]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavformat/mp3.c
Move one function that is only used for muxing below #ifdef CONFIG_MUXERS.
[frescor/ffmpeg.git] / libavformat / mp3.c
1 /*
2  * MP3 muxer and demuxer
3  * Copyright (c) 2003 Fabrice Bellard.
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/avstring.h"
23 #include "libavcodec/mpegaudio.h"
24 #include "libavcodec/mpegaudiodecheader.h"
25 #include "avformat.h"
26
27 #define ID3v2_HEADER_SIZE 10
28 #define ID3v1_TAG_SIZE 128
29
30 #define ID3v1_GENRE_MAX 125
31
32 static const char *id3v1_genre_str[ID3v1_GENRE_MAX + 1] = {
33     [0] = "Blues",
34     [1] = "Classic Rock",
35     [2] = "Country",
36     [3] = "Dance",
37     [4] = "Disco",
38     [5] = "Funk",
39     [6] = "Grunge",
40     [7] = "Hip-Hop",
41     [8] = "Jazz",
42     [9] = "Metal",
43     [10] = "New Age",
44     [11] = "Oldies",
45     [12] = "Other",
46     [13] = "Pop",
47     [14] = "R&B",
48     [15] = "Rap",
49     [16] = "Reggae",
50     [17] = "Rock",
51     [18] = "Techno",
52     [19] = "Industrial",
53     [20] = "Alternative",
54     [21] = "Ska",
55     [22] = "Death Metal",
56     [23] = "Pranks",
57     [24] = "Soundtrack",
58     [25] = "Euro-Techno",
59     [26] = "Ambient",
60     [27] = "Trip-Hop",
61     [28] = "Vocal",
62     [29] = "Jazz+Funk",
63     [30] = "Fusion",
64     [31] = "Trance",
65     [32] = "Classical",
66     [33] = "Instrumental",
67     [34] = "Acid",
68     [35] = "House",
69     [36] = "Game",
70     [37] = "Sound Clip",
71     [38] = "Gospel",
72     [39] = "Noise",
73     [40] = "AlternRock",
74     [41] = "Bass",
75     [42] = "Soul",
76     [43] = "Punk",
77     [44] = "Space",
78     [45] = "Meditative",
79     [46] = "Instrumental Pop",
80     [47] = "Instrumental Rock",
81     [48] = "Ethnic",
82     [49] = "Gothic",
83     [50] = "Darkwave",
84     [51] = "Techno-Industrial",
85     [52] = "Electronic",
86     [53] = "Pop-Folk",
87     [54] = "Eurodance",
88     [55] = "Dream",
89     [56] = "Southern Rock",
90     [57] = "Comedy",
91     [58] = "Cult",
92     [59] = "Gangsta",
93     [60] = "Top 40",
94     [61] = "Christian Rap",
95     [62] = "Pop/Funk",
96     [63] = "Jungle",
97     [64] = "Native American",
98     [65] = "Cabaret",
99     [66] = "New Wave",
100     [67] = "Psychadelic",
101     [68] = "Rave",
102     [69] = "Showtunes",
103     [70] = "Trailer",
104     [71] = "Lo-Fi",
105     [72] = "Tribal",
106     [73] = "Acid Punk",
107     [74] = "Acid Jazz",
108     [75] = "Polka",
109     [76] = "Retro",
110     [77] = "Musical",
111     [78] = "Rock & Roll",
112     [79] = "Hard Rock",
113     [80] = "Folk",
114     [81] = "Folk-Rock",
115     [82] = "National Folk",
116     [83] = "Swing",
117     [84] = "Fast Fusion",
118     [85] = "Bebob",
119     [86] = "Latin",
120     [87] = "Revival",
121     [88] = "Celtic",
122     [89] = "Bluegrass",
123     [90] = "Avantgarde",
124     [91] = "Gothic Rock",
125     [92] = "Progressive Rock",
126     [93] = "Psychedelic Rock",
127     [94] = "Symphonic Rock",
128     [95] = "Slow Rock",
129     [96] = "Big Band",
130     [97] = "Chorus",
131     [98] = "Easy Listening",
132     [99] = "Acoustic",
133     [100] = "Humour",
134     [101] = "Speech",
135     [102] = "Chanson",
136     [103] = "Opera",
137     [104] = "Chamber Music",
138     [105] = "Sonata",
139     [106] = "Symphony",
140     [107] = "Booty Bass",
141     [108] = "Primus",
142     [109] = "Porn Groove",
143     [110] = "Satire",
144     [111] = "Slow Jam",
145     [112] = "Club",
146     [113] = "Tango",
147     [114] = "Samba",
148     [115] = "Folklore",
149     [116] = "Ballad",
150     [117] = "Power Ballad",
151     [118] = "Rhythmic Soul",
152     [119] = "Freestyle",
153     [120] = "Duet",
154     [121] = "Punk Rock",
155     [122] = "Drum Solo",
156     [123] = "A capella",
157     [124] = "Euro-House",
158     [125] = "Dance Hall",
159 };
160
161 /* buf must be ID3v2_HEADER_SIZE byte long */
162 static int id3v2_match(const uint8_t *buf)
163 {
164     return  buf[0] == 'I' &&
165             buf[1] == 'D' &&
166             buf[2] == '3' &&
167             buf[3] != 0xff &&
168             buf[4] != 0xff &&
169             (buf[6] & 0x80) == 0 &&
170             (buf[7] & 0x80) == 0 &&
171             (buf[8] & 0x80) == 0 &&
172             (buf[9] & 0x80) == 0;
173 }
174
175 static unsigned int id3v2_get_size(ByteIOContext *s, int len)
176 {
177     int v=0;
178     while(len--)
179         v= (v<<7) + (get_byte(s)&0x7F);
180     return v;
181 }
182
183 static void id3v2_read_ttag(AVFormatContext *s, int taglen, char *dst, int dstlen)
184 {
185     char *q;
186     int len;
187
188     if(dstlen > 0)
189         dst[0]= 0;
190     if(taglen < 1)
191         return;
192
193     taglen--; /* account for encoding type byte */
194     dstlen--; /* Leave space for zero terminator */
195
196     switch(get_byte(s->pb)) { /* encoding type */
197
198     case 0:  /* ISO-8859-1 (0 - 255 maps directly into unicode) */
199         q = dst;
200         while(taglen--) {
201             uint8_t tmp;
202             PUT_UTF8(get_byte(s->pb), tmp, if (q - dst < dstlen - 1) *q++ = tmp;)
203         }
204         *q = '\0';
205         break;
206
207     case 3:  /* UTF-8 */
208         len = FFMIN(taglen, dstlen-1);
209         get_buffer(s->pb, dst, len);
210         dst[len] = 0;
211         break;
212     }
213 }
214
215 /**
216  * ID3v2 parser
217  *
218  * Handles ID3v2.2, 2.3 and 2.4.
219  *
220  */
221
222 static void id3v2_parse(AVFormatContext *s, int len, uint8_t version, uint8_t flags)
223 {
224     int isv34, tlen;
225     uint32_t tag;
226     offset_t next;
227     char tmp[16];
228     int taghdrlen;
229     const char *reason;
230
231     switch(version) {
232     case 2:
233         if(flags & 0x40) {
234             reason = "compression";
235             goto error;
236         }
237         isv34 = 0;
238         taghdrlen = 6;
239         break;
240
241     case 3:
242     case 4:
243         isv34 = 1;
244         taghdrlen = 10;
245         break;
246
247     default:
248         reason = "version";
249         goto error;
250     }
251
252     if(flags & 0x80) {
253         reason = "unsynchronization";
254         goto error;
255     }
256
257     if(isv34 && flags & 0x40) /* Extended header present, just skip over it */
258         url_fskip(s->pb, id3v2_get_size(s->pb, 4));
259
260     while(len >= taghdrlen) {
261         if(isv34) {
262             tag  = get_be32(s->pb);
263             tlen = id3v2_get_size(s->pb, 4);
264             get_be16(s->pb); /* flags */
265         } else {
266             tag  = get_be24(s->pb);
267             tlen = id3v2_get_size(s->pb, 3);
268         }
269         len -= taghdrlen + tlen;
270
271         if(len < 0)
272             break;
273
274         next = url_ftell(s->pb) + tlen;
275
276         switch(tag) {
277         case MKBETAG('T', 'I', 'T', '2'):
278         case MKBETAG(0,   'T', 'T', '2'):
279             id3v2_read_ttag(s, tlen, s->title, sizeof(s->title));
280             break;
281         case MKBETAG('T', 'P', 'E', '1'):
282         case MKBETAG(0,   'T', 'P', '1'):
283             id3v2_read_ttag(s, tlen, s->author, sizeof(s->author));
284             break;
285         case MKBETAG('T', 'A', 'L', 'B'):
286         case MKBETAG(0,   'T', 'A', 'L'):
287             id3v2_read_ttag(s, tlen, s->album, sizeof(s->album));
288             break;
289         case MKBETAG('T', 'C', 'O', 'N'):
290         case MKBETAG(0,   'T', 'C', 'O'):
291             id3v2_read_ttag(s, tlen, s->genre, sizeof(s->genre));
292             break;
293         case MKBETAG('T', 'C', 'O', 'P'):
294         case MKBETAG(0,   'T', 'C', 'R'):
295             id3v2_read_ttag(s, tlen, s->copyright, sizeof(s->copyright));
296             break;
297         case MKBETAG('T', 'R', 'C', 'K'):
298         case MKBETAG(0,   'T', 'R', 'K'):
299             id3v2_read_ttag(s, tlen, tmp, sizeof(tmp));
300             s->track = atoi(tmp);
301             break;
302         case 0:
303             /* padding, skip to end */
304             url_fskip(s->pb, len);
305             len = 0;
306             continue;
307         }
308         /* Skip to end of tag */
309         url_fseek(s->pb, next, SEEK_SET);
310     }
311
312     if(version == 4 && flags & 0x10) /* Footer preset, always 10 bytes, skip over it */
313         url_fskip(s->pb, 10);
314     return;
315
316   error:
317     av_log(s, AV_LOG_INFO, "ID3v2.%d tag skipped, cannot handle %s\n", version, reason);
318     url_fskip(s->pb, len);
319 }
320
321 static void id3v1_get_string(char *str, int str_size,
322                              const uint8_t *buf, int buf_size)
323 {
324     int i, c;
325     char *q;
326
327     q = str;
328     for(i = 0; i < buf_size; i++) {
329         c = buf[i];
330         if (c == '\0')
331             break;
332         if ((q - str) >= str_size - 1)
333             break;
334         *q++ = c;
335     }
336     *q = '\0';
337 }
338
339 /* 'buf' must be ID3v1_TAG_SIZE byte long */
340 static int id3v1_parse_tag(AVFormatContext *s, const uint8_t *buf)
341 {
342     char str[5];
343     int genre;
344
345     if (!(buf[0] == 'T' &&
346           buf[1] == 'A' &&
347           buf[2] == 'G'))
348         return -1;
349     id3v1_get_string(s->title, sizeof(s->title), buf + 3, 30);
350     id3v1_get_string(s->author, sizeof(s->author), buf + 33, 30);
351     id3v1_get_string(s->album, sizeof(s->album), buf + 63, 30);
352     id3v1_get_string(str, sizeof(str), buf + 93, 4);
353     s->year = atoi(str);
354     id3v1_get_string(s->comment, sizeof(s->comment), buf + 97, 30);
355     if (buf[125] == 0 && buf[126] != 0)
356         s->track = buf[126];
357     genre = buf[127];
358     if (genre <= ID3v1_GENRE_MAX)
359         av_strlcpy(s->genre, id3v1_genre_str[genre], sizeof(s->genre));
360     return 0;
361 }
362
363 /* mp3 read */
364
365 static int mp3_read_probe(AVProbeData *p)
366 {
367     int max_frames, first_frames = 0;
368     int fsize, frames, sample_rate;
369     uint32_t header;
370     uint8_t *buf, *buf2, *end;
371     AVCodecContext avctx;
372
373     if(id3v2_match(p->buf))
374         return AVPROBE_SCORE_MAX/2+1; // this must be less than mpeg-ps because some retards put id3v2 tags before mpeg-ps files
375
376     max_frames = 0;
377     buf = p->buf;
378     end = buf + p->buf_size - sizeof(uint32_t);
379
380     for(; buf < end; buf= buf2+1) {
381         buf2 = buf;
382
383         for(frames = 0; buf2 < end; frames++) {
384             header = AV_RB32(buf2);
385             fsize = ff_mpa_decode_header(&avctx, header, &sample_rate);
386             if(fsize < 0)
387                 break;
388             buf2 += fsize;
389         }
390         max_frames = FFMAX(max_frames, frames);
391         if(buf == p->buf)
392             first_frames= frames;
393     }
394     if   (first_frames>=3) return AVPROBE_SCORE_MAX/2+1;
395     else if(max_frames>500)return AVPROBE_SCORE_MAX/2;
396     else if(max_frames>=3) return AVPROBE_SCORE_MAX/4;
397     else if(max_frames>=1) return 1;
398     else                   return 0;
399 }
400
401 /**
402  * Try to find Xing/Info/VBRI tags and compute duration from info therein
403  */
404 static void mp3_parse_vbr_tags(AVFormatContext *s, AVStream *st, offset_t base)
405 {
406     uint32_t v, spf;
407     int frames = -1; /* Total number of frames in file */
408     const offset_t xing_offtbl[2][2] = {{32, 17}, {17,9}};
409     MPADecodeContext c;
410
411     v = get_be32(s->pb);
412     if(ff_mpa_check_header(v) < 0)
413       return;
414
415     ff_mpegaudio_decode_header(&c, v);
416     if(c.layer != 3)
417         return;
418
419     /* Check for Xing / Info tag */
420     url_fseek(s->pb, xing_offtbl[c.lsf == 1][c.nb_channels == 1], SEEK_CUR);
421     v = get_be32(s->pb);
422     if(v == MKBETAG('X', 'i', 'n', 'g') || v == MKBETAG('I', 'n', 'f', 'o')) {
423         v = get_be32(s->pb);
424         if(v & 0x1)
425             frames = get_be32(s->pb);
426     }
427
428     /* Check for VBRI tag (always 32 bytes after end of mpegaudio header) */
429     url_fseek(s->pb, base + 4 + 32, SEEK_SET);
430     v = get_be32(s->pb);
431     if(v == MKBETAG('V', 'B', 'R', 'I')) {
432         /* Check tag version */
433         if(get_be16(s->pb) == 1) {
434             /* skip delay, quality and total bytes */
435             url_fseek(s->pb, 8, SEEK_CUR);
436             frames = get_be32(s->pb);
437         }
438     }
439
440     if(frames < 0)
441         return;
442
443     spf = c.lsf ? 576 : 1152; /* Samples per frame, layer 3 */
444     st->duration = av_rescale_q(frames, (AVRational){spf, c.sample_rate},
445                                 st->time_base);
446 }
447
448 static int mp3_read_header(AVFormatContext *s,
449                            AVFormatParameters *ap)
450 {
451     AVStream *st;
452     uint8_t buf[ID3v1_TAG_SIZE];
453     int len, ret, filesize;
454     offset_t off;
455
456     st = av_new_stream(s, 0);
457     if (!st)
458         return AVERROR(ENOMEM);
459
460     st->codec->codec_type = CODEC_TYPE_AUDIO;
461     st->codec->codec_id = CODEC_ID_MP3;
462     st->need_parsing = AVSTREAM_PARSE_FULL;
463     st->start_time = 0;
464
465     /* try to get the TAG */
466     if (!url_is_streamed(s->pb)) {
467         /* XXX: change that */
468         filesize = url_fsize(s->pb);
469         if (filesize > 128) {
470             url_fseek(s->pb, filesize - 128, SEEK_SET);
471             ret = get_buffer(s->pb, buf, ID3v1_TAG_SIZE);
472             if (ret == ID3v1_TAG_SIZE) {
473                 id3v1_parse_tag(s, buf);
474             }
475             url_fseek(s->pb, 0, SEEK_SET);
476         }
477     }
478
479     /* if ID3v2 header found, skip it */
480     ret = get_buffer(s->pb, buf, ID3v2_HEADER_SIZE);
481     if (ret != ID3v2_HEADER_SIZE)
482         return -1;
483     if (id3v2_match(buf)) {
484         /* parse ID3v2 header */
485         len = ((buf[6] & 0x7f) << 21) |
486             ((buf[7] & 0x7f) << 14) |
487             ((buf[8] & 0x7f) << 7) |
488             (buf[9] & 0x7f);
489         id3v2_parse(s, len, buf[3], buf[5]);
490     } else {
491         url_fseek(s->pb, 0, SEEK_SET);
492     }
493
494     off = url_ftell(s->pb);
495     mp3_parse_vbr_tags(s, st, off);
496     url_fseek(s->pb, off, SEEK_SET);
497
498     /* the parameters will be extracted from the compressed bitstream */
499     return 0;
500 }
501
502 #define MP3_PACKET_SIZE 1024
503
504 static int mp3_read_packet(AVFormatContext *s, AVPacket *pkt)
505 {
506     int ret, size;
507     //    AVStream *st = s->streams[0];
508
509     size= MP3_PACKET_SIZE;
510
511     ret= av_get_packet(s->pb, pkt, size);
512
513     pkt->stream_index = 0;
514     if (ret <= 0) {
515         return AVERROR(EIO);
516     }
517     /* note: we need to modify the packet size here to handle the last
518        packet */
519     pkt->size = ret;
520     return ret;
521 }
522
523 #ifdef CONFIG_MUXERS
524 static void id3v1_create_tag(AVFormatContext *s, uint8_t *buf)
525 {
526     int v, i;
527
528     memset(buf, 0, ID3v1_TAG_SIZE); /* fail safe */
529     buf[0] = 'T';
530     buf[1] = 'A';
531     buf[2] = 'G';
532     strncpy(buf + 3, s->title, 30);
533     strncpy(buf + 33, s->author, 30);
534     strncpy(buf + 63, s->album, 30);
535     v = s->year;
536     if (v > 0) {
537         for(i = 0;i < 4; i++) {
538             buf[96 - i] = '0' + (v % 10);
539             v = v / 10;
540         }
541     }
542     strncpy(buf + 97, s->comment, 30);
543     if (s->track != 0) {
544         buf[125] = 0;
545         buf[126] = s->track;
546     }
547     for(i = 0; i <= ID3v1_GENRE_MAX; i++) {
548         if (!strcasecmp(s->genre, id3v1_genre_str[i])) {
549             buf[127] = i;
550             break;
551         }
552     }
553 }
554
555 /* simple formats */
556
557 static void id3v2_put_size(AVFormatContext *s, int size)
558 {
559     put_byte(s->pb, size >> 21 & 0x7f);
560     put_byte(s->pb, size >> 14 & 0x7f);
561     put_byte(s->pb, size >> 7  & 0x7f);
562     put_byte(s->pb, size       & 0x7f);
563 }
564
565 static void id3v2_put_ttag(AVFormatContext *s, const char *string, uint32_t tag)
566 {
567     int len = strlen(string);
568     put_be32(s->pb, tag);
569     id3v2_put_size(s, len + 1);
570     put_be16(s->pb, 0);
571     put_byte(s->pb, 3); /* UTF-8 */
572     put_buffer(s->pb, string, len);
573 }
574
575
576 /**
577  * Write an ID3v2.4 header at beginning of stream
578  */
579
580 static int mp3_write_header(struct AVFormatContext *s)
581 {
582     int totlen = 0;
583     char tracktxt[10];
584     char yeartxt[10];
585
586     if(s->track)
587         snprintf(tracktxt, sizeof(tracktxt), "%d", s->track);
588     if(s->year)
589         snprintf( yeartxt, sizeof(yeartxt) , "%d", s->year );
590
591     if(s->title[0])     totlen += 11 + strlen(s->title);
592     if(s->author[0])    totlen += 11 + strlen(s->author);
593     if(s->album[0])     totlen += 11 + strlen(s->album);
594     if(s->genre[0])     totlen += 11 + strlen(s->genre);
595     if(s->copyright[0]) totlen += 11 + strlen(s->copyright);
596     if(s->track)        totlen += 11 + strlen(tracktxt);
597     if(s->year)         totlen += 11 + strlen(yeartxt);
598     if(!(s->streams[0]->codec->flags & CODEC_FLAG_BITEXACT))
599         totlen += strlen(LIBAVFORMAT_IDENT) + 11;
600
601     if(totlen == 0)
602         return 0;
603
604     put_be32(s->pb, MKBETAG('I', 'D', '3', 0x04)); /* ID3v2.4 */
605     put_byte(s->pb, 0);
606     put_byte(s->pb, 0); /* flags */
607
608     id3v2_put_size(s, totlen);
609
610     if(s->title[0])     id3v2_put_ttag(s, s->title,     MKBETAG('T', 'I', 'T', '2'));
611     if(s->author[0])    id3v2_put_ttag(s, s->author,    MKBETAG('T', 'P', 'E', '1'));
612     if(s->album[0])     id3v2_put_ttag(s, s->album,     MKBETAG('T', 'A', 'L', 'B'));
613     if(s->genre[0])     id3v2_put_ttag(s, s->genre,     MKBETAG('T', 'C', 'O', 'N'));
614     if(s->copyright[0]) id3v2_put_ttag(s, s->copyright, MKBETAG('T', 'C', 'O', 'P'));
615     if(s->track)        id3v2_put_ttag(s, tracktxt,     MKBETAG('T', 'R', 'C', 'K'));
616     if(s->year)         id3v2_put_ttag(s, yeartxt,      MKBETAG('T', 'Y', 'E', 'R'));
617     if(!(s->streams[0]->codec->flags & CODEC_FLAG_BITEXACT))
618         id3v2_put_ttag(s, LIBAVFORMAT_IDENT,            MKBETAG('T', 'E', 'N', 'C'));
619     return 0;
620 }
621
622 static int mp3_write_packet(struct AVFormatContext *s, AVPacket *pkt)
623 {
624     put_buffer(s->pb, pkt->data, pkt->size);
625     put_flush_packet(s->pb);
626     return 0;
627 }
628
629 static int mp3_write_trailer(struct AVFormatContext *s)
630 {
631     uint8_t buf[ID3v1_TAG_SIZE];
632
633     /* write the id3v1 tag */
634     if (s->title[0] != '\0') {
635         id3v1_create_tag(s, buf);
636         put_buffer(s->pb, buf, ID3v1_TAG_SIZE);
637         put_flush_packet(s->pb);
638     }
639     return 0;
640 }
641 #endif //CONFIG_MUXERS
642
643 #ifdef CONFIG_MP3_DEMUXER
644 AVInputFormat mp3_demuxer = {
645     "mp3",
646     NULL_IF_CONFIG_SMALL("MPEG audio"),
647     0,
648     mp3_read_probe,
649     mp3_read_header,
650     mp3_read_packet,
651     .flags= AVFMT_GENERIC_INDEX,
652     .extensions = "mp2,mp3,m2a", /* XXX: use probe */
653 };
654 #endif
655 #ifdef CONFIG_MP2_MUXER
656 AVOutputFormat mp2_muxer = {
657     "mp2",
658     NULL_IF_CONFIG_SMALL("MPEG audio layer 2"),
659     "audio/x-mpeg",
660 #ifdef CONFIG_LIBMP3LAME
661     "mp2,m2a",
662 #else
663     "mp2,mp3,m2a",
664 #endif
665     0,
666     CODEC_ID_MP2,
667     CODEC_ID_NONE,
668     NULL,
669     mp3_write_packet,
670     mp3_write_trailer,
671 };
672 #endif
673 #ifdef CONFIG_MP3_MUXER
674 AVOutputFormat mp3_muxer = {
675     "mp3",
676     NULL_IF_CONFIG_SMALL("MPEG audio layer 3"),
677     "audio/x-mpeg",
678     "mp3",
679     0,
680     CODEC_ID_MP3,
681     CODEC_ID_NONE,
682     mp3_write_header,
683     mp3_write_packet,
684     mp3_write_trailer,
685 };
686 #endif