]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavformat/movenc.c
remove obsolete requirements, quicktime 6 is from 2002, not sure if muxing scheme...
[frescor/ffmpeg.git] / libavformat / movenc.c
1 /*
2  * MOV, 3GP, MP4 muxer
3  * Copyright (c) 2003 Thomas Raivio.
4  * Copyright (c) 2004 Gildas Bazin <gbazin at videolan dot org>.
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22 #include "avformat.h"
23 #include "riff.h"
24 #include "avio.h"
25 #include "isom.h"
26 #include "avc.h"
27
28 #undef NDEBUG
29 #include <assert.h>
30
31 #define MOV_INDEX_CLUSTER_SIZE 16384
32 #define globalTimescale 1000
33
34 #define MODE_MP4 0
35 #define MODE_MOV 1
36 #define MODE_3GP 2
37 #define MODE_PSP 3 // example working PSP command line:
38 // ffmpeg -i testinput.avi  -f psp -r 14.985 -s 320x240 -b 768 -ar 24000 -ab 32 M4V00001.MP4
39 #define MODE_3G2 4
40 #define MODE_IPOD 5
41
42 typedef struct MOVIentry {
43     unsigned int flags, size;
44     uint64_t     pos;
45     unsigned int samplesInChunk;
46     char         key_frame;
47     unsigned int entries;
48     int64_t      cts;
49     int64_t      dts;
50 } MOVIentry;
51
52 typedef struct MOVIndex {
53     int         mode;
54     int         entry;
55     long        timescale;
56     long        time;
57     int64_t     trackDuration;
58     long        sampleCount;
59     long        sampleSize;
60     int         hasKeyframes;
61     int         hasBframes;
62     int         language;
63     int         trackID;
64     int         tag; ///< stsd fourcc
65     AVCodecContext *enc;
66
67     int         vosLen;
68     uint8_t     *vosData;
69     MOVIentry   *cluster;
70     int         audio_vbr;
71 } MOVTrack;
72
73 typedef struct MOVContext {
74     int     mode;
75     int64_t time;
76     int     nb_streams;
77     offset_t mdat_pos;
78     uint64_t mdat_size;
79     long    timescale;
80     MOVTrack tracks[MAX_STREAMS];
81 } MOVContext;
82
83 //FIXME support 64 bit variant with wide placeholders
84 static offset_t updateSize(ByteIOContext *pb, offset_t pos)
85 {
86     offset_t curpos = url_ftell(pb);
87     url_fseek(pb, pos, SEEK_SET);
88     put_be32(pb, curpos - pos); /* rewrite size */
89     url_fseek(pb, curpos, SEEK_SET);
90
91     return curpos - pos;
92 }
93
94 /* Chunk offset atom */
95 static int mov_write_stco_tag(ByteIOContext *pb, MOVTrack *track)
96 {
97     int i;
98     int mode64 = 0; //   use 32 bit size variant if possible
99     offset_t pos = url_ftell(pb);
100     put_be32(pb, 0); /* size */
101     if (pos > UINT32_MAX) {
102         mode64 = 1;
103         put_tag(pb, "co64");
104     } else
105         put_tag(pb, "stco");
106     put_be32(pb, 0); /* version & flags */
107     put_be32(pb, track->entry); /* entry count */
108     for (i=0; i<track->entry; i++) {
109         if(mode64 == 1)
110             put_be64(pb, track->cluster[i].pos);
111         else
112             put_be32(pb, track->cluster[i].pos);
113     }
114     return updateSize (pb, pos);
115 }
116
117 /* Sample size atom */
118 static int mov_write_stsz_tag(ByteIOContext *pb, MOVTrack *track)
119 {
120     int equalChunks = 1;
121     int i, j, entries = 0, tst = -1, oldtst = -1;
122
123     offset_t pos = url_ftell(pb);
124     put_be32(pb, 0); /* size */
125     put_tag(pb, "stsz");
126     put_be32(pb, 0); /* version & flags */
127
128     for (i=0; i<track->entry; i++) {
129         tst = track->cluster[i].size/track->cluster[i].entries;
130         if(oldtst != -1 && tst != oldtst) {
131             equalChunks = 0;
132         }
133         oldtst = tst;
134         entries += track->cluster[i].entries;
135     }
136     if (equalChunks) {
137         int sSize = track->cluster[0].size/track->cluster[0].entries;
138         put_be32(pb, sSize); // sample size
139         put_be32(pb, entries); // sample count
140     }
141     else {
142         put_be32(pb, 0); // sample size
143         put_be32(pb, entries); // sample count
144         for (i=0; i<track->entry; i++) {
145             for (j=0; j<track->cluster[i].entries; j++) {
146                 put_be32(pb, track->cluster[i].size /
147                          track->cluster[i].entries);
148             }
149         }
150     }
151     return updateSize (pb, pos);
152 }
153
154 /* Sample to chunk atom */
155 static int mov_write_stsc_tag(ByteIOContext *pb, MOVTrack *track)
156 {
157     int index = 0, oldval = -1, i;
158     offset_t entryPos, curpos;
159
160     offset_t pos = url_ftell(pb);
161     put_be32(pb, 0); /* size */
162     put_tag(pb, "stsc");
163     put_be32(pb, 0); // version & flags
164     entryPos = url_ftell(pb);
165     put_be32(pb, track->entry); // entry count
166     for (i=0; i<track->entry; i++) {
167         if(oldval != track->cluster[i].samplesInChunk)
168         {
169             put_be32(pb, i+1); // first chunk
170             put_be32(pb, track->cluster[i].samplesInChunk); // samples per chunk
171             put_be32(pb, 0x1); // sample description index
172             oldval = track->cluster[i].samplesInChunk;
173             index++;
174         }
175     }
176     curpos = url_ftell(pb);
177     url_fseek(pb, entryPos, SEEK_SET);
178     put_be32(pb, index); // rewrite size
179     url_fseek(pb, curpos, SEEK_SET);
180
181     return updateSize (pb, pos);
182 }
183
184 /* Sync sample atom */
185 static int mov_write_stss_tag(ByteIOContext *pb, MOVTrack *track)
186 {
187     offset_t curpos, entryPos;
188     int i, index = 0;
189     offset_t pos = url_ftell(pb);
190     put_be32(pb, 0); // size
191     put_tag(pb, "stss");
192     put_be32(pb, 0); // version & flags
193     entryPos = url_ftell(pb);
194     put_be32(pb, track->entry); // entry count
195     for (i=0; i<track->entry; i++) {
196         if(track->cluster[i].key_frame == 1) {
197             put_be32(pb, i+1);
198             index++;
199         }
200     }
201     curpos = url_ftell(pb);
202     url_fseek(pb, entryPos, SEEK_SET);
203     put_be32(pb, index); // rewrite size
204     url_fseek(pb, curpos, SEEK_SET);
205     return updateSize (pb, pos);
206 }
207
208 static int mov_write_amr_tag(ByteIOContext *pb, MOVTrack *track)
209 {
210     put_be32(pb, 0x11); /* size */
211     if (track->mode == MODE_MOV) put_tag(pb, "samr");
212     else                         put_tag(pb, "damr");
213     put_tag(pb, "FFMP");
214     put_byte(pb, 0); /* decoder version */
215
216     put_be16(pb, 0x81FF); /* Mode set (all modes for AMR_NB) */
217     put_byte(pb, 0x00); /* Mode change period (no restriction) */
218     put_byte(pb, 0x01); /* Frames per sample */
219     return 0x11;
220 }
221
222 /**
223  * This function writes extradata "as is".
224  * Extradata must be formated like a valid atom (with size and tag)
225  */
226 static int mov_write_extradata_tag(ByteIOContext *pb, MOVTrack *track)
227 {
228     put_buffer(pb, track->enc->extradata, track->enc->extradata_size);
229     return track->enc->extradata_size;
230 }
231
232 static int mov_write_enda_tag(ByteIOContext *pb)
233 {
234     put_be32(pb, 10);
235     put_tag(pb, "enda");
236     put_be16(pb, 1); /* little endian */
237     return 10;
238 }
239
240 static unsigned int descrLength(unsigned int len)
241 {
242     int i;
243     for(i=1; len>>(7*i); i++);
244     return len + 1 + i;
245 }
246
247 static void putDescr(ByteIOContext *pb, int tag, unsigned int size)
248 {
249     int i= descrLength(size) - size - 2;
250     put_byte(pb, tag);
251     for(; i>0; i--)
252         put_byte(pb, (size>>(7*i)) | 0x80);
253     put_byte(pb, size & 0x7F);
254 }
255
256 static int mov_write_esds_tag(ByteIOContext *pb, MOVTrack *track) // Basic
257 {
258     offset_t pos = url_ftell(pb);
259     int decoderSpecificInfoLen = track->vosLen ? descrLength(track->vosLen):0;
260
261     put_be32(pb, 0); // size
262     put_tag(pb, "esds");
263     put_be32(pb, 0); // Version
264
265     // ES descriptor
266     putDescr(pb, 0x03, 3 + descrLength(13 + decoderSpecificInfoLen) +
267              descrLength(1));
268     put_be16(pb, track->trackID);
269     put_byte(pb, 0x00); // flags (= no flags)
270
271     // DecoderConfig descriptor
272     putDescr(pb, 0x04, 13 + decoderSpecificInfoLen);
273
274     // Object type indication
275     put_byte(pb, codec_get_tag(ff_mp4_obj_type, track->enc->codec_id));
276
277     // the following fields is made of 6 bits to identify the streamtype (4 for video, 5 for audio)
278     // plus 1 bit to indicate upstream and 1 bit set to 1 (reserved)
279     if(track->enc->codec_type == CODEC_TYPE_AUDIO)
280         put_byte(pb, 0x15); // flags (= Audiostream)
281     else
282         put_byte(pb, 0x11); // flags (= Visualstream)
283
284     put_byte(pb,  track->enc->rc_buffer_size>>(3+16));    // Buffersize DB (24 bits)
285     put_be16(pb, (track->enc->rc_buffer_size>>3)&0xFFFF); // Buffersize DB
286
287     put_be32(pb, FFMAX(track->enc->bit_rate, track->enc->rc_max_rate)); // maxbitrate (FIXME should be max rate in any 1 sec window)
288     if(track->enc->rc_max_rate != track->enc->rc_min_rate || track->enc->rc_min_rate==0)
289         put_be32(pb, 0); // vbr
290     else
291         put_be32(pb, track->enc->rc_max_rate); // avg bitrate
292
293     if (track->vosLen) {
294         // DecoderSpecific info descriptor
295         putDescr(pb, 0x05, track->vosLen);
296         put_buffer(pb, track->vosData, track->vosLen);
297     }
298
299     // SL descriptor
300     putDescr(pb, 0x06, 1);
301     put_byte(pb, 0x02);
302     return updateSize (pb, pos);
303 }
304
305 static int mov_write_wave_tag(ByteIOContext *pb, MOVTrack *track)
306 {
307     offset_t pos = url_ftell(pb);
308
309     put_be32(pb, 0);     /* size */
310     put_tag(pb, "wave");
311
312     put_be32(pb, 12);    /* size */
313     put_tag(pb, "frma");
314     put_le32(pb, track->tag);
315
316     if (track->enc->codec_id == CODEC_ID_AAC) {
317         /* useless atom needed by mplayer, ipod, not needed by quicktime */
318         put_be32(pb, 12); /* size */
319         put_tag(pb, "mp4a");
320         put_be32(pb, 0);
321         mov_write_esds_tag(pb, track);
322     } else if (track->enc->codec_id == CODEC_ID_PCM_S24LE ||
323                track->enc->codec_id == CODEC_ID_PCM_S32LE) {
324         mov_write_enda_tag(pb);
325     } else if (track->enc->codec_id == CODEC_ID_AMR_NB) {
326         mov_write_amr_tag(pb, track);
327     } else if (track->enc->codec_id == CODEC_ID_ALAC) {
328         mov_write_extradata_tag(pb, track);
329     }
330
331     put_be32(pb, 8);     /* size */
332     put_be32(pb, 0);     /* null tag */
333
334     return updateSize (pb, pos);
335 }
336
337 static int mov_write_glbl_tag(ByteIOContext *pb, MOVTrack *track)
338 {
339     put_be32(pb, track->vosLen+8);
340     put_tag(pb, "glbl");
341     put_buffer(pb, track->vosData, track->vosLen);
342     return 8+track->vosLen;
343 }
344
345 static int mov_write_audio_tag(ByteIOContext *pb, MOVTrack *track)
346 {
347     offset_t pos = url_ftell(pb);
348     int version = track->mode == MODE_MOV &&
349         (track->audio_vbr ||
350          track->enc->codec_id == CODEC_ID_PCM_S32LE ||
351          track->enc->codec_id == CODEC_ID_PCM_S24LE);
352
353     put_be32(pb, 0); /* size */
354     put_le32(pb, track->tag); // store it byteswapped
355     put_be32(pb, 0); /* Reserved */
356     put_be16(pb, 0); /* Reserved */
357     put_be16(pb, 1); /* Data-reference index, XXX  == 1 */
358
359     /* SoundDescription */
360     put_be16(pb, version); /* Version */
361     put_be16(pb, 0); /* Revision level */
362     put_be32(pb, 0); /* Reserved */
363
364     if (track->mode == MODE_MOV) {
365         put_be16(pb, track->enc->channels);
366         if (track->enc->codec_id == CODEC_ID_PCM_U8 ||
367             track->enc->codec_id == CODEC_ID_PCM_S8)
368             put_be16(pb, 8); /* bits per sample */
369         else
370             put_be16(pb, 16);
371         put_be16(pb, track->audio_vbr ? -2 : 0); /* compression ID */
372     } else { /* reserved for mp4/3gp */
373         put_be16(pb, 2);
374         put_be16(pb, 16);
375         put_be16(pb, 0);
376     }
377
378     put_be16(pb, 0); /* packet size (= 0) */
379     put_be16(pb, track->timescale); /* Time scale */
380     put_be16(pb, 0); /* Reserved */
381
382     if(version == 1) { /* SoundDescription V1 extended info */
383         put_be32(pb, track->enc->frame_size); /* Samples per packet */
384         put_be32(pb, track->sampleSize / track->enc->channels); /* Bytes per packet */
385         put_be32(pb, track->sampleSize); /* Bytes per frame */
386         put_be32(pb, 2); /* Bytes per sample */
387     }
388
389     if(track->mode == MODE_MOV &&
390        (track->enc->codec_id == CODEC_ID_AAC ||
391         track->enc->codec_id == CODEC_ID_AMR_NB ||
392         track->enc->codec_id == CODEC_ID_PCM_S24LE ||
393         track->enc->codec_id == CODEC_ID_PCM_S32LE ||
394         track->enc->codec_id == CODEC_ID_ALAC))
395         mov_write_wave_tag(pb, track);
396     else if(track->tag == MKTAG('m','p','4','a'))
397         mov_write_esds_tag(pb, track);
398     else if(track->enc->codec_id == CODEC_ID_AMR_NB)
399         mov_write_amr_tag(pb, track);
400     else if(track->vosLen > 0)
401         mov_write_glbl_tag(pb, track);
402
403     return updateSize (pb, pos);
404 }
405
406 static int mov_write_d263_tag(ByteIOContext *pb)
407 {
408     put_be32(pb, 0xf); /* size */
409     put_tag(pb, "d263");
410     put_tag(pb, "FFMP");
411     put_byte(pb, 0); /* decoder version */
412     /* FIXME use AVCodecContext level/profile, when encoder will set values */
413     put_byte(pb, 0xa); /* level */
414     put_byte(pb, 0); /* profile */
415     return 0xf;
416 }
417
418 /* TODO: No idea about these values */
419 static int mov_write_svq3_tag(ByteIOContext *pb)
420 {
421     put_be32(pb, 0x15);
422     put_tag(pb, "SMI ");
423     put_tag(pb, "SEQH");
424     put_be32(pb, 0x5);
425     put_be32(pb, 0xe2c0211d);
426     put_be32(pb, 0xc0000000);
427     put_byte(pb, 0);
428     return 0x15;
429 }
430
431 static int mov_write_avcc_tag(ByteIOContext *pb, MOVTrack *track)
432 {
433     offset_t pos = url_ftell(pb);
434
435     put_be32(pb, 0);
436     put_tag(pb, "avcC");
437     ff_isom_write_avcc(pb, track->vosData, track->vosLen);
438     return updateSize(pb, pos);
439 }
440
441 /* also used by all avid codecs (dv, imx, meridien) and their variants */
442 static int mov_write_avid_tag(ByteIOContext *pb, MOVTrack *track)
443 {
444     int i;
445     put_be32(pb, 24); /* size */
446     put_tag(pb, "ACLR");
447     put_tag(pb, "ACLR");
448     put_tag(pb, "0001");
449     put_be32(pb, 1); /* yuv 1 / rgb 2 ? */
450     put_be32(pb, 0); /* unknown */
451
452     put_be32(pb, 24); /* size */
453     put_tag(pb, "APRG");
454     put_tag(pb, "APRG");
455     put_tag(pb, "0001");
456     put_be32(pb, 1); /* unknown */
457     put_be32(pb, 0); /* unknown */
458
459     put_be32(pb, 120); /* size */
460     put_tag(pb, "ARES");
461     put_tag(pb, "ARES");
462     put_tag(pb, "0001");
463     put_be32(pb, AV_RB32(track->vosData + 0x28)); /* dnxhd cid, some id ? */
464     put_be32(pb, track->enc->width);
465     /* values below are based on samples created with quicktime and avid codecs */
466     if (track->vosData[5] & 2) { // interlaced
467         put_be32(pb, track->enc->height/2);
468         put_be32(pb, 2); /* unknown */
469         put_be32(pb, 0); /* unknown */
470         put_be32(pb, 4); /* unknown */
471     } else {
472         put_be32(pb, track->enc->height);
473         put_be32(pb, 1); /* unknown */
474         put_be32(pb, 0); /* unknown */
475         if (track->enc->height == 1080)
476             put_be32(pb, 5); /* unknown */
477         else
478             put_be32(pb, 6); /* unknown */
479     }
480     /* padding */
481     for (i = 0; i < 10; i++)
482         put_be64(pb, 0);
483
484     /* extra padding for stsd needed */
485     put_be32(pb, 0);
486     return 0;
487 }
488
489 static const AVCodecTag codec_3gp_tags[] = {
490     { CODEC_ID_H263,   MKTAG('s','2','6','3') },
491     { CODEC_ID_H264,   MKTAG('a','v','c','1') },
492     { CODEC_ID_MPEG4,  MKTAG('m','p','4','v') },
493     { CODEC_ID_AAC,    MKTAG('m','p','4','a') },
494     { CODEC_ID_AMR_NB, MKTAG('s','a','m','r') },
495     { CODEC_ID_AMR_WB, MKTAG('s','a','w','b') },
496 };
497
498 static const AVCodecTag mov_pix_fmt_tags[] = {
499     { PIX_FMT_YUYV422, MKTAG('y','u','v','s') },
500     { PIX_FMT_UYVY422, MKTAG('2','v','u','y') },
501     { PIX_FMT_BGR555,  MKTAG('r','a','w',' ') },
502     { PIX_FMT_RGB24,   MKTAG('r','a','w',' ') },
503     { PIX_FMT_BGR32_1, MKTAG('r','a','w',' ') },
504 };
505
506 static int mov_find_codec_tag(AVFormatContext *s, MOVTrack *track)
507 {
508     int tag = track->enc->codec_tag;
509     if (track->mode == MODE_MP4 || track->mode == MODE_PSP || track->mode == MODE_IPOD) {
510         if (!codec_get_tag(ff_mp4_obj_type, track->enc->codec_id))
511             return 0;
512         if (track->enc->codec_id == CODEC_ID_H264)           tag = MKTAG('a','v','c','1');
513         else if (track->enc->codec_type == CODEC_TYPE_VIDEO) tag = MKTAG('m','p','4','v');
514         else if (track->enc->codec_type == CODEC_TYPE_AUDIO) tag = MKTAG('m','p','4','a');
515     } else if (track->mode == MODE_3GP || track->mode == MODE_3G2) {
516         tag = codec_get_tag(codec_3gp_tags, track->enc->codec_id);
517     } else if (!tag || (track->enc->strict_std_compliance >= FF_COMPLIANCE_NORMAL &&
518                         (tag == MKTAG('d','v','c','p') ||
519                          track->enc->codec_id == CODEC_ID_RAWVIDEO))) {
520         if (track->enc->codec_id == CODEC_ID_DVVIDEO) {
521             if (track->enc->height == 480) /* NTSC */
522                 if  (track->enc->pix_fmt == PIX_FMT_YUV422P) tag = MKTAG('d','v','5','n');
523                 else                                         tag = MKTAG('d','v','c',' ');
524             else if (track->enc->pix_fmt == PIX_FMT_YUV422P) tag = MKTAG('d','v','5','p');
525             else if (track->enc->pix_fmt == PIX_FMT_YUV420P) tag = MKTAG('d','v','c','p');
526             else                                             tag = MKTAG('d','v','p','p');
527         } else if (track->enc->codec_id == CODEC_ID_RAWVIDEO) {
528             tag = codec_get_tag(mov_pix_fmt_tags, track->enc->pix_fmt);
529             if (!tag) // restore tag
530                 tag = track->enc->codec_tag;
531         } else {
532             if (track->enc->codec_type == CODEC_TYPE_VIDEO) {
533                 tag = codec_get_tag(codec_movvideo_tags, track->enc->codec_id);
534                 if (!tag) { // if no mac fcc found, try with Microsoft tags
535                     tag = codec_get_tag(codec_bmp_tags, track->enc->codec_id);
536                     if (tag)
537                         av_log(s, AV_LOG_INFO, "Warning, using MS style video codec tag, "
538                                "the file may be unplayable!\n");
539                 }
540             } else if (track->enc->codec_type == CODEC_TYPE_AUDIO) {
541                 tag = codec_get_tag(codec_movaudio_tags, track->enc->codec_id);
542                 if (!tag) { // if no mac fcc found, try with Microsoft tags
543                     int ms_tag = codec_get_tag(codec_wav_tags, track->enc->codec_id);
544                     if (ms_tag) {
545                         tag = MKTAG('m', 's', ((ms_tag >> 8) & 0xff), (ms_tag & 0xff));
546                         av_log(s, AV_LOG_INFO, "Warning, using MS style audio codec tag, "
547                                "the file may be unplayable!\n");
548                     }
549                 }
550             }
551         }
552     }
553     return tag;
554 }
555
556 /** Write uuid atom.
557  * Needed to make file play in iPods running newest firmware
558  * goes after avcC atom in moov.trak.mdia.minf.stbl.stsd.avc1
559  */
560 static int mov_write_uuid_tag_ipod(ByteIOContext *pb)
561 {
562     put_be32(pb, 28);
563     put_tag(pb, "uuid");
564     put_be32(pb, 0x6b6840f2);
565     put_be32(pb, 0x5f244fc5);
566     put_be32(pb, 0xba39a51b);
567     put_be32(pb, 0xcf0323f3);
568     put_be32(pb, 0x0);
569     return 28;
570 }
571
572 static int mov_write_video_tag(ByteIOContext *pb, MOVTrack *track)
573 {
574     offset_t pos = url_ftell(pb);
575     char compressor_name[32];
576
577     put_be32(pb, 0); /* size */
578     put_le32(pb, track->tag); // store it byteswapped
579     put_be32(pb, 0); /* Reserved */
580     put_be16(pb, 0); /* Reserved */
581     put_be16(pb, 1); /* Data-reference index */
582
583     put_be16(pb, 0); /* Codec stream version */
584     put_be16(pb, 0); /* Codec stream revision (=0) */
585     if (track->mode == MODE_MOV) {
586         put_tag(pb, "FFMP"); /* Vendor */
587         if(track->enc->codec_id == CODEC_ID_RAWVIDEO) {
588             put_be32(pb, 0); /* Temporal Quality */
589             put_be32(pb, 0x400); /* Spatial Quality = lossless*/
590         } else {
591             put_be32(pb, 0x200); /* Temporal Quality = normal */
592             put_be32(pb, 0x200); /* Spatial Quality = normal */
593         }
594     } else {
595         put_be32(pb, 0); /* Reserved */
596         put_be32(pb, 0); /* Reserved */
597         put_be32(pb, 0); /* Reserved */
598     }
599     put_be16(pb, track->enc->width); /* Video width */
600     put_be16(pb, track->enc->height); /* Video height */
601     put_be32(pb, 0x00480000); /* Horizontal resolution 72dpi */
602     put_be32(pb, 0x00480000); /* Vertical resolution 72dpi */
603     put_be32(pb, 0); /* Data size (= 0) */
604     put_be16(pb, 1); /* Frame count (= 1) */
605
606     memset(compressor_name,0,32);
607     /* FIXME not sure, ISO 14496-1 draft where it shall be set to 0 */
608     if (track->mode == MODE_MOV && track->enc->codec && track->enc->codec->name)
609         strncpy(compressor_name,track->enc->codec->name,31);
610     put_byte(pb, strlen(compressor_name));
611     put_buffer(pb, compressor_name, 31);
612
613     if (track->mode == MODE_MOV && track->enc->bits_per_sample)
614         put_be16(pb, track->enc->bits_per_sample);
615     else
616         put_be16(pb, 0x18); /* Reserved */
617     put_be16(pb, 0xffff); /* Reserved */
618     if(track->tag == MKTAG('m','p','4','v'))
619         mov_write_esds_tag(pb, track);
620     else if(track->enc->codec_id == CODEC_ID_H263)
621         mov_write_d263_tag(pb);
622     else if(track->enc->codec_id == CODEC_ID_SVQ3)
623         mov_write_svq3_tag(pb);
624     else if(track->enc->codec_id == CODEC_ID_DNXHD)
625         mov_write_avid_tag(pb, track);
626     else if(track->enc->codec_id == CODEC_ID_H264) {
627         mov_write_avcc_tag(pb, track);
628         if(track->mode == MODE_IPOD)
629             mov_write_uuid_tag_ipod(pb);
630     } else if(track->vosLen > 0)
631         mov_write_glbl_tag(pb, track);
632
633     return updateSize (pb, pos);
634 }
635
636 static int mov_write_stsd_tag(ByteIOContext *pb, MOVTrack *track)
637 {
638     offset_t pos = url_ftell(pb);
639     put_be32(pb, 0); /* size */
640     put_tag(pb, "stsd");
641     put_be32(pb, 0); /* version & flags */
642     put_be32(pb, 1); /* entry count */
643     if (track->enc->codec_type == CODEC_TYPE_VIDEO)
644         mov_write_video_tag(pb, track);
645     else if (track->enc->codec_type == CODEC_TYPE_AUDIO)
646         mov_write_audio_tag(pb, track);
647     return updateSize(pb, pos);
648 }
649
650 static int mov_write_ctts_tag(ByteIOContext *pb, MOVTrack *track)
651 {
652     MOV_stts_t *ctts_entries;
653     uint32_t entries = 0;
654     uint32_t atom_size;
655     int i;
656
657     ctts_entries = av_malloc((track->entry + 1) * sizeof(*ctts_entries)); /* worst case */
658     ctts_entries[0].count = 1;
659     ctts_entries[0].duration = track->cluster[0].cts;
660     for (i=1; i<track->entry; i++) {
661         if (track->cluster[i].cts == ctts_entries[entries].duration) {
662             ctts_entries[entries].count++; /* compress */
663         } else {
664             entries++;
665             ctts_entries[entries].duration = track->cluster[i].cts;
666             ctts_entries[entries].count = 1;
667         }
668     }
669     entries++; /* last one */
670     atom_size = 16 + (entries * 8);
671     put_be32(pb, atom_size); /* size */
672     put_tag(pb, "ctts");
673     put_be32(pb, 0); /* version & flags */
674     put_be32(pb, entries); /* entry count */
675     for (i=0; i<entries; i++) {
676         put_be32(pb, ctts_entries[i].count);
677         put_be32(pb, ctts_entries[i].duration);
678     }
679     av_free(ctts_entries);
680     return atom_size;
681 }
682
683 /* Time to sample atom */
684 static int mov_write_stts_tag(ByteIOContext *pb, MOVTrack *track)
685 {
686     MOV_stts_t *stts_entries;
687     uint32_t entries = -1;
688     uint32_t atom_size;
689     int i;
690
691     if (track->enc->codec_type == CODEC_TYPE_AUDIO && !track->audio_vbr) {
692         stts_entries = av_malloc(sizeof(*stts_entries)); /* one entry */
693         stts_entries[0].count = track->sampleCount;
694         stts_entries[0].duration = 1;
695         entries = 1;
696     } else {
697         stts_entries = av_malloc(track->entry * sizeof(*stts_entries)); /* worst case */
698         for (i=0; i<track->entry; i++) {
699             int64_t duration = i + 1 == track->entry ?
700                 track->trackDuration - track->cluster[i].dts + track->cluster[0].dts : /* readjusting */
701                 track->cluster[i+1].dts - track->cluster[i].dts;
702             if (i && duration == stts_entries[entries].duration) {
703                 stts_entries[entries].count++; /* compress */
704             } else {
705                 entries++;
706                 stts_entries[entries].duration = duration;
707                 stts_entries[entries].count = 1;
708             }
709         }
710         entries++; /* last one */
711     }
712     atom_size = 16 + (entries * 8);
713     put_be32(pb, atom_size); /* size */
714     put_tag(pb, "stts");
715     put_be32(pb, 0); /* version & flags */
716     put_be32(pb, entries); /* entry count */
717     for (i=0; i<entries; i++) {
718         put_be32(pb, stts_entries[i].count);
719         put_be32(pb, stts_entries[i].duration);
720     }
721     av_free(stts_entries);
722     return atom_size;
723 }
724
725 static int mov_write_dref_tag(ByteIOContext *pb)
726 {
727     put_be32(pb, 28); /* size */
728     put_tag(pb, "dref");
729     put_be32(pb, 0); /* version & flags */
730     put_be32(pb, 1); /* entry count */
731
732     put_be32(pb, 0xc); /* size */
733     put_tag(pb, "url ");
734     put_be32(pb, 1); /* version & flags */
735
736     return 28;
737 }
738
739 static int mov_write_stbl_tag(ByteIOContext *pb, MOVTrack *track)
740 {
741     offset_t pos = url_ftell(pb);
742     put_be32(pb, 0); /* size */
743     put_tag(pb, "stbl");
744     mov_write_stsd_tag(pb, track);
745     mov_write_stts_tag(pb, track);
746     if (track->enc->codec_type == CODEC_TYPE_VIDEO &&
747         track->hasKeyframes && track->hasKeyframes < track->entry)
748         mov_write_stss_tag(pb, track);
749     if (track->enc->codec_type == CODEC_TYPE_VIDEO &&
750         track->hasBframes)
751         mov_write_ctts_tag(pb, track);
752     mov_write_stsc_tag(pb, track);
753     mov_write_stsz_tag(pb, track);
754     mov_write_stco_tag(pb, track);
755     return updateSize(pb, pos);
756 }
757
758 static int mov_write_dinf_tag(ByteIOContext *pb)
759 {
760     offset_t pos = url_ftell(pb);
761     put_be32(pb, 0); /* size */
762     put_tag(pb, "dinf");
763     mov_write_dref_tag(pb);
764     return updateSize(pb, pos);
765 }
766
767 static int mov_write_smhd_tag(ByteIOContext *pb)
768 {
769     put_be32(pb, 16); /* size */
770     put_tag(pb, "smhd");
771     put_be32(pb, 0); /* version & flags */
772     put_be16(pb, 0); /* reserved (balance, normally = 0) */
773     put_be16(pb, 0); /* reserved */
774     return 16;
775 }
776
777 static int mov_write_vmhd_tag(ByteIOContext *pb)
778 {
779     put_be32(pb, 0x14); /* size (always 0x14) */
780     put_tag(pb, "vmhd");
781     put_be32(pb, 0x01); /* version & flags */
782     put_be64(pb, 0); /* reserved (graphics mode = copy) */
783     return 0x14;
784 }
785
786 static int mov_write_hdlr_tag(ByteIOContext *pb, MOVTrack *track)
787 {
788     const char *descr, *hdlr, *hdlr_type;
789     offset_t pos = url_ftell(pb);
790
791     if (!track) { /* no media --> data handler */
792         hdlr = "dhlr";
793         hdlr_type = "url ";
794         descr = "DataHandler";
795     } else {
796         hdlr = (track->mode == MODE_MOV) ? "mhlr" : "\0\0\0\0";
797         if (track->enc->codec_type == CODEC_TYPE_VIDEO) {
798             hdlr_type = "vide";
799             descr = "VideoHandler";
800         } else {
801             hdlr_type = "soun";
802             descr = "SoundHandler";
803         }
804     }
805
806     put_be32(pb, 0); /* size */
807     put_tag(pb, "hdlr");
808     put_be32(pb, 0); /* Version & flags */
809     put_buffer(pb, hdlr, 4); /* handler */
810     put_tag(pb, hdlr_type); /* handler type */
811     put_be32(pb ,0); /* reserved */
812     put_be32(pb ,0); /* reserved */
813     put_be32(pb ,0); /* reserved */
814     put_byte(pb, strlen(descr)); /* string counter */
815     put_buffer(pb, descr, strlen(descr)); /* handler description */
816     return updateSize(pb, pos);
817 }
818
819 static int mov_write_minf_tag(ByteIOContext *pb, MOVTrack *track)
820 {
821     offset_t pos = url_ftell(pb);
822     put_be32(pb, 0); /* size */
823     put_tag(pb, "minf");
824     if(track->enc->codec_type == CODEC_TYPE_VIDEO)
825         mov_write_vmhd_tag(pb);
826     else
827         mov_write_smhd_tag(pb);
828     if (track->mode == MODE_MOV) /* FIXME: Why do it for MODE_MOV only ? */
829         mov_write_hdlr_tag(pb, NULL);
830     mov_write_dinf_tag(pb);
831     mov_write_stbl_tag(pb, track);
832     return updateSize(pb, pos);
833 }
834
835 static int mov_write_mdhd_tag(ByteIOContext *pb, MOVTrack *track)
836 {
837     int version = track->trackDuration < INT32_MAX ? 0 : 1;
838
839     (version == 1) ? put_be32(pb, 44) : put_be32(pb, 32); /* size */
840     put_tag(pb, "mdhd");
841     put_byte(pb, version);
842     put_be24(pb, 0); /* flags */
843     if (version == 1) {
844         put_be64(pb, track->time);
845         put_be64(pb, track->time);
846     } else {
847         put_be32(pb, track->time); /* creation time */
848         put_be32(pb, track->time); /* modification time */
849     }
850     put_be32(pb, track->timescale); /* time scale (sample rate for audio) */
851     (version == 1) ? put_be64(pb, track->trackDuration) : put_be32(pb, track->trackDuration); /* duration */
852     put_be16(pb, track->language); /* language */
853     put_be16(pb, 0); /* reserved (quality) */
854
855     if(version!=0 && track->mode == MODE_MOV){
856         av_log(NULL, AV_LOG_ERROR,
857             "FATAL error, file duration too long for timebase, this file will not be\n"
858             "playable with quicktime. Choose a different timebase or a different\n"
859             "container format\n");
860     }
861
862     return 32;
863 }
864
865 static int mov_write_mdia_tag(ByteIOContext *pb, MOVTrack *track)
866 {
867     offset_t pos = url_ftell(pb);
868     put_be32(pb, 0); /* size */
869     put_tag(pb, "mdia");
870     mov_write_mdhd_tag(pb, track);
871     mov_write_hdlr_tag(pb, track);
872     mov_write_minf_tag(pb, track);
873     return updateSize(pb, pos);
874 }
875
876 static int mov_write_tkhd_tag(ByteIOContext *pb, MOVTrack *track)
877 {
878     int64_t duration = av_rescale_rnd(track->trackDuration, globalTimescale, track->timescale, AV_ROUND_UP);
879     int version = duration < INT32_MAX ? 0 : 1;
880
881     (version == 1) ? put_be32(pb, 104) : put_be32(pb, 92); /* size */
882     put_tag(pb, "tkhd");
883     put_byte(pb, version);
884     put_be24(pb, 0xf); /* flags (track enabled) */
885     if (version == 1) {
886         put_be64(pb, track->time);
887         put_be64(pb, track->time);
888     } else {
889         put_be32(pb, track->time); /* creation time */
890         put_be32(pb, track->time); /* modification time */
891     }
892     put_be32(pb, track->trackID); /* track-id */
893     put_be32(pb, 0); /* reserved */
894     (version == 1) ? put_be64(pb, duration) : put_be32(pb, duration);
895
896     put_be32(pb, 0); /* reserved */
897     put_be32(pb, 0); /* reserved */
898     put_be32(pb, 0x0); /* reserved (Layer & Alternate group) */
899     /* Volume, only for audio */
900     if(track->enc->codec_type == CODEC_TYPE_AUDIO)
901         put_be16(pb, 0x0100);
902     else
903         put_be16(pb, 0);
904     put_be16(pb, 0); /* reserved */
905
906     /* Matrix structure */
907     put_be32(pb, 0x00010000); /* reserved */
908     put_be32(pb, 0x0); /* reserved */
909     put_be32(pb, 0x0); /* reserved */
910     put_be32(pb, 0x0); /* reserved */
911     put_be32(pb, 0x00010000); /* reserved */
912     put_be32(pb, 0x0); /* reserved */
913     put_be32(pb, 0x0); /* reserved */
914     put_be32(pb, 0x0); /* reserved */
915     put_be32(pb, 0x40000000); /* reserved */
916
917     /* Track width and height, for visual only */
918     if(track->enc->codec_type == CODEC_TYPE_VIDEO) {
919         double sample_aspect_ratio = av_q2d(track->enc->sample_aspect_ratio);
920         if(!sample_aspect_ratio) sample_aspect_ratio = 1;
921         put_be32(pb, sample_aspect_ratio * track->enc->width*0x10000);
922         put_be32(pb, track->enc->height*0x10000);
923     }
924     else {
925         put_be32(pb, 0);
926         put_be32(pb, 0);
927     }
928     return 0x5c;
929 }
930
931 // This box seems important for the psp playback ... without it the movie seems to hang
932 static int mov_write_edts_tag(ByteIOContext *pb, MOVTrack *track)
933 {
934     put_be32(pb, 0x24); /* size  */
935     put_tag(pb, "edts");
936     put_be32(pb, 0x1c); /* size  */
937     put_tag(pb, "elst");
938     put_be32(pb, 0x0);
939     put_be32(pb, 0x1);
940
941     put_be32(pb, av_rescale_rnd(track->trackDuration, globalTimescale, track->timescale, AV_ROUND_UP)); /* duration   ... doesn't seem to effect psp */
942
943     put_be32(pb, track->cluster[0].cts); /* first pts is cts since dts is 0 */
944     put_be32(pb, 0x00010000);
945     return 0x24;
946 }
947
948 // goes at the end of each track!  ... Critical for PSP playback ("Incompatible data" without it)
949 static int mov_write_uuid_tag_psp(ByteIOContext *pb, MOVTrack *mov)
950 {
951     put_be32(pb, 0x34); /* size ... reports as 28 in mp4box! */
952     put_tag(pb, "uuid");
953     put_tag(pb, "USMT");
954     put_be32(pb, 0x21d24fce);
955     put_be32(pb, 0xbb88695c);
956     put_be32(pb, 0xfac9c740);
957     put_be32(pb, 0x1c);     // another size here!
958     put_tag(pb, "MTDT");
959     put_be32(pb, 0x00010012);
960     put_be32(pb, 0x0a);
961     put_be32(pb, 0x55c40000);
962     put_be32(pb, 0x1);
963     put_be32(pb, 0x0);
964     return 0x34;
965 }
966
967 static int mov_write_trak_tag(ByteIOContext *pb, MOVTrack *track)
968 {
969     offset_t pos = url_ftell(pb);
970     put_be32(pb, 0); /* size */
971     put_tag(pb, "trak");
972     mov_write_tkhd_tag(pb, track);
973     if (track->mode == MODE_PSP || track->hasBframes)
974         mov_write_edts_tag(pb, track);  // PSP Movies require edts box
975     mov_write_mdia_tag(pb, track);
976     if (track->mode == MODE_PSP)
977         mov_write_uuid_tag_psp(pb,track);  // PSP Movies require this uuid box
978     return updateSize(pb, pos);
979 }
980
981 #if 0
982 /* TODO: Not sorted out, but not necessary either */
983 static int mov_write_iods_tag(ByteIOContext *pb, MOVContext *mov)
984 {
985     put_be32(pb, 0x15); /* size */
986     put_tag(pb, "iods");
987     put_be32(pb, 0);    /* version & flags */
988     put_be16(pb, 0x1007);
989     put_byte(pb, 0);
990     put_be16(pb, 0x4fff);
991     put_be16(pb, 0xfffe);
992     put_be16(pb, 0x01ff);
993     return 0x15;
994 }
995 #endif
996
997 static int mov_write_mvhd_tag(ByteIOContext *pb, MOVContext *mov)
998 {
999     int maxTrackID = 1, i;
1000     int64_t maxTrackLenTemp, maxTrackLen = 0;
1001     int version;
1002
1003     for (i=0; i<mov->nb_streams; i++) {
1004         if(mov->tracks[i].entry > 0) {
1005             maxTrackLenTemp = av_rescale_rnd(mov->tracks[i].trackDuration, globalTimescale, mov->tracks[i].timescale, AV_ROUND_UP);
1006             if(maxTrackLen < maxTrackLenTemp)
1007                 maxTrackLen = maxTrackLenTemp;
1008             if(maxTrackID < mov->tracks[i].trackID)
1009                 maxTrackID = mov->tracks[i].trackID;
1010         }
1011     }
1012
1013     version = maxTrackLen < UINT32_MAX ? 0 : 1;
1014     (version == 1) ? put_be32(pb, 120) : put_be32(pb, 108); /* size */
1015     put_tag(pb, "mvhd");
1016     put_byte(pb, version);
1017     put_be24(pb, 0); /* flags */
1018     if (version == 1) {
1019         put_be64(pb, mov->time);
1020         put_be64(pb, mov->time);
1021     } else {
1022         put_be32(pb, mov->time); /* creation time */
1023         put_be32(pb, mov->time); /* modification time */
1024     }
1025     put_be32(pb, mov->timescale); /* timescale */
1026     (version == 1) ? put_be64(pb, maxTrackLen) : put_be32(pb, maxTrackLen); /* duration of longest track */
1027
1028     put_be32(pb, 0x00010000); /* reserved (preferred rate) 1.0 = normal */
1029     put_be16(pb, 0x0100); /* reserved (preferred volume) 1.0 = normal */
1030     put_be16(pb, 0); /* reserved */
1031     put_be32(pb, 0); /* reserved */
1032     put_be32(pb, 0); /* reserved */
1033
1034     /* Matrix structure */
1035     put_be32(pb, 0x00010000); /* reserved */
1036     put_be32(pb, 0x0); /* reserved */
1037     put_be32(pb, 0x0); /* reserved */
1038     put_be32(pb, 0x0); /* reserved */
1039     put_be32(pb, 0x00010000); /* reserved */
1040     put_be32(pb, 0x0); /* reserved */
1041     put_be32(pb, 0x0); /* reserved */
1042     put_be32(pb, 0x0); /* reserved */
1043     put_be32(pb, 0x40000000); /* reserved */
1044
1045     put_be32(pb, 0); /* reserved (preview time) */
1046     put_be32(pb, 0); /* reserved (preview duration) */
1047     put_be32(pb, 0); /* reserved (poster time) */
1048     put_be32(pb, 0); /* reserved (selection time) */
1049     put_be32(pb, 0); /* reserved (selection duration) */
1050     put_be32(pb, 0); /* reserved (current time) */
1051     put_be32(pb, maxTrackID+1); /* Next track id */
1052     return 0x6c;
1053 }
1054
1055 static int mov_write_itunes_hdlr_tag(ByteIOContext *pb, MOVContext *mov,
1056                                      AVFormatContext *s)
1057 {
1058     offset_t pos = url_ftell(pb);
1059     put_be32(pb, 0); /* size */
1060     put_tag(pb, "hdlr");
1061     put_be32(pb, 0);
1062     put_be32(pb, 0);
1063     put_tag(pb, "mdir");
1064     put_tag(pb, "appl");
1065     put_be32(pb, 0);
1066     put_be32(pb, 0);
1067     put_be16(pb, 0);
1068     return updateSize(pb, pos);
1069 }
1070
1071 /* helper function to write a data tag with the specified string as data */
1072 static int mov_write_string_data_tag(ByteIOContext *pb, const char *data, int long_style)
1073 {
1074     if(long_style){
1075         offset_t pos = url_ftell(pb);
1076         put_be32(pb, 0); /* size */
1077         put_tag(pb, "data");
1078         put_be32(pb, 1);
1079         put_be32(pb, 0);
1080         put_buffer(pb, data, strlen(data));
1081         return updateSize(pb, pos);
1082     }else{
1083         put_be16(pb, strlen(data)); /* string length */
1084         put_be16(pb, 0);
1085         put_buffer(pb, data, strlen(data));
1086         return strlen(data) + 4;
1087     }
1088 }
1089
1090 static int mov_write_string_tag(ByteIOContext *pb, const char *name, const char *value, int long_style){
1091     int size = 0;
1092     if (value && value[0]) {
1093         offset_t pos = url_ftell(pb);
1094         put_be32(pb, 0); /* size */
1095         put_tag(pb, name);
1096         mov_write_string_data_tag(pb, value, long_style);
1097         size= updateSize(pb, pos);
1098     }
1099     return size;
1100 }
1101
1102 /* iTunes year */
1103 static int mov_write_day_tag(ByteIOContext *pb, int year, int long_style)
1104 {
1105     if(year){
1106         char year_str[5];
1107         snprintf(year_str, sizeof(year_str), "%04d", year);
1108         return mov_write_string_tag(pb, "\251day", year_str, long_style);
1109     }else
1110         return 0;
1111 }
1112
1113 /* iTunes track number */
1114 static int mov_write_trkn_tag(ByteIOContext *pb, MOVContext *mov,
1115                               AVFormatContext *s)
1116 {
1117     int size = 0;
1118     if (s->track) {
1119         offset_t pos = url_ftell(pb);
1120         put_be32(pb, 0); /* size */
1121         put_tag(pb, "trkn");
1122         {
1123             offset_t pos = url_ftell(pb);
1124             put_be32(pb, 0); /* size */
1125             put_tag(pb, "data");
1126             put_be32(pb, 0);        // 8 bytes empty
1127             put_be32(pb, 0);
1128             put_be16(pb, 0);        // empty
1129             put_be16(pb, s->track); // track number
1130             put_be16(pb, 0);        // total track number
1131             put_be16(pb, 0);        // empty
1132             updateSize(pb, pos);
1133         }
1134         size = updateSize(pb, pos);
1135     }
1136     return size;
1137 }
1138
1139 /* iTunes meta data list */
1140 static int mov_write_ilst_tag(ByteIOContext *pb, MOVContext *mov,
1141                               AVFormatContext *s)
1142 {
1143     offset_t pos = url_ftell(pb);
1144     put_be32(pb, 0); /* size */
1145     put_tag(pb, "ilst");
1146     mov_write_string_tag(pb, "\251nam", s->title         , 1);
1147     mov_write_string_tag(pb, "\251ART", s->author        , 1);
1148     mov_write_string_tag(pb, "\251wrt", s->author        , 1);
1149     mov_write_string_tag(pb, "\251alb", s->album         , 1);
1150     mov_write_day_tag(pb, s->year ,1);
1151     if(mov->tracks[0].enc && !(mov->tracks[0].enc->flags & CODEC_FLAG_BITEXACT))
1152         mov_write_string_tag(pb, "\251too", LIBAVFORMAT_IDENT, 1);
1153     mov_write_string_tag(pb, "\251cmt", s->comment       , 1);
1154     mov_write_string_tag(pb, "\251gen", s->genre         , 1);
1155     mov_write_trkn_tag(pb, mov, s);
1156     return updateSize(pb, pos);
1157 }
1158
1159 /* iTunes meta data tag */
1160 static int mov_write_meta_tag(ByteIOContext *pb, MOVContext *mov,
1161                               AVFormatContext *s)
1162 {
1163     int size = 0;
1164
1165     // only save meta tag if required
1166     if (s->title[0] || s->author[0] || s->album[0] || s->year ||
1167          s->comment[0] || s->genre[0] || s->track) {
1168         offset_t pos = url_ftell(pb);
1169         put_be32(pb, 0); /* size */
1170         put_tag(pb, "meta");
1171         put_be32(pb, 0);
1172         mov_write_itunes_hdlr_tag(pb, mov, s);
1173         mov_write_ilst_tag(pb, mov, s);
1174         size = updateSize(pb, pos);
1175     }
1176     return size;
1177 }
1178
1179 static int mov_write_udta_tag(ByteIOContext *pb, MOVContext *mov,
1180                               AVFormatContext *s)
1181 {
1182     int i;
1183
1184     if (s->title[0]   || s->author[0] || s->album[0] || s->year ||
1185         s->comment[0] || s->genre[0]  || s->track ||
1186        (mov->mode == MODE_MOV &&
1187          (mov->tracks[0].enc && !mov->tracks[0].enc->flags & CODEC_FLAG_BITEXACT))) {
1188         offset_t pos = url_ftell(pb);
1189
1190         put_be32(pb, 0); /* size */
1191         put_tag(pb, "udta");
1192
1193         /* iTunes meta data */
1194         mov_write_meta_tag(pb, mov, s);
1195
1196         if(mov->mode == MODE_MOV){ // the title field breaks gtkpod with mp4 and my suspicion is that stuff is not valid in mp4
1197             mov_write_string_tag(pb, "\251nam", s->title         , 0);
1198             mov_write_string_tag(pb, "\251aut", s->author        , 0);
1199             mov_write_string_tag(pb, "\251alb", s->album         , 0);
1200             mov_write_day_tag(pb, s->year, 0);
1201             if(mov->tracks[0].enc && !(mov->tracks[0].enc->flags & CODEC_FLAG_BITEXACT))
1202                 mov_write_string_tag(pb, "\251enc", LIBAVFORMAT_IDENT, 0);
1203             mov_write_string_tag(pb, "\251des", s->comment       , 0);
1204             mov_write_string_tag(pb, "\251gen", s->genre         , 0);
1205         }
1206
1207         return updateSize(pb, pos);
1208     }
1209
1210     return 0;
1211 }
1212
1213 static int utf8len(const uint8_t *b)
1214 {
1215     int len=0;
1216     int val;
1217     while(*b){
1218         GET_UTF8(val, *b++, return -1;)
1219         len++;
1220     }
1221     return len;
1222 }
1223
1224 static int ascii_to_wc(ByteIOContext *pb, const uint8_t *b)
1225 {
1226     int val;
1227     while(*b){
1228         GET_UTF8(val, *b++, return -1;)
1229         put_be16(pb, val);
1230     }
1231     put_be16(pb, 0x00);
1232     return 0;
1233 }
1234
1235 static uint16_t language_code(const char *str)
1236 {
1237     return (((str[0]-0x60) & 0x1F) << 10) + (((str[1]-0x60) & 0x1F) << 5) + ((str[2]-0x60) & 0x1F);
1238 }
1239
1240 static int mov_write_uuidusmt_tag(ByteIOContext *pb, AVFormatContext *s)
1241 {
1242     size_t len, size;
1243     offset_t pos, curpos;
1244
1245     size = 0;
1246     if (s->title[0]) {
1247         pos = url_ftell(pb);
1248         put_be32(pb, 0); /* size placeholder*/
1249         put_tag(pb, "uuid");
1250         put_tag(pb, "USMT");
1251         put_be32(pb, 0x21d24fce); /* 96 bit UUID */
1252         put_be32(pb, 0xbb88695c);
1253         put_be32(pb, 0xfac9c740);
1254         size += 24;
1255
1256         put_be32(pb, 0); /* size placeholder*/
1257         put_tag(pb, "MTDT");
1258         put_be16(pb, 4);
1259         size += 10;
1260
1261         // ?
1262         put_be16(pb, 0x0C);                 /* size */
1263         put_be32(pb, 0x0B);                 /* type */
1264         put_be16(pb, language_code("und")); /* language */
1265         put_be16(pb, 0x0);                  /* ? */
1266         put_be16(pb, 0x021C);               /* data */
1267         size += 12;
1268
1269         // Encoder
1270         len = utf8len(LIBAVCODEC_IDENT)+1;
1271         if(len<=0)
1272             goto not_utf8;
1273         put_be16(pb, len*2+10);             /* size */
1274         put_be32(pb, 0x04);                 /* type */
1275         put_be16(pb, language_code("eng")); /* language */
1276         put_be16(pb, 0x01);                 /* ? */
1277         ascii_to_wc(pb, LIBAVCODEC_IDENT);
1278         size += len*2+10;
1279
1280         // Title
1281         len = utf8len(s->title)+1;
1282         if(len<=0)
1283             goto not_utf8;
1284         put_be16(pb, len*2+10);             /* size */
1285         put_be32(pb, 0x01);                 /* type */
1286         put_be16(pb, language_code("eng")); /* language */
1287         put_be16(pb, 0x01);                 /* ? */
1288         ascii_to_wc (pb, s->title);
1289         size += len*2+10;
1290
1291         // Date
1292 //        snprintf(dt,32,"%04d/%02d/%02d %02d:%02d:%02d",t_st->tm_year+1900,t_st->tm_mon+1,t_st->tm_mday,t_st->tm_hour,t_st->tm_min,t_st->tm_sec);
1293         len = utf8len("2006/04/01 11:11:11")+1;
1294         if(len<=0)
1295             goto not_utf8;
1296         put_be16(pb, len*2+10);    /* size */
1297         put_be32(pb, 0x03);        /* type */
1298         put_be16(pb, language_code("und")); /* language */
1299         put_be16(pb, 0x01);        /* ? */
1300         ascii_to_wc (pb, "2006/04/01 11:11:11");
1301         size += len*2+10;
1302
1303         // size
1304         curpos = url_ftell(pb);
1305         url_fseek(pb, pos, SEEK_SET);
1306         put_be32(pb, size);
1307         url_fseek(pb, pos+24, SEEK_SET);
1308         put_be32(pb, size-24);
1309         url_fseek(pb, curpos, SEEK_SET);
1310     }
1311
1312     return size;
1313 not_utf8:
1314     av_log(s, AV_LOG_ERROR, "not utf8\n");
1315     return -1;
1316 }
1317
1318 static int mov_write_moov_tag(ByteIOContext *pb, MOVContext *mov,
1319                               AVFormatContext *s)
1320 {
1321     int i;
1322     offset_t pos = url_ftell(pb);
1323     put_be32(pb, 0); /* size placeholder*/
1324     put_tag(pb, "moov");
1325     mov->timescale = globalTimescale;
1326
1327     for (i=0; i<mov->nb_streams; i++) {
1328         if(mov->tracks[i].entry <= 0) continue;
1329
1330         mov->tracks[i].time = mov->time;
1331         mov->tracks[i].trackID = i+1;
1332     }
1333
1334     mov_write_mvhd_tag(pb, mov);
1335     //mov_write_iods_tag(pb, mov);
1336     for (i=0; i<mov->nb_streams; i++) {
1337         if(mov->tracks[i].entry > 0) {
1338             mov_write_trak_tag(pb, &(mov->tracks[i]));
1339         }
1340     }
1341
1342     if (mov->mode == MODE_PSP)
1343         mov_write_uuidusmt_tag(pb, s);
1344     else if (mov->mode != MODE_3GP && mov->mode != MODE_3G2)
1345         mov_write_udta_tag(pb, mov, s);
1346
1347     return updateSize(pb, pos);
1348 }
1349
1350 static int mov_write_mdat_tag(ByteIOContext *pb, MOVContext *mov)
1351 {
1352     put_be32(pb, 8);    // placeholder for extended size field (64 bit)
1353     put_tag(pb, mov->mode == MODE_MOV ? "wide" : "free");
1354
1355     mov->mdat_pos = url_ftell(pb);
1356     put_be32(pb, 0); /* size placeholder*/
1357     put_tag(pb, "mdat");
1358     return 0;
1359 }
1360
1361 /* TODO: This needs to be more general */
1362 static void mov_write_ftyp_tag (ByteIOContext *pb, AVFormatContext *s)
1363 {
1364     MOVContext *mov = s->priv_data;
1365
1366     put_be32(pb, 0x14); /* size */
1367     put_tag(pb, "ftyp");
1368
1369     if (mov->mode == MODE_3GP)
1370         put_tag(pb, "3gp4");
1371     else if (mov->mode == MODE_3G2)
1372         put_tag(pb, "3g2a");
1373     else if (mov->mode == MODE_PSP)
1374         put_tag(pb, "MSNV");
1375     else if (mov->mode == MODE_MP4 || mov->mode == MODE_IPOD)
1376         put_tag(pb, "isom");
1377     else
1378         put_tag(pb, "qt  ");
1379
1380     put_be32(pb, 0x200);
1381
1382     if (mov->mode == MODE_3GP)
1383         put_tag(pb, "3gp4");
1384     else if (mov->mode == MODE_3G2)
1385         put_tag(pb, "3g2a");
1386     else if (mov->mode == MODE_PSP)
1387         put_tag(pb, "MSNV");
1388     else if (mov->mode == MODE_MP4 || mov->mode == MODE_IPOD)
1389         put_tag(pb, "mp41");
1390     else
1391         put_tag(pb, "qt  ");
1392 }
1393
1394 static void mov_write_uuidprof_tag(ByteIOContext *pb, AVFormatContext *s)
1395 {
1396     AVCodecContext *VideoCodec = s->streams[0]->codec;
1397     AVCodecContext *AudioCodec = s->streams[1]->codec;
1398     int AudioRate = AudioCodec->sample_rate;
1399     int FrameRate = ((VideoCodec->time_base.den) * (0x10000))/ (VideoCodec->time_base.num);
1400     int audio_kbitrate= AudioCodec->bit_rate / 1000;
1401     int video_kbitrate= FFMIN(VideoCodec->bit_rate / 1000, 800 - audio_kbitrate);
1402
1403     put_be32(pb, 0x94); /* size */
1404     put_tag(pb, "uuid");
1405     put_tag(pb, "PROF");
1406
1407     put_be32(pb, 0x21d24fce); /* 96 bit UUID */
1408     put_be32(pb, 0xbb88695c);
1409     put_be32(pb, 0xfac9c740);
1410
1411     put_be32(pb, 0x0);  /* ? */
1412     put_be32(pb, 0x3);  /* 3 sections ? */
1413
1414     put_be32(pb, 0x14); /* size */
1415     put_tag(pb, "FPRF");
1416     put_be32(pb, 0x0);  /* ? */
1417     put_be32(pb, 0x0);  /* ? */
1418     put_be32(pb, 0x0);  /* ? */
1419
1420     put_be32(pb, 0x2c);  /* size */
1421     put_tag(pb, "APRF");   /* audio */
1422     put_be32(pb, 0x0);
1423     put_be32(pb, 0x2);   /* TrackID */
1424     put_tag(pb, "mp4a");
1425     put_be32(pb, 0x20f);
1426     put_be32(pb, 0x0);
1427     put_be32(pb, audio_kbitrate);
1428     put_be32(pb, audio_kbitrate);
1429     put_be32(pb, AudioRate);
1430     put_be32(pb, AudioCodec->channels);
1431
1432     put_be32(pb, 0x34);  /* size */
1433     put_tag(pb, "VPRF");   /* video */
1434     put_be32(pb, 0x0);
1435     put_be32(pb, 0x1);    /* TrackID */
1436     if (VideoCodec->codec_id == CODEC_ID_H264) {
1437         put_tag(pb, "avc1");
1438         put_be16(pb, 0x014D);
1439         put_be16(pb, 0x0015);
1440     } else {
1441         put_tag(pb, "mp4v");
1442         put_be16(pb, 0x0000);
1443         put_be16(pb, 0x0103);
1444     }
1445     put_be32(pb, 0x0);
1446     put_be32(pb, video_kbitrate);
1447     put_be32(pb, video_kbitrate);
1448     put_be32(pb, FrameRate);
1449     put_be32(pb, FrameRate);
1450     put_be16(pb, VideoCodec->width);
1451     put_be16(pb, VideoCodec->height);
1452     put_be32(pb, 0x010001); /* ? */
1453 }
1454
1455 static int mov_write_header(AVFormatContext *s)
1456 {
1457     ByteIOContext *pb = s->pb;
1458     MOVContext *mov = s->priv_data;
1459     int i;
1460
1461     if (url_is_streamed(s->pb)) {
1462         av_log(s, AV_LOG_ERROR, "muxer does not support non seekable output\n");
1463         return -1;
1464     }
1465
1466     /* Default mode == MP4 */
1467     mov->mode = MODE_MP4;
1468
1469     if (s->oformat != NULL) {
1470         if (!strcmp("3gp", s->oformat->name)) mov->mode = MODE_3GP;
1471         else if (!strcmp("3g2", s->oformat->name)) mov->mode = MODE_3G2;
1472         else if (!strcmp("mov", s->oformat->name)) mov->mode = MODE_MOV;
1473         else if (!strcmp("psp", s->oformat->name)) mov->mode = MODE_PSP;
1474         else if (!strcmp("ipod",s->oformat->name)) mov->mode = MODE_IPOD;
1475
1476         mov_write_ftyp_tag(pb,s);
1477         if (mov->mode == MODE_PSP) {
1478             if (s->nb_streams != 2) {
1479                 av_log(s, AV_LOG_ERROR, "PSP mode need one video and one audio stream\n");
1480                 return -1;
1481             }
1482             mov_write_uuidprof_tag(pb,s);
1483         }
1484     }
1485
1486     for(i=0; i<s->nb_streams; i++){
1487         AVStream *st= s->streams[i];
1488         MOVTrack *track= &mov->tracks[i];
1489
1490         track->enc = st->codec;
1491         track->language = ff_mov_iso639_to_lang(st->language, mov->mode != MODE_MOV);
1492         track->mode = mov->mode;
1493         track->tag = mov_find_codec_tag(s, track);
1494         if (!track->tag) {
1495             av_log(s, AV_LOG_ERROR, "track %d: could not find tag for codec\n", i);
1496             return -1;
1497         }
1498         if(st->codec->codec_type == CODEC_TYPE_VIDEO){
1499             track->timescale = st->codec->time_base.den;
1500             av_set_pts_info(st, 64, 1, st->codec->time_base.den);
1501             if (track->mode == MODE_MOV && track->timescale > 100000)
1502                 av_log(s, AV_LOG_WARNING,
1503                        "WARNING codec timebase is very high. If duration is too long,\n"
1504                        "file may not be playable by quicktime. Specify a shorter timebase\n"
1505                        "or choose different container.\n");
1506         }else if(st->codec->codec_type == CODEC_TYPE_AUDIO){
1507             track->timescale = st->codec->sample_rate;
1508             av_set_pts_info(st, 64, 1, st->codec->sample_rate);
1509             if(!st->codec->frame_size){
1510                 av_log(s, AV_LOG_ERROR, "track %d: codec frame size is not set\n", i);
1511                 return -1;
1512             }else if(st->codec->frame_size > 1){ /* assume compressed audio */
1513                 track->audio_vbr = 1;
1514             }else{
1515                 track->sampleSize = (av_get_bits_per_sample(st->codec->codec_id) >> 3) * st->codec->channels;
1516             }
1517         }
1518     }
1519
1520     mov_write_mdat_tag(pb, mov);
1521     mov->time = s->timestamp + 0x7C25B080; //1970 based -> 1904 based
1522     mov->nb_streams = s->nb_streams;
1523
1524     put_flush_packet(pb);
1525
1526     return 0;
1527 }
1528
1529 static int mov_write_packet(AVFormatContext *s, AVPacket *pkt)
1530 {
1531     MOVContext *mov = s->priv_data;
1532     ByteIOContext *pb = s->pb;
1533     MOVTrack *trk = &mov->tracks[pkt->stream_index];
1534     AVCodecContext *enc = trk->enc;
1535     unsigned int samplesInChunk = 0;
1536     int size= pkt->size;
1537
1538     if (url_is_streamed(s->pb)) return 0; /* Can't handle that */
1539     if (!size) return 0; /* Discard 0 sized packets */
1540
1541     if (enc->codec_id == CODEC_ID_AMR_NB) {
1542         /* We must find out how many AMR blocks there are in one packet */
1543         static uint16_t packed_size[16] =
1544             {13, 14, 16, 18, 20, 21, 27, 32, 6, 0, 0, 0, 0, 0, 0, 0};
1545         int len = 0;
1546
1547         while (len < size && samplesInChunk < 100) {
1548             len += packed_size[(pkt->data[len] >> 3) & 0x0F];
1549             samplesInChunk++;
1550         }
1551         if(samplesInChunk > 1){
1552             av_log(s, AV_LOG_ERROR, "fatal error, input is not a single packet, implement a AVParser for it\n");
1553             return -1;
1554         }
1555     } else if (trk->sampleSize)
1556         samplesInChunk = size/trk->sampleSize;
1557     else
1558         samplesInChunk = 1;
1559
1560     /* copy extradata if it exists */
1561     if (trk->vosLen == 0 && enc->extradata_size > 0) {
1562         trk->vosLen = enc->extradata_size;
1563         trk->vosData = av_malloc(trk->vosLen);
1564         memcpy(trk->vosData, enc->extradata, trk->vosLen);
1565     }
1566
1567     if (enc->codec_id == CODEC_ID_H264 && trk->vosLen > 0 && *(uint8_t *)trk->vosData != 1) {
1568         /* from x264 or from bytestream h264 */
1569         /* nal reformating needed */
1570         int ret = ff_avc_parse_nal_units(pkt->data, &pkt->data, &pkt->size);
1571         if (ret < 0)
1572             return ret;
1573         assert(pkt->size);
1574         size = pkt->size;
1575     } else if (enc->codec_id == CODEC_ID_DNXHD && !trk->vosLen) {
1576         /* copy frame header to create needed atoms */
1577         if (size < 640)
1578             return -1;
1579         trk->vosLen = 640;
1580         trk->vosData = av_malloc(trk->vosLen);
1581         memcpy(trk->vosData, pkt->data, 640);
1582     }
1583
1584     if (!(trk->entry % MOV_INDEX_CLUSTER_SIZE)) {
1585         trk->cluster = av_realloc(trk->cluster, (trk->entry + MOV_INDEX_CLUSTER_SIZE) * sizeof(*trk->cluster));
1586         if (!trk->cluster)
1587             return -1;
1588     }
1589
1590     trk->cluster[trk->entry].pos = url_ftell(pb);
1591     trk->cluster[trk->entry].samplesInChunk = samplesInChunk;
1592     trk->cluster[trk->entry].size = size;
1593     trk->cluster[trk->entry].entries = samplesInChunk;
1594     trk->cluster[trk->entry].dts = pkt->dts;
1595     trk->trackDuration = pkt->dts - trk->cluster[0].dts + pkt->duration;
1596
1597     if (pkt->pts == AV_NOPTS_VALUE) {
1598         av_log(s, AV_LOG_WARNING, "pts has no value\n");
1599         pkt->pts = pkt->dts;
1600     }
1601     if (pkt->dts != pkt->pts)
1602         trk->hasBframes = 1;
1603     trk->cluster[trk->entry].cts = pkt->pts - pkt->dts;
1604     trk->cluster[trk->entry].key_frame = !!(pkt->flags & PKT_FLAG_KEY);
1605     if(trk->cluster[trk->entry].key_frame)
1606         trk->hasKeyframes++;
1607     trk->entry++;
1608     trk->sampleCount += samplesInChunk;
1609     mov->mdat_size += size;
1610
1611     put_buffer(pb, pkt->data, size);
1612
1613     put_flush_packet(pb);
1614     return 0;
1615 }
1616
1617 static int mov_write_trailer(AVFormatContext *s)
1618 {
1619     MOVContext *mov = s->priv_data;
1620     ByteIOContext *pb = s->pb;
1621     int res = 0;
1622     int i;
1623
1624     offset_t moov_pos = url_ftell(pb);
1625
1626     /* Write size of mdat tag */
1627     if (mov->mdat_size+8 <= UINT32_MAX) {
1628         url_fseek(pb, mov->mdat_pos, SEEK_SET);
1629         put_be32(pb, mov->mdat_size+8);
1630     } else {
1631         /* overwrite 'wide' placeholder atom */
1632         url_fseek(pb, mov->mdat_pos - 8, SEEK_SET);
1633         put_be32(pb, 1); /* special value: real atom size will be 64 bit value after tag field */
1634         put_tag(pb, "mdat");
1635         put_be64(pb, mov->mdat_size+16);
1636     }
1637     url_fseek(pb, moov_pos, SEEK_SET);
1638
1639     mov_write_moov_tag(pb, mov, s);
1640
1641     for (i=0; i<mov->nb_streams; i++) {
1642         av_freep(&mov->tracks[i].cluster);
1643
1644         if(mov->tracks[i].vosLen) av_free(mov->tracks[i].vosData);
1645
1646     }
1647
1648     put_flush_packet(pb);
1649
1650     return res;
1651 }
1652
1653 #ifdef CONFIG_MOV_MUXER
1654 AVOutputFormat mov_muxer = {
1655     "mov",
1656     NULL_IF_CONFIG_SMALL("MOV format"),
1657     NULL,
1658     "mov",
1659     sizeof(MOVContext),
1660     CODEC_ID_AAC,
1661     CODEC_ID_MPEG4,
1662     mov_write_header,
1663     mov_write_packet,
1664     mov_write_trailer,
1665     .flags = AVFMT_GLOBALHEADER,
1666     .codec_tag = (const AVCodecTag*[]){codec_movvideo_tags, codec_movaudio_tags, 0},
1667 };
1668 #endif
1669 #ifdef CONFIG_TGP_MUXER
1670 AVOutputFormat tgp_muxer = {
1671     "3gp",
1672     NULL_IF_CONFIG_SMALL("3GP format"),
1673     NULL,
1674     "3gp",
1675     sizeof(MOVContext),
1676     CODEC_ID_AMR_NB,
1677     CODEC_ID_H263,
1678     mov_write_header,
1679     mov_write_packet,
1680     mov_write_trailer,
1681     .flags = AVFMT_GLOBALHEADER,
1682     .codec_tag = (const AVCodecTag*[]){codec_3gp_tags, 0},
1683 };
1684 #endif
1685 #ifdef CONFIG_MP4_MUXER
1686 AVOutputFormat mp4_muxer = {
1687     "mp4",
1688     NULL_IF_CONFIG_SMALL("MP4 format"),
1689     "application/mp4",
1690     "mp4,m4a",
1691     sizeof(MOVContext),
1692     CODEC_ID_AAC,
1693     CODEC_ID_MPEG4,
1694     mov_write_header,
1695     mov_write_packet,
1696     mov_write_trailer,
1697     .flags = AVFMT_GLOBALHEADER,
1698     .codec_tag = (const AVCodecTag*[]){ff_mp4_obj_type, 0},
1699 };
1700 #endif
1701 #ifdef CONFIG_PSP_MUXER
1702 AVOutputFormat psp_muxer = {
1703     "psp",
1704     NULL_IF_CONFIG_SMALL("PSP MP4 format"),
1705     NULL,
1706     "mp4,psp",
1707     sizeof(MOVContext),
1708     CODEC_ID_AAC,
1709     CODEC_ID_MPEG4,
1710     mov_write_header,
1711     mov_write_packet,
1712     mov_write_trailer,
1713     .flags = AVFMT_GLOBALHEADER,
1714     .codec_tag = (const AVCodecTag*[]){ff_mp4_obj_type, 0},
1715 };
1716 #endif
1717 #ifdef CONFIG_TG2_MUXER
1718 AVOutputFormat tg2_muxer = {
1719     "3g2",
1720     NULL_IF_CONFIG_SMALL("3GP2 format"),
1721     NULL,
1722     "3g2",
1723     sizeof(MOVContext),
1724     CODEC_ID_AMR_NB,
1725     CODEC_ID_H263,
1726     mov_write_header,
1727     mov_write_packet,
1728     mov_write_trailer,
1729     .flags = AVFMT_GLOBALHEADER,
1730     .codec_tag = (const AVCodecTag*[]){codec_3gp_tags, 0},
1731 };
1732 #endif
1733 #ifdef CONFIG_IPOD_MUXER
1734 AVOutputFormat ipod_muxer = {
1735     "ipod",
1736     NULL_IF_CONFIG_SMALL("iPod H.264 MP4 format"),
1737     "application/mp4",
1738     NULL,
1739     sizeof(MOVContext),
1740     CODEC_ID_AAC,
1741     CODEC_ID_H264,
1742     mov_write_header,
1743     mov_write_packet,
1744     mov_write_trailer,
1745     .flags = AVFMT_GLOBALHEADER,
1746     .codec_tag = (const AVCodecTag*[]){ff_mp4_obj_type, 0},
1747 };
1748 #endif