]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavformat/movenc.c
support for alac in .mov
[frescor/ffmpeg.git] / libavformat / movenc.c
1 /*
2  * MOV, 3GP, MP4 muxer
3  * Copyright (c) 2003 Thomas Raivio.
4  * Copyright (c) 2004 Gildas Bazin <gbazin at videolan dot org>.
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22 #include "avformat.h"
23 #include "riff.h"
24 #include "avio.h"
25 #include "isom.h"
26 #include "avc.h"
27
28 #undef NDEBUG
29 #include <assert.h>
30
31 #define MOV_INDEX_CLUSTER_SIZE 16384
32 #define globalTimescale 1000
33
34 #define MODE_MP4 0
35 #define MODE_MOV 1
36 #define MODE_3GP 2
37 #define MODE_PSP 3 // example working PSP command line:
38 // ffmpeg -i testinput.avi  -f psp -r 14.985 -s 320x240 -b 768 -ar 24000 -ab 32 M4V00001.MP4
39 #define MODE_3G2 4
40 #define MODE_IPOD 5
41
42 typedef struct MOVIentry {
43     unsigned int flags, size;
44     uint64_t     pos;
45     unsigned int samplesInChunk;
46     char         key_frame;
47     unsigned int entries;
48     int64_t      cts;
49     int64_t      dts;
50 } MOVIentry;
51
52 typedef struct MOVIndex {
53     int         mode;
54     int         entry;
55     long        timescale;
56     long        time;
57     int64_t     trackDuration;
58     long        sampleCount;
59     long        sampleSize;
60     int         hasKeyframes;
61     int         hasBframes;
62     int         language;
63     int         trackID;
64     int         tag; ///< stsd fourcc
65     AVCodecContext *enc;
66
67     int         vosLen;
68     uint8_t     *vosData;
69     MOVIentry   *cluster;
70     int         audio_vbr;
71 } MOVTrack;
72
73 typedef struct MOVContext {
74     int     mode;
75     int64_t time;
76     int     nb_streams;
77     offset_t mdat_pos;
78     uint64_t mdat_size;
79     long    timescale;
80     MOVTrack tracks[MAX_STREAMS];
81 } MOVContext;
82
83 //FIXME support 64 bit variant with wide placeholders
84 static offset_t updateSize (ByteIOContext *pb, offset_t pos)
85 {
86     offset_t curpos = url_ftell(pb);
87     url_fseek(pb, pos, SEEK_SET);
88     put_be32(pb, curpos - pos); /* rewrite size */
89     url_fseek(pb, curpos, SEEK_SET);
90
91     return curpos - pos;
92 }
93
94 /* Chunk offset atom */
95 static int mov_write_stco_tag(ByteIOContext *pb, MOVTrack* track)
96 {
97     int i;
98     int mode64 = 0; //   use 32 bit size variant if possible
99     offset_t pos = url_ftell(pb);
100     put_be32(pb, 0); /* size */
101     if (pos > UINT32_MAX) {
102         mode64 = 1;
103         put_tag(pb, "co64");
104     } else
105         put_tag(pb, "stco");
106     put_be32(pb, 0); /* version & flags */
107     put_be32(pb, track->entry); /* entry count */
108     for (i=0; i<track->entry; i++) {
109         if(mode64 == 1)
110             put_be64(pb, track->cluster[i].pos);
111         else
112             put_be32(pb, track->cluster[i].pos);
113     }
114     return updateSize (pb, pos);
115 }
116
117 /* Sample size atom */
118 static int mov_write_stsz_tag(ByteIOContext *pb, MOVTrack* track)
119 {
120     int equalChunks = 1;
121     int i, j, entries = 0, tst = -1, oldtst = -1;
122
123     offset_t pos = url_ftell(pb);
124     put_be32(pb, 0); /* size */
125     put_tag(pb, "stsz");
126     put_be32(pb, 0); /* version & flags */
127
128     for (i=0; i<track->entry; i++) {
129         tst = track->cluster[i].size/track->cluster[i].entries;
130         if(oldtst != -1 && tst != oldtst) {
131             equalChunks = 0;
132         }
133         oldtst = tst;
134         entries += track->cluster[i].entries;
135     }
136     if (equalChunks) {
137         int sSize = track->cluster[0].size/track->cluster[0].entries;
138         put_be32(pb, sSize); // sample size
139         put_be32(pb, entries); // sample count
140     }
141     else {
142         put_be32(pb, 0); // sample size
143         put_be32(pb, entries); // sample count
144         for (i=0; i<track->entry; i++) {
145             for (j=0; j<track->cluster[i].entries; j++) {
146                 put_be32(pb, track->cluster[i].size /
147                          track->cluster[i].entries);
148             }
149         }
150     }
151     return updateSize (pb, pos);
152 }
153
154 /* Sample to chunk atom */
155 static int mov_write_stsc_tag(ByteIOContext *pb, MOVTrack* track)
156 {
157     int index = 0, oldval = -1, i;
158     offset_t entryPos, curpos;
159
160     offset_t pos = url_ftell(pb);
161     put_be32(pb, 0); /* size */
162     put_tag(pb, "stsc");
163     put_be32(pb, 0); // version & flags
164     entryPos = url_ftell(pb);
165     put_be32(pb, track->entry); // entry count
166     for (i=0; i<track->entry; i++) {
167         if(oldval != track->cluster[i].samplesInChunk)
168         {
169             put_be32(pb, i+1); // first chunk
170             put_be32(pb, track->cluster[i].samplesInChunk); // samples per chunk
171             put_be32(pb, 0x1); // sample description index
172             oldval = track->cluster[i].samplesInChunk;
173             index++;
174         }
175     }
176     curpos = url_ftell(pb);
177     url_fseek(pb, entryPos, SEEK_SET);
178     put_be32(pb, index); // rewrite size
179     url_fseek(pb, curpos, SEEK_SET);
180
181     return updateSize (pb, pos);
182 }
183
184 /* Sync sample atom */
185 static int mov_write_stss_tag(ByteIOContext *pb, MOVTrack* track)
186 {
187     offset_t curpos, entryPos;
188     int i, index = 0;
189     offset_t pos = url_ftell(pb);
190     put_be32(pb, 0); // size
191     put_tag(pb, "stss");
192     put_be32(pb, 0); // version & flags
193     entryPos = url_ftell(pb);
194     put_be32(pb, track->entry); // entry count
195     for (i=0; i<track->entry; i++) {
196         if(track->cluster[i].key_frame == 1) {
197             put_be32(pb, i+1);
198             index++;
199         }
200     }
201     curpos = url_ftell(pb);
202     url_fseek(pb, entryPos, SEEK_SET);
203     put_be32(pb, index); // rewrite size
204     url_fseek(pb, curpos, SEEK_SET);
205     return updateSize (pb, pos);
206 }
207
208 static int mov_write_amr_tag(ByteIOContext *pb, MOVTrack *track)
209 {
210     put_be32(pb, 0x11); /* size */
211     if (track->mode == MODE_MOV) put_tag(pb, "samr");
212     else                         put_tag(pb, "damr");
213     put_tag(pb, "FFMP");
214     put_byte(pb, 0); /* decoder version */
215
216     put_be16(pb, 0x81FF); /* Mode set (all modes for AMR_NB) */
217     put_byte(pb, 0x00); /* Mode change period (no restriction) */
218     put_byte(pb, 0x01); /* Frames per sample */
219     return 0x11;
220 }
221
222 /**
223  * This function writes extradata "as is".
224  * Extradata must be formated like a valid atom (with size and tag)
225  */
226 static int mov_write_extradata_tag(ByteIOContext *pb, MOVTrack *track)
227 {
228     put_buffer(pb, track->enc->extradata, track->enc->extradata_size);
229     return track->enc->extradata_size;
230 }
231
232 static int mov_write_enda_tag(ByteIOContext *pb)
233 {
234     put_be32(pb, 10);
235     put_tag(pb, "enda");
236     put_be16(pb, 1); /* little endian */
237     return 10;
238 }
239
240 static unsigned int descrLength(unsigned int len)
241 {
242     int i;
243     for(i=1; len>>(7*i); i++);
244     return len + 1 + i;
245 }
246
247 static void putDescr(ByteIOContext *pb, int tag, unsigned int size)
248 {
249     int i= descrLength(size) - size - 2;
250     put_byte(pb, tag);
251     for(; i>0; i--)
252         put_byte(pb, (size>>(7*i)) | 0x80);
253     put_byte(pb, size & 0x7F);
254 }
255
256 static int mov_write_esds_tag(ByteIOContext *pb, MOVTrack* track) // Basic
257 {
258     offset_t pos = url_ftell(pb);
259     int decoderSpecificInfoLen = track->vosLen ? descrLength(track->vosLen):0;
260
261     put_be32(pb, 0);               // size
262     put_tag(pb, "esds");
263     put_be32(pb, 0);               // Version
264
265     // ES descriptor
266     putDescr(pb, 0x03, 3 + descrLength(13 + decoderSpecificInfoLen) +
267              descrLength(1));
268     put_be16(pb, track->trackID);
269     put_byte(pb, 0x00);            // flags (= no flags)
270
271     // DecoderConfig descriptor
272     putDescr(pb, 0x04, 13 + decoderSpecificInfoLen);
273
274     // Object type indication
275     put_byte(pb, codec_get_tag(ff_mp4_obj_type, track->enc->codec_id));
276
277     // the following fields is made of 6 bits to identify the streamtype (4 for video, 5 for audio)
278     // plus 1 bit to indicate upstream and 1 bit set to 1 (reserved)
279     if(track->enc->codec_type == CODEC_TYPE_AUDIO)
280         put_byte(pb, 0x15);            // flags (= Audiostream)
281     else
282         put_byte(pb, 0x11);            // flags (= Visualstream)
283
284     put_byte(pb,  track->enc->rc_buffer_size>>(3+16));             // Buffersize DB (24 bits)
285     put_be16(pb, (track->enc->rc_buffer_size>>3)&0xFFFF);          // Buffersize DB
286
287     put_be32(pb, FFMAX(track->enc->bit_rate, track->enc->rc_max_rate));     // maxbitrate  (FIXME should be max rate in any 1 sec window)
288     if(track->enc->rc_max_rate != track->enc->rc_min_rate || track->enc->rc_min_rate==0)
289         put_be32(pb, 0);     // vbr
290     else
291         put_be32(pb, track->enc->rc_max_rate);     // avg bitrate
292
293     if (track->vosLen)
294     {
295         // DecoderSpecific info descriptor
296         putDescr(pb, 0x05, track->vosLen);
297         put_buffer(pb, track->vosData, track->vosLen);
298     }
299
300
301     // SL descriptor
302     putDescr(pb, 0x06, 1);
303     put_byte(pb, 0x02);
304     return updateSize (pb, pos);
305 }
306
307 static int mov_write_wave_tag(ByteIOContext *pb, MOVTrack* track)
308 {
309     offset_t pos = url_ftell(pb);
310
311     put_be32(pb, 0);     /* size */
312     put_tag(pb, "wave");
313
314     put_be32(pb, 12);    /* size */
315     put_tag(pb, "frma");
316     put_le32(pb, track->tag);
317
318     if (track->enc->codec_id == CODEC_ID_AAC) {
319         /* useless atom needed by mplayer, ipod, not needed by quicktime */
320         put_be32(pb, 12); /* size */
321         put_tag(pb, "mp4a");
322         put_be32(pb, 0);
323         mov_write_esds_tag(pb, track);
324     } else if (track->enc->codec_id == CODEC_ID_PCM_S24LE ||
325                track->enc->codec_id == CODEC_ID_PCM_S32LE) {
326         mov_write_enda_tag(pb);
327     } else if (track->enc->codec_id == CODEC_ID_AMR_NB) {
328         mov_write_amr_tag(pb, track);
329     } else if (track->enc->codec_id == CODEC_ID_ALAC) {
330         mov_write_extradata_tag(pb, track);
331     }
332
333     put_be32(pb, 8);     /* size */
334     put_be32(pb, 0);     /* null tag */
335
336     return updateSize (pb, pos);
337 }
338
339 static int mov_write_glbl_tag(ByteIOContext *pb, MOVTrack* track)
340 {
341     put_be32(pb, track->vosLen+8);
342     put_tag(pb, "glbl");
343     put_buffer(pb, track->vosData, track->vosLen);
344     return 8+track->vosLen;
345 }
346
347 static int mov_write_audio_tag(ByteIOContext *pb, MOVTrack* track)
348 {
349     offset_t pos = url_ftell(pb);
350     int version = track->mode == MODE_MOV &&
351         (track->audio_vbr ||
352          track->enc->codec_id == CODEC_ID_PCM_S32LE ||
353          track->enc->codec_id == CODEC_ID_PCM_S24LE);
354
355     put_be32(pb, 0); /* size */
356     put_le32(pb, track->tag); // store it byteswapped
357     put_be32(pb, 0); /* Reserved */
358     put_be16(pb, 0); /* Reserved */
359     put_be16(pb, 1); /* Data-reference index, XXX  == 1 */
360
361     /* SoundDescription */
362     put_be16(pb, version); /* Version */
363     put_be16(pb, 0); /* Revision level */
364     put_be32(pb, 0); /* Reserved */
365
366     if (track->mode == MODE_MOV) {
367         put_be16(pb, track->enc->channels);
368         if (track->enc->codec_id == CODEC_ID_PCM_U8 ||
369             track->enc->codec_id == CODEC_ID_PCM_S8)
370             put_be16(pb, 8); /* bits per sample */
371         else
372             put_be16(pb, 16);
373         put_be16(pb, track->audio_vbr ? -2 : 0); /* compression ID */
374     } else { /* reserved for mp4/3gp */
375         put_be16(pb, 2);
376         put_be16(pb, 16);
377         put_be16(pb, 0);
378     }
379
380     put_be16(pb, 0); /* packet size (= 0) */
381     put_be16(pb, track->timescale); /* Time scale */
382     put_be16(pb, 0); /* Reserved */
383
384     if(version == 1) { /* SoundDescription V1 extended info */
385         put_be32(pb, track->enc->frame_size); /* Samples per packet */
386         put_be32(pb, track->sampleSize / track->enc->channels); /* Bytes per packet */
387         put_be32(pb, track->sampleSize); /* Bytes per frame */
388         put_be32(pb, 2); /* Bytes per sample */
389     }
390
391     if(track->mode == MODE_MOV &&
392        (track->enc->codec_id == CODEC_ID_AAC ||
393         track->enc->codec_id == CODEC_ID_AMR_NB ||
394         track->enc->codec_id == CODEC_ID_PCM_S24LE ||
395         track->enc->codec_id == CODEC_ID_PCM_S32LE ||
396         track->enc->codec_id == CODEC_ID_ALAC))
397         mov_write_wave_tag(pb, track);
398     else if(track->tag == MKTAG('m','p','4','a'))
399         mov_write_esds_tag(pb, track);
400     else if(track->enc->codec_id == CODEC_ID_AMR_NB)
401         mov_write_amr_tag(pb, track);
402     else if(track->vosLen > 0)
403         mov_write_glbl_tag(pb, track);
404
405     return updateSize (pb, pos);
406 }
407
408 static int mov_write_d263_tag(ByteIOContext *pb)
409 {
410     put_be32(pb, 0xf); /* size */
411     put_tag(pb, "d263");
412     put_tag(pb, "FFMP");
413     put_byte(pb, 0); /* decoder version */
414     /* FIXME use AVCodecContext level/profile, when encoder will set values */
415     put_byte(pb, 0xa); /* level */
416     put_byte(pb, 0); /* profile */
417     return 0xf;
418 }
419
420 /* TODO: No idea about these values */
421 static int mov_write_svq3_tag(ByteIOContext *pb)
422 {
423     put_be32(pb, 0x15);
424     put_tag(pb, "SMI ");
425     put_tag(pb, "SEQH");
426     put_be32(pb, 0x5);
427     put_be32(pb, 0xe2c0211d);
428     put_be32(pb, 0xc0000000);
429     put_byte(pb, 0);
430     return 0x15;
431 }
432
433 static int mov_write_avcc_tag(ByteIOContext *pb, MOVTrack *track)
434 {
435     offset_t pos = url_ftell(pb);
436
437     put_be32(pb, 0);
438     put_tag(pb, "avcC");
439     ff_isom_write_avcc(pb, track->vosData, track->vosLen);
440     return updateSize(pb, pos);
441 }
442
443 /* also used by all avid codecs (dv, imx, meridien) and their variants */
444 static int mov_write_avid_tag(ByteIOContext *pb, MOVTrack *track)
445 {
446     int i;
447     put_be32(pb, 24); /* size */
448     put_tag(pb, "ACLR");
449     put_tag(pb, "ACLR");
450     put_tag(pb, "0001");
451     put_be32(pb, 1); /* yuv 1 / rgb 2 ? */
452     put_be32(pb, 0); /* unknown */
453
454     put_be32(pb, 24); /* size */
455     put_tag(pb, "APRG");
456     put_tag(pb, "APRG");
457     put_tag(pb, "0001");
458     put_be32(pb, 1); /* unknown */
459     put_be32(pb, 0); /* unknown */
460
461     put_be32(pb, 120); /* size */
462     put_tag(pb, "ARES");
463     put_tag(pb, "ARES");
464     put_tag(pb, "0001");
465     put_be32(pb, AV_RB32(track->vosData + 0x28)); /* dnxhd cid, some id ? */
466     put_be32(pb, track->enc->width);
467     /* values below are based on samples created with quicktime and avid codecs */
468     if (track->vosData[5] & 2) { // interlaced
469         put_be32(pb, track->enc->height/2);
470         put_be32(pb, 2); /* unknown */
471         put_be32(pb, 0); /* unknown */
472         put_be32(pb, 4); /* unknown */
473     } else {
474         put_be32(pb, track->enc->height);
475         put_be32(pb, 1); /* unknown */
476         put_be32(pb, 0); /* unknown */
477         if (track->enc->height == 1080)
478             put_be32(pb, 5); /* unknown */
479         else
480             put_be32(pb, 6); /* unknown */
481     }
482     /* padding */
483     for (i = 0; i < 10; i++)
484         put_be64(pb, 0);
485
486     /* extra padding for stsd needed */
487     put_be32(pb, 0);
488     return 0;
489 }
490
491 static const AVCodecTag codec_3gp_tags[] = {
492     { CODEC_ID_H263,   MKTAG('s','2','6','3') },
493     { CODEC_ID_H264,   MKTAG('a','v','c','1') },
494     { CODEC_ID_MPEG4,  MKTAG('m','p','4','v') },
495     { CODEC_ID_AAC,    MKTAG('m','p','4','a') },
496     { CODEC_ID_AMR_NB, MKTAG('s','a','m','r') },
497     { CODEC_ID_AMR_WB, MKTAG('s','a','w','b') },
498 };
499
500 static const AVCodecTag mov_pix_fmt_tags[] = {
501     { PIX_FMT_YUYV422, MKTAG('y','u','v','s') },
502     { PIX_FMT_UYVY422, MKTAG('2','v','u','y') },
503     { PIX_FMT_BGR555,  MKTAG('r','a','w',' ') },
504     { PIX_FMT_RGB24,   MKTAG('r','a','w',' ') },
505     { PIX_FMT_BGR32_1, MKTAG('r','a','w',' ') },
506 };
507
508 static int mov_find_codec_tag(AVFormatContext *s, MOVTrack *track)
509 {
510     int tag = track->enc->codec_tag;
511     if (track->mode == MODE_MP4 || track->mode == MODE_PSP || track->mode == MODE_IPOD) {
512         if (!codec_get_tag(ff_mp4_obj_type, track->enc->codec_id))
513             return 0;
514         if (track->enc->codec_id == CODEC_ID_H264)           tag = MKTAG('a','v','c','1');
515         else if (track->enc->codec_type == CODEC_TYPE_VIDEO) tag = MKTAG('m','p','4','v');
516         else if (track->enc->codec_type == CODEC_TYPE_AUDIO) tag = MKTAG('m','p','4','a');
517     } else if (track->mode == MODE_3GP || track->mode == MODE_3G2) {
518         tag = codec_get_tag(codec_3gp_tags, track->enc->codec_id);
519     } else if (!tag || (track->enc->strict_std_compliance >= FF_COMPLIANCE_NORMAL &&
520                         (tag == MKTAG('d','v','c','p') ||
521                          track->enc->codec_id == CODEC_ID_RAWVIDEO))) {
522         if (track->enc->codec_id == CODEC_ID_DVVIDEO) {
523             if (track->enc->height == 480) /* NTSC */
524                 if  (track->enc->pix_fmt == PIX_FMT_YUV422P) tag = MKTAG('d','v','5','n');
525                 else                                         tag = MKTAG('d','v','c',' ');
526             else if (track->enc->pix_fmt == PIX_FMT_YUV422P) tag = MKTAG('d','v','5','p');
527             else if (track->enc->pix_fmt == PIX_FMT_YUV420P) tag = MKTAG('d','v','c','p');
528             else                                             tag = MKTAG('d','v','p','p');
529         } else if (track->enc->codec_id == CODEC_ID_RAWVIDEO) {
530             tag = codec_get_tag(mov_pix_fmt_tags, track->enc->pix_fmt);
531             if (!tag) // restore tag
532                 tag = track->enc->codec_tag;
533         } else {
534             if (track->enc->codec_type == CODEC_TYPE_VIDEO) {
535                 tag = codec_get_tag(codec_movvideo_tags, track->enc->codec_id);
536                 if (!tag) { // if no mac fcc found, try with Microsoft tags
537                     tag = codec_get_tag(codec_bmp_tags, track->enc->codec_id);
538                     if (tag)
539                         av_log(s, AV_LOG_INFO, "Warning, using MS style video codec tag, "
540                                "the file may be unplayable!\n");
541                 }
542             } else if (track->enc->codec_type == CODEC_TYPE_AUDIO) {
543                 tag = codec_get_tag(codec_movaudio_tags, track->enc->codec_id);
544                 if (!tag) { // if no mac fcc found, try with Microsoft tags
545                     int ms_tag = codec_get_tag(codec_wav_tags, track->enc->codec_id);
546                     if (ms_tag) {
547                         tag = MKTAG('m', 's', ((ms_tag >> 8) & 0xff), (ms_tag & 0xff));
548                         av_log(s, AV_LOG_INFO, "Warning, using MS style audio codec tag, "
549                                "the file may be unplayable!\n");
550                     }
551                 }
552             }
553         }
554     }
555     return tag;
556 }
557
558 /** Write uuid atom.
559  * Needed to make file play in iPods running newest firmware
560  * goes after avcC atom in moov.trak.mdia.minf.stbl.stsd.avc1
561  */
562 static int mov_write_uuid_tag_ipod(ByteIOContext *pb)
563 {
564     put_be32(pb, 28);
565     put_tag(pb, "uuid");
566     put_be32(pb, 0x6b6840f2);
567     put_be32(pb, 0x5f244fc5);
568     put_be32(pb, 0xba39a51b);
569     put_be32(pb, 0xcf0323f3);
570     put_be32(pb, 0x0);
571     return 28;
572 }
573
574 static int mov_write_video_tag(ByteIOContext *pb, MOVTrack* track)
575 {
576     offset_t pos = url_ftell(pb);
577     char compressor_name[32];
578
579     put_be32(pb, 0); /* size */
580     put_le32(pb, track->tag); // store it byteswapped
581     put_be32(pb, 0); /* Reserved */
582     put_be16(pb, 0); /* Reserved */
583     put_be16(pb, 1); /* Data-reference index */
584
585     put_be16(pb, 0); /* Codec stream version */
586     put_be16(pb, 0); /* Codec stream revision (=0) */
587     if (track->mode == MODE_MOV) {
588         put_tag(pb, "FFMP"); /* Vendor */
589         if(track->enc->codec_id == CODEC_ID_RAWVIDEO) {
590             put_be32(pb, 0); /* Temporal Quality */
591             put_be32(pb, 0x400); /* Spatial Quality = lossless*/
592         } else {
593             put_be32(pb, 0x200); /* Temporal Quality = normal */
594             put_be32(pb, 0x200); /* Spatial Quality = normal */
595         }
596     } else {
597         put_be32(pb, 0); /* Reserved */
598         put_be32(pb, 0); /* Reserved */
599         put_be32(pb, 0); /* Reserved */
600     }
601     put_be16(pb, track->enc->width); /* Video width */
602     put_be16(pb, track->enc->height); /* Video height */
603     put_be32(pb, 0x00480000); /* Horizontal resolution 72dpi */
604     put_be32(pb, 0x00480000); /* Vertical resolution 72dpi */
605     put_be32(pb, 0); /* Data size (= 0) */
606     put_be16(pb, 1); /* Frame count (= 1) */
607
608     memset(compressor_name,0,32);
609     /* FIXME not sure, ISO 14496-1 draft where it shall be set to 0 */
610     if (track->mode == MODE_MOV && track->enc->codec && track->enc->codec->name)
611         strncpy(compressor_name,track->enc->codec->name,31);
612     put_byte(pb, strlen(compressor_name));
613     put_buffer(pb, compressor_name, 31);
614
615     if (track->mode == MODE_MOV && track->enc->bits_per_sample)
616         put_be16(pb, track->enc->bits_per_sample);
617     else
618         put_be16(pb, 0x18); /* Reserved */
619     put_be16(pb, 0xffff); /* Reserved */
620     if(track->tag == MKTAG('m','p','4','v'))
621         mov_write_esds_tag(pb, track);
622     else if(track->enc->codec_id == CODEC_ID_H263)
623         mov_write_d263_tag(pb);
624     else if(track->enc->codec_id == CODEC_ID_SVQ3)
625         mov_write_svq3_tag(pb);
626     else if(track->enc->codec_id == CODEC_ID_DNXHD)
627         mov_write_avid_tag(pb, track);
628     else if(track->enc->codec_id == CODEC_ID_H264) {
629         mov_write_avcc_tag(pb, track);
630         if(track->mode == MODE_IPOD)
631             mov_write_uuid_tag_ipod(pb);
632     } else if(track->vosLen > 0)
633         mov_write_glbl_tag(pb, track);
634
635     return updateSize (pb, pos);
636 }
637
638 static int mov_write_stsd_tag(ByteIOContext *pb, MOVTrack* track)
639 {
640     offset_t pos = url_ftell(pb);
641     put_be32(pb, 0); /* size */
642     put_tag(pb, "stsd");
643     put_be32(pb, 0); /* version & flags */
644     put_be32(pb, 1); /* entry count */
645     if (track->enc->codec_type == CODEC_TYPE_VIDEO)
646         mov_write_video_tag(pb, track);
647     else if (track->enc->codec_type == CODEC_TYPE_AUDIO)
648         mov_write_audio_tag(pb, track);
649     return updateSize(pb, pos);
650 }
651
652 static int mov_write_ctts_tag(ByteIOContext *pb, MOVTrack* track)
653 {
654     MOV_stts_t *ctts_entries;
655     uint32_t entries = 0;
656     uint32_t atom_size;
657     int i;
658
659     ctts_entries = av_malloc((track->entry + 1) * sizeof(*ctts_entries)); /* worst case */
660     ctts_entries[0].count = 1;
661     ctts_entries[0].duration = track->cluster[0].cts;
662     for (i=1; i<track->entry; i++) {
663         if (track->cluster[i].cts == ctts_entries[entries].duration) {
664             ctts_entries[entries].count++; /* compress */
665         } else {
666             entries++;
667             ctts_entries[entries].duration = track->cluster[i].cts;
668             ctts_entries[entries].count = 1;
669         }
670     }
671     entries++; /* last one */
672     atom_size = 16 + (entries * 8);
673     put_be32(pb, atom_size); /* size */
674     put_tag(pb, "ctts");
675     put_be32(pb, 0); /* version & flags */
676     put_be32(pb, entries); /* entry count */
677     for (i=0; i<entries; i++) {
678         put_be32(pb, ctts_entries[i].count);
679         put_be32(pb, ctts_entries[i].duration);
680     }
681     av_free(ctts_entries);
682     return atom_size;
683 }
684
685 /* Time to sample atom */
686 static int mov_write_stts_tag(ByteIOContext *pb, MOVTrack* track)
687 {
688     MOV_stts_t *stts_entries;
689     uint32_t entries = -1;
690     uint32_t atom_size;
691     int i;
692
693     if (track->enc->codec_type == CODEC_TYPE_AUDIO && !track->audio_vbr) {
694         stts_entries = av_malloc(sizeof(*stts_entries)); /* one entry */
695         stts_entries[0].count = track->sampleCount;
696         stts_entries[0].duration = 1;
697         entries = 1;
698     } else {
699         stts_entries = av_malloc(track->entry * sizeof(*stts_entries)); /* worst case */
700         for (i=0; i<track->entry; i++) {
701             int64_t duration = i + 1 == track->entry ?
702                 track->trackDuration - track->cluster[i].dts + track->cluster[0].dts : /* readjusting */
703                 track->cluster[i+1].dts - track->cluster[i].dts;
704             if (i && duration == stts_entries[entries].duration) {
705                 stts_entries[entries].count++; /* compress */
706             } else {
707                 entries++;
708                 stts_entries[entries].duration = duration;
709                 stts_entries[entries].count = 1;
710             }
711         }
712         entries++; /* last one */
713     }
714     atom_size = 16 + (entries * 8);
715     put_be32(pb, atom_size); /* size */
716     put_tag(pb, "stts");
717     put_be32(pb, 0); /* version & flags */
718     put_be32(pb, entries); /* entry count */
719     for (i=0; i<entries; i++) {
720         put_be32(pb, stts_entries[i].count);
721         put_be32(pb, stts_entries[i].duration);
722     }
723     av_free(stts_entries);
724     return atom_size;
725 }
726
727 static int mov_write_dref_tag(ByteIOContext *pb)
728 {
729     put_be32(pb, 28); /* size */
730     put_tag(pb, "dref");
731     put_be32(pb, 0); /* version & flags */
732     put_be32(pb, 1); /* entry count */
733
734     put_be32(pb, 0xc); /* size */
735     put_tag(pb, "url ");
736     put_be32(pb, 1); /* version & flags */
737
738     return 28;
739 }
740
741 static int mov_write_stbl_tag(ByteIOContext *pb, MOVTrack* track)
742 {
743     offset_t pos = url_ftell(pb);
744     put_be32(pb, 0); /* size */
745     put_tag(pb, "stbl");
746     mov_write_stsd_tag(pb, track);
747     mov_write_stts_tag(pb, track);
748     if (track->enc->codec_type == CODEC_TYPE_VIDEO &&
749         track->hasKeyframes && track->hasKeyframes < track->entry)
750         mov_write_stss_tag(pb, track);
751     if (track->enc->codec_type == CODEC_TYPE_VIDEO &&
752         track->hasBframes)
753         mov_write_ctts_tag(pb, track);
754     mov_write_stsc_tag(pb, track);
755     mov_write_stsz_tag(pb, track);
756     mov_write_stco_tag(pb, track);
757     return updateSize(pb, pos);
758 }
759
760 static int mov_write_dinf_tag(ByteIOContext *pb)
761 {
762     offset_t pos = url_ftell(pb);
763     put_be32(pb, 0); /* size */
764     put_tag(pb, "dinf");
765     mov_write_dref_tag(pb);
766     return updateSize(pb, pos);
767 }
768
769 static int mov_write_smhd_tag(ByteIOContext *pb)
770 {
771     put_be32(pb, 16); /* size */
772     put_tag(pb, "smhd");
773     put_be32(pb, 0); /* version & flags */
774     put_be16(pb, 0); /* reserved (balance, normally = 0) */
775     put_be16(pb, 0); /* reserved */
776     return 16;
777 }
778
779 static int mov_write_vmhd_tag(ByteIOContext *pb)
780 {
781     put_be32(pb, 0x14); /* size (always 0x14) */
782     put_tag(pb, "vmhd");
783     put_be32(pb, 0x01); /* version & flags */
784     put_be64(pb, 0); /* reserved (graphics mode = copy) */
785     return 0x14;
786 }
787
788 static int mov_write_hdlr_tag(ByteIOContext *pb, MOVTrack* track)
789 {
790     const char *descr, *hdlr, *hdlr_type;
791     offset_t pos = url_ftell(pb);
792
793     if (!track) { /* no media --> data handler */
794         hdlr = "dhlr";
795         hdlr_type = "url ";
796         descr = "DataHandler";
797     } else {
798         hdlr = (track->mode == MODE_MOV) ? "mhlr" : "\0\0\0\0";
799         if (track->enc->codec_type == CODEC_TYPE_VIDEO) {
800             hdlr_type = "vide";
801             descr = "VideoHandler";
802         } else {
803             hdlr_type = "soun";
804             descr = "SoundHandler";
805         }
806     }
807
808     put_be32(pb, 0); /* size */
809     put_tag(pb, "hdlr");
810     put_be32(pb, 0); /* Version & flags */
811     put_buffer(pb, hdlr, 4); /* handler */
812     put_tag(pb, hdlr_type); /* handler type */
813     put_be32(pb ,0); /* reserved */
814     put_be32(pb ,0); /* reserved */
815     put_be32(pb ,0); /* reserved */
816     put_byte(pb, strlen(descr)); /* string counter */
817     put_buffer(pb, descr, strlen(descr)); /* handler description */
818     return updateSize(pb, pos);
819 }
820
821 static int mov_write_minf_tag(ByteIOContext *pb, MOVTrack* track)
822 {
823     offset_t pos = url_ftell(pb);
824     put_be32(pb, 0); /* size */
825     put_tag(pb, "minf");
826     if(track->enc->codec_type == CODEC_TYPE_VIDEO)
827         mov_write_vmhd_tag(pb);
828     else
829         mov_write_smhd_tag(pb);
830     if (track->mode == MODE_MOV) /* FIXME: Why do it for MODE_MOV only ? */
831         mov_write_hdlr_tag(pb, NULL);
832     mov_write_dinf_tag(pb);
833     mov_write_stbl_tag(pb, track);
834     return updateSize(pb, pos);
835 }
836
837 static int mov_write_mdhd_tag(ByteIOContext *pb, MOVTrack* track)
838 {
839     int version = track->trackDuration < INT32_MAX ? 0 : 1;
840
841     (version == 1) ? put_be32(pb, 44) : put_be32(pb, 32); /* size */
842     put_tag(pb, "mdhd");
843     put_byte(pb, version);
844     put_be24(pb, 0); /* flags */
845     if (version == 1) {
846         put_be64(pb, track->time);
847         put_be64(pb, track->time);
848     } else {
849         put_be32(pb, track->time); /* creation time */
850         put_be32(pb, track->time); /* modification time */
851     }
852     put_be32(pb, track->timescale); /* time scale (sample rate for audio) */
853     (version == 1) ? put_be64(pb, track->trackDuration) : put_be32(pb, track->trackDuration); /* duration */
854     put_be16(pb, track->language); /* language */
855     put_be16(pb, 0); /* reserved (quality) */
856
857     if(version!=0 && track->mode == MODE_MOV){
858         av_log(NULL, AV_LOG_ERROR,
859             "FATAL error, file duration too long for timebase, this file will not be\n"
860             "playable with quicktime. Choose a different timebase or a different\n"
861             "container format\n");
862     }
863
864     return 32;
865 }
866
867 static int mov_write_mdia_tag(ByteIOContext *pb, MOVTrack* track)
868 {
869     offset_t pos = url_ftell(pb);
870     put_be32(pb, 0); /* size */
871     put_tag(pb, "mdia");
872     mov_write_mdhd_tag(pb, track);
873     mov_write_hdlr_tag(pb, track);
874     mov_write_minf_tag(pb, track);
875     return updateSize(pb, pos);
876 }
877
878 static int mov_write_tkhd_tag(ByteIOContext *pb, MOVTrack* track)
879 {
880     int64_t duration = av_rescale_rnd(track->trackDuration, globalTimescale, track->timescale, AV_ROUND_UP);
881     int version = duration < INT32_MAX ? 0 : 1;
882
883     (version == 1) ? put_be32(pb, 104) : put_be32(pb, 92); /* size */
884     put_tag(pb, "tkhd");
885     put_byte(pb, version);
886     put_be24(pb, 0xf); /* flags (track enabled) */
887     if (version == 1) {
888         put_be64(pb, track->time);
889         put_be64(pb, track->time);
890     } else {
891         put_be32(pb, track->time); /* creation time */
892         put_be32(pb, track->time); /* modification time */
893     }
894     put_be32(pb, track->trackID); /* track-id */
895     put_be32(pb, 0); /* reserved */
896     (version == 1) ? put_be64(pb, duration) : put_be32(pb, duration);
897
898     put_be32(pb, 0); /* reserved */
899     put_be32(pb, 0); /* reserved */
900     put_be32(pb, 0x0); /* reserved (Layer & Alternate group) */
901     /* Volume, only for audio */
902     if(track->enc->codec_type == CODEC_TYPE_AUDIO)
903         put_be16(pb, 0x0100);
904     else
905         put_be16(pb, 0);
906     put_be16(pb, 0); /* reserved */
907
908     /* Matrix structure */
909     put_be32(pb, 0x00010000); /* reserved */
910     put_be32(pb, 0x0); /* reserved */
911     put_be32(pb, 0x0); /* reserved */
912     put_be32(pb, 0x0); /* reserved */
913     put_be32(pb, 0x00010000); /* reserved */
914     put_be32(pb, 0x0); /* reserved */
915     put_be32(pb, 0x0); /* reserved */
916     put_be32(pb, 0x0); /* reserved */
917     put_be32(pb, 0x40000000); /* reserved */
918
919     /* Track width and height, for visual only */
920     if(track->enc->codec_type == CODEC_TYPE_VIDEO) {
921         double sample_aspect_ratio = av_q2d(track->enc->sample_aspect_ratio);
922         if(!sample_aspect_ratio) sample_aspect_ratio = 1;
923         put_be32(pb, sample_aspect_ratio * track->enc->width*0x10000);
924         put_be32(pb, track->enc->height*0x10000);
925     }
926     else {
927         put_be32(pb, 0);
928         put_be32(pb, 0);
929     }
930     return 0x5c;
931 }
932
933 // This box seems important for the psp playback ... without it the movie seems to hang
934 static int mov_write_edts_tag(ByteIOContext *pb, MOVTrack *track)
935 {
936     put_be32(pb, 0x24); /* size  */
937     put_tag(pb, "edts");
938     put_be32(pb, 0x1c); /* size  */
939     put_tag(pb, "elst");
940     put_be32(pb, 0x0);
941     put_be32(pb, 0x1);
942
943     put_be32(pb, av_rescale_rnd(track->trackDuration, globalTimescale, track->timescale, AV_ROUND_UP)); /* duration   ... doesn't seem to effect psp */
944
945     put_be32(pb, track->cluster[0].cts); /* first pts is cts since dts is 0 */
946     put_be32(pb, 0x00010000);
947     return 0x24;
948 }
949
950 // goes at the end of each track!  ... Critical for PSP playback ("Incompatible data" without it)
951 static int mov_write_uuid_tag_psp(ByteIOContext *pb, MOVTrack *mov)
952 {
953     put_be32(pb, 0x34); /* size ... reports as 28 in mp4box! */
954     put_tag(pb, "uuid");
955     put_tag(pb, "USMT");
956     put_be32(pb, 0x21d24fce);
957     put_be32(pb, 0xbb88695c);
958     put_be32(pb, 0xfac9c740);
959     put_be32(pb, 0x1c);     // another size here!
960     put_tag(pb, "MTDT");
961     put_be32(pb, 0x00010012);
962     put_be32(pb, 0x0a);
963     put_be32(pb, 0x55c40000);
964     put_be32(pb, 0x1);
965     put_be32(pb, 0x0);
966     return 0x34;
967 }
968
969 static int mov_write_trak_tag(ByteIOContext *pb, MOVTrack* track)
970 {
971     offset_t pos = url_ftell(pb);
972     put_be32(pb, 0); /* size */
973     put_tag(pb, "trak");
974     mov_write_tkhd_tag(pb, track);
975     if (track->mode == MODE_PSP || track->hasBframes)
976         mov_write_edts_tag(pb, track);  // PSP Movies require edts box
977     mov_write_mdia_tag(pb, track);
978     if (track->mode == MODE_PSP)
979         mov_write_uuid_tag_psp(pb,track);  // PSP Movies require this uuid box
980     return updateSize(pb, pos);
981 }
982
983 #if 0
984 /* TODO: Not sorted out, but not necessary either */
985 static int mov_write_iods_tag(ByteIOContext *pb, MOVContext *mov)
986 {
987     put_be32(pb, 0x15); /* size */
988     put_tag(pb, "iods");
989     put_be32(pb, 0);    /* version & flags */
990     put_be16(pb, 0x1007);
991     put_byte(pb, 0);
992     put_be16(pb, 0x4fff);
993     put_be16(pb, 0xfffe);
994     put_be16(pb, 0x01ff);
995     return 0x15;
996 }
997 #endif
998
999 static int mov_write_mvhd_tag(ByteIOContext *pb, MOVContext *mov)
1000 {
1001     int maxTrackID = 1, i;
1002     int64_t maxTrackLenTemp, maxTrackLen = 0;
1003     int version;
1004
1005     for (i=0; i<mov->nb_streams; i++) {
1006         if(mov->tracks[i].entry > 0) {
1007             maxTrackLenTemp = av_rescale_rnd(mov->tracks[i].trackDuration, globalTimescale, mov->tracks[i].timescale, AV_ROUND_UP);
1008             if(maxTrackLen < maxTrackLenTemp)
1009                 maxTrackLen = maxTrackLenTemp;
1010             if(maxTrackID < mov->tracks[i].trackID)
1011                 maxTrackID = mov->tracks[i].trackID;
1012         }
1013     }
1014
1015     version = maxTrackLen < UINT32_MAX ? 0 : 1;
1016     (version == 1) ? put_be32(pb, 120) : put_be32(pb, 108); /* size */
1017     put_tag(pb, "mvhd");
1018     put_byte(pb, version);
1019     put_be24(pb, 0); /* flags */
1020     if (version == 1) {
1021         put_be64(pb, mov->time);
1022         put_be64(pb, mov->time);
1023     } else {
1024         put_be32(pb, mov->time); /* creation time */
1025         put_be32(pb, mov->time); /* modification time */
1026     }
1027     put_be32(pb, mov->timescale); /* timescale */
1028     (version == 1) ? put_be64(pb, maxTrackLen) : put_be32(pb, maxTrackLen); /* duration of longest track */
1029
1030     put_be32(pb, 0x00010000); /* reserved (preferred rate) 1.0 = normal */
1031     put_be16(pb, 0x0100); /* reserved (preferred volume) 1.0 = normal */
1032     put_be16(pb, 0); /* reserved */
1033     put_be32(pb, 0); /* reserved */
1034     put_be32(pb, 0); /* reserved */
1035
1036     /* Matrix structure */
1037     put_be32(pb, 0x00010000); /* reserved */
1038     put_be32(pb, 0x0); /* reserved */
1039     put_be32(pb, 0x0); /* reserved */
1040     put_be32(pb, 0x0); /* reserved */
1041     put_be32(pb, 0x00010000); /* reserved */
1042     put_be32(pb, 0x0); /* reserved */
1043     put_be32(pb, 0x0); /* reserved */
1044     put_be32(pb, 0x0); /* reserved */
1045     put_be32(pb, 0x40000000); /* reserved */
1046
1047     put_be32(pb, 0); /* reserved (preview time) */
1048     put_be32(pb, 0); /* reserved (preview duration) */
1049     put_be32(pb, 0); /* reserved (poster time) */
1050     put_be32(pb, 0); /* reserved (selection time) */
1051     put_be32(pb, 0); /* reserved (selection duration) */
1052     put_be32(pb, 0); /* reserved (current time) */
1053     put_be32(pb, maxTrackID+1); /* Next track id */
1054     return 0x6c;
1055 }
1056
1057 static int mov_write_itunes_hdlr_tag(ByteIOContext *pb, MOVContext* mov,
1058                                      AVFormatContext *s)
1059 {
1060     offset_t pos = url_ftell(pb);
1061     put_be32(pb, 0); /* size */
1062     put_tag(pb, "hdlr");
1063     put_be32(pb, 0);
1064     put_be32(pb, 0);
1065     put_tag(pb, "mdir");
1066     put_tag(pb, "appl");
1067     put_be32(pb, 0);
1068     put_be32(pb, 0);
1069     put_be16(pb, 0);
1070     return updateSize(pb, pos);
1071 }
1072
1073 /* helper function to write a data tag with the specified string as data */
1074 static int mov_write_string_data_tag(ByteIOContext *pb, const char *data, int long_style)
1075 {
1076     if(long_style){
1077         offset_t pos = url_ftell(pb);
1078         put_be32(pb, 0); /* size */
1079         put_tag(pb, "data");
1080         put_be32(pb, 1);
1081         put_be32(pb, 0);
1082         put_buffer(pb, data, strlen(data));
1083         return updateSize(pb, pos);
1084     }else{
1085         put_be16(pb, strlen(data)); /* string length */
1086         put_be16(pb, 0);
1087         put_buffer(pb, data, strlen(data));
1088         return strlen(data) + 4;
1089     }
1090 }
1091
1092 static int mov_write_string_tag(ByteIOContext *pb, const char *name, const char *value, int long_style){
1093     int size = 0;
1094     if (value && value[0]) {
1095         offset_t pos = url_ftell(pb);
1096         put_be32(pb, 0); /* size */
1097         put_tag(pb, name);
1098         mov_write_string_data_tag(pb, value, long_style);
1099         size= updateSize(pb, pos);
1100     }
1101     return size;
1102 }
1103
1104 /* iTunes year */
1105 static int mov_write_day_tag(ByteIOContext *pb, int year, int long_style)
1106 {
1107     if(year){
1108         char year_str[5];
1109         snprintf(year_str, sizeof(year_str), "%04d", year);
1110         return mov_write_string_tag(pb, "\251day", year_str, long_style);
1111     }else
1112         return 0;
1113 }
1114
1115 /* iTunes track number */
1116 static int mov_write_trkn_tag(ByteIOContext *pb, MOVContext* mov,
1117                               AVFormatContext *s)
1118 {
1119     int size = 0;
1120     if (s->track) {
1121         offset_t pos = url_ftell(pb);
1122         put_be32(pb, 0); /* size */
1123         put_tag(pb, "trkn");
1124         {
1125             offset_t pos = url_ftell(pb);
1126             put_be32(pb, 0); /* size */
1127             put_tag(pb, "data");
1128             put_be32(pb, 0);        // 8 bytes empty
1129             put_be32(pb, 0);
1130             put_be16(pb, 0);        // empty
1131             put_be16(pb, s->track); // track number
1132             put_be16(pb, 0);        // total track number
1133             put_be16(pb, 0);        // empty
1134             updateSize(pb, pos);
1135         }
1136         size = updateSize(pb, pos);
1137     }
1138     return size;
1139 }
1140
1141 /* iTunes meta data list */
1142 static int mov_write_ilst_tag(ByteIOContext *pb, MOVContext* mov,
1143                               AVFormatContext *s)
1144 {
1145     offset_t pos = url_ftell(pb);
1146     put_be32(pb, 0); /* size */
1147     put_tag(pb, "ilst");
1148     mov_write_string_tag(pb, "\251nam", s->title         , 1);
1149     mov_write_string_tag(pb, "\251ART", s->author        , 1);
1150     mov_write_string_tag(pb, "\251wrt", s->author        , 1);
1151     mov_write_string_tag(pb, "\251alb", s->album         , 1);
1152     mov_write_day_tag(pb, s->year ,1);
1153     if(mov->tracks[0].enc && !(mov->tracks[0].enc->flags & CODEC_FLAG_BITEXACT))
1154         mov_write_string_tag(pb, "\251too", LIBAVFORMAT_IDENT, 1);
1155     mov_write_string_tag(pb, "\251cmt", s->comment       , 1);
1156     mov_write_string_tag(pb, "\251gen", s->genre         , 1);
1157     mov_write_trkn_tag(pb, mov, s);
1158     return updateSize(pb, pos);
1159 }
1160
1161 /* iTunes meta data tag */
1162 static int mov_write_meta_tag(ByteIOContext *pb, MOVContext* mov,
1163                               AVFormatContext *s)
1164 {
1165     int size = 0;
1166
1167     // only save meta tag if required
1168     if (s->title[0] || s->author[0] || s->album[0] || s->year ||
1169          s->comment[0] || s->genre[0] || s->track) {
1170         offset_t pos = url_ftell(pb);
1171         put_be32(pb, 0); /* size */
1172         put_tag(pb, "meta");
1173         put_be32(pb, 0);
1174         mov_write_itunes_hdlr_tag(pb, mov, s);
1175         mov_write_ilst_tag(pb, mov, s);
1176         size = updateSize(pb, pos);
1177     }
1178     return size;
1179 }
1180
1181 static int mov_write_udta_tag(ByteIOContext *pb, MOVContext* mov,
1182                               AVFormatContext *s)
1183 {
1184     int i, req = 0;
1185
1186     /* Requirements */
1187     for (i=0; i<mov->nb_streams; i++) {
1188         if(mov->tracks[i].entry <= 0) continue;
1189         if (mov->tracks[i].enc->codec_id == CODEC_ID_AAC ||
1190             mov->tracks[i].enc->codec_id == CODEC_ID_MPEG4) {
1191             req = 1;
1192             break;
1193         }
1194     }
1195
1196     if (s->title[0]   || s->author[0] || s->album[0] || s->year ||
1197         s->comment[0] || s->genre[0]  || s->track ||
1198        (mov->mode == MODE_MOV &&
1199       ((mov->tracks[0].enc && !mov->tracks[0].enc->flags & CODEC_FLAG_BITEXACT) || req))) {
1200         offset_t pos = url_ftell(pb);
1201
1202         put_be32(pb, 0); /* size */
1203         put_tag(pb, "udta");
1204
1205         /* iTunes meta data */
1206         mov_write_meta_tag(pb, mov, s);
1207
1208         if(mov->mode == MODE_MOV){ // the title field breaks gtkpod with mp4 and my suspicion is that stuff is not valid in mp4
1209             /* Requirements */
1210             if (req)
1211                 mov_write_string_tag(pb, "\251req", "QuickTime 6.0 or greater", 0);
1212
1213             mov_write_string_tag(pb, "\251nam", s->title         , 0);
1214             mov_write_string_tag(pb, "\251aut", s->author        , 0);
1215             mov_write_string_tag(pb, "\251alb", s->album         , 0);
1216             mov_write_day_tag(pb, s->year, 0);
1217             if(mov->tracks[0].enc && !(mov->tracks[0].enc->flags & CODEC_FLAG_BITEXACT))
1218                 mov_write_string_tag(pb, "\251enc", LIBAVFORMAT_IDENT, 0);
1219             mov_write_string_tag(pb, "\251des", s->comment       , 0);
1220             mov_write_string_tag(pb, "\251gen", s->genre         , 0);
1221         }
1222
1223         return updateSize(pb, pos);
1224     }
1225
1226     return 0;
1227 }
1228
1229 static int utf8len(const uint8_t *b){
1230     int len=0;
1231     int val;
1232     while(*b){
1233         GET_UTF8(val, *b++, return -1;)
1234         len++;
1235     }
1236     return len;
1237 }
1238
1239 static int ascii_to_wc (ByteIOContext *pb, const uint8_t *b)
1240 {
1241     int val;
1242     while(*b){
1243         GET_UTF8(val, *b++, return -1;)
1244         put_be16(pb, val);
1245     }
1246     put_be16(pb, 0x00);
1247     return 0;
1248 }
1249
1250 static uint16_t language_code (const char *str)
1251 {
1252     return ((((str[0]-0x60) & 0x1F)<<10) + (((str[1]-0x60) & 0x1F)<<5) + ((str[2]-0x60) & 0x1F));
1253 }
1254
1255 static int mov_write_uuidusmt_tag (ByteIOContext *pb, AVFormatContext *s)
1256 {
1257     size_t len, size;
1258     offset_t pos, curpos;
1259
1260     size = 0;
1261     if (s->title[0]) {
1262         pos = url_ftell(pb);
1263         put_be32(pb, 0); /* size placeholder*/
1264         put_tag(pb, "uuid");
1265         put_tag(pb, "USMT");
1266         put_be32(pb, 0x21d24fce); /* 96 bit UUID */
1267         put_be32(pb, 0xbb88695c);
1268         put_be32(pb, 0xfac9c740);
1269         size += 24;
1270
1271         put_be32(pb, 0); /* size placeholder*/
1272         put_tag(pb, "MTDT");
1273         put_be16(pb, 4);
1274         size += 10;
1275
1276         // ?
1277         put_be16(pb, 0x0C);                 /* size */
1278         put_be32(pb, 0x0B);                 /* type */
1279         put_be16(pb, language_code("und")); /* language */
1280         put_be16(pb, 0x0);                  /* ? */
1281         put_be16(pb, 0x021C);               /* data */
1282         size += 12;
1283
1284         // Encoder
1285         len = utf8len(LIBAVCODEC_IDENT)+1;
1286         if(len<=0)
1287             goto not_utf8;
1288         put_be16(pb, len*2+10);             /* size */
1289         put_be32(pb, 0x04);                 /* type */
1290         put_be16(pb, language_code("eng")); /* language */
1291         put_be16(pb, 0x01);                 /* ? */
1292         ascii_to_wc(pb, LIBAVCODEC_IDENT);
1293         size += len*2+10;
1294
1295         // Title
1296         len = utf8len(s->title)+1;
1297         if(len<=0)
1298             goto not_utf8;
1299         put_be16(pb, len*2+10);             /* size */
1300         put_be32(pb, 0x01);                 /* type */
1301         put_be16(pb, language_code("eng")); /* language */
1302         put_be16(pb, 0x01);                 /* ? */
1303         ascii_to_wc (pb, s->title);
1304         size += len*2+10;
1305
1306         // Date
1307 //        snprintf(dt,32,"%04d/%02d/%02d %02d:%02d:%02d",t_st->tm_year+1900,t_st->tm_mon+1,t_st->tm_mday,t_st->tm_hour,t_st->tm_min,t_st->tm_sec);
1308         len = utf8len("2006/04/01 11:11:11")+1;
1309         if(len<=0)
1310             goto not_utf8;
1311         put_be16(pb, len*2+10);    /* size */
1312         put_be32(pb, 0x03);        /* type */
1313         put_be16(pb, language_code("und")); /* language */
1314         put_be16(pb, 0x01);        /* ? */
1315         ascii_to_wc (pb, "2006/04/01 11:11:11");
1316         size += len*2+10;
1317
1318         // size
1319         curpos = url_ftell(pb);
1320         url_fseek(pb, pos, SEEK_SET);
1321         put_be32(pb, size);
1322         url_fseek(pb, pos+24, SEEK_SET);
1323         put_be32(pb, size-24);
1324         url_fseek(pb, curpos, SEEK_SET);
1325     }
1326
1327     return size;
1328 not_utf8:
1329     av_log(s, AV_LOG_ERROR, "not utf8\n");
1330     return -1;
1331 }
1332
1333 static int mov_write_moov_tag(ByteIOContext *pb, MOVContext *mov,
1334                               AVFormatContext *s)
1335 {
1336     int i;
1337     offset_t pos = url_ftell(pb);
1338     put_be32(pb, 0); /* size placeholder*/
1339     put_tag(pb, "moov");
1340     mov->timescale = globalTimescale;
1341
1342     for (i=0; i<mov->nb_streams; i++) {
1343         if(mov->tracks[i].entry <= 0) continue;
1344
1345         mov->tracks[i].time = mov->time;
1346         mov->tracks[i].trackID = i+1;
1347     }
1348
1349     mov_write_mvhd_tag(pb, mov);
1350     //mov_write_iods_tag(pb, mov);
1351     for (i=0; i<mov->nb_streams; i++) {
1352         if(mov->tracks[i].entry > 0) {
1353             mov_write_trak_tag(pb, &(mov->tracks[i]));
1354         }
1355     }
1356
1357     if (mov->mode == MODE_PSP)
1358         mov_write_uuidusmt_tag(pb, s);
1359     else if (mov->mode != MODE_3GP && mov->mode != MODE_3G2)
1360         mov_write_udta_tag(pb, mov, s);
1361
1362     return updateSize(pb, pos);
1363 }
1364
1365 static int mov_write_mdat_tag(ByteIOContext *pb, MOVContext* mov)
1366 {
1367     put_be32(pb, 8);    // placeholder for extended size field (64 bit)
1368     put_tag(pb, mov->mode == MODE_MOV ? "wide" : "free");
1369
1370     mov->mdat_pos = url_ftell(pb);
1371     put_be32(pb, 0); /* size placeholder*/
1372     put_tag(pb, "mdat");
1373     return 0;
1374 }
1375
1376 /* TODO: This needs to be more general */
1377 static void mov_write_ftyp_tag (ByteIOContext *pb, AVFormatContext *s)
1378 {
1379     MOVContext *mov = s->priv_data;
1380
1381     put_be32(pb, 0x14); /* size */
1382     put_tag(pb, "ftyp");
1383
1384     if (mov->mode == MODE_3GP)
1385         put_tag(pb, "3gp4");
1386     else if (mov->mode == MODE_3G2)
1387         put_tag(pb, "3g2a");
1388     else if (mov->mode == MODE_PSP)
1389         put_tag(pb, "MSNV");
1390     else if (mov->mode == MODE_MP4 || mov->mode == MODE_IPOD)
1391         put_tag(pb, "isom");
1392     else
1393         put_tag(pb, "qt  ");
1394
1395     put_be32(pb, 0x200);
1396
1397     if (mov->mode == MODE_3GP)
1398         put_tag(pb, "3gp4");
1399     else if (mov->mode == MODE_3G2)
1400         put_tag(pb, "3g2a");
1401     else if (mov->mode == MODE_PSP)
1402         put_tag(pb, "MSNV");
1403     else if (mov->mode == MODE_MP4 || mov->mode == MODE_IPOD)
1404         put_tag(pb, "mp41");
1405     else
1406         put_tag(pb, "qt  ");
1407 }
1408
1409 static void mov_write_uuidprof_tag(ByteIOContext *pb, AVFormatContext *s)
1410 {
1411     AVCodecContext *VideoCodec = s->streams[0]->codec;
1412     AVCodecContext *AudioCodec = s->streams[1]->codec;
1413     int AudioRate = AudioCodec->sample_rate;
1414     int FrameRate = ((VideoCodec->time_base.den) * (0x10000))/ (VideoCodec->time_base.num);
1415     int audio_kbitrate= AudioCodec->bit_rate / 1000;
1416     int video_kbitrate= FFMIN(VideoCodec->bit_rate / 1000, 800 - audio_kbitrate);
1417
1418     put_be32(pb, 0x94); /* size */
1419     put_tag(pb, "uuid");
1420     put_tag(pb, "PROF");
1421
1422     put_be32(pb, 0x21d24fce); /* 96 bit UUID */
1423     put_be32(pb, 0xbb88695c);
1424     put_be32(pb, 0xfac9c740);
1425
1426     put_be32(pb, 0x0);  /* ? */
1427     put_be32(pb, 0x3);  /* 3 sections ? */
1428
1429     put_be32(pb, 0x14); /* size */
1430     put_tag(pb, "FPRF");
1431     put_be32(pb, 0x0);  /* ? */
1432     put_be32(pb, 0x0);  /* ? */
1433     put_be32(pb, 0x0);  /* ? */
1434
1435     put_be32(pb, 0x2c);  /* size */
1436     put_tag(pb, "APRF");   /* audio */
1437     put_be32(pb, 0x0);
1438     put_be32(pb, 0x2);   /* TrackID */
1439     put_tag(pb, "mp4a");
1440     put_be32(pb, 0x20f);
1441     put_be32(pb, 0x0);
1442     put_be32(pb, audio_kbitrate);
1443     put_be32(pb, audio_kbitrate);
1444     put_be32(pb, AudioRate);
1445     put_be32(pb, AudioCodec->channels);
1446
1447     put_be32(pb, 0x34);  /* size */
1448     put_tag(pb, "VPRF");   /* video */
1449     put_be32(pb, 0x0);
1450     put_be32(pb, 0x1);    /* TrackID */
1451     if (VideoCodec->codec_id == CODEC_ID_H264) {
1452         put_tag(pb, "avc1");
1453         put_be16(pb, 0x014D);
1454         put_be16(pb, 0x0015);
1455     } else {
1456         put_tag(pb, "mp4v");
1457         put_be16(pb, 0x0000);
1458         put_be16(pb, 0x0103);
1459     }
1460     put_be32(pb, 0x0);
1461     put_be32(pb, video_kbitrate);
1462     put_be32(pb, video_kbitrate);
1463     put_be32(pb, FrameRate);
1464     put_be32(pb, FrameRate);
1465     put_be16(pb, VideoCodec->width);
1466     put_be16(pb, VideoCodec->height);
1467     put_be32(pb, 0x010001); /* ? */
1468 }
1469
1470 static int mov_write_header(AVFormatContext *s)
1471 {
1472     ByteIOContext *pb = s->pb;
1473     MOVContext *mov = s->priv_data;
1474     int i;
1475
1476     if (url_is_streamed(s->pb)) {
1477         av_log(s, AV_LOG_ERROR, "muxer does not support non seekable output\n");
1478         return -1;
1479     }
1480
1481     /* Default mode == MP4 */
1482     mov->mode = MODE_MP4;
1483
1484     if (s->oformat != NULL) {
1485         if (!strcmp("3gp", s->oformat->name)) mov->mode = MODE_3GP;
1486         else if (!strcmp("3g2", s->oformat->name)) mov->mode = MODE_3G2;
1487         else if (!strcmp("mov", s->oformat->name)) mov->mode = MODE_MOV;
1488         else if (!strcmp("psp", s->oformat->name)) mov->mode = MODE_PSP;
1489         else if (!strcmp("ipod",s->oformat->name)) mov->mode = MODE_IPOD;
1490
1491         mov_write_ftyp_tag(pb,s);
1492         if (mov->mode == MODE_PSP) {
1493             if (s->nb_streams != 2) {
1494                 av_log(s, AV_LOG_ERROR, "PSP mode need one video and one audio stream\n");
1495                 return -1;
1496             }
1497             mov_write_uuidprof_tag(pb,s);
1498         }
1499     }
1500
1501     for(i=0; i<s->nb_streams; i++){
1502         AVStream *st= s->streams[i];
1503         MOVTrack *track= &mov->tracks[i];
1504
1505         track->enc = st->codec;
1506         track->language = ff_mov_iso639_to_lang(st->language, mov->mode != MODE_MOV);
1507         track->mode = mov->mode;
1508         track->tag = mov_find_codec_tag(s, track);
1509         if (!track->tag) {
1510             av_log(s, AV_LOG_ERROR, "track %d: could not find tag for codec\n", i);
1511             return -1;
1512         }
1513         if(st->codec->codec_type == CODEC_TYPE_VIDEO){
1514             track->timescale = st->codec->time_base.den;
1515             av_set_pts_info(st, 64, 1, st->codec->time_base.den);
1516             if (track->mode == MODE_MOV && track->timescale > 100000)
1517                 av_log(s, AV_LOG_WARNING,
1518                        "WARNING codec timebase is very high. If duration is too long,\n"
1519                        "file may not be playable by quicktime. Specify a shorter timebase\n"
1520                        "or choose different container.\n");
1521         }else if(st->codec->codec_type == CODEC_TYPE_AUDIO){
1522             track->timescale = st->codec->sample_rate;
1523             av_set_pts_info(st, 64, 1, st->codec->sample_rate);
1524             if(!st->codec->frame_size){
1525                 av_log(s, AV_LOG_ERROR, "track %d: codec frame size is not set\n", i);
1526                 return -1;
1527             }else if(st->codec->frame_size > 1){ /* assume compressed audio */
1528                 track->audio_vbr = 1;
1529             }else{
1530                 track->sampleSize = (av_get_bits_per_sample(st->codec->codec_id) >> 3) * st->codec->channels;
1531             }
1532         }
1533     }
1534
1535     mov_write_mdat_tag(pb, mov);
1536     mov->time = s->timestamp + 0x7C25B080; //1970 based -> 1904 based
1537     mov->nb_streams = s->nb_streams;
1538
1539     put_flush_packet(pb);
1540
1541     return 0;
1542 }
1543
1544 static int mov_write_packet(AVFormatContext *s, AVPacket *pkt)
1545 {
1546     MOVContext *mov = s->priv_data;
1547     ByteIOContext *pb = s->pb;
1548     MOVTrack *trk = &mov->tracks[pkt->stream_index];
1549     AVCodecContext *enc = trk->enc;
1550     unsigned int samplesInChunk = 0;
1551     int size= pkt->size;
1552
1553     if (url_is_streamed(s->pb)) return 0; /* Can't handle that */
1554     if (!size) return 0; /* Discard 0 sized packets */
1555
1556     if (enc->codec_id == CODEC_ID_AMR_NB) {
1557         /* We must find out how many AMR blocks there are in one packet */
1558         static uint16_t packed_size[16] =
1559             {13, 14, 16, 18, 20, 21, 27, 32, 6, 0, 0, 0, 0, 0, 0, 0};
1560         int len = 0;
1561
1562         while (len < size && samplesInChunk < 100) {
1563             len += packed_size[(pkt->data[len] >> 3) & 0x0F];
1564             samplesInChunk++;
1565         }
1566         if(samplesInChunk > 1){
1567             av_log(s, AV_LOG_ERROR, "fatal error, input is not a single packet, implement a AVParser for it\n");
1568             return -1;
1569         }
1570     } else if (trk->sampleSize)
1571         samplesInChunk = size/trk->sampleSize;
1572     else
1573         samplesInChunk = 1;
1574
1575     /* copy extradata if it exists */
1576     if (trk->vosLen == 0 && enc->extradata_size > 0) {
1577         trk->vosLen = enc->extradata_size;
1578         trk->vosData = av_malloc(trk->vosLen);
1579         memcpy(trk->vosData, enc->extradata, trk->vosLen);
1580     }
1581
1582     if (enc->codec_id == CODEC_ID_H264 && trk->vosLen > 0 && *(uint8_t *)trk->vosData != 1) {
1583         /* from x264 or from bytestream h264 */
1584         /* nal reformating needed */
1585         int ret = ff_avc_parse_nal_units(pkt->data, &pkt->data, &pkt->size);
1586         if (ret < 0)
1587             return ret;
1588         assert(pkt->size);
1589         size = pkt->size;
1590     } else if (enc->codec_id == CODEC_ID_DNXHD && !trk->vosLen) {
1591         /* copy frame header to create needed atoms */
1592         if (size < 640)
1593             return -1;
1594         trk->vosLen = 640;
1595         trk->vosData = av_malloc(trk->vosLen);
1596         memcpy(trk->vosData, pkt->data, 640);
1597     }
1598
1599     if (!(trk->entry % MOV_INDEX_CLUSTER_SIZE)) {
1600         trk->cluster = av_realloc(trk->cluster, (trk->entry + MOV_INDEX_CLUSTER_SIZE) * sizeof(*trk->cluster));
1601         if (!trk->cluster)
1602             return -1;
1603     }
1604
1605     trk->cluster[trk->entry].pos = url_ftell(pb);
1606     trk->cluster[trk->entry].samplesInChunk = samplesInChunk;
1607     trk->cluster[trk->entry].size = size;
1608     trk->cluster[trk->entry].entries = samplesInChunk;
1609     trk->cluster[trk->entry].dts = pkt->dts;
1610     trk->trackDuration = pkt->dts - trk->cluster[0].dts + pkt->duration;
1611
1612     if(enc->codec_type == CODEC_TYPE_VIDEO) {
1613         if (pkt->dts != pkt->pts)
1614             trk->hasBframes = 1;
1615         trk->cluster[trk->entry].cts = pkt->pts - pkt->dts;
1616         trk->cluster[trk->entry].key_frame = !!(pkt->flags & PKT_FLAG_KEY);
1617         if(trk->cluster[trk->entry].key_frame)
1618             trk->hasKeyframes++;
1619     }
1620     trk->entry++;
1621     trk->sampleCount += samplesInChunk;
1622     mov->mdat_size += size;
1623
1624     put_buffer(pb, pkt->data, size);
1625
1626     put_flush_packet(pb);
1627     return 0;
1628 }
1629
1630 static int mov_write_trailer(AVFormatContext *s)
1631 {
1632     MOVContext *mov = s->priv_data;
1633     ByteIOContext *pb = s->pb;
1634     int res = 0;
1635     int i;
1636
1637     offset_t moov_pos = url_ftell(pb);
1638
1639     /* Write size of mdat tag */
1640     if (mov->mdat_size+8 <= UINT32_MAX) {
1641         url_fseek(pb, mov->mdat_pos, SEEK_SET);
1642         put_be32(pb, mov->mdat_size+8);
1643     } else {
1644         /* overwrite 'wide' placeholder atom */
1645         url_fseek(pb, mov->mdat_pos - 8, SEEK_SET);
1646         put_be32(pb, 1); /* special value: real atom size will be 64 bit value after tag field */
1647         put_tag(pb, "mdat");
1648         put_be64(pb, mov->mdat_size+16);
1649     }
1650     url_fseek(pb, moov_pos, SEEK_SET);
1651
1652     mov_write_moov_tag(pb, mov, s);
1653
1654     for (i=0; i<mov->nb_streams; i++) {
1655         av_freep(&mov->tracks[i].cluster);
1656
1657         if(mov->tracks[i].vosLen) av_free(mov->tracks[i].vosData);
1658
1659     }
1660
1661     put_flush_packet(pb);
1662
1663     return res;
1664 }
1665
1666 #ifdef CONFIG_MOV_MUXER
1667 AVOutputFormat mov_muxer = {
1668     "mov",
1669     "mov format",
1670     NULL,
1671     "mov",
1672     sizeof(MOVContext),
1673     CODEC_ID_AAC,
1674     CODEC_ID_MPEG4,
1675     mov_write_header,
1676     mov_write_packet,
1677     mov_write_trailer,
1678     .flags = AVFMT_GLOBALHEADER,
1679     .codec_tag = (const AVCodecTag*[]){codec_movvideo_tags, codec_movaudio_tags, 0},
1680 };
1681 #endif
1682 #ifdef CONFIG_TGP_MUXER
1683 AVOutputFormat tgp_muxer = {
1684     "3gp",
1685     "3gp format",
1686     NULL,
1687     "3gp",
1688     sizeof(MOVContext),
1689     CODEC_ID_AMR_NB,
1690     CODEC_ID_H263,
1691     mov_write_header,
1692     mov_write_packet,
1693     mov_write_trailer,
1694     .flags = AVFMT_GLOBALHEADER,
1695     .codec_tag = (const AVCodecTag*[]){codec_3gp_tags, 0},
1696 };
1697 #endif
1698 #ifdef CONFIG_MP4_MUXER
1699 AVOutputFormat mp4_muxer = {
1700     "mp4",
1701     "mp4 format",
1702     "application/mp4",
1703     "mp4,m4a",
1704     sizeof(MOVContext),
1705     CODEC_ID_AAC,
1706     CODEC_ID_MPEG4,
1707     mov_write_header,
1708     mov_write_packet,
1709     mov_write_trailer,
1710     .flags = AVFMT_GLOBALHEADER,
1711     .codec_tag = (const AVCodecTag*[]){ff_mp4_obj_type, 0},
1712 };
1713 #endif
1714 #ifdef CONFIG_PSP_MUXER
1715 AVOutputFormat psp_muxer = {
1716     "psp",
1717     "psp mp4 format",
1718     NULL,
1719     "mp4,psp",
1720     sizeof(MOVContext),
1721     CODEC_ID_AAC,
1722     CODEC_ID_MPEG4,
1723     mov_write_header,
1724     mov_write_packet,
1725     mov_write_trailer,
1726     .flags = AVFMT_GLOBALHEADER,
1727     .codec_tag = (const AVCodecTag*[]){ff_mp4_obj_type, 0},
1728 };
1729 #endif
1730 #ifdef CONFIG_TG2_MUXER
1731 AVOutputFormat tg2_muxer = {
1732     "3g2",
1733     "3gp2 format",
1734     NULL,
1735     "3g2",
1736     sizeof(MOVContext),
1737     CODEC_ID_AMR_NB,
1738     CODEC_ID_H263,
1739     mov_write_header,
1740     mov_write_packet,
1741     mov_write_trailer,
1742     .flags = AVFMT_GLOBALHEADER,
1743     .codec_tag = (const AVCodecTag*[]){codec_3gp_tags, 0},
1744 };
1745 #endif
1746 #ifdef CONFIG_IPOD_MUXER
1747 AVOutputFormat ipod_muxer = {
1748     "ipod",
1749     "iPod H.264 mp4 format",
1750     "application/mp4",
1751     NULL,
1752     sizeof(MOVContext),
1753     CODEC_ID_AAC,
1754     CODEC_ID_H264,
1755     mov_write_header,
1756     mov_write_packet,
1757     mov_write_trailer,
1758     .flags = AVFMT_GLOBALHEADER,
1759     .codec_tag = (const AVCodecTag*[]){ff_mp4_obj_type, 0},
1760 };
1761 #endif