]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavformat/matroskaenc.c
Make a byte always mean a byte
[frescor/ffmpeg.git] / libavformat / matroskaenc.c
1 /*
2  * Matroska file muxer
3  * Copyright (c) 2007 David Conrad
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "avformat.h"
23 #include "md5.h"
24 #include "riff.h"
25 #include "xiph.h"
26 #include "matroska.h"
27
28 typedef struct mkv_seekhead_entry {
29     unsigned int    elementid;
30     uint64_t        segmentpos;
31 } mkv_seekhead_entry;
32
33 typedef struct mkv_seekhead {
34     offset_t                filepos;
35     offset_t                segment_offset;     ///< the file offset to the beginning of the segment
36     int                     reserved_size;      ///< -1 if appending to file
37     int                     max_entries;
38     mkv_seekhead_entry      *entries;
39     int                     num_entries;
40 } mkv_seekhead;
41
42 typedef struct {
43     uint64_t        pts;
44     int             tracknum;
45     offset_t        cluster_pos;        ///< file offset of the cluster containing the block
46 } mkv_cuepoint;
47
48 typedef struct {
49     offset_t        segment_offset;
50     mkv_cuepoint    *entries;
51     int             num_entries;
52 } mkv_cues;
53
54 typedef struct MatroskaMuxContext {
55     offset_t        segment;
56     offset_t        segment_offset;
57     offset_t        segment_uid;
58     offset_t        cluster;
59     offset_t        cluster_pos;        ///< file offset of the current cluster
60     uint64_t        cluster_pts;
61     offset_t        duration_offset;
62     uint64_t        duration;
63     mkv_seekhead    *main_seekhead;
64     mkv_seekhead    *cluster_seekhead;
65     mkv_cues        *cues;
66
67     struct AVMD5    *md5_ctx;
68 } MatroskaMuxContext;
69
70 static int ebml_id_size(unsigned int id)
71 {
72     return (av_log2(id+1)-1)/7+1;
73 }
74
75 static void put_ebml_id(ByteIOContext *pb, unsigned int id)
76 {
77     int i = ebml_id_size(id);
78     while (i--)
79         put_byte(pb, id >> (i*8));
80 }
81
82 /**
83  * Write an EBML size meaning "unknown size"
84  *
85  * @param bytes The number of bytes the size should occupy. Maximum of 8.
86  */
87 static void put_ebml_size_unknown(ByteIOContext *pb, int bytes)
88 {
89     uint64_t value = 0;
90     int i;
91
92     bytes = FFMIN(bytes, 8);
93     for (i = 0; i < bytes*7 + 1; i++)
94         value |= 1ULL << i;
95     for (i = bytes-1; i >= 0; i--)
96         put_byte(pb, value >> i*8);
97 }
98
99 // XXX: test this thoroughly and get rid of minbytes hack (currently needed to
100 // use up all of the space reserved in start_ebml_master)
101 static void put_ebml_size(ByteIOContext *pb, uint64_t size, int minbytes)
102 {
103     int i, bytes = minbytes;
104
105     // sizes larger than this are currently undefined in EBML
106     // so write "unknown" size
107     if (size >= (1ULL<<56)-1) {
108         put_ebml_size_unknown(pb, 1);
109         return;
110     }
111
112     while ((size+1) >> bytes*7) bytes++;
113
114     put_byte(pb, (0x80 >> (bytes-1)) | (size >> (bytes-1)*8));
115     for (i = bytes - 2; i >= 0; i--)
116         put_byte(pb, size >> i*8);
117 }
118
119 static void put_ebml_uint(ByteIOContext *pb, unsigned int elementid, uint64_t val)
120 {
121     int i, bytes = 1;
122     while (val >> bytes*8) bytes++;
123
124     put_ebml_id(pb, elementid);
125     put_ebml_size(pb, bytes, 0);
126     for (i = bytes - 1; i >= 0; i--)
127         put_byte(pb, val >> i*8);
128 }
129
130 static void put_ebml_float(ByteIOContext *pb, unsigned int elementid, double val)
131 {
132     put_ebml_id(pb, elementid);
133     put_ebml_size(pb, 8, 0);
134     put_be64(pb, av_dbl2int(val));
135 }
136
137 static void put_ebml_binary(ByteIOContext *pb, unsigned int elementid,
138                             const uint8_t *buf, int size)
139 {
140     put_ebml_id(pb, elementid);
141     put_ebml_size(pb, size, 0);
142     put_buffer(pb, buf, size);
143 }
144
145 static void put_ebml_string(ByteIOContext *pb, unsigned int elementid, const char *str)
146 {
147     put_ebml_binary(pb, elementid, str, strlen(str));
148 }
149
150 /**
151  * Writes a void element of a given size. Useful for reserving space in the file to be
152  * written to later.
153  *
154  * @param size The amount of space to reserve, which must be at least 2.
155  */
156 static void put_ebml_void(ByteIOContext *pb, uint64_t size)
157 {
158     offset_t currentpos = url_ftell(pb);
159
160     if (size < 2)
161         return;
162
163     put_ebml_id(pb, EBML_ID_VOID);
164     // we need to subtract the length needed to store the size from the size we need to reserve
165     // so 2 cases, we use 8 bytes to store the size if possible, 1 byte otherwise
166     if (size < 10)
167         put_ebml_size(pb, size-1, 0);
168     else
169         put_ebml_size(pb, size-9, 8);
170     url_fseek(pb, currentpos + size, SEEK_SET);
171 }
172
173 static offset_t start_ebml_master(ByteIOContext *pb, unsigned int elementid)
174 {
175     put_ebml_id(pb, elementid);
176     // XXX: this always reserves the maximum needed space to store any size value
177     // we should be smarter (additional parameter for expected size?)
178     put_ebml_size_unknown(pb, 8);
179     return url_ftell(pb);
180 }
181
182 static void end_ebml_master(ByteIOContext *pb, offset_t start)
183 {
184     offset_t pos = url_ftell(pb);
185
186     url_fseek(pb, start - 8, SEEK_SET);
187     put_ebml_size(pb, pos - start, 8);
188     url_fseek(pb, pos, SEEK_SET);
189 }
190
191 static void put_xiph_size(ByteIOContext *pb, int size)
192 {
193     int i;
194     for (i = 0; i < size / 255; i++)
195         put_byte(pb, 255);
196     put_byte(pb, size % 255);
197 }
198
199 /**
200  * Initialize a mkv_seekhead element to be ready to index level 1 Matroska elements.
201  * If a maximum number of elements is specified, enough space will be reserved at
202  * the current file location to write a seek head of that size.
203  *
204  * @param segment_offset the absolute offset into the file that the segment begins
205  * @param numelements the maximum number of elements that will be indexed by this
206  *                    seek head, 0 if unlimited.
207  */
208 static mkv_seekhead * mkv_start_seekhead(ByteIOContext *pb, offset_t segment_offset, int numelements)
209 {
210     mkv_seekhead *new_seekhead = av_mallocz(sizeof(mkv_seekhead));
211     if (new_seekhead == NULL)
212         return NULL;
213
214     new_seekhead->segment_offset = segment_offset;
215
216     if (numelements > 0) {
217         new_seekhead->filepos = url_ftell(pb);
218         // 21 bytes max for a seek entry, 10 bytes max for the SeekHead ID and size,
219         // and 3 bytes to guarantee that an EBML void element will fit afterwards
220         // XXX: 28 bytes right now because begin_ebml_master() reserves more than necessary
221         new_seekhead->reserved_size = numelements * 28 + 13;
222         new_seekhead->max_entries = numelements;
223         put_ebml_void(pb, new_seekhead->reserved_size);
224     }
225     return new_seekhead;
226 }
227
228 static int mkv_add_seekhead_entry(mkv_seekhead *seekhead, unsigned int elementid, uint64_t filepos)
229 {
230     mkv_seekhead_entry *entries = seekhead->entries;
231     int new_entry = seekhead->num_entries;
232
233     // don't store more elements than we reserved space for
234     if (seekhead->max_entries > 0 && seekhead->max_entries <= seekhead->num_entries)
235         return -1;
236
237     entries = av_realloc(entries, (seekhead->num_entries + 1) * sizeof(mkv_seekhead_entry));
238     if (entries == NULL)
239         return -1;
240
241     entries[new_entry].elementid = elementid;
242     entries[new_entry].segmentpos = filepos - seekhead->segment_offset;
243
244     seekhead->entries = entries;
245     seekhead->num_entries++;
246
247     return 0;
248 }
249
250 /**
251  * Write the seek head to the file and free it. If a maximum number of elements was
252  * specified to mkv_start_seekhead(), the seek head will be written at the location
253  * reserved for it. Otherwise, it is written at the current location in the file.
254  *
255  * @return the file offset where the seekhead was written
256  */
257 static offset_t mkv_write_seekhead(ByteIOContext *pb, mkv_seekhead *seekhead)
258 {
259     offset_t metaseek, seekentry, currentpos;
260     int i;
261
262     currentpos = url_ftell(pb);
263
264     if (seekhead->reserved_size > 0)
265         url_fseek(pb, seekhead->filepos, SEEK_SET);
266
267     metaseek = start_ebml_master(pb, MATROSKA_ID_SEEKHEAD);
268     for (i = 0; i < seekhead->num_entries; i++) {
269         mkv_seekhead_entry *entry = &seekhead->entries[i];
270
271         seekentry = start_ebml_master(pb, MATROSKA_ID_SEEKENTRY);
272
273         put_ebml_id(pb, MATROSKA_ID_SEEKID);
274         put_ebml_size(pb, ebml_id_size(entry->elementid), 0);
275         put_ebml_id(pb, entry->elementid);
276
277         put_ebml_uint(pb, MATROSKA_ID_SEEKPOSITION, entry->segmentpos);
278         end_ebml_master(pb, seekentry);
279     }
280     end_ebml_master(pb, metaseek);
281
282     if (seekhead->reserved_size > 0) {
283         uint64_t remaining = seekhead->filepos + seekhead->reserved_size - url_ftell(pb);
284         put_ebml_void(pb, remaining);
285         url_fseek(pb, currentpos, SEEK_SET);
286
287         currentpos = seekhead->filepos;
288     }
289     av_free(seekhead->entries);
290     av_free(seekhead);
291
292     return currentpos;
293 }
294
295 static mkv_cues * mkv_start_cues(offset_t segment_offset)
296 {
297     mkv_cues *cues = av_mallocz(sizeof(mkv_cues));
298     if (cues == NULL)
299         return NULL;
300
301     cues->segment_offset = segment_offset;
302     return cues;
303 }
304
305 static int mkv_add_cuepoint(mkv_cues *cues, AVPacket *pkt, offset_t cluster_pos)
306 {
307     mkv_cuepoint *entries = cues->entries;
308     int new_entry = cues->num_entries;
309
310     entries = av_realloc(entries, (cues->num_entries + 1) * sizeof(mkv_cuepoint));
311     if (entries == NULL)
312         return -1;
313
314     entries[new_entry].pts = pkt->pts;
315     entries[new_entry].tracknum = pkt->stream_index + 1;
316     entries[new_entry].cluster_pos = cluster_pos - cues->segment_offset;
317
318     cues->entries = entries;
319     cues->num_entries++;
320     return 0;
321 }
322
323 static offset_t mkv_write_cues(ByteIOContext *pb, mkv_cues *cues)
324 {
325     offset_t currentpos, cues_element;
326     int i, j;
327
328     currentpos = url_ftell(pb);
329     cues_element = start_ebml_master(pb, MATROSKA_ID_CUES);
330
331     for (i = 0; i < cues->num_entries; i++) {
332         offset_t cuepoint, track_positions;
333         mkv_cuepoint *entry = &cues->entries[i];
334         uint64_t pts = entry->pts;
335
336         cuepoint = start_ebml_master(pb, MATROSKA_ID_POINTENTRY);
337         put_ebml_uint(pb, MATROSKA_ID_CUETIME, pts);
338
339         // put all the entries from different tracks that have the exact same
340         // timestamp into the same CuePoint
341         for (j = 0; j < cues->num_entries - i && entry[j].pts == pts; j++) {
342             track_positions = start_ebml_master(pb, MATROSKA_ID_CUETRACKPOSITION);
343             put_ebml_uint(pb, MATROSKA_ID_CUETRACK          , entry[j].tracknum   );
344             put_ebml_uint(pb, MATROSKA_ID_CUECLUSTERPOSITION, entry[j].cluster_pos);
345             end_ebml_master(pb, track_positions);
346         }
347         i += j - 1;
348         end_ebml_master(pb, cuepoint);
349     }
350     end_ebml_master(pb, cues_element);
351
352     av_free(cues->entries);
353     av_free(cues);
354     return currentpos;
355 }
356
357 static int put_xiph_codecpriv(ByteIOContext *pb, AVCodecContext *codec)
358 {
359     offset_t codecprivate;
360     uint8_t *header_start[3];
361     int header_len[3];
362     int first_header_size;
363     int j;
364
365     if (codec->codec_id == CODEC_ID_VORBIS)
366         first_header_size = 30;
367     else
368         first_header_size = 42;
369
370     if (ff_split_xiph_headers(codec->extradata, codec->extradata_size,
371                               first_header_size, header_start, header_len) < 0) {
372         av_log(codec, AV_LOG_ERROR, "Extradata corrupt.\n");
373         return -1;
374     }
375
376     codecprivate = start_ebml_master(pb, MATROSKA_ID_CODECPRIVATE);
377     put_byte(pb, 2);                    // number packets - 1
378     for (j = 0; j < 2; j++) {
379         put_xiph_size(pb, header_len[j]);
380     }
381     for (j = 0; j < 3; j++)
382         put_buffer(pb, header_start[j], header_len[j]);
383     end_ebml_master(pb, codecprivate);
384
385     return 0;
386 }
387
388 #define FLAC_STREAMINFO_SIZE 34
389
390 static int put_flac_codecpriv(ByteIOContext *pb, AVCodecContext *codec)
391 {
392     offset_t codecpriv = start_ebml_master(pb, MATROSKA_ID_CODECPRIVATE);
393
394     // if the extradata_size is greater than FLAC_STREAMINFO_SIZE,
395     // assume that it's in Matroska's format already
396     if (codec->extradata_size < FLAC_STREAMINFO_SIZE) {
397         av_log(codec, AV_LOG_ERROR, "Invalid FLAC extradata\n");
398         return -1;
399     } else if (codec->extradata_size == FLAC_STREAMINFO_SIZE) {
400         // only the streaminfo packet
401         put_byte(pb, 0);
402         put_xiph_size(pb, codec->extradata_size);
403         av_log(codec, AV_LOG_ERROR, "Only one packet\n");
404     }
405     put_buffer(pb, codec->extradata, codec->extradata_size);
406     end_ebml_master(pb, codecpriv);
407     return 0;
408 }
409
410 static void get_aac_sample_rates(AVCodecContext *codec, int *sample_rate, int *output_sample_rate)
411 {
412     static const int aac_sample_rates[] = {
413         96000, 88200, 64000, 48000, 44100, 32000,
414         24000, 22050, 16000, 12000, 11025,  8000,
415     };
416     int sri;
417
418     if (codec->extradata_size < 2) {
419         av_log(codec, AV_LOG_WARNING, "no aac extradata, unable to determine sample rate\n");
420         return;
421     }
422
423     sri = ((codec->extradata[0] << 1) & 0xE) | (codec->extradata[1] >> 7);
424     if (sri > 12) {
425         av_log(codec, AV_LOG_WARNING, "aac samplerate index out of bounds\n");
426         return;
427     }
428     *sample_rate = aac_sample_rates[sri];
429
430     // if sbr, get output sample rate as well
431     if (codec->extradata_size == 5) {
432         sri = (codec->extradata[4] >> 3) & 0xF;
433         if (sri > 12) {
434             av_log(codec, AV_LOG_WARNING, "aac output samplerate index out of bounds\n");
435             return;
436         }
437         *output_sample_rate = aac_sample_rates[sri];
438     }
439 }
440
441 static int mkv_write_tracks(AVFormatContext *s)
442 {
443     MatroskaMuxContext *mkv = s->priv_data;
444     ByteIOContext *pb = &s->pb;
445     offset_t tracks;
446     int i, j;
447
448     if (mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_TRACKS, url_ftell(pb)) < 0)
449         return -1;
450
451     tracks = start_ebml_master(pb, MATROSKA_ID_TRACKS);
452     for (i = 0; i < s->nb_streams; i++) {
453         AVStream *st = s->streams[i];
454         AVCodecContext *codec = st->codec;
455         offset_t subinfo, track;
456         int native_id = 0;
457         int bit_depth = av_get_bits_per_sample(codec->codec_id);
458         int sample_rate = codec->sample_rate;
459         int output_sample_rate = 0;
460
461         if (codec->codec_id == CODEC_ID_AAC)
462             get_aac_sample_rates(codec, &sample_rate, &output_sample_rate);
463
464         track = start_ebml_master(pb, MATROSKA_ID_TRACKENTRY);
465         put_ebml_uint (pb, MATROSKA_ID_TRACKNUMBER     , i + 1);
466         put_ebml_uint (pb, MATROSKA_ID_TRACKUID        , i + 1);
467         put_ebml_uint (pb, MATROSKA_ID_TRACKFLAGLACING , 0);    // no lacing (yet)
468
469         if (st->language[0])
470             put_ebml_string(pb, MATROSKA_ID_TRACKLANGUAGE, st->language);
471         else
472             put_ebml_string(pb, MATROSKA_ID_TRACKLANGUAGE, "und");
473
474         // look for a codec id string specific to mkv to use, if none are found, use AVI codes
475         for (j = 0; ff_mkv_codec_tags[j].id != CODEC_ID_NONE; j++) {
476             if (ff_mkv_codec_tags[j].id == codec->codec_id) {
477                 put_ebml_string(pb, MATROSKA_ID_CODECID, ff_mkv_codec_tags[j].str);
478                 native_id = 1;
479                 break;
480             }
481         }
482
483         if (native_id) {
484             if (codec->codec_id == CODEC_ID_VORBIS || codec->codec_id == CODEC_ID_THEORA) {
485                 if (put_xiph_codecpriv(pb, codec) < 0)
486                     return -1;
487             } else if (codec->codec_id == CODEC_ID_FLAC) {
488                 if (put_flac_codecpriv(pb, codec) < 0)
489                     return -1;
490             } else if (codec->extradata_size) {
491                 put_ebml_binary(pb, MATROSKA_ID_CODECPRIVATE, codec->extradata, codec->extradata_size);
492             }
493         }
494
495         switch (codec->codec_type) {
496             case CODEC_TYPE_VIDEO:
497                 put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, MATROSKA_TRACK_TYPE_VIDEO);
498
499                 if (!native_id) {
500                     offset_t bmp_header;
501                     // if there is no mkv-specific codec id, use VFW mode
502                     if (!codec->codec_tag)
503                         codec->codec_tag = codec_get_tag(codec_bmp_tags, codec->codec_id);
504
505                     put_ebml_string(pb, MATROSKA_ID_CODECID, MATROSKA_CODEC_ID_VIDEO_VFW_FOURCC);
506                     bmp_header = start_ebml_master(pb, MATROSKA_ID_CODECPRIVATE);
507                     put_bmp_header(pb, codec, codec_bmp_tags, 0);
508                     end_ebml_master(pb, bmp_header);
509                 }
510                 subinfo = start_ebml_master(pb, MATROSKA_ID_TRACKVIDEO);
511                 // XXX: interlace flag?
512                 put_ebml_uint (pb, MATROSKA_ID_VIDEOPIXELWIDTH , codec->width);
513                 put_ebml_uint (pb, MATROSKA_ID_VIDEOPIXELHEIGHT, codec->height);
514                 if (codec->sample_aspect_ratio.num) {
515                     put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYWIDTH , codec->sample_aspect_ratio.num);
516                     put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYHEIGHT, codec->sample_aspect_ratio.den);
517                 }
518                 end_ebml_master(pb, subinfo);
519                 break;
520
521             case CODEC_TYPE_AUDIO:
522                 put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, MATROSKA_TRACK_TYPE_AUDIO);
523
524                 if (!native_id) {
525                     offset_t wav_header;
526                     // no mkv-specific ID, use ACM mode
527                     codec->codec_tag = codec_get_tag(codec_wav_tags, codec->codec_id);
528                     if (!codec->codec_tag) {
529                         av_log(s, AV_LOG_ERROR, "no codec id found for stream %d", i);
530                         return -1;
531                     }
532
533                     put_ebml_string(pb, MATROSKA_ID_CODECID, MATROSKA_CODEC_ID_AUDIO_ACM);
534                     wav_header = start_ebml_master(pb, MATROSKA_ID_CODECPRIVATE);
535                     put_wav_header(pb, codec);
536                     end_ebml_master(pb, wav_header);
537                 }
538                 subinfo = start_ebml_master(pb, MATROSKA_ID_TRACKAUDIO);
539                 put_ebml_uint  (pb, MATROSKA_ID_AUDIOCHANNELS    , codec->channels);
540                 put_ebml_float (pb, MATROSKA_ID_AUDIOSAMPLINGFREQ, sample_rate);
541                 if (output_sample_rate)
542                     put_ebml_float(pb, MATROSKA_ID_AUDIOOUTSAMPLINGFREQ, output_sample_rate);
543                 if (bit_depth)
544                     put_ebml_uint(pb, MATROSKA_ID_AUDIOBITDEPTH, bit_depth);
545                 end_ebml_master(pb, subinfo);
546                 break;
547
548                 case CODEC_TYPE_SUBTITLE:
549                     put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, MATROSKA_TRACK_TYPE_SUBTITLE);
550                     break;
551             default:
552                 av_log(s, AV_LOG_ERROR, "Only audio and video are supported for Matroska.");
553                 break;
554         }
555         end_ebml_master(pb, track);
556
557         // ms precision is the de-facto standard timescale for mkv files
558         av_set_pts_info(st, 64, 1, 1000);
559     }
560     end_ebml_master(pb, tracks);
561     return 0;
562 }
563
564 static int mkv_write_header(AVFormatContext *s)
565 {
566     MatroskaMuxContext *mkv = s->priv_data;
567     ByteIOContext *pb = &s->pb;
568     offset_t ebml_header, segment_info;
569
570     mkv->md5_ctx = av_mallocz(av_md5_size);
571     av_md5_init(mkv->md5_ctx);
572
573     ebml_header = start_ebml_master(pb, EBML_ID_HEADER);
574     put_ebml_uint   (pb, EBML_ID_EBMLVERSION        ,           1);
575     put_ebml_uint   (pb, EBML_ID_EBMLREADVERSION    ,           1);
576     put_ebml_uint   (pb, EBML_ID_EBMLMAXIDLENGTH    ,           4);
577     put_ebml_uint   (pb, EBML_ID_EBMLMAXSIZELENGTH  ,           8);
578     put_ebml_string (pb, EBML_ID_DOCTYPE            ,  "matroska");
579     put_ebml_uint   (pb, EBML_ID_DOCTYPEVERSION     ,           2);
580     put_ebml_uint   (pb, EBML_ID_DOCTYPEREADVERSION ,           2);
581     end_ebml_master(pb, ebml_header);
582
583     mkv->segment = start_ebml_master(pb, MATROSKA_ID_SEGMENT);
584     mkv->segment_offset = url_ftell(pb);
585
586     // we write 2 seek heads - one at the end of the file to point to each cluster, and
587     // one at the beginning to point to all other level one elements (including the seek
588     // head at the end of the file), which isn't more than 10 elements if we only write one
589     // of each other currently defined level 1 element
590     mkv->main_seekhead    = mkv_start_seekhead(pb, mkv->segment_offset, 10);
591     mkv->cluster_seekhead = mkv_start_seekhead(pb, mkv->segment_offset, 0);
592
593     if (mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_INFO, url_ftell(pb)) < 0)
594         return -1;
595
596     segment_info = start_ebml_master(pb, MATROSKA_ID_INFO);
597     put_ebml_uint(pb, MATROSKA_ID_TIMECODESCALE, 1000000);
598     if (strlen(s->title))
599         put_ebml_string(pb, MATROSKA_ID_TITLE, s->title);
600     if (!(s->streams[0]->codec->flags & CODEC_FLAG_BITEXACT)) {
601         put_ebml_string(pb, MATROSKA_ID_MUXINGAPP , LIBAVFORMAT_IDENT);
602         put_ebml_string(pb, MATROSKA_ID_WRITINGAPP, LIBAVFORMAT_IDENT);
603
604         // reserve space to write the segment UID later
605         mkv->segment_uid = url_ftell(pb);
606         put_ebml_void(pb, 19);
607     }
608
609     // reserve space for the duration
610     mkv->duration = 0;
611     mkv->duration_offset = url_ftell(pb);
612     put_ebml_void(pb, 11);                  // assumes double-precision float to be written
613     end_ebml_master(pb, segment_info);
614
615     if (mkv_write_tracks(s) < 0)
616         return -1;
617
618     if (mkv_add_seekhead_entry(mkv->cluster_seekhead, MATROSKA_ID_CLUSTER, url_ftell(pb)) < 0)
619         return -1;
620
621     mkv->cluster_pos = url_ftell(pb);
622     mkv->cluster = start_ebml_master(pb, MATROSKA_ID_CLUSTER);
623     put_ebml_uint(pb, MATROSKA_ID_CLUSTERTIMECODE, 0);
624     mkv->cluster_pts = 0;
625
626     mkv->cues = mkv_start_cues(mkv->segment_offset);
627     if (mkv->cues == NULL)
628         return -1;
629
630     return 0;
631 }
632
633 static void mkv_write_block(AVFormatContext *s, unsigned int blockid, AVPacket *pkt, int flags)
634 {
635     MatroskaMuxContext *mkv = s->priv_data;
636     ByteIOContext *pb = &s->pb;
637
638     av_log(s, AV_LOG_DEBUG, "Writing block at offset %llu, size %d, pts %lld, dts %lld, duration %d, flags %d\n",
639            url_ftell(pb), pkt->size, pkt->pts, pkt->dts, pkt->duration, flags);
640     put_ebml_id(pb, blockid);
641     put_ebml_size(pb, pkt->size + 4, 0);
642     put_byte(pb, 0x80 | (pkt->stream_index + 1));     // this assumes stream_index is less than 126
643     put_be16(pb, pkt->pts - mkv->cluster_pts);
644     put_byte(pb, flags);
645     put_buffer(pb, pkt->data, pkt->size);
646 }
647
648 static int mkv_write_packet(AVFormatContext *s, AVPacket *pkt)
649 {
650     MatroskaMuxContext *mkv = s->priv_data;
651     ByteIOContext *pb = &s->pb;
652     AVCodecContext *codec = s->streams[pkt->stream_index]->codec;
653     int keyframe = !!(pkt->flags & PKT_FLAG_KEY);
654
655     // start a new cluster every 5 MB or 5 sec
656     if (url_ftell(pb) > mkv->cluster + 5*1024*1024 || pkt->pts > mkv->cluster_pts + 5000) {
657         av_log(s, AV_LOG_DEBUG, "Starting new cluster at offset %llu bytes, pts %llu\n", url_ftell(pb), pkt->pts);
658         end_ebml_master(pb, mkv->cluster);
659
660         if (mkv_add_seekhead_entry(mkv->cluster_seekhead, MATROSKA_ID_CLUSTER, url_ftell(pb)) < 0)
661             return -1;
662
663         mkv->cluster_pos = url_ftell(pb);
664         mkv->cluster = start_ebml_master(pb, MATROSKA_ID_CLUSTER);
665         put_ebml_uint(pb, MATROSKA_ID_CLUSTERTIMECODE, pkt->pts);
666         mkv->cluster_pts = pkt->pts;
667         av_md5_update(mkv->md5_ctx, pkt->data, FFMIN(200, pkt->size));
668     }
669
670     if (codec->codec_type != CODEC_TYPE_SUBTITLE) {
671         mkv_write_block(s, MATROSKA_ID_SIMPLEBLOCK, pkt, keyframe << 7);
672     } else {
673         offset_t blockgroup = start_ebml_master(pb, MATROSKA_ID_BLOCKGROUP);
674         mkv_write_block(s, MATROSKA_ID_BLOCK, pkt, 0);
675         put_ebml_uint(pb, MATROSKA_ID_DURATION, pkt->duration);
676         end_ebml_master(pb, blockgroup);
677     }
678
679     if (codec->codec_type == CODEC_TYPE_VIDEO && keyframe) {
680         if (mkv_add_cuepoint(mkv->cues, pkt, mkv->cluster_pos) < 0)
681             return -1;
682     }
683
684     mkv->duration = pkt->pts + pkt->duration;
685     return 0;
686 }
687
688 static int mkv_write_trailer(AVFormatContext *s)
689 {
690     MatroskaMuxContext *mkv = s->priv_data;
691     ByteIOContext *pb = &s->pb;
692     offset_t currentpos, second_seekhead, cuespos;
693
694     end_ebml_master(pb, mkv->cluster);
695
696     cuespos = mkv_write_cues(pb, mkv->cues);
697     second_seekhead = mkv_write_seekhead(pb, mkv->cluster_seekhead);
698
699     mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_CUES    , cuespos);
700     mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_SEEKHEAD, second_seekhead);
701     mkv_write_seekhead(pb, mkv->main_seekhead);
702
703     // update the duration
704     av_log(s, AV_LOG_DEBUG, "end duration = %llu\n", mkv->duration);
705     currentpos = url_ftell(pb);
706     url_fseek(pb, mkv->duration_offset, SEEK_SET);
707     put_ebml_float(pb, MATROSKA_ID_DURATION, mkv->duration);
708
709     // write the md5sum of some frames as the segment UID
710     if (!(s->streams[0]->codec->flags & CODEC_FLAG_BITEXACT)) {
711         uint8_t segment_uid[16];
712         av_md5_final(mkv->md5_ctx, segment_uid);
713         url_fseek(pb, mkv->segment_uid, SEEK_SET);
714         put_ebml_binary(pb, MATROSKA_ID_SEGMENTUID, segment_uid, 16);
715     }
716     url_fseek(pb, currentpos, SEEK_SET);
717
718     end_ebml_master(pb, mkv->segment);
719     av_free(mkv->md5_ctx);
720     return 0;
721 }
722
723 AVOutputFormat matroska_muxer = {
724     "matroska",
725     "Matroska File Format",
726     "video/x-matroska",
727     "mkv",
728     sizeof(MatroskaMuxContext),
729     CODEC_ID_MP2,
730     CODEC_ID_MPEG4,
731     mkv_write_header,
732     mkv_write_packet,
733     mkv_write_trailer,
734     .codec_tag = (const AVCodecTag*[]){codec_bmp_tags, codec_wav_tags, 0},
735 };
736
737 AVOutputFormat matroska_audio_muxer = {
738     "matroska",
739     "Matroska File Format",
740     "audio/x-matroska",
741     "mka",
742     sizeof(MatroskaMuxContext),
743     CODEC_ID_MP2,
744     CODEC_ID_NONE,
745     mkv_write_header,
746     mkv_write_packet,
747     mkv_write_trailer,
748     .codec_tag = (const AVCodecTag*[]){codec_wav_tags, 0},
749 };