]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavformat/mxfdec.c
Fix for issue #829 ("ffvorbis outputs crackling sound, libvorbis plays fine")
[frescor/ffmpeg.git] / libavformat / mxfdec.c
1 /*
2  * MXF demuxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /*
23  * References
24  * SMPTE 336M KLV Data Encoding Protocol Using Key-Length-Value
25  * SMPTE 377M MXF File Format Specifications
26  * SMPTE 378M Operational Pattern 1a
27  * SMPTE 379M MXF Generic Container
28  * SMPTE 381M Mapping MPEG Streams into the MXF Generic Container
29  * SMPTE 382M Mapping AES3 and Broadcast Wave Audio into the MXF Generic Container
30  * SMPTE 383M Mapping DV-DIF Data to the MXF Generic Container
31  *
32  * Principle
33  * Search for Track numbers which will identify essence element KLV packets.
34  * Search for SourcePackage which define tracks which contains Track numbers.
35  * Material Package contains tracks with reference to SourcePackage tracks.
36  * Search for Descriptors (Picture, Sound) which contains codec info and parameters.
37  * Assign Descriptors to correct Tracks.
38  *
39  * Metadata reading functions read Local Tags, get InstanceUID(0x3C0A) then add MetaDataSet to MXFContext.
40  * Metadata parsing resolves Strong References to objects.
41  *
42  * Simple demuxer, only OP1A supported and some files might not work at all.
43  * Only tracks with associated descriptors will be decoded. "Highly Desirable" SMPTE 377M D.1
44  */
45
46 //#define DEBUG
47
48 #include "libavutil/aes.h"
49 #include "libavcodec/bytestream.h"
50 #include "avformat.h"
51 #include "mxf.h"
52
53 typedef struct {
54     UID uid;
55     enum MXFMetadataSetType type;
56     UID source_container_ul;
57 } MXFCryptoContext;
58
59 typedef struct {
60     UID uid;
61     enum MXFMetadataSetType type;
62     UID source_package_uid;
63     UID data_definition_ul;
64     int64_t duration;
65     int64_t start_position;
66     int source_track_id;
67 } MXFStructuralComponent;
68
69 typedef struct {
70     UID uid;
71     enum MXFMetadataSetType type;
72     UID data_definition_ul;
73     UID *structural_components_refs;
74     int structural_components_count;
75     int64_t duration;
76 } MXFSequence;
77
78 typedef struct {
79     UID uid;
80     enum MXFMetadataSetType type;
81     MXFSequence *sequence; /* mandatory, and only one */
82     UID sequence_ref;
83     int track_id;
84     uint8_t track_number[4];
85     AVRational edit_rate;
86 } MXFTrack;
87
88 typedef struct {
89     UID uid;
90     enum MXFMetadataSetType type;
91     UID essence_container_ul;
92     UID essence_codec_ul;
93     AVRational sample_rate;
94     AVRational aspect_ratio;
95     int width;
96     int height;
97     int channels;
98     int bits_per_sample;
99     UID *sub_descriptors_refs;
100     int sub_descriptors_count;
101     int linked_track_id;
102     uint8_t *extradata;
103     int extradata_size;
104 } MXFDescriptor;
105
106 typedef struct {
107     UID uid;
108     enum MXFMetadataSetType type;
109 } MXFIndexTableSegment;
110
111 typedef struct {
112     UID uid;
113     enum MXFMetadataSetType type;
114     UID package_uid;
115     UID *tracks_refs;
116     int tracks_count;
117     MXFDescriptor *descriptor; /* only one */
118     UID descriptor_ref;
119 } MXFPackage;
120
121 typedef struct {
122     UID uid;
123     enum MXFMetadataSetType type;
124 } MXFMetadataSet;
125
126 typedef struct {
127     UID *packages_refs;
128     int packages_count;
129     MXFMetadataSet **metadata_sets;
130     int metadata_sets_count;
131     AVFormatContext *fc;
132     struct AVAES *aesc;
133     uint8_t *local_tags;
134     int local_tags_count;
135 } MXFContext;
136
137 enum MXFWrappingScheme {
138     Frame,
139     Clip,
140 };
141
142 typedef struct {
143     const UID key;
144     int (*read)();
145     int ctx_size;
146     enum MXFMetadataSetType type;
147 } MXFMetadataReadTableEntry;
148
149 /* partial keys to match */
150 static const uint8_t mxf_header_partition_pack_key[]       = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02 };
151 static const uint8_t mxf_essence_element_key[]             = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0d,0x01,0x03,0x01 };
152 static const uint8_t mxf_klv_key[]                         = { 0x06,0x0e,0x2b,0x34 };
153 /* complete keys to match */
154 static const uint8_t mxf_crypto_source_container_ul[]      = { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0x09,0x06,0x01,0x01,0x02,0x02,0x00,0x00,0x00 };
155 static const uint8_t mxf_encrypted_triplet_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x04,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x7e,0x01,0x00 };
156 static const uint8_t mxf_encrypted_essence_container[]     = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x0b,0x01,0x00 };
157 static const uint8_t mxf_sony_mpeg4_extradata[]            = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0e,0x06,0x06,0x02,0x02,0x01,0x00,0x00 };
158
159 #define IS_KLV_KEY(x, y) (!memcmp(x, y, sizeof(y)))
160
161 static int64_t klv_decode_ber_length(ByteIOContext *pb)
162 {
163     uint64_t size = get_byte(pb);
164     if (size & 0x80) { /* long form */
165         int bytes_num = size & 0x7f;
166         /* SMPTE 379M 5.3.4 guarantee that bytes_num must not exceed 8 bytes */
167         if (bytes_num > 8)
168             return -1;
169         size = 0;
170         while (bytes_num--)
171             size = size << 8 | get_byte(pb);
172     }
173     return size;
174 }
175
176 static int mxf_read_sync(ByteIOContext *pb, const uint8_t *key, unsigned size)
177 {
178     int i, b;
179     for (i = 0; i < size && !url_feof(pb); i++) {
180         b = get_byte(pb);
181         if (b == key[0])
182             i = 0;
183         else if (b != key[i])
184             i = -1;
185     }
186     return i == size;
187 }
188
189 static int klv_read_packet(KLVPacket *klv, ByteIOContext *pb)
190 {
191     if (!mxf_read_sync(pb, mxf_klv_key, 4))
192         return -1;
193     klv->offset = url_ftell(pb) - 4;
194     memcpy(klv->key, mxf_klv_key, 4);
195     get_buffer(pb, klv->key + 4, 12);
196     klv->length = klv_decode_ber_length(pb);
197     return klv->length == -1 ? -1 : 0;
198 }
199
200 static int mxf_get_stream_index(AVFormatContext *s, KLVPacket *klv)
201 {
202     int i;
203
204     for (i = 0; i < s->nb_streams; i++) {
205         MXFTrack *track = s->streams[i]->priv_data;
206         /* SMPTE 379M 7.3 */
207         if (!memcmp(klv->key + sizeof(mxf_essence_element_key), track->track_number, sizeof(track->track_number)))
208             return i;
209     }
210     /* return 0 if only one stream, for OP Atom files with 0 as track number */
211     return s->nb_streams == 1 ? 0 : -1;
212 }
213
214 /* XXX: use AVBitStreamFilter */
215 static int mxf_get_d10_aes3_packet(ByteIOContext *pb, AVStream *st, AVPacket *pkt, int64_t length)
216 {
217     uint8_t buffer[61444];
218     const uint8_t *buf_ptr, *end_ptr;
219     uint8_t *data_ptr;
220     int i;
221
222     if (length > 61444) /* worst case PAL 1920 samples 8 channels */
223         return -1;
224     get_buffer(pb, buffer, length);
225     av_new_packet(pkt, length);
226     data_ptr = pkt->data;
227     end_ptr = buffer + length;
228     buf_ptr = buffer + 4; /* skip SMPTE 331M header */
229     for (; buf_ptr < end_ptr; ) {
230         for (i = 0; i < st->codec->channels; i++) {
231             uint32_t sample = bytestream_get_le32(&buf_ptr);
232             if (st->codec->bits_per_coded_sample == 24)
233                 bytestream_put_le24(&data_ptr, (sample >> 4) & 0xffffff);
234             else
235                 bytestream_put_le16(&data_ptr, (sample >> 12) & 0xffff);
236         }
237         buf_ptr += 32 - st->codec->channels*4; // always 8 channels stored SMPTE 331M
238     }
239     pkt->size = data_ptr - pkt->data;
240     return 0;
241 }
242
243 static int mxf_decrypt_triplet(AVFormatContext *s, AVPacket *pkt, KLVPacket *klv)
244 {
245     static const uint8_t checkv[16] = {0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b};
246     MXFContext *mxf = s->priv_data;
247     ByteIOContext *pb = s->pb;
248     int64_t end = url_ftell(pb) + klv->length;
249     uint64_t size;
250     uint64_t orig_size;
251     uint64_t plaintext_size;
252     uint8_t ivec[16];
253     uint8_t tmpbuf[16];
254     int index;
255
256     if (!mxf->aesc && s->key && s->keylen == 16) {
257         mxf->aesc = av_malloc(av_aes_size);
258         if (!mxf->aesc)
259             return -1;
260         av_aes_init(mxf->aesc, s->key, 128, 1);
261     }
262     // crypto context
263     url_fskip(pb, klv_decode_ber_length(pb));
264     // plaintext offset
265     klv_decode_ber_length(pb);
266     plaintext_size = get_be64(pb);
267     // source klv key
268     klv_decode_ber_length(pb);
269     get_buffer(pb, klv->key, 16);
270     if (!IS_KLV_KEY(klv, mxf_essence_element_key))
271         return -1;
272     index = mxf_get_stream_index(s, klv);
273     if (index < 0)
274         return -1;
275     // source size
276     klv_decode_ber_length(pb);
277     orig_size = get_be64(pb);
278     if (orig_size < plaintext_size)
279         return -1;
280     // enc. code
281     size = klv_decode_ber_length(pb);
282     if (size < 32 || size - 32 < orig_size)
283         return -1;
284     get_buffer(pb, ivec, 16);
285     get_buffer(pb, tmpbuf, 16);
286     if (mxf->aesc)
287         av_aes_crypt(mxf->aesc, tmpbuf, tmpbuf, 1, ivec, 1);
288     if (memcmp(tmpbuf, checkv, 16))
289         av_log(s, AV_LOG_ERROR, "probably incorrect decryption key\n");
290     size -= 32;
291     av_get_packet(pb, pkt, size);
292     size -= plaintext_size;
293     if (mxf->aesc)
294         av_aes_crypt(mxf->aesc, &pkt->data[plaintext_size],
295                      &pkt->data[plaintext_size], size >> 4, ivec, 1);
296     pkt->size = orig_size;
297     pkt->stream_index = index;
298     url_fskip(pb, end - url_ftell(pb));
299     return 0;
300 }
301
302 static int mxf_read_packet(AVFormatContext *s, AVPacket *pkt)
303 {
304     KLVPacket klv;
305
306     while (!url_feof(s->pb)) {
307         if (klv_read_packet(&klv, s->pb) < 0)
308             return -1;
309         PRINT_KEY(s, "read packet", klv.key);
310         dprintf(s, "size %lld offset %#llx\n", klv.length, klv.offset);
311         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key)) {
312             int res = mxf_decrypt_triplet(s, pkt, &klv);
313             if (res < 0) {
314                 av_log(s, AV_LOG_ERROR, "invalid encoded triplet\n");
315                 return -1;
316             }
317             return 0;
318         }
319         if (IS_KLV_KEY(klv.key, mxf_essence_element_key)) {
320             int index = mxf_get_stream_index(s, &klv);
321             if (index < 0) {
322                 av_log(s, AV_LOG_ERROR, "error getting stream index %d\n", AV_RB32(klv.key+12));
323                 goto skip;
324             }
325             if (s->streams[index]->discard == AVDISCARD_ALL)
326                 goto skip;
327             /* check for 8 channels AES3 element */
328             if (klv.key[12] == 0x06 && klv.key[13] == 0x01 && klv.key[14] == 0x10) {
329                 if (mxf_get_d10_aes3_packet(s->pb, s->streams[index], pkt, klv.length) < 0) {
330                     av_log(s, AV_LOG_ERROR, "error reading D-10 aes3 frame\n");
331                     return -1;
332                 }
333             } else
334                 av_get_packet(s->pb, pkt, klv.length);
335             pkt->stream_index = index;
336             pkt->pos = klv.offset;
337             return 0;
338         } else
339         skip:
340             url_fskip(s->pb, klv.length);
341     }
342     return AVERROR(EIO);
343 }
344
345 static int mxf_read_primer_pack(MXFContext *mxf)
346 {
347     ByteIOContext *pb = mxf->fc->pb;
348     int item_num = get_be32(pb);
349     int item_len = get_be32(pb);
350
351     if (item_len != 18) {
352         av_log(mxf->fc, AV_LOG_ERROR, "unsupported primer pack item length\n");
353         return -1;
354     }
355     if (item_num > UINT_MAX / item_len)
356         return -1;
357     mxf->local_tags_count = item_num;
358     mxf->local_tags = av_malloc(item_num*item_len);
359     if (!mxf->local_tags)
360         return -1;
361     get_buffer(pb, mxf->local_tags, item_num*item_len);
362     return 0;
363 }
364
365 static int mxf_add_metadata_set(MXFContext *mxf, void *metadata_set)
366 {
367     if (mxf->metadata_sets_count+1 >= UINT_MAX / sizeof(*mxf->metadata_sets))
368         return AVERROR(ENOMEM);
369     mxf->metadata_sets = av_realloc(mxf->metadata_sets, (mxf->metadata_sets_count + 1) * sizeof(*mxf->metadata_sets));
370     if (!mxf->metadata_sets)
371         return -1;
372     mxf->metadata_sets[mxf->metadata_sets_count] = metadata_set;
373     mxf->metadata_sets_count++;
374     return 0;
375 }
376
377 static int mxf_read_cryptographic_context(MXFCryptoContext *cryptocontext, ByteIOContext *pb, int tag, int size, UID uid)
378 {
379     if (size != 16)
380         return -1;
381     if (IS_KLV_KEY(uid, mxf_crypto_source_container_ul))
382         get_buffer(pb, cryptocontext->source_container_ul, 16);
383     return 0;
384 }
385
386 static int mxf_read_content_storage(MXFContext *mxf, ByteIOContext *pb, int tag)
387 {
388     switch (tag) {
389     case 0x1901:
390         mxf->packages_count = get_be32(pb);
391         if (mxf->packages_count >= UINT_MAX / sizeof(UID))
392             return -1;
393         mxf->packages_refs = av_malloc(mxf->packages_count * sizeof(UID));
394         if (!mxf->packages_refs)
395             return -1;
396         url_fskip(pb, 4); /* useless size of objects, always 16 according to specs */
397         get_buffer(pb, (uint8_t *)mxf->packages_refs, mxf->packages_count * sizeof(UID));
398         break;
399     }
400     return 0;
401 }
402
403 static int mxf_read_source_clip(MXFStructuralComponent *source_clip, ByteIOContext *pb, int tag)
404 {
405     switch(tag) {
406     case 0x0202:
407         source_clip->duration = get_be64(pb);
408         break;
409     case 0x1201:
410         source_clip->start_position = get_be64(pb);
411         break;
412     case 0x1101:
413         /* UMID, only get last 16 bytes */
414         url_fskip(pb, 16);
415         get_buffer(pb, source_clip->source_package_uid, 16);
416         break;
417     case 0x1102:
418         source_clip->source_track_id = get_be32(pb);
419         break;
420     }
421     return 0;
422 }
423
424 static int mxf_read_material_package(MXFPackage *package, ByteIOContext *pb, int tag)
425 {
426     switch(tag) {
427     case 0x4403:
428         package->tracks_count = get_be32(pb);
429         if (package->tracks_count >= UINT_MAX / sizeof(UID))
430             return -1;
431         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
432         if (!package->tracks_refs)
433             return -1;
434         url_fskip(pb, 4); /* useless size of objects, always 16 according to specs */
435         get_buffer(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
436         break;
437     }
438     return 0;
439 }
440
441 static int mxf_read_track(MXFTrack *track, ByteIOContext *pb, int tag)
442 {
443     switch(tag) {
444     case 0x4801:
445         track->track_id = get_be32(pb);
446         break;
447     case 0x4804:
448         get_buffer(pb, track->track_number, 4);
449         break;
450     case 0x4B01:
451         track->edit_rate.den = get_be32(pb);
452         track->edit_rate.num = get_be32(pb);
453         break;
454     case 0x4803:
455         get_buffer(pb, track->sequence_ref, 16);
456         break;
457     }
458     return 0;
459 }
460
461 static int mxf_read_sequence(MXFSequence *sequence, ByteIOContext *pb, int tag)
462 {
463     switch(tag) {
464     case 0x0202:
465         sequence->duration = get_be64(pb);
466         break;
467     case 0x0201:
468         get_buffer(pb, sequence->data_definition_ul, 16);
469         break;
470     case 0x1001:
471         sequence->structural_components_count = get_be32(pb);
472         if (sequence->structural_components_count >= UINT_MAX / sizeof(UID))
473             return -1;
474         sequence->structural_components_refs = av_malloc(sequence->structural_components_count * sizeof(UID));
475         if (!sequence->structural_components_refs)
476             return -1;
477         url_fskip(pb, 4); /* useless size of objects, always 16 according to specs */
478         get_buffer(pb, (uint8_t *)sequence->structural_components_refs, sequence->structural_components_count * sizeof(UID));
479         break;
480     }
481     return 0;
482 }
483
484 static int mxf_read_source_package(MXFPackage *package, ByteIOContext *pb, int tag)
485 {
486     switch(tag) {
487     case 0x4403:
488         package->tracks_count = get_be32(pb);
489         if (package->tracks_count >= UINT_MAX / sizeof(UID))
490             return -1;
491         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
492         if (!package->tracks_refs)
493             return -1;
494         url_fskip(pb, 4); /* useless size of objects, always 16 according to specs */
495         get_buffer(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
496         break;
497     case 0x4401:
498         /* UMID, only get last 16 bytes */
499         url_fskip(pb, 16);
500         get_buffer(pb, package->package_uid, 16);
501         break;
502     case 0x4701:
503         get_buffer(pb, package->descriptor_ref, 16);
504         break;
505     }
506     return 0;
507 }
508
509 static int mxf_read_index_table_segment(MXFIndexTableSegment *segment, ByteIOContext *pb, int tag)
510 {
511     switch(tag) {
512     case 0x3F05: dprintf(NULL, "EditUnitByteCount %d\n", get_be32(pb)); break;
513     case 0x3F06: dprintf(NULL, "IndexSID %d\n", get_be32(pb)); break;
514     case 0x3F07: dprintf(NULL, "BodySID %d\n", get_be32(pb)); break;
515     case 0x3F0B: dprintf(NULL, "IndexEditRate %d/%d\n", get_be32(pb), get_be32(pb)); break;
516     case 0x3F0C: dprintf(NULL, "IndexStartPosition %lld\n", get_be64(pb)); break;
517     case 0x3F0D: dprintf(NULL, "IndexDuration %lld\n", get_be64(pb)); break;
518     }
519     return 0;
520 }
521
522 static void mxf_read_pixel_layout(ByteIOContext *pb, MXFDescriptor *descriptor)
523 {
524     int code;
525
526     do {
527         code = get_byte(pb);
528         dprintf(NULL, "pixel layout: code %#x\n", code);
529         switch (code) {
530         case 0x52: /* R */
531             descriptor->bits_per_sample += get_byte(pb);
532             break;
533         case 0x47: /* G */
534             descriptor->bits_per_sample += get_byte(pb);
535             break;
536         case 0x42: /* B */
537             descriptor->bits_per_sample += get_byte(pb);
538             break;
539         default:
540             get_byte(pb);
541         }
542     } while (code != 0); /* SMPTE 377M E.2.46 */
543 }
544
545 static int mxf_read_generic_descriptor(MXFDescriptor *descriptor, ByteIOContext *pb, int tag, int size, UID uid)
546 {
547     switch(tag) {
548     case 0x3F01:
549         descriptor->sub_descriptors_count = get_be32(pb);
550         if (descriptor->sub_descriptors_count >= UINT_MAX / sizeof(UID))
551             return -1;
552         descriptor->sub_descriptors_refs = av_malloc(descriptor->sub_descriptors_count * sizeof(UID));
553         if (!descriptor->sub_descriptors_refs)
554             return -1;
555         url_fskip(pb, 4); /* useless size of objects, always 16 according to specs */
556         get_buffer(pb, (uint8_t *)descriptor->sub_descriptors_refs, descriptor->sub_descriptors_count * sizeof(UID));
557         break;
558     case 0x3004:
559         get_buffer(pb, descriptor->essence_container_ul, 16);
560         break;
561     case 0x3006:
562         descriptor->linked_track_id = get_be32(pb);
563         break;
564     case 0x3201: /* PictureEssenceCoding */
565         get_buffer(pb, descriptor->essence_codec_ul, 16);
566         break;
567     case 0x3203:
568         descriptor->width = get_be32(pb);
569         break;
570     case 0x3202:
571         descriptor->height = get_be32(pb);
572         break;
573     case 0x320E:
574         descriptor->aspect_ratio.num = get_be32(pb);
575         descriptor->aspect_ratio.den = get_be32(pb);
576         break;
577     case 0x3D03:
578         descriptor->sample_rate.num = get_be32(pb);
579         descriptor->sample_rate.den = get_be32(pb);
580         break;
581     case 0x3D06: /* SoundEssenceCompression */
582         get_buffer(pb, descriptor->essence_codec_ul, 16);
583         break;
584     case 0x3D07:
585         descriptor->channels = get_be32(pb);
586         break;
587     case 0x3D01:
588         descriptor->bits_per_sample = get_be32(pb);
589         break;
590     case 0x3401:
591         mxf_read_pixel_layout(pb, descriptor);
592         break;
593     default:
594         /* Private uid used by SONY C0023S01.mxf */
595         if (IS_KLV_KEY(uid, mxf_sony_mpeg4_extradata)) {
596             descriptor->extradata = av_malloc(size);
597             if (!descriptor->extradata)
598                 return -1;
599             descriptor->extradata_size = size;
600             get_buffer(pb, descriptor->extradata, size);
601         }
602         break;
603     }
604     return 0;
605 }
606
607 /*
608  * Match an uid independently of the version byte and up to len common bytes
609  * Returns: boolean
610  */
611 static int mxf_match_uid(const UID key, const UID uid, int len)
612 {
613     int i;
614     for (i = 0; i < len; i++) {
615         if (i != 7 && key[i] != uid[i])
616             return 0;
617     }
618     return 1;
619 }
620
621 static const MXFCodecUL *mxf_get_codec_ul(const MXFCodecUL *uls, UID *uid)
622 {
623     while (uls->uid[0]) {
624         if(mxf_match_uid(uls->uid, *uid, uls->matching_len))
625             break;
626         uls++;
627     }
628     return uls;
629 }
630
631 static void *mxf_resolve_strong_ref(MXFContext *mxf, UID *strong_ref, enum MXFMetadataSetType type)
632 {
633     int i;
634
635     if (!strong_ref)
636         return NULL;
637     for (i = 0; i < mxf->metadata_sets_count; i++) {
638         if (!memcmp(*strong_ref, mxf->metadata_sets[i]->uid, 16) &&
639             (type == AnyType || mxf->metadata_sets[i]->type == type)) {
640             return mxf->metadata_sets[i];
641         }
642     }
643     return NULL;
644 }
645
646 static const MXFCodecUL mxf_essence_container_uls[] = {
647     // video essence container uls
648     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x60,0x01 }, 14, CODEC_ID_MPEG2VIDEO }, /* MPEG-ES Frame wrapped */
649     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x02,0x41,0x01 }, 14,    CODEC_ID_DVVIDEO }, /* DV 625 25mbps */
650     // sound essence container uls
651     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x06,0x01,0x00 }, 14, CODEC_ID_PCM_S16LE }, /* BWF Frame wrapped */
652     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x40,0x01 }, 14,       CODEC_ID_MP2 }, /* MPEG-ES Frame wrapped, 0x40 ??? stream id */
653     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x01,0x01,0x01 }, 14, CODEC_ID_PCM_S16LE }, /* D-10 Mapping 50Mbps PAL Extended Template */
654     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      CODEC_ID_NONE },
655 };
656
657 static int mxf_parse_structural_metadata(MXFContext *mxf)
658 {
659     MXFPackage *material_package = NULL;
660     MXFPackage *temp_package = NULL;
661     int i, j, k;
662
663     dprintf(mxf->fc, "metadata sets count %d\n", mxf->metadata_sets_count);
664     /* TODO: handle multiple material packages (OP3x) */
665     for (i = 0; i < mxf->packages_count; i++) {
666         material_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[i], MaterialPackage);
667         if (material_package) break;
668     }
669     if (!material_package) {
670         av_log(mxf->fc, AV_LOG_ERROR, "no material package found\n");
671         return -1;
672     }
673
674     for (i = 0; i < material_package->tracks_count; i++) {
675         MXFPackage *source_package = NULL;
676         MXFTrack *material_track = NULL;
677         MXFTrack *source_track = NULL;
678         MXFTrack *temp_track = NULL;
679         MXFDescriptor *descriptor = NULL;
680         MXFStructuralComponent *component = NULL;
681         UID *essence_container_ul = NULL;
682         const MXFCodecUL *codec_ul = NULL;
683         const MXFCodecUL *container_ul = NULL;
684         AVStream *st;
685
686         if (!(material_track = mxf_resolve_strong_ref(mxf, &material_package->tracks_refs[i], Track))) {
687             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track strong ref\n");
688             continue;
689         }
690
691         if (!(material_track->sequence = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, Sequence))) {
692             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track sequence strong ref\n");
693             return -1;
694         }
695
696         /* TODO: handle multiple source clips */
697         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
698             /* TODO: handle timecode component */
699             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], SourceClip);
700             if (!component)
701                 continue;
702
703             for (k = 0; k < mxf->packages_count; k++) {
704                 temp_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[k], SourcePackage);
705                 if (!temp_package)
706                     continue;
707                 if (!memcmp(temp_package->package_uid, component->source_package_uid, 16)) {
708                     source_package = temp_package;
709                     break;
710                 }
711             }
712             if (!source_package) {
713                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source package found\n", material_track->track_id);
714                 break;
715             }
716             for (k = 0; k < source_package->tracks_count; k++) {
717                 if (!(temp_track = mxf_resolve_strong_ref(mxf, &source_package->tracks_refs[k], Track))) {
718                     av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track strong ref\n");
719                     return -1;
720                 }
721                 if (temp_track->track_id == component->source_track_id) {
722                     source_track = temp_track;
723                     break;
724                 }
725             }
726             if (!source_track) {
727                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source track found\n", material_track->track_id);
728                 break;
729             }
730         }
731         if (!source_track)
732             continue;
733
734         st = av_new_stream(mxf->fc, source_track->track_id);
735         if (!st) {
736             av_log(mxf->fc, AV_LOG_ERROR, "could not allocate stream\n");
737             return -1;
738         }
739         st->priv_data = source_track;
740         st->duration = component->duration;
741         if (st->duration == -1)
742             st->duration = AV_NOPTS_VALUE;
743         st->start_time = component->start_position;
744         av_set_pts_info(st, 64, material_track->edit_rate.num, material_track->edit_rate.den);
745
746         if (!(source_track->sequence = mxf_resolve_strong_ref(mxf, &source_track->sequence_ref, Sequence))) {
747             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track sequence strong ref\n");
748             return -1;
749         }
750
751         PRINT_KEY(mxf->fc, "data definition   ul", source_track->sequence->data_definition_ul);
752         codec_ul = mxf_get_codec_ul(ff_mxf_data_definition_uls, &source_track->sequence->data_definition_ul);
753         st->codec->codec_type = codec_ul->id;
754
755         source_package->descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor_ref, AnyType);
756         if (source_package->descriptor) {
757             if (source_package->descriptor->type == MultipleDescriptor) {
758                 for (j = 0; j < source_package->descriptor->sub_descriptors_count; j++) {
759                     MXFDescriptor *sub_descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor->sub_descriptors_refs[j], Descriptor);
760
761                     if (!sub_descriptor) {
762                         av_log(mxf->fc, AV_LOG_ERROR, "could not resolve sub descriptor strong ref\n");
763                         continue;
764                     }
765                     if (sub_descriptor->linked_track_id == source_track->track_id) {
766                         descriptor = sub_descriptor;
767                         break;
768                     }
769                 }
770             } else if (source_package->descriptor->type == Descriptor)
771                 descriptor = source_package->descriptor;
772         }
773         if (!descriptor) {
774             av_log(mxf->fc, AV_LOG_INFO, "source track %d: stream %d, no descriptor found\n", source_track->track_id, st->index);
775             continue;
776         }
777         PRINT_KEY(mxf->fc, "essence codec     ul", descriptor->essence_codec_ul);
778         PRINT_KEY(mxf->fc, "essence container ul", descriptor->essence_container_ul);
779         essence_container_ul = &descriptor->essence_container_ul;
780         /* HACK: replacing the original key with mxf_encrypted_essence_container
781          * is not allowed according to s429-6, try to find correct information anyway */
782         if (IS_KLV_KEY(essence_container_ul, mxf_encrypted_essence_container)) {
783             av_log(mxf->fc, AV_LOG_INFO, "broken encrypted mxf file\n");
784             for (k = 0; k < mxf->metadata_sets_count; k++) {
785                 MXFMetadataSet *metadata = mxf->metadata_sets[k];
786                 if (metadata->type == CryptoContext) {
787                     essence_container_ul = &((MXFCryptoContext *)metadata)->source_container_ul;
788                     break;
789                 }
790             }
791         }
792         /* TODO: drop PictureEssenceCoding and SoundEssenceCompression, only check EssenceContainer */
793         codec_ul = mxf_get_codec_ul(ff_mxf_codec_uls, &descriptor->essence_codec_ul);
794         st->codec->codec_id = codec_ul->id;
795         if (descriptor->extradata) {
796             st->codec->extradata = descriptor->extradata;
797             st->codec->extradata_size = descriptor->extradata_size;
798         }
799         if (st->codec->codec_type == CODEC_TYPE_VIDEO) {
800             container_ul = mxf_get_codec_ul(mxf_essence_container_uls, essence_container_ul);
801             if (st->codec->codec_id == CODEC_ID_NONE)
802                 st->codec->codec_id = container_ul->id;
803             st->codec->width = descriptor->width;
804             st->codec->height = descriptor->height;
805             st->codec->bits_per_coded_sample = descriptor->bits_per_sample; /* Uncompressed */
806             st->need_parsing = AVSTREAM_PARSE_HEADERS;
807         } else if (st->codec->codec_type == CODEC_TYPE_AUDIO) {
808             container_ul = mxf_get_codec_ul(mxf_essence_container_uls, essence_container_ul);
809             if (st->codec->codec_id == CODEC_ID_NONE)
810                 st->codec->codec_id = container_ul->id;
811             st->codec->channels = descriptor->channels;
812             st->codec->bits_per_coded_sample = descriptor->bits_per_sample;
813             st->codec->sample_rate = descriptor->sample_rate.num / descriptor->sample_rate.den;
814             /* TODO: implement CODEC_ID_RAWAUDIO */
815             if (st->codec->codec_id == CODEC_ID_PCM_S16LE) {
816                 if (descriptor->bits_per_sample == 24)
817                     st->codec->codec_id = CODEC_ID_PCM_S24LE;
818                 else if (descriptor->bits_per_sample == 32)
819                     st->codec->codec_id = CODEC_ID_PCM_S32LE;
820             } else if (st->codec->codec_id == CODEC_ID_PCM_S16BE) {
821                 if (descriptor->bits_per_sample == 24)
822                     st->codec->codec_id = CODEC_ID_PCM_S24BE;
823                 else if (descriptor->bits_per_sample == 32)
824                     st->codec->codec_id = CODEC_ID_PCM_S32BE;
825             } else if (st->codec->codec_id == CODEC_ID_MP2) {
826                 st->need_parsing = AVSTREAM_PARSE_FULL;
827             }
828         }
829         if (st->codec->codec_type != CODEC_TYPE_DATA && (*essence_container_ul)[15] > 0x01) {
830             av_log(mxf->fc, AV_LOG_WARNING, "only frame wrapped mappings are correctly supported\n");
831             st->need_parsing = AVSTREAM_PARSE_FULL;
832         }
833     }
834     return 0;
835 }
836
837 static const MXFMetadataReadTableEntry mxf_metadata_read_table[] = {
838     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x05,0x01,0x00 }, mxf_read_primer_pack },
839     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x18,0x00 }, mxf_read_content_storage, 0, AnyType },
840     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x37,0x00 }, mxf_read_source_package, sizeof(MXFPackage), SourcePackage },
841     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x36,0x00 }, mxf_read_material_package, sizeof(MXFPackage), MaterialPackage },
842     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x0F,0x00 }, mxf_read_sequence, sizeof(MXFSequence), Sequence },
843     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x11,0x00 }, mxf_read_source_clip, sizeof(MXFStructuralComponent), SourceClip },
844     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x44,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), MultipleDescriptor },
845     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x42,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Generic Sound */
846     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x28,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* CDCI */
847     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x29,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* RGBA */
848     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG 2 Video */
849     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x48,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Wave */
850     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x47,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* AES3 */
851     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3A,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Static Track */
852     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3B,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Generic Track */
853     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x04,0x01,0x02,0x02,0x00,0x00 }, mxf_read_cryptographic_context, sizeof(MXFCryptoContext), CryptoContext },
854     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x10,0x01,0x00 }, mxf_read_index_table_segment, sizeof(MXFIndexTableSegment), IndexTableSegment },
855     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 }, NULL, 0, AnyType },
856 };
857
858 static int mxf_read_local_tags(MXFContext *mxf, KLVPacket *klv, int (*read_child)(), int ctx_size, enum MXFMetadataSetType type)
859 {
860     ByteIOContext *pb = mxf->fc->pb;
861     MXFMetadataSet *ctx = ctx_size ? av_mallocz(ctx_size) : mxf;
862     uint64_t klv_end = url_ftell(pb) + klv->length;
863
864     if (!ctx)
865         return -1;
866     while (url_ftell(pb) + 4 < klv_end) {
867         int tag = get_be16(pb);
868         int size = get_be16(pb); /* KLV specified by 0x53 */
869         uint64_t next = url_ftell(pb) + size;
870         UID uid = {0};
871
872         dprintf(mxf->fc, "local tag %#04x size %d\n", tag, size);
873         if (!size) { /* ignore empty tag, needed for some files with empty UMID tag */
874             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x with 0 size\n", tag);
875             continue;
876         }
877         if (tag > 0x7FFF) { /* dynamic tag */
878             int i;
879             for (i = 0; i < mxf->local_tags_count; i++) {
880                 int local_tag = AV_RB16(mxf->local_tags+i*18);
881                 if (local_tag == tag) {
882                     memcpy(uid, mxf->local_tags+i*18+2, 16);
883                     dprintf(mxf->fc, "local tag %#04x\n", local_tag);
884                     PRINT_KEY(mxf->fc, "uid", uid);
885                 }
886             }
887         }
888         if (ctx_size && tag == 0x3C0A)
889             get_buffer(pb, ctx->uid, 16);
890         else if (read_child(ctx, pb, tag, size, uid) < 0)
891             return -1;
892
893         url_fseek(pb, next, SEEK_SET);
894     }
895     if (ctx_size) ctx->type = type;
896     return ctx_size ? mxf_add_metadata_set(mxf, ctx) : 0;
897 }
898
899 static int mxf_read_header(AVFormatContext *s, AVFormatParameters *ap)
900 {
901     MXFContext *mxf = s->priv_data;
902     KLVPacket klv;
903
904     if (!mxf_read_sync(s->pb, mxf_header_partition_pack_key, 14)) {
905         av_log(s, AV_LOG_ERROR, "could not find header partition pack key\n");
906         return -1;
907     }
908     url_fseek(s->pb, -14, SEEK_CUR);
909     mxf->fc = s;
910     while (!url_feof(s->pb)) {
911         const MXFMetadataReadTableEntry *metadata;
912
913         if (klv_read_packet(&klv, s->pb) < 0)
914             return -1;
915         PRINT_KEY(s, "read header", klv.key);
916         dprintf(s, "size %lld offset %#llx\n", klv.length, klv.offset);
917         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key) ||
918             IS_KLV_KEY(klv.key, mxf_essence_element_key)) {
919             /* FIXME avoid seek */
920             url_fseek(s->pb, klv.offset, SEEK_SET);
921             break;
922         }
923
924         for (metadata = mxf_metadata_read_table; metadata->read; metadata++) {
925             if (IS_KLV_KEY(klv.key, metadata->key)) {
926                 int (*read)() = klv.key[5] == 0x53 ? mxf_read_local_tags : metadata->read;
927                 if (read(mxf, &klv, metadata->read, metadata->ctx_size, metadata->type) < 0) {
928                     av_log(s, AV_LOG_ERROR, "error reading header metadata\n");
929                     return -1;
930                 }
931                 break;
932             }
933         }
934         if (!metadata->read)
935             url_fskip(s->pb, klv.length);
936     }
937     return mxf_parse_structural_metadata(mxf);
938 }
939
940 static int mxf_read_close(AVFormatContext *s)
941 {
942     MXFContext *mxf = s->priv_data;
943     int i;
944
945     av_freep(&mxf->packages_refs);
946     for (i = 0; i < mxf->metadata_sets_count; i++) {
947         switch (mxf->metadata_sets[i]->type) {
948         case MultipleDescriptor:
949             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->sub_descriptors_refs);
950             break;
951         case Sequence:
952             av_freep(&((MXFSequence *)mxf->metadata_sets[i])->structural_components_refs);
953             break;
954         case SourcePackage:
955         case MaterialPackage:
956             av_freep(&((MXFPackage *)mxf->metadata_sets[i])->tracks_refs);
957             break;
958         case Track:
959             mxf->metadata_sets[i] = NULL; /* will be freed later */
960             break;
961         default:
962             break;
963         }
964         av_freep(&mxf->metadata_sets[i]);
965     }
966     av_freep(&mxf->metadata_sets);
967     av_freep(&mxf->aesc);
968     av_freep(&mxf->local_tags);
969     return 0;
970 }
971
972 static int mxf_probe(AVProbeData *p) {
973     uint8_t *bufp = p->buf;
974     uint8_t *end = p->buf + p->buf_size;
975
976     if (p->buf_size < sizeof(mxf_header_partition_pack_key))
977         return 0;
978
979     /* Must skip Run-In Sequence and search for MXF header partition pack key SMPTE 377M 5.5 */
980     end -= sizeof(mxf_header_partition_pack_key);
981     for (; bufp < end; bufp++) {
982         if (IS_KLV_KEY(bufp, mxf_header_partition_pack_key))
983             return AVPROBE_SCORE_MAX;
984     }
985     return 0;
986 }
987
988 /* rudimentary byte seek */
989 /* XXX: use MXF Index */
990 static int mxf_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
991 {
992     AVStream *st = s->streams[stream_index];
993     int64_t seconds;
994
995     if (!s->bit_rate)
996         return -1;
997     if (sample_time < 0)
998         sample_time = 0;
999     seconds = av_rescale(sample_time, st->time_base.num, st->time_base.den);
1000     url_fseek(s->pb, (s->bit_rate * seconds) >> 3, SEEK_SET);
1001     av_update_cur_dts(s, st, sample_time);
1002     return 0;
1003 }
1004
1005 AVInputFormat mxf_demuxer = {
1006     "mxf",
1007     NULL_IF_CONFIG_SMALL("Material eXchange Format"),
1008     sizeof(MXFContext),
1009     mxf_probe,
1010     mxf_read_header,
1011     mxf_read_packet,
1012     mxf_read_close,
1013     mxf_read_seek,
1014 };