]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavcodec/vorbis_dec.c
optimize imdct_half:
[frescor/ffmpeg.git] / libavcodec / vorbis_dec.c
1 /**
2  * @file vorbis_dec.c
3  * Vorbis I decoder
4  * @author Denes Balatoni  ( dbalatoni programozo hu )
5
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #undef V_DEBUG
24 //#define V_DEBUG
25 //#define AV_DEBUG(...) av_log(NULL, AV_LOG_INFO, __VA_ARGS__)
26
27 #include <math.h>
28
29 #define ALT_BITSTREAM_READER_LE
30 #include "avcodec.h"
31 #include "bitstream.h"
32 #include "dsputil.h"
33
34 #include "vorbis.h"
35 #include "xiph.h"
36
37 #define V_NB_BITS 8
38 #define V_NB_BITS2 11
39 #define V_MAX_VLCS (1<<16)
40
41 #ifndef V_DEBUG
42 #define AV_DEBUG(...)
43 #endif
44
45 #undef NDEBUG
46 #include <assert.h>
47
48 typedef struct {
49     uint_fast8_t dimensions;
50     uint_fast8_t lookup_type;
51     uint_fast8_t maxdepth;
52     VLC vlc;
53     float *codevectors;
54     unsigned int nb_bits;
55 } vorbis_codebook;
56
57 typedef union vorbis_floor_u vorbis_floor_data;
58 typedef struct vorbis_floor0_s vorbis_floor0;
59 typedef struct vorbis_floor1_s vorbis_floor1;
60 struct vorbis_context_s;
61 typedef
62 uint_fast8_t (* vorbis_floor_decode_func)
63              (struct vorbis_context_s *, vorbis_floor_data *, float *);
64 typedef struct {
65     uint_fast8_t floor_type;
66     vorbis_floor_decode_func decode;
67     union vorbis_floor_u
68     {
69         struct vorbis_floor0_s
70         {
71             uint_fast8_t order;
72             uint_fast16_t rate;
73             uint_fast16_t bark_map_size;
74             int_fast32_t * map[2];
75             uint_fast32_t map_size[2];
76             uint_fast8_t amplitude_bits;
77             uint_fast8_t amplitude_offset;
78             uint_fast8_t num_books;
79             uint_fast8_t * book_list;
80             float * lsp;
81         } t0;
82         struct vorbis_floor1_s
83         {
84             uint_fast8_t partitions;
85             uint_fast8_t maximum_class;
86             uint_fast8_t partition_class[32];
87             uint_fast8_t class_dimensions[16];
88             uint_fast8_t class_subclasses[16];
89             uint_fast8_t class_masterbook[16];
90             int_fast16_t subclass_books[16][8];
91             uint_fast8_t multiplier;
92             uint_fast16_t x_list_dim;
93             floor1_entry_t * list;
94         } t1;
95     } data;
96 } vorbis_floor;
97
98 typedef struct {
99     uint_fast16_t type;
100     uint_fast32_t begin;
101     uint_fast32_t end;
102     uint_fast32_t partition_size;
103     uint_fast8_t classifications;
104     uint_fast8_t classbook;
105     int_fast16_t books[64][8];
106     uint_fast8_t maxpass;
107 } vorbis_residue;
108
109 typedef struct {
110     uint_fast8_t submaps;
111     uint_fast16_t coupling_steps;
112     uint_fast8_t *magnitude;
113     uint_fast8_t *angle;
114     uint_fast8_t *mux;
115     uint_fast8_t submap_floor[16];
116     uint_fast8_t submap_residue[16];
117 } vorbis_mapping;
118
119 typedef struct {
120     uint_fast8_t blockflag;
121     uint_fast16_t windowtype;
122     uint_fast16_t transformtype;
123     uint_fast8_t mapping;
124 } vorbis_mode;
125
126 typedef struct vorbis_context_s {
127     AVCodecContext *avccontext;
128     GetBitContext gb;
129     DSPContext dsp;
130
131     MDCTContext mdct[2];
132     uint_fast8_t first_frame;
133     uint_fast32_t version;
134     uint_fast8_t audio_channels;
135     uint_fast32_t audio_samplerate;
136     uint_fast32_t bitrate_maximum;
137     uint_fast32_t bitrate_nominal;
138     uint_fast32_t bitrate_minimum;
139     uint_fast32_t blocksize[2];
140     const float * win[2];
141     uint_fast16_t codebook_count;
142     vorbis_codebook *codebooks;
143     uint_fast8_t floor_count;
144     vorbis_floor *floors;
145     uint_fast8_t residue_count;
146     vorbis_residue *residues;
147     uint_fast8_t mapping_count;
148     vorbis_mapping *mappings;
149     uint_fast8_t mode_count;
150     vorbis_mode *modes;
151     uint_fast8_t mode_number; // mode number for the current packet
152     uint_fast8_t previous_window;
153     float *channel_residues;
154     float *channel_floors;
155     float *saved;
156     uint_fast32_t add_bias; // for float->int conversion
157     uint_fast32_t exp_bias;
158 } vorbis_context;
159
160 /* Helper functions */
161
162 #define BARK(x) \
163     (13.1f*atan(0.00074f*(x))+2.24f*atan(1.85e-8f*(x)*(x))+1e-4f*(x))
164
165 static float vorbisfloat2float(uint_fast32_t val) {
166     double mant=val&0x1fffff;
167     long exp=(val&0x7fe00000L)>>21;
168     if (val&0x80000000) mant=-mant;
169     return ldexp(mant, exp - 20 - 768);
170 }
171
172
173 // Free all allocated memory -----------------------------------------
174
175 static void vorbis_free(vorbis_context *vc) {
176     int_fast16_t i;
177
178     av_freep(&vc->channel_residues);
179     av_freep(&vc->channel_floors);
180     av_freep(&vc->saved);
181
182     av_freep(&vc->residues);
183     av_freep(&vc->modes);
184
185     ff_mdct_end(&vc->mdct[0]);
186     ff_mdct_end(&vc->mdct[1]);
187
188     for(i=0;i<vc->codebook_count;++i) {
189         av_free(vc->codebooks[i].codevectors);
190         free_vlc(&vc->codebooks[i].vlc);
191     }
192     av_freep(&vc->codebooks);
193
194     for(i=0;i<vc->floor_count;++i) {
195         if(vc->floors[i].floor_type==0) {
196             av_free(vc->floors[i].data.t0.map[0]);
197             av_free(vc->floors[i].data.t0.map[1]);
198             av_free(vc->floors[i].data.t0.book_list);
199             av_free(vc->floors[i].data.t0.lsp);
200         }
201         else {
202             av_free(vc->floors[i].data.t1.list);
203         }
204     }
205     av_freep(&vc->floors);
206
207     for(i=0;i<vc->mapping_count;++i) {
208         av_free(vc->mappings[i].magnitude);
209         av_free(vc->mappings[i].angle);
210         av_free(vc->mappings[i].mux);
211     }
212     av_freep(&vc->mappings);
213
214     if(vc->exp_bias){
215         av_freep(&vc->win[0]);
216         av_freep(&vc->win[1]);
217     }
218 }
219
220 // Parse setup header -------------------------------------------------
221
222 // Process codebooks part
223
224 static int vorbis_parse_setup_hdr_codebooks(vorbis_context *vc) {
225     uint_fast16_t cb;
226     uint8_t *tmp_vlc_bits;
227     uint32_t *tmp_vlc_codes;
228     GetBitContext *gb=&vc->gb;
229
230     vc->codebook_count=get_bits(gb,8)+1;
231
232     AV_DEBUG(" Codebooks: %d \n", vc->codebook_count);
233
234     vc->codebooks=av_mallocz(vc->codebook_count * sizeof(vorbis_codebook));
235     tmp_vlc_bits =av_mallocz(V_MAX_VLCS * sizeof(uint8_t));
236     tmp_vlc_codes=av_mallocz(V_MAX_VLCS * sizeof(uint32_t));
237
238     for(cb=0;cb<vc->codebook_count;++cb) {
239         vorbis_codebook *codebook_setup=&vc->codebooks[cb];
240         uint_fast8_t ordered;
241         uint_fast32_t t, used_entries=0;
242         uint_fast32_t entries;
243
244         AV_DEBUG(" %d. Codebook \n", cb);
245
246         if (get_bits(gb, 24)!=0x564342) {
247             av_log(vc->avccontext, AV_LOG_ERROR, " %"PRIdFAST16". Codebook setup data corrupt. \n", cb);
248             goto error;
249         }
250
251         codebook_setup->dimensions=get_bits(gb, 16);
252         if (codebook_setup->dimensions>16) {
253             av_log(vc->avccontext, AV_LOG_ERROR, " %"PRIdFAST16". Codebook's dimension is too large (%d). \n", cb, codebook_setup->dimensions);
254             goto error;
255         }
256         entries=get_bits(gb, 24);
257         if (entries>V_MAX_VLCS) {
258             av_log(vc->avccontext, AV_LOG_ERROR, " %"PRIdFAST16". Codebook has too many entries (%"PRIdFAST32"). \n", cb, entries);
259             goto error;
260         }
261
262         ordered=get_bits1(gb);
263
264         AV_DEBUG(" codebook_dimensions %d, codebook_entries %d \n", codebook_setup->dimensions, entries);
265
266         if (!ordered) {
267             uint_fast16_t ce;
268             uint_fast8_t flag;
269             uint_fast8_t sparse=get_bits1(gb);
270
271             AV_DEBUG(" not ordered \n");
272
273             if (sparse) {
274                 AV_DEBUG(" sparse \n");
275
276                 used_entries=0;
277                 for(ce=0;ce<entries;++ce) {
278                     flag=get_bits1(gb);
279                     if (flag) {
280                         tmp_vlc_bits[ce]=get_bits(gb, 5)+1;
281                         ++used_entries;
282                     }
283                     else tmp_vlc_bits[ce]=0;
284                 }
285             } else {
286                 AV_DEBUG(" not sparse \n");
287
288                 used_entries=entries;
289                 for(ce=0;ce<entries;++ce) {
290                     tmp_vlc_bits[ce]=get_bits(gb, 5)+1;
291                 }
292             }
293         } else {
294             uint_fast16_t current_entry=0;
295             uint_fast8_t current_length=get_bits(gb, 5)+1;
296
297             AV_DEBUG(" ordered, current length: %d \n", current_length);  //FIXME
298
299             used_entries=entries;
300             for(;current_entry<used_entries;++current_length) {
301                 uint_fast16_t i, number;
302
303                 AV_DEBUG(" number bits: %d ", ilog(entries - current_entry));
304
305                 number=get_bits(gb, ilog(entries - current_entry));
306
307                 AV_DEBUG(" number: %d \n", number);
308
309                 for(i=current_entry;i<number+current_entry;++i) {
310                     if (i<used_entries) tmp_vlc_bits[i]=current_length;
311                 }
312
313                 current_entry+=number;
314             }
315             if (current_entry>used_entries) {
316                 av_log(vc->avccontext, AV_LOG_ERROR, " More codelengths than codes in codebook. \n");
317                 goto error;
318             }
319         }
320
321         codebook_setup->lookup_type=get_bits(gb, 4);
322
323         AV_DEBUG(" lookup type: %d : %s \n", codebook_setup->lookup_type, codebook_setup->lookup_type ? "vq" : "no lookup" );
324
325 // If the codebook is used for (inverse) VQ, calculate codevectors.
326
327         if (codebook_setup->lookup_type==1) {
328             uint_fast16_t i, j, k;
329             uint_fast16_t codebook_lookup_values=ff_vorbis_nth_root(entries, codebook_setup->dimensions);
330             uint_fast16_t codebook_multiplicands[codebook_lookup_values];
331
332             float codebook_minimum_value=vorbisfloat2float(get_bits_long(gb, 32));
333             float codebook_delta_value=vorbisfloat2float(get_bits_long(gb, 32));
334             uint_fast8_t codebook_value_bits=get_bits(gb, 4)+1;
335             uint_fast8_t codebook_sequence_p=get_bits1(gb);
336
337             AV_DEBUG(" We expect %d numbers for building the codevectors. \n", codebook_lookup_values);
338             AV_DEBUG("  delta %f minmum %f \n", codebook_delta_value, codebook_minimum_value);
339
340             for(i=0;i<codebook_lookup_values;++i) {
341                 codebook_multiplicands[i]=get_bits(gb, codebook_value_bits);
342
343                 AV_DEBUG(" multiplicands*delta+minmum : %e \n", (float)codebook_multiplicands[i]*codebook_delta_value+codebook_minimum_value);
344                 AV_DEBUG(" multiplicand %d \n", codebook_multiplicands[i]);
345             }
346
347 // Weed out unused vlcs and build codevector vector
348             codebook_setup->codevectors=used_entries ? av_mallocz(used_entries*codebook_setup->dimensions * sizeof(float)) : NULL;
349             for(j=0, i=0;i<entries;++i) {
350                 uint_fast8_t dim=codebook_setup->dimensions;
351
352                 if (tmp_vlc_bits[i]) {
353                     float last=0.0;
354                     uint_fast32_t lookup_offset=i;
355
356 #ifdef V_DEBUG
357                     av_log(vc->avccontext, AV_LOG_INFO, "Lookup offset %d ,", i);
358 #endif
359
360                     for(k=0;k<dim;++k) {
361                         uint_fast32_t multiplicand_offset = lookup_offset % codebook_lookup_values;
362                         codebook_setup->codevectors[j*dim+k]=codebook_multiplicands[multiplicand_offset]*codebook_delta_value+codebook_minimum_value+last;
363                         if (codebook_sequence_p) {
364                             last=codebook_setup->codevectors[j*dim+k];
365                         }
366                         lookup_offset/=codebook_lookup_values;
367                     }
368                     tmp_vlc_bits[j]=tmp_vlc_bits[i];
369
370 #ifdef V_DEBUG
371                     av_log(vc->avccontext, AV_LOG_INFO, "real lookup offset %d, vector: ", j);
372                     for(k=0;k<dim;++k) {
373                         av_log(vc->avccontext, AV_LOG_INFO, " %f ", codebook_setup->codevectors[j*dim+k]);
374                     }
375                     av_log(vc->avccontext, AV_LOG_INFO, "\n");
376 #endif
377
378                     ++j;
379                 }
380             }
381             if (j!=used_entries) {
382                 av_log(vc->avccontext, AV_LOG_ERROR, "Bug in codevector vector building code. \n");
383                 goto error;
384             }
385             entries=used_entries;
386         }
387         else if (codebook_setup->lookup_type>=2) {
388             av_log(vc->avccontext, AV_LOG_ERROR, "Codebook lookup type not supported. \n");
389             goto error;
390         }
391
392 // Initialize VLC table
393         if (ff_vorbis_len2vlc(tmp_vlc_bits, tmp_vlc_codes, entries)) {
394             av_log(vc->avccontext, AV_LOG_ERROR, " Invalid code lengths while generating vlcs. \n");
395             goto error;
396         }
397         codebook_setup->maxdepth=0;
398         for(t=0;t<entries;++t)
399             if (tmp_vlc_bits[t]>=codebook_setup->maxdepth) codebook_setup->maxdepth=tmp_vlc_bits[t];
400
401         if(codebook_setup->maxdepth > 3*V_NB_BITS) codebook_setup->nb_bits=V_NB_BITS2;
402         else                                       codebook_setup->nb_bits=V_NB_BITS;
403
404         codebook_setup->maxdepth=(codebook_setup->maxdepth+codebook_setup->nb_bits-1)/codebook_setup->nb_bits;
405
406         if (init_vlc(&codebook_setup->vlc, codebook_setup->nb_bits, entries, tmp_vlc_bits, sizeof(*tmp_vlc_bits), sizeof(*tmp_vlc_bits), tmp_vlc_codes, sizeof(*tmp_vlc_codes), sizeof(*tmp_vlc_codes), INIT_VLC_LE)) {
407             av_log(vc->avccontext, AV_LOG_ERROR, " Error generating vlc tables. \n");
408             goto error;
409         }
410     }
411
412     av_free(tmp_vlc_bits);
413     av_free(tmp_vlc_codes);
414     return 0;
415
416 // Error:
417 error:
418     av_free(tmp_vlc_bits);
419     av_free(tmp_vlc_codes);
420     return 1;
421 }
422
423 // Process time domain transforms part (unused in Vorbis I)
424
425 static int vorbis_parse_setup_hdr_tdtransforms(vorbis_context *vc) {
426     GetBitContext *gb=&vc->gb;
427     uint_fast8_t i;
428     uint_fast8_t vorbis_time_count=get_bits(gb, 6)+1;
429
430     for(i=0;i<vorbis_time_count;++i) {
431         uint_fast16_t vorbis_tdtransform=get_bits(gb, 16);
432
433         AV_DEBUG(" Vorbis time domain transform %d: %d \n", vorbis_time_count, vorbis_tdtransform);
434
435         if (vorbis_tdtransform) {
436             av_log(vc->avccontext, AV_LOG_ERROR, "Vorbis time domain transform data nonzero. \n");
437             return 1;
438         }
439     }
440     return 0;
441 }
442
443 // Process floors part
444
445 static uint_fast8_t vorbis_floor0_decode(vorbis_context *vc,
446                                          vorbis_floor_data *vfu, float *vec);
447 static void create_map( vorbis_context * vc, uint_fast8_t floor_number );
448 static uint_fast8_t vorbis_floor1_decode(vorbis_context *vc,
449                                          vorbis_floor_data *vfu, float *vec);
450 static int vorbis_parse_setup_hdr_floors(vorbis_context *vc) {
451     GetBitContext *gb=&vc->gb;
452     uint_fast16_t i,j,k;
453
454     vc->floor_count=get_bits(gb, 6)+1;
455
456     vc->floors=av_mallocz(vc->floor_count * sizeof(vorbis_floor));
457
458     for (i=0;i<vc->floor_count;++i) {
459         vorbis_floor *floor_setup=&vc->floors[i];
460
461         floor_setup->floor_type=get_bits(gb, 16);
462
463         AV_DEBUG(" %d. floor type %d \n", i, floor_setup->floor_type);
464
465         if (floor_setup->floor_type==1) {
466             uint_fast8_t maximum_class=0;
467             uint_fast8_t rangebits;
468             uint_fast16_t floor1_values=2;
469
470             floor_setup->decode=vorbis_floor1_decode;
471
472             floor_setup->data.t1.partitions=get_bits(gb, 5);
473
474             AV_DEBUG(" %d.floor: %d partitions \n", i, floor_setup->data.t1.partitions);
475
476             for(j=0;j<floor_setup->data.t1.partitions;++j) {
477                 floor_setup->data.t1.partition_class[j]=get_bits(gb, 4);
478                 if (floor_setup->data.t1.partition_class[j]>maximum_class) maximum_class=floor_setup->data.t1.partition_class[j];
479
480                 AV_DEBUG(" %d. floor %d partition class %d \n", i, j, floor_setup->data.t1.partition_class[j]);
481
482             }
483
484             AV_DEBUG(" maximum class %d \n", maximum_class);
485
486             floor_setup->data.t1.maximum_class=maximum_class;
487
488             for(j=0;j<=maximum_class;++j) {
489                 floor_setup->data.t1.class_dimensions[j]=get_bits(gb, 3)+1;
490                 floor_setup->data.t1.class_subclasses[j]=get_bits(gb, 2);
491
492                 AV_DEBUG(" %d floor %d class dim: %d subclasses %d \n", i, j, floor_setup->data.t1.class_dimensions[j], floor_setup->data.t1.class_subclasses[j]);
493
494                 if (floor_setup->data.t1.class_subclasses[j]) {
495                     floor_setup->data.t1.class_masterbook[j]=get_bits(gb, 8);
496
497                     AV_DEBUG("   masterbook: %d \n", floor_setup->data.t1.class_masterbook[j]);
498                 }
499
500                 for(k=0;k<(1<<floor_setup->data.t1.class_subclasses[j]);++k) {
501                     floor_setup->data.t1.subclass_books[j][k]=(int16_t)get_bits(gb, 8)-1;
502
503                     AV_DEBUG("    book %d. : %d \n", k, floor_setup->data.t1.subclass_books[j][k]);
504                 }
505             }
506
507             floor_setup->data.t1.multiplier=get_bits(gb, 2)+1;
508             floor_setup->data.t1.x_list_dim=2;
509
510             for(j=0;j<floor_setup->data.t1.partitions;++j) {
511                 floor_setup->data.t1.x_list_dim+=floor_setup->data.t1.class_dimensions[floor_setup->data.t1.partition_class[j]];
512             }
513
514             floor_setup->data.t1.list=av_mallocz(floor_setup->data.t1.x_list_dim * sizeof(floor1_entry_t));
515
516
517             rangebits=get_bits(gb, 4);
518             floor_setup->data.t1.list[0].x = 0;
519             floor_setup->data.t1.list[1].x = (1<<rangebits);
520
521             for(j=0;j<floor_setup->data.t1.partitions;++j) {
522                 for(k=0;k<floor_setup->data.t1.class_dimensions[floor_setup->data.t1.partition_class[j]];++k,++floor1_values) {
523                     floor_setup->data.t1.list[floor1_values].x=get_bits(gb, rangebits);
524
525                     AV_DEBUG(" %d. floor1 Y coord. %d \n", floor1_values, floor_setup->data.t1.list[floor1_values].x);
526                 }
527             }
528
529 // Precalculate order of x coordinates - needed for decode
530             ff_vorbis_ready_floor1_list(floor_setup->data.t1.list, floor_setup->data.t1.x_list_dim);
531         }
532         else if(floor_setup->floor_type==0) {
533             uint_fast8_t max_codebook_dim=0;
534
535             floor_setup->decode=vorbis_floor0_decode;
536
537             floor_setup->data.t0.order=get_bits(gb, 8);
538             floor_setup->data.t0.rate=get_bits(gb, 16);
539             floor_setup->data.t0.bark_map_size=get_bits(gb, 16);
540             floor_setup->data.t0.amplitude_bits=get_bits(gb, 6);
541             /* zero would result in a div by zero later *
542              * 2^0 - 1 == 0                             */
543             if (floor_setup->data.t0.amplitude_bits == 0) {
544               av_log(vc->avccontext, AV_LOG_ERROR,
545                      "Floor 0 amplitude bits is 0.\n");
546               return 1;
547             }
548             floor_setup->data.t0.amplitude_offset=get_bits(gb, 8);
549             floor_setup->data.t0.num_books=get_bits(gb, 4)+1;
550
551             /* allocate mem for booklist */
552             floor_setup->data.t0.book_list=
553                 av_malloc(floor_setup->data.t0.num_books);
554             if(!floor_setup->data.t0.book_list) { return 1; }
555             /* read book indexes */
556             {
557                 int idx;
558                 uint_fast8_t book_idx;
559                 for (idx=0;idx<floor_setup->data.t0.num_books;++idx) {
560                     book_idx=get_bits(gb, 8);
561                     floor_setup->data.t0.book_list[idx]=book_idx;
562                     if (vc->codebooks[book_idx].dimensions > max_codebook_dim)
563                         max_codebook_dim=vc->codebooks[book_idx].dimensions;
564
565                     if (floor_setup->data.t0.book_list[idx]>vc->codebook_count)
566                         return 1;
567                 }
568             }
569
570             create_map( vc, i );
571
572             /* allocate mem for lsp coefficients */
573             {
574                 /* codebook dim is for padding if codebook dim doesn't *
575                  * divide order+1 then we need to read more data       */
576                 floor_setup->data.t0.lsp=
577                     av_malloc((floor_setup->data.t0.order+1 + max_codebook_dim)
578                               * sizeof(float));
579                 if(!floor_setup->data.t0.lsp) { return 1; }
580             }
581
582 #ifdef V_DEBUG /* debug output parsed headers */
583             AV_DEBUG("floor0 order: %u\n", floor_setup->data.t0.order);
584             AV_DEBUG("floor0 rate: %u\n", floor_setup->data.t0.rate);
585             AV_DEBUG("floor0 bark map size: %u\n",
586               floor_setup->data.t0.bark_map_size);
587             AV_DEBUG("floor0 amplitude bits: %u\n",
588               floor_setup->data.t0.amplitude_bits);
589             AV_DEBUG("floor0 amplitude offset: %u\n",
590               floor_setup->data.t0.amplitude_offset);
591             AV_DEBUG("floor0 number of books: %u\n",
592               floor_setup->data.t0.num_books);
593             AV_DEBUG("floor0 book list pointer: %p\n",
594               floor_setup->data.t0.book_list);
595             {
596               int idx;
597               for (idx=0;idx<floor_setup->data.t0.num_books;++idx) {
598                 AV_DEBUG( "  Book %d: %u\n",
599                   idx+1,
600                   floor_setup->data.t0.book_list[idx] );
601               }
602             }
603 #endif
604         }
605         else {
606             av_log(vc->avccontext, AV_LOG_ERROR, "Invalid floor type!\n");
607             return 1;
608         }
609     }
610     return 0;
611 }
612
613 // Process residues part
614
615 static int vorbis_parse_setup_hdr_residues(vorbis_context *vc){
616     GetBitContext *gb=&vc->gb;
617     uint_fast8_t i, j, k;
618
619     vc->residue_count=get_bits(gb, 6)+1;
620     vc->residues=av_mallocz(vc->residue_count * sizeof(vorbis_residue));
621
622     AV_DEBUG(" There are %d residues. \n", vc->residue_count);
623
624     for(i=0;i<vc->residue_count;++i) {
625         vorbis_residue *res_setup=&vc->residues[i];
626         uint_fast8_t cascade[64];
627         uint_fast8_t high_bits;
628         uint_fast8_t low_bits;
629
630         res_setup->type=get_bits(gb, 16);
631
632         AV_DEBUG(" %d. residue type %d \n", i, res_setup->type);
633
634         res_setup->begin=get_bits(gb, 24);
635         res_setup->end=get_bits(gb, 24);
636         res_setup->partition_size=get_bits(gb, 24)+1;
637         res_setup->classifications=get_bits(gb, 6)+1;
638         res_setup->classbook=get_bits(gb, 8);
639
640         AV_DEBUG("    begin %d end %d part.size %d classif.s %d classbook %d \n", res_setup->begin, res_setup->end, res_setup->partition_size,
641           res_setup->classifications, res_setup->classbook);
642
643         for(j=0;j<res_setup->classifications;++j) {
644             high_bits=0;
645             low_bits=get_bits(gb, 3);
646             if (get_bits1(gb)) {
647                 high_bits=get_bits(gb, 5);
648             }
649             cascade[j]=(high_bits<<3)+low_bits;
650
651             AV_DEBUG("     %d class casscade depth: %d \n", j, ilog(cascade[j]));
652         }
653
654         res_setup->maxpass=0;
655         for(j=0;j<res_setup->classifications;++j) {
656             for(k=0;k<8;++k) {
657                 if (cascade[j]&(1<<k)) {
658                         res_setup->books[j][k]=get_bits(gb, 8);
659
660                     AV_DEBUG("     %d class casscade depth %d book: %d \n", j, k, res_setup->books[j][k]);
661
662                     if (k>res_setup->maxpass) {
663                         res_setup->maxpass=k;
664                     }
665                 } else {
666                     res_setup->books[j][k]=-1;
667                 }
668             }
669         }
670     }
671     return 0;
672 }
673
674 // Process mappings part
675
676 static int vorbis_parse_setup_hdr_mappings(vorbis_context *vc) {
677     GetBitContext *gb=&vc->gb;
678     uint_fast8_t i, j;
679
680     vc->mapping_count=get_bits(gb, 6)+1;
681     vc->mappings=av_mallocz(vc->mapping_count * sizeof(vorbis_mapping));
682
683     AV_DEBUG(" There are %d mappings. \n", vc->mapping_count);
684
685     for(i=0;i<vc->mapping_count;++i) {
686         vorbis_mapping *mapping_setup=&vc->mappings[i];
687
688         if (get_bits(gb, 16)) {
689             av_log(vc->avccontext, AV_LOG_ERROR, "Other mappings than type 0 are not compliant with the Vorbis I specification. \n");
690             return 1;
691         }
692         if (get_bits1(gb)) {
693             mapping_setup->submaps=get_bits(gb, 4)+1;
694         } else {
695             mapping_setup->submaps=1;
696         }
697
698         if (get_bits1(gb)) {
699             mapping_setup->coupling_steps=get_bits(gb, 8)+1;
700             mapping_setup->magnitude=av_mallocz(mapping_setup->coupling_steps * sizeof(uint_fast8_t));
701             mapping_setup->angle    =av_mallocz(mapping_setup->coupling_steps * sizeof(uint_fast8_t));
702             for(j=0;j<mapping_setup->coupling_steps;++j) {
703                 mapping_setup->magnitude[j]=get_bits(gb, ilog(vc->audio_channels-1));
704                 mapping_setup->angle[j]=get_bits(gb, ilog(vc->audio_channels-1));
705                 // FIXME: sanity checks
706             }
707         } else {
708             mapping_setup->coupling_steps=0;
709         }
710
711         AV_DEBUG("   %d mapping coupling steps: %d \n", i, mapping_setup->coupling_steps);
712
713         if(get_bits(gb, 2)) {
714             av_log(vc->avccontext, AV_LOG_ERROR, "%d. mapping setup data invalid. \n", i);
715             return 1; // following spec.
716         }
717
718         if (mapping_setup->submaps>1) {
719             mapping_setup->mux=av_mallocz(vc->audio_channels * sizeof(uint_fast8_t));
720             for(j=0;j<vc->audio_channels;++j) {
721                 mapping_setup->mux[j]=get_bits(gb, 4);
722             }
723         }
724
725         for(j=0;j<mapping_setup->submaps;++j) {
726             skip_bits(gb, 8); // FIXME check?
727             mapping_setup->submap_floor[j]=get_bits(gb, 8);
728             mapping_setup->submap_residue[j]=get_bits(gb, 8);
729
730             AV_DEBUG("   %d mapping %d submap : floor %d, residue %d \n", i, j, mapping_setup->submap_floor[j], mapping_setup->submap_residue[j]);
731         }
732     }
733     return 0;
734 }
735
736 // Process modes part
737
738 static void create_map( vorbis_context * vc, uint_fast8_t floor_number )
739 {
740     vorbis_floor * floors=vc->floors;
741     vorbis_floor0 * vf;
742     int idx;
743     int_fast8_t blockflag;
744     int_fast32_t * map;
745     int_fast32_t n; //TODO: could theoretically be smaller?
746
747     for (blockflag=0;blockflag<2;++blockflag)
748     {
749     n=vc->blocksize[blockflag]/2;
750     floors[floor_number].data.t0.map[blockflag]=
751         av_malloc((n+1) * sizeof(int_fast32_t)); // n+sentinel
752
753     map=floors[floor_number].data.t0.map[blockflag];
754     vf=&floors[floor_number].data.t0;
755
756     for (idx=0; idx<n;++idx) {
757         map[idx]=floor( BARK((vf->rate*idx)/(2.0f*n)) *
758                               ((vf->bark_map_size)/
759                                BARK(vf->rate/2.0f )) );
760         if (vf->bark_map_size-1 < map[idx]) {
761             map[idx]=vf->bark_map_size-1;
762         }
763     }
764     map[n]=-1;
765     vf->map_size[blockflag]=n;
766     }
767
768 #   ifdef V_DEBUG
769     for(idx=0;idx<=n;++idx) {
770         AV_DEBUG("floor0 map: map at pos %d is %d\n",
771                  idx, map[idx]);
772     }
773 #   endif
774 }
775
776 static int vorbis_parse_setup_hdr_modes(vorbis_context *vc) {
777     GetBitContext *gb=&vc->gb;
778     uint_fast8_t i;
779
780     vc->mode_count=get_bits(gb, 6)+1;
781     vc->modes=av_mallocz(vc->mode_count * sizeof(vorbis_mode));
782
783     AV_DEBUG(" There are %d modes.\n", vc->mode_count);
784
785     for(i=0;i<vc->mode_count;++i) {
786         vorbis_mode *mode_setup=&vc->modes[i];
787
788         mode_setup->blockflag=get_bits1(gb);
789         mode_setup->windowtype=get_bits(gb, 16); //FIXME check
790         mode_setup->transformtype=get_bits(gb, 16); //FIXME check
791         mode_setup->mapping=get_bits(gb, 8); //FIXME check
792
793         AV_DEBUG(" %d mode: blockflag %d, windowtype %d, transformtype %d, mapping %d \n", i, mode_setup->blockflag, mode_setup->windowtype, mode_setup->transformtype, mode_setup->mapping);
794     }
795     return 0;
796 }
797
798 // Process the whole setup header using the functions above
799
800 static int vorbis_parse_setup_hdr(vorbis_context *vc) {
801     GetBitContext *gb=&vc->gb;
802
803     if ((get_bits(gb, 8)!='v') || (get_bits(gb, 8)!='o') ||
804     (get_bits(gb, 8)!='r') || (get_bits(gb, 8)!='b') ||
805     (get_bits(gb, 8)!='i') || (get_bits(gb, 8)!='s')) {
806         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (no vorbis signature). \n");
807         return 1;
808     }
809
810     if (vorbis_parse_setup_hdr_codebooks(vc)) {
811         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (codebooks). \n");
812         return 2;
813     }
814     if (vorbis_parse_setup_hdr_tdtransforms(vc)) {
815         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (time domain transforms). \n");
816         return 3;
817     }
818     if (vorbis_parse_setup_hdr_floors(vc)) {
819         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (floors). \n");
820         return 4;
821     }
822     if (vorbis_parse_setup_hdr_residues(vc)) {
823         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (residues). \n");
824         return 5;
825     }
826     if (vorbis_parse_setup_hdr_mappings(vc)) {
827         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (mappings). \n");
828         return 6;
829     }
830     if (vorbis_parse_setup_hdr_modes(vc)) {
831         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (modes). \n");
832         return 7;
833     }
834     if (!get_bits1(gb)) {
835         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis setup header packet corrupt (framing flag). \n");
836         return 8; // framing flag bit unset error
837     }
838
839     return 0;
840 }
841
842 // Process the identification header
843
844 static int vorbis_parse_id_hdr(vorbis_context *vc){
845     GetBitContext *gb=&vc->gb;
846     uint_fast8_t bl0, bl1;
847
848     if ((get_bits(gb, 8)!='v') || (get_bits(gb, 8)!='o') ||
849     (get_bits(gb, 8)!='r') || (get_bits(gb, 8)!='b') ||
850     (get_bits(gb, 8)!='i') || (get_bits(gb, 8)!='s')) {
851         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis id header packet corrupt (no vorbis signature). \n");
852         return 1;
853     }
854
855     vc->version=get_bits_long(gb, 32);    //FIXME check 0
856     vc->audio_channels=get_bits(gb, 8);   //FIXME check >0
857     vc->audio_samplerate=get_bits_long(gb, 32);   //FIXME check >0
858     vc->bitrate_maximum=get_bits_long(gb, 32);
859     vc->bitrate_nominal=get_bits_long(gb, 32);
860     vc->bitrate_minimum=get_bits_long(gb, 32);
861     bl0=get_bits(gb, 4);
862     bl1=get_bits(gb, 4);
863     vc->blocksize[0]=(1<<bl0);
864     vc->blocksize[1]=(1<<bl1);
865     if (bl0>13 || bl0<6 || bl1>13 || bl1<6 || bl1<bl0) {
866         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis id header packet corrupt (illegal blocksize). \n");
867         return 3;
868     }
869     // output format int16
870     if (vc->blocksize[1]/2 * vc->audio_channels * 2 >
871                                              AVCODEC_MAX_AUDIO_FRAME_SIZE) {
872         av_log(vc->avccontext, AV_LOG_ERROR, "Vorbis channel count makes "
873                "output packets too large.\n");
874         return 4;
875     }
876     vc->win[0]=ff_vorbis_vwin[bl0-6];
877     vc->win[1]=ff_vorbis_vwin[bl1-6];
878
879     if(vc->exp_bias){
880         int i, j;
881         for(j=0; j<2; j++){
882             float *win = av_malloc(vc->blocksize[j]/2 * sizeof(float));
883             for(i=0; i<vc->blocksize[j]/2; i++)
884                 win[i] = vc->win[j][i] * (1<<15);
885             vc->win[j] = win;
886         }
887     }
888
889     if ((get_bits1(gb)) == 0) {
890         av_log(vc->avccontext, AV_LOG_ERROR, " Vorbis id header packet corrupt (framing flag not set). \n");
891         return 2;
892     }
893
894     vc->channel_residues= av_malloc((vc->blocksize[1]/2)*vc->audio_channels * sizeof(float));
895     vc->channel_floors  = av_malloc((vc->blocksize[1]/2)*vc->audio_channels * sizeof(float));
896     vc->saved           = av_mallocz((vc->blocksize[1]/4)*vc->audio_channels * sizeof(float));
897     vc->previous_window=0;
898
899     ff_mdct_init(&vc->mdct[0], bl0, 1);
900     ff_mdct_init(&vc->mdct[1], bl1, 1);
901
902     AV_DEBUG(" vorbis version %d \n audio_channels %d \n audio_samplerate %d \n bitrate_max %d \n bitrate_nom %d \n bitrate_min %d \n blk_0 %d blk_1 %d \n ",
903             vc->version, vc->audio_channels, vc->audio_samplerate, vc->bitrate_maximum, vc->bitrate_nominal, vc->bitrate_minimum, vc->blocksize[0], vc->blocksize[1]);
904
905 /*
906     BLK=vc->blocksize[0];
907     for(i=0;i<BLK/2;++i) {
908         vc->win[0][i]=sin(0.5*3.14159265358*(sin(((float)i+0.5)/(float)BLK*3.14159265358))*(sin(((float)i+0.5)/(float)BLK*3.14159265358)));
909     }
910 */
911
912     return 0;
913 }
914
915 // Process the extradata using the functions above (identification header, setup header)
916
917 static av_cold int vorbis_decode_init(AVCodecContext *avccontext) {
918     vorbis_context *vc = avccontext->priv_data ;
919     uint8_t *headers = avccontext->extradata;
920     int headers_len=avccontext->extradata_size;
921     uint8_t *header_start[3];
922     int header_len[3];
923     GetBitContext *gb = &(vc->gb);
924     int hdr_type;
925
926     vc->avccontext = avccontext;
927     dsputil_init(&vc->dsp, avccontext);
928
929     if(vc->dsp.float_to_int16_interleave == ff_float_to_int16_interleave_c) {
930         vc->add_bias = 385;
931         vc->exp_bias = 0;
932     } else {
933         vc->add_bias = 0;
934         vc->exp_bias = 15<<23;
935     }
936
937     if (!headers_len) {
938         av_log(avccontext, AV_LOG_ERROR, "Extradata corrupt.\n");
939         return -1;
940     }
941
942     if (ff_split_xiph_headers(headers, headers_len, 30, header_start, header_len) < 0) {
943         av_log(avccontext, AV_LOG_ERROR, "Extradata corrupt.\n");
944         return -1;
945     }
946
947     init_get_bits(gb, header_start[0], header_len[0]*8);
948     hdr_type=get_bits(gb, 8);
949     if (hdr_type!=1) {
950         av_log(avccontext, AV_LOG_ERROR, "First header is not the id header.\n");
951         return -1;
952     }
953     if (vorbis_parse_id_hdr(vc)) {
954         av_log(avccontext, AV_LOG_ERROR, "Id header corrupt.\n");
955         vorbis_free(vc);
956         return -1;
957     }
958
959     init_get_bits(gb, header_start[2], header_len[2]*8);
960     hdr_type=get_bits(gb, 8);
961     if (hdr_type!=5) {
962         av_log(avccontext, AV_LOG_ERROR, "Third header is not the setup header.\n");
963         return -1;
964     }
965     if (vorbis_parse_setup_hdr(vc)) {
966         av_log(avccontext, AV_LOG_ERROR, "Setup header corrupt.\n");
967         vorbis_free(vc);
968         return -1;
969     }
970
971     avccontext->channels = vc->audio_channels;
972     avccontext->sample_rate = vc->audio_samplerate;
973     avccontext->frame_size  = FFMIN(vc->blocksize[0], vc->blocksize[1])>>2;
974     avccontext->sample_fmt = SAMPLE_FMT_S16;
975
976     return 0 ;
977 }
978
979 // Decode audiopackets -------------------------------------------------
980
981 // Read and decode floor
982
983 static uint_fast8_t vorbis_floor0_decode(vorbis_context *vc,
984                                          vorbis_floor_data *vfu, float *vec) {
985     vorbis_floor0 * vf=&vfu->t0;
986     float * lsp=vf->lsp;
987     uint_fast32_t amplitude;
988     uint_fast32_t book_idx;
989     uint_fast8_t blockflag=vc->modes[vc->mode_number].blockflag;
990
991     amplitude=get_bits(&vc->gb, vf->amplitude_bits);
992     if (amplitude>0) {
993         float last = 0;
994         uint_fast16_t lsp_len = 0;
995         uint_fast16_t idx;
996         vorbis_codebook codebook;
997
998         book_idx=get_bits(&vc->gb, ilog(vf->num_books));
999         if ( book_idx >= vf->num_books ) {
1000             av_log( vc->avccontext, AV_LOG_ERROR,
1001                     "floor0 dec: booknumber too high!\n" );
1002             book_idx= 0;
1003             //FIXME: look above
1004         }
1005         AV_DEBUG( "floor0 dec: booknumber: %u\n", book_idx );
1006         codebook=vc->codebooks[vf->book_list[book_idx]];
1007
1008         while (lsp_len<vf->order) {
1009             int vec_off;
1010
1011             AV_DEBUG( "floor0 dec: book dimension: %d\n", codebook.dimensions );
1012             AV_DEBUG( "floor0 dec: maximum depth: %d\n", codebook.maxdepth );
1013             /* read temp vector */
1014             vec_off=get_vlc2(&vc->gb,
1015                              codebook.vlc.table,
1016                              codebook.nb_bits,
1017                              codebook.maxdepth ) *
1018                              codebook.dimensions;
1019             AV_DEBUG( "floor0 dec: vector offset: %d\n", vec_off );
1020             /* copy each vector component and add last to it */
1021             for (idx=0; idx<codebook.dimensions; ++idx) {
1022                 lsp[lsp_len+idx]=codebook.codevectors[vec_off+idx]+last;
1023             }
1024             last=lsp[lsp_len+idx-1]; /* set last to last vector component */
1025
1026             lsp_len += codebook.dimensions;
1027         }
1028 #ifdef V_DEBUG
1029         /* DEBUG: output lsp coeffs */
1030         {
1031             int idx;
1032             for ( idx = 0; idx < lsp_len; ++idx )
1033                 AV_DEBUG("floor0 dec: coeff at %d is %f\n", idx, lsp[idx] );
1034         }
1035 #endif
1036
1037         /* synthesize floor output vector */
1038         {
1039             int i;
1040             int order=vf->order;
1041             float wstep=M_PI/vf->bark_map_size;
1042
1043             for(i=0;i<order;i++) { lsp[i]=2.0f*cos(lsp[i]); }
1044
1045             AV_DEBUG("floor0 synth: map_size=%d; m=%d; wstep=%f\n",
1046                      vf->map_size, order, wstep);
1047
1048             i=0;
1049             while(i<vf->map_size[blockflag]) {
1050                 int j, iter_cond=vf->map[blockflag][i];
1051                 float p=0.5f;
1052                 float q=0.5f;
1053                 float two_cos_w=2.0f*cos(wstep*iter_cond); // needed all times
1054
1055                 /* similar part for the q and p products */
1056                 for(j=0;j<order;j+=2) {
1057                     q *= lsp[j]  -two_cos_w;
1058                     p *= lsp[j+1]-two_cos_w;
1059                 }
1060                 if(j==order) { // even order
1061                     p *= p*(2.0f-two_cos_w);
1062                     q *= q*(2.0f+two_cos_w);
1063                 }
1064                 else { // odd order
1065                     q *= two_cos_w-lsp[j]; // one more time for q
1066
1067                     /* final step and square */
1068                     p *= p*(4.f-two_cos_w*two_cos_w);
1069                     q *= q;
1070                 }
1071
1072                 /* calculate linear floor value */
1073                 {
1074                     q=exp( (
1075                              ( (amplitude*vf->amplitude_offset)/
1076                                (((1<<vf->amplitude_bits)-1) * sqrt(p+q)) )
1077                              - vf->amplitude_offset ) * .11512925f
1078                          );
1079                 }
1080
1081                 /* fill vector */
1082                 do { vec[i]=q; ++i; }while(vf->map[blockflag][i]==iter_cond);
1083             }
1084         }
1085     }
1086     else {
1087         /* this channel is unused */
1088         return 1;
1089     }
1090
1091     AV_DEBUG(" Floor0 decoded\n");
1092
1093     return 0;
1094 }
1095
1096 static uint_fast8_t vorbis_floor1_decode(vorbis_context *vc, vorbis_floor_data *vfu, float *vec) {
1097     vorbis_floor1 * vf=&vfu->t1;
1098     GetBitContext *gb=&vc->gb;
1099     uint_fast16_t range_v[4]={ 256, 128, 86, 64 };
1100     uint_fast16_t range=range_v[vf->multiplier-1];
1101     uint_fast16_t floor1_Y[vf->x_list_dim];
1102     uint_fast16_t floor1_Y_final[vf->x_list_dim];
1103     int floor1_flag[vf->x_list_dim];
1104     uint_fast8_t class_;
1105     uint_fast8_t cdim;
1106     uint_fast8_t cbits;
1107     uint_fast8_t csub;
1108     uint_fast8_t cval;
1109     int_fast16_t book;
1110     uint_fast16_t offset;
1111     uint_fast16_t i,j;
1112     /*u*/int_fast16_t adx, ady, off, predicted; // WTF ? dy/adx= (unsigned)dy/adx ?
1113     int_fast16_t dy, err;
1114
1115
1116     if (!get_bits1(gb)) return 1; // silence
1117
1118 // Read values (or differences) for the floor's points
1119
1120     floor1_Y[0]=get_bits(gb, ilog(range-1));
1121     floor1_Y[1]=get_bits(gb, ilog(range-1));
1122
1123     AV_DEBUG("floor 0 Y %d floor 1 Y %d \n", floor1_Y[0], floor1_Y[1]);
1124
1125     offset=2;
1126     for(i=0;i<vf->partitions;++i) {
1127         class_=vf->partition_class[i];
1128         cdim=vf->class_dimensions[class_];
1129         cbits=vf->class_subclasses[class_];
1130         csub=(1<<cbits)-1;
1131         cval=0;
1132
1133         AV_DEBUG("Cbits %d \n", cbits);
1134
1135         if (cbits) { // this reads all subclasses for this partition's class
1136             cval=get_vlc2(gb, vc->codebooks[vf->class_masterbook[class_]].vlc.table,
1137             vc->codebooks[vf->class_masterbook[class_]].nb_bits, 3);
1138         }
1139
1140         for(j=0;j<cdim;++j) {
1141             book=vf->subclass_books[class_][cval & csub];
1142
1143             AV_DEBUG("book %d Cbits %d cval %d  bits:%d \n", book, cbits, cval, get_bits_count(gb));
1144
1145             cval=cval>>cbits;
1146             if (book>-1) {
1147                 floor1_Y[offset+j]=get_vlc2(gb, vc->codebooks[book].vlc.table,
1148                 vc->codebooks[book].nb_bits, 3);
1149             } else {
1150                 floor1_Y[offset+j]=0;
1151             }
1152
1153             AV_DEBUG(" floor(%d) = %d \n", vf->list[offset+j].x, floor1_Y[offset+j]);
1154         }
1155         offset+=cdim;
1156     }
1157
1158 // Amplitude calculation from the differences
1159
1160     floor1_flag[0]=1;
1161     floor1_flag[1]=1;
1162     floor1_Y_final[0]=floor1_Y[0];
1163     floor1_Y_final[1]=floor1_Y[1];
1164
1165     for(i=2;i<vf->x_list_dim;++i) {
1166         uint_fast16_t val, highroom, lowroom, room;
1167         uint_fast16_t high_neigh_offs;
1168         uint_fast16_t low_neigh_offs;
1169
1170         low_neigh_offs=vf->list[i].low;
1171         high_neigh_offs=vf->list[i].high;
1172         dy=floor1_Y_final[high_neigh_offs]-floor1_Y_final[low_neigh_offs];  // render_point begin
1173         adx=vf->list[high_neigh_offs].x-vf->list[low_neigh_offs].x;
1174         ady= FFABS(dy);
1175         err=ady*(vf->list[i].x-vf->list[low_neigh_offs].x);
1176         off=(int16_t)err/(int16_t)adx;
1177         if (dy<0) {
1178             predicted=floor1_Y_final[low_neigh_offs]-off;
1179         } else {
1180             predicted=floor1_Y_final[low_neigh_offs]+off;
1181         } // render_point end
1182
1183         val=floor1_Y[i];
1184         highroom=range-predicted;
1185         lowroom=predicted;
1186         if (highroom < lowroom) {
1187             room=highroom*2;
1188         } else {
1189             room=lowroom*2;   // SPEC mispelling
1190         }
1191         if (val) {
1192             floor1_flag[low_neigh_offs]=1;
1193             floor1_flag[high_neigh_offs]=1;
1194             floor1_flag[i]=1;
1195             if (val>=room) {
1196                 if (highroom > lowroom) {
1197                     floor1_Y_final[i]=val-lowroom+predicted;
1198                 } else {
1199                     floor1_Y_final[i]=predicted-val+highroom-1;
1200                 }
1201             } else {
1202                 if (val & 1) {
1203                     floor1_Y_final[i]=predicted-(val+1)/2;
1204                 } else {
1205                     floor1_Y_final[i]=predicted+val/2;
1206                 }
1207             }
1208         } else {
1209             floor1_flag[i]=0;
1210             floor1_Y_final[i]=predicted;
1211         }
1212
1213         AV_DEBUG(" Decoded floor(%d) = %d / val %d \n", vf->list[i].x, floor1_Y_final[i], val);
1214     }
1215
1216 // Curve synth - connect the calculated dots and convert from dB scale FIXME optimize ?
1217
1218     ff_vorbis_floor1_render_list(vf->list, vf->x_list_dim, floor1_Y_final, floor1_flag, vf->multiplier, vec, vf->list[1].x);
1219
1220     AV_DEBUG(" Floor decoded\n");
1221
1222     return 0;
1223 }
1224
1225 // Read and decode residue
1226
1227 static int vorbis_residue_decode(vorbis_context *vc, vorbis_residue *vr, uint_fast8_t ch, uint_fast8_t *do_not_decode, float *vec, uint_fast16_t vlen) {
1228     GetBitContext *gb=&vc->gb;
1229     uint_fast8_t c_p_c=vc->codebooks[vr->classbook].dimensions;
1230     uint_fast16_t n_to_read=vr->end-vr->begin;
1231     uint_fast16_t ptns_to_read=n_to_read/vr->partition_size;
1232     uint_fast8_t classifs[ptns_to_read*vc->audio_channels];
1233     uint_fast8_t pass;
1234     uint_fast8_t ch_used;
1235     uint_fast8_t i,j,l;
1236     uint_fast16_t k;
1237
1238     if (vr->type==2) {
1239         for(j=1;j<ch;++j) {
1240                 do_not_decode[0]&=do_not_decode[j];  // FIXME - clobbering input
1241         }
1242         if (do_not_decode[0]) return 0;
1243         ch_used=1;
1244     } else {
1245         ch_used=ch;
1246     }
1247
1248     AV_DEBUG(" residue type 0/1/2 decode begin, ch: %d  cpc %d  \n", ch, c_p_c);
1249
1250     for(pass=0;pass<=vr->maxpass;++pass) { // FIXME OPTIMIZE?
1251         uint_fast16_t voffset;
1252         uint_fast16_t partition_count;
1253         uint_fast16_t j_times_ptns_to_read;
1254
1255         voffset=vr->begin;
1256         for(partition_count=0;partition_count<ptns_to_read;) {  // SPEC        error
1257             if (!pass) {
1258                 uint_fast32_t inverse_class = ff_inverse[vr->classifications];
1259                 for(j_times_ptns_to_read=0, j=0;j<ch_used;++j) {
1260                     if (!do_not_decode[j]) {
1261                         uint_fast32_t temp=get_vlc2(gb, vc->codebooks[vr->classbook].vlc.table,
1262                         vc->codebooks[vr->classbook].nb_bits, 3);
1263
1264                         AV_DEBUG("Classword: %d \n", temp);
1265
1266                         assert(vr->classifications > 1 && temp<=65536); //needed for inverse[]
1267                         for(i=0;i<c_p_c;++i) {
1268                             uint_fast32_t temp2;
1269
1270                             temp2=(((uint_fast64_t)temp) * inverse_class)>>32;
1271                             if (partition_count+c_p_c-1-i < ptns_to_read) {
1272                                 classifs[j_times_ptns_to_read+partition_count+c_p_c-1-i]=temp-temp2*vr->classifications;
1273                             }
1274                             temp=temp2;
1275                         }
1276                     }
1277                     j_times_ptns_to_read+=ptns_to_read;
1278                 }
1279             }
1280             for(i=0;(i<c_p_c) && (partition_count<ptns_to_read);++i) {
1281                 for(j_times_ptns_to_read=0, j=0;j<ch_used;++j) {
1282                     uint_fast16_t voffs;
1283
1284                     if (!do_not_decode[j]) {
1285                         uint_fast8_t vqclass=classifs[j_times_ptns_to_read+partition_count];
1286                         int_fast16_t vqbook=vr->books[vqclass][pass];
1287
1288                         if (vqbook>=0 && vc->codebooks[vqbook].codevectors) {
1289                             uint_fast16_t coffs;
1290                             unsigned dim= vc->codebooks[vqbook].dimensions; // not uint_fast8_t: 64bit is slower here on amd64
1291                             uint_fast16_t step= dim==1 ? vr->partition_size
1292                                               : FASTDIV(vr->partition_size, dim);
1293                             vorbis_codebook codebook= vc->codebooks[vqbook];
1294
1295                             if (vr->type==0) {
1296
1297                                 voffs=voffset+j*vlen;
1298                                 for(k=0;k<step;++k) {
1299                                     coffs=get_vlc2(gb, codebook.vlc.table, codebook.nb_bits, 3) * dim;
1300                                     for(l=0;l<dim;++l) {
1301                                         vec[voffs+k+l*step]+=codebook.codevectors[coffs+l];  // FPMATH
1302                                     }
1303                                 }
1304                             }
1305                             else if (vr->type==1) {
1306                                 voffs=voffset+j*vlen;
1307                                 for(k=0;k<step;++k) {
1308                                     coffs=get_vlc2(gb, codebook.vlc.table, codebook.nb_bits, 3) * dim;
1309                                     for(l=0;l<dim;++l, ++voffs) {
1310                                         vec[voffs]+=codebook.codevectors[coffs+l];  // FPMATH
1311
1312                                         AV_DEBUG(" pass %d offs: %d curr: %f change: %f cv offs.: %d  \n", pass, voffs, vec[voffs], codebook.codevectors[coffs+l], coffs);
1313                                     }
1314                                 }
1315                             }
1316                             else if (vr->type==2 && ch==2 && (voffset&1)==0 && (dim&1)==0) { // most frequent case optimized
1317                                 voffs=voffset>>1;
1318
1319                                 if(dim==2) {
1320                                     for(k=0;k<step;++k) {
1321                                         coffs=get_vlc2(gb, codebook.vlc.table, codebook.nb_bits, 3) * 2;
1322                                         vec[voffs+k     ]+=codebook.codevectors[coffs  ];  // FPMATH
1323                                         vec[voffs+k+vlen]+=codebook.codevectors[coffs+1];  // FPMATH
1324                                     }
1325                                 } else if(dim==4) {
1326                                     for(k=0;k<step;++k, voffs+=2) {
1327                                         coffs=get_vlc2(gb, codebook.vlc.table, codebook.nb_bits, 3) * 4;
1328                                         vec[voffs       ]+=codebook.codevectors[coffs  ];  // FPMATH
1329                                         vec[voffs+1     ]+=codebook.codevectors[coffs+2];  // FPMATH
1330                                         vec[voffs+vlen  ]+=codebook.codevectors[coffs+1];  // FPMATH
1331                                         vec[voffs+vlen+1]+=codebook.codevectors[coffs+3];  // FPMATH
1332                                     }
1333                                 } else
1334                                 for(k=0;k<step;++k) {
1335                                     coffs=get_vlc2(gb, codebook.vlc.table, codebook.nb_bits, 3) * dim;
1336                                     for(l=0;l<dim;l+=2, voffs++) {
1337                                         vec[voffs     ]+=codebook.codevectors[coffs+l  ];  // FPMATH
1338                                         vec[voffs+vlen]+=codebook.codevectors[coffs+l+1];  // FPMATH
1339
1340                                         AV_DEBUG(" pass %d offs: %d curr: %f change: %f cv offs.: %d+%d  \n", pass, voffset/ch+(voffs%ch)*vlen, vec[voffset/ch+(voffs%ch)*vlen], codebook.codevectors[coffs+l], coffs, l);
1341                                     }
1342                                 }
1343
1344                             }
1345                             else if (vr->type==2) {
1346                                 voffs=voffset;
1347
1348                                 for(k=0;k<step;++k) {
1349                                     coffs=get_vlc2(gb, codebook.vlc.table, codebook.nb_bits, 3) * dim;
1350                                     for(l=0;l<dim;++l, ++voffs) {
1351                                         vec[voffs/ch+(voffs%ch)*vlen]+=codebook.codevectors[coffs+l];  // FPMATH FIXME use if and counter instead of / and %
1352
1353                                         AV_DEBUG(" pass %d offs: %d curr: %f change: %f cv offs.: %d+%d  \n", pass, voffset/ch+(voffs%ch)*vlen, vec[voffset/ch+(voffs%ch)*vlen], codebook.codevectors[coffs+l], coffs, l);
1354                                     }
1355                                 }
1356                             } else {
1357                                 av_log(vc->avccontext, AV_LOG_ERROR, " Invalid residue type while residue decode?! \n");
1358                                 return 1;
1359                             }
1360                         }
1361                     }
1362                     j_times_ptns_to_read+=ptns_to_read;
1363                 }
1364                 ++partition_count;
1365                 voffset+=vr->partition_size;
1366             }
1367         }
1368     }
1369     return 0;
1370 }
1371
1372 void vorbis_inverse_coupling(float *mag, float *ang, int blocksize)
1373 {
1374     int i;
1375     for(i=0; i<blocksize; i++)
1376     {
1377         if (mag[i]>0.0) {
1378             if (ang[i]>0.0) {
1379                 ang[i]=mag[i]-ang[i];
1380             } else {
1381                 float temp=ang[i];
1382                 ang[i]=mag[i];
1383                 mag[i]+=temp;
1384             }
1385         } else {
1386             if (ang[i]>0.0) {
1387                 ang[i]+=mag[i];
1388             } else {
1389                 float temp=ang[i];
1390                 ang[i]=mag[i];
1391                 mag[i]-=temp;
1392             }
1393         }
1394     }
1395 }
1396
1397 static void copy_normalize(float *dst, float *src, int len, int exp_bias, float add_bias)
1398 {
1399     int i;
1400     if(exp_bias) {
1401         for(i=0; i<len; i++)
1402             ((uint32_t*)dst)[i] = ((uint32_t*)src)[i] + exp_bias; // dst[k]=src[i]*(1<<bias)
1403     } else {
1404         for(i=0; i<len; i++)
1405             dst[i] = src[i] + add_bias;
1406     }
1407 }
1408
1409 // Decode the audio packet using the functions above
1410
1411 static int vorbis_parse_audio_packet(vorbis_context *vc) {
1412     GetBitContext *gb=&vc->gb;
1413
1414     uint_fast8_t previous_window=vc->previous_window;
1415     uint_fast8_t mode_number;
1416     uint_fast8_t blockflag;
1417     uint_fast16_t blocksize;
1418     int_fast32_t i,j,dir;
1419     uint_fast8_t no_residue[vc->audio_channels];
1420     uint_fast8_t do_not_decode[vc->audio_channels];
1421     vorbis_mapping *mapping;
1422     float *ch_res_ptr=vc->channel_residues;
1423     float *ch_floor_ptr=vc->channel_floors;
1424     uint_fast8_t res_chan[vc->audio_channels];
1425     uint_fast8_t res_num=0;
1426     int_fast16_t retlen=0;
1427     float fadd_bias = vc->add_bias;
1428
1429     if (get_bits1(gb)) {
1430         av_log(vc->avccontext, AV_LOG_ERROR, "Not a Vorbis I audio packet.\n");
1431         return -1; // packet type not audio
1432     }
1433
1434     if (vc->mode_count==1) {
1435         mode_number=0;
1436     } else {
1437         mode_number=get_bits(gb, ilog(vc->mode_count-1));
1438     }
1439     vc->mode_number=mode_number;
1440     mapping=&vc->mappings[vc->modes[mode_number].mapping];
1441
1442     AV_DEBUG(" Mode number: %d , mapping: %d , blocktype %d \n", mode_number, vc->modes[mode_number].mapping, vc->modes[mode_number].blockflag);
1443
1444     blockflag=vc->modes[mode_number].blockflag;
1445     blocksize=vc->blocksize[blockflag];
1446     if (blockflag) {
1447         skip_bits(gb, 2); // previous_window, next_window
1448     }
1449
1450     memset(ch_res_ptr, 0, sizeof(float)*vc->audio_channels*blocksize/2); //FIXME can this be removed ?
1451     memset(ch_floor_ptr, 0, sizeof(float)*vc->audio_channels*blocksize/2); //FIXME can this be removed ?
1452
1453 // Decode floor
1454
1455     for(i=0;i<vc->audio_channels;++i) {
1456         vorbis_floor *floor;
1457         if (mapping->submaps>1) {
1458             floor=&vc->floors[mapping->submap_floor[mapping->mux[i]]];
1459         } else {
1460             floor=&vc->floors[mapping->submap_floor[0]];
1461         }
1462
1463         no_residue[i]=floor->decode(vc, &floor->data, ch_floor_ptr);
1464         ch_floor_ptr+=blocksize/2;
1465     }
1466
1467 // Nonzero vector propagate
1468
1469     for(i=mapping->coupling_steps-1;i>=0;--i) {
1470         if (!(no_residue[mapping->magnitude[i]] & no_residue[mapping->angle[i]])) {
1471             no_residue[mapping->magnitude[i]]=0;
1472             no_residue[mapping->angle[i]]=0;
1473         }
1474     }
1475
1476 // Decode residue
1477
1478     for(i=0;i<mapping->submaps;++i) {
1479         vorbis_residue *residue;
1480         uint_fast8_t ch=0;
1481
1482         for(j=0;j<vc->audio_channels;++j) {
1483             if ((mapping->submaps==1) || (i=mapping->mux[j])) {
1484                 res_chan[j]=res_num;
1485                 if (no_residue[j]) {
1486                     do_not_decode[ch]=1;
1487                 } else {
1488                     do_not_decode[ch]=0;
1489                 }
1490                 ++ch;
1491                 ++res_num;
1492             }
1493         }
1494         residue=&vc->residues[mapping->submap_residue[i]];
1495         vorbis_residue_decode(vc, residue, ch, do_not_decode, ch_res_ptr, blocksize/2);
1496
1497         ch_res_ptr+=ch*blocksize/2;
1498     }
1499
1500 // Inverse coupling
1501
1502     for(i=mapping->coupling_steps-1;i>=0;--i) { //warning: i has to be signed
1503         float *mag, *ang;
1504
1505         mag=vc->channel_residues+res_chan[mapping->magnitude[i]]*blocksize/2;
1506         ang=vc->channel_residues+res_chan[mapping->angle[i]]*blocksize/2;
1507         vc->dsp.vorbis_inverse_coupling(mag, ang, blocksize/2);
1508     }
1509
1510 // Dotproduct
1511
1512     for(j=0, ch_floor_ptr=vc->channel_floors;j<vc->audio_channels;++j,ch_floor_ptr+=blocksize/2) {
1513         ch_res_ptr=vc->channel_residues+res_chan[j]*blocksize/2;
1514         vc->dsp.vector_fmul(ch_floor_ptr, ch_res_ptr, blocksize/2);
1515     }
1516
1517 // MDCT, overlap/add, save data for next overlapping  FPMATH
1518
1519     retlen = (blocksize + vc->blocksize[previous_window])/4;
1520     dir = retlen <= blocksize/2; // pick an order so that ret[] can reuse floors[] without stepping on any data we need
1521     for(j=dir?0:vc->audio_channels-1; (unsigned)j<vc->audio_channels; j+=dir*2-1) {
1522         uint_fast16_t bs0=vc->blocksize[0];
1523         uint_fast16_t bs1=vc->blocksize[1];
1524         float *residue=vc->channel_residues+res_chan[j]*blocksize/2;
1525         float *floor=vc->channel_floors+j*blocksize/2;
1526         float *saved=vc->saved+j*bs1/4;
1527         float *ret=vc->channel_floors+j*retlen;
1528         float *buf=residue;
1529         const float *win=vc->win[blockflag&previous_window];
1530
1531         vc->mdct[0].fft.imdct_half(&vc->mdct[blockflag], buf, floor);
1532
1533         if(blockflag == previous_window) {
1534             vc->dsp.vector_fmul_window(ret, saved, buf, win, fadd_bias, blocksize/4);
1535         } else if(blockflag > previous_window) {
1536             vc->dsp.vector_fmul_window(ret, saved, buf, win, fadd_bias, bs0/4);
1537             copy_normalize(ret+bs0/2, buf+bs0/4, (bs1-bs0)/4, vc->exp_bias, fadd_bias);
1538         } else {
1539             copy_normalize(ret, saved, (bs1-bs0)/4, vc->exp_bias, fadd_bias);
1540             vc->dsp.vector_fmul_window(ret+(bs1-bs0)/4, saved+(bs1-bs0)/4, buf, win, fadd_bias, bs0/4);
1541         }
1542         memcpy(saved, buf+blocksize/4, blocksize/4*sizeof(float));
1543     }
1544
1545     vc->previous_window = blockflag;
1546     return retlen;
1547 }
1548
1549 // Return the decoded audio packet through the standard api
1550
1551 static int vorbis_decode_frame(AVCodecContext *avccontext,
1552                         void *data, int *data_size,
1553                         const uint8_t *buf, int buf_size)
1554 {
1555     vorbis_context *vc = avccontext->priv_data ;
1556     GetBitContext *gb = &(vc->gb);
1557     const float *channel_ptrs[vc->audio_channels];
1558     int i;
1559
1560     int_fast16_t len;
1561
1562     if(!buf_size){
1563         return 0;
1564     }
1565
1566     AV_DEBUG("packet length %d \n", buf_size);
1567
1568     init_get_bits(gb, buf, buf_size*8);
1569
1570     len=vorbis_parse_audio_packet(vc);
1571
1572     if (len<=0) {
1573         *data_size=0;
1574         return buf_size;
1575     }
1576
1577     if (!vc->first_frame) {
1578         vc->first_frame=1;
1579         *data_size=0;
1580         return buf_size ;
1581     }
1582
1583     AV_DEBUG("parsed %d bytes %d bits, returned %d samples (*ch*bits) \n", get_bits_count(gb)/8, get_bits_count(gb)%8, len);
1584
1585     for(i=0; i<vc->audio_channels; i++)
1586         channel_ptrs[i] = vc->channel_floors+i*len;
1587     vc->dsp.float_to_int16_interleave(data, channel_ptrs, len, vc->audio_channels);
1588     *data_size=len*2*vc->audio_channels;
1589
1590     return buf_size ;
1591 }
1592
1593 // Close decoder
1594
1595 static av_cold int vorbis_decode_close(AVCodecContext *avccontext) {
1596     vorbis_context *vc = avccontext->priv_data;
1597
1598     vorbis_free(vc);
1599
1600     return 0 ;
1601 }
1602
1603 AVCodec vorbis_decoder = {
1604     "vorbis",
1605     CODEC_TYPE_AUDIO,
1606     CODEC_ID_VORBIS,
1607     sizeof(vorbis_context),
1608     vorbis_decode_init,
1609     NULL,
1610     vorbis_decode_close,
1611     vorbis_decode_frame,
1612     .long_name = NULL_IF_CONFIG_SMALL("Vorbis"),
1613 };
1614