]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavcodec/indeo3.c
606ff224080ad9a36d2df17afec1be20132a38ec
[frescor/ffmpeg.git] / libavcodec / indeo3.c
1 /*
2  * Intel Indeo 3 (IV31, IV32, etc.) video decoder for ffmpeg
3  * written, produced, and directed by Alan Smithee
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include <stdio.h>
23 #include <stdlib.h>
24 #include <string.h>
25 #include <unistd.h>
26
27 #include "avcodec.h"
28 #include "dsputil.h"
29 #include "bytestream.h"
30
31 #include "indeo3data.h"
32
33 typedef struct
34 {
35   uint8_t *Ybuf;
36   uint8_t *Ubuf;
37   uint8_t *Vbuf;
38   uint8_t *the_buf;
39   unsigned int the_buf_size;
40   unsigned short y_w, y_h;
41   unsigned short uv_w, uv_h;
42 } YUVBufs;
43
44 typedef struct Indeo3DecodeContext {
45     AVCodecContext *avctx;
46     int width, height;
47     AVFrame frame;
48
49     YUVBufs iv_frame[2];
50     YUVBufs *cur_frame;
51     YUVBufs *ref_frame;
52
53     uint8_t *ModPred;
54     uint8_t *corrector_type;
55 } Indeo3DecodeContext;
56
57 static const uint8_t corrector_type_0[24] = {
58   195, 159, 133, 115, 101,  93,  87,  77,
59   195, 159, 133, 115, 101,  93,  87,  77,
60   128,  79,  79,  79,  79,  79,  79,  79
61 };
62
63 static const uint8_t corrector_type_2[8] = { 9, 7, 6, 8, 5, 4, 3, 2 };
64
65 static av_cold int build_modpred(Indeo3DecodeContext *s)
66 {
67   int i, j;
68
69   if (!(s->ModPred = av_malloc(8 * 128)))
70     return AVERROR(ENOMEM);
71
72   for (i=0; i < 128; ++i) {
73     s->ModPred[i+0*128] = i >  126 ? 254 : 2*(i + 1 - ((i + 1) % 2));
74     s->ModPred[i+1*128] = i ==   7 ?  20 :
75                           i == 119 ||
76                           i == 120 ? 236 : 2*(i + 2 - ((i + 1) % 3));
77     s->ModPred[i+2*128] = i >  125 ? 248 : 2*(i + 2 - ((i + 2) % 4));
78     s->ModPred[i+3*128] =                  2*(i + 1 - ((i - 3) % 5));
79     s->ModPred[i+4*128] = i ==   8 ?  20 : 2*(i + 1 - ((i - 3) % 6));
80     s->ModPred[i+5*128] =                  2*(i + 4 - ((i + 3) % 7));
81     s->ModPred[i+6*128] = i >  123 ? 240 : 2*(i + 4 - ((i + 4) % 8));
82     s->ModPred[i+7*128] =                  2*(i + 5 - ((i + 4) % 9));
83   }
84
85   if (!(s->corrector_type = av_malloc(24 * 256)))
86     return AVERROR(ENOMEM);
87
88   for (i=0; i < 24; ++i) {
89     for (j=0; j < 256; ++j) {
90       s->corrector_type[i*256+j] = j < corrector_type_0[i]          ? 1 :
91                                    j < 248 || (i == 16 && j == 248) ? 0 :
92                                    corrector_type_2[j - 248];
93     }
94   }
95
96   return 0;
97 }
98
99 static void iv_Decode_Chunk(Indeo3DecodeContext *s, uint8_t *cur,
100   uint8_t *ref, int width, int height, const uint8_t *buf1,
101   long fflags2, const uint8_t *hdr,
102   const uint8_t *buf2, int min_width_160);
103
104 /* ---------------------------------------------------------------------- */
105 static av_cold int iv_alloc_frames(Indeo3DecodeContext *s)
106 {
107   int luma_width, luma_height, luma_pixels, chroma_width, chroma_height,
108       chroma_pixels, i;
109   unsigned int bufsize;
110
111   luma_width   = (s->width  + 3) & (~3);
112   luma_height  = (s->height + 3) & (~3);
113   chroma_width  = ((luma_width >> 2) + 3) & (~3);
114   chroma_height = ((luma_height>> 2) + 3) & (~3);
115   luma_pixels = luma_width * luma_height;
116   chroma_pixels = chroma_width * chroma_height;
117
118   bufsize = luma_pixels * 2 + luma_width * 3 +
119     (chroma_pixels + chroma_width) * 4;
120
121   if(!(s->iv_frame[0].the_buf = av_malloc(bufsize)))
122     return AVERROR(ENOMEM);
123   s->iv_frame[0].y_w = s->iv_frame[1].y_w = luma_width;
124   s->iv_frame[0].y_h = s->iv_frame[1].y_h = luma_height;
125   s->iv_frame[0].uv_w = s->iv_frame[1].uv_w = chroma_width;
126   s->iv_frame[0].uv_h = s->iv_frame[1].uv_h = chroma_height;
127   s->iv_frame[0].the_buf_size = bufsize;
128
129   s->iv_frame[0].Ybuf = s->iv_frame[0].the_buf + luma_width;
130   i = luma_pixels + luma_width * 2;
131   s->iv_frame[1].Ybuf = s->iv_frame[0].the_buf + i;
132   i += (luma_pixels + luma_width);
133   s->iv_frame[0].Ubuf = s->iv_frame[0].the_buf + i;
134   i += (chroma_pixels + chroma_width);
135   s->iv_frame[1].Ubuf = s->iv_frame[0].the_buf + i;
136   i += (chroma_pixels + chroma_width);
137   s->iv_frame[0].Vbuf = s->iv_frame[0].the_buf + i;
138   i += (chroma_pixels + chroma_width);
139   s->iv_frame[1].Vbuf = s->iv_frame[0].the_buf + i;
140
141   for(i = 1; i <= luma_width; i++)
142     s->iv_frame[0].Ybuf[-i] = s->iv_frame[1].Ybuf[-i] =
143       s->iv_frame[0].Ubuf[-i] = 0x80;
144
145   for(i = 1; i <= chroma_width; i++) {
146     s->iv_frame[1].Ubuf[-i] = 0x80;
147     s->iv_frame[0].Vbuf[-i] = 0x80;
148     s->iv_frame[1].Vbuf[-i] = 0x80;
149     s->iv_frame[1].Vbuf[chroma_pixels+i-1] = 0x80;
150   }
151
152   return 0;
153 }
154
155 /* ---------------------------------------------------------------------- */
156 static av_cold void iv_free_func(Indeo3DecodeContext *s)
157 {
158   int i;
159
160   for(i = 0 ; i < 2 ; i++) {
161     if(s->iv_frame[i].the_buf != NULL)
162       av_free(s->iv_frame[i].the_buf);
163     s->iv_frame[i].Ybuf = s->iv_frame[i].Ubuf =
164       s->iv_frame[i].Vbuf = NULL;
165     s->iv_frame[i].the_buf = NULL;
166     s->iv_frame[i].the_buf_size = 0;
167     s->iv_frame[i].y_w = s->iv_frame[i].y_h = 0;
168     s->iv_frame[i].uv_w = s->iv_frame[i].uv_h = 0;
169   }
170
171   av_free(s->ModPred);
172   av_free(s->corrector_type);
173 }
174
175 /* ---------------------------------------------------------------------- */
176 static unsigned long iv_decode_frame(Indeo3DecodeContext *s,
177                                      const uint8_t *buf, int buf_size)
178 {
179   unsigned int hdr_width, hdr_height,
180     chroma_width, chroma_height;
181   unsigned long fflags1, fflags2, fflags3, offs1, offs2, offs3, offs;
182   const uint8_t *hdr_pos, *buf_pos;
183
184   buf_pos = buf;
185   buf_pos += 18;
186
187   fflags1 = bytestream_get_le16(&buf_pos);
188   fflags3 = bytestream_get_le32(&buf_pos);
189   fflags2 = *buf_pos++;
190   buf_pos += 3;
191   hdr_height = bytestream_get_le16(&buf_pos);
192   hdr_width  = bytestream_get_le16(&buf_pos);
193
194   if(avcodec_check_dimensions(NULL, hdr_width, hdr_height))
195       return -1;
196
197   chroma_height = ((hdr_height >> 2) + 3) & 0x7ffc;
198   chroma_width = ((hdr_width >> 2) + 3) & 0x7ffc;
199   offs1 = bytestream_get_le32(&buf_pos);
200   offs2 = bytestream_get_le32(&buf_pos);
201   offs3 = bytestream_get_le32(&buf_pos);
202   buf_pos += 4;
203   hdr_pos = buf_pos;
204   if(fflags3 == 0x80) return 4;
205
206   if(fflags1 & 0x200) {
207     s->cur_frame = s->iv_frame + 1;
208     s->ref_frame = s->iv_frame;
209   } else {
210     s->cur_frame = s->iv_frame;
211     s->ref_frame = s->iv_frame + 1;
212   }
213
214   buf_pos = buf + 16 + offs1;
215   offs = bytestream_get_le32(&buf_pos);
216
217   iv_Decode_Chunk(s, s->cur_frame->Ybuf, s->ref_frame->Ybuf, hdr_width,
218     hdr_height, buf_pos + offs * 2, fflags2, hdr_pos, buf_pos,
219     FFMIN(hdr_width, 160));
220
221   if (!(s->avctx->flags & CODEC_FLAG_GRAY))
222   {
223
224   buf_pos = buf + 16 + offs2;
225   offs = bytestream_get_le32(&buf_pos);
226
227   iv_Decode_Chunk(s, s->cur_frame->Vbuf, s->ref_frame->Vbuf, chroma_width,
228     chroma_height, buf_pos + offs * 2, fflags2, hdr_pos, buf_pos,
229     FFMIN(chroma_width, 40));
230
231   buf_pos = buf + 16 + offs3;
232   offs = bytestream_get_le32(&buf_pos);
233
234   iv_Decode_Chunk(s, s->cur_frame->Ubuf, s->ref_frame->Ubuf, chroma_width,
235     chroma_height, buf_pos + offs * 2, fflags2, hdr_pos, buf_pos,
236     FFMIN(chroma_width, 40));
237
238   }
239
240   return 8;
241 }
242
243 typedef struct {
244   long xpos;
245   long ypos;
246   long width;
247   long height;
248   long split_flag;
249   long split_direction;
250   long usl7;
251 } ustr_t;
252
253 /* ---------------------------------------------------------------------- */
254
255 #define LV1_CHECK(buf1,rle_v3,lv1,lp2)  \
256   if((lv1 & 0x80) != 0) {   \
257     if(rle_v3 != 0)         \
258       rle_v3 = 0;           \
259     else {                  \
260       rle_v3 = 1;           \
261       buf1 -= 2;            \
262     }                       \
263   }                         \
264   lp2 = 4;
265
266
267 #define RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)  \
268   if(rle_v3 == 0) {         \
269     rle_v2 = *buf1;         \
270     rle_v1 = 1;             \
271     if(rle_v2 > 32) {       \
272       rle_v2 -= 32;         \
273       rle_v1 = 0;           \
274     }                       \
275     rle_v3 = 1;             \
276   }                         \
277   buf1--;
278
279
280 #define LP2_CHECK(buf1,rle_v3,lp2)  \
281   if(lp2 == 0 && rle_v3 != 0)     \
282     rle_v3 = 0;           \
283   else {                  \
284     buf1--;               \
285     rle_v3 = 1;           \
286   }
287
288
289 #define RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2) \
290   rle_v2--;             \
291   if(rle_v2 == 0) {     \
292     rle_v3 = 0;         \
293     buf1 += 2;          \
294   }                     \
295   lp2 = 4;
296
297 static void iv_Decode_Chunk(Indeo3DecodeContext *s,
298   uint8_t *cur, uint8_t *ref, int width, int height,
299   const uint8_t *buf1, long fflags2, const uint8_t *hdr,
300   const uint8_t *buf2, int min_width_160)
301 {
302   uint8_t bit_buf;
303   unsigned long bit_pos, lv, lv1, lv2;
304   long *width_tbl, width_tbl_arr[10];
305   const signed char *ref_vectors;
306   uint8_t *cur_frm_pos, *ref_frm_pos, *cp, *cp2;
307   uint32_t *cur_lp, *ref_lp;
308   const uint32_t *correction_lp[2], *correctionloworder_lp[2], *correctionhighorder_lp[2];
309   uint8_t *correction_type_sp[2];
310   ustr_t strip_tbl[20], *strip;
311   int i, j, k, lp1, lp2, flag1, cmd, blks_width, blks_height, region_160_width,
312     rle_v1, rle_v2, rle_v3;
313   unsigned short res;
314
315   bit_buf = 0;
316   ref_vectors = NULL;
317
318   width_tbl = width_tbl_arr + 1;
319   i = (width < 0 ? width + 3 : width)/4;
320   for(j = -1; j < 8; j++)
321     width_tbl[j] = i * j;
322
323   strip = strip_tbl;
324
325   for(region_160_width = 0; region_160_width < (width - min_width_160); region_160_width += min_width_160);
326
327   strip->ypos = strip->xpos = 0;
328   for(strip->width = min_width_160; width > strip->width; strip->width *= 2);
329   strip->height = height;
330   strip->split_direction = 0;
331   strip->split_flag = 0;
332   strip->usl7 = 0;
333
334   bit_pos = 0;
335
336   rle_v1 = rle_v2 = rle_v3 = 0;
337
338   while(strip >= strip_tbl) {
339     if(bit_pos <= 0) {
340       bit_pos = 8;
341       bit_buf = *buf1++;
342     }
343
344     bit_pos -= 2;
345     cmd = (bit_buf >> bit_pos) & 0x03;
346
347     if(cmd == 0) {
348       strip++;
349       memcpy(strip, strip-1, sizeof(ustr_t));
350       strip->split_flag = 1;
351       strip->split_direction = 0;
352       strip->height = (strip->height > 8 ? ((strip->height+8)>>4)<<3 : 4);
353       continue;
354     } else if(cmd == 1) {
355       strip++;
356       memcpy(strip, strip-1, sizeof(ustr_t));
357       strip->split_flag = 1;
358       strip->split_direction = 1;
359       strip->width = (strip->width > 8 ? ((strip->width+8)>>4)<<3 : 4);
360       continue;
361     } else if(cmd == 2) {
362       if(strip->usl7 == 0) {
363         strip->usl7 = 1;
364         ref_vectors = NULL;
365         continue;
366       }
367     } else if(cmd == 3) {
368       if(strip->usl7 == 0) {
369         strip->usl7 = 1;
370         ref_vectors = (const signed char*)buf2 + (*buf1 * 2);
371         buf1++;
372         continue;
373       }
374     }
375
376     cur_frm_pos = cur + width * strip->ypos + strip->xpos;
377
378     if((blks_width = strip->width) < 0)
379       blks_width += 3;
380     blks_width >>= 2;
381     blks_height = strip->height;
382
383     if(ref_vectors != NULL) {
384       ref_frm_pos = ref + (ref_vectors[0] + strip->ypos) * width +
385         ref_vectors[1] + strip->xpos;
386     } else
387       ref_frm_pos = cur_frm_pos - width_tbl[4];
388
389     if(cmd == 2) {
390       if(bit_pos <= 0) {
391         bit_pos = 8;
392         bit_buf = *buf1++;
393       }
394
395       bit_pos -= 2;
396       cmd = (bit_buf >> bit_pos) & 0x03;
397
398       if(cmd == 0 || ref_vectors != NULL) {
399         for(lp1 = 0; lp1 < blks_width; lp1++) {
400           for(i = 0, j = 0; i < blks_height; i++, j += width_tbl[1])
401             ((uint32_t *)cur_frm_pos)[j] = ((uint32_t *)ref_frm_pos)[j];
402           cur_frm_pos += 4;
403           ref_frm_pos += 4;
404         }
405       } else if(cmd != 1)
406         return;
407     } else {
408       k = *buf1 >> 4;
409       j = *buf1 & 0x0f;
410       buf1++;
411       lv = j + fflags2;
412
413       if((lv - 8) <= 7 && (k == 0 || k == 3 || k == 10)) {
414         cp2 = s->ModPred + ((lv - 8) << 7);
415         cp = ref_frm_pos;
416         for(i = 0; i < blks_width << 2; i++) {
417             int v = *cp >> 1;
418             *(cp++) = cp2[v];
419         }
420       }
421
422       if(k == 1 || k == 4) {
423         lv = (hdr[j] & 0xf) + fflags2;
424         correction_type_sp[0] = s->corrector_type + (lv << 8);
425         correction_lp[0] = correction + (lv << 8);
426         lv = (hdr[j] >> 4) + fflags2;
427         correction_lp[1] = correction + (lv << 8);
428         correction_type_sp[1] = s->corrector_type + (lv << 8);
429       } else {
430         correctionloworder_lp[0] = correctionloworder_lp[1] = correctionloworder + (lv << 8);
431         correctionhighorder_lp[0] = correctionhighorder_lp[1] = correctionhighorder + (lv << 8);
432         correction_type_sp[0] = correction_type_sp[1] = s->corrector_type + (lv << 8);
433         correction_lp[0] = correction_lp[1] = correction + (lv << 8);
434       }
435
436       switch(k) {
437         case 1:
438         case 0:                    /********** CASE 0 **********/
439           for( ; blks_height > 0; blks_height -= 4) {
440             for(lp1 = 0; lp1 < blks_width; lp1++) {
441               for(lp2 = 0; lp2 < 4; ) {
442                 k = *buf1++;
443                 cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2];
444                 ref_lp = ((uint32_t *)ref_frm_pos) + width_tbl[lp2];
445
446                 switch(correction_type_sp[0][k]) {
447                   case 0:
448                     *cur_lp = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
449                     lp2++;
450                     break;
451                   case 1:
452                     res = ((le2me_16(((unsigned short *)(ref_lp))[0]) >> 1) + correction_lp[lp2 & 0x01][*buf1]) << 1;
453                     ((unsigned short *)cur_lp)[0] = le2me_16(res);
454                     res = ((le2me_16(((unsigned short *)(ref_lp))[1]) >> 1) + correction_lp[lp2 & 0x01][k]) << 1;
455                     ((unsigned short *)cur_lp)[1] = le2me_16(res);
456                     buf1++;
457                     lp2++;
458                     break;
459                   case 2:
460                     if(lp2 == 0) {
461                       for(i = 0, j = 0; i < 2; i++, j += width_tbl[1])
462                         cur_lp[j] = ref_lp[j];
463                       lp2 += 2;
464                     }
465                     break;
466                   case 3:
467                     if(lp2 < 2) {
468                       for(i = 0, j = 0; i < (3 - lp2); i++, j += width_tbl[1])
469                         cur_lp[j] = ref_lp[j];
470                       lp2 = 3;
471                     }
472                     break;
473                   case 8:
474                     if(lp2 == 0) {
475                       RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
476
477                       if(rle_v1 == 1 || ref_vectors != NULL) {
478                         for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
479                           cur_lp[j] = ref_lp[j];
480                       }
481
482                       RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
483                       break;
484                     } else {
485                       rle_v1 = 1;
486                       rle_v2 = *buf1 - 1;
487                     }
488                   case 5:
489                       LP2_CHECK(buf1,rle_v3,lp2)
490                   case 4:
491                     for(i = 0, j = 0; i < (4 - lp2); i++, j += width_tbl[1])
492                       cur_lp[j] = ref_lp[j];
493                     lp2 = 4;
494                     break;
495
496                   case 7:
497                     if(rle_v3 != 0)
498                       rle_v3 = 0;
499                     else {
500                       buf1--;
501                       rle_v3 = 1;
502                     }
503                   case 6:
504                     if(ref_vectors != NULL) {
505                       for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
506                         cur_lp[j] = ref_lp[j];
507                     }
508                     lp2 = 4;
509                     break;
510
511                   case 9:
512                     lv1 = *buf1++;
513                     lv = (lv1 & 0x7F) << 1;
514                     lv += (lv << 8);
515                     lv += (lv << 16);
516                     for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
517                       cur_lp[j] = lv;
518
519                     LV1_CHECK(buf1,rle_v3,lv1,lp2)
520                     break;
521                   default:
522                     return;
523                 }
524               }
525
526               cur_frm_pos += 4;
527               ref_frm_pos += 4;
528             }
529
530             cur_frm_pos += ((width - blks_width) * 4);
531             ref_frm_pos += ((width - blks_width) * 4);
532           }
533           break;
534
535         case 4:
536         case 3:                    /********** CASE 3 **********/
537           if(ref_vectors != NULL)
538             return;
539           flag1 = 1;
540
541           for( ; blks_height > 0; blks_height -= 8) {
542             for(lp1 = 0; lp1 < blks_width; lp1++) {
543               for(lp2 = 0; lp2 < 4; ) {
544                 k = *buf1++;
545
546                 cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
547                 ref_lp = ((uint32_t *)cur_frm_pos) + width_tbl[(lp2 * 2) - 1];
548
549                 switch(correction_type_sp[lp2 & 0x01][k]) {
550                   case 0:
551                     cur_lp[width_tbl[1]] = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
552                     if(lp2 > 0 || flag1 == 0 || strip->ypos != 0)
553                       cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
554                     else
555                       cur_lp[0] = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
556                     lp2++;
557                     break;
558
559                   case 1:
560                     res = ((le2me_16(((unsigned short *)ref_lp)[0]) >> 1) + correction_lp[lp2 & 0x01][*buf1]) << 1;
561                     ((unsigned short *)cur_lp)[width_tbl[2]] = le2me_16(res);
562                     res = ((le2me_16(((unsigned short *)ref_lp)[1]) >> 1) + correction_lp[lp2 & 0x01][k]) << 1;
563                     ((unsigned short *)cur_lp)[width_tbl[2]+1] = le2me_16(res);
564
565                     if(lp2 > 0 || flag1 == 0 || strip->ypos != 0)
566                       cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
567                     else
568                       cur_lp[0] = cur_lp[width_tbl[1]];
569                     buf1++;
570                     lp2++;
571                     break;
572
573                   case 2:
574                     if(lp2 == 0) {
575                       for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
576                         cur_lp[j] = *ref_lp;
577                       lp2 += 2;
578                     }
579                     break;
580
581                   case 3:
582                     if(lp2 < 2) {
583                       for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1])
584                         cur_lp[j] = *ref_lp;
585                       lp2 = 3;
586                     }
587                     break;
588
589                   case 6:
590                     lp2 = 4;
591                     break;
592
593                   case 7:
594                     if(rle_v3 != 0)
595                       rle_v3 = 0;
596                     else {
597                       buf1--;
598                       rle_v3 = 1;
599                     }
600                     lp2 = 4;
601                     break;
602
603                   case 8:
604                     if(lp2 == 0) {
605                       RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
606
607                       if(rle_v1 == 1) {
608                         for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
609                           cur_lp[j] = ref_lp[j];
610                       }
611
612                       RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
613                       break;
614                     } else {
615                       rle_v2 = (*buf1) - 1;
616                       rle_v1 = 1;
617                     }
618                   case 5:
619                       LP2_CHECK(buf1,rle_v3,lp2)
620                   case 4:
621                     for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1])
622                       cur_lp[j] = *ref_lp;
623                     lp2 = 4;
624                     break;
625
626                   case 9:
627                     av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
628                     lv1 = *buf1++;
629                     lv = (lv1 & 0x7F) << 1;
630                     lv += (lv << 8);
631                     lv += (lv << 16);
632
633                     for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
634                       cur_lp[j] = lv;
635
636                     LV1_CHECK(buf1,rle_v3,lv1,lp2)
637                     break;
638
639                   default:
640                     return;
641                 }
642               }
643
644               cur_frm_pos += 4;
645             }
646
647             cur_frm_pos += (((width * 2) - blks_width) * 4);
648             flag1 = 0;
649           }
650           break;
651
652         case 10:                    /********** CASE 10 **********/
653           if(ref_vectors == NULL) {
654             flag1 = 1;
655
656             for( ; blks_height > 0; blks_height -= 8) {
657               for(lp1 = 0; lp1 < blks_width; lp1 += 2) {
658                 for(lp2 = 0; lp2 < 4; ) {
659                   k = *buf1++;
660                   cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
661                   ref_lp = ((uint32_t *)cur_frm_pos) + width_tbl[(lp2 * 2) - 1];
662                   lv1 = ref_lp[0];
663                   lv2 = ref_lp[1];
664                   if(lp2 == 0 && flag1 != 0) {
665 #ifdef WORDS_BIGENDIAN
666                     lv1 = lv1 & 0xFF00FF00;
667                     lv1 = (lv1 >> 8) | lv1;
668                     lv2 = lv2 & 0xFF00FF00;
669                     lv2 = (lv2 >> 8) | lv2;
670 #else
671                     lv1 = lv1 & 0x00FF00FF;
672                     lv1 = (lv1 << 8) | lv1;
673                     lv2 = lv2 & 0x00FF00FF;
674                     lv2 = (lv2 << 8) | lv2;
675 #endif
676                   }
677
678                   switch(correction_type_sp[lp2 & 0x01][k]) {
679                     case 0:
680                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(lv1) >> 1) + correctionloworder_lp[lp2 & 0x01][k]) << 1);
681                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(lv2) >> 1) + correctionhighorder_lp[lp2 & 0x01][k]) << 1);
682                       if(lp2 > 0 || strip->ypos != 0 || flag1 == 0) {
683                         cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
684                         cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
685                       } else {
686                         cur_lp[0] = cur_lp[width_tbl[1]];
687                         cur_lp[1] = cur_lp[width_tbl[1]+1];
688                       }
689                       lp2++;
690                       break;
691
692                     case 1:
693                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(lv1) >> 1) + correctionloworder_lp[lp2 & 0x01][*buf1]) << 1);
694                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(lv2) >> 1) + correctionloworder_lp[lp2 & 0x01][k]) << 1);
695                       if(lp2 > 0 || strip->ypos != 0 || flag1 == 0) {
696                         cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
697                         cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
698                       } else {
699                         cur_lp[0] = cur_lp[width_tbl[1]];
700                         cur_lp[1] = cur_lp[width_tbl[1]+1];
701                       }
702                       buf1++;
703                       lp2++;
704                       break;
705
706                     case 2:
707                       if(lp2 == 0) {
708                         if(flag1 != 0) {
709                           for(i = 0, j = width_tbl[1]; i < 3; i++, j += width_tbl[1]) {
710                             cur_lp[j] = lv1;
711                             cur_lp[j+1] = lv2;
712                           }
713                           cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
714                           cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
715                         } else {
716                           for(i = 0, j = 0; i < 4; i++, j += width_tbl[1]) {
717                             cur_lp[j] = lv1;
718                             cur_lp[j+1] = lv2;
719                           }
720                         }
721                         lp2 += 2;
722                       }
723                       break;
724
725                     case 3:
726                       if(lp2 < 2) {
727                         if(lp2 == 0 && flag1 != 0) {
728                           for(i = 0, j = width_tbl[1]; i < 5; i++, j += width_tbl[1]) {
729                             cur_lp[j] = lv1;
730                             cur_lp[j+1] = lv2;
731                           }
732                           cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
733                           cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
734                         } else {
735                           for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1]) {
736                             cur_lp[j] = lv1;
737                             cur_lp[j+1] = lv2;
738                           }
739                         }
740                         lp2 = 3;
741                       }
742                       break;
743
744                     case 8:
745                       if(lp2 == 0) {
746                         RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
747                         if(rle_v1 == 1) {
748                           if(flag1 != 0) {
749                             for(i = 0, j = width_tbl[1]; i < 7; i++, j += width_tbl[1]) {
750                               cur_lp[j] = lv1;
751                               cur_lp[j+1] = lv2;
752                             }
753                             cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
754                             cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
755                           } else {
756                             for(i = 0, j = 0; i < 8; i++, j += width_tbl[1]) {
757                               cur_lp[j] = lv1;
758                               cur_lp[j+1] = lv2;
759                             }
760                           }
761                         }
762                         RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
763                         break;
764                       } else {
765                         rle_v1 = 1;
766                         rle_v2 = (*buf1) - 1;
767                       }
768                     case 5:
769                         LP2_CHECK(buf1,rle_v3,lp2)
770                     case 4:
771                       if(lp2 == 0 && flag1 != 0) {
772                         for(i = 0, j = width_tbl[1]; i < 7; i++, j += width_tbl[1]) {
773                           cur_lp[j] = lv1;
774                           cur_lp[j+1] = lv2;
775                         }
776                         cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
777                         cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
778                       } else {
779                         for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1]) {
780                           cur_lp[j] = lv1;
781                           cur_lp[j+1] = lv2;
782                         }
783                       }
784                       lp2 = 4;
785                       break;
786
787                     case 6:
788                       lp2 = 4;
789                       break;
790
791                     case 7:
792                       if(lp2 == 0) {
793                         if(rle_v3 != 0)
794                           rle_v3 = 0;
795                         else {
796                           buf1--;
797                           rle_v3 = 1;
798                         }
799                         lp2 = 4;
800                       }
801                       break;
802
803                     case 9:
804                       av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
805                       lv1 = *buf1;
806                       lv = (lv1 & 0x7F) << 1;
807                       lv += (lv << 8);
808                       lv += (lv << 16);
809                       for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
810                         cur_lp[j] = lv;
811                       LV1_CHECK(buf1,rle_v3,lv1,lp2)
812                       break;
813
814                     default:
815                       return;
816                   }
817                 }
818
819                 cur_frm_pos += 8;
820               }
821
822               cur_frm_pos += (((width * 2) - blks_width) * 4);
823               flag1 = 0;
824             }
825           } else {
826             for( ; blks_height > 0; blks_height -= 8) {
827               for(lp1 = 0; lp1 < blks_width; lp1 += 2) {
828                 for(lp2 = 0; lp2 < 4; ) {
829                   k = *buf1++;
830                   cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
831                   ref_lp = ((uint32_t *)ref_frm_pos) + width_tbl[lp2 * 2];
832
833                   switch(correction_type_sp[lp2 & 0x01][k]) {
834                     case 0:
835                       lv1 = correctionloworder_lp[lp2 & 0x01][k];
836                       lv2 = correctionhighorder_lp[lp2 & 0x01][k];
837                       cur_lp[0] = le2me_32(((le2me_32(ref_lp[0]) >> 1) + lv1) << 1);
838                       cur_lp[1] = le2me_32(((le2me_32(ref_lp[1]) >> 1) + lv2) << 1);
839                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(ref_lp[width_tbl[1]]) >> 1) + lv1) << 1);
840                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(ref_lp[width_tbl[1]+1]) >> 1) + lv2) << 1);
841                       lp2++;
842                       break;
843
844                     case 1:
845                       lv1 = correctionloworder_lp[lp2 & 0x01][*buf1++];
846                       lv2 = correctionloworder_lp[lp2 & 0x01][k];
847                       cur_lp[0] = le2me_32(((le2me_32(ref_lp[0]) >> 1) + lv1) << 1);
848                       cur_lp[1] = le2me_32(((le2me_32(ref_lp[1]) >> 1) + lv2) << 1);
849                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(ref_lp[width_tbl[1]]) >> 1) + lv1) << 1);
850                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(ref_lp[width_tbl[1]+1]) >> 1) + lv2) << 1);
851                       lp2++;
852                       break;
853
854                     case 2:
855                       if(lp2 == 0) {
856                         for(i = 0, j = 0; i < 4; i++, j += width_tbl[1]) {
857                           cur_lp[j] = ref_lp[j];
858                           cur_lp[j+1] = ref_lp[j+1];
859                         }
860                         lp2 += 2;
861                       }
862                       break;
863
864                     case 3:
865                       if(lp2 < 2) {
866                         for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1]) {
867                           cur_lp[j] = ref_lp[j];
868                           cur_lp[j+1] = ref_lp[j+1];
869                         }
870                         lp2 = 3;
871                       }
872                       break;
873
874                     case 8:
875                       if(lp2 == 0) {
876                         RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
877                         for(i = 0, j = 0; i < 8; i++, j += width_tbl[1]) {
878                           ((uint32_t *)cur_frm_pos)[j] = ((uint32_t *)ref_frm_pos)[j];
879                           ((uint32_t *)cur_frm_pos)[j+1] = ((uint32_t *)ref_frm_pos)[j+1];
880                         }
881                         RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
882                         break;
883                       } else {
884                         rle_v1 = 1;
885                         rle_v2 = (*buf1) - 1;
886                       }
887                     case 5:
888                     case 7:
889                         LP2_CHECK(buf1,rle_v3,lp2)
890                     case 6:
891                     case 4:
892                       for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1]) {
893                         cur_lp[j] = ref_lp[j];
894                         cur_lp[j+1] = ref_lp[j+1];
895                       }
896                       lp2 = 4;
897                       break;
898
899                     case 9:
900                       av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
901                       lv1 = *buf1;
902                       lv = (lv1 & 0x7F) << 1;
903                       lv += (lv << 8);
904                       lv += (lv << 16);
905                       for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
906                         ((uint32_t *)cur_frm_pos)[j] = ((uint32_t *)cur_frm_pos)[j+1] = lv;
907                       LV1_CHECK(buf1,rle_v3,lv1,lp2)
908                       break;
909
910                     default:
911                       return;
912                   }
913                 }
914
915                 cur_frm_pos += 8;
916                 ref_frm_pos += 8;
917               }
918
919               cur_frm_pos += (((width * 2) - blks_width) * 4);
920               ref_frm_pos += (((width * 2) - blks_width) * 4);
921             }
922           }
923           break;
924
925         case 11:                    /********** CASE 11 **********/
926           if(ref_vectors == NULL)
927             return;
928
929           for( ; blks_height > 0; blks_height -= 8) {
930             for(lp1 = 0; lp1 < blks_width; lp1++) {
931               for(lp2 = 0; lp2 < 4; ) {
932                 k = *buf1++;
933                 cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
934                 ref_lp = ((uint32_t *)ref_frm_pos) + width_tbl[lp2 * 2];
935
936                 switch(correction_type_sp[lp2 & 0x01][k]) {
937                   case 0:
938                     cur_lp[0] = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
939                     cur_lp[width_tbl[1]] = le2me_32(((le2me_32(ref_lp[width_tbl[1]]) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
940                     lp2++;
941                     break;
942
943                   case 1:
944                     lv1 = (unsigned short)(correction_lp[lp2 & 0x01][*buf1++]);
945                     lv2 = (unsigned short)(correction_lp[lp2 & 0x01][k]);
946                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[0]) >> 1) + lv1) << 1);
947                     ((unsigned short *)cur_lp)[0] = le2me_16(res);
948                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[1]) >> 1) + lv2) << 1);
949                     ((unsigned short *)cur_lp)[1] = le2me_16(res);
950                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[width_tbl[2]]) >> 1) + lv1) << 1);
951                     ((unsigned short *)cur_lp)[width_tbl[2]] = le2me_16(res);
952                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[width_tbl[2]+1]) >> 1) + lv2) << 1);
953                     ((unsigned short *)cur_lp)[width_tbl[2]+1] = le2me_16(res);
954                     lp2++;
955                     break;
956
957                   case 2:
958                     if(lp2 == 0) {
959                       for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
960                         cur_lp[j] = ref_lp[j];
961                       lp2 += 2;
962                     }
963                     break;
964
965                   case 3:
966                     if(lp2 < 2) {
967                       for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1])
968                         cur_lp[j] = ref_lp[j];
969                       lp2 = 3;
970                     }
971                     break;
972
973                   case 8:
974                     if(lp2 == 0) {
975                       RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
976
977                       for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
978                         cur_lp[j] = ref_lp[j];
979
980                       RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
981                       break;
982                     } else {
983                       rle_v1 = 1;
984                       rle_v2 = (*buf1) - 1;
985                     }
986                   case 5:
987                   case 7:
988                       LP2_CHECK(buf1,rle_v3,lp2)
989                   case 4:
990                   case 6:
991                     for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1])
992                       cur_lp[j] = ref_lp[j];
993                     lp2 = 4;
994                     break;
995
996                 case 9:
997                   av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
998                   lv1 = *buf1++;
999                   lv = (lv1 & 0x7F) << 1;
1000                   lv += (lv << 8);
1001                   lv += (lv << 16);
1002                   for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
1003                     cur_lp[j] = lv;
1004                   LV1_CHECK(buf1,rle_v3,lv1,lp2)
1005                   break;
1006
1007                   default:
1008                     return;
1009                 }
1010               }
1011
1012               cur_frm_pos += 4;
1013               ref_frm_pos += 4;
1014             }
1015
1016             cur_frm_pos += (((width * 2) - blks_width) * 4);
1017             ref_frm_pos += (((width * 2) - blks_width) * 4);
1018           }
1019           break;
1020
1021         default:
1022           return;
1023       }
1024     }
1025
1026     if(strip < strip_tbl)
1027       return;
1028
1029     for( ; strip >= strip_tbl; strip--) {
1030       if(strip->split_flag != 0) {
1031         strip->split_flag = 0;
1032         strip->usl7 = (strip-1)->usl7;
1033
1034         if(strip->split_direction) {
1035           strip->xpos += strip->width;
1036           strip->width = (strip-1)->width - strip->width;
1037           if(region_160_width <= strip->xpos && width < strip->width + strip->xpos)
1038             strip->width = width - strip->xpos;
1039         } else {
1040           strip->ypos += strip->height;
1041           strip->height = (strip-1)->height - strip->height;
1042         }
1043         break;
1044       }
1045     }
1046   }
1047 }
1048
1049 static av_cold int indeo3_decode_init(AVCodecContext *avctx)
1050 {
1051     Indeo3DecodeContext *s = avctx->priv_data;
1052     int ret = 0;
1053
1054     s->avctx = avctx;
1055     s->width = avctx->width;
1056     s->height = avctx->height;
1057     avctx->pix_fmt = PIX_FMT_YUV410P;
1058
1059     if (!(ret = build_modpred(s)))
1060       ret = iv_alloc_frames(s);
1061     if (ret)
1062       iv_free_func(s);
1063
1064     return ret;
1065 }
1066
1067 static int indeo3_decode_frame(AVCodecContext *avctx,
1068                                void *data, int *data_size,
1069                                const uint8_t *buf, int buf_size)
1070 {
1071     Indeo3DecodeContext *s=avctx->priv_data;
1072     uint8_t *src, *dest;
1073     int y;
1074
1075     iv_decode_frame(s, buf, buf_size);
1076
1077     if(s->frame.data[0])
1078         avctx->release_buffer(avctx, &s->frame);
1079
1080     s->frame.reference = 0;
1081     if(avctx->get_buffer(avctx, &s->frame) < 0) {
1082         av_log(s->avctx, AV_LOG_ERROR, "get_buffer() failed\n");
1083         return -1;
1084     }
1085
1086     src = s->cur_frame->Ybuf;
1087     dest = s->frame.data[0];
1088     for (y = 0; y < s->height; y++) {
1089       memcpy(dest, src, s->cur_frame->y_w);
1090       src += s->cur_frame->y_w;
1091       dest += s->frame.linesize[0];
1092     }
1093
1094     if (!(s->avctx->flags & CODEC_FLAG_GRAY))
1095     {
1096     src = s->cur_frame->Ubuf;
1097     dest = s->frame.data[1];
1098     for (y = 0; y < s->height / 4; y++) {
1099       memcpy(dest, src, s->cur_frame->uv_w);
1100       src += s->cur_frame->uv_w;
1101       dest += s->frame.linesize[1];
1102     }
1103
1104     src = s->cur_frame->Vbuf;
1105     dest = s->frame.data[2];
1106     for (y = 0; y < s->height / 4; y++) {
1107       memcpy(dest, src, s->cur_frame->uv_w);
1108       src += s->cur_frame->uv_w;
1109       dest += s->frame.linesize[2];
1110     }
1111     }
1112
1113     *data_size=sizeof(AVFrame);
1114     *(AVFrame*)data= s->frame;
1115
1116     return buf_size;
1117 }
1118
1119 static av_cold int indeo3_decode_end(AVCodecContext *avctx)
1120 {
1121     Indeo3DecodeContext *s = avctx->priv_data;
1122
1123     iv_free_func(s);
1124
1125     return 0;
1126 }
1127
1128 AVCodec indeo3_decoder = {
1129     "indeo3",
1130     CODEC_TYPE_VIDEO,
1131     CODEC_ID_INDEO3,
1132     sizeof(Indeo3DecodeContext),
1133     indeo3_decode_init,
1134     NULL,
1135     indeo3_decode_end,
1136     indeo3_decode_frame,
1137     0,
1138     NULL,
1139     .long_name = NULL_IF_CONFIG_SMALL("Intel Indeo 3"),
1140 };