]> rtime.felk.cvut.cz Git - frescor/ffmpeg.git/blob - libavcodec/indeo3.c
07e9bcc0840c56307f5b4f28104e4a818a75990a
[frescor/ffmpeg.git] / libavcodec / indeo3.c
1 /*
2  * Intel Indeo 3 (IV31, IV32, etc.) video decoder for ffmpeg
3  * written, produced, and directed by Alan Smithee
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include <stdio.h>
23 #include <stdlib.h>
24 #include <string.h>
25 #include <unistd.h>
26
27 #include "avcodec.h"
28 #include "dsputil.h"
29 #include "bytestream.h"
30
31 #include "indeo3data.h"
32
33 typedef struct
34 {
35   uint8_t *Ybuf;
36   uint8_t *Ubuf;
37   uint8_t *Vbuf;
38   uint8_t *the_buf;
39   unsigned int the_buf_size;
40   unsigned short y_w, y_h;
41   unsigned short uv_w, uv_h;
42 } YUVBufs;
43
44 typedef struct Indeo3DecodeContext {
45     AVCodecContext *avctx;
46     int width, height;
47     AVFrame frame;
48
49     YUVBufs iv_frame[2];
50     YUVBufs *cur_frame;
51     YUVBufs *ref_frame;
52
53     uint8_t *ModPred;
54     uint8_t *corrector_type;
55 } Indeo3DecodeContext;
56
57 static const uint8_t corrector_type_0[24] = {
58   195, 159, 133, 115, 101,  93,  87,  77,
59   195, 159, 133, 115, 101,  93,  87,  77,
60   128,  79,  79,  79,  79,  79,  79,  79
61 };
62
63 static const uint8_t corrector_type_2[8] = { 9, 7, 6, 8, 5, 4, 3, 2 };
64
65 static av_cold void build_modpred(Indeo3DecodeContext *s)
66 {
67   int i, j;
68
69   s->ModPred = av_malloc(8 * 128);
70
71   for (i=0; i < 128; ++i) {
72     s->ModPred[i+0*128] = i >  126 ? 254 : 2*(i + 1 - ((i + 1) % 2));
73     s->ModPred[i+1*128] = i ==   7 ?  20 :
74                           i == 119 ||
75                           i == 120 ? 236 : 2*(i + 2 - ((i + 1) % 3));
76     s->ModPred[i+2*128] = i >  125 ? 248 : 2*(i + 2 - ((i + 2) % 4));
77     s->ModPred[i+3*128] =                  2*(i + 1 - ((i - 3) % 5));
78     s->ModPred[i+4*128] = i ==   8 ?  20 : 2*(i + 1 - ((i - 3) % 6));
79     s->ModPred[i+5*128] =                  2*(i + 4 - ((i + 3) % 7));
80     s->ModPred[i+6*128] = i >  123 ? 240 : 2*(i + 4 - ((i + 4) % 8));
81     s->ModPred[i+7*128] =                  2*(i + 5 - ((i + 4) % 9));
82   }
83
84   s->corrector_type = av_malloc(24 * 256);
85
86   for (i=0; i < 24; ++i) {
87     for (j=0; j < 256; ++j) {
88       s->corrector_type[i*256+j] = j < corrector_type_0[i]          ? 1 :
89                                    j < 248 || (i == 16 && j == 248) ? 0 :
90                                    corrector_type_2[j - 248];
91     }
92   }
93 }
94
95 static void iv_Decode_Chunk(Indeo3DecodeContext *s, uint8_t *cur,
96   uint8_t *ref, int width, int height, const uint8_t *buf1,
97   long fflags2, const uint8_t *hdr,
98   const uint8_t *buf2, int min_width_160);
99
100 /* ---------------------------------------------------------------------- */
101 static av_cold void iv_alloc_frames(Indeo3DecodeContext *s)
102 {
103   int luma_width, luma_height, luma_pixels, chroma_width, chroma_height,
104       chroma_pixels, i;
105   unsigned int bufsize;
106
107   luma_width   = (s->width  + 3) & (~3);
108   luma_height  = (s->height + 3) & (~3);
109
110   s->iv_frame[0].y_w = s->iv_frame[0].y_h =
111     s->iv_frame[0].the_buf_size = 0;
112   s->iv_frame[1].y_w = s->iv_frame[1].y_h =
113     s->iv_frame[1].the_buf_size = 0;
114   s->iv_frame[1].the_buf = NULL;
115
116   chroma_width  = ((luma_width >> 2) + 3) & (~3);
117   chroma_height = ((luma_height>> 2) + 3) & (~3);
118   luma_pixels = luma_width * luma_height;
119   chroma_pixels = chroma_width * chroma_height;
120
121   bufsize = luma_pixels * 2 + luma_width * 3 +
122     (chroma_pixels + chroma_width) * 4;
123
124   if((s->iv_frame[0].the_buf =
125     (s->iv_frame[0].the_buf_size == 0 ? av_malloc(bufsize) :
126       av_realloc(s->iv_frame[0].the_buf, bufsize))) == NULL)
127     return;
128   s->iv_frame[0].y_w = s->iv_frame[1].y_w = luma_width;
129   s->iv_frame[0].y_h = s->iv_frame[1].y_h = luma_height;
130   s->iv_frame[0].uv_w = s->iv_frame[1].uv_w = chroma_width;
131   s->iv_frame[0].uv_h = s->iv_frame[1].uv_h = chroma_height;
132   s->iv_frame[0].the_buf_size = bufsize;
133
134   s->iv_frame[0].Ybuf = s->iv_frame[0].the_buf + luma_width;
135   i = luma_pixels + luma_width * 2;
136   s->iv_frame[1].Ybuf = s->iv_frame[0].the_buf + i;
137   i += (luma_pixels + luma_width);
138   s->iv_frame[0].Ubuf = s->iv_frame[0].the_buf + i;
139   i += (chroma_pixels + chroma_width);
140   s->iv_frame[1].Ubuf = s->iv_frame[0].the_buf + i;
141   i += (chroma_pixels + chroma_width);
142   s->iv_frame[0].Vbuf = s->iv_frame[0].the_buf + i;
143   i += (chroma_pixels + chroma_width);
144   s->iv_frame[1].Vbuf = s->iv_frame[0].the_buf + i;
145
146   for(i = 1; i <= luma_width; i++)
147     s->iv_frame[0].Ybuf[-i] = s->iv_frame[1].Ybuf[-i] =
148       s->iv_frame[0].Ubuf[-i] = 0x80;
149
150   for(i = 1; i <= chroma_width; i++) {
151     s->iv_frame[1].Ubuf[-i] = 0x80;
152     s->iv_frame[0].Vbuf[-i] = 0x80;
153     s->iv_frame[1].Vbuf[-i] = 0x80;
154     s->iv_frame[1].Vbuf[chroma_pixels+i-1] = 0x80;
155   }
156 }
157
158 /* ---------------------------------------------------------------------- */
159 static av_cold void iv_free_func(Indeo3DecodeContext *s)
160 {
161   int i;
162
163   for(i = 0 ; i < 2 ; i++) {
164     if(s->iv_frame[i].the_buf != NULL)
165       av_free(s->iv_frame[i].the_buf);
166     s->iv_frame[i].Ybuf = s->iv_frame[i].Ubuf =
167       s->iv_frame[i].Vbuf = NULL;
168     s->iv_frame[i].the_buf = NULL;
169     s->iv_frame[i].the_buf_size = 0;
170     s->iv_frame[i].y_w = s->iv_frame[i].y_h = 0;
171     s->iv_frame[i].uv_w = s->iv_frame[i].uv_h = 0;
172   }
173
174   av_free(s->ModPred);
175   av_free(s->corrector_type);
176 }
177
178 /* ---------------------------------------------------------------------- */
179 static unsigned long iv_decode_frame(Indeo3DecodeContext *s,
180                                      const uint8_t *buf, int buf_size)
181 {
182   unsigned int hdr_width, hdr_height,
183     chroma_width, chroma_height;
184   unsigned long fflags1, fflags2, fflags3, offs1, offs2, offs3, offs;
185   const uint8_t *hdr_pos, *buf_pos;
186
187   buf_pos = buf;
188   buf_pos += 18;
189
190   fflags1 = bytestream_get_le16(&buf_pos);
191   fflags3 = bytestream_get_le32(&buf_pos);
192   fflags2 = *buf_pos++;
193   buf_pos += 3;
194   hdr_height = bytestream_get_le16(&buf_pos);
195   hdr_width  = bytestream_get_le16(&buf_pos);
196
197   if(avcodec_check_dimensions(NULL, hdr_width, hdr_height))
198       return -1;
199
200   chroma_height = ((hdr_height >> 2) + 3) & 0x7ffc;
201   chroma_width = ((hdr_width >> 2) + 3) & 0x7ffc;
202   offs1 = bytestream_get_le32(&buf_pos);
203   offs2 = bytestream_get_le32(&buf_pos);
204   offs3 = bytestream_get_le32(&buf_pos);
205   buf_pos += 4;
206   hdr_pos = buf_pos;
207   if(fflags3 == 0x80) return 4;
208
209   if(fflags1 & 0x200) {
210     s->cur_frame = s->iv_frame + 1;
211     s->ref_frame = s->iv_frame;
212   } else {
213     s->cur_frame = s->iv_frame;
214     s->ref_frame = s->iv_frame + 1;
215   }
216
217   buf_pos = buf + 16 + offs1;
218   offs = bytestream_get_le32(&buf_pos);
219
220   iv_Decode_Chunk(s, s->cur_frame->Ybuf, s->ref_frame->Ybuf, hdr_width,
221     hdr_height, buf_pos + offs * 2, fflags2, hdr_pos, buf_pos,
222     FFMIN(hdr_width, 160));
223
224   if (!(s->avctx->flags & CODEC_FLAG_GRAY))
225   {
226
227   buf_pos = buf + 16 + offs2;
228   offs = bytestream_get_le32(&buf_pos);
229
230   iv_Decode_Chunk(s, s->cur_frame->Vbuf, s->ref_frame->Vbuf, chroma_width,
231     chroma_height, buf_pos + offs * 2, fflags2, hdr_pos, buf_pos,
232     FFMIN(chroma_width, 40));
233
234   buf_pos = buf + 16 + offs3;
235   offs = bytestream_get_le32(&buf_pos);
236
237   iv_Decode_Chunk(s, s->cur_frame->Ubuf, s->ref_frame->Ubuf, chroma_width,
238     chroma_height, buf_pos + offs * 2, fflags2, hdr_pos, buf_pos,
239     FFMIN(chroma_width, 40));
240
241   }
242
243   return 8;
244 }
245
246 typedef struct {
247   long xpos;
248   long ypos;
249   long width;
250   long height;
251   long split_flag;
252   long split_direction;
253   long usl7;
254 } ustr_t;
255
256 /* ---------------------------------------------------------------------- */
257
258 #define LV1_CHECK(buf1,rle_v3,lv1,lp2)  \
259   if((lv1 & 0x80) != 0) {   \
260     if(rle_v3 != 0)         \
261       rle_v3 = 0;           \
262     else {                  \
263       rle_v3 = 1;           \
264       buf1 -= 2;            \
265     }                       \
266   }                         \
267   lp2 = 4;
268
269
270 #define RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)  \
271   if(rle_v3 == 0) {         \
272     rle_v2 = *buf1;         \
273     rle_v1 = 1;             \
274     if(rle_v2 > 32) {       \
275       rle_v2 -= 32;         \
276       rle_v1 = 0;           \
277     }                       \
278     rle_v3 = 1;             \
279   }                         \
280   buf1--;
281
282
283 #define LP2_CHECK(buf1,rle_v3,lp2)  \
284   if(lp2 == 0 && rle_v3 != 0)     \
285     rle_v3 = 0;           \
286   else {                  \
287     buf1--;               \
288     rle_v3 = 1;           \
289   }
290
291
292 #define RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2) \
293   rle_v2--;             \
294   if(rle_v2 == 0) {     \
295     rle_v3 = 0;         \
296     buf1 += 2;          \
297   }                     \
298   lp2 = 4;
299
300 static void iv_Decode_Chunk(Indeo3DecodeContext *s,
301   uint8_t *cur, uint8_t *ref, int width, int height,
302   const uint8_t *buf1, long fflags2, const uint8_t *hdr,
303   const uint8_t *buf2, int min_width_160)
304 {
305   uint8_t bit_buf;
306   unsigned long bit_pos, lv, lv1, lv2;
307   long *width_tbl, width_tbl_arr[10];
308   const signed char *ref_vectors;
309   uint8_t *cur_frm_pos, *ref_frm_pos, *cp, *cp2;
310   uint32_t *cur_lp, *ref_lp;
311   const uint32_t *correction_lp[2], *correctionloworder_lp[2], *correctionhighorder_lp[2];
312   uint8_t *correction_type_sp[2];
313   ustr_t strip_tbl[20], *strip;
314   int i, j, k, lp1, lp2, flag1, cmd, blks_width, blks_height, region_160_width,
315     rle_v1, rle_v2, rle_v3;
316   unsigned short res;
317
318   bit_buf = 0;
319   ref_vectors = NULL;
320
321   width_tbl = width_tbl_arr + 1;
322   i = (width < 0 ? width + 3 : width)/4;
323   for(j = -1; j < 8; j++)
324     width_tbl[j] = i * j;
325
326   strip = strip_tbl;
327
328   for(region_160_width = 0; region_160_width < (width - min_width_160); region_160_width += min_width_160);
329
330   strip->ypos = strip->xpos = 0;
331   for(strip->width = min_width_160; width > strip->width; strip->width *= 2);
332   strip->height = height;
333   strip->split_direction = 0;
334   strip->split_flag = 0;
335   strip->usl7 = 0;
336
337   bit_pos = 0;
338
339   rle_v1 = rle_v2 = rle_v3 = 0;
340
341   while(strip >= strip_tbl) {
342     if(bit_pos <= 0) {
343       bit_pos = 8;
344       bit_buf = *buf1++;
345     }
346
347     bit_pos -= 2;
348     cmd = (bit_buf >> bit_pos) & 0x03;
349
350     if(cmd == 0) {
351       strip++;
352       memcpy(strip, strip-1, sizeof(ustr_t));
353       strip->split_flag = 1;
354       strip->split_direction = 0;
355       strip->height = (strip->height > 8 ? ((strip->height+8)>>4)<<3 : 4);
356       continue;
357     } else if(cmd == 1) {
358       strip++;
359       memcpy(strip, strip-1, sizeof(ustr_t));
360       strip->split_flag = 1;
361       strip->split_direction = 1;
362       strip->width = (strip->width > 8 ? ((strip->width+8)>>4)<<3 : 4);
363       continue;
364     } else if(cmd == 2) {
365       if(strip->usl7 == 0) {
366         strip->usl7 = 1;
367         ref_vectors = NULL;
368         continue;
369       }
370     } else if(cmd == 3) {
371       if(strip->usl7 == 0) {
372         strip->usl7 = 1;
373         ref_vectors = (const signed char*)buf2 + (*buf1 * 2);
374         buf1++;
375         continue;
376       }
377     }
378
379     cur_frm_pos = cur + width * strip->ypos + strip->xpos;
380
381     if((blks_width = strip->width) < 0)
382       blks_width += 3;
383     blks_width >>= 2;
384     blks_height = strip->height;
385
386     if(ref_vectors != NULL) {
387       ref_frm_pos = ref + (ref_vectors[0] + strip->ypos) * width +
388         ref_vectors[1] + strip->xpos;
389     } else
390       ref_frm_pos = cur_frm_pos - width_tbl[4];
391
392     if(cmd == 2) {
393       if(bit_pos <= 0) {
394         bit_pos = 8;
395         bit_buf = *buf1++;
396       }
397
398       bit_pos -= 2;
399       cmd = (bit_buf >> bit_pos) & 0x03;
400
401       if(cmd == 0 || ref_vectors != NULL) {
402         for(lp1 = 0; lp1 < blks_width; lp1++) {
403           for(i = 0, j = 0; i < blks_height; i++, j += width_tbl[1])
404             ((uint32_t *)cur_frm_pos)[j] = ((uint32_t *)ref_frm_pos)[j];
405           cur_frm_pos += 4;
406           ref_frm_pos += 4;
407         }
408       } else if(cmd != 1)
409         return;
410     } else {
411       k = *buf1 >> 4;
412       j = *buf1 & 0x0f;
413       buf1++;
414       lv = j + fflags2;
415
416       if((lv - 8) <= 7 && (k == 0 || k == 3 || k == 10)) {
417         cp2 = s->ModPred + ((lv - 8) << 7);
418         cp = ref_frm_pos;
419         for(i = 0; i < blks_width << 2; i++) {
420             int v = *cp >> 1;
421             *(cp++) = cp2[v];
422         }
423       }
424
425       if(k == 1 || k == 4) {
426         lv = (hdr[j] & 0xf) + fflags2;
427         correction_type_sp[0] = s->corrector_type + (lv << 8);
428         correction_lp[0] = correction + (lv << 8);
429         lv = (hdr[j] >> 4) + fflags2;
430         correction_lp[1] = correction + (lv << 8);
431         correction_type_sp[1] = s->corrector_type + (lv << 8);
432       } else {
433         correctionloworder_lp[0] = correctionloworder_lp[1] = correctionloworder + (lv << 8);
434         correctionhighorder_lp[0] = correctionhighorder_lp[1] = correctionhighorder + (lv << 8);
435         correction_type_sp[0] = correction_type_sp[1] = s->corrector_type + (lv << 8);
436         correction_lp[0] = correction_lp[1] = correction + (lv << 8);
437       }
438
439       switch(k) {
440         case 1:
441         case 0:                    /********** CASE 0 **********/
442           for( ; blks_height > 0; blks_height -= 4) {
443             for(lp1 = 0; lp1 < blks_width; lp1++) {
444               for(lp2 = 0; lp2 < 4; ) {
445                 k = *buf1++;
446                 cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2];
447                 ref_lp = ((uint32_t *)ref_frm_pos) + width_tbl[lp2];
448
449                 switch(correction_type_sp[0][k]) {
450                   case 0:
451                     *cur_lp = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
452                     lp2++;
453                     break;
454                   case 1:
455                     res = ((le2me_16(((unsigned short *)(ref_lp))[0]) >> 1) + correction_lp[lp2 & 0x01][*buf1]) << 1;
456                     ((unsigned short *)cur_lp)[0] = le2me_16(res);
457                     res = ((le2me_16(((unsigned short *)(ref_lp))[1]) >> 1) + correction_lp[lp2 & 0x01][k]) << 1;
458                     ((unsigned short *)cur_lp)[1] = le2me_16(res);
459                     buf1++;
460                     lp2++;
461                     break;
462                   case 2:
463                     if(lp2 == 0) {
464                       for(i = 0, j = 0; i < 2; i++, j += width_tbl[1])
465                         cur_lp[j] = ref_lp[j];
466                       lp2 += 2;
467                     }
468                     break;
469                   case 3:
470                     if(lp2 < 2) {
471                       for(i = 0, j = 0; i < (3 - lp2); i++, j += width_tbl[1])
472                         cur_lp[j] = ref_lp[j];
473                       lp2 = 3;
474                     }
475                     break;
476                   case 8:
477                     if(lp2 == 0) {
478                       RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
479
480                       if(rle_v1 == 1 || ref_vectors != NULL) {
481                         for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
482                           cur_lp[j] = ref_lp[j];
483                       }
484
485                       RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
486                       break;
487                     } else {
488                       rle_v1 = 1;
489                       rle_v2 = *buf1 - 1;
490                     }
491                   case 5:
492                       LP2_CHECK(buf1,rle_v3,lp2)
493                   case 4:
494                     for(i = 0, j = 0; i < (4 - lp2); i++, j += width_tbl[1])
495                       cur_lp[j] = ref_lp[j];
496                     lp2 = 4;
497                     break;
498
499                   case 7:
500                     if(rle_v3 != 0)
501                       rle_v3 = 0;
502                     else {
503                       buf1--;
504                       rle_v3 = 1;
505                     }
506                   case 6:
507                     if(ref_vectors != NULL) {
508                       for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
509                         cur_lp[j] = ref_lp[j];
510                     }
511                     lp2 = 4;
512                     break;
513
514                   case 9:
515                     lv1 = *buf1++;
516                     lv = (lv1 & 0x7F) << 1;
517                     lv += (lv << 8);
518                     lv += (lv << 16);
519                     for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
520                       cur_lp[j] = lv;
521
522                     LV1_CHECK(buf1,rle_v3,lv1,lp2)
523                     break;
524                   default:
525                     return;
526                 }
527               }
528
529               cur_frm_pos += 4;
530               ref_frm_pos += 4;
531             }
532
533             cur_frm_pos += ((width - blks_width) * 4);
534             ref_frm_pos += ((width - blks_width) * 4);
535           }
536           break;
537
538         case 4:
539         case 3:                    /********** CASE 3 **********/
540           if(ref_vectors != NULL)
541             return;
542           flag1 = 1;
543
544           for( ; blks_height > 0; blks_height -= 8) {
545             for(lp1 = 0; lp1 < blks_width; lp1++) {
546               for(lp2 = 0; lp2 < 4; ) {
547                 k = *buf1++;
548
549                 cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
550                 ref_lp = ((uint32_t *)cur_frm_pos) + width_tbl[(lp2 * 2) - 1];
551
552                 switch(correction_type_sp[lp2 & 0x01][k]) {
553                   case 0:
554                     cur_lp[width_tbl[1]] = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
555                     if(lp2 > 0 || flag1 == 0 || strip->ypos != 0)
556                       cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
557                     else
558                       cur_lp[0] = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
559                     lp2++;
560                     break;
561
562                   case 1:
563                     res = ((le2me_16(((unsigned short *)ref_lp)[0]) >> 1) + correction_lp[lp2 & 0x01][*buf1]) << 1;
564                     ((unsigned short *)cur_lp)[width_tbl[2]] = le2me_16(res);
565                     res = ((le2me_16(((unsigned short *)ref_lp)[1]) >> 1) + correction_lp[lp2 & 0x01][k]) << 1;
566                     ((unsigned short *)cur_lp)[width_tbl[2]+1] = le2me_16(res);
567
568                     if(lp2 > 0 || flag1 == 0 || strip->ypos != 0)
569                       cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
570                     else
571                       cur_lp[0] = cur_lp[width_tbl[1]];
572                     buf1++;
573                     lp2++;
574                     break;
575
576                   case 2:
577                     if(lp2 == 0) {
578                       for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
579                         cur_lp[j] = *ref_lp;
580                       lp2 += 2;
581                     }
582                     break;
583
584                   case 3:
585                     if(lp2 < 2) {
586                       for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1])
587                         cur_lp[j] = *ref_lp;
588                       lp2 = 3;
589                     }
590                     break;
591
592                   case 6:
593                     lp2 = 4;
594                     break;
595
596                   case 7:
597                     if(rle_v3 != 0)
598                       rle_v3 = 0;
599                     else {
600                       buf1--;
601                       rle_v3 = 1;
602                     }
603                     lp2 = 4;
604                     break;
605
606                   case 8:
607                     if(lp2 == 0) {
608                       RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
609
610                       if(rle_v1 == 1) {
611                         for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
612                           cur_lp[j] = ref_lp[j];
613                       }
614
615                       RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
616                       break;
617                     } else {
618                       rle_v2 = (*buf1) - 1;
619                       rle_v1 = 1;
620                     }
621                   case 5:
622                       LP2_CHECK(buf1,rle_v3,lp2)
623                   case 4:
624                     for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1])
625                       cur_lp[j] = *ref_lp;
626                     lp2 = 4;
627                     break;
628
629                   case 9:
630                     av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
631                     lv1 = *buf1++;
632                     lv = (lv1 & 0x7F) << 1;
633                     lv += (lv << 8);
634                     lv += (lv << 16);
635
636                     for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
637                       cur_lp[j] = lv;
638
639                     LV1_CHECK(buf1,rle_v3,lv1,lp2)
640                     break;
641
642                   default:
643                     return;
644                 }
645               }
646
647               cur_frm_pos += 4;
648             }
649
650             cur_frm_pos += (((width * 2) - blks_width) * 4);
651             flag1 = 0;
652           }
653           break;
654
655         case 10:                    /********** CASE 10 **********/
656           if(ref_vectors == NULL) {
657             flag1 = 1;
658
659             for( ; blks_height > 0; blks_height -= 8) {
660               for(lp1 = 0; lp1 < blks_width; lp1 += 2) {
661                 for(lp2 = 0; lp2 < 4; ) {
662                   k = *buf1++;
663                   cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
664                   ref_lp = ((uint32_t *)cur_frm_pos) + width_tbl[(lp2 * 2) - 1];
665                   lv1 = ref_lp[0];
666                   lv2 = ref_lp[1];
667                   if(lp2 == 0 && flag1 != 0) {
668 #ifdef WORDS_BIGENDIAN
669                     lv1 = lv1 & 0xFF00FF00;
670                     lv1 = (lv1 >> 8) | lv1;
671                     lv2 = lv2 & 0xFF00FF00;
672                     lv2 = (lv2 >> 8) | lv2;
673 #else
674                     lv1 = lv1 & 0x00FF00FF;
675                     lv1 = (lv1 << 8) | lv1;
676                     lv2 = lv2 & 0x00FF00FF;
677                     lv2 = (lv2 << 8) | lv2;
678 #endif
679                   }
680
681                   switch(correction_type_sp[lp2 & 0x01][k]) {
682                     case 0:
683                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(lv1) >> 1) + correctionloworder_lp[lp2 & 0x01][k]) << 1);
684                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(lv2) >> 1) + correctionhighorder_lp[lp2 & 0x01][k]) << 1);
685                       if(lp2 > 0 || strip->ypos != 0 || flag1 == 0) {
686                         cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
687                         cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
688                       } else {
689                         cur_lp[0] = cur_lp[width_tbl[1]];
690                         cur_lp[1] = cur_lp[width_tbl[1]+1];
691                       }
692                       lp2++;
693                       break;
694
695                     case 1:
696                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(lv1) >> 1) + correctionloworder_lp[lp2 & 0x01][*buf1]) << 1);
697                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(lv2) >> 1) + correctionloworder_lp[lp2 & 0x01][k]) << 1);
698                       if(lp2 > 0 || strip->ypos != 0 || flag1 == 0) {
699                         cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
700                         cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
701                       } else {
702                         cur_lp[0] = cur_lp[width_tbl[1]];
703                         cur_lp[1] = cur_lp[width_tbl[1]+1];
704                       }
705                       buf1++;
706                       lp2++;
707                       break;
708
709                     case 2:
710                       if(lp2 == 0) {
711                         if(flag1 != 0) {
712                           for(i = 0, j = width_tbl[1]; i < 3; i++, j += width_tbl[1]) {
713                             cur_lp[j] = lv1;
714                             cur_lp[j+1] = lv2;
715                           }
716                           cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
717                           cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
718                         } else {
719                           for(i = 0, j = 0; i < 4; i++, j += width_tbl[1]) {
720                             cur_lp[j] = lv1;
721                             cur_lp[j+1] = lv2;
722                           }
723                         }
724                         lp2 += 2;
725                       }
726                       break;
727
728                     case 3:
729                       if(lp2 < 2) {
730                         if(lp2 == 0 && flag1 != 0) {
731                           for(i = 0, j = width_tbl[1]; i < 5; i++, j += width_tbl[1]) {
732                             cur_lp[j] = lv1;
733                             cur_lp[j+1] = lv2;
734                           }
735                           cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
736                           cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
737                         } else {
738                           for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1]) {
739                             cur_lp[j] = lv1;
740                             cur_lp[j+1] = lv2;
741                           }
742                         }
743                         lp2 = 3;
744                       }
745                       break;
746
747                     case 8:
748                       if(lp2 == 0) {
749                         RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
750                         if(rle_v1 == 1) {
751                           if(flag1 != 0) {
752                             for(i = 0, j = width_tbl[1]; i < 7; i++, j += width_tbl[1]) {
753                               cur_lp[j] = lv1;
754                               cur_lp[j+1] = lv2;
755                             }
756                             cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
757                             cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
758                           } else {
759                             for(i = 0, j = 0; i < 8; i++, j += width_tbl[1]) {
760                               cur_lp[j] = lv1;
761                               cur_lp[j+1] = lv2;
762                             }
763                           }
764                         }
765                         RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
766                         break;
767                       } else {
768                         rle_v1 = 1;
769                         rle_v2 = (*buf1) - 1;
770                       }
771                     case 5:
772                         LP2_CHECK(buf1,rle_v3,lp2)
773                     case 4:
774                       if(lp2 == 0 && flag1 != 0) {
775                         for(i = 0, j = width_tbl[1]; i < 7; i++, j += width_tbl[1]) {
776                           cur_lp[j] = lv1;
777                           cur_lp[j+1] = lv2;
778                         }
779                         cur_lp[0] = ((cur_lp[-width_tbl[1]] >> 1) + (cur_lp[width_tbl[1]] >> 1)) & 0xFEFEFEFE;
780                         cur_lp[1] = ((cur_lp[-width_tbl[1]+1] >> 1) + (cur_lp[width_tbl[1]+1] >> 1)) & 0xFEFEFEFE;
781                       } else {
782                         for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1]) {
783                           cur_lp[j] = lv1;
784                           cur_lp[j+1] = lv2;
785                         }
786                       }
787                       lp2 = 4;
788                       break;
789
790                     case 6:
791                       lp2 = 4;
792                       break;
793
794                     case 7:
795                       if(lp2 == 0) {
796                         if(rle_v3 != 0)
797                           rle_v3 = 0;
798                         else {
799                           buf1--;
800                           rle_v3 = 1;
801                         }
802                         lp2 = 4;
803                       }
804                       break;
805
806                     case 9:
807                       av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
808                       lv1 = *buf1;
809                       lv = (lv1 & 0x7F) << 1;
810                       lv += (lv << 8);
811                       lv += (lv << 16);
812                       for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
813                         cur_lp[j] = lv;
814                       LV1_CHECK(buf1,rle_v3,lv1,lp2)
815                       break;
816
817                     default:
818                       return;
819                   }
820                 }
821
822                 cur_frm_pos += 8;
823               }
824
825               cur_frm_pos += (((width * 2) - blks_width) * 4);
826               flag1 = 0;
827             }
828           } else {
829             for( ; blks_height > 0; blks_height -= 8) {
830               for(lp1 = 0; lp1 < blks_width; lp1 += 2) {
831                 for(lp2 = 0; lp2 < 4; ) {
832                   k = *buf1++;
833                   cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
834                   ref_lp = ((uint32_t *)ref_frm_pos) + width_tbl[lp2 * 2];
835
836                   switch(correction_type_sp[lp2 & 0x01][k]) {
837                     case 0:
838                       lv1 = correctionloworder_lp[lp2 & 0x01][k];
839                       lv2 = correctionhighorder_lp[lp2 & 0x01][k];
840                       cur_lp[0] = le2me_32(((le2me_32(ref_lp[0]) >> 1) + lv1) << 1);
841                       cur_lp[1] = le2me_32(((le2me_32(ref_lp[1]) >> 1) + lv2) << 1);
842                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(ref_lp[width_tbl[1]]) >> 1) + lv1) << 1);
843                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(ref_lp[width_tbl[1]+1]) >> 1) + lv2) << 1);
844                       lp2++;
845                       break;
846
847                     case 1:
848                       lv1 = correctionloworder_lp[lp2 & 0x01][*buf1++];
849                       lv2 = correctionloworder_lp[lp2 & 0x01][k];
850                       cur_lp[0] = le2me_32(((le2me_32(ref_lp[0]) >> 1) + lv1) << 1);
851                       cur_lp[1] = le2me_32(((le2me_32(ref_lp[1]) >> 1) + lv2) << 1);
852                       cur_lp[width_tbl[1]] = le2me_32(((le2me_32(ref_lp[width_tbl[1]]) >> 1) + lv1) << 1);
853                       cur_lp[width_tbl[1]+1] = le2me_32(((le2me_32(ref_lp[width_tbl[1]+1]) >> 1) + lv2) << 1);
854                       lp2++;
855                       break;
856
857                     case 2:
858                       if(lp2 == 0) {
859                         for(i = 0, j = 0; i < 4; i++, j += width_tbl[1]) {
860                           cur_lp[j] = ref_lp[j];
861                           cur_lp[j+1] = ref_lp[j+1];
862                         }
863                         lp2 += 2;
864                       }
865                       break;
866
867                     case 3:
868                       if(lp2 < 2) {
869                         for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1]) {
870                           cur_lp[j] = ref_lp[j];
871                           cur_lp[j+1] = ref_lp[j+1];
872                         }
873                         lp2 = 3;
874                       }
875                       break;
876
877                     case 8:
878                       if(lp2 == 0) {
879                         RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
880                         for(i = 0, j = 0; i < 8; i++, j += width_tbl[1]) {
881                           ((uint32_t *)cur_frm_pos)[j] = ((uint32_t *)ref_frm_pos)[j];
882                           ((uint32_t *)cur_frm_pos)[j+1] = ((uint32_t *)ref_frm_pos)[j+1];
883                         }
884                         RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
885                         break;
886                       } else {
887                         rle_v1 = 1;
888                         rle_v2 = (*buf1) - 1;
889                       }
890                     case 5:
891                     case 7:
892                         LP2_CHECK(buf1,rle_v3,lp2)
893                     case 6:
894                     case 4:
895                       for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1]) {
896                         cur_lp[j] = ref_lp[j];
897                         cur_lp[j+1] = ref_lp[j+1];
898                       }
899                       lp2 = 4;
900                       break;
901
902                     case 9:
903                       av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
904                       lv1 = *buf1;
905                       lv = (lv1 & 0x7F) << 1;
906                       lv += (lv << 8);
907                       lv += (lv << 16);
908                       for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
909                         ((uint32_t *)cur_frm_pos)[j] = ((uint32_t *)cur_frm_pos)[j+1] = lv;
910                       LV1_CHECK(buf1,rle_v3,lv1,lp2)
911                       break;
912
913                     default:
914                       return;
915                   }
916                 }
917
918                 cur_frm_pos += 8;
919                 ref_frm_pos += 8;
920               }
921
922               cur_frm_pos += (((width * 2) - blks_width) * 4);
923               ref_frm_pos += (((width * 2) - blks_width) * 4);
924             }
925           }
926           break;
927
928         case 11:                    /********** CASE 11 **********/
929           if(ref_vectors == NULL)
930             return;
931
932           for( ; blks_height > 0; blks_height -= 8) {
933             for(lp1 = 0; lp1 < blks_width; lp1++) {
934               for(lp2 = 0; lp2 < 4; ) {
935                 k = *buf1++;
936                 cur_lp = ((uint32_t *)cur_frm_pos) + width_tbl[lp2 * 2];
937                 ref_lp = ((uint32_t *)ref_frm_pos) + width_tbl[lp2 * 2];
938
939                 switch(correction_type_sp[lp2 & 0x01][k]) {
940                   case 0:
941                     cur_lp[0] = le2me_32(((le2me_32(*ref_lp) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
942                     cur_lp[width_tbl[1]] = le2me_32(((le2me_32(ref_lp[width_tbl[1]]) >> 1) + correction_lp[lp2 & 0x01][k]) << 1);
943                     lp2++;
944                     break;
945
946                   case 1:
947                     lv1 = (unsigned short)(correction_lp[lp2 & 0x01][*buf1++]);
948                     lv2 = (unsigned short)(correction_lp[lp2 & 0x01][k]);
949                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[0]) >> 1) + lv1) << 1);
950                     ((unsigned short *)cur_lp)[0] = le2me_16(res);
951                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[1]) >> 1) + lv2) << 1);
952                     ((unsigned short *)cur_lp)[1] = le2me_16(res);
953                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[width_tbl[2]]) >> 1) + lv1) << 1);
954                     ((unsigned short *)cur_lp)[width_tbl[2]] = le2me_16(res);
955                     res = (unsigned short)(((le2me_16(((unsigned short *)ref_lp)[width_tbl[2]+1]) >> 1) + lv2) << 1);
956                     ((unsigned short *)cur_lp)[width_tbl[2]+1] = le2me_16(res);
957                     lp2++;
958                     break;
959
960                   case 2:
961                     if(lp2 == 0) {
962                       for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
963                         cur_lp[j] = ref_lp[j];
964                       lp2 += 2;
965                     }
966                     break;
967
968                   case 3:
969                     if(lp2 < 2) {
970                       for(i = 0, j = 0; i < 6 - (lp2 * 2); i++, j += width_tbl[1])
971                         cur_lp[j] = ref_lp[j];
972                       lp2 = 3;
973                     }
974                     break;
975
976                   case 8:
977                     if(lp2 == 0) {
978                       RLE_V3_CHECK(buf1,rle_v1,rle_v2,rle_v3)
979
980                       for(i = 0, j = 0; i < 8; i++, j += width_tbl[1])
981                         cur_lp[j] = ref_lp[j];
982
983                       RLE_V2_CHECK(buf1,rle_v2, rle_v3,lp2)
984                       break;
985                     } else {
986                       rle_v1 = 1;
987                       rle_v2 = (*buf1) - 1;
988                     }
989                   case 5:
990                   case 7:
991                       LP2_CHECK(buf1,rle_v3,lp2)
992                   case 4:
993                   case 6:
994                     for(i = 0, j = 0; i < 8 - (lp2 * 2); i++, j += width_tbl[1])
995                       cur_lp[j] = ref_lp[j];
996                     lp2 = 4;
997                     break;
998
999                 case 9:
1000                   av_log(s->avctx, AV_LOG_ERROR, "UNTESTED.\n");
1001                   lv1 = *buf1++;
1002                   lv = (lv1 & 0x7F) << 1;
1003                   lv += (lv << 8);
1004                   lv += (lv << 16);
1005                   for(i = 0, j = 0; i < 4; i++, j += width_tbl[1])
1006                     cur_lp[j] = lv;
1007                   LV1_CHECK(buf1,rle_v3,lv1,lp2)
1008                   break;
1009
1010                   default:
1011                     return;
1012                 }
1013               }
1014
1015               cur_frm_pos += 4;
1016               ref_frm_pos += 4;
1017             }
1018
1019             cur_frm_pos += (((width * 2) - blks_width) * 4);
1020             ref_frm_pos += (((width * 2) - blks_width) * 4);
1021           }
1022           break;
1023
1024         default:
1025           return;
1026       }
1027     }
1028
1029     if(strip < strip_tbl)
1030       return;
1031
1032     for( ; strip >= strip_tbl; strip--) {
1033       if(strip->split_flag != 0) {
1034         strip->split_flag = 0;
1035         strip->usl7 = (strip-1)->usl7;
1036
1037         if(strip->split_direction) {
1038           strip->xpos += strip->width;
1039           strip->width = (strip-1)->width - strip->width;
1040           if(region_160_width <= strip->xpos && width < strip->width + strip->xpos)
1041             strip->width = width - strip->xpos;
1042         } else {
1043           strip->ypos += strip->height;
1044           strip->height = (strip-1)->height - strip->height;
1045         }
1046         break;
1047       }
1048     }
1049   }
1050 }
1051
1052 static av_cold int indeo3_decode_init(AVCodecContext *avctx)
1053 {
1054     Indeo3DecodeContext *s = avctx->priv_data;
1055
1056     s->avctx = avctx;
1057     s->width = avctx->width;
1058     s->height = avctx->height;
1059     avctx->pix_fmt = PIX_FMT_YUV410P;
1060
1061     build_modpred(s);
1062     iv_alloc_frames(s);
1063
1064     return 0;
1065 }
1066
1067 static int indeo3_decode_frame(AVCodecContext *avctx,
1068                                void *data, int *data_size,
1069                                const uint8_t *buf, int buf_size)
1070 {
1071     Indeo3DecodeContext *s=avctx->priv_data;
1072     uint8_t *src, *dest;
1073     int y;
1074
1075     iv_decode_frame(s, buf, buf_size);
1076
1077     if(s->frame.data[0])
1078         avctx->release_buffer(avctx, &s->frame);
1079
1080     s->frame.reference = 0;
1081     if(avctx->get_buffer(avctx, &s->frame) < 0) {
1082         av_log(s->avctx, AV_LOG_ERROR, "get_buffer() failed\n");
1083         return -1;
1084     }
1085
1086     src = s->cur_frame->Ybuf;
1087     dest = s->frame.data[0];
1088     for (y = 0; y < s->height; y++) {
1089       memcpy(dest, src, s->cur_frame->y_w);
1090       src += s->cur_frame->y_w;
1091       dest += s->frame.linesize[0];
1092     }
1093
1094     if (!(s->avctx->flags & CODEC_FLAG_GRAY))
1095     {
1096     src = s->cur_frame->Ubuf;
1097     dest = s->frame.data[1];
1098     for (y = 0; y < s->height / 4; y++) {
1099       memcpy(dest, src, s->cur_frame->uv_w);
1100       src += s->cur_frame->uv_w;
1101       dest += s->frame.linesize[1];
1102     }
1103
1104     src = s->cur_frame->Vbuf;
1105     dest = s->frame.data[2];
1106     for (y = 0; y < s->height / 4; y++) {
1107       memcpy(dest, src, s->cur_frame->uv_w);
1108       src += s->cur_frame->uv_w;
1109       dest += s->frame.linesize[2];
1110     }
1111     }
1112
1113     *data_size=sizeof(AVFrame);
1114     *(AVFrame*)data= s->frame;
1115
1116     return buf_size;
1117 }
1118
1119 static av_cold int indeo3_decode_end(AVCodecContext *avctx)
1120 {
1121     Indeo3DecodeContext *s = avctx->priv_data;
1122
1123     iv_free_func(s);
1124
1125     return 0;
1126 }
1127
1128 AVCodec indeo3_decoder = {
1129     "indeo3",
1130     CODEC_TYPE_VIDEO,
1131     CODEC_ID_INDEO3,
1132     sizeof(Indeo3DecodeContext),
1133     indeo3_decode_init,
1134     NULL,
1135     indeo3_decode_end,
1136     indeo3_decode_frame,
1137     0,
1138     NULL,
1139     .long_name = NULL_IF_CONFIG_SMALL("Intel Indeo 3"),
1140 };