[svn] / trunk / xvidcore / src / image / image.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/src/image/image.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 851, Sat Feb 15 15:22:19 2003 UTC revision 1815, Fri Nov 28 10:58:07 2008 UTC
# Line 1  Line 1 
1  /**************************************************************************  /**************************************************************************
2   *   *
3   *      XVID MPEG-4 VIDEO CODEC   *      XVID MPEG-4 VIDEO CODEC
4   *      image stuff   *  - Image management functions -
5   *   *
6   *      This program is an implementation of a part of one or more MPEG-4   *  Copyright(C) 2001-2004 Peter Ross <pross@xvid.org>
  *      Video tools as specified in ISO/IEC 14496-2 standard.  Those intending  
  *      to use this software module in hardware or software products are  
  *      advised that its use may infringe existing patents or copyrights, and  
  *      any such use would be at such party's own risk.  The original  
  *      developer of this software module and his/her company, and subsequent  
  *      editors and their companies, will have no liability for use of this  
  *      software or modifications or derivatives thereof.  
7   *   *
8   *      This program is free software; you can redistribute it and/or modify   *      This program is free software; you can redistribute it and/or modify
9   *      it under the terms of the GNU General Public License as published by   *      it under the terms of the GNU General Public License as published by
# Line 24  Line 17 
17   *   *
18   *      You should have received a copy of the GNU General Public License   *      You should have received a copy of the GNU General Public License
19   *      along with this program; if not, write to the Free Software   *      along with this program; if not, write to the Free Software
20   *      Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22   *************************************************************************/   * $Id: image.c,v 1.43 2008-11-28 10:58:07 Isibaar Exp $
   
 /**************************************************************************  
  *  
  *      History:  
23   *   *
24   *  05.10.2002  support for interpolated images in qpel mode - Isibaar   ****************************************************************************/
  *      01.05.2002      BFRAME image-based u,v interpolation  
  *  22.04.2002  added some B-frame support  
  *      14.04.2002      added image_dump_yuvpgm(), added image_mad()  
  *              XVID_CSP_USER input support  
  *  09.04.2002  PSNR calculations - Isibaar  
  *      06.04.2002      removed interlaced edging from U,V blocks (as per spec)  
  *  26.03.2002  interlacing support (field-based edging in set_edges)  
  *      26.01.2002      rgb555, rgb565  
  *      07.01.2001      commented u,v interpolation (not required for uv-block-based)  
  *  23.12.2001  removed #ifdefs, added function pointers + init_common()  
  *      22.12.2001      cpu #ifdefs  
  *  19.12.2001  image_dump(); useful for debugging  
  *       6.12.2001      inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>  
  *  
  *************************************************************************/  
25    
26  #include <stdlib.h>  #include <stdlib.h>
27  #include <string.h>                             // memcpy, memset  #include <string.h>                             /* memcpy, memset */
28  #include <math.h>  #include <math.h>
   
29  #include "../portab.h"  #include "../portab.h"
30  #include "../global.h"                  // XVID_CSP_XXX's  #include "../global.h"                  /* XVID_CSP_XXX's */
31  #include "../xvid.h"                    // XVID_CSP_XXX's  #include "../xvid.h"                    /* XVID_CSP_XXX's */
32  #include "image.h"  #include "image.h"
33  #include "colorspace.h"  #include "colorspace.h"
34  #include "interpolate8x8.h"  #include "interpolate8x8.h"
 #include "reduced.h"  
 #include "../divx4.h"  
35  #include "../utils/mem_align.h"  #include "../utils/mem_align.h"
36    #include "../motion/sad.h"
37    #include "../utils/emms.h"
38    
39  #include "font.h"               // XXX: remove later  #include "font.h"               /* XXX: remove later */
40    
41  #define SAFETY  64  #define SAFETY  64
42  #define EDGE_SIZE2  (EDGE_SIZE/2)  #define EDGE_SIZE2  (EDGE_SIZE/2)
# Line 76  Line 49 
49  {  {
50          const uint32_t edged_width2 = edged_width / 2;          const uint32_t edged_width2 = edged_width / 2;
51          const uint32_t edged_height2 = edged_height / 2;          const uint32_t edged_height2 = edged_height / 2;
         uint32_t i;  
52    
53          image->y =          image->y =
54                  xvid_malloc(edged_width * (edged_height + 1) + SAFETY, CACHE_LINE);                  xvid_malloc(edged_width * (edged_height + 1) + SAFETY, CACHE_LINE);
55          if (image->y == NULL) {          if (image->y == NULL) {
56                  return -1;                  return -1;
57          }          }
58            memset(image->y, 0, edged_width * (edged_height + 1) + SAFETY);
         for (i = 0; i < edged_width * edged_height + SAFETY; i++) {  
                 image->y[i] = 0;  
         }  
59    
60          image->u = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);          image->u = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);
61          if (image->u == NULL) {          if (image->u == NULL) {
62                  xvid_free(image->y);                  xvid_free(image->y);
63                    image->y = NULL;
64                  return -1;                  return -1;
65          }          }
66            memset(image->u, 0, edged_width2 * edged_height2 + SAFETY);
67    
68          image->v = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);          image->v = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);
69          if (image->v == NULL) {          if (image->v == NULL) {
70                  xvid_free(image->u);                  xvid_free(image->u);
71                    image->u = NULL;
72                  xvid_free(image->y);                  xvid_free(image->y);
73                    image->y = NULL;
74                  return -1;                  return -1;
75          }          }
76            memset(image->v, 0, edged_width2 * edged_height2 + SAFETY);
77    
78          image->y += EDGE_SIZE * edged_width + EDGE_SIZE;          image->y += EDGE_SIZE * edged_width + EDGE_SIZE;
79          image->u += EDGE_SIZE2 * edged_width2 + EDGE_SIZE2;          image->u += EDGE_SIZE2 * edged_width2 + EDGE_SIZE2;
# Line 118  Line 93 
93    
94          if (image->y) {          if (image->y) {
95                  xvid_free(image->y - (EDGE_SIZE * edged_width + EDGE_SIZE));                  xvid_free(image->y - (EDGE_SIZE * edged_width + EDGE_SIZE));
96                    image->y = NULL;
97          }          }
98          if (image->u) {          if (image->u) {
99                  xvid_free(image->u - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));                  xvid_free(image->u - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));
100                    image->u = NULL;
101          }          }
102          if (image->v) {          if (image->v) {
103                  xvid_free(image->v - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));                  xvid_free(image->v - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));
104                    image->v = NULL;
105          }          }
106  }  }
107    
# Line 132  Line 110 
110  image_swap(IMAGE * image1,  image_swap(IMAGE * image1,
111                     IMAGE * image2)                     IMAGE * image2)
112  {  {
113          uint8_t *tmp;      SWAP(uint8_t*, image1->y, image2->y);
114        SWAP(uint8_t*, image1->u, image2->u);
115          tmp = image1->y;      SWAP(uint8_t*, image1->v, image2->v);
         image1->y = image2->y;  
         image2->y = tmp;  
   
         tmp = image1->u;  
         image1->u = image2->u;  
         image2->u = tmp;  
   
         tmp = image1->v;  
         image1->v = image2->v;  
         image2->v = tmp;  
116  }  }
117    
118    
# Line 159  Line 127 
127          memcpy(image1->v, image2->v, edged_width * height / 4);          memcpy(image1->v, image2->v, edged_width * height / 4);
128  }  }
129    
130    /* setedges bug was fixed in this BS version */
131    #define SETEDGES_BUG_BEFORE             18
132    
133  void  void
134  image_setedges(IMAGE * image,  image_setedges(IMAGE * image,
135                             uint32_t edged_width,                             uint32_t edged_width,
136                             uint32_t edged_height,                             uint32_t edged_height,
137                             uint32_t width,                             uint32_t width,
138                             uint32_t height)                             uint32_t height,
139                               int bs_version)
140  {  {
141          const uint32_t edged_width2 = edged_width / 2;          const uint32_t edged_width2 = edged_width / 2;
142          const uint32_t width2 = width / 2;          uint32_t width2;
143          uint32_t i;          uint32_t i;
144          uint8_t *dst;          uint8_t *dst;
145          uint8_t *src;          uint8_t *src;
146    
   
147          dst = image->y - (EDGE_SIZE + EDGE_SIZE * edged_width);          dst = image->y - (EDGE_SIZE + EDGE_SIZE * edged_width);
148          src = image->y;          src = image->y;
149    
150            /* According to the Standard Clause 7.6.4, padding is done starting at 16
151             * pixel width and height multiples. This was not respected in old xvids */
152            if (bs_version == 0 || bs_version >= SETEDGES_BUG_BEFORE) {
153                    width  = (width+15)&~15;
154                    height = (height+15)&~15;
155            }
156    
157            width2 = width/2;
158    
159          for (i = 0; i < EDGE_SIZE; i++) {          for (i = 0; i < EDGE_SIZE; i++) {
160                  memset(dst, *src, EDGE_SIZE);                  memset(dst, *src, EDGE_SIZE);
161                  memcpy(dst + EDGE_SIZE, src, width);                  memcpy(dst + EDGE_SIZE, src, width);
# Line 202  Line 181 
181          }          }
182    
183    
184  //U          /* U */
185          dst = image->u - (EDGE_SIZE2 + EDGE_SIZE2 * edged_width2);          dst = image->u - (EDGE_SIZE2 + EDGE_SIZE2 * edged_width2);
186          src = image->u;          src = image->u;
187    
# Line 230  Line 209 
209          }          }
210    
211    
212  // V          /* V */
213          dst = image->v - (EDGE_SIZE2 + EDGE_SIZE2 * edged_width2);          dst = image->v - (EDGE_SIZE2 + EDGE_SIZE2 * edged_width2);
214          src = image->v;          src = image->v;
215    
# Line 258  Line 237 
237          }          }
238  }  }
239    
 // bframe encoding requires image-based u,v interpolation  
240  void  void
241  image_interpolate(const IMAGE * refn,  image_interpolate(const uint8_t * refn,
242                                    IMAGE * refh,                                    uint8_t * refh,
243                                    IMAGE * refv,                                    uint8_t * refv,
244                                    IMAGE * refhv,                                    uint8_t * refhv,
245                                    uint32_t edged_width,                                    uint32_t edged_width,
246                                    uint32_t edged_height,                                    uint32_t edged_height,
247                                    uint32_t quarterpel,                                    uint32_t quarterpel,
248                                    uint32_t rounding)                                    uint32_t rounding)
249  {  {
250          const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); // we only interpolate half of the edge area          const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); /* we only interpolate half of the edge area */
251          const uint32_t stride_add = 7 * edged_width;          const uint32_t stride_add = 7 * edged_width;
 /*  
 #ifdef BFRAMES  
         const uint32_t edged_width2 = edged_width / 2;  
         const uint32_t edged_height2 = edged_height / 2;  
         const uint32_t offset2 = EDGE_SIZE2 * (edged_width2 + 1);  
         const uint32_t stride_add2 = 7 * edged_width2;  
 #endif  
 */  
         uint8_t *n_ptr, *h_ptr, *v_ptr, *hv_ptr;  
         uint32_t x, y;  
252    
253            uint8_t *n_ptr;
254            uint8_t *h_ptr, *v_ptr, *hv_ptr;
255            uint32_t x, y;
256    
257          n_ptr = refn->y;          n_ptr = (uint8_t*)refn;
258          h_ptr = refh->y;          h_ptr = refh;
259          v_ptr = refv->y;          v_ptr = refv;
         hv_ptr = refhv->y;  
260    
261          n_ptr -= offset;          n_ptr -= offset;
262          h_ptr -= offset;          h_ptr -= offset;
263          v_ptr -= offset;          v_ptr -= offset;
         hv_ptr -= offset;  
264    
265            /* Note we initialize the hv pointer later, as we can optimize code a bit
266             * doing it down to up in quarterpel and up to down in halfpel */
267          if(quarterpel) {          if(quarterpel) {
268    
269                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
# Line 314  Line 285 
285                          n_ptr += stride_add;                          n_ptr += stride_add;
286                  }                  }
287    
288                  h_ptr = refh->y;                  h_ptr = refh + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
289                  h_ptr -= offset;                  hv_ptr = refhv + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
290    
291                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {
292                            hv_ptr -= stride_add;
293                            h_ptr -= stride_add;
294                            hv_ptr -= EDGE_SIZE;
295                            h_ptr -= EDGE_SIZE;
296    
297                          for (x = 0; x < (edged_width - EDGE_SIZE); x = x + 8) {                          for (x = 0; x < (edged_width - EDGE_SIZE); x = x + 8) {
298                                    hv_ptr -= 8;
299                                    h_ptr -= 8;
300                                  interpolate8x8_6tap_lowpass_v(hv_ptr, h_ptr, edged_width, rounding);                                  interpolate8x8_6tap_lowpass_v(hv_ptr, h_ptr, edged_width, rounding);
                                 hv_ptr += 8;  
                                 h_ptr += 8;  
301                          }                          }
   
                         hv_ptr += EDGE_SIZE;  
                         h_ptr += EDGE_SIZE;  
   
                         hv_ptr += stride_add;  
                         h_ptr += stride_add;  
302                  }                  }
303          }          } else {
304          else {  
305                    hv_ptr = refhv;
306                    hv_ptr -= offset;
307    
308                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
309                          for (x = 0; x < (edged_width - EDGE_SIZE); x += 8) {                          for (x = 0; x < (edged_width - EDGE_SIZE); x += 8) {
# Line 356  Line 328 
328                          n_ptr += stride_add;                          n_ptr += stride_add;
329                  }                  }
330          }          }
 /*  
 #ifdef BFRAMES  
         n_ptr = refn->u;  
         h_ptr = refh->u;  
         v_ptr = refv->u;  
         hv_ptr = refhv->u;  
   
         n_ptr -= offset2;  
         h_ptr -= offset2;  
         v_ptr -= offset2;  
         hv_ptr -= offset2;  
   
         for (y = 0; y < edged_height2; y += 8) {  
                 for (x = 0; x < edged_width2; x += 8) {  
                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);  
   
                         n_ptr += 8;  
                         h_ptr += 8;  
                         v_ptr += 8;  
                         hv_ptr += 8;  
                 }  
                 h_ptr += stride_add2;  
                 v_ptr += stride_add2;  
                 hv_ptr += stride_add2;  
                 n_ptr += stride_add2;  
         }  
   
         n_ptr = refn->v;  
         h_ptr = refh->v;  
         v_ptr = refv->v;  
         hv_ptr = refhv->v;  
   
         n_ptr -= offset2;  
         h_ptr -= offset2;  
         v_ptr -= offset2;  
         hv_ptr -= offset2;  
   
         for (y = 0; y < edged_height2; y = y + 8) {  
                 for (x = 0; x < edged_width2; x = x + 8) {  
                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);  
   
                         n_ptr += 8;  
                         h_ptr += 8;  
                         v_ptr += 8;  
                         hv_ptr += 8;  
                 }  
                 h_ptr += stride_add2;  
                 v_ptr += stride_add2;  
                 hv_ptr += stride_add2;  
                 n_ptr += stride_add2;  
         }  
 #endif  
 */  
         /*  
            interpolate_halfpel_h(  
            refh->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
          */  
   
         /* uv-image-based compensation  
            offset = EDGE_SIZE2 * (edged_width / 2 + 1);  
   
            interpolate_halfpel_h(  
            refh->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
   
            interpolate_halfpel_h(  
            refh->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
          */  
331  }  }
332    
333    
# Line 512  Line 367 
367  #undef IMG_V  #undef IMG_V
368          }          }
369    
370          DPRINTF(DPRINTF_DEBUG,"chroma_optimized_pixels = %i/%i", pixels, width*height/4);          DPRINTF(XVID_DEBUG_DEBUG,"chroma_optimized_pixels = %i/%i\n", pixels, width*height/4);
371  }  }
372    
373    
# Line 530  Line 385 
385                                   uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,                                   uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,
386                                   int y_stride, int uv_stride,                                   int y_stride, int uv_stride,
387                                   int width, int height, int vflip,                                   int width, int height, int vflip,
388                                   packedFunc * func_opt, packedFunc func_c, int size)                                   packedFunc * func_opt, packedFunc func_c,
389                     int size, int interlacing)
390  {  {
391          int width_opt, width_c;          int width_opt, width_c, height_opt;
392    
393        if (width==1 || height==1) return; /* forget about it */
394    
395          if (func_opt != func_c && x_stride < size*((width+15)/16)*16)          if (func_opt != func_c && x_stride < size*((width+15)/16)*16)
396          {          {
397                  width_opt = width & (~15);                  width_opt = width & (~15);
398                  width_c = width - width_opt;                  width_c = (width - width_opt) & (~1);
399          }          }
400          else          else
401          {          {
402                  width_opt = width;          /* Enforce the width to be divisable by two. */
403                    width_opt = width & (~1);
404                  width_c = 0;                  width_c = 0;
405          }          }
406    
407        /* packed conversions require height to be divisable by 2
408           (or even by 4 for interlaced conversion) */
409        if (interlacing)
410            height_opt = height & (~3);
411        else
412            height_opt = height & (~1);
413    
414          func_opt(x_ptr, x_stride,          func_opt(x_ptr, x_stride,
415                          y_ptr, u_ptr, v_ptr, y_stride, uv_stride,                          y_ptr, u_ptr, v_ptr, y_stride, uv_stride,
416                          width_opt, height, vflip);                          width_opt, height_opt, vflip);
417    
418          if (width_c)          if (width_c)
419          {          {
420                  func_c(x_ptr + size*width_opt, x_stride,                  func_c(x_ptr + size*width_opt, x_stride,
421                          y_ptr + width_opt, u_ptr + width_opt/2, v_ptr + width_opt/2,                          y_ptr + width_opt, u_ptr + width_opt/2, v_ptr + width_opt/2,
422                          y_stride, uv_stride, width_c, height, vflip);                          y_stride, uv_stride, width_c, height_opt, vflip);
423          }          }
424  }  }
425    
# Line 564  Line 430 
430                          uint32_t width,                          uint32_t width,
431                          int height,                          int height,
432                          uint32_t edged_width,                          uint32_t edged_width,
433                          uint8_t * src,                          uint8_t * src[4],
434                          int src_stride,                          int src_stride[4],
435                          int csp,                          int csp,
436                          int interlacing)                          int interlacing)
437  {  {
438          const int edged_width2 = edged_width/2;          const int edged_width2 = edged_width/2;
439          const int width2 = width/2;          const int width2 = width/2;
440          const int height2 = height/2;          const int height2 = height/2;
441          //const int height_signed = (csp & XVID_CSP_VFLIP) ? -height : height;  #if 0
442            const int height_signed = (csp & XVID_CSP_VFLIP) ? -height : height;
443    #endif
         //      int src_stride = width;  
   
         // --- xvid 2.1 compatiblity patch ---  
         // --- remove when xvid_dec_frame->stride equals real stride  
         /*  
         if ((csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB555 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB565 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_YUY2 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_YVYU ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_UYVY)  
         {  
                 src_stride *= 2;  
         }  
         else if ((csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB24)  
         {  
                 src_stride *= 3;  
         }  
         else if ((csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB32 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_ABGR ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGBA)  
         {  
                 src_stride *= 4;  
         }  
         */  
         // ^--- xvid 2.1 compatiblity fix ---^  
444    
445          switch (csp & ~XVID_CSP_VFLIP) {          switch (csp & ~XVID_CSP_VFLIP) {
446          case XVID_CSP_RGB555:          case XVID_CSP_RGB555:
447                  safe_packed_conv(                  safe_packed_conv(
448                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
449                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
450                          interlacing?rgb555i_to_yv12  :rgb555_to_yv12,                          interlacing?rgb555i_to_yv12  :rgb555_to_yv12,
451                          interlacing?rgb555i_to_yv12_c:rgb555_to_yv12_c, 2);                          interlacing?rgb555i_to_yv12_c:rgb555_to_yv12_c, 2, interlacing);
452                  break;                  break;
453    
454          case XVID_CSP_RGB565:          case XVID_CSP_RGB565:
455                  safe_packed_conv(                  safe_packed_conv(
456                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
457                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
458                          interlacing?rgb565i_to_yv12  :rgb565_to_yv12,                          interlacing?rgb565i_to_yv12  :rgb565_to_yv12,
459                          interlacing?rgb565i_to_yv12_c:rgb565_to_yv12_c, 2);                          interlacing?rgb565i_to_yv12_c:rgb565_to_yv12_c, 2, interlacing);
460                  break;                  break;
461    
462    
463          case XVID_CSP_RGB24:          case XVID_CSP_BGR:
464                  safe_packed_conv(                  safe_packed_conv(
465                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
466                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
467                          interlacing?bgri_to_yv12  :bgr_to_yv12,                          interlacing?bgri_to_yv12  :bgr_to_yv12,
468                          interlacing?bgri_to_yv12_c:bgr_to_yv12_c, 3);                          interlacing?bgri_to_yv12_c:bgr_to_yv12_c, 3, interlacing);
469                  break;                  break;
470    
471          case XVID_CSP_RGB32:          case XVID_CSP_BGRA:
472                  safe_packed_conv(                  safe_packed_conv(
473                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
474                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
475                          interlacing?bgrai_to_yv12  :bgra_to_yv12,                          interlacing?bgrai_to_yv12  :bgra_to_yv12,
476                          interlacing?bgrai_to_yv12_c:bgra_to_yv12_c, 4);                          interlacing?bgrai_to_yv12_c:bgra_to_yv12_c, 4, interlacing);
477                  break;                  break;
478    
479          case XVID_CSP_ABGR :          case XVID_CSP_ABGR :
480                  safe_packed_conv(                  safe_packed_conv(
481                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
482                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
483                          interlacing?abgri_to_yv12  :abgr_to_yv12,                          interlacing?abgri_to_yv12  :abgr_to_yv12,
484                          interlacing?abgri_to_yv12_c:abgr_to_yv12_c, 4);                          interlacing?abgri_to_yv12_c:abgr_to_yv12_c, 4, interlacing);
485                    break;
486    
487            case XVID_CSP_RGB:
488                    safe_packed_conv(
489                            src[0], src_stride[0], image->y, image->u, image->v,
490                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
491                            interlacing?rgbi_to_yv12  :rgb_to_yv12,
492                            interlacing?rgbi_to_yv12_c:rgb_to_yv12_c, 3, interlacing);
493                  break;                  break;
494    
495          case XVID_CSP_RGBA :          case XVID_CSP_RGBA :
496                  safe_packed_conv(                  safe_packed_conv(
497                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
498                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
499                          interlacing?rgbai_to_yv12  :rgba_to_yv12,                          interlacing?rgbai_to_yv12  :rgba_to_yv12,
500                          interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4);                          interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4, interlacing);
501                    break;
502    
503            case XVID_CSP_ARGB:
504                    safe_packed_conv(
505                            src[0], src_stride[0], image->y, image->u, image->v,
506                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
507                            interlacing?argbi_to_yv12  : argb_to_yv12,
508                            interlacing?argbi_to_yv12_c: argb_to_yv12_c, 4, interlacing);
509                  break;                  break;
510    
511          case XVID_CSP_YUY2:          case XVID_CSP_YUY2:
512                  safe_packed_conv(                  safe_packed_conv(
513                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
514                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
515                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,
516                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2);                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
517                  break;                  break;
518    
519          case XVID_CSP_YVYU:             /* u/v swapped */          case XVID_CSP_YVYU:             /* u/v swapped */
520                  safe_packed_conv(                  safe_packed_conv(
521                          src, src_stride, image->y, image->v, image->y,                          src[0], src_stride[0], image->y, image->v, image->u,
522                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
523                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,
524                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2);                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
525                  break;                  break;
526    
527          case XVID_CSP_UYVY:          case XVID_CSP_UYVY:
528                  safe_packed_conv(                  safe_packed_conv(
529                          src, src_stride, image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
530                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
531                          interlacing?uyvyi_to_yv12  :uyvy_to_yv12,                          interlacing?uyvyi_to_yv12  :uyvy_to_yv12,
532                          interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2);                          interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2, interlacing);
533                  break;                  break;
534    
535          case XVID_CSP_I420:          case XVID_CSP_I420:     /* YCbCr == YUV == internal colorspace for MPEG */
536                  yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,                  yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,
537                          src, src + src_stride*height, src + src_stride*height + (src_stride/2)*height2,                          src[0], src[0] + src_stride[0]*height, src[0] + src_stride[0]*height + (src_stride[0]/2)*height2,
538                          src_stride, src_stride/2, width, height, (csp & XVID_CSP_VFLIP));                          src_stride[0], src_stride[0]/2, width, height, (csp & XVID_CSP_VFLIP));
539                  break                  break;
540                          ;  
541          case XVID_CSP_YV12:             /* u/v swapped */          case XVID_CSP_YV12: /* YCrCb == YVA == U and V plane swapped */
542                  yv12_to_yv12(image->y, image->v, image->u, edged_width, edged_width2,                  yv12_to_yv12(image->y, image->v, image->u, edged_width, edged_width2,
543                          src, src + src_stride*height, src + src_stride*height + (src_stride/2)*height2,                          src[0], src[0] + src_stride[0]*height, src[0] + src_stride[0]*height + (src_stride[0]/2)*height2,
544                          src_stride, src_stride/2, width, height, (csp & XVID_CSP_VFLIP));                          src_stride[0], src_stride[0]/2, width, height, (csp & XVID_CSP_VFLIP));
545                  break;                  break;
546    
547          case XVID_CSP_USER:          case XVID_CSP_PLANAR:  /* YCbCr with arbitrary pointers and different strides for Y and UV */
                 {  
                         DEC_PICTURE * pic = (DEC_PICTURE*)src;  
548                          yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,                          yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,
549                                  pic->y, pic->u, pic->v, pic->stride_y, pic->stride_y,                          src[0], src[1], src[2], src_stride[0], src_stride[1],  /* v: dst_stride[2] not yet supported */
550                                  width, height, (csp & XVID_CSP_VFLIP));                                  width, height, (csp & XVID_CSP_VFLIP));
                 }  
551                  break;                  break;
552    
553          case XVID_CSP_NULL:          case XVID_CSP_NULL:
# Line 759  Line 613 
613                           uint32_t width,                           uint32_t width,
614                           int height,                           int height,
615                           uint32_t edged_width,                           uint32_t edged_width,
616                           uint8_t * dst,                           uint8_t * dst[4],
617                           uint32_t dst_stride,                           int dst_stride[4],
618                           int csp,                           int csp,
619                           int interlacing)                           int interlacing)
620  {  {
# Line 773  Line 627 
627          image_dump_yuvpgm(image, edged_width, width, height, "\\decode.pgm");          image_dump_yuvpgm(image, edged_width, width, height, "\\decode.pgm");
628  */  */
629    
   
         // --- xvid 2.1 compatiblity patch ---  
         // --- remove when xvid_dec_frame->stride equals real stride  
         /*  
         if ((csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB555 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB565 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_YUY2 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_YVYU ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_UYVY)  
         {  
                 dst_stride *= 2;  
         }  
         else if ((csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB24)  
         {  
                 dst_stride *= 3;  
         }  
         else if ((csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGB32 ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_ABGR ||  
                 (csp & ~XVID_CSP_VFLIP) == XVID_CSP_RGBA)  
         {  
                 dst_stride *= 4;  
         }  
         */  
         // ^--- xvid 2.1 compatiblity fix ---^  
   
   
630          switch (csp & ~XVID_CSP_VFLIP) {          switch (csp & ~XVID_CSP_VFLIP) {
631          case XVID_CSP_RGB555:          case XVID_CSP_RGB555:
632                  safe_packed_conv(                  safe_packed_conv(
633                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
634                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
635                          interlacing?yv12_to_rgb555i  :yv12_to_rgb555,                          interlacing?yv12_to_rgb555i  :yv12_to_rgb555,
636                          interlacing?yv12_to_rgb555i_c:yv12_to_rgb555_c, 2);                          interlacing?yv12_to_rgb555i_c:yv12_to_rgb555_c, 2, interlacing);
637                  return 0;                  return 0;
638    
639          case XVID_CSP_RGB565:          case XVID_CSP_RGB565:
640                  safe_packed_conv(                  safe_packed_conv(
641                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
642                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
643                          interlacing?yv12_to_rgb565i  :yv12_to_rgb565,                          interlacing?yv12_to_rgb565i  :yv12_to_rgb565,
644                          interlacing?yv12_to_rgb565i_c:yv12_to_rgb565_c, 2);                          interlacing?yv12_to_rgb565i_c:yv12_to_rgb565_c, 2, interlacing);
645                  return 0;                  return 0;
646    
647          case XVID_CSP_RGB24:      case XVID_CSP_BGR:
648                  safe_packed_conv(                  safe_packed_conv(
649                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
650                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
651                          interlacing?yv12_to_bgri  :yv12_to_bgr,                          interlacing?yv12_to_bgri  :yv12_to_bgr,
652                          interlacing?yv12_to_bgri_c:yv12_to_bgr_c, 3);                          interlacing?yv12_to_bgri_c:yv12_to_bgr_c, 3, interlacing);
653                  return 0;                  return 0;
654    
655          case XVID_CSP_RGB32:          case XVID_CSP_BGRA:
656                  safe_packed_conv(                  safe_packed_conv(
657                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
658                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
659                          interlacing?yv12_to_bgrai  :yv12_to_bgra,                          interlacing?yv12_to_bgrai  :yv12_to_bgra,
660                          interlacing?yv12_to_bgrai_c:yv12_to_bgra_c, 4);                          interlacing?yv12_to_bgrai_c:yv12_to_bgra_c, 4, interlacing);
661                  return 0;                  return 0;
662    
663          case XVID_CSP_ABGR:          case XVID_CSP_ABGR:
664                  safe_packed_conv(                  safe_packed_conv(
665                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
666                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
667                          interlacing?yv12_to_abgri  :yv12_to_abgr,                          interlacing?yv12_to_abgri  :yv12_to_abgr,
668                          interlacing?yv12_to_abgri_c:yv12_to_abgr_c, 4);                          interlacing?yv12_to_abgri_c:yv12_to_abgr_c, 4, interlacing);
669                    return 0;
670    
671            case XVID_CSP_RGB:
672                    safe_packed_conv(
673                            dst[0], dst_stride[0], image->y, image->u, image->v,
674                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
675                            interlacing?yv12_to_rgbi  :yv12_to_rgb,
676                            interlacing?yv12_to_rgbi_c:yv12_to_rgb_c, 3, interlacing);
677                  return 0;                  return 0;
678    
679          case XVID_CSP_RGBA:          case XVID_CSP_RGBA:
680                  safe_packed_conv(                  safe_packed_conv(
681                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
682                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
683                          interlacing?yv12_to_rgbai  :yv12_to_rgba,                          interlacing?yv12_to_rgbai  :yv12_to_rgba,
684                          interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4);                          interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4, interlacing);
685                    return 0;
686    
687            case XVID_CSP_ARGB:
688                    safe_packed_conv(
689                            dst[0], dst_stride[0], image->y, image->u, image->v,
690                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
691                            interlacing?yv12_to_argbi  :yv12_to_argb,
692                            interlacing?yv12_to_argbi_c:yv12_to_argb_c, 4, interlacing);
693                  return 0;                  return 0;
694    
695          case XVID_CSP_YUY2:          case XVID_CSP_YUY2:
696                  safe_packed_conv(                  safe_packed_conv(
697                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
698                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
699                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,
700                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2);                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
701                  return 0;                  return 0;
702    
703          case XVID_CSP_YVYU:             // u,v swapped          case XVID_CSP_YVYU:             /* u,v swapped */
704                  safe_packed_conv(                  safe_packed_conv(
705                          dst, dst_stride, image->y, image->v, image->u,                          dst[0], dst_stride[0], image->y, image->v, image->u,
706                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
707                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,
708                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2);                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
709                  return 0;                  return 0;
710    
711          case XVID_CSP_UYVY:          case XVID_CSP_UYVY:
712                  safe_packed_conv(                  safe_packed_conv(
713                          dst, dst_stride, image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
714                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
715                          interlacing?yv12_to_uyvyi  :yv12_to_uyvy,                          interlacing?yv12_to_uyvyi  :yv12_to_uyvy,
716                          interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2);                          interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2, interlacing);
717                  return 0;                  return 0;
718    
719          case XVID_CSP_I420:          case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */
720                  yv12_to_yv12(dst, dst + dst_stride*height, dst + dst_stride*height + (dst_stride/2)*height2,                  yv12_to_yv12(dst[0], dst[0] + dst_stride[0]*height, dst[0] + dst_stride[0]*height + (dst_stride[0]/2)*height2,
721                          dst_stride, dst_stride/2,                          dst_stride[0], dst_stride[0]/2,
722                          image->y, image->u, image->v, edged_width, edged_width2,                          image->y, image->u, image->v, edged_width, edged_width2,
723                          width, height, (csp & XVID_CSP_VFLIP));                          width, height, (csp & XVID_CSP_VFLIP));
724                  return 0;                  return 0;
725    
726          case XVID_CSP_YV12:             // u,v swapped          case XVID_CSP_YV12:     /* YCrCb == YVU == U and V plane swapped */
727                  yv12_to_yv12(dst, dst + dst_stride*height, dst + dst_stride*height + (dst_stride/2)*height2,                  yv12_to_yv12(dst[0], dst[0] + dst_stride[0]*height, dst[0] + dst_stride[0]*height + (dst_stride[0]/2)*height2,
728                          dst_stride, dst_stride/2,                          dst_stride[0], dst_stride[0]/2,
729                          image->y, image->v, image->u, edged_width, edged_width2,                          image->y, image->v, image->u, edged_width, edged_width2,
730                          width, height, (csp & XVID_CSP_VFLIP));                          width, height, (csp & XVID_CSP_VFLIP));
731                  return 0;                  return 0;
732    
733          case XVID_CSP_USER:          case XVID_CSP_PLANAR:  /* YCbCr with arbitrary pointers and different strides for Y and UV */
734                  {                  yv12_to_yv12(dst[0], dst[1], dst[2],
735                          DEC_PICTURE * pic = (DEC_PICTURE*)dst;                          dst_stride[0], dst_stride[1],   /* v: dst_stride[2] not yet supported */
736                          pic->y = image->y;                          image->y, image->u, image->v, edged_width, edged_width2,
737                          pic->u = image->u;                          width, height, (csp & XVID_CSP_VFLIP));
738                          pic->v = image->v;                  return 0;
739                          pic->stride_y = edged_width;  
740                          pic->stride_uv = edged_width / 2;          case XVID_CSP_INTERNAL :
741                  }                  dst[0] = image->y;
742                    dst[1] = image->u;
743                    dst[2] = image->v;
744                    dst_stride[0] = edged_width;
745                    dst_stride[1] = edged_width/2;
746                    dst_stride[2] = edged_width/2;
747                  return 0;                  return 0;
748    
749          case XVID_CSP_NULL:          case XVID_CSP_NULL:
750          case XVID_CSP_EXTERN:          case XVID_CSP_SLICE:
751                  return 0;                  return 0;
752    
753          }          }
# Line 944  Line 793 
793          if (sse==0)          if (sse==0)
794                  return 99.99F;                  return 99.99F;
795    
796          return 48.131F - 10*(float)log10((float)sse/(float)(pixels));   // log10(255*255)=4.8131          return 48.131F - 10*(float)log10((float)sse/(float)(pixels));   /* log10(255*255)=4.8131 */
797    
798  }  }
799    
# Line 954  Line 803 
803                     uint16_t width,                     uint16_t width,
804                     uint16_t height)                     uint16_t height)
805  {  {
806          int diff, x, y;          int y, bwidth, bheight;
807          long sse=0;          long sse=0;
808    
809          for (y = 0; y < height; y++) {          bwidth  = width  & (~0x07);
810            bheight = height & (~0x07);
811    
812            /* Compute the 8x8 integer part */
813            for (y = 0; y<bheight; y += 8) {
814                    int x;
815    
816                    /* Compute sse for the band */
817                    for (x = 0; x<bwidth; x += 8)
818                            sse += sse8_8bit(orig  + x, recon + x, stride);
819    
820                    /* remaining pixels of the 8 pixels high band */
821                    for (x = bwidth; x < width; x++) {
822                            int diff;
823                            diff = *(orig + 0*stride + x) - *(recon + 0*stride + x);
824                            sse += diff * diff;
825                            diff = *(orig + 1*stride + x) - *(recon + 1*stride + x);
826                            sse += diff * diff;
827                            diff = *(orig + 2*stride + x) - *(recon + 2*stride + x);
828                            sse += diff * diff;
829                            diff = *(orig + 3*stride + x) - *(recon + 3*stride + x);
830                            sse += diff * diff;
831                            diff = *(orig + 4*stride + x) - *(recon + 4*stride + x);
832                            sse += diff * diff;
833                            diff = *(orig + 5*stride + x) - *(recon + 5*stride + x);
834                            sse += diff * diff;
835                            diff = *(orig + 6*stride + x) - *(recon + 6*stride + x);
836                            sse += diff * diff;
837                            diff = *(orig + 7*stride + x) - *(recon + 7*stride + x);
838                            sse += diff * diff;
839                    }
840    
841                    orig  += 8*stride;
842                    recon += 8*stride;
843            }
844    
845            /* Compute the down rectangle sse */
846            for (y = bheight; y < height; y++) {
847                    int x;
848                  for (x = 0; x < width; x++) {                  for (x = 0; x < width; x++) {
849                            int diff;
850                          diff = *(orig + x) - *(recon + x);                          diff = *(orig + x) - *(recon + x);
851                          sse += diff * diff;                          sse += diff * diff;
852                  }                  }
853                  orig += stride;                  orig += stride;
854                  recon += stride;                  recon += stride;
855          }          }
856          return sse;  
857            return (sse);
858  }  }
859    
860  /*  #if 0
861    
862  #include <stdio.h>  #include <stdio.h>
863  #include <string.h>  #include <string.h>
# Line 992  Line 881 
881  }  }
882    
883    
884  // dump image+edges to yuv pgm files  /* dump image+edges to yuv pgm files */
885    
886  int image_dump(IMAGE * image, uint32_t edged_width, uint32_t edged_height, char * path, int number)  int image_dump(IMAGE * image, uint32_t edged_width, uint32_t edged_height, char * path, int number)
887  {  {
# Line 1015  Line 904 
904    
905          return 0;          return 0;
906  }  }
907  */  #endif
908    
909    
910    
# Line 1080  Line 969 
969    
970          for (y = 0; y < height; y++)          for (y = 0; y < height; y++)
971                  for (x = 0; x < width; x++)                  for (x = 0; x < width; x++)
972                          sum += ABS(img1->y[x + y * stride] - img2->y[x + y * stride]);                          sum += abs(img1->y[x + y * stride] - img2->y[x + y * stride]);
973    
974          for (y = 0; y < height2; y++)          for (y = 0; y < height2; y++)
975                  for (x = 0; x < width2; x++)                  for (x = 0; x < width2; x++)
976                          sum += ABS(img1->u[x + y * stride2] - img2->u[x + y * stride2]);                          sum += abs(img1->u[x + y * stride2] - img2->u[x + y * stride2]);
977    
978          for (y = 0; y < height2; y++)          for (y = 0; y < height2; y++)
979                  for (x = 0; x < width2; x++)                  for (x = 0; x < width2; x++)
980                          sum += ABS(img1->v[x + y * stride2] - img2->v[x + y * stride2]);                          sum += abs(img1->v[x + y * stride2] - img2->v[x + y * stride2]);
981    
982          return (float) sum / (width * height * 3 / 2);          return (float) sum / (width * height * 3 / 2);
983  }  }
984    
985  void  void
986  output_slice(IMAGE * cur, int std, int width, XVID_DEC_PICTURE* out_frm, int mbx, int mby,int mbl) {  output_slice(IMAGE * cur, int stride, int width, xvid_image_t* out_frm, int mbx, int mby,int mbl) {
987    uint8_t *dY,*dU,*dV,*sY,*sU,*sV;    uint8_t *dY,*dU,*dV,*sY,*sU,*sV;
988    int std2 = std >> 1;    int stride2 = stride >> 1;
989    int w = mbl << 4, w2,i;    int w = mbl << 4, w2,i;
990    
991    if(w > width)    if(w > width)
992      w = width;      w = width;
993    w2 = w >> 1;    w2 = w >> 1;
994    
995    dY = (uint8_t*)out_frm->y + (mby << 4) * out_frm->stride_y + (mbx << 4);    dY = (uint8_t*)out_frm->plane[0] + (mby << 4) * out_frm->stride[0] + (mbx << 4);
996    dU = (uint8_t*)out_frm->u + (mby << 3) * out_frm->stride_u + (mbx << 3);    dU = (uint8_t*)out_frm->plane[1] + (mby << 3) * out_frm->stride[1] + (mbx << 3);
997    dV = (uint8_t*)out_frm->v + (mby << 3) * out_frm->stride_v + (mbx << 3);    dV = (uint8_t*)out_frm->plane[2] + (mby << 3) * out_frm->stride[2] + (mbx << 3);
998    sY = cur->y + (mby << 4) * std + (mbx << 4);    sY = cur->y + (mby << 4) * stride + (mbx << 4);
999    sU = cur->u + (mby << 3) * std2 + (mbx << 3);    sU = cur->u + (mby << 3) * stride2 + (mbx << 3);
1000    sV = cur->v + (mby << 3) * std2 + (mbx << 3);    sV = cur->v + (mby << 3) * stride2 + (mbx << 3);
1001    
1002    for(i = 0 ; i < 16 ; i++) {    for(i = 0 ; i < 16 ; i++) {
1003      memcpy(dY,sY,w);      memcpy(dY,sY,w);
1004      dY += out_frm->stride_y;      dY += out_frm->stride[0];
1005      sY += std;      sY += stride;
1006    }    }
1007    for(i = 0 ; i < 8 ; i++) {    for(i = 0 ; i < 8 ; i++) {
1008      memcpy(dU,sU,w2);      memcpy(dU,sU,w2);
1009      dU += out_frm->stride_u;      dU += out_frm->stride[1];
1010      sU += std2;      sU += stride2;
1011    }    }
1012    for(i = 0 ; i < 8 ; i++) {    for(i = 0 ; i < 8 ; i++) {
1013      memcpy(dV,sV,w2);      memcpy(dV,sV,w2);
1014      dV += out_frm->stride_v;      dV += out_frm->stride[2];
1015      sV += std2;      sV += stride2;
1016    }    }
1017  }  }
1018    
# Line 1154  Line 1043 
1043          }          }
1044  }  }
1045    
1046    /****************************************************************************/
1047    
1048  /* reduced resolution deblocking filter  static void (*deintl_core)(uint8_t *, int width, int height, const int stride) = 0;
1049          block = block size (16=rrv, 8=full resolution)  extern void xvid_deinterlace_sse(uint8_t *, int width, int height, const int stride);
         flags = XVID_DEC_YDEBLOCK|XVID_DEC_UVDEBLOCK  
 */  
 void  
 image_deblock_rrv(IMAGE * img, int edged_width,  
                                 const MACROBLOCK * mbs, int mb_width, int mb_height, int mb_stride,  
                                 int block, int flags)  
 {  
         const int edged_width2 = edged_width /2;  
         const int nblocks = block / 8;  /* skals code uses 8pixel block uints */  
         int i,j;  
1050    
1051          /* luma: j,i in block units */  #define CLIP_255(x)   ( ((x)&~255) ? ((-(x)) >> (8*sizeof((x))-1))&0xff : (x) )
         if ((flags & XVID_DEC_DEBLOCKY))  
         {  
                 for (j = 1; j < mb_height*2; j++)               /* horizontal deblocking */  
                 for (i = 0; i < mb_width*2; i++)  
                 {  
                         if (mbs[(j-1)/2*mb_stride + (i/2)].mode != MODE_NOT_CODED ||  
                                 mbs[(j+0)/2*mb_stride + (i/2)].mode != MODE_NOT_CODED)  
                         {  
                                 hfilter_31(img->y + (j*block - 1)*edged_width + i*block,  
                                                                   img->y + (j*block + 0)*edged_width + i*block, nblocks);  
                         }  
                 }  
1052    
1053                  for (j = 0; j < mb_height*2; j++)               /* vertical deblocking */  static void deinterlace_c(uint8_t *pix, int width, int height, const int bps)
                 for (i = 1; i < mb_width*2; i++)  
1054                  {                  {
1055                          if (mbs[(j/2)*mb_stride + (i-1)/2].mode != MODE_NOT_CODED ||    pix += bps;
1056                                  mbs[(j/2)*mb_stride + (i+0)/2].mode != MODE_NOT_CODED)    while(width-->0)
1057                          {                          {
1058                                  vfilter_31(img->y + (j*block)*edged_width + i*block - 1,      int p1 = pix[-bps];
1059                                                     img->y + (j*block)*edged_width + i*block + 0,      int p2 = pix[0];
1060                                                     edged_width, nblocks);      int p0 = p2;
1061        int j = (height>>1) - 1;
1062        int V;
1063        unsigned char *P = pix++;
1064        while(j-->0)
1065        {
1066          const int  p3 = P[  bps];
1067          const int  p4 = P[2*bps];
1068          V =  ((p1+p3+1)>>1) + ((p2 - ((p0+p4+1)>>1)) >> 2);
1069          P[0] = CLIP_255( V );
1070          p0 = p2;
1071          p1 = p3;
1072          p2 = p4;
1073          P += 2*bps;
1074                          }                          }
1075        V =  ((p1+p1+1)>>1) + ((p2 - ((p0+p2+1)>>1)) >> 2);
1076        P[0] = CLIP_255( V );
1077                  }                  }
1078          }          }
1079    #undef CLIP_255
1080    
1081    int xvid_image_deinterlace(xvid_image_t* img, int width, int height, int bottom_first)
         /* chroma */  
         if ((flags & XVID_DEC_DEBLOCKUV))  
1082          {          {
1083                  for (j = 1; j < mb_height; j++)         /* horizontal deblocking */          if (height&1)
1084                  for (i = 0; i < mb_width; i++)                  return 0;
1085                  {          if (img->csp!=XVID_CSP_PLANAR && img->csp!=XVID_CSP_I420 && img->csp!=XVID_CSP_YV12)
1086                          if (mbs[(j-1)*mb_stride + i].mode != MODE_NOT_CODED ||                  return 0;       /* not yet supported */
1087                                  mbs[(j+0)*mb_stride + i].mode != MODE_NOT_CODED)          if (deintl_core==0) {
1088                          {                  deintl_core = deinterlace_c;
1089                                  hfilter_31(img->u + (j*block - 1)*edged_width2 + i*block,  #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
1090                                                     img->u + (j*block + 0)*edged_width2 + i*block, nblocks);                  {
1091                                  hfilter_31(img->v + (j*block - 1)*edged_width2 + i*block,                          int cpu_flags = check_cpu_features();
1092                                                     img->v + (j*block + 0)*edged_width2 + i*block, nblocks);                          if (cpu_flags & XVID_CPU_MMX)
1093                          }                                  deintl_core = xvid_deinterlace_sse;
1094                  }                  }
1095    #endif
                 for (j = 0; j < mb_height; j++)         /* vertical deblocking */  
                 for (i = 1; i < mb_width; i++)  
                 {  
                         if (mbs[j*mb_stride + i - 1].mode != MODE_NOT_CODED ||  
                                 mbs[j*mb_stride + i + 0].mode != MODE_NOT_CODED)  
                         {  
                                 vfilter_31(img->u + (j*block)*edged_width2 + i*block - 1,  
                                                    img->u + (j*block)*edged_width2 + i*block + 0,  
                                                    edged_width2, nblocks);  
                                 vfilter_31(img->v + (j*block)*edged_width2 + i*block - 1,  
                                                    img->v + (j*block)*edged_width2 + i*block + 0,  
                                                    edged_width2, nblocks);  
1096                          }                          }
1097            if (!bottom_first) {
1098                    deintl_core(img->plane[0], width,    height,    img->stride[0]);
1099                    deintl_core(img->plane[1], width>>1, height>>1, img->stride[1]);
1100                    deintl_core(img->plane[2], width>>1, height>>1, img->stride[2]);
1101                  }                  }
1102            else {
1103                    deintl_core((uint8_t *)img->plane[0] + ( height    -1)*img->stride[0], width,    height,    -img->stride[0]);
1104                    deintl_core((uint8_t *)img->plane[1] + ((height>>1)-1)*img->stride[1], width>>1, height>>1, -img->stride[1]);
1105                    deintl_core((uint8_t *)img->plane[2] + ((height>>1)-1)*img->stride[2], width>>1, height>>1, -img->stride[2]);
1106          }          }
1107            emms();
1108    
1109            return 1;
1110  }  }
1111    

Legend:
Removed from v.851  
changed lines
  Added in v.1815

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4