[svn] / branches / release-1_3-branch / xvidcore / src / image / image.c Repository:
ViewVC logotype

Diff of /branches/release-1_3-branch/xvidcore/src/image/image.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/xvidcore/src/image/image.c revision 1631, Fri Sep 9 12:18:10 2005 UTC branches/release-1_3-branch/xvidcore/src/image/image.c revision 1959, Tue Mar 8 19:18:44 2011 UTC
# Line 3  Line 3 
3   *  XVID MPEG-4 VIDEO CODEC   *  XVID MPEG-4 VIDEO CODEC
4   *  - Image management functions -   *  - Image management functions -
5   *   *
6   *  Copyright(C) 2001-2004 Peter Ross <pross@xvid.org>   *  Copyright(C) 2001-2010 Peter Ross <pross@xvid.org>
7   *   *
8   *  This program is free software ; you can redistribute it and/or modify   *  This program is free software ; you can redistribute it and/or modify
9   *  it under the terms of the GNU General Public License as published by   *  it under the terms of the GNU General Public License as published by
# Line 19  Line 19 
19   *  along with this program ; if not, write to the Free Software   *  along with this program ; if not, write to the Free Software
20   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22   * $Id: image.c,v 1.32 2005-09-09 12:18:10 suxen_drol Exp $   * $Id: image.c,v 1.46.2.2 2011-03-08 19:18:34 Isibaar Exp $
23   *   *
24   ****************************************************************************/   ****************************************************************************/
25    
# Line 34  Line 34 
34  #include "interpolate8x8.h"  #include "interpolate8x8.h"
35  #include "../utils/mem_align.h"  #include "../utils/mem_align.h"
36  #include "../motion/sad.h"  #include "../motion/sad.h"
37    #include "../utils/emms.h"
38    
39  #include "font.h"               /* XXX: remove later */  #include "font.h"               /* XXX: remove later */
40    
# Line 126  Line 127 
127          memcpy(image1->v, image2->v, edged_width * height / 4);          memcpy(image1->v, image2->v, edged_width * height / 4);
128  }  }
129    
130  /* setedges bug was fixed in this BS version */  /* setedges bug was in this BS versions */
131  #define SETEDGES_BUG_BEFORE             18  #define SETEDGES_BUG_BEFORE             18
132    #define SETEDGES_BUG_AFTER              57
133    #define SETEDGES_BUG_REFIXED            63
134    
135  void  void
136  image_setedges(IMAGE * image,  image_setedges(IMAGE * image,
# Line 148  Line 151 
151    
152          /* According to the Standard Clause 7.6.4, padding is done starting at 16          /* According to the Standard Clause 7.6.4, padding is done starting at 16
153           * pixel width and height multiples. This was not respected in old xvids */           * pixel width and height multiples. This was not respected in old xvids */
154          if (bs_version == 0 || bs_version >= SETEDGES_BUG_BEFORE) {          if (bs_version >= SETEDGES_BUG_BEFORE &&
155                    bs_version <  SETEDGES_BUG_AFTER ||
156                    bs_version >= SETEDGES_BUG_REFIXED) {
157                  width  = (width+15)&~15;                  width  = (width+15)&~15;
158                  height = (height+15)&~15;                  height = (height+15)&~15;
159          }          }
# Line 236  Line 241 
241          }          }
242  }  }
243    
 /* bframe encoding requires image-based u,v interpolation */  
244  void  void
245  image_interpolate(const IMAGE * refn,  image_interpolate(const uint8_t * refn,
246                                    IMAGE * refh,                                    uint8_t * refh,
247                                    IMAGE * refv,                                    uint8_t * refv,
248                                    IMAGE * refhv,                                    uint8_t * refhv,
249                                    uint32_t edged_width,                                    uint32_t edged_width,
250                                    uint32_t edged_height,                                    uint32_t edged_height,
251                                    uint32_t quarterpel,                                    uint32_t quarterpel,
# Line 249  Line 253 
253  {  {
254          const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); /* we only interpolate half of the edge area */          const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); /* we only interpolate half of the edge area */
255          const uint32_t stride_add = 7 * edged_width;          const uint32_t stride_add = 7 * edged_width;
 #if 0  
         const uint32_t edged_width2 = edged_width / 2;  
         const uint32_t edged_height2 = edged_height / 2;  
         const uint32_t offset2 = EDGE_SIZE2 * (edged_width2 + 1);  
         const uint32_t stride_add2 = 7 * edged_width2;  
 #endif  
         uint8_t *n_ptr, *h_ptr, *v_ptr, *hv_ptr;  
         uint32_t x, y;  
256    
257            uint8_t *n_ptr;
258            uint8_t *h_ptr, *v_ptr, *hv_ptr;
259            uint32_t x, y;
260    
261          n_ptr = refn->y;          n_ptr = (uint8_t*)refn;
262          h_ptr = refh->y;          h_ptr = refh;
263          v_ptr = refv->y;          v_ptr = refv;
264    
265          n_ptr -= offset;          n_ptr -= offset;
266          h_ptr -= offset;          h_ptr -= offset;
# Line 290  Line 289 
289                          n_ptr += stride_add;                          n_ptr += stride_add;
290                  }                  }
291    
292                  h_ptr = refh->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;                  h_ptr = refh + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
293                  hv_ptr = refhv->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;                  hv_ptr = refhv + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
294    
295                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {
296                          hv_ptr -= stride_add;                          hv_ptr -= stride_add;
# Line 307  Line 306 
306                  }                  }
307          } else {          } else {
308    
309                  hv_ptr = refhv->y;                  hv_ptr = refhv;
310                  hv_ptr -= offset;                  hv_ptr -= offset;
311    
312                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
# Line 333  Line 332 
332                          n_ptr += stride_add;                          n_ptr += stride_add;
333                  }                  }
334          }          }
 /*  
 #ifdef BFRAMES  
         n_ptr = refn->u;  
         h_ptr = refh->u;  
         v_ptr = refv->u;  
         hv_ptr = refhv->u;  
   
         n_ptr -= offset2;  
         h_ptr -= offset2;  
         v_ptr -= offset2;  
         hv_ptr -= offset2;  
   
         for (y = 0; y < edged_height2; y += 8) {  
                 for (x = 0; x < edged_width2; x += 8) {  
                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);  
   
                         n_ptr += 8;  
                         h_ptr += 8;  
                         v_ptr += 8;  
                         hv_ptr += 8;  
                 }  
                 h_ptr += stride_add2;  
                 v_ptr += stride_add2;  
                 hv_ptr += stride_add2;  
                 n_ptr += stride_add2;  
         }  
   
         n_ptr = refn->v;  
         h_ptr = refh->v;  
         v_ptr = refv->v;  
         hv_ptr = refhv->v;  
   
         n_ptr -= offset2;  
         h_ptr -= offset2;  
         v_ptr -= offset2;  
         hv_ptr -= offset2;  
   
         for (y = 0; y < edged_height2; y = y + 8) {  
                 for (x = 0; x < edged_width2; x = x + 8) {  
                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);  
   
                         n_ptr += 8;  
                         h_ptr += 8;  
                         v_ptr += 8;  
                         hv_ptr += 8;  
                 }  
                 h_ptr += stride_add2;  
                 v_ptr += stride_add2;  
                 hv_ptr += stride_add2;  
                 n_ptr += stride_add2;  
         }  
 #endif  
 */  
         /*  
            interpolate_halfpel_h(  
            refh->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
          */  
   
         /* uv-image-based compensation  
            offset = EDGE_SIZE2 * (edged_width / 2 + 1);  
   
            interpolate_halfpel_h(  
            refh->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
   
            interpolate_halfpel_h(  
            refh->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
          */  
335  }  }
336    
337    
# Line 507  Line 389 
389                                   uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,                                   uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,
390                                   int y_stride, int uv_stride,                                   int y_stride, int uv_stride,
391                                   int width, int height, int vflip,                                   int width, int height, int vflip,
392                                   packedFunc * func_opt, packedFunc func_c, int size)                                   packedFunc * func_opt, packedFunc func_c,
393                     int size, int interlacing)
394  {  {
395          int width_opt, width_c;          int width_opt, width_c, height_opt;
396    
397        if (width<0 || width==1 || height==1) return; /* forget about it */
398    
399          if (func_opt != func_c && x_stride < size*((width+15)/16)*16)          if (func_opt != func_c && x_stride < size*((width+15)/16)*16)
400          {          {
401                  width_opt = width & (~15);                  width_opt = width & (~15);
402                  width_c = width - width_opt;                  width_c = (width - width_opt) & (~1);
403          }          }
404          else          else if (func_opt != func_c && !(width&1) && (size==3))
405          {          {
406                  width_opt = width;          /* MMX reads 4 bytes per pixel for RGB/BGR */
407            width_opt = width - 2;
408            width_c = 2;
409        }
410        else {
411            /* Enforce the width to be divisable by two. */
412                    width_opt = width & (~1);
413                  width_c = 0;                  width_c = 0;
414          }          }
415    
416        /* packed conversions require height to be divisable by 2
417           (or even by 4 for interlaced conversion) */
418        if (interlacing)
419            height_opt = height & (~3);
420        else
421            height_opt = height & (~1);
422    
423          func_opt(x_ptr, x_stride,          func_opt(x_ptr, x_stride,
424                          y_ptr, u_ptr, v_ptr, y_stride, uv_stride,                          y_ptr, u_ptr, v_ptr, y_stride, uv_stride,
425                          width_opt, height, vflip);                          width_opt, height_opt, vflip);
426    
427          if (width_c)          if (width_c)
428          {          {
429                  func_c(x_ptr + size*width_opt, x_stride,                  func_c(x_ptr + size*width_opt, x_stride,
430                          y_ptr + width_opt, u_ptr + width_opt/2, v_ptr + width_opt/2,                          y_ptr + width_opt, u_ptr + width_opt/2, v_ptr + width_opt/2,
431                          y_stride, uv_stride, width_c, height, vflip);                          y_stride, uv_stride, width_c, height_opt, vflip);
432          }          }
433  }  }
434    
# Line 559  Line 457 
457                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
458                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
459                          interlacing?rgb555i_to_yv12  :rgb555_to_yv12,                          interlacing?rgb555i_to_yv12  :rgb555_to_yv12,
460                          interlacing?rgb555i_to_yv12_c:rgb555_to_yv12_c, 2);                          interlacing?rgb555i_to_yv12_c:rgb555_to_yv12_c, 2, interlacing);
461                  break;                  break;
462    
463          case XVID_CSP_RGB565:          case XVID_CSP_RGB565:
# Line 567  Line 465 
465                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
466                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
467                          interlacing?rgb565i_to_yv12  :rgb565_to_yv12,                          interlacing?rgb565i_to_yv12  :rgb565_to_yv12,
468                          interlacing?rgb565i_to_yv12_c:rgb565_to_yv12_c, 2);                          interlacing?rgb565i_to_yv12_c:rgb565_to_yv12_c, 2, interlacing);
469                  break;                  break;
470    
471    
# Line 576  Line 474 
474                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
475                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
476                          interlacing?bgri_to_yv12  :bgr_to_yv12,                          interlacing?bgri_to_yv12  :bgr_to_yv12,
477                          interlacing?bgri_to_yv12_c:bgr_to_yv12_c, 3);                          interlacing?bgri_to_yv12_c:bgr_to_yv12_c, 3, interlacing);
478                  break;                  break;
479    
480          case XVID_CSP_BGRA:          case XVID_CSP_BGRA:
# Line 584  Line 482 
482                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
483                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
484                          interlacing?bgrai_to_yv12  :bgra_to_yv12,                          interlacing?bgrai_to_yv12  :bgra_to_yv12,
485                          interlacing?bgrai_to_yv12_c:bgra_to_yv12_c, 4);                          interlacing?bgrai_to_yv12_c:bgra_to_yv12_c, 4, interlacing);
486                  break;                  break;
487    
488          case XVID_CSP_ABGR :          case XVID_CSP_ABGR :
# Line 592  Line 490 
490                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
491                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
492                          interlacing?abgri_to_yv12  :abgr_to_yv12,                          interlacing?abgri_to_yv12  :abgr_to_yv12,
493                          interlacing?abgri_to_yv12_c:abgr_to_yv12_c, 4);                          interlacing?abgri_to_yv12_c:abgr_to_yv12_c, 4, interlacing);
494                    break;
495    
496            case XVID_CSP_RGB:
497                    safe_packed_conv(
498                            src[0], src_stride[0], image->y, image->u, image->v,
499                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
500                            interlacing?rgbi_to_yv12  :rgb_to_yv12,
501                            interlacing?rgbi_to_yv12_c:rgb_to_yv12_c, 3, interlacing);
502                  break;                  break;
503    
504          case XVID_CSP_RGBA :          case XVID_CSP_RGBA :
# Line 600  Line 506 
506                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
507                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
508                          interlacing?rgbai_to_yv12  :rgba_to_yv12,                          interlacing?rgbai_to_yv12  :rgba_to_yv12,
509                          interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4);                          interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4, interlacing);
510                  break;                  break;
511    
512          case XVID_CSP_ARGB:          case XVID_CSP_ARGB:
# Line 608  Line 514 
514                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
515                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
516                          interlacing?argbi_to_yv12  : argb_to_yv12,                          interlacing?argbi_to_yv12  : argb_to_yv12,
517                          interlacing?argbi_to_yv12_c: argb_to_yv12_c, 4);                          interlacing?argbi_to_yv12_c: argb_to_yv12_c, 4, interlacing);
518                  break;                  break;
519    
520          case XVID_CSP_YUY2:          case XVID_CSP_YUY2:
# Line 616  Line 522 
522                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
523                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
524                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,
525                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2);                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
526                  break;                  break;
527    
528          case XVID_CSP_YVYU:             /* u/v swapped */          case XVID_CSP_YVYU:             /* u/v swapped */
# Line 624  Line 530 
530                          src[0], src_stride[0], image->y, image->v, image->u,                          src[0], src_stride[0], image->y, image->v, image->u,
531                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
532                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,
533                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2);                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
534                  break;                  break;
535    
536          case XVID_CSP_UYVY:          case XVID_CSP_UYVY:
# Line 632  Line 538 
538                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
539                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
540                          interlacing?uyvyi_to_yv12  :uyvy_to_yv12,                          interlacing?uyvyi_to_yv12  :uyvy_to_yv12,
541                          interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2);                          interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2, interlacing);
542                  break;                  break;
543    
544          case XVID_CSP_I420:     /* YCbCr == YUV == internal colorspace for MPEG */          case XVID_CSP_I420:     /* YCbCr == YUV == internal colorspace for MPEG */
# Line 736  Line 642 
642                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
643                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
644                          interlacing?yv12_to_rgb555i  :yv12_to_rgb555,                          interlacing?yv12_to_rgb555i  :yv12_to_rgb555,
645                          interlacing?yv12_to_rgb555i_c:yv12_to_rgb555_c, 2);                          interlacing?yv12_to_rgb555i_c:yv12_to_rgb555_c, 2, interlacing);
646                  return 0;                  return 0;
647    
648          case XVID_CSP_RGB565:          case XVID_CSP_RGB565:
# Line 744  Line 650 
650                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
651                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
652                          interlacing?yv12_to_rgb565i  :yv12_to_rgb565,                          interlacing?yv12_to_rgb565i  :yv12_to_rgb565,
653                          interlacing?yv12_to_rgb565i_c:yv12_to_rgb565_c, 2);                          interlacing?yv12_to_rgb565i_c:yv12_to_rgb565_c, 2, interlacing);
654                  return 0;                  return 0;
655    
656      case XVID_CSP_BGR:      case XVID_CSP_BGR:
# Line 752  Line 658 
658                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
659                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
660                          interlacing?yv12_to_bgri  :yv12_to_bgr,                          interlacing?yv12_to_bgri  :yv12_to_bgr,
661                          interlacing?yv12_to_bgri_c:yv12_to_bgr_c, 3);                          interlacing?yv12_to_bgri_c:yv12_to_bgr_c, 3, interlacing);
662                  return 0;                  return 0;
663    
664          case XVID_CSP_BGRA:          case XVID_CSP_BGRA:
# Line 760  Line 666 
666                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
667                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
668                          interlacing?yv12_to_bgrai  :yv12_to_bgra,                          interlacing?yv12_to_bgrai  :yv12_to_bgra,
669                          interlacing?yv12_to_bgrai_c:yv12_to_bgra_c, 4);                          interlacing?yv12_to_bgrai_c:yv12_to_bgra_c, 4, interlacing);
670                  return 0;                  return 0;
671    
672          case XVID_CSP_ABGR:          case XVID_CSP_ABGR:
# Line 768  Line 674 
674                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
675                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
676                          interlacing?yv12_to_abgri  :yv12_to_abgr,                          interlacing?yv12_to_abgri  :yv12_to_abgr,
677                          interlacing?yv12_to_abgri_c:yv12_to_abgr_c, 4);                          interlacing?yv12_to_abgri_c:yv12_to_abgr_c, 4, interlacing);
678                    return 0;
679    
680            case XVID_CSP_RGB:
681                    safe_packed_conv(
682                            dst[0], dst_stride[0], image->y, image->u, image->v,
683                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
684                            interlacing?yv12_to_rgbi  :yv12_to_rgb,
685                            interlacing?yv12_to_rgbi_c:yv12_to_rgb_c, 3, interlacing);
686                  return 0;                  return 0;
687    
688          case XVID_CSP_RGBA:          case XVID_CSP_RGBA:
# Line 776  Line 690 
690                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
691                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
692                          interlacing?yv12_to_rgbai  :yv12_to_rgba,                          interlacing?yv12_to_rgbai  :yv12_to_rgba,
693                          interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4);                          interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4, interlacing);
694                  return 0;                  return 0;
695    
696          case XVID_CSP_ARGB:          case XVID_CSP_ARGB:
# Line 784  Line 698 
698                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
699                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
700                          interlacing?yv12_to_argbi  :yv12_to_argb,                          interlacing?yv12_to_argbi  :yv12_to_argb,
701                          interlacing?yv12_to_argbi_c:yv12_to_argb_c, 4);                          interlacing?yv12_to_argbi_c:yv12_to_argb_c, 4, interlacing);
702                  return 0;                  return 0;
703    
704          case XVID_CSP_YUY2:          case XVID_CSP_YUY2:
# Line 792  Line 706 
706                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
707                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
708                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,
709                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2);                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
710                  return 0;                  return 0;
711    
712          case XVID_CSP_YVYU:             /* u,v swapped */          case XVID_CSP_YVYU:             /* u,v swapped */
# Line 800  Line 714 
714                          dst[0], dst_stride[0], image->y, image->v, image->u,                          dst[0], dst_stride[0], image->y, image->v, image->u,
715                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
716                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,
717                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2);                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
718                  return 0;                  return 0;
719    
720          case XVID_CSP_UYVY:          case XVID_CSP_UYVY:
# Line 808  Line 722 
722                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
723                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
724                          interlacing?yv12_to_uyvyi  :yv12_to_uyvy,                          interlacing?yv12_to_uyvyi  :yv12_to_uyvy,
725                          interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2);                          interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2, interlacing);
726                  return 0;                  return 0;
727    
728          case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */          case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */
# Line 952  Line 866 
866          return (sse);          return (sse);
867  }  }
868    
869    void image_block_variance(IMAGE * orig_image,
870                                              uint16_t stride,
871                                              MACROBLOCK *mbs,
872                                              uint16_t mb_width,
873                                              uint16_t mb_height)
874    {
875            DECLARE_ALIGNED_MATRIX(sums, 1, 4, uint16_t, CACHE_LINE);
876            DECLARE_ALIGNED_MATRIX(squares, 1, 4, uint32_t, CACHE_LINE);
877    
878            int x, y, i, j;
879            uint8_t *orig_y = orig_image->y;
880            uint8_t *orig_u = orig_image->u;
881            uint8_t *orig_v = orig_image->v;
882    
883            for (y = 0; y < mb_height; y++) {
884                    for (x = 0; x < mb_width; x++) {
885                            MACROBLOCK *pMB = &mbs[x + y * mb_width];
886                            uint32_t var4[4];
887                            uint32_t sum = 0, square = 0;
888    
889                            /* y-blocks */
890                            for (j = 0; j < 2; j++) {
891                                    for (i = 0; i < 2; i++) {
892                                            int lsum = blocksum8(orig_y + ((y<<4) + (j<<3))*stride + (x<<4) + (i<<3),
893                                                                                     stride, sums, squares);
894                                            int lsquare = (squares[0] + squares[1] + squares[2] + squares[3])<<6;
895    
896                                            sum += lsum;
897                                            square += lsquare;
898    
899                                            var4[0] = (squares[0]<<4) - sums[0]*sums[0];
900                                            var4[1] = (squares[1]<<4) - sums[1]*sums[1];
901                                            var4[2] = (squares[2]<<4) - sums[2]*sums[2];
902                                            var4[3] = (squares[3]<<4) - sums[3]*sums[3];
903    
904                                            pMB->rel_var8[j*2 + i] = lsquare - lsum*lsum;
905                                            if (pMB->rel_var8[j*2 + i])
906                                                    pMB->rel_var8[j*2 + i] = ((var4[0] + var4[1] + var4[2] + var4[3])<<8) /
907                                                                                                     pMB->rel_var8[j*2 + i]; /* 4*(Var(Di)/Var(D)) */
908                                            else
909                                                    pMB->rel_var8[j*2 + i] = 64;
910                                    }
911                            }
912    
913                            /* u */
914                            {
915                                    int lsum = blocksum8(orig_u + (y<<3)*(stride>>1) + (x<<3),
916                                                                             stride, sums, squares);
917                                    int lsquare = (squares[0] + squares[1] + squares[2] + squares[3])<<6;
918    
919                                    sum += lsum;
920                                    square += lsquare;
921    
922                                    var4[0] = (squares[0]<<4) - sums[0]*sums[0];
923                                    var4[1] = (squares[1]<<4) - sums[1]*sums[1];
924                                    var4[2] = (squares[2]<<4) - sums[2]*sums[2];
925                                    var4[3] = (squares[3]<<4) - sums[3]*sums[3];
926    
927                                    pMB->rel_var8[4] = lsquare - lsum*lsum;
928                                    if (pMB->rel_var8[4])
929                                            pMB->rel_var8[4] = ((var4[0] + var4[1] + var4[2] + var4[3])<<8) /
930                                                                                     pMB->rel_var8[4]; /* 4*(Var(Di)/Var(D)) */
931                                    else
932                                            pMB->rel_var8[4] = 64;
933                            }
934    
935                            /* v */
936                            {
937                                    int lsum = blocksum8(orig_v + (y<<3)*(stride>>1) + (x<<3),
938                                                                             stride, sums, squares);
939                                    int lsquare = (squares[0] + squares[1] + squares[2] + squares[3])<<6;
940    
941                                    sum += lsum;
942                                    square += lsquare;
943    
944                                    var4[0] = (squares[0]<<4) - sums[0]*sums[0];
945                                    var4[1] = (squares[1]<<4) - sums[1]*sums[1];
946                                    var4[2] = (squares[2]<<4) - sums[2]*sums[2];
947                                    var4[3] = (squares[3]<<4) - sums[3]*sums[3];
948    
949                                    pMB->rel_var8[5] = lsquare - lsum*lsum;
950                                    if (pMB->rel_var8[5])
951                                            pMB->rel_var8[5] = ((var4[0] + var4[1] + var4[2] + var4[3])<<8) /
952                                                                                     pMB->rel_var8[5]; /* 4*(Var(Di)/Var(D)) */
953                                    else
954                                            pMB->rel_var8[5] = 64;
955                            }
956    
957                    }
958            }
959    }
960    
961  #if 0  #if 0
962    
963  #include <stdio.h>  #include <stdio.h>
# Line 1137  Line 1143 
1143                  p += edged_width/2;                  p += edged_width/2;
1144          }          }
1145  }  }
1146    
1147    /****************************************************************************/
1148    
1149    static void (*deintl_core)(uint8_t *, int width, int height, const int stride) = 0;
1150    extern void xvid_deinterlace_sse(uint8_t *, int width, int height, const int stride);
1151    
1152    #define CLIP_255(x)   ( ((x)&~255) ? ((-(x)) >> (8*sizeof((x))-1))&0xff : (x) )
1153    
1154    static void deinterlace_c(uint8_t *pix, int width, int height, const int bps)
1155    {
1156      pix += bps;
1157      while(width-->0)
1158      {
1159        int p1 = pix[-bps];
1160        int p2 = pix[0];
1161        int p0 = p2;
1162        int j = (height>>1) - 1;
1163        int V;
1164        unsigned char *P = pix++;
1165        while(j-->0)
1166        {
1167          const int  p3 = P[  bps];
1168          const int  p4 = P[2*bps];
1169          V =  ((p1+p3+1)>>1) + ((p2 - ((p0+p4+1)>>1)) >> 2);
1170          P[0] = CLIP_255( V );
1171          p0 = p2;
1172          p1 = p3;
1173          p2 = p4;
1174          P += 2*bps;
1175        }
1176        V =  ((p1+p1+1)>>1) + ((p2 - ((p0+p2+1)>>1)) >> 2);
1177        P[0] = CLIP_255( V );
1178      }
1179    }
1180    #undef CLIP_255
1181    
1182    int xvid_image_deinterlace(xvid_image_t* img, int width, int height, int bottom_first)
1183    {
1184            if (height&1)
1185                    return 0;
1186            if (img->csp!=XVID_CSP_PLANAR && img->csp!=XVID_CSP_I420 && img->csp!=XVID_CSP_YV12)
1187                    return 0;       /* not yet supported */
1188            if (deintl_core==0) {
1189                    deintl_core = deinterlace_c;
1190    #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
1191                    {
1192                            int cpu_flags = check_cpu_features();
1193                            if (cpu_flags & XVID_CPU_MMX)
1194                                    deintl_core = xvid_deinterlace_sse;
1195                    }
1196    #endif
1197            }
1198            if (!bottom_first) {
1199                    deintl_core(img->plane[0], width,    height,    img->stride[0]);
1200                    deintl_core(img->plane[1], width>>1, height>>1, img->stride[1]);
1201                    deintl_core(img->plane[2], width>>1, height>>1, img->stride[2]);
1202            }
1203            else {
1204                    deintl_core((uint8_t *)img->plane[0] + ( height    -1)*img->stride[0], width,    height,    -img->stride[0]);
1205                    deintl_core((uint8_t *)img->plane[1] + ((height>>1)-1)*img->stride[1], width>>1, height>>1, -img->stride[1]);
1206                    deintl_core((uint8_t *)img->plane[2] + ((height>>1)-1)*img->stride[2], width>>1, height>>1, -img->stride[2]);
1207            }
1208            emms();
1209    
1210            return 1;
1211    }
1212    

Legend:
Removed from v.1631  
changed lines
  Added in v.1959

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4