[svn] / trunk / xvidcore / src / image / image.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/src/image/image.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1424, Mon Apr 12 15:49:56 2004 UTC revision 1932, Thu Dec 30 11:47:06 2010 UTC
# Line 3  Line 3 
3   *  XVID MPEG-4 VIDEO CODEC   *  XVID MPEG-4 VIDEO CODEC
4   *  - Image management functions -   *  - Image management functions -
5   *   *
6   *  Copyright(C) 2001-2004 Peter Ross <pross@xvid.org>   *  Copyright(C) 2001-2010 Peter Ross <pross@xvid.org>
7   *   *
8   *  This program is free software ; you can redistribute it and/or modify   *  This program is free software ; you can redistribute it and/or modify
9   *  it under the terms of the GNU General Public License as published by   *  it under the terms of the GNU General Public License as published by
# Line 19  Line 19 
19   *  along with this program ; if not, write to the Free Software   *  along with this program ; if not, write to the Free Software
20   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22   * $Id: image.c,v 1.29 2004-04-12 15:49:56 edgomez Exp $   * $Id: image.c,v 1.47 2010-12-30 11:46:08 Isibaar Exp $
23   *   *
24   ****************************************************************************/   ****************************************************************************/
25    
26  #include <stdlib.h>  #include <stdlib.h>
27  #include <string.h>                             /* memcpy, memset */  #include <string.h>                             /* memcpy, memset */
28  #include <math.h>  #include <math.h>
   
29  #include "../portab.h"  #include "../portab.h"
30  #include "../global.h"                  /* XVID_CSP_XXX's */  #include "../global.h"                  /* XVID_CSP_XXX's */
31  #include "../xvid.h"                    /* XVID_CSP_XXX's */  #include "../xvid.h"                    /* XVID_CSP_XXX's */
32  #include "image.h"  #include "image.h"
33  #include "colorspace.h"  #include "colorspace.h"
34  #include "interpolate8x8.h"  #include "interpolate8x8.h"
 #include "reduced.h"  
35  #include "../utils/mem_align.h"  #include "../utils/mem_align.h"
36  #include "../motion/sad.h"  #include "../motion/sad.h"
37    #include "../utils/emms.h"
38    
39  #include "font.h"               /* XXX: remove later */  #include "font.h"               /* XXX: remove later */
40    
# Line 150  Line 149 
149    
150          /* According to the Standard Clause 7.6.4, padding is done starting at 16          /* According to the Standard Clause 7.6.4, padding is done starting at 16
151           * pixel width and height multiples. This was not respected in old xvids */           * pixel width and height multiples. This was not respected in old xvids */
152          if (bs_version == 0 || bs_version >= SETEDGES_BUG_BEFORE) {          if (bs_version >= SETEDGES_BUG_BEFORE) {
153                  width  = (width+15)&~15;                  width  = (width+15)&~15;
154                  height = (height+15)&~15;                  height = (height+15)&~15;
155          }          }
# Line 238  Line 237 
237          }          }
238  }  }
239    
 /* bframe encoding requires image-based u,v interpolation */  
240  void  void
241  image_interpolate(const IMAGE * refn,  image_interpolate(const uint8_t * refn,
242                                    IMAGE * refh,                                    uint8_t * refh,
243                                    IMAGE * refv,                                    uint8_t * refv,
244                                    IMAGE * refhv,                                    uint8_t * refhv,
245                                    uint32_t edged_width,                                    uint32_t edged_width,
246                                    uint32_t edged_height,                                    uint32_t edged_height,
247                                    uint32_t quarterpel,                                    uint32_t quarterpel,
# Line 251  Line 249 
249  {  {
250          const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); /* we only interpolate half of the edge area */          const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); /* we only interpolate half of the edge area */
251          const uint32_t stride_add = 7 * edged_width;          const uint32_t stride_add = 7 * edged_width;
 #if 0  
         const uint32_t edged_width2 = edged_width / 2;  
         const uint32_t edged_height2 = edged_height / 2;  
         const uint32_t offset2 = EDGE_SIZE2 * (edged_width2 + 1);  
         const uint32_t stride_add2 = 7 * edged_width2;  
 #endif  
         uint8_t *n_ptr, *h_ptr, *v_ptr, *hv_ptr;  
         uint32_t x, y;  
252    
253            uint8_t *n_ptr;
254            uint8_t *h_ptr, *v_ptr, *hv_ptr;
255            uint32_t x, y;
256    
257          n_ptr = refn->y;          n_ptr = (uint8_t*)refn;
258          h_ptr = refh->y;          h_ptr = refh;
259          v_ptr = refv->y;          v_ptr = refv;
260    
261          n_ptr -= offset;          n_ptr -= offset;
262          h_ptr -= offset;          h_ptr -= offset;
# Line 292  Line 285 
285                          n_ptr += stride_add;                          n_ptr += stride_add;
286                  }                  }
287    
288                  h_ptr = refh->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;                  h_ptr = refh + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
289                  hv_ptr = refhv->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;                  hv_ptr = refhv + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
290    
291                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {
292                          hv_ptr -= stride_add;                          hv_ptr -= stride_add;
# Line 309  Line 302 
302                  }                  }
303          } else {          } else {
304    
305                  hv_ptr = refhv->y;                  hv_ptr = refhv;
306                  hv_ptr -= offset;                  hv_ptr -= offset;
307    
308                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
# Line 335  Line 328 
328                          n_ptr += stride_add;                          n_ptr += stride_add;
329                  }                  }
330          }          }
 /*  
 #ifdef BFRAMES  
         n_ptr = refn->u;  
         h_ptr = refh->u;  
         v_ptr = refv->u;  
         hv_ptr = refhv->u;  
   
         n_ptr -= offset2;  
         h_ptr -= offset2;  
         v_ptr -= offset2;  
         hv_ptr -= offset2;  
   
         for (y = 0; y < edged_height2; y += 8) {  
                 for (x = 0; x < edged_width2; x += 8) {  
                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);  
   
                         n_ptr += 8;  
                         h_ptr += 8;  
                         v_ptr += 8;  
                         hv_ptr += 8;  
                 }  
                 h_ptr += stride_add2;  
                 v_ptr += stride_add2;  
                 hv_ptr += stride_add2;  
                 n_ptr += stride_add2;  
         }  
   
         n_ptr = refn->v;  
         h_ptr = refh->v;  
         v_ptr = refv->v;  
         hv_ptr = refhv->v;  
   
         n_ptr -= offset2;  
         h_ptr -= offset2;  
         v_ptr -= offset2;  
         hv_ptr -= offset2;  
   
         for (y = 0; y < edged_height2; y = y + 8) {  
                 for (x = 0; x < edged_width2; x = x + 8) {  
                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);  
                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);  
   
                         n_ptr += 8;  
                         h_ptr += 8;  
                         v_ptr += 8;  
                         hv_ptr += 8;  
                 }  
                 h_ptr += stride_add2;  
                 v_ptr += stride_add2;  
                 hv_ptr += stride_add2;  
                 n_ptr += stride_add2;  
         }  
 #endif  
 */  
         /*  
            interpolate_halfpel_h(  
            refh->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->y - offset,  
            refn->y - offset,  
            edged_width, edged_height,  
            rounding);  
          */  
   
         /* uv-image-based compensation  
            offset = EDGE_SIZE2 * (edged_width / 2 + 1);  
   
            interpolate_halfpel_h(  
            refh->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->u - offset,  
            refn->u - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
   
            interpolate_halfpel_h(  
            refh->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_v(  
            refv->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
   
            interpolate_halfpel_hv(  
            refhv->v - offset,  
            refn->v - offset,  
            edged_width / 2, edged_height / 2,  
            rounding);  
          */  
331  }  }
332    
333    
# Line 509  Line 385 
385                                   uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,                                   uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,
386                                   int y_stride, int uv_stride,                                   int y_stride, int uv_stride,
387                                   int width, int height, int vflip,                                   int width, int height, int vflip,
388                                   packedFunc * func_opt, packedFunc func_c, int size)                                   packedFunc * func_opt, packedFunc func_c,
389                     int size, int interlacing)
390  {  {
391          int width_opt, width_c;          int width_opt, width_c, height_opt;
392    
393        if (width<0 || width==1 || height==1) return; /* forget about it */
394    
395          if (func_opt != func_c && x_stride < size*((width+15)/16)*16)          if (func_opt != func_c && x_stride < size*((width+15)/16)*16)
396          {          {
397                  width_opt = width & (~15);                  width_opt = width & (~15);
398                  width_c = width - width_opt;                  width_c = (width - width_opt) & (~1);
399          }          }
400          else          else if (func_opt != func_c && !(width&1) && (size==3))
401          {          {
402                  width_opt = width;          /* MMX reads 4 bytes per pixel for RGB/BGR */
403            width_opt = width - 2;
404            width_c = 2;
405        }
406        else {
407            /* Enforce the width to be divisable by two. */
408                    width_opt = width & (~1);
409                  width_c = 0;                  width_c = 0;
410          }          }
411    
412        /* packed conversions require height to be divisable by 2
413           (or even by 4 for interlaced conversion) */
414        if (interlacing)
415            height_opt = height & (~3);
416        else
417            height_opt = height & (~1);
418    
419          func_opt(x_ptr, x_stride,          func_opt(x_ptr, x_stride,
420                          y_ptr, u_ptr, v_ptr, y_stride, uv_stride,                          y_ptr, u_ptr, v_ptr, y_stride, uv_stride,
421                          width_opt, height, vflip);                          width_opt, height_opt, vflip);
422    
423          if (width_c)          if (width_c)
424          {          {
425                  func_c(x_ptr + size*width_opt, x_stride,                  func_c(x_ptr + size*width_opt, x_stride,
426                          y_ptr + width_opt, u_ptr + width_opt/2, v_ptr + width_opt/2,                          y_ptr + width_opt, u_ptr + width_opt/2, v_ptr + width_opt/2,
427                          y_stride, uv_stride, width_c, height, vflip);                          y_stride, uv_stride, width_c, height_opt, vflip);
428          }          }
429  }  }
430    
# Line 561  Line 453 
453                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
454                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
455                          interlacing?rgb555i_to_yv12  :rgb555_to_yv12,                          interlacing?rgb555i_to_yv12  :rgb555_to_yv12,
456                          interlacing?rgb555i_to_yv12_c:rgb555_to_yv12_c, 2);                          interlacing?rgb555i_to_yv12_c:rgb555_to_yv12_c, 2, interlacing);
457                  break;                  break;
458    
459          case XVID_CSP_RGB565:          case XVID_CSP_RGB565:
# Line 569  Line 461 
461                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
462                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
463                          interlacing?rgb565i_to_yv12  :rgb565_to_yv12,                          interlacing?rgb565i_to_yv12  :rgb565_to_yv12,
464                          interlacing?rgb565i_to_yv12_c:rgb565_to_yv12_c, 2);                          interlacing?rgb565i_to_yv12_c:rgb565_to_yv12_c, 2, interlacing);
465                  break;                  break;
466    
467    
# Line 578  Line 470 
470                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
471                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
472                          interlacing?bgri_to_yv12  :bgr_to_yv12,                          interlacing?bgri_to_yv12  :bgr_to_yv12,
473                          interlacing?bgri_to_yv12_c:bgr_to_yv12_c, 3);                          interlacing?bgri_to_yv12_c:bgr_to_yv12_c, 3, interlacing);
474                  break;                  break;
475    
476          case XVID_CSP_BGRA:          case XVID_CSP_BGRA:
# Line 586  Line 478 
478                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
479                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
480                          interlacing?bgrai_to_yv12  :bgra_to_yv12,                          interlacing?bgrai_to_yv12  :bgra_to_yv12,
481                          interlacing?bgrai_to_yv12_c:bgra_to_yv12_c, 4);                          interlacing?bgrai_to_yv12_c:bgra_to_yv12_c, 4, interlacing);
482                  break;                  break;
483    
484          case XVID_CSP_ABGR :          case XVID_CSP_ABGR :
# Line 594  Line 486 
486                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
487                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
488                          interlacing?abgri_to_yv12  :abgr_to_yv12,                          interlacing?abgri_to_yv12  :abgr_to_yv12,
489                          interlacing?abgri_to_yv12_c:abgr_to_yv12_c, 4);                          interlacing?abgri_to_yv12_c:abgr_to_yv12_c, 4, interlacing);
490                    break;
491    
492            case XVID_CSP_RGB:
493                    safe_packed_conv(
494                            src[0], src_stride[0], image->y, image->u, image->v,
495                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
496                            interlacing?rgbi_to_yv12  :rgb_to_yv12,
497                            interlacing?rgbi_to_yv12_c:rgb_to_yv12_c, 3, interlacing);
498                  break;                  break;
499    
500          case XVID_CSP_RGBA :          case XVID_CSP_RGBA :
# Line 602  Line 502 
502                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
503                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
504                          interlacing?rgbai_to_yv12  :rgba_to_yv12,                          interlacing?rgbai_to_yv12  :rgba_to_yv12,
505                          interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4);                          interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4, interlacing);
506                  break;                  break;
507    
508          case XVID_CSP_ARGB:          case XVID_CSP_ARGB:
# Line 610  Line 510 
510                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
511                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
512                          interlacing?argbi_to_yv12  : argb_to_yv12,                          interlacing?argbi_to_yv12  : argb_to_yv12,
513                          interlacing?argbi_to_yv12_c: argb_to_yv12_c, 4);                          interlacing?argbi_to_yv12_c: argb_to_yv12_c, 4, interlacing);
514                  break;                  break;
515    
516          case XVID_CSP_YUY2:          case XVID_CSP_YUY2:
# Line 618  Line 518 
518                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
519                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
520                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,
521                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2);                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
522                  break;                  break;
523    
524          case XVID_CSP_YVYU:             /* u/v swapped */          case XVID_CSP_YVYU:             /* u/v swapped */
# Line 626  Line 526 
526                          src[0], src_stride[0], image->y, image->v, image->u,                          src[0], src_stride[0], image->y, image->v, image->u,
527                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
528                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,
529                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2);                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
530                  break;                  break;
531    
532          case XVID_CSP_UYVY:          case XVID_CSP_UYVY:
# Line 634  Line 534 
534                          src[0], src_stride[0], image->y, image->u, image->v,                          src[0], src_stride[0], image->y, image->u, image->v,
535                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
536                          interlacing?uyvyi_to_yv12  :uyvy_to_yv12,                          interlacing?uyvyi_to_yv12  :uyvy_to_yv12,
537                          interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2);                          interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2, interlacing);
538                  break;                  break;
539    
540          case XVID_CSP_I420:     /* YCbCr == YUV == internal colorspace for MPEG */          case XVID_CSP_I420:     /* YCbCr == YUV == internal colorspace for MPEG */
# Line 719  Line 619 
619                           int height,                           int height,
620                           uint32_t edged_width,                           uint32_t edged_width,
621                           uint8_t * dst[4],                           uint8_t * dst[4],
622                           uint32_t dst_stride[4],                           int dst_stride[4],
623                           int csp,                           int csp,
624                           int interlacing)                           int interlacing)
625  {  {
# Line 738  Line 638 
638                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
639                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
640                          interlacing?yv12_to_rgb555i  :yv12_to_rgb555,                          interlacing?yv12_to_rgb555i  :yv12_to_rgb555,
641                          interlacing?yv12_to_rgb555i_c:yv12_to_rgb555_c, 2);                          interlacing?yv12_to_rgb555i_c:yv12_to_rgb555_c, 2, interlacing);
642                  return 0;                  return 0;
643    
644          case XVID_CSP_RGB565:          case XVID_CSP_RGB565:
# Line 746  Line 646 
646                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
647                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
648                          interlacing?yv12_to_rgb565i  :yv12_to_rgb565,                          interlacing?yv12_to_rgb565i  :yv12_to_rgb565,
649                          interlacing?yv12_to_rgb565i_c:yv12_to_rgb565_c, 2);                          interlacing?yv12_to_rgb565i_c:yv12_to_rgb565_c, 2, interlacing);
650                  return 0;                  return 0;
651    
652      case XVID_CSP_BGR:      case XVID_CSP_BGR:
# Line 754  Line 654 
654                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
655                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
656                          interlacing?yv12_to_bgri  :yv12_to_bgr,                          interlacing?yv12_to_bgri  :yv12_to_bgr,
657                          interlacing?yv12_to_bgri_c:yv12_to_bgr_c, 3);                          interlacing?yv12_to_bgri_c:yv12_to_bgr_c, 3, interlacing);
658                  return 0;                  return 0;
659    
660          case XVID_CSP_BGRA:          case XVID_CSP_BGRA:
# Line 762  Line 662 
662                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
663                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
664                          interlacing?yv12_to_bgrai  :yv12_to_bgra,                          interlacing?yv12_to_bgrai  :yv12_to_bgra,
665                          interlacing?yv12_to_bgrai_c:yv12_to_bgra_c, 4);                          interlacing?yv12_to_bgrai_c:yv12_to_bgra_c, 4, interlacing);
666                  return 0;                  return 0;
667    
668          case XVID_CSP_ABGR:          case XVID_CSP_ABGR:
# Line 770  Line 670 
670                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
671                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
672                          interlacing?yv12_to_abgri  :yv12_to_abgr,                          interlacing?yv12_to_abgri  :yv12_to_abgr,
673                          interlacing?yv12_to_abgri_c:yv12_to_abgr_c, 4);                          interlacing?yv12_to_abgri_c:yv12_to_abgr_c, 4, interlacing);
674                    return 0;
675    
676            case XVID_CSP_RGB:
677                    safe_packed_conv(
678                            dst[0], dst_stride[0], image->y, image->u, image->v,
679                            edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
680                            interlacing?yv12_to_rgbi  :yv12_to_rgb,
681                            interlacing?yv12_to_rgbi_c:yv12_to_rgb_c, 3, interlacing);
682                  return 0;                  return 0;
683    
684          case XVID_CSP_RGBA:          case XVID_CSP_RGBA:
# Line 778  Line 686 
686                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
687                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
688                          interlacing?yv12_to_rgbai  :yv12_to_rgba,                          interlacing?yv12_to_rgbai  :yv12_to_rgba,
689                          interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4);                          interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4, interlacing);
690                  return 0;                  return 0;
691    
692          case XVID_CSP_ARGB:          case XVID_CSP_ARGB:
# Line 786  Line 694 
694                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
695                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
696                          interlacing?yv12_to_argbi  :yv12_to_argb,                          interlacing?yv12_to_argbi  :yv12_to_argb,
697                          interlacing?yv12_to_argbi_c:yv12_to_argb_c, 4);                          interlacing?yv12_to_argbi_c:yv12_to_argb_c, 4, interlacing);
698                  return 0;                  return 0;
699    
700          case XVID_CSP_YUY2:          case XVID_CSP_YUY2:
# Line 794  Line 702 
702                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
703                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
704                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,
705                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2);                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
706                  return 0;                  return 0;
707    
708          case XVID_CSP_YVYU:             /* u,v swapped */          case XVID_CSP_YVYU:             /* u,v swapped */
# Line 802  Line 710 
710                          dst[0], dst_stride[0], image->y, image->v, image->u,                          dst[0], dst_stride[0], image->y, image->v, image->u,
711                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
712                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,                          interlacing?yv12_to_yuyvi  :yv12_to_yuyv,
713                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2);                          interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
714                  return 0;                  return 0;
715    
716          case XVID_CSP_UYVY:          case XVID_CSP_UYVY:
# Line 810  Line 718 
718                          dst[0], dst_stride[0], image->y, image->u, image->v,                          dst[0], dst_stride[0], image->y, image->u, image->v,
719                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
720                          interlacing?yv12_to_uyvyi  :yv12_to_uyvy,                          interlacing?yv12_to_uyvyi  :yv12_to_uyvy,
721                          interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2);                          interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2, interlacing);
722                  return 0;                  return 0;
723    
724          case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */          case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */
# Line 954  Line 862 
862          return (sse);          return (sse);
863  }  }
864    
865    void image_block_variance(IMAGE * orig_image,
866                                              uint16_t stride,
867                                              MACROBLOCK *mbs,
868                                              uint16_t mb_width,
869                                              uint16_t mb_height)
870    {
871            DECLARE_ALIGNED_MATRIX(sums, 1, 4, uint16_t, CACHE_LINE);
872            DECLARE_ALIGNED_MATRIX(squares, 1, 4, uint32_t, CACHE_LINE);
873    
874            int x, y, i, j;
875            uint8_t *orig_y = orig_image->y;
876            uint8_t *orig_u = orig_image->u;
877            uint8_t *orig_v = orig_image->v;
878    
879            for (y = 0; y < mb_height; y++) {
880                    for (x = 0; x < mb_width; x++) {
881                            MACROBLOCK *pMB = &mbs[x + y * mb_width];
882                            uint32_t var4[4];
883                            uint32_t sum = 0, square = 0;
884    
885                            /* y-blocks */
886                            for (j = 0; j < 2; j++) {
887                                    for (i = 0; i < 2; i++) {
888                                            int lsum = blocksum8(orig_y + ((y<<4) + (j<<3))*stride + (x<<4) + (i<<3),
889                                                                                     stride, sums, squares);
890                                            int lsquare = (squares[0] + squares[1] + squares[2] + squares[3])<<6;
891    
892                                            sum += lsum;
893                                            square += lsquare;
894    
895                                            var4[0] = (squares[0]<<4) - sums[0]*sums[0];
896                                            var4[1] = (squares[1]<<4) - sums[1]*sums[1];
897                                            var4[2] = (squares[2]<<4) - sums[2]*sums[2];
898                                            var4[3] = (squares[3]<<4) - sums[3]*sums[3];
899    
900                                            pMB->rel_var8[j*2 + i] = lsquare - lsum*lsum;
901                                            if (pMB->rel_var8[j*2 + i])
902                                                    pMB->rel_var8[j*2 + i] = ((var4[0] + var4[1] + var4[2] + var4[3])<<8) /
903                                                                                                     pMB->rel_var8[j*2 + i]; /* 4*(Var(Di)/Var(D)) */
904                                            else
905                                                    pMB->rel_var8[j*2 + i] = 64;
906                                    }
907                            }
908    
909                            /* u */
910                            {
911                                    int lsum = blocksum8(orig_u + (y<<3)*(stride>>1) + (x<<3),
912                                                                             stride, sums, squares);
913                                    int lsquare = (squares[0] + squares[1] + squares[2] + squares[3])<<6;
914    
915                                    sum += lsum;
916                                    square += lsquare;
917    
918                                    var4[0] = (squares[0]<<4) - sums[0]*sums[0];
919                                    var4[1] = (squares[1]<<4) - sums[1]*sums[1];
920                                    var4[2] = (squares[2]<<4) - sums[2]*sums[2];
921                                    var4[3] = (squares[3]<<4) - sums[3]*sums[3];
922    
923                                    pMB->rel_var8[4] = lsquare - lsum*lsum;
924                                    if (pMB->rel_var8[4])
925                                            pMB->rel_var8[4] = ((var4[0] + var4[1] + var4[2] + var4[3])<<8) /
926                                                                                     pMB->rel_var8[4]; /* 4*(Var(Di)/Var(D)) */
927                                    else
928                                            pMB->rel_var8[4] = 64;
929                            }
930    
931                            /* v */
932                            {
933                                    int lsum = blocksum8(orig_v + (y<<3)*(stride>>1) + (x<<3),
934                                                                             stride, sums, squares);
935                                    int lsquare = (squares[0] + squares[1] + squares[2] + squares[3])<<6;
936    
937                                    sum += lsum;
938                                    square += lsquare;
939    
940                                    var4[0] = (squares[0]<<4) - sums[0]*sums[0];
941                                    var4[1] = (squares[1]<<4) - sums[1]*sums[1];
942                                    var4[2] = (squares[2]<<4) - sums[2]*sums[2];
943                                    var4[3] = (squares[3]<<4) - sums[3]*sums[3];
944    
945                                    pMB->rel_var8[5] = lsquare - lsum*lsum;
946                                    if (pMB->rel_var8[5])
947                                            pMB->rel_var8[5] = ((var4[0] + var4[1] + var4[2] + var4[3])<<8) /
948                                                                                     pMB->rel_var8[5]; /* 4*(Var(Di)/Var(D)) */
949                                    else
950                                            pMB->rel_var8[5] = 64;
951                            }
952    
953                    }
954            }
955    }
956    
957  #if 0  #if 0
958    
959  #include <stdio.h>  #include <stdio.h>
# Line 1080  Line 1080 
1080  }  }
1081    
1082  void  void
1083  output_slice(IMAGE * cur, int std, int width, xvid_image_t* out_frm, int mbx, int mby,int mbl) {  output_slice(IMAGE * cur, int stride, int width, xvid_image_t* out_frm, int mbx, int mby,int mbl) {
1084    uint8_t *dY,*dU,*dV,*sY,*sU,*sV;    uint8_t *dY,*dU,*dV,*sY,*sU,*sV;
1085    int std2 = std >> 1;    int stride2 = stride >> 1;
1086    int w = mbl << 4, w2,i;    int w = mbl << 4, w2,i;
1087    
1088    if(w > width)    if(w > width)
# Line 1092  Line 1092 
1092    dY = (uint8_t*)out_frm->plane[0] + (mby << 4) * out_frm->stride[0] + (mbx << 4);    dY = (uint8_t*)out_frm->plane[0] + (mby << 4) * out_frm->stride[0] + (mbx << 4);
1093    dU = (uint8_t*)out_frm->plane[1] + (mby << 3) * out_frm->stride[1] + (mbx << 3);    dU = (uint8_t*)out_frm->plane[1] + (mby << 3) * out_frm->stride[1] + (mbx << 3);
1094    dV = (uint8_t*)out_frm->plane[2] + (mby << 3) * out_frm->stride[2] + (mbx << 3);    dV = (uint8_t*)out_frm->plane[2] + (mby << 3) * out_frm->stride[2] + (mbx << 3);
1095    sY = cur->y + (mby << 4) * std + (mbx << 4);    sY = cur->y + (mby << 4) * stride + (mbx << 4);
1096    sU = cur->u + (mby << 3) * std2 + (mbx << 3);    sU = cur->u + (mby << 3) * stride2 + (mbx << 3);
1097    sV = cur->v + (mby << 3) * std2 + (mbx << 3);    sV = cur->v + (mby << 3) * stride2 + (mbx << 3);
1098    
1099    for(i = 0 ; i < 16 ; i++) {    for(i = 0 ; i < 16 ; i++) {
1100      memcpy(dY,sY,w);      memcpy(dY,sY,w);
1101      dY += out_frm->stride[0];      dY += out_frm->stride[0];
1102      sY += std;      sY += stride;
1103    }    }
1104    for(i = 0 ; i < 8 ; i++) {    for(i = 0 ; i < 8 ; i++) {
1105      memcpy(dU,sU,w2);      memcpy(dU,sU,w2);
1106      dU += out_frm->stride[1];      dU += out_frm->stride[1];
1107      sU += std2;      sU += stride2;
1108    }    }
1109    for(i = 0 ; i < 8 ; i++) {    for(i = 0 ; i < 8 ; i++) {
1110      memcpy(dV,sV,w2);      memcpy(dV,sV,w2);
1111      dV += out_frm->stride[2];      dV += out_frm->stride[2];
1112      sV += std2;      sV += stride2;
1113    }    }
1114  }  }
1115    
# Line 1140  Line 1140 
1140          }          }
1141  }  }
1142    
1143    /****************************************************************************/
1144    
1145  /* reduced resolution deblocking filter  static void (*deintl_core)(uint8_t *, int width, int height, const int stride) = 0;
1146          block = block size (16=rrv, 8=full resolution)  extern void xvid_deinterlace_sse(uint8_t *, int width, int height, const int stride);
         flags = XVID_DEC_YDEBLOCK|XVID_DEC_UVDEBLOCK  
 */  
 void  
 image_deblock_rrv(IMAGE * img, int edged_width,  
                                 const MACROBLOCK * mbs, int mb_width, int mb_height, int mb_stride,  
                                 int block, int flags)  
 {  
         const int edged_width2 = edged_width /2;  
         const int nblocks = block / 8;  /* skals code uses 8pixel block uints */  
         int i,j;  
1147    
1148          /* luma: j,i in block units */  #define CLIP_255(x)   ( ((x)&~255) ? ((-(x)) >> (8*sizeof((x))-1))&0xff : (x) )
1149    
1150                  for (j = 1; j < mb_height*2; j++)               /* horizontal deblocking */  static void deinterlace_c(uint8_t *pix, int width, int height, const int bps)
                 for (i = 0; i < mb_width*2; i++)  
1151                  {                  {
1152                          if (mbs[(j-1)/2*mb_stride + (i/2)].mode != MODE_NOT_CODED ||    pix += bps;
1153                                  mbs[(j+0)/2*mb_stride + (i/2)].mode != MODE_NOT_CODED)    while(width-->0)
1154                          {                          {
1155                                  hfilter_31(img->y + (j*block - 1)*edged_width + i*block,      int p1 = pix[-bps];
1156                                                                    img->y + (j*block + 0)*edged_width + i*block, nblocks);      int p2 = pix[0];
1157                          }      int p0 = p2;
1158                  }      int j = (height>>1) - 1;
1159        int V;
1160                  for (j = 0; j < mb_height*2; j++)               /* vertical deblocking */      unsigned char *P = pix++;
1161                  for (i = 1; i < mb_width*2; i++)      while(j-->0)
                 {  
                         if (mbs[(j/2)*mb_stride + (i-1)/2].mode != MODE_NOT_CODED ||  
                                 mbs[(j/2)*mb_stride + (i+0)/2].mode != MODE_NOT_CODED)  
1162                          {                          {
1163                                  vfilter_31(img->y + (j*block)*edged_width + i*block - 1,        const int  p3 = P[  bps];
1164                                                     img->y + (j*block)*edged_width + i*block + 0,        const int  p4 = P[2*bps];
1165                                                     edged_width, nblocks);        V =  ((p1+p3+1)>>1) + ((p2 - ((p0+p4+1)>>1)) >> 2);
1166          P[0] = CLIP_255( V );
1167          p0 = p2;
1168          p1 = p3;
1169          p2 = p4;
1170          P += 2*bps;
1171                          }                          }
1172                  }      V =  ((p1+p1+1)>>1) + ((p2 - ((p0+p2+1)>>1)) >> 2);
1173        P[0] = CLIP_255( V );
   
   
         /* chroma */  
   
                 for (j = 1; j < mb_height; j++)         /* horizontal deblocking */  
                 for (i = 0; i < mb_width; i++)  
                 {  
                         if (mbs[(j-1)*mb_stride + i].mode != MODE_NOT_CODED ||  
                                 mbs[(j+0)*mb_stride + i].mode != MODE_NOT_CODED)  
                         {  
                                 hfilter_31(img->u + (j*block - 1)*edged_width2 + i*block,  
                                                    img->u + (j*block + 0)*edged_width2 + i*block, nblocks);  
                                 hfilter_31(img->v + (j*block - 1)*edged_width2 + i*block,  
                                                    img->v + (j*block + 0)*edged_width2 + i*block, nblocks);  
1174                          }                          }
1175                  }                  }
1176    #undef CLIP_255
1177    
1178                  for (j = 0; j < mb_height; j++)         /* vertical deblocking */  int xvid_image_deinterlace(xvid_image_t* img, int width, int height, int bottom_first)
                 for (i = 1; i < mb_width; i++)  
1179                  {                  {
1180                          if (mbs[j*mb_stride + i - 1].mode != MODE_NOT_CODED ||          if (height&1)
1181                                  mbs[j*mb_stride + i + 0].mode != MODE_NOT_CODED)                  return 0;
1182                          {          if (img->csp!=XVID_CSP_PLANAR && img->csp!=XVID_CSP_I420 && img->csp!=XVID_CSP_YV12)
1183                                  vfilter_31(img->u + (j*block)*edged_width2 + i*block - 1,                  return 0;       /* not yet supported */
1184                                                     img->u + (j*block)*edged_width2 + i*block + 0,          if (deintl_core==0) {
1185                                                     edged_width2, nblocks);                  deintl_core = deinterlace_c;
1186                                  vfilter_31(img->v + (j*block)*edged_width2 + i*block - 1,  #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
1187                                                     img->v + (j*block)*edged_width2 + i*block + 0,                  {
1188                                                     edged_width2, nblocks);                          int cpu_flags = check_cpu_features();
1189                            if (cpu_flags & XVID_CPU_MMX)
1190                                    deintl_core = xvid_deinterlace_sse;
1191                          }                          }
1192    #endif
1193                  }                  }
1194            if (!bottom_first) {
1195                    deintl_core(img->plane[0], width,    height,    img->stride[0]);
1196                    deintl_core(img->plane[1], width>>1, height>>1, img->stride[1]);
1197                    deintl_core(img->plane[2], width>>1, height>>1, img->stride[2]);
1198            }
1199            else {
1200                    deintl_core((uint8_t *)img->plane[0] + ( height    -1)*img->stride[0], width,    height,    -img->stride[0]);
1201                    deintl_core((uint8_t *)img->plane[1] + ((height>>1)-1)*img->stride[1], width>>1, height>>1, -img->stride[1]);
1202                    deintl_core((uint8_t *)img->plane[2] + ((height>>1)-1)*img->stride[2], width>>1, height>>1, -img->stride[2]);
1203            }
1204            emms();
1205    
1206            return 1;
1207  }  }
1208    

Legend:
Removed from v.1424  
changed lines
  Added in v.1932

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4