[svn] / branches / release-1_3-branch / xvidcore / src / motion / gmc.c Repository:
ViewVC logotype

Diff of /branches/release-1_3-branch/xvidcore/src/motion/gmc.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1398, Fri Apr 2 21:29:21 2004 UTC revision 1711, Sat Jun 17 13:08:05 2006 UTC
# Line 19  Line 19 
19   *  along with this program ; if not, write to the Free Software   *  along with this program ; if not, write to the Free Software
20   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22   * $Id: gmc.c,v 1.3 2004-04-02 21:29:21 edgomez Exp $   * $Id: gmc.c,v 1.6 2006-06-17 13:07:55 Isibaar Exp $
23   *   *
24   ****************************************************************************/   ****************************************************************************/
25    
# Line 30  Line 30 
30    
31  #include <stdio.h>  #include <stdio.h>
32    
33      /* initialized by init_GMC(), for 3points */
34    static
35    void (*Predict_16x16_func)(const NEW_GMC_DATA * const This,
36                               uint8_t *dst, const uint8_t *src,
37                               int dststride, int srcstride, int x, int y, int rounding) = 0;
38    static
39    void (*Predict_8x8_func)(const NEW_GMC_DATA * const This,
40                             uint8_t *uDst, const uint8_t *uSrc,
41                             uint8_t *vDst, const uint8_t *vSrc,
42                             int dststride, int srcstride, int x, int y, int rounding) = 0;
43    
44    /****************************************************************************/
45    /* this is borrowed from   bitstream.c  until we find a common solution */
46    static uint32_t __inline
47    log2bin(uint32_t value)
48    {
49    /* Changed by Chenm001 */
50    #if !defined(_MSC_VER)
51      int n = 0;
52    
53      while (value) {
54            value >>= 1;
55            n++;
56      }
57      return n;
58    #else
59      __asm {
60            bsr eax, value
61            inc eax
62      }
63    #endif
64    }
65    
66    /* 16*sizeof(int) -> 1 or 2 cachelines */
67    /* table lookup might be faster!  (still to be benchmarked) */
68    
69    /*
70    static int log2bin_table[16] =
71            { 0, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4};
72    */
73    /*      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 */
74    
75    #define RDIV(a,b) (((a)>0 ? (a) + ((b)>>1) : (a) - ((b)>>1))/(b))
76    #define RSHIFT(a,b) ( (a)>0 ? ((a) + (1<<((b)-1)))>>(b) : ((a) + (1<<((b)-1))-1)>>(b))
77    
78    #define MLT(i)  (((16-(i))<<16) + (i))
79    static const uint32_t MTab[16] = {
80      MLT( 0), MLT( 1), MLT( 2), MLT( 3), MLT( 4), MLT( 5), MLT( 6), MLT( 7),
81      MLT( 8), MLT( 9), MLT(10), MLT(11), MLT(12), MLT(13), MLT(14), MLT(15)
82    };
83    #undef MLT
84    
85  /* ************************************************************  /* ************************************************************
86   * Pts = 2 or 3   * Pts = 2 or 3
87   *   *
# Line 38  Line 90 
90   * Conversely, *dst is the macroblock top-left adress.   * Conversely, *dst is the macroblock top-left adress.
91   */   */
92    
93    static
94  void Predict_16x16_C(const NEW_GMC_DATA * const This,  void Predict_16x16_C(const NEW_GMC_DATA * const This,
95                                           uint8_t *dst, const uint8_t *src,                                           uint8_t *dst, const uint8_t *src,
96                                           int dststride, int srcstride, int x, int y, int rounding)                                           int dststride, int srcstride, int x, int y, int rounding)
# Line 97  Line 150 
150          }          }
151  }  }
152    
153    static
154  void Predict_8x8_C(const NEW_GMC_DATA * const This,  void Predict_8x8_C(const NEW_GMC_DATA * const This,
155                                           uint8_t *uDst, const uint8_t *uSrc,                                           uint8_t *uDst, const uint8_t *uSrc,
156                                           uint8_t *vDst, const uint8_t *vSrc,                                           uint8_t *vDst, const uint8_t *vSrc,
# Line 176  Line 230 
230          }          }
231  }  }
232    
233    static
234  void get_average_mv_C(const NEW_GMC_DATA * const Dsp, VECTOR * const mv,  void get_average_mv_C(const NEW_GMC_DATA * const Dsp, VECTOR * const mv,
235                                                  int x, int y, int qpel)                                                  int x, int y, int qpel)
236  {  {
# Line 206  Line 261 
261   * simplified version for 1 warp point   * simplified version for 1 warp point
262   */   */
263    
264    static
265  void Predict_1pt_16x16_C(const NEW_GMC_DATA * const This,  void Predict_1pt_16x16_C(const NEW_GMC_DATA * const This,
266                                                   uint8_t *Dst, const uint8_t *Src,                                                   uint8_t *Dst, const uint8_t *Src,
267                                                   int dststride, int srcstride, int x, int y, int rounding)                                                   int dststride, int srcstride, int x, int y, int rounding)
# Line 223  Line 279 
279          int i, j;          int i, j;
280    
281          int32_t Offset;          int32_t Offset;
282          if (vo>=(-16*4) && vo<=H) Offset = (vo>>4)*srcstride;          if (vo>=(-16<<4) && vo<=H) Offset = (vo>>4)*srcstride;
283          else {          else {
284                  if (vo>H) Offset = ( H>>4)*srcstride;                  if (vo>H) Offset = ( H>>4)*srcstride;
285                  else Offset =-16*srcstride;                  else Offset =-16*srcstride;
286                  rj = MTab[0];                  rj = MTab[0];
287          }          }
288          if (uo>=(-16*4) && uo<=W) Offset += (uo>>4);          if (uo>=(-16<<4) && uo<=W) Offset += (uo>>4);
289          else {          else {
290                  if (uo>W) Offset += (W>>4);                  if (uo>W) Offset += (W>>4);
291                  else Offset -= 16;                  else Offset -= 16;
# Line 257  Line 313 
313          }          }
314  }  }
315    
316    static
317  void Predict_1pt_8x8_C(const NEW_GMC_DATA * const This,  void Predict_1pt_8x8_C(const NEW_GMC_DATA * const This,
318                                                   uint8_t *uDst, const uint8_t *uSrc,                                                   uint8_t *uDst, const uint8_t *uSrc,
319                                                   uint8_t *vDst, const uint8_t *vSrc,                                                   uint8_t *vDst, const uint8_t *vSrc,
# Line 274  Line 331 
331          int i, j;          int i, j;
332    
333          int32_t Offset;          int32_t Offset;
334          if (vo>=(-8*4) && vo<=H) Offset = (vo>>4)*srcstride;          if (vo>=(-8<<4) && vo<=H) Offset = (vo>>4)*srcstride;
335          else {          else {
336                  if (vo>H) Offset = ( H>>4)*srcstride;                  if (vo>H) Offset = ( H>>4)*srcstride;
337                  else Offset =-8*srcstride;                  else Offset =-8*srcstride;
338                  rrj = MTab[0];                  rrj = MTab[0];
339          }          }
340          if (uo>=(-8*4) && uo<=W) Offset += (uo>>4);          if (uo>=(-8<<4) && uo<=W) Offset += (uo>>4);
341          else {          else {
342                  if (uo>W) Offset += ( W>>4);                  if (uo>W) Offset += ( W>>4);
343                  else Offset -= 8;                  else Offset -= 8;
# Line 319  Line 376 
376          }          }
377  }  }
378    
379    static
380  void get_average_mv_1pt_C(const NEW_GMC_DATA * const Dsp, VECTOR * const mv,  void get_average_mv_1pt_C(const NEW_GMC_DATA * const Dsp, VECTOR * const mv,
381                                                          int x, int y, int qpel)                                                          int x, int y, int qpel)
382  {  {
# Line 326  Line 384 
384          mv->y = RSHIFT(Dsp->Vo<<qpel, 3);          mv->y = RSHIFT(Dsp->Vo<<qpel, 3);
385  }  }
386    
387    #if defined(ARCH_IS_IA32)
388    /* *************************************************************
389     * MMX core function
390     */
391    
392    static
393    void (*GMC_Core_Lin_8)(uint8_t *Dst, const uint16_t * Offsets,
394                           const uint8_t * const Src0, const int BpS, const int Rounder) = 0;
395    
396    extern void xvid_GMC_Core_Lin_8_mmx(uint8_t *Dst, const uint16_t * Offsets,
397                                        const uint8_t * const Src0, const int BpS, const int Rounder);
398    
399    extern void xvid_GMC_Core_Lin_8_sse2(uint8_t *Dst, const uint16_t * Offsets,
400                                         const uint8_t * const Src0, const int BpS, const int Rounder);
401    
402    /* *************************************************************/
403    
404    static void GMC_Core_Non_Lin_8(uint8_t *Dst,
405                                   const uint16_t * Offsets,
406                                   const uint8_t * const Src0, const int srcstride,
407                                   const int Rounder)
408    {
409      int i;
410      for(i=0; i<8; ++i)
411      {
412        uint32_t u = Offsets[i   ];
413        uint32_t v = Offsets[i+16];
414        const uint32_t ri = MTab[u&0x0f];
415        const uint32_t rj = MTab[v&0x0f];
416        uint32_t f0, f1;
417        const uint8_t * const Src = Src0 + (u>>4) + (v>>4)*srcstride;
418        f0  = Src[0];
419        f0 |= Src[1] << 16;
420        f1  = Src[srcstride +0];
421        f1 |= Src[srcstride +1] << 16;
422        f0 = (ri*f0)>>16;
423        f1 = (ri*f1) & 0x0fff0000;
424        f0 |= f1;
425        f0 = ( rj*f0 + Rounder ) >> 24;
426        Dst[i] = (uint8_t)f0;
427      }
428    }
429    
430    //////////////////////////////////////////////////////////
431    
432    static
433    void Predict_16x16_mmx(const NEW_GMC_DATA * const This,
434                           uint8_t *dst, const uint8_t *src,
435                           int dststride, int srcstride, int x, int y, int rounding)
436    {
437      const int W = This->sW;
438      const int H = This->sH;
439      const int rho = 3 - This->accuracy;
440      const int Rounder = ( 128 - (rounding<<(2*rho)) ) << 16;
441      const uint32_t W2 = W<<(16-rho);
442      const uint32_t H2 = H<<(16-rho);
443    
444      const int dUx = This->dU[0];
445      const int dVx = This->dV[0];
446      const int dUy = This->dU[1];
447      const int dVy = This->dV[1];
448    
449      int Uo = This->Uo + 16*(dUy*y + dUx*x);
450      int Vo = This->Vo + 16*(dVy*y + dVx*x);
451    
452      int i, j;
453    
454      DECLARE_ALIGNED_MATRIX(Offsets, 2,16, uint16_t, CACHE_LINE);
455      for(j=16; j>0; --j)
456      {
457        int32_t U = Uo, V = Vo;
458        Uo += dUy; Vo += dVy;
459        if ( W2>(uint32_t)U && W2>(uint32_t)(U+15*dUx) &&
460             H2>(uint32_t)V && H2>(uint32_t)(V+15*dVx) )
461        {
462          for(i=0; i<16; ++i)
463          {
464            uint32_t u = ( U >> 16 ) << rho;
465            uint32_t v = ( V >> 16 ) << rho;
466            U += dUx;  V += dVx;
467            Offsets[   i] = u;
468            Offsets[16+i] = v;
469          }
470    
471              {
472              // batch 8 input pixels when linearity says it's ok
473            uint32_t UV1, UV2;
474            UV1 = (Offsets[0] | (Offsets[16]<<16)) & 0xfff0fff0U;
475            UV2 = (Offsets[7] | (Offsets[23]<<16)) & 0xfff0fff0U;
476            if (UV1+7*16==UV2)
477              GMC_Core_Lin_8(dst,    Offsets,    src + (Offsets[0]>>4) + (Offsets[16]>>4)*srcstride, srcstride, Rounder);
478            else
479              GMC_Core_Non_Lin_8(dst,   Offsets,   src, srcstride, Rounder);
480            UV1 = (Offsets[ 8] | (Offsets[24]<<16)) & 0xfff0fff0U;
481            UV2 = (Offsets[15] | (Offsets[31]<<16)) & 0xfff0fff0U;
482            if (UV1+7*16==UV2)
483              GMC_Core_Lin_8(dst+8,  Offsets+8,  src + (Offsets[8]>>4) + (Offsets[24]>>4)*srcstride, srcstride, Rounder);
484            else
485              GMC_Core_Non_Lin_8(dst+8, Offsets+8, src, srcstride, Rounder);
486              }
487            }
488        else
489        {
490          for(i=0; i<16; ++i)
491          {
492            int u = ( U >> 16 ) << rho;
493            int v = ( V >> 16 ) << rho;
494            U += dUx; V += dVx;
495    
496            Offsets[   i] = (u<0) ? 0 : (u>=W) ? W : u;
497            Offsets[16+i] = (v<0) ? 0 : (v>=H) ? H : v;
498          }
499            // due to boundary clipping, we cannot infer the 8-pixels batchability
500            // simply by using the linearity. Oh well, not a big deal...
501          GMC_Core_Non_Lin_8(dst,   Offsets,   src, srcstride, Rounder);
502          GMC_Core_Non_Lin_8(dst+8, Offsets+8, src, srcstride, Rounder);
503        }
504        dst += dststride;
505      }
506    }
507    
508    static
509    void Predict_8x8_mmx(const NEW_GMC_DATA * const This,
510                         uint8_t *uDst, const uint8_t *uSrc,
511                         uint8_t *vDst, const uint8_t *vSrc,
512                         int dststride, int srcstride, int x, int y, int rounding)
513    {
514      const int W   = This->sW >> 1;
515      const int H   = This->sH >> 1;
516      const int rho = 3-This->accuracy;
517      const int32_t Rounder = ( 128 - (rounding<<(2*rho)) ) << 16;
518      const uint32_t W2 = W<<(16-rho);
519      const uint32_t H2 = H<<(16-rho);
520    
521      const int dUx = This->dU[0];
522      const int dVx = This->dV[0];
523      const int dUy = This->dU[1];
524      const int dVy = This->dV[1];
525    
526      int Uo = This->Uco + 8*(dUy*y + dUx*x);
527      int Vo = This->Vco + 8*(dVy*y + dVx*x);
528    
529      DECLARE_ALIGNED_MATRIX(Offsets, 2,16, uint16_t, CACHE_LINE);
530      int i, j;
531      for(j=8; j>0; --j)
532      {
533        int32_t U = Uo, V = Vo;
534        Uo += dUy; Vo += dVy;
535        if ( W2>(uint32_t)U && W2>(uint32_t)(U+15*dUx) &&
536             H2>(uint32_t)V && H2>(uint32_t)(V+15*dVx) )
537        {
538          for(i=0; i<8; ++i)
539          {
540            int32_t u = ( U >> 16 ) << rho;
541            int32_t v = ( V >> 16 ) << rho;
542            U += dUx; V += dVx;
543            Offsets[   i] = u;
544            Offsets[16+i] = v;
545          }
546    
547              {
548              // batch 8 input pixels when linearity says it's ok
549            const uint32_t UV1 = (Offsets[ 0] | (Offsets[16]<<16)) & 0xfff0fff0U;
550            const uint32_t UV2 = (Offsets[ 7] | (Offsets[23]<<16)) & 0xfff0fff0U;
551            if (UV1+7*16==UV2)
552                    {
553              const uint32_t Off = (Offsets[0]>>4) + (Offsets[16]>>4)*srcstride;
554              GMC_Core_Lin_8(uDst, Offsets, uSrc+Off, srcstride, Rounder);
555              GMC_Core_Lin_8(vDst, Offsets, vSrc+Off, srcstride, Rounder);
556                    }
557            else {
558              GMC_Core_Non_Lin_8(uDst, Offsets, uSrc, srcstride, Rounder);
559              GMC_Core_Non_Lin_8(vDst, Offsets, vSrc, srcstride, Rounder);
560                    }
561              }
562        }
563        else
564        {
565          for(i=0; i<8; ++i)
566          {
567            int u = ( U >> 16 ) << rho;
568            int v = ( V >> 16 ) << rho;
569            U += dUx; V += dVx;
570            Offsets[   i] = (u<0) ? 0 : (u>=W) ? W : u;
571            Offsets[16+i] = (v<0) ? 0 : (v>=H) ? H : v;
572          }
573          GMC_Core_Non_Lin_8(uDst, Offsets, uSrc, srcstride, Rounder);
574          GMC_Core_Non_Lin_8(vDst, Offsets, vSrc, srcstride, Rounder);
575        }
576        uDst += dststride;
577        vDst += dststride;
578      }
579    }
580    
581    #endif /* ARCH_IS_IA32 */
582    
583    /* *************************************************************
584     * will initialize internal pointers
585     */
586    
587    void init_GMC(const unsigned int cpu_flags)
588    {
589          Predict_16x16_func = Predict_16x16_C;
590          Predict_8x8_func   = Predict_8x8_C;
591    
592    #if defined(ARCH_IS_IA32)
593          if ((cpu_flags & XVID_CPU_MMX)   || (cpu_flags & XVID_CPU_MMXEXT)   ||
594              (cpu_flags & XVID_CPU_3DNOW) || (cpu_flags & XVID_CPU_3DNOWEXT) ||
595              (cpu_flags & XVID_CPU_SSE)   || (cpu_flags & XVID_CPU_SSE2))
596            {
597               Predict_16x16_func = Predict_16x16_mmx;
598               Predict_8x8_func   = Predict_8x8_mmx;
599               if (cpu_flags & XVID_CPU_SSE2)
600                 GMC_Core_Lin_8 = xvid_GMC_Core_Lin_8_sse2;
601               else
602                 GMC_Core_Lin_8 = xvid_GMC_Core_Lin_8_mmx;
603            }
604    #endif
605    }
606    
607  /* *************************************************************  /* *************************************************************
608   * Warning! It's Accuracy being passed, not 'resolution'!   * Warning! It's Accuracy being passed, not 'resolution'!
609   */   */
# Line 413  Line 691 
691          gmc->Uco = (gmc->Uco + gmc->dU[0] + gmc->dU[1])>>2;          gmc->Uco = (gmc->Uco + gmc->dU[0] + gmc->dU[1])>>2;
692          gmc->Vco = (gmc->Vco + gmc->dV[0] + gmc->dV[1])>>2;          gmc->Vco = (gmc->Vco + gmc->dV[0] + gmc->dV[1])>>2;
693    
694          gmc->predict_16x16      = Predict_16x16_C;          gmc->predict_16x16      = Predict_16x16_func;
695          gmc->predict_8x8        = Predict_8x8_C;          gmc->predict_8x8        = Predict_8x8_func;
696          gmc->get_average_mv = get_average_mv_C;          gmc->get_average_mv = get_average_mv_C;
697          }          }
698  }  }

Legend:
Removed from v.1398  
changed lines
  Added in v.1711

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4