[svn] / branches / dev-api-3 / xvidcore / src / motion / motion_est.c Repository:
ViewVC logotype

Diff of /branches/dev-api-3/xvidcore/src/motion/motion_est.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/xvidcore/src/motion/motion_est.c revision 285, Wed Jul 10 19:16:56 2002 UTC branches/dev-api-3/xvidcore/src/motion/motion_est.c revision 530, Mon Sep 23 20:36:02 2002 UTC
# Line 28  Line 28 
28   *   *
29   *************************************************************************/   *************************************************************************/
30    
 /**************************************************************************  
  *  
  *  Modifications:  
  *  
  *      01.05.2002      updated MotionEstimationBVOP  
  *      25.04.2002 partial prevMB conversion  
  *  22.04.2002 remove some compile warning by chenm001 <chenm001@163.com>  
  *  14.04.2002 added MotionEstimationBVOP()  
  *  02.04.2002 add EPZS(^2) as ME algorithm, use PMV_USESQUARES to choose between  
  *             EPZS and EPZS^2  
  *  08.02.2002 split up PMVfast into three routines: PMVFast, PMVFast_MainLoop  
  *             PMVFast_Refine to support multiple searches with different start points  
  *  07.01.2002 uv-block-based interpolation  
  *  06.01.2002 INTER/INTRA-decision is now done before any SEARCH8 (speedup)  
  *             changed INTER_BIAS to 150 (as suggested by suxen_drol)  
  *             removed halfpel refinement step in PMVfastSearch8 + quality=5  
  *             added new quality mode = 6 which performs halfpel refinement  
  *             filesize difference between quality 5 and 6 is smaller than 1%  
  *             (Isibaar)  
  *  31.12.2001 PMVfastSearch16 and PMVfastSearch8 (gruel)  
  *  30.12.2001 get_range/MotionSearchX simplified; blue/green bug fix  
  *  22.12.2001 commented best_point==99 check  
  *  19.12.2001 modified get_range (purple bug fix)  
  *  15.12.2001 moved pmv displacement from mbprediction  
  *  02.12.2001 motion estimation/compensation split (Isibaar)  
  *  16.11.2001 rewrote/tweaked search algorithms; pross@cs.rmit.edu.au  
  *  10.11.2001 support for sad16/sad8 functions  
  *  28.08.2001 reactivated MODE_INTER4V for EXT_MODE  
  *  24.08.2001 removed MODE_INTER4V_Q, disabled MODE_INTER4V for EXT_MODE  
  *  22.08.2001 added MODE_INTER4V_Q  
  *  20.08.2001 added pragma to get rid of internal compiler error with VC6  
  *             idea by Cyril. Thanks.  
  *  
  *  Michael Militzer <isibaar@videocoding.de>  
  *  
  **************************************************************************/  
   
31  #include <assert.h>  #include <assert.h>
32  #include <stdio.h>  #include <stdio.h>
33  #include <stdlib.h>  #include <stdlib.h>
# Line 74  Line 37 
37  #include "../prediction/mbprediction.h"  #include "../prediction/mbprediction.h"
38  #include "../global.h"  #include "../global.h"
39  #include "../utils/timer.h"  #include "../utils/timer.h"
40    #include "motion_est.h"
41  #include "motion.h"  #include "motion.h"
42  #include "sad.h"  #include "sad.h"
43    
44    #define INITIAL_SKIP_THRESH     (10)
45    #define FINAL_SKIP_THRESH       (50)
46    #define MAX_SAD00_FOR_SKIP      (20)
47    #define MAX_CHROMA_SAD_FOR_SKIP (18)
48    #define SKIP_THRESH_B (10)
49    
50    #define CHECK_CANDIDATE(X,Y,D) { \
51    (*CheckCandidate)((const int)(X),(const int)(Y), (D), &iDirection, data ); }
52    
53  static int32_t lambda_vec16[32] =       /* rounded values for lambda param for weight of motion bits as in modified H.26L */  #define iDiamondSize 2
 { 0, (int) (1.00235 + 0.5), (int) (1.15582 + 0.5), (int) (1.31976 + 0.5),  
                 (int) (1.49591 + 0.5), (int) (1.68601 + 0.5),  
         (int) (1.89187 + 0.5), (int) (2.11542 + 0.5), (int) (2.35878 + 0.5),  
                 (int) (2.62429 + 0.5), (int) (2.91455 + 0.5),  
         (int) (3.23253 + 0.5), (int) (3.58158 + 0.5), (int) (3.96555 + 0.5),  
                 (int) (4.38887 + 0.5), (int) (4.85673 + 0.5),  
         (int) (5.37519 + 0.5), (int) (5.95144 + 0.5), (int) (6.59408 + 0.5),  
                 (int) (7.31349 + 0.5), (int) (8.12242 + 0.5),  
         (int) (9.03669 + 0.5), (int) (10.0763 + 0.5), (int) (11.2669 + 0.5),  
                 (int) (12.6426 + 0.5), (int) (14.2493 + 0.5),  
         (int) (16.1512 + 0.5), (int) (18.442 + 0.5), (int) (21.2656 + 0.5),  
                 (int) (24.8580 + 0.5), (int) (29.6436 + 0.5),  
         (int) (36.4949 + 0.5)  
 };  
   
 static int32_t *lambda_vec8 = lambda_vec16;     /* same table for INTER and INTER4V for now */  
   
54    
55    //FILE * debug;
56    
57  // mv.length table  static __inline int
58  static const uint32_t mvtab[33] = {  d_mv_bits(int x, int y, const uint32_t iFcode)
         1, 2, 3, 4, 6, 7, 7, 7,  
         9, 9, 9, 10, 10, 10, 10, 10,  
         10, 10, 10, 10, 10, 10, 10, 10,  
         10, 11, 11, 11, 11, 11, 11, 12, 12  
 };  
   
   
 static __inline uint32_t  
 mv_bits(int32_t component,  
                 const uint32_t iFcode)  
59  {  {
60          if (component == 0)          int xb, yb;
                 return 1;  
   
         if (component < 0)  
                 component = -component;  
   
         if (iFcode == 1) {  
                 if (component > 32)  
                         component = 32;  
61    
62                  return mvtab[component] + 1;          if (x == 0) xb = 1;
63            else {
64                    if (x < 0) x = -x;
65                    x += (1 << (iFcode - 1)) - 1;
66                    x >>= (iFcode - 1);
67                    if (x > 32) x = 32;
68                    xb = mvtab[x] + iFcode;
69          }          }
70    
71          component += (1 << (iFcode - 1)) - 1;          if (y == 0) yb = 1;
72          component >>= (iFcode - 1);          else {
73                    if (y < 0) y = -y;
74          if (component > 32)                  y += (1 << (iFcode - 1)) - 1;
75                  component = 32;                  y >>= (iFcode - 1);
76                    if (y > 32) y = 32;
77          return mvtab[component] + 1 + iFcode - 1;                  yb = mvtab[y] + iFcode;
78            }
79            return xb + yb;
80  }  }
81    
82    /* CHACK_CANDIATE FUNCTIONS START */
83    
84  static __inline uint32_t  static void
85  calc_delta_16(const int32_t dx,  CheckCandidate16(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
                           const int32_t dy,  
                           const uint32_t iFcode,  
                           const uint32_t iQuant)  
86  {  {
87          return NEIGH_TEND_16X16 * lambda_vec16[iQuant] * (mv_bits(dx, iFcode) +          int32_t * const sad = data->temp;
88                                                                                                            mv_bits(dy, iFcode));  //      static int32_t sad[5];
89  }          int t;
90            const uint8_t * Reference;
91    
92  static __inline uint32_t          if (( x > data->max_dx) || ( x < data->min_dx)
93  calc_delta_8(const int32_t dx,                  || ( y > data->max_dy) || (y < data->min_dy)) return;
94                           const int32_t dy,  
95                           const uint32_t iFcode,          switch ( ((x&1)<<1) + (y&1) ) {
96                           const uint32_t iQuant)                  case 0 : Reference = data->Ref + x/2 + (y/2)*(data->iEdgedWidth); break;
97  {                  case 1 : Reference = data->RefV + x/2 + ((y-1)/2)*(data->iEdgedWidth); break;
98          return NEIGH_TEND_8X8 * lambda_vec8[iQuant] * (mv_bits(dx, iFcode) +                  case 2 : Reference = data->RefH + (x-1)/2 + (y/2)*(data->iEdgedWidth); break;
99                                                                                                     mv_bits(dy, iFcode));                  default : Reference = data->RefHV + (x-1)/2 + ((y-1)/2)*(data->iEdgedWidth); break;
100  }  }
101    
102  bool          data->temp[0] = sad16v(data->Cur, Reference, data->iEdgedWidth, sad+1);
 MotionEstimation(MBParam * const pParam,  
                                  FRAMEINFO * const current,  
                                  FRAMEINFO * const reference,  
                                  const IMAGE * const pRefH,  
                                  const IMAGE * const pRefV,  
                                  const IMAGE * const pRefHV,  
                                  const uint32_t iLimit)  
 {  
         const uint32_t iWcount = pParam->mb_width;  
         const uint32_t iHcount = pParam->mb_height;  
         MACROBLOCK *const pMBs = current->mbs;  
         MACROBLOCK *const prevMBs = reference->mbs;  
         const IMAGE *const pCurrent = &current->image;  
         const IMAGE *const pRef = &reference->image;  
103    
104          const VECTOR zeroMV = { 0, 0 };          t = d_mv_bits(x - data->predMV.x, y - data->predMV.y, data->iFcode);
105            data->temp[0] += lambda_vec16[data->iQuant] * t;
106            data->temp[1] += lambda_vec8[data->iQuant] * t;
107    
108          int64_t time;          if (data->temp[0] < data->iMinSAD[0]) {
109          int32_t x, y;                  data->iMinSAD[0] = data->temp[0];
110          int32_t iIntra = 0;                  data->currentMV[0].x = x; data->currentMV[0].y = y;
111          VECTOR pmv;                  *dir = Direction; }
   
         if (sadInit)  
                 (*sadInit) ();  
   
         for (y = 0; y < iHcount; y++)   {  
                 for (x = 0; x < iWcount; x ++)  {  
   
                         MACROBLOCK *const pMB = &pMBs[x + y * iWcount];  
   
                         pMB->sad16 =  
                                 SEARCH16(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,  
                                                  y, current->motion_flags, current->quant,  
                                                  current->fcode, pParam, pMBs, prevMBs, &pMB->mv16,  
                                                  &pMB->pmvs[0]);  
112    
113                          if (0 < (pMB->sad16 - MV16_INTER_BIAS)) {          if (data->temp[1] < data->iMinSAD[1]) {
114                                  int32_t deviation;                  data->iMinSAD[1] = data->temp[1]; data->currentMV[1].x = x; data->currentMV[1].y = y; }
115            if (data->temp[2] < data->iMinSAD[2]) {
116                    data->iMinSAD[2] = data->temp[2]; data->currentMV[2].x = x; data->currentMV[2].y = y; }
117            if (data->temp[3] < data->iMinSAD[3]) {
118                    data->iMinSAD[3] = data->temp[3]; data->currentMV[3].x = x; data->currentMV[3].y = y; }
119            if (data->temp[4] < data->iMinSAD[4]) {
120                    data->iMinSAD[4] = data->temp[4]; data->currentMV[4].x = x; data->currentMV[4].y = y; }
121    
122                                  deviation =  }
                                         dev16(pCurrent->y + x * 16 + y * 16 * pParam->edged_width,  
                                                   pParam->edged_width);  
123    
124                                  if (deviation < (pMB->sad16 - MV16_INTER_BIAS)) {  static void
125                                          pMB->mode = MODE_INTRA;  CheckCandidate16no4v(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
126                                          pMB->mv16 = pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] =  {
127                                                  pMB->mvs[3] = zeroMV;          int32_t sad;
128                                          pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] =          const uint8_t * Reference;
                                                 pMB->sad8[3] = 0;  
129    
130                                          iIntra++;          if (( x > data->max_dx) || ( x < data->min_dx)
131                                          if (iIntra >= iLimit)                  || ( y > data->max_dy) || (y < data->min_dy)) return;
                                                 return 1;  
132    
133                                          continue;          switch ( ((x&1)<<1) + (y&1) )
134            {
135                    case 0 : Reference = data->Ref + x/2 + (y/2)*(data->iEdgedWidth); break;
136                    case 1 : Reference = data->RefV + x/2 + ((y-1)/2)*(data->iEdgedWidth); break;
137                    case 2 : Reference = data->RefH + (x-1)/2 + (y/2)*(data->iEdgedWidth); break;
138                    default : Reference = data->RefHV + (x-1)/2 + ((y-1)/2)*(data->iEdgedWidth); break;
139                                  }                                  }
140    
141            sad = lambda_vec16[data->iQuant] *
142                            d_mv_bits(x - data->predMV.x, y - data->predMV.y, data->iFcode);
143            sad += sad16(data->Cur, Reference, data->iEdgedWidth, 256*4096);
144    
145            if (sad < *(data->iMinSAD)) {
146                    *(data->iMinSAD) = sad;
147                    data->currentMV[0].x = x; data->currentMV[0].y = y;
148                    *dir = Direction; }
149                          }                          }
150    
151                          pmv = pMB->pmvs[0];  static void
152                          if (current->global_flags & XVID_INTER4V)  CheckCandidateInt(const int xf, const int yf, const int Direction, int * const dir, const SearchData * const data)
153                                  if ((!(current->global_flags & XVID_LUMIMASKING) ||  {
154                                           pMB->dquant == NO_CHANGE)) {          int32_t sad;
155                                          int32_t sad8 = IMV16X16 * current->quant;          const int xb = data->currentMV[1].x;
156            const int yb = data->currentMV[1].y;
157                                          if (sad8 < pMB->sad16)          const uint8_t *ReferenceF, *ReferenceB;
   
                                                 sad8 += pMB->sad8[0] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x, 2 * y, pMB->mv16.x,  
                                                                         pMB->mv16.y, current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[0],  
                                                                         &pMB->pmvs[0]);  
   
                                         if (sad8 < pMB->sad16)  
                                                 sad8 += pMB->sad8[1] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x + 1, 2 * y, pMB->mv16.x,  
                                                                         pMB->mv16.y, current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[1],  
                                                                         &pMB->pmvs[1]);  
   
                                         if (sad8 < pMB->sad16)  
                                                 sad8 += pMB->sad8[2] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x, 2 * y + 1, pMB->mv16.x,  
                                                                         pMB->mv16.y, current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[2],  
                                                                         &pMB->pmvs[2]);  
   
                                         if (sad8 < pMB->sad16)  
                                                 sad8 += pMB->sad8[3] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x + 1, 2 * y + 1,  
                                                                         pMB->mv16.x, pMB->mv16.y,  
                                                                         current->motion_flags, current->quant,  
                                                                         current->fcode, pParam, pMBs, prevMBs,  
                                                                         &pMB->mvs[3], &pMB->pmvs[3]);  
158    
159                                          /* decide: MODE_INTER or MODE_INTER4V          if (( xf > data->max_dx) || ( xf < data->min_dx)
160                                             mpeg4:   if (sad8 < pMB->sad16 - nb/2+1) use_inter4v                  || ( yf > data->max_dy) || (yf < data->min_dy)) return;
                                          */  
161    
162                                          if (sad8 < pMB->sad16) {          switch ( ((xf&1)<<1) + (yf&1) ) {
163                                                  pMB->mode = MODE_INTER4V;                  case 0 : ReferenceF = data->Ref + xf/2 + (yf/2)*(data->iEdgedWidth); break;
164                                                  pMB->sad8[0] *= 4;                  case 1 : ReferenceF = data->RefV + xf/2 + ((yf-1)/2)*(data->iEdgedWidth); break;
165                                                  pMB->sad8[1] *= 4;                  case 2 : ReferenceF = data->RefH + (xf-1)/2 + (yf/2)*(data->iEdgedWidth); break;
166                                                  pMB->sad8[2] *= 4;                  default : ReferenceF = data->RefHV + (xf-1)/2 + ((yf-1)/2)*(data->iEdgedWidth); break;
                                                 pMB->sad8[3] *= 4;  
                                                 continue;  
167                                          }                                          }
168    
169            switch ( ((xb&1)<<1) + (yb&1) ) {
170                    case 0 : ReferenceB = data->bRef + xb/2 + (yb/2)*(data->iEdgedWidth); break;
171                    case 1 : ReferenceB = data->bRefV + xb/2 + ((yb-1)/2)*(data->iEdgedWidth); break;
172                    case 2 : ReferenceB = data->bRefH + (xb-1)/2 + (yb/2)*(data->iEdgedWidth); break;
173                    default : ReferenceB = data->bRefHV + (xb-1)/2 + ((yb-1)/2)*(data->iEdgedWidth); break;
174                                  }                                  }
175    
176                          pMB->mode = MODE_INTER;          sad = lambda_vec16[data->iQuant] *
177                          pMB->pmvs[0] = pmv;     /* pMB->pmvs[1] = pMB->pmvs[2] = pMB->pmvs[3]  are not needed for INTER */                          ( d_mv_bits(xf - data->predMV.x, yf - data->predMV.y, data->iFcode) +
178                          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->mv16;                            d_mv_bits(xb - data->bpredMV.x, yb - data->bpredMV.y, data->iFcode) );
                         pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] =  
                                 pMB->sad16;  
                         }  
                         }  
179    
180          return 0;          sad += sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
 }  
181    
182  #define CHECK_MV16_ZERO {\          if (sad < *(data->iMinSAD)) {
183    if ( (0 <= max_dx) && (0 >= min_dx) \                  *(data->iMinSAD) = sad;
184      && (0 <= max_dy) && (0 >= min_dy) ) \                  data->currentMV->x = xf; data->currentMV->y = yf;
185    { \                  *dir = Direction; }
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0, 0 , iEdgedWidth), iEdgedWidth, MV_MAX_ERROR); \  
     iSAD += calc_delta_16(-pmv[0].x, -pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=0; currMV->y=0; }  }     \  
 }  
   
 #define NOCHECK_MV16_CANDIDATE(X,Y) { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \  
 }  
   
 #define CHECK_MV16_CANDIDATE(X,Y) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
 }  
   
 #define CHECK_MV16_CANDIDATE_DIR(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \  
 }  
   
 #define CHECK_MV16_CANDIDATE_FOUND(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
 }  
   
   
 #define CHECK_MV8_ZERO {\  
   iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, 0, 0 , iEdgedWidth), iEdgedWidth); \  
   iSAD += calc_delta_8(-pmv[0].x, -pmv[0].y, (uint8_t)iFcode, iQuant);\  
   if (iSAD < iMinSAD) \  
   { iMinSAD=iSAD; currMV->x=0; currMV->y=0; } \  
 }  
   
 #define NOCHECK_MV8_CANDIDATE(X,Y) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \  
 }  
   
 #define CHECK_MV8_CANDIDATE(X,Y) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
 }  
   
 #define CHECK_MV8_CANDIDATE_DIR(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \  
 }  
   
 #define CHECK_MV8_CANDIDATE_FOUND(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
186  }  }
187    
188  /* too slow and not fully functional at the moment */  static void
189  /*  CheckCandidateDirect(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
 int32_t ZeroSearch16(  
                                         const uint8_t * const pRef,  
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const IMAGE * const pCur,  
                                         const int x, const int y,  
                                         const uint32_t MotionFlags,  
                                         const uint32_t iQuant,  
                                         const uint32_t iFcode,  
                                         MBParam * const pParam,  
                                         const MACROBLOCK * const pMBs,  
                                         const MACROBLOCK * const prevMBs,  
                                         VECTOR * const currMV,  
                                         VECTOR * const currPMV)  
190  {  {
191          const int32_t iEdgedWidth = pParam->edged_width;          int32_t sad;
192          const uint8_t * cur = pCur->y + x*16 + y*16*iEdgedWidth;          int k;
193          int32_t iSAD;          const uint8_t *ReferenceF;
194          VECTOR pred;          const uint8_t *ReferenceB;
195            VECTOR mvs, b_mvs;
196    
197            if (( x > 31) || ( x < -32) || ( y > 31) || (y < -32)) return;
198    
199          pred = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);          sad = lambda_vec16[data->iQuant] * d_mv_bits(x, y, 1);
200    
201          iSAD = sad16( cur,          for (k = 0; k < 4; k++) {
202                  get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0,0, iEdgedWidth),                  mvs.x = data->directmvF[k].x + x;
203                  iEdgedWidth, MV_MAX_ERROR);                  b_mvs.x = ((x == 0) ?
204          if (iSAD <= iQuant * 96)                          data->directmvB[k].x
205                  iSAD -= MV16_00_BIAS;                          : mvs.x - data->referencemv[k].x);
206    
207          currMV->x = 0;                  mvs.y = data->directmvF[k].y + y;
208          currMV->y = 0;                  b_mvs.y = ((y == 0) ?
209          currPMV->x = -pred.x;                          data->directmvB[k].y
210          currPMV->y = -pred.y;                          : mvs.y - data->referencemv[k].y);
211    
212          return iSAD;                  if (( mvs.x > data->max_dx ) || ( mvs.x < data->min_dx )
213                            || ( mvs.y > data->max_dy ) || ( mvs.y < data->min_dy )
214                            || ( b_mvs.x > data->max_dx ) || ( b_mvs.x < data->min_dx )
215                            || ( b_mvs.y > data->max_dy ) || ( b_mvs.y < data->min_dy )) return;
216    
217                    switch ( ((mvs.x&1)<<1) + (mvs.y&1) ) {
218                            case 0 : ReferenceF = data->Ref + mvs.x/2 + (mvs.y/2)*(data->iEdgedWidth); break;
219                            case 1 : ReferenceF = data->RefV + mvs.x/2 + ((mvs.y-1)/2)*(data->iEdgedWidth); break;
220                            case 2 : ReferenceF = data->RefH + (mvs.x-1)/2 + (mvs.y/2)*(data->iEdgedWidth); break;
221                            default : ReferenceF = data->RefHV + (mvs.x-1)/2 + ((mvs.y-1)/2)*(data->iEdgedWidth); break;
222  }  }
 */  
223    
224  int32_t                  switch ( ((b_mvs.x&1)<<1) + (b_mvs.y&1) ) {
225  Diamond16_MainSearch(const uint8_t * const pRef,                          case 0 : ReferenceB = data->bRef + b_mvs.x/2 + (b_mvs.y/2)*(data->iEdgedWidth); break;
226                                           const uint8_t * const pRefH,                          case 1 : ReferenceB = data->bRefV + b_mvs.x/2 + ((b_mvs.y-1)/2)*(data->iEdgedWidth); break;
227                                           const uint8_t * const pRefV,                          case 2 : ReferenceB = data->bRefH + (b_mvs.x-1)/2 + (b_mvs.y/2)*(data->iEdgedWidth); break;
228                                           const uint8_t * const pRefHV,                          default : ReferenceB = data->bRefHV + (b_mvs.x-1)/2 + ((b_mvs.y-1)/2)*(data->iEdgedWidth); break;
                                          const uint8_t * const cur,  
                                          const int x,  
                                          const int y,  
                                          int32_t startx,  
                                          int32_t starty,  
                                          int32_t iMinSAD,  
                                          VECTOR * const currMV,  
                                          const VECTOR * const pmv,  
                                          const int32_t min_dx,  
                                          const int32_t max_dx,  
                                          const int32_t min_dy,  
                                          const int32_t max_dy,  
                                          const int32_t iEdgedWidth,  
                                          const int32_t iDiamondSize,  
                                          const int32_t iFcode,  
                                          const int32_t iQuant,  
                                          int iFound)  
 {  
 /* Do a diamond search around given starting point, return SAD of best */  
   
         int32_t iDirection = 0;  
         int32_t iSAD;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
 /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  
   
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;  
   
                         if (iDirection != 2)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,  
                                                                                    backupMV.y, 1);  
                         if (iDirection != 1)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x + iDiamondSize,  
                                                                                    backupMV.y, 2);  
                         if (iDirection != 4)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y - iDiamondSize, 3);  
                         if (iDirection != 3)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y + iDiamondSize, 4);  
         } else {  
                 currMV->x = startx;  
                 currMV->y = starty;  
         }  
         return iMinSAD;  
229  }  }
230    
231  int32_t                  sad += sad8bi(data->Cur + 8*(k&1) + 8*(k>>1)*(data->iEdgedWidth),
232  Square16_MainSearch(const uint8_t * const pRef,                                                  ReferenceF + 8*(k&1) + 8*(k>>1)*(data->iEdgedWidth),
233                                          const uint8_t * const pRefH,                                                  ReferenceB + 8*(k&1) + 8*(k>>1)*(data->iEdgedWidth),
234                                          const uint8_t * const pRefV,                                                  data->iEdgedWidth);
235                                          const uint8_t * const pRefHV,                  if (sad > *(data->iMinSAD)) return;
236                                          const uint8_t * const cur,          }
                                         const int x,  
                                         const int y,  
                                         int32_t startx,  
                                         int32_t starty,  
                                         int32_t iMinSAD,  
                                         VECTOR * const currMV,  
                                         const VECTOR * const pmv,  
                                         const int32_t min_dx,  
                                         const int32_t max_dx,  
                                         const int32_t min_dy,  
                                         const int32_t max_dy,  
                                         const int32_t iEdgedWidth,  
                                         const int32_t iDiamondSize,  
                                         const int32_t iFcode,  
                                         const int32_t iQuant,  
                                         int iFound)  
 {  
 /* Do a square search around given starting point, return SAD of best */  
   
         int32_t iDirection = 0;  
         int32_t iSAD;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
 /* It's one search with full square pattern, and new parts for all following diamonds */  
   
 /*   new direction are extra, so 1-4 is normal diamond  
       537  
       1*2  
       648  
 */  
   
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                          backupMV.y - iDiamondSize, 5);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                          backupMV.y + iDiamondSize, 6);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                          backupMV.y - iDiamondSize, 7);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                          backupMV.y + iDiamondSize, 8);  
   
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;  
237    
238                          switch (iDirection) {          if (sad < *(data->iMinSAD)) {
239                          case 1:                  *(data->iMinSAD) = sad;
240                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,                  data->currentMV->x = x; data->currentMV->y = y;
241                                                                                     backupMV.y, 1);                  *dir = Direction; }
242                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  }
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 break;  
                         case 2:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
243    
244                          case 3:  static void
245                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,  CheckCandidateDirectno4v(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
246                                                                                   4);  {
247                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,          int32_t sad;
248                                                                                   backupMV.y - iDiamondSize, 7);          const uint8_t *ReferenceF;
249                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,          const uint8_t *ReferenceB;
250                                                                                   backupMV.y + iDiamondSize, 8);          VECTOR mvs, b_mvs;
                                 break;  
251    
252                          case 4:          if (( x > 31) || ( x < -31) || ( y > 31) || (y < -31)) return;
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 break;  
253    
254                          case 5:                  sad = lambda_vec16[data->iQuant] * d_mv_bits(x, y, 1);
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,  
                                                                                  1);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 break;  
255    
256                          case 6:          mvs.x = data->directmvF[0].x + x;
257                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,          b_mvs.x = ((x == 0) ?
258                                                                                   2);                  data->directmvB[0].x
259                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,                  : mvs.x - data->referencemv[0].x);
                                                                                  3);  
   
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
260    
261                                  break;          mvs.y = data->directmvF[0].y + y;
262            b_mvs.y = ((y == 0) ?
263                    data->directmvB[0].y
264                    : mvs.y - data->referencemv[0].y);
265    
266                          case 7:          if (( mvs.x > data->max_dx ) || ( mvs.x < data->min_dx )
267                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,                  || ( mvs.y > data->max_dy ) || ( mvs.y < data->min_dy )
268                                                                                     backupMV.y, 1);                  || ( b_mvs.x > data->max_dx ) || ( b_mvs.x < data->min_dx )
269                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,                  || ( b_mvs.y > data->max_dy ) || ( b_mvs.y < data->min_dy )) return;
                                                                                  4);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
270    
271                          case 8:          switch ( ((mvs.x&1)<<1) + (mvs.y&1) ) {
272                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,                  case 0 : ReferenceF = data->Ref + mvs.x/2 + (mvs.y/2)*(data->iEdgedWidth); break;
273                                                                                   2);                  case 1 : ReferenceF = data->RefV + mvs.x/2 + ((mvs.y-1)/2)*(data->iEdgedWidth); break;
274                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,                  case 2 : ReferenceF = data->RefH + (mvs.x-1)/2 + (mvs.y/2)*(data->iEdgedWidth); break;
275                                                                                   4);                  default : ReferenceF = data->RefHV + (mvs.x-1)/2 + ((mvs.y-1)/2)*(data->iEdgedWidth); break;
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
                         default:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,  
                                                                                  1);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,  
                                                                                  4);  
   
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
276                          }                          }
277          } else {  
278                  currMV->x = startx;          switch ( ((b_mvs.x&1)<<1) + (b_mvs.y&1) ) {
279                  currMV->y = starty;                  case 0 : ReferenceB = data->bRef + b_mvs.x/2 + (b_mvs.y/2)*(data->iEdgedWidth); break;
280                    case 1 : ReferenceB = data->bRefV + b_mvs.x/2 + ((b_mvs.y-1)/2)*(data->iEdgedWidth); break;
281                    case 2 : ReferenceB = data->bRefH + (b_mvs.x-1)/2 + (b_mvs.y/2)*(data->iEdgedWidth); break;
282                    default : ReferenceB = data->bRefHV + (b_mvs.x-1)/2 + ((b_mvs.y-1)/2)*(data->iEdgedWidth); break;
283          }          }
284          return iMinSAD;  
285            sad += sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
286    
287            if (sad < *(data->iMinSAD)) {
288                    *(data->iMinSAD) = sad;
289                    data->currentMV->x = x; data->currentMV->y = y;
290                    *dir = Direction; }
291  }  }
292    
293    static void
294    CheckCandidate8(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
295    {
296            int32_t sad;
297            const uint8_t * Reference;
298    
299  int32_t          if (( x > data->max_dx) || ( x < data->min_dx)
300  Full16_MainSearch(const uint8_t * const pRef,                  || ( y > data->max_dy) || (y < data->min_dy)) return;
                                   const uint8_t * const pRefH,  
                                   const uint8_t * const pRefV,  
                                   const uint8_t * const pRefHV,  
                                   const uint8_t * const cur,  
                                   const int x,  
                                   const int y,  
                                   int32_t startx,  
                                   int32_t starty,  
                                   int32_t iMinSAD,  
                                   VECTOR * const currMV,  
                                   const VECTOR * const pmv,  
                                   const int32_t min_dx,  
                                   const int32_t max_dx,  
                                   const int32_t min_dy,  
                                   const int32_t max_dy,  
                                   const int32_t iEdgedWidth,  
                                   const int32_t iDiamondSize,  
                                   const int32_t iFcode,  
                                   const int32_t iQuant,  
                                   int iFound)  
 {  
         int32_t iSAD;  
         int32_t dx, dy;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
         for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)  
                 for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)  
                         NOCHECK_MV16_CANDIDATE(dx, dy);  
301    
302          return iMinSAD;          switch ( ((x&1)<<1) + (y&1) )
303            {
304                    case 0 : Reference = data->Ref + x/2 + (y/2)*(data->iEdgedWidth); break;
305                    case 1 : Reference = data->RefV + x/2 + ((y-1)/2)*(data->iEdgedWidth); break;
306                    case 2 : Reference = data->RefH + (x-1)/2 + (y/2)*(data->iEdgedWidth); break;
307                    default : Reference = data->RefHV + (x-1)/2 + ((y-1)/2)*(data->iEdgedWidth); break;
308  }  }
309    
310  int32_t          sad = sad8(data->Cur, Reference, data->iEdgedWidth);
311  AdvDiamond16_MainSearch(const uint8_t * const pRef,          sad += lambda_vec8[data->iQuant] * d_mv_bits(x - data->predMV.x, y - data->predMV.y, data->iFcode);
                                                 const uint8_t * const pRefH,  
                                                 const uint8_t * const pRefV,  
                                                 const uint8_t * const pRefHV,  
                                                 const uint8_t * const cur,  
                                                 const int x,  
                                                 const int y,  
                                                 int32_t startx,  
                                                 int32_t starty,  
                                                 int32_t iMinSAD,  
                                                 VECTOR * const currMV,  
                                                 const VECTOR * const pmv,  
                                                 const int32_t min_dx,  
                                                 const int32_t max_dx,  
                                                 const int32_t min_dy,  
                                                 const int32_t max_dy,  
                                                 const int32_t iEdgedWidth,  
                                                 const int32_t iDiamondSize,  
                                                 const int32_t iFcode,  
                                                 const int32_t iQuant,  
                                                 int iDirection)  
 {  
312    
313          int32_t iSAD;          if (sad < *(data->iMinSAD)) {
314                    *(data->iMinSAD) = sad;
315                    data->currentMV->x = x; data->currentMV->y = y;
316                    *dir = Direction; }
317    }
318    
319  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */  /* CHACK_CANDIATE FUNCTIONS END */
320    
321          if (iDirection) {  /* MAINSEARCH FUNCTIONS START */
                 CHECK_MV16_CANDIDATE(startx - iDiamondSize, starty);  
                 CHECK_MV16_CANDIDATE(startx + iDiamondSize, starty);  
                 CHECK_MV16_CANDIDATE(startx, starty - iDiamondSize);  
                 CHECK_MV16_CANDIDATE(startx, starty + iDiamondSize);  
         } else {  
                 int bDirection = 1 + 2 + 4 + 8;  
322    
323                  do {  static void
324                          iDirection = 0;  AdvDiamondSearch(int x, int y, const SearchData * const data, int bDirection)
325                          if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)  {
                                 CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);  
326    
327                          if (bDirection & 2)  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
                                 CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);  
328    
329                          if (bDirection & 4)                  int iDirection;
                                 CHECK_MV16_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);  
330    
331                          if (bDirection & 8)                  do {
332                                  CHECK_MV16_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);                          iDirection = 0;
333                            if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1);
334                            if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2);
335                            if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4);
336                            if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8);
337    
338                          /* now we're doing diagonal checks near our candidate */                          /* now we're doing diagonal checks near our candidate */
339    
340                          if (iDirection)         //checking if anything found                          if (iDirection) {               //checking if anything found
                         {  
341                                  bDirection = iDirection;                                  bDirection = iDirection;
342                                  iDirection = 0;                                  iDirection = 0;
343                                  startx = currMV->x;                                  x = data->currentMV->x; y = data->currentMV->y;
344                                  starty = currMV->y;                                  if (bDirection & 3) {   //our candidate is left or right
345                                  if (bDirection & 3)     //our candidate is left or right                                          CHECK_CANDIDATE(x, y + iDiamondSize, 8);
346                                  {                                          CHECK_CANDIDATE(x, y - iDiamondSize, 4);
347                                          CHECK_MV16_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);                                  } else {                        // what remains here is up or down
348                                          CHECK_MV16_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);                                          CHECK_CANDIDATE(x + iDiamondSize, y, 2);
349                                  } else                  // what remains here is up or down                                          CHECK_CANDIDATE(x - iDiamondSize, y, 1); }
                                 {  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);  
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);  
                                 }  
350    
351                                  if (iDirection) {                                  if (iDirection) {
352                                          bDirection += iDirection;                                          bDirection += iDirection;
353                                          startx = currMV->x;                                          x = data->currentMV->x; y = data->currentMV->y; }
354                                          starty = currMV->y;                          } else {                                //about to quit, eh? not so fast....
                                 }  
                         } else                          //about to quit, eh? not so fast....  
                         {  
355                                  switch (bDirection) {                                  switch (bDirection) {
356                                  case 2:                                  case 2:
357                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
358                                                                                           starty - iDiamondSize, 2 + 4);                                          CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
359                                          break;                                          break;
360                                  case 1:                                  case 1:
361                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
362                                                                                           starty - iDiamondSize, 1 + 4);                                          CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty + iDiamondSize, 1 + 8);  
363                                          break;                                          break;
364                                  case 2 + 4:                                  case 2 + 4:
365                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
366                                                                                           starty - iDiamondSize, 1 + 4);                                          CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
367                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                                                                          starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
368                                          break;                                          break;
369                                  case 4:                                  case 4:
370                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
371                                                                                           starty - iDiamondSize, 2 + 4);                                          CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty - iDiamondSize, 1 + 4);  
372                                          break;                                          break;
373                                  case 8:                                  case 8:
374                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
375                                                                                           starty + iDiamondSize, 2 + 8);                                          CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty + iDiamondSize, 1 + 8);  
376                                          break;                                          break;
377                                  case 1 + 4:                                  case 1 + 4:
378                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
379                                                                                           starty + iDiamondSize, 1 + 8);                                          CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
380                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
                                                                                          starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty - iDiamondSize, 2 + 4);  
381                                          break;                                          break;
382                                  case 2 + 8:                                  case 2 + 8:
383                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
384                                                                                           starty - iDiamondSize, 1 + 4);                                          CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
385                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                                                                          starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
386                                          break;                                          break;
387                                  case 1 + 8:                                  case 1 + 8:
388                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
389                                                                                           starty - iDiamondSize, 2 + 4);                                          CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
390                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                          CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                                                                          starty + iDiamondSize, 2 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty + iDiamondSize, 1 + 8);  
391                                          break;                                          break;
392                                  default:                //1+2+4+8 == we didn't find anything at all                                  default:                //1+2+4+8 == we didn't find anything at all
393                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
394                                                                                           starty - iDiamondSize, 1 + 4);                                          CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
395                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                          CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
396                                                                                           starty + iDiamondSize, 1 + 8);                                          CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
397                                          break;                                          break;
398                                  }                                  }
399                                  if (!iDirection)                                  if (!iDirection) break;         //ok, the end. really
                                         break;          //ok, the end. really  
                                 else {  
400                                          bDirection = iDirection;                                          bDirection = iDirection;
401                                          startx = currMV->x;                                  x = data->currentMV->x; y = data->currentMV->y;
                                         starty = currMV->y;  
                                 }  
402                          }                          }
403                  }                  }
404                  while (1);                              //forever                  while (1);                              //forever
405          }          }
         return iMinSAD;  
 }  
406    
407  int32_t  static void
408  AdvDiamond8_MainSearch(const uint8_t * const pRef,  SquareSearch(int x, int y, const SearchData * const data, int bDirection)
                                            const uint8_t * const pRefH,  
                                            const uint8_t * const pRefV,  
                                            const uint8_t * const pRefHV,  
                                            const uint8_t * const cur,  
                                            const int x,  
                                            const int y,  
                                            int32_t startx,  
                                            int32_t starty,  
                                            int32_t iMinSAD,  
                                            VECTOR * const currMV,  
                                            const VECTOR * const pmv,  
                                            const int32_t min_dx,  
                                            const int32_t max_dx,  
                                            const int32_t min_dy,  
                                            const int32_t max_dy,  
                                            const int32_t iEdgedWidth,  
                                            const int32_t iDiamondSize,  
                                            const int32_t iFcode,  
                                            const int32_t iQuant,  
                                            int iDirection)  
409  {  {
410            int iDirection;
411    
412            do {
413                    iDirection = 0;
414                    if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1+16+64);
415                    if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2+32+128);
416                    if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4+16+32);
417                    if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8+64+128);
418                    if (bDirection & 16) CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1+4+16+32+64);
419                    if (bDirection & 32) CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2+4+16+32+128);
420                    if (bDirection & 64) CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1+8+16+64+128);
421                    if (bDirection & 128) CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2+8+32+64+128);
422    
423                    bDirection = iDirection;
424                    x = data->currentMV->x; y = data->currentMV->y;
425            } while (iDirection);
426    }
427    
428          int32_t iSAD;  static void
429    DiamondSearch(int x, int y, const SearchData * const data, int bDirection)
430    {
431    
432  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
433    
434          if (iDirection) {                  int iDirection;
                 CHECK_MV8_CANDIDATE(startx - iDiamondSize, starty);  
                 CHECK_MV8_CANDIDATE(startx + iDiamondSize, starty);  
                 CHECK_MV8_CANDIDATE(startx, starty - iDiamondSize);  
                 CHECK_MV8_CANDIDATE(startx, starty + iDiamondSize);  
         } else {  
                 int bDirection = 1 + 2 + 4 + 8;  
435    
436                  do {                  do {
437                          iDirection = 0;                          iDirection = 0;
438                          if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)                          if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1);
439                                  CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);                          if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2);
440                            if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4);
441                          if (bDirection & 2)                          if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8);
                                 CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);  
   
                         if (bDirection & 4)  
                                 CHECK_MV8_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);  
   
                         if (bDirection & 8)  
                                 CHECK_MV8_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);  
442    
443                          /* now we're doing diagonal checks near our candidate */                          /* now we're doing diagonal checks near our candidate */
444    
445                          if (iDirection)         //checking if anything found                          if (iDirection) {               //checking if anything found
                         {  
446                                  bDirection = iDirection;                                  bDirection = iDirection;
447                                  iDirection = 0;                                  iDirection = 0;
448                                  startx = currMV->x;                                  x = data->currentMV->x; y = data->currentMV->y;
449                                  starty = currMV->y;                                  if (bDirection & 3) {   //our candidate is left or right
450                                  if (bDirection & 3)     //our candidate is left or right                                          CHECK_CANDIDATE(x, y + iDiamondSize, 8);
451                                  {                                          CHECK_CANDIDATE(x, y - iDiamondSize, 4);
452                                          CHECK_MV8_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);                                  } else {                        // what remains here is up or down
453                                          CHECK_MV8_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);                                          CHECK_CANDIDATE(x + iDiamondSize, y, 2);
454                                  } else                  // what remains here is up or down                                          CHECK_CANDIDATE(x - iDiamondSize, y, 1); }
                                 {  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);  
                                 }  
455    
                                 if (iDirection) {  
456                                          bDirection += iDirection;                                          bDirection += iDirection;
457                                          startx = currMV->x;                                  x = data->currentMV->x; y = data->currentMV->y;
                                         starty = currMV->y;  
                                 }  
                         } else                          //about to quit, eh? not so fast....  
                         {  
                                 switch (bDirection) {  
                                 case 2:  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 1:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         break;  
                                 case 2 + 4:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 4:  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         break;  
                                 case 8:  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         break;  
                                 case 1 + 4:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         break;  
                                 case 2 + 8:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 1 + 8:  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         break;  
                                 default:                //1+2+4+8 == we didn't find anything at all  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
                                 }  
                                 if (!(iDirection))  
                                         break;          //ok, the end. really  
                                 else {  
                                         bDirection = iDirection;  
                                         startx = currMV->x;  
                                         starty = currMV->y;  
                                 }  
458                          }                          }
459                  }                  }
460                  while (1);                              //forever                  while (iDirection);
         }  
         return iMinSAD;  
 }  
   
   
 int32_t  
 Full8_MainSearch(const uint8_t * const pRef,  
                                  const uint8_t * const pRefH,  
                                  const uint8_t * const pRefV,  
                                  const uint8_t * const pRefHV,  
                                  const uint8_t * const cur,  
                                  const int x,  
                                  const int y,  
                                  int32_t startx,  
                                  int32_t starty,  
                                  int32_t iMinSAD,  
                                  VECTOR * const currMV,  
                                  const VECTOR * const pmv,  
                                  const int32_t min_dx,  
                                  const int32_t max_dx,  
                                  const int32_t min_dy,  
                                  const int32_t max_dy,  
                                  const int32_t iEdgedWidth,  
                                  const int32_t iDiamondSize,  
                                  const int32_t iFcode,  
                                  const int32_t iQuant,  
                                  int iFound)  
 {  
         int32_t iSAD;  
         int32_t dx, dy;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
         for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)  
                 for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)  
                         NOCHECK_MV8_CANDIDATE(dx, dy);  
   
         return iMinSAD;  
461  }  }
462    
463    /* MAINSEARCH FUNCTIONS END */
464    
465    /* HALFPELREFINE COULD BE A MAINSEARCH FUNCTION, BUT THERE IS NO NEED FOR IT */
466    
467  int32_t  static void
468  Halfpel16_Refine(const uint8_t * const pRef,  HalfpelRefine(const SearchData * const data)
                                  const uint8_t * const pRefH,  
                                  const uint8_t * const pRefV,  
                                  const uint8_t * const pRefHV,  
                                  const uint8_t * const cur,  
                                  const int x,  
                                  const int y,  
                                  VECTOR * const currMV,  
                                  int32_t iMinSAD,  
                                  const VECTOR * const pmv,  
                                  const int32_t min_dx,  
                                  const int32_t max_dx,  
                                  const int32_t min_dy,  
                                  const int32_t max_dy,  
                                  const int32_t iFcode,  
                                  const int32_t iQuant,  
                                  const int32_t iEdgedWidth)  
469  {  {
470  /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */  /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */
471    
472          int32_t iSAD;          VECTOR backupMV = *(data->currentMV);
473          VECTOR backupMV = *currMV;          int iDirection; //not needed
   
         CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y - 1);  
         CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y - 1);  
         CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y - 1);  
         CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y);  
         CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y);  
         CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y + 1);  
         CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y + 1);  
         CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y + 1);  
   
         return iMinSAD;  
 }  
   
 #define PMV_HALFPEL16 (PMV_HALFPELDIAMOND16|PMV_HALFPELREFINE16)  
   
   
 int32_t  
 PMVfastSearch16(const uint8_t * const pRef,  
                                 const uint8_t * const pRefH,  
                                 const uint8_t * const pRefV,  
                                 const uint8_t * const pRefHV,  
                                 const IMAGE * const pCur,  
                                 const int x,  
                                 const int y,  
                                 const uint32_t MotionFlags,  
                                 const uint32_t iQuant,  
                                 const uint32_t iFcode,  
                                 const MBParam * const pParam,  
                                 const MACROBLOCK * const pMBs,  
                                 const MACROBLOCK * const prevMBs,  
                                 VECTOR * const currMV,  
                                 VECTOR * const currPMV)  
 {  
         const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
   
         const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;  
   
         int32_t iDiamondSize;  
   
         int32_t min_dx;  
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
   
         int32_t iFound;  
   
         VECTOR newMV;  
         VECTOR backupMV;                        /* just for PMVFAST */  
474    
475          VECTOR pmv[4];          CHECK_CANDIDATE(backupMV.x - 1, backupMV.y - 1, 0);
476          int32_t psad[4];          CHECK_CANDIDATE(backupMV.x + 1, backupMV.y - 1, 0);
477            CHECK_CANDIDATE(backupMV.x - 1, backupMV.y + 1, 0);
478            CHECK_CANDIDATE(backupMV.x + 1, backupMV.y + 1, 0);
479    
480          MainSearch16FuncPtr MainSearchPtr;          CHECK_CANDIDATE(backupMV.x - 1, backupMV.y, 0);
481            CHECK_CANDIDATE(backupMV.x + 1, backupMV.y, 0);
482    
483          const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;          CHECK_CANDIDATE(backupMV.x, backupMV.y + 1, 0);
484            CHECK_CANDIDATE(backupMV.x, backupMV.y - 1, 0);
         int32_t threshA, threshB;  
         int32_t bPredEq;  
         int32_t iMinSAD, iSAD;  
   
 /* Get maximum range */  
         get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,  
                           iFcode);  
   
 /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */  
   
         if (!(MotionFlags & PMV_HALFPEL16)) {  
                 min_dx = EVEN(min_dx);  
                 max_dx = EVEN(max_dx);  
                 min_dy = EVEN(min_dy);  
                 max_dy = EVEN(max_dy);  
485          }          }
486    
487          /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  static __inline int
488          //bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);  SkipDecisionP(const IMAGE * current, const IMAGE * reference,
489          bPredEq = get_pmvdata2(pMBs, iWcount, 0, x, y, 0, pmv, psad);                                                          const int x, const int y,
490                                                            const uint32_t iEdgedWidth, const uint32_t iQuant)
 /*      fprintf(stderr,"pmv: %d %d / %d --- %d %d   %d %d   %d %d - %d %d %d\n",  
                 pmv[0].x,pmv[0].y,psad[0],  
                 pmv[1].x,pmv[1].y,pmv[2].x,pmv[2].y,pmv[3].x,pmv[3].y,  
                 psad[1],psad[2],psad[3]);  
 */  
         if ((x == 0) && (y == 0)) {  
                 threshA = 512;  
                 threshB = 1024;  
         } else {  
                 threshA = psad[0];  
                 threshB = threshA + 256;  
                 if (threshA < 512)  
                         threshA = 512;  
                 if (threshA > 1024)  
                         threshA = 1024;  
                 if (threshB > 1792)  
                         threshB = 1792;  
         }  
   
         iFound = 0;  
   
 /* Step 4: Calculate SAD around the Median prediction.  
    MinSAD=SAD  
    If Motion Vector equal to Previous frame motion vector  
    and MinSAD<PrevFrmSAD goto Step 10.  
    If SAD<=256 goto Step 10.  
 */  
491    
492          *currMV = pmv[0];                       /* current best := prediction */  {
493          if (!(MotionFlags & PMV_HALFPEL16)) {   /* This should NOT be necessary! */  /*      keep repeating checks for all b-frames before this P frame,
494                  currMV->x = EVEN(currMV->x);          to make sure that SKIP is possible (todo)
495                  currMV->y = EVEN(currMV->y);          how: if skip is not possible set sad00 to a very high value */
496          }  
497            uint32_t sadC = sad8(current->u + x*8 + y*(iEdgedWidth/2)*8,
498                                            reference->u + x*8 + y*(iEdgedWidth/2)*8, iEdgedWidth/2);
499            if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP) return 0;
500            sadC += sad8(current->v + x*8 + y*(iEdgedWidth/2)*8,
501                                            reference->v + x*8 + y*(iEdgedWidth/2)*8, iEdgedWidth/2);
502            if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP) return 0;
503    
504          if (currMV->x > max_dx) {          return 1;
                 currMV->x = max_dx;  
         }  
         if (currMV->x < min_dx) {  
                 currMV->x = min_dx;  
         }  
         if (currMV->y > max_dy) {  
                 currMV->y = max_dy;  
         }  
         if (currMV->y < min_dy) {  
                 currMV->y = min_dy;  
505          }          }
506    
507          iMinSAD =  static __inline void
508                  sad16(cur,  SkipMacroblockP(MACROBLOCK *pMB, const int32_t sad)
                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,  
                                                  iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);  
         iMinSAD +=  
                 calc_delta_16(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                           (uint8_t) iFcode, iQuant);  
   
         if ((iMinSAD < 256) ||  
                 ((MVequal(*currMV, prevMB->mvs[0])) &&  
                  ((uint32_t) iMinSAD < prevMB->sad16))) {  
                 if (iMinSAD < 2 * iQuant)       // high chances for SKIP-mode  
509                  {                  {
510                          if (!MVzero(*currMV)) {          pMB->mode = MODE_NOT_CODED;
511                                  iMinSAD += MV16_00_BIAS;          pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = pMB->mv16.x = 0;
512                                  CHECK_MV16_ZERO;        // (0,0) saves space for letterboxed pictures          pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = pMB->mv16.y = 0;
513                                  iMinSAD -= MV16_00_BIAS;          pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = sad;
514                          }                          }
                 }  
   
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast16_Terminate_with_Refine;  
         }  
   
515    
516  /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  bool
517     vector of the median.  MotionEstimation(MBParam * const pParam,
518     If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2                                   FRAMEINFO * const current,
519  */                                   FRAMEINFO * const reference,
520                                     const IMAGE * const pRefH,
521          if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[0])))                                   const IMAGE * const pRefV,
522                  iFound = 2;                                   const IMAGE * const pRefHV,
523                                     const uint32_t iLimit)
524  /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.  {
525     Otherwise select large Diamond Search.          MACROBLOCK *const pMBs = current->mbs;
526  */          const IMAGE *const pCurrent = &current->image;
527            const IMAGE *const pRef = &reference->image;
         if ((!MVzero(pmv[0])) || (threshB < 1536) || (bPredEq))  
                 iDiamondSize = 1;               // halfpel!  
         else  
                 iDiamondSize = 2;               // halfpel!  
   
         if (!(MotionFlags & PMV_HALFPELDIAMOND16))  
                 iDiamondSize *= 2;  
   
 /*  
    Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  
    Also calculate (0,0) but do not subtract offset.  
    Let MinSAD be the smallest SAD up to this point.  
    If MV is (0,0) subtract offset.  
 */  
   
 // (0,0) is always possible  
528    
529          if (!MVzero(pmv[0]))          const VECTOR zeroMV = { 0, 0 };
                 CHECK_MV16_ZERO;  
530    
531  // previous frame MV is always possible          uint32_t x, y;
532            uint32_t iIntra = 0;
533            int32_t InterBias;
534    
535            if (sadInit) (*sadInit) ();
536    
537            for (y = 0; y < pParam->mb_height; y++) {
538                    for (x = 0; x < pParam->mb_width; x++)  {
539    
540                            MACROBLOCK *pMB = &pMBs[x + y * pParam->mb_width];
541                            int32_t sad00 =  pMB->sad16
542                                    = sad16v(pCurrent->y + (x + y * pParam->edged_width) * 16,
543                                                            pRef->y + (x + y * pParam->edged_width) * 16,
544                                                            pParam->edged_width, pMB->sad8 );
545    
546                            if (!(current->global_flags & XVID_LUMIMASKING)) {
547                                    pMB->dquant = NO_CHANGE;
548                                    pMB->quant = current->quant; }
549    
550    //initial skip decision
551    
552                            if ((pMB->dquant == NO_CHANGE) && (sad00 <= MAX_SAD00_FOR_SKIP * pMB->quant)
553                                    && (SkipDecisionP(pCurrent, pRef, x, y, pParam->edged_width, pMB->quant)) ) {
554                                    if (pMB->sad16 < pMB->quant * INITIAL_SKIP_THRESH) {
555                                                    SkipMacroblockP(pMB, sad00);
556                                                    continue;
557                                    }
558                            } else sad00 = 256*4096; // skip not allowed - for final skip decision
559    
560          if (!MVzero(prevMB->mvs[0]))                          SearchP(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,
561                  if (!MVequal(prevMB->mvs[0], pmv[0]))                                                  y, current->motion_flags, pMB->quant,
562                          CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);                                                  current->fcode, pParam, pMBs, reference->mbs,
563                                                    current->global_flags & XVID_INTER4V, pMB);
564    
565    /* final skip decision, a.k.a. "the vector you found, really that good?" */
566                            if (sad00 < pMB->quant * MAX_SAD00_FOR_SKIP)
567                                    if ((100*pMB->sad16)/(sad00+1) > FINAL_SKIP_THRESH)
568                                    { SkipMacroblockP(pMB, sad00); continue; }
569    
570  // left neighbour, if allowed  /* finally, intra decision */
571    
572          if (!MVzero(pmv[1]))                          InterBias = MV16_INTER_BIAS;
573                  if (!MVequal(pmv[1], prevMB->mvs[0]))                          if (pMB->quant > 8)  InterBias += 50 * (pMB->quant - 8); // to make high quants work
574                          if (!MVequal(pmv[1], pmv[0])) {                          if (y != 0)
575                                  if (!(MotionFlags & PMV_HALFPEL16)) {                                  if ((pMB - pParam->mb_width)->mode == MODE_INTER ) InterBias -= 50;
576                                          pmv[1].x = EVEN(pmv[1].x);                          if (x != 0)
577                                          pmv[1].y = EVEN(pmv[1].y);                                  if ((pMB - 1)->mode == MODE_INTER ) InterBias -= 50;
                                 }  
578    
579                                  CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);                          if (InterBias < pMB->sad16)  {
580                          }                                  const int32_t deviation =
581  // top neighbour, if allowed                                          dev16(pCurrent->y + (x + y * pParam->edged_width) * 16,
582          if (!MVzero(pmv[2]))                                                    pParam->edged_width);
                 if (!MVequal(pmv[2], prevMB->mvs[0]))  
                         if (!MVequal(pmv[2], pmv[0]))  
                                 if (!MVequal(pmv[2], pmv[1])) {  
                                         if (!(MotionFlags & PMV_HALFPEL16)) {  
                                                 pmv[2].x = EVEN(pmv[2].x);  
                                                 pmv[2].y = EVEN(pmv[2].y);  
                                         }  
                                         CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);  
583    
584  // top right neighbour, if allowed                                  if (deviation < (pMB->sad16 - InterBias)) {
585                                          if (!MVzero(pmv[3]))                                          if (++iIntra >= iLimit) return 1;
586                                                  if (!MVequal(pmv[3], prevMB->mvs[0]))                                          pMB->mode = MODE_INTRA;
587                                                          if (!MVequal(pmv[3], pmv[0]))                                          pMB->mv16 = pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] =
588                                                                  if (!MVequal(pmv[3], pmv[1]))                                                  pMB->mvs[3] = zeroMV;
589                                                                          if (!MVequal(pmv[3], pmv[2])) {                                          pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] =
590                                                                                  if (!(MotionFlags & PMV_HALFPEL16)) {                                                  pMB->sad8[3] = 0;
                                                                                         pmv[3].x = EVEN(pmv[3].x);  
                                                                                         pmv[3].y = EVEN(pmv[3].y);  
591                                                                                  }                                                                                  }
                                                                                 CHECK_MV16_CANDIDATE(pmv[3].x,  
                                                                                                                          pmv[3].y);  
592                                                                          }                                                                          }
593                                  }                                  }
   
         if ((MVzero(*currMV)) &&  
                 (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )  
                 iMinSAD -= MV16_00_BIAS;  
   
   
 /* Step 6: If MinSAD <= thresa goto Step 10.  
    If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.  
 */  
   
         if ((iMinSAD <= threshA) ||  
                 (MVequal(*currMV, prevMB->mvs[0]) &&  
                  ((uint32_t) iMinSAD < prevMB->sad16))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast16_Terminate_with_Refine;  
594          }          }
595            return 0;
   
 /************ (Diamond Search)  **************/  
 /*  
    Step 7: Perform Diamond search, with either the small or large diamond.  
    If Found=2 only examine one Diamond pattern, and afterwards goto step 10  
    Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.  
    If center then goto step 10.  
    Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.  
    Refine by using small diamond and goto step 10.  
 */  
   
         if (MotionFlags & PMV_USESQUARES16)  
                 MainSearchPtr = Square16_MainSearch;  
         else if (MotionFlags & PMV_ADVANCEDDIAMOND16)  
                 MainSearchPtr = AdvDiamond16_MainSearch;  
         else  
                 MainSearchPtr = Diamond16_MainSearch;  
   
         backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  
   
   
 //      fprintf(stderr,"Entering Diamond %d %d (%d):\n",x,y,iMinSAD);  
   
 /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  
         iSAD =  
                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  
                                                   currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                   iQuant, iFound);  
   
         if (iSAD < iMinSAD) {  
                 *currMV = newMV;  
                 iMinSAD = iSAD;  
596          }          }
597    
         if (MotionFlags & PMV_EXTSEARCH16) {  
 /* extended: search (up to) two more times: orignal prediction and (0,0) */  
598    
599                  if (!(MVequal(pmv[0], backupMV))) {  #define PMV_HALFPEL16 (PMV_HALFPELDIAMOND16|PMV_HALFPELREFINE16)
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  
                                                                   pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   iDiamondSize, iFcode, iQuant, iFound);  
   
                         if (iSAD < iMinSAD) {  
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
                 }  
600    
601                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {  static __inline int
602                          iSAD =  make_mask(const VECTOR * const pmv, const int i)
603                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  {
604                                                                    iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,          int mask = 0xFF, j;
605                                                                    max_dy, iEdgedWidth, iDiamondSize, iFcode,          for (j = 0; j < i; j++) {
606                                                                    iQuant, iFound);                  if (MVequal(pmv[i], pmv[j])) return 0; // same vector has been checked already
607                    if (pmv[i].x == pmv[j].x) {
608                          if (iSAD < iMinSAD) {                          if (pmv[i].y == pmv[j].y + iDiamondSize) { mask &= ~4; continue; }
609                                  *currMV = newMV;                          if (pmv[i].y == pmv[j].y - iDiamondSize) { mask &= ~8; continue; }
610                                  iMinSAD = iSAD;                  } else
611                            if (pmv[i].y == pmv[j].y) {
612                                    if (pmv[i].x == pmv[j].x + iDiamondSize) { mask &= ~1; continue; }
613                                    if (pmv[i].x == pmv[j].x - iDiamondSize) { mask &= ~2; continue; }
614                          }                          }
615                  }                  }
616            return mask;
617          }          }
618    
619  /*  static __inline void
620     Step 10:  The motion vector is chosen according to the block corresponding to MinSAD.  PreparePredictionsP(VECTOR * const pmv, int x, int y, const int iWcount,
621  */                          const int iHcount, const MACROBLOCK * const prevMB)
622    {
   PMVfast16_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step  
                 iMinSAD =  
                         Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                          iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                          iFcode, iQuant, iEdgedWidth);  
   
 /*fprintf(stderr,"Chosen for %d %d: %d %d - %d %d\n",x,y,currMV->x,currMV->y,pmv[0].x,pmv[0].y);  
 */  
   PMVfast16_Terminate_without_Refine:  
         currPMV->x = currMV->x - pmv[0].x;  
         currPMV->y = currMV->y - pmv[0].y;  
         return iMinSAD;  
 }  
   
   
   
   
623    
624    //this function depends on get_pmvdata which means that it sucks. It should get the predictions by itself
625    
626  int32_t          if ( (y != 0) && (x != (iWcount-1)) ) {         // [5] top-right neighbour
627  Diamond8_MainSearch(const uint8_t * const pRef,                  pmv[5].x = EVEN(pmv[3].x);
628                                          const uint8_t * const pRefH,                  pmv[5].y = EVEN(pmv[3].y); }
629                                          const uint8_t * const pRefV,          else pmv[5].x = pmv[5].y = 0;
                                         const uint8_t * const pRefHV,  
                                         const uint8_t * const cur,  
                                         const int x,  
                                         const int y,  
                                         int32_t startx,  
                                         int32_t starty,  
                                         int32_t iMinSAD,  
                                         VECTOR * const currMV,  
                                         const VECTOR * const pmv,  
                                         const int32_t min_dx,  
                                         const int32_t max_dx,  
                                         const int32_t min_dy,  
                                         const int32_t max_dy,  
                                         const int32_t iEdgedWidth,  
                                         const int32_t iDiamondSize,  
                                         const int32_t iFcode,  
                                         const int32_t iQuant,  
                                         int iFound)  
 {  
 /* Do a diamond search around given starting point, return SAD of best */  
   
         int32_t iDirection = 0;  
         int32_t iSAD;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
 /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  
   
         CHECK_MV8_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV8_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV8_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV8_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;     // since iDirection!=0, this is well defined!  
   
                         if (iDirection != 2)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x - iDiamondSize,  
                                                                                   backupMV.y, 1);  
                         if (iDirection != 1)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x + iDiamondSize,  
                                                                                   backupMV.y, 2);  
                         if (iDirection != 4)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x,  
                                                                                   backupMV.y - iDiamondSize, 3);  
                         if (iDirection != 3)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x,  
                                                                                   backupMV.y + iDiamondSize, 4);  
         } else {  
                 currMV->x = startx;  
                 currMV->y = starty;  
         }  
         return iMinSAD;  
 }  
630    
631  int32_t          if (x != 0) { pmv[3].x = EVEN(pmv[1].x); pmv[3].y = EVEN(pmv[1].y); }// pmv[3] is left neighbour
632  Halfpel8_Refine(const uint8_t * const pRef,          else pmv[3].x = pmv[3].y = 0;
                                 const uint8_t * const pRefH,  
                                 const uint8_t * const pRefV,  
                                 const uint8_t * const pRefHV,  
                                 const uint8_t * const cur,  
                                 const int x,  
                                 const int y,  
                                 VECTOR * const currMV,  
                                 int32_t iMinSAD,  
                                 const VECTOR * const pmv,  
                                 const int32_t min_dx,  
                                 const int32_t max_dx,  
                                 const int32_t min_dy,  
                                 const int32_t max_dy,  
                                 const int32_t iFcode,  
                                 const int32_t iQuant,  
                                 const int32_t iEdgedWidth)  
 {  
 /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */  
633    
634          int32_t iSAD;          if (y != 0) { pmv[4].x = EVEN(pmv[2].x); pmv[4].y = EVEN(pmv[2].y); }// [4] top neighbour
635          VECTOR backupMV = *currMV;      else pmv[4].x = pmv[4].y = 0;
636    
637          CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y - 1);          // [1] median prediction
638          CHECK_MV8_CANDIDATE(backupMV.x, backupMV.y - 1);          pmv[1].x = EVEN(pmv[0].x); pmv[1].y = EVEN(pmv[0].y);
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y - 1);  
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y);  
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y + 1);  
         CHECK_MV8_CANDIDATE(backupMV.x, backupMV.y + 1);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y + 1);  
639    
640          return iMinSAD;          pmv[0].x = pmv[0].y = 0; // [0] is zero; not used in the loop (checked before) but needed here for make_mask
 }  
641    
642            pmv[2].x = EVEN(prevMB->mvs[0].x); // [2] is last frame
643            pmv[2].y = EVEN(prevMB->mvs[0].y);
644    
645  #define PMV_HALFPEL8 (PMV_HALFPELDIAMOND8|PMV_HALFPELREFINE8)          if ((x != iWcount-1) && (y != iHcount-1)) {
646                    pmv[6].x = EVEN((prevMB+1+iWcount)->mvs[0].x); //[6] right-down neighbour in last frame
647                    pmv[6].y = EVEN((prevMB+1+iWcount)->mvs[0].y); }
648            else pmv[6].x = pmv[6].y = 0;
649    }
650    
651  int32_t  static void
652  PMVfastSearch8(const uint8_t * const pRef,  SearchP(const uint8_t * const pRef,
653                             const uint8_t * const pRefH,                             const uint8_t * const pRefH,
654                             const uint8_t * const pRefV,                             const uint8_t * const pRefV,
655                             const uint8_t * const pRefHV,                             const uint8_t * const pRefHV,
656                             const IMAGE * const pCur,                             const IMAGE * const pCur,
657                             const int x,                             const int x,
658                             const int y,                             const int y,
                            const int start_x,  
                            const int start_y,  
659                             const uint32_t MotionFlags,                             const uint32_t MotionFlags,
660                             const uint32_t iQuant,                             const uint32_t iQuant,
661                             const uint32_t iFcode,                             const uint32_t iFcode,
662                             const MBParam * const pParam,                             const MBParam * const pParam,
663                             const MACROBLOCK * const pMBs,                             const MACROBLOCK * const pMBs,
664                             const MACROBLOCK * const prevMBs,                             const MACROBLOCK * const prevMBs,
665                             VECTOR * const currMV,                  int inter4v,
666                             VECTOR * const currPMV)                  MACROBLOCK * const pMB)
667  {  {
668          const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
669          const int32_t iEdgedWidth = pParam->edged_width;          const int32_t iEdgedWidth = pParam->edged_width;
670    
671          const uint8_t *cur = pCur->y + x * 8 + y * 8 * iEdgedWidth;          int i, iDirection = 255, mask, threshA;
672            int32_t temp[5];
673            VECTOR currentMV[5], pmv[7];
674            int32_t psad[4], iMinSAD[5];
675            MainSearchFunc * MainSearchPtr;
676            SearchData Data;
677    
678            get_pmvdata2(pMBs, pParam->mb_width, 0, x, y, 0, pmv, psad);  //has to be changed to get_pmv(2)()
679            get_range(&Data.min_dx, &Data.max_dx, &Data.min_dy, &Data.max_dy, x, y, 16,
680                                    pParam->width, pParam->height, iFcode);
681    
682            Data.predMV = pmv[0];
683            Data.Cur = pCur->y + (x + y * iEdgedWidth) * 16;
684            Data.iEdgedWidth = iEdgedWidth;
685            Data.currentMV = currentMV;
686            Data.iMinSAD = iMinSAD;
687            Data.Ref = pRef + (x + iEdgedWidth*y)*16;
688            Data.RefH = pRefH + (x + iEdgedWidth*y) * 16;
689            Data.RefV = pRefV + (x + iEdgedWidth*y) * 16;
690            Data.RefHV = pRefHV + (x + iEdgedWidth*y) * 16;
691            Data.temp = temp;
692    
693            Data.iQuant = iQuant;
694            Data.iFcode = iFcode;
695    
696          int32_t iDiamondSize;          if (!(MotionFlags & PMV_HALFPEL16)) {
697                    Data.min_dx = EVEN(Data.min_dx);
698                    Data.max_dx = EVEN(Data.max_dx);
699                    Data.min_dy = EVEN(Data.min_dy);
700                    Data.max_dy = EVEN(Data.max_dy); }
701    
702          int32_t min_dx;          for(i = 0;  i < 5; i++) currentMV[i].x = currentMV[i].y = 0;
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
703    
704          VECTOR pmv[4];          i = d_mv_bits(pmv[0].x, pmv[0].y, iFcode);
         int32_t psad[4];  
         VECTOR newMV;  
         VECTOR backupMV;  
         VECTOR startMV;  
705    
706  //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;          iMinSAD[0] = pMB->sad16 + lambda_vec16[iQuant] * i;
707          const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;          iMinSAD[1] = pMB->sad8[0] + lambda_vec8[iQuant] * i;
708            iMinSAD[2] = pMB->sad8[1];
709            iMinSAD[3] = pMB->sad8[2];
710            iMinSAD[4] = pMB->sad8[3];
711    
712           int32_t threshA, threshB;          if (pMB->dquant != NO_CHANGE) inter4v = 0;
         int32_t iFound, bPredEq;  
         int32_t iMinSAD, iSAD;  
713    
714          int32_t iSubBlock = (y & 1) + (y & 1) + (x & 1);          if ((x == 0) && (y == 0)) threshA = 512;
715            else {
716                    threshA = psad[0] + 20;
717                    if (threshA < 512) threshA = 512;
718                    if (threshA > 1024) threshA = 1024; }
719    
720            PreparePredictionsP(pmv, x, y, pParam->mb_width, pParam->mb_height,
721                                            prevMBs + x + y * pParam->mb_width);
722    
723            if (inter4v) CheckCandidate = CheckCandidate16;
724            else CheckCandidate = CheckCandidate16no4v;
725    
726    /* main loop. checking all predictions */
727    
728            for (i = 1; i < 7; i++) {
729                    if (!(mask = make_mask(pmv, i)) ) continue;
730                    CheckCandidate16(pmv[i].x, pmv[i].y, mask, &iDirection, &Data);
731                    if (iMinSAD[0] < threshA) break;
732            }
733    
734            if ((iMinSAD[0] <= threshA) ||
735                            (MVequal(currentMV[0], (prevMBs+x+y*pParam->mb_width)->mvs[0]) &&
736                            (iMinSAD[0] < (prevMBs+x+y*pParam->mb_width)->sad16))) {
737                    inter4v = 0;
738                    if (MotionFlags & PMV_QUICKSTOP16) goto PMVfast16_Terminate_without_Refine;
739                    if (MotionFlags & PMV_EARLYSTOP16) {
740                            CheckCandidate = CheckCandidate16no4v; // I sure hope it's faster
741                            goto PMVfast16_Terminate_with_Refine;
742                    }
743            }
744    
745          MainSearch8FuncPtr MainSearchPtr;          if (MotionFlags & PMV_USESQUARES16)
746                    MainSearchPtr = SquareSearch;
747            else if (MotionFlags & PMV_ADVANCEDDIAMOND16)
748                    MainSearchPtr = AdvDiamondSearch;
749                    else MainSearchPtr = DiamondSearch;
750    
751          /* Init variables */          (*MainSearchPtr)(currentMV->x, currentMV->y, &Data, iDirection);
         startMV.x = start_x;  
         startMV.y = start_y;  
752    
753          /* Get maximum range */  /* extended search, diamond starting in 0,0 and in prediction.
754          get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,          note that this search is/might be done in halfpel positions,
755                            iFcode);          which makes it more different than the diamond above */
756    
757          if (!(MotionFlags & PMV_HALFPELDIAMOND8)) {          if (MotionFlags & PMV_EXTSEARCH16) {
758                  min_dx = EVEN(min_dx);                  int32_t bSAD;
759                  max_dx = EVEN(max_dx);                  VECTOR startMV = Data.predMV, backupMV = currentMV[0];
760                  min_dy = EVEN(min_dy);                  if (!(MotionFlags & PMV_HALFPELREFINE16)) // who's gonna use extsearch and no halfpel?
761                  max_dy = EVEN(max_dy);                          startMV.x = EVEN(startMV.x); startMV.y = EVEN(startMV.y);
762                    if (!(MVequal(startMV, backupMV))) {
763                            bSAD = iMinSAD[0]; iMinSAD[0] = MV_MAX_ERROR;
764    
765                            CheckCandidate16(startMV.x, startMV.y, 255, &iDirection, &Data);
766                            (*MainSearchPtr)(startMV.x, startMV.y, &Data, 255);
767                            if (bSAD < iMinSAD[0]) {
768                                    currentMV[0] = backupMV;
769                                    iMinSAD[0] = bSAD; }
770                    }
771    
772                    backupMV = currentMV[0];
773                    if (MotionFlags & PMV_HALFPELREFINE16) startMV.x = startMV.y = 1;
774                    else startMV.x = startMV.y = 0;
775                    if (!(MVequal(startMV, backupMV))) {
776                            bSAD = iMinSAD[0]; iMinSAD[0] = MV_MAX_ERROR;
777    
778                            CheckCandidate16(startMV.x, startMV.y, 255, &iDirection, &Data);
779                            (*MainSearchPtr)(startMV.x, startMV.y, &Data, 255);
780                            if (bSAD < iMinSAD[0]) {
781                                    currentMV[0] = backupMV;
782                                    iMinSAD[0] = bSAD; }
783                    }
784          }          }
785    
786          /* because we might use IF (dx>max_dx) THEN dx=max_dx; */  PMVfast16_Terminate_with_Refine:
         //bPredEq = get_pmvdata(pMBs, (x >> 1), (y >> 1), iWcount, iSubBlock, pmv, psad);  
         bPredEq = get_pmvdata2(pMBs, iWcount, 0, (x >> 1), (y >> 1), iSubBlock, pmv, psad);  
   
         if ((x == 0) && (y == 0)) {  
                 threshA = 512 / 4;  
                 threshB = 1024 / 4;  
787    
788          } else {          if (MotionFlags & PMV_HALFPELREFINE16) HalfpelRefine(&Data);
                 threshA = psad[0] / 4;  /* good estimate */  
                 threshB = threshA + 256 / 4;  
                 if (threshA < 512 / 4)  
                         threshA = 512 / 4;  
                 if (threshA > 1024 / 4)  
                         threshA = 1024 / 4;  
                 if (threshB > 1792 / 4)  
                         threshB = 1792 / 4;  
         }  
   
         iFound = 0;  
   
 /* Step 4: Calculate SAD around the Median prediction.  
    MinSAD=SAD  
    If Motion Vector equal to Previous frame motion vector  
    and MinSAD<PrevFrmSAD goto Step 10.  
    If SAD<=256 goto Step 10.  
 */  
789    
790    PMVfast16_Terminate_without_Refine:
791    
792  // Prepare for main loop          if (inter4v)
793                    for(i = 0; i < 4; i++)
794                            Search8(&Data, 2*x+(i&1), 2*y+(i>>1), MotionFlags, pParam, pMB, pMBs, i);
795    
796            if (!(inter4v) ||
797                    (iMinSAD[0] < iMinSAD[1] + iMinSAD[2] + iMinSAD[3] + iMinSAD[4] + IMV16X16 * (int32_t)iQuant )) {
798    // INTER MODE
799                    pMB->mode = MODE_INTER;
800                    pMB->mv16 = pMB->mvs[0] = pMB->mvs[1]
801                            = pMB->mvs[2] = pMB->mvs[3] = currentMV[0];
802    
803  //  if (MotionFlags & PMV_USESQUARES8)                  pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] =
804  //      MainSearchPtr = Square8_MainSearch;                          pMB->sad8[2] = pMB->sad8[3] =  iMinSAD[0];
 //  else  
805    
806          if (MotionFlags & PMV_ADVANCEDDIAMOND8)                  pMB->pmvs[0].x = currentMV[0].x - Data.predMV.x;
807                  MainSearchPtr = AdvDiamond8_MainSearch;                  pMB->pmvs[0].y = currentMV[0].y - Data.predMV.y;
808          else          } else {
809                  MainSearchPtr = Diamond8_MainSearch;  // INTER4V MODE; all other things are already set in Search8
810                    pMB->mode = MODE_INTER4V;
811                    pMB->sad16 = iMinSAD[1] + iMinSAD[2] + iMinSAD[3] + iMinSAD[4] + IMV16X16 * iQuant;
812            }
813    
814    }
815    
816          *currMV = startMV;  static void
817    Search8(const SearchData * const OldData,
818                    const int x, const int y,
819                    const uint32_t MotionFlags,
820                    const MBParam * const pParam,
821                    MACROBLOCK * const pMB,
822                    const MACROBLOCK * const pMBs,
823                    const int block)
824    {
825            SearchData Data;
826    
827          iMinSAD =          Data.predMV = get_pmv2(pMBs, pParam->mb_width, 0, x/2 , y/2, block);
828                  sad8(cur,          Data.iMinSAD = OldData->iMinSAD + 1 + block;
829                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,          Data.currentMV = OldData->currentMV+1+block;
830                                                  iEdgedWidth), iEdgedWidth);          Data.iFcode = OldData->iFcode;
831          iMinSAD +=          Data.iQuant = OldData->iQuant;
                 calc_delta_8(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                          (uint8_t) iFcode, iQuant);  
   
         if ((iMinSAD < 256 / 4) || ((MVequal(*currMV, prevMB->mvs[iSubBlock]))  
                                                                 && ((uint32_t) iMinSAD <  
                                                                         prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
   
 /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  
    vector of the median.  
    If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2  
 */  
832    
833          if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[iSubBlock])))          if (block != 0)
834                  iFound = 2;                  *(Data.iMinSAD) += lambda_vec8[Data.iQuant] *
835                                                                    d_mv_bits(      Data.currentMV->x - Data.predMV.x,
836                                                                                            Data.currentMV->y - Data.predMV.y,
837                                                                                            Data.iFcode);
838    
 /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.  
    Otherwise select large Diamond Search.  
 */  
839    
840          if ((!MVzero(pmv[0])) || (threshB < 1536 / 4) || (bPredEq))          if (MotionFlags & (PMV_EXTSEARCH8|PMV_HALFPELREFINE8)) {
                 iDiamondSize = 1;               // 1 halfpel!  
         else  
                 iDiamondSize = 2;               // 2 halfpel = 1 full pixel!  
841    
842          if (!(MotionFlags & PMV_HALFPELDIAMOND8))                  Data.Ref = OldData->Ref + 8 * ((block&1) + pParam->edged_width*(block>>1));
843                  iDiamondSize *= 2;                  Data.RefH = OldData->RefH + 8 * ((block&1) + pParam->edged_width*(block>>1));
844                    Data.RefV = OldData->RefV + 8 * ((block&1) + pParam->edged_width*(block>>1));
845                    Data.RefHV = OldData->RefHV + 8 * ((block&1) + pParam->edged_width*(block>>1));
846    
847                    Data.iEdgedWidth = pParam->edged_width;
848    
849  /*                  Data.Cur = OldData->Cur + 8 * ((block&1) + pParam->edged_width*(block>>1));
    Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  
    Also calculate (0,0) but do not subtract offset.  
    Let MinSAD be the smallest SAD up to this point.  
    If MV is (0,0) subtract offset.  
 */  
850    
851  // the median prediction might be even better than mv16                  get_range(&Data.min_dx, &Data.max_dx, &Data.min_dy, &Data.max_dy, x, y, 8,
852                                    pParam->width, pParam->height, OldData->iFcode);
853    
854          if (!MVequal(pmv[0], startMV))                  CheckCandidate = CheckCandidate8;
                 CHECK_MV8_CANDIDATE(pmv[0].x, pmv[0].y);  
855    
856  // (0,0) if needed                  if (MotionFlags & PMV_EXTSEARCH8) {
         if (!MVzero(pmv[0]))  
                 if (!MVzero(startMV))  
                         CHECK_MV8_ZERO;  
   
 // previous frame MV if needed  
         if (!MVzero(prevMB->mvs[iSubBlock]))  
                 if (!MVequal(prevMB->mvs[iSubBlock], startMV))  
                         if (!MVequal(prevMB->mvs[iSubBlock], pmv[0]))  
                                 CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x,  
                                                                         prevMB->mvs[iSubBlock].y);  
   
         if ((iMinSAD <= threshA) ||  
                 (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&  
                  ((uint32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
   
 // left neighbour, if allowed and needed  
         if (!MVzero(pmv[1]))  
                 if (!MVequal(pmv[1], startMV))  
                         if (!MVequal(pmv[1], prevMB->mvs[iSubBlock]))  
                                 if (!MVequal(pmv[1], pmv[0])) {  
                                         if (!(MotionFlags & PMV_HALFPEL8)) {  
                                                 pmv[1].x = EVEN(pmv[1].x);  
                                                 pmv[1].y = EVEN(pmv[1].y);  
                                         }  
                                         CHECK_MV8_CANDIDATE(pmv[1].x, pmv[1].y);  
                                 }  
 // top neighbour, if allowed and needed  
         if (!MVzero(pmv[2]))  
                 if (!MVequal(pmv[2], startMV))  
                         if (!MVequal(pmv[2], prevMB->mvs[iSubBlock]))  
                                 if (!MVequal(pmv[2], pmv[0]))  
                                         if (!MVequal(pmv[2], pmv[1])) {  
                                                 if (!(MotionFlags & PMV_HALFPEL8)) {  
                                                         pmv[2].x = EVEN(pmv[2].x);  
                                                         pmv[2].y = EVEN(pmv[2].y);  
                                                 }  
                                                 CHECK_MV8_CANDIDATE(pmv[2].x, pmv[2].y);  
   
 // top right neighbour, if allowed and needed  
                                                 if (!MVzero(pmv[3]))  
                                                         if (!MVequal(pmv[3], startMV))  
                                                                 if (!MVequal(pmv[3], prevMB->mvs[iSubBlock]))  
                                                                         if (!MVequal(pmv[3], pmv[0]))  
                                                                                 if (!MVequal(pmv[3], pmv[1]))  
                                                                                         if (!MVequal(pmv[3], pmv[2])) {  
                                                                                                 if (!  
                                                                                                         (MotionFlags &  
                                                                                                          PMV_HALFPEL8)) {  
                                                                                                         pmv[3].x = EVEN(pmv[3].x);  
                                                                                                         pmv[3].y = EVEN(pmv[3].y);  
                                                                                                 }  
                                                                                                 CHECK_MV8_CANDIDATE(pmv[3].x,  
                                                                                                                                         pmv[3].y);  
                                                                                         }  
                                         }  
   
         if ((MVzero(*currMV)) &&  
                 (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )  
                 iMinSAD -= MV8_00_BIAS;  
857    
858                            MainSearchFunc *MainSearchPtr;
859                            if (MotionFlags & PMV_USESQUARES8) MainSearchPtr = SquareSearch;
860                                    else if (MotionFlags & PMV_ADVANCEDDIAMOND8) MainSearchPtr = AdvDiamondSearch;
861                                            else MainSearchPtr = DiamondSearch;
862    
863  /* Step 6: If MinSAD <= thresa goto Step 10.                          (*MainSearchPtr)(Data.currentMV->x, Data.currentMV->y, &Data, 255);     }
    If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.  
 */  
864    
865          if ((iMinSAD <= threshA) ||                  if (MotionFlags & PMV_HALFPELREFINE8) HalfpelRefine(&Data);
                 (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&  
                  ((uint32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
866          }          }
867    
868  /************ (Diamond Search)  **************/          pMB->pmvs[block].x = Data.currentMV->x - Data.predMV.x;
869  /*          pMB->pmvs[block].y = Data.currentMV->y - Data.predMV.y;
870     Step 7: Perform Diamond search, with either the small or large diamond.          pMB->mvs[block] = *(Data.currentMV);
871     If Found=2 only examine one Diamond pattern, and afterwards goto step 10          pMB->sad8[block] =  4 * (*(Data.iMinSAD));
872     Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.  }
    If center then goto step 10.  
    Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.  
    Refine by using small diamond and goto step 10.  
 */  
873    
874          backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  /* B-frames code starts here */
875    
876  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  static __inline VECTOR
877          iSAD =  ChoosePred(const MACROBLOCK * const pMB, const uint32_t mode)
878                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  {
879                                                    currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,  /* the stupidiest function ever */
880                                                    min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,          if (mode == MODE_FORWARD) return pMB->mvs[0];
881                                                    iQuant, iFound);          else return pMB->b_mvs[0];
   
         if (iSAD < iMinSAD) {  
                 *currMV = newMV;  
                 iMinSAD = iSAD;  
882          }          }
883    
884          if (MotionFlags & PMV_EXTSEARCH8) {  static void __inline
885  /* extended: search (up to) two more times: orignal prediction and (0,0) */  PreparePredictionsBF(VECTOR * const pmv, const int x, const int y,
886                                                            const uint32_t iWcount,
887                  if (!(MVequal(pmv[0], backupMV))) {                                                          const MACROBLOCK * const pMB,
888                          iSAD =                                                          const uint32_t mode_curr)
889                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  {
                                                                   pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   iDiamondSize, iFcode, iQuant, iFound);  
890    
891                          if (iSAD < iMinSAD) {          // [0] is prediction
892                                  *currMV = newMV;          pmv[0].x = EVEN(pmv[0].x); pmv[0].y = EVEN(pmv[0].y);
                                 iMinSAD = iSAD;  
                         }  
                 }  
893    
894                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {          pmv[1].x = pmv[1].y = 0; // [1] is zero
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  
                                                                   iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, iFound);  
895    
896                          if (iSAD < iMinSAD) {          pmv[2] = ChoosePred(pMB, mode_curr);
897                                  *currMV = newMV;          pmv[2].x = EVEN(pmv[2].x); pmv[2].y = EVEN(pmv[2].y);
                                 iMinSAD = iSAD;  
                         }  
                 }  
         }  
898    
899  /* Step 10: The motion vector is chosen according to the block corresponding to MinSAD.          pmv[3].x = pmv[3].y = 0;
900     By performing an optional local half-pixel search, we can refine this result even further.          if ((y != 0)&&(x != (int)(iWcount+1))) {                        // [3] top-right neighbour
901  */                  pmv[3] = ChoosePred(pMB+1-iWcount, mode_curr);
902                    pmv[3].x = EVEN(pmv[3].x); pmv[3].y = EVEN(pmv[3].y); }
903    
904    PMVfast8_Terminate_with_Refine:          if (y != 0) {
905          if (MotionFlags & PMV_HALFPELREFINE8)   // perform final half-pel step                  pmv[4] = ChoosePred(pMB-iWcount, mode_curr);
906                  iMinSAD =                  pmv[4].x = EVEN(pmv[4].x); pmv[4].y = EVEN(pmv[4].y);
907                          Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,          } else pmv[4].x = pmv[4].y = 0;
                                                         iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                         iFcode, iQuant, iEdgedWidth);  
908    
909            if (x != 0) {
910                    pmv[5] = ChoosePred(pMB-1, mode_curr);
911                    pmv[5].x = EVEN(pmv[5].x); pmv[5].y = EVEN(pmv[5].y);
912            } else pmv[5].x = pmv[5].y = 0;
913    
914    PMVfast8_Terminate_without_Refine:          if ((x != 0)&&(y != 0)) {
915          currPMV->x = currMV->x - pmv[0].x;                  pmv[6] = ChoosePred(pMB-1-iWcount, mode_curr);
916          currPMV->y = currMV->y - pmv[0].y;                  pmv[6].x = EVEN(pmv[5].x); pmv[5].y = EVEN(pmv[5].y);
917            } else pmv[6].x = pmv[6].y = 0;
918    
919          return iMinSAD;  // more?
920  }  }
921    
922  int32_t  
923  EPZSSearch16(const uint8_t * const pRef,  /* search backward or forward, for b-frames */
924    static void
925    SearchBF(       const uint8_t * const pRef,
926                           const uint8_t * const pRefH,                           const uint8_t * const pRefH,
927                           const uint8_t * const pRefV,                           const uint8_t * const pRefV,
928                           const uint8_t * const pRefHV,                           const uint8_t * const pRefHV,
929                           const IMAGE * const pCur,                           const IMAGE * const pCur,
930                           const int x,                          const int x, const int y,
                          const int y,  
931                           const uint32_t MotionFlags,                           const uint32_t MotionFlags,
932                           const uint32_t iQuant,                           const uint32_t iQuant,
933                           const uint32_t iFcode,                           const uint32_t iFcode,
934                           const MBParam * const pParam,                           const MBParam * const pParam,
935                           const MACROBLOCK * const pMBs,                          MACROBLOCK * const pMB,
936                           const MACROBLOCK * const prevMBs,                          const VECTOR * const predMV,
937                           VECTOR * const currMV,                          int32_t * const best_sad,
938                           VECTOR * const currPMV)                          const int32_t mode_current)
939  {  {
         const uint32_t iWcount = pParam->mb_width;  
         const uint32_t iHcount = pParam->mb_height;  
940    
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
941          const int32_t iEdgedWidth = pParam->edged_width;          const int32_t iEdgedWidth = pParam->edged_width;
942    
943          const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;          int i, iDirection, mask;
944            VECTOR currentMV, pmv[7];
945          int32_t min_dx;          MainSearchFunc *MainSearchPtr;
946          int32_t max_dx;          int32_t iMinSAD = MV_MAX_ERROR;
947          int32_t min_dy;          SearchData Data;
948          int32_t max_dy;  
949            Data.iMinSAD = &iMinSAD;
950          VECTOR newMV;          Data.Cur = pCur->y + (x + y * iEdgedWidth) * 16;
951          VECTOR backupMV;          Data.iEdgedWidth = iEdgedWidth;
952            Data.currentMV = &currentMV;
953          VECTOR pmv[4];          Data.iMinSAD = &iMinSAD;
954          int32_t psad[8];          Data.Ref = pRef + (x + y * iEdgedWidth) * 16;
955            Data.RefH = pRefH + (x + y * iEdgedWidth) * 16;
956          static MACROBLOCK *oldMBs = NULL;          Data.RefV = pRefV + (x + y * iEdgedWidth) * 16;
957            Data.RefHV = pRefHV + (x + y * iEdgedWidth) * 16;
958  //  const MACROBLOCK * const pMB = pMBs + x + y * iWcount;  
959          const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;          Data.iQuant = iQuant;
960          MACROBLOCK *oldMB = NULL;          Data.iFcode = iFcode;
961            Data.predMV = *predMV;
          int32_t thresh2;  
         int32_t bPredEq;  
         int32_t iMinSAD, iSAD = 9999;  
   
         MainSearch16FuncPtr MainSearchPtr;  
962    
963          if (oldMBs == NULL) {          get_range(&Data.min_dx, &Data.max_dx, &Data.min_dy, &Data.max_dy, x, y, 16,
964                  oldMBs = (MACROBLOCK *) calloc(iWcount * iHcount, sizeof(MACROBLOCK));                                  pParam->width, pParam->height, iFcode);
 //      fprintf(stderr,"allocated %d bytes for oldMBs\n",iWcount*iHcount*sizeof(MACROBLOCK));  
         }  
         oldMB = oldMBs + x + y * iWcount;  
   
 /* Get maximum range */  
         get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,  
                           iFcode);  
   
         if (!(MotionFlags & PMV_HALFPEL16)) {  
                 min_dx = EVEN(min_dx);  
                 max_dx = EVEN(max_dx);  
                 min_dy = EVEN(min_dy);  
                 max_dy = EVEN(max_dy);  
         }  
         /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  
         //bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);  
         bPredEq = get_pmvdata2(pMBs, iWcount, 0, x, y, 0, pmv, psad);  
   
 /* Step 4: Calculate SAD around the Median prediction.  
         MinSAD=SAD  
         If Motion Vector equal to Previous frame motion vector  
                 and MinSAD<PrevFrmSAD goto Step 10.  
         If SAD<=256 goto Step 10.  
 */  
   
 // Prepare for main loop  
   
         *currMV = pmv[0];                       /* current best := median prediction */  
         if (!(MotionFlags & PMV_HALFPEL16)) {  
                 currMV->x = EVEN(currMV->x);  
                 currMV->y = EVEN(currMV->y);  
         }  
   
         if (currMV->x > max_dx)  
                 currMV->x = max_dx;  
         if (currMV->x < min_dx)  
                 currMV->x = min_dx;  
         if (currMV->y > max_dy)  
                 currMV->y = max_dy;  
         if (currMV->y < min_dy)  
                 currMV->y = min_dy;  
   
 /***************** This is predictor SET A: only median prediction ******************/  
   
         iMinSAD =  
                 sad16(cur,  
                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,  
                                                  iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);  
         iMinSAD +=  
                 calc_delta_16(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                           (uint8_t) iFcode, iQuant);  
   
 // thresh1 is fixed to 256  
         if ((iMinSAD < 256) ||  
                 ((MVequal(*currMV, prevMB->mvs[0])) &&  
                  ((uint32_t) iMinSAD < prevMB->sad16))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto EPZS16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto EPZS16_Terminate_with_Refine;  
         }  
   
 /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/  
   
 // previous frame MV  
         CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);  
   
 // set threshhold based on Min of Prediction and SAD of collocated block  
 // CHECK_MV16 always uses iSAD for the SAD of last vector to check, so now iSAD is what we want  
   
         if ((x == 0) && (y == 0)) {  
                 thresh2 = 512;  
         } else {  
 /* T_k = 1.2 * MIN(SAD_top,SAD_left,SAD_topleft,SAD_coll) +128;   [Tourapis, 2002] */  
   
                 thresh2 = MIN(psad[0], iSAD) * 6 / 5 + 128;  
         }  
965    
 // MV=(0,0) is often a good choice  
   
         CHECK_MV16_ZERO;  
   
   
 // left neighbour, if allowed  
         if (x != 0) {  
                 if (!(MotionFlags & PMV_HALFPEL16)) {  
                         pmv[1].x = EVEN(pmv[1].x);  
                         pmv[1].y = EVEN(pmv[1].y);  
                 }  
                 CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);  
         }  
 // top neighbour, if allowed  
         if (y != 0) {  
966                  if (!(MotionFlags & PMV_HALFPEL16)) {                  if (!(MotionFlags & PMV_HALFPEL16)) {
967                          pmv[2].x = EVEN(pmv[2].x);                  Data.min_dx = EVEN(Data.min_dx);
968                          pmv[2].y = EVEN(pmv[2].y);                  Data.max_dx = EVEN(Data.max_dx);
969                  }                  Data.min_dy = EVEN(Data.min_dy);
970                  CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);                  Data.max_dy = EVEN(Data.max_dy); } // no-halpel and b-frames. do we need it?
   
 // top right neighbour, if allowed  
                 if ((uint32_t) x != (iWcount - 1)) {  
                         if (!(MotionFlags & PMV_HALFPEL16)) {  
                                 pmv[3].x = EVEN(pmv[3].x);  
                                 pmv[3].y = EVEN(pmv[3].y);  
                         }  
                         CHECK_MV16_CANDIDATE(pmv[3].x, pmv[3].y);  
                 }  
         }  
   
 /* Terminate if MinSAD <= T_2  
    Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]  
 */  
971    
         if ((iMinSAD <= thresh2)  
                 || (MVequal(*currMV, prevMB->mvs[0]) &&  
                         ((uint32_t) iMinSAD <= prevMB->sad16))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto EPZS16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto EPZS16_Terminate_with_Refine;  
         }  
   
 /***** predictor SET C: acceleration MV (new!), neighbours in prev. frame(new!) ****/  
   
         backupMV = prevMB->mvs[0];      // collocated MV  
         backupMV.x += (prevMB->mvs[0].x - oldMB->mvs[0].x);     // acceleration X  
         backupMV.y += (prevMB->mvs[0].y - oldMB->mvs[0].y);     // acceleration Y  
   
         CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y);  
   
 // left neighbour  
         if (x != 0)  
                 CHECK_MV16_CANDIDATE((prevMB - 1)->mvs[0].x, (prevMB - 1)->mvs[0].y);  
   
 // top neighbour  
         if (y != 0)  
                 CHECK_MV16_CANDIDATE((prevMB - iWcount)->mvs[0].x,  
                                                          (prevMB - iWcount)->mvs[0].y);  
972    
973  // right neighbour, if allowed (this value is not written yet, so take it from   pMB->mvs          pmv[0] = Data.predMV;
974            PreparePredictionsBF(pmv, x, y, pParam->mb_width,
975                                            pMB, mode_current);
976    
977          if ((uint32_t) x != iWcount - 1)          currentMV.x = currentMV.y = 0;
                 CHECK_MV16_CANDIDATE((prevMB + 1)->mvs[0].x, (prevMB + 1)->mvs[0].y);  
978    
979  // bottom neighbour, dito          CheckCandidate = CheckCandidate16no4v;
         if ((uint32_t) y != iHcount - 1)  
                 CHECK_MV16_CANDIDATE((prevMB + iWcount)->mvs[0].x,  
                                                          (prevMB + iWcount)->mvs[0].y);  
980    
981  /* Terminate if MinSAD <= T_3 (here T_3 = T_2)  */  // main loop. checking all predictions
982          if (iMinSAD <= thresh2) {          for (i = 0; i < 8; i++) {
983                  if (MotionFlags & PMV_QUICKSTOP16)                  if (!(mask = make_mask(pmv, i)) ) continue;
984                          goto EPZS16_Terminate_without_Refine;                  CheckCandidate16no4v(pmv[i].x, pmv[i].y, mask, &iDirection, &Data);
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto EPZS16_Terminate_with_Refine;  
985          }          }
986    
 /************ (if Diamond Search)  **************/  
   
         backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  
   
987          if (MotionFlags & PMV_USESQUARES16)          if (MotionFlags & PMV_USESQUARES16)
988                  MainSearchPtr = Square16_MainSearch;                  MainSearchPtr = SquareSearch;
989          else          else if (MotionFlags & PMV_ADVANCEDDIAMOND16)
990           if (MotionFlags & PMV_ADVANCEDDIAMOND16)                  MainSearchPtr = AdvDiamondSearch;
991                  MainSearchPtr = AdvDiamond16_MainSearch;                  else MainSearchPtr = DiamondSearch;
         else  
                 MainSearchPtr = Diamond16_MainSearch;  
   
 /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  
   
         iSAD =  
                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  
                                                   currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);  
   
         if (iSAD < iMinSAD) {  
                 *currMV = newMV;  
                 iMinSAD = iSAD;  
         }  
   
992    
993          if (MotionFlags & PMV_EXTSEARCH16) {          (*MainSearchPtr)(currentMV.x, currentMV.y, &Data, 255);
 /* extended mode: search (up to) two more times: orignal prediction and (0,0) */  
994    
995                  if (!(MVequal(pmv[0], backupMV))) {          if (MotionFlags & PMV_HALFPELREFINE16) HalfpelRefine(&Data);
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  
                                                                   pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   2, iFcode, iQuant, 0);  
                 }  
996    
997                  if (iSAD < iMinSAD) {  // three bits are needed to code backward mode. four for forward
998                          *currMV = newMV;  // we treat the bits just like they were vector's
999                          iMinSAD = iSAD;          if (mode_current == MODE_FORWARD) iMinSAD +=  4 * lambda_vec16[iQuant];
1000                  }          else iMinSAD +=  3 * lambda_vec16[iQuant];
1001    
                 if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {  
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  
                                                                   iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);  
1002    
1003                          if (iSAD < iMinSAD) {          if (iMinSAD < *best_sad) {
1004                                  *currMV = newMV;                  *best_sad = iMinSAD;
1005                                  iMinSAD = iSAD;                  pMB->mode = mode_current;
1006                    pMB->pmvs[0].x = currentMV.x - predMV->x;
1007                    pMB->pmvs[0].y = currentMV.y - predMV->y;
1008                    if (mode_current == MODE_FORWARD) pMB->mvs[0] = currentMV;
1009                    else pMB->b_mvs[0] = currentMV;
1010                          }                          }
                 }  
         }  
   
 /***************        Choose best MV found     **************/  
   
   EPZS16_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step  
                 iMinSAD =  
                         Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                          iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                          iFcode, iQuant, iEdgedWidth);  
1011    
   EPZS16_Terminate_without_Refine:  
   
         *oldMB = *prevMB;  
   
         currPMV->x = currMV->x - pmv[0].x;  
         currPMV->y = currMV->y - pmv[0].y;  
         return iMinSAD;  
1012  }  }
1013    
1014    static int32_t
1015    SearchDirect(const uint8_t * const f_Ref,
1016                                    const uint8_t * const f_RefH,
1017                                    const uint8_t * const f_RefV,
1018                                    const uint8_t * const f_RefHV,
1019                                    const uint8_t * const b_Ref,
1020                                    const uint8_t * const b_RefH,
1021                                    const uint8_t * const b_RefV,
1022                                    const uint8_t * const b_RefHV,
1023                                    const IMAGE * const pCur,
1024                                    const int x, const int y,
1025                                    const uint32_t MotionFlags,
1026                                    const uint32_t iQuant,
1027                                    const int32_t TRB, const int32_t TRD,
1028                                    const MBParam * const pParam,
1029                                    MACROBLOCK * const pMB,
1030                                    const MACROBLOCK * const b_mb,
1031                                    int32_t * const best_sad)
1032    
1033    {
1034            const uint32_t iEdgedWidth = pParam->edged_width;
1035            int32_t iMinSAD = 0, skip_sad;
1036            int k;
1037            VECTOR currentMV;
1038            MainSearchFunc *MainSearchPtr;
1039            SearchData Data;
1040    
1041            Data.iMinSAD = &iMinSAD;
1042            Data.Cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;
1043            Data.iEdgedWidth = iEdgedWidth;
1044            Data.currentMV = &currentMV;
1045            Data.iQuant = iQuant;
1046            Data.referencemv = b_mb->mvs;
1047    
1048            Data.Ref= f_Ref + (x + iEdgedWidth*y) * 16;
1049            Data.RefH = f_RefH + (x + iEdgedWidth*y) * 16;
1050            Data.RefV = f_RefV + (x + iEdgedWidth*y) * 16;
1051            Data.RefHV = f_RefHV + (x + iEdgedWidth*y) * 16;
1052            Data.bRef = b_Ref + (x + iEdgedWidth*y) * 16;
1053            Data.bRefH = b_RefH + (x + iEdgedWidth*y) * 16;
1054            Data.bRefV = b_RefV + (x + iEdgedWidth*y) * 16;
1055            Data.bRefHV = b_RefHV + (x + iEdgedWidth*y) * 16;
1056    /*
1057    //What we do here is a complicated version of CheckCandidateDirect(0,0);
1058    get_range(&Data.min_dx, &Data.max_dx, &Data.min_dy, &Data.max_dy, x, y, 16, pParam->width, pParam->height, 19);
1059    
1060  int32_t  */
1061  EPZSSearch8(const uint8_t * const pRef,          Data.max_dx = 2 * pParam->width - 2 * (x) * 16;
1062                          const uint8_t * const pRefH,          Data.max_dy = 2 * pParam->height - 2 * (y) * 16;
1063                          const uint8_t * const pRefV,          Data.min_dx = -(2 * 16 + 2 * (x) * 16);
1064                          const uint8_t * const pRefHV,          Data.min_dy = -(2 * 16 + 2 * (y) * 16);
1065    
1066            for (k = 0; k < 4; k++) {
1067                    pMB->mvs[k].x = Data.directmvF[k].x = ((TRB * Data.referencemv[k].x) / TRD);
1068                    pMB->b_mvs[k].x = Data.directmvB[k].x = ((TRB - TRD) * Data.referencemv[k].x) / TRD;
1069                    pMB->mvs[k].y = Data.directmvF[k].y = ((TRB * Data.referencemv[k].y) / TRD);
1070                    pMB->b_mvs[k].y = Data.directmvB[k].y = ((TRB - TRD) * Data.referencemv[k].y) / TRD;
1071    
1072            if (( pMB->mvs[k].x > Data.max_dx ) || ( pMB->mvs[k].x < Data.min_dx )
1073                            || ( pMB->mvs[k].y > Data.max_dy ) || ( pMB->mvs[k].y < Data.min_dy )
1074                            || ( pMB->b_mvs[k].x > Data.max_dx ) || ( pMB->b_mvs[k].x < Data.min_dx )
1075                            || ( pMB->b_mvs[k].y > Data.max_dy ) || ( pMB->b_mvs[k].y < Data.min_dy )) {
1076    /*
1077                    fprintf(debug, "\nERROR - out of range : vector %d,%d and %d,%d\n", pMB->mvs[k].x, pMB->mvs[k].y,pMB->b_mvs[k].x,pMB->b_mvs[k].y );
1078                    fprintf(debug, " range is x: %d..%d y: %d..%d \n", Data.min_dx,Data.max_dx,Data.min_dy,Data.max_dy);
1079                    fprintf(debug,"macroblock %d, %d \n", x, y);
1080                    fprintf(debug, "direct MV is %d,%d \n", directmv[k].x, directmv[k].y);
1081    */
1082                    *best_sad = 256*4096; // in that case, we won't use direct mode
1083                    pMB->mode = MODE_DIRECT; // just to make sure it doesn't say "MODE_DIRECT_NONE_MV"
1084                    pMB->b_mvs[0].x = pMB->b_mvs[0].y = 0;  /* because backwards and interpol might rely on this */
1085                    return 0; }
1086    
1087    
1088            if (b_mb->mode != MODE_INTER4V) {
1089                    iMinSAD = sad16bi(Data.Cur,
1090                                                    get_ref_mv(f_Ref, f_RefH, f_RefV, f_RefHV,
1091                                                                    x, y, 16, &pMB->mvs[0], iEdgedWidth),
1092                                                    get_ref_mv(b_Ref, b_RefH, b_RefV, b_RefHV,
1093                                                                    x, y, 16, &pMB->b_mvs[0], iEdgedWidth), iEdgedWidth);
1094    
1095                    Data.directmvF[1] = Data.directmvF[2] = Data.directmvF[3] = Data.directmvF[0];
1096                    Data.directmvB[1] = Data.directmvB[2] = Data.directmvB[3] = Data.directmvB[0];
1097                    break;
1098            }
1099            iMinSAD += sad8bi(Data.Cur + (k&1)*8 + (k>>1)* 8 * iEdgedWidth,
1100                                                    get_ref_mv(f_Ref, f_RefH, f_RefV, f_RefHV,
1101                                                                    (2*x+(k&1)), (2*y+(k>>1)), 8, &pMB->mvs[k], iEdgedWidth),
1102                                                    get_ref_mv(b_Ref, b_RefH, b_RefV, b_RefHV,
1103                                                                    (2*x+(k&1)), (2*y+(k>>1)), 8, &pMB->b_mvs[k], iEdgedWidth),
1104                                                    iEdgedWidth);
1105            }
1106    
1107    // skip decision
1108            if (iMinSAD < (int32_t)iQuant * SKIP_THRESH_B) {
1109                    pMB->mode = MODE_DIRECT_NONE_MV;
1110                    return iMinSAD; }
1111    
1112            skip_sad = iMinSAD;
1113            iMinSAD += 2 * lambda_vec16[iQuant]; // 2 bits needed to code vector 0,0
1114            currentMV.x = currentMV.y = 0;
1115            if (b_mb->mode == MODE_INTER4V)
1116                    CheckCandidate = CheckCandidateDirect;
1117            else CheckCandidate = CheckCandidateDirectno4v;
1118    
1119    //  DIRECT MODE DELTA VECTOR SEARCH.
1120    //      This has to be made more effective, but at the moment I'm happy it's running at all
1121    
1122            if (MotionFlags & PMV_USESQUARES16) MainSearchPtr = SquareSearch;
1123                    else if (MotionFlags & PMV_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1124                            else MainSearchPtr = DiamondSearch;
1125    
1126            (*MainSearchPtr)(0, 0, &Data, 255);
1127    
1128            HalfpelRefine(&Data);
1129    
1130            iMinSAD +=  1 * lambda_vec16[iQuant]; // one bit is needed to code direct mode. we treat this bit just like it was vector's
1131            *best_sad = iMinSAD;
1132    
1133            if (b_mb->mode == MODE_INTER4V)
1134                    pMB->mode = MODE_DIRECT;
1135            else pMB->mode = MODE_DIRECT_NO4V; //for faster compensation
1136    
1137            pMB->pmvs[3] = currentMV;
1138    
1139            for (k = 0; k < 4; k++) {
1140                    pMB->mvs[k].x = Data.directmvF[k].x + currentMV.x;
1141                    pMB->b_mvs[k].x = ((currentMV.x == 0)
1142                                                            ? Data.directmvB[k].x
1143                                                            : pMB->mvs[k].x - Data.referencemv[k].x);
1144                    pMB->mvs[k].y = (Data.directmvF[k].y + currentMV.y);
1145                    pMB->b_mvs[k].y = ((currentMV.y == 0)
1146                                                            ? Data.directmvB[k].y
1147                                                            : pMB->mvs[k].y - Data.referencemv[k].y);
1148                    if (b_mb->mode != MODE_INTER4V) {
1149                            pMB->mvs[3] = pMB->mvs[2] = pMB->mvs[1] = pMB->mvs[0];
1150                            pMB->b_mvs[3] = pMB->b_mvs[2] = pMB->b_mvs[1] = pMB->b_mvs[0];
1151                            break;
1152                    }
1153            }
1154            return 0;//skip_sad;
1155    }
1156    
1157    static __inline void
1158    SearchInterpolate(const uint8_t * const f_Ref,
1159                                    const uint8_t * const f_RefH,
1160                                    const uint8_t * const f_RefV,
1161                                    const uint8_t * const f_RefHV,
1162                                    const uint8_t * const b_Ref,
1163                                    const uint8_t * const b_RefH,
1164                                    const uint8_t * const b_RefV,
1165                                    const uint8_t * const b_RefHV,
1166                          const IMAGE * const pCur,                          const IMAGE * const pCur,
1167                          const int x,                                  const int x, const int y,
1168                          const int y,                                  const uint32_t fcode,
1169                          const int start_x,                                  const uint32_t bcode,
                         const int start_y,  
1170                          const uint32_t MotionFlags,                          const uint32_t MotionFlags,
1171                          const uint32_t iQuant,                          const uint32_t iQuant,
                         const uint32_t iFcode,  
1172                          const MBParam * const pParam,                          const MBParam * const pParam,
1173                          const MACROBLOCK * const pMBs,                                  const VECTOR * const f_predMV,
1174                          const MACROBLOCK * const prevMBs,                                  const VECTOR * const b_predMV,
1175                          VECTOR * const currMV,                                  MACROBLOCK * const pMB,
1176                          VECTOR * const currPMV)                                  int32_t * const best_sad)
1177    
1178  {  {
1179  /* Please not that EPZS might not be a good choice for 8x8-block motion search ! */  /* Interpolated MC motion vector search, this is tedious and more complicated because there are
1180       two values for everything, always one for backward and one for forward ME. Still, we don't gain
1181       much from this search, maybe it should simply be skipped and simply current i_sad16 value used
1182       as "optimal". */
1183    
         const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
1184          const int32_t iEdgedWidth = pParam->edged_width;          const int32_t iEdgedWidth = pParam->edged_width;
1185    
1186          const uint8_t *cur = pCur->y + x * 8 + y * 8 * iEdgedWidth;          int iDirection, i, j;
1187            int32_t iMinSAD = 256*4096;
1188            VECTOR currentMV[3];
1189            SearchData fData, bData;
1190    
         int32_t iDiamondSize = 1;  
1191    
1192          int32_t min_dx;          fData.iMinSAD = bData.iMinSAD = &iMinSAD;
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
1193    
1194          VECTOR newMV;          fData.Cur = bData.Cur = pCur->y + (x + y * iEdgedWidth) * 16;
1195          VECTOR backupMV;          fData.iEdgedWidth = bData.iEdgedWidth = iEdgedWidth;
1196            fData.currentMV = currentMV; bData.currentMV = currentMV + 1;
1197            fData.iQuant = bData.iQuant = iQuant;
1198            fData.iFcode = bData.bFcode = fcode; fData.bFcode = bData.iFcode = bcode;
1199    
         VECTOR pmv[4];  
         int32_t psad[8];  
1200    
1201          const int32_t iSubBlock = ((y & 1) << 1) + (x & 1);          bData.bRef = fData.Ref = f_Ref + (x + y * iEdgedWidth) * 16;
1202            bData.bRefH = fData.RefH = f_RefH + (x + y * iEdgedWidth) * 16;
1203            bData.bRefV = fData.RefV = f_RefV + (x + y * iEdgedWidth) * 16;
1204            bData.bRefHV = fData.RefHV = f_RefHV + (x + y * iEdgedWidth) * 16;
1205            bData.Ref = fData.bRef = b_Ref + (x + y * iEdgedWidth) * 16;
1206            bData.RefH = fData.bRefH = b_RefH + (x + y * iEdgedWidth) * 16;
1207            bData.RefV = fData.bRefV = b_RefV + (x + y * iEdgedWidth) * 16;
1208            bData.RefHV = fData.bRefHV = b_RefHV + (x + y * iEdgedWidth) * 16;
1209    
1210  //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;          bData.bpredMV = fData.predMV = *f_predMV;
1211          const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;          fData.bpredMV = bData.predMV = *b_predMV;
1212    
         int32_t bPredEq;  
         int32_t iMinSAD, iSAD = 9999;  
1213    
1214          MainSearch8FuncPtr MainSearchPtr;          currentMV[0] = pMB->mvs[0];
1215            currentMV[1] = pMB->b_mvs[0];
1216            get_range(&fData.min_dx, &fData.max_dx, &fData.min_dy, &fData.max_dy, x, y, 16, pParam->width, pParam->height, fcode);
1217            get_range(&bData.min_dx, &bData.max_dx, &bData.min_dy, &bData.max_dy, x, y, 16, pParam->width, pParam->height, bcode);
1218    
1219  /* Get maximum range */          CheckCandidateInt(currentMV[0].x, currentMV[0].y, 255, &iDirection, &fData);
         get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,  
                           iFcode);  
1220    
1221  /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */  //diamond. I wish we could use normal mainsearch functions (square, advdiamond)
1222    
1223          if (!(MotionFlags & PMV_HALFPEL8)) {          do {
1224                  min_dx = EVEN(min_dx);                  iDirection = 255;
1225                  max_dx = EVEN(max_dx);                  // forward MV moves
1226                  min_dy = EVEN(min_dy);                  i = currentMV[0].x; j = currentMV[0].y;
1227                  max_dy = EVEN(max_dy);  
1228                    CheckCandidateInt(i + 2, j, 0, &iDirection, &fData);
1229                    CheckCandidateInt(i, j + 2, 0, &iDirection, &fData);
1230                    CheckCandidateInt(i - 2, j, 0, &iDirection, &fData);
1231                    CheckCandidateInt(i, j - 2, 0, &iDirection, &fData);
1232    
1233                    // backward MV moves
1234                    i = currentMV[1].x; j = currentMV[1].y;
1235                    currentMV[2] = currentMV[0];
1236    
1237                    CheckCandidateInt(i + 2, j, 0, &iDirection, &bData);
1238                    CheckCandidateInt(i, j + 2, 0, &iDirection, &bData);
1239                    CheckCandidateInt(i - 2, j, 0, &iDirection, &bData);
1240                    CheckCandidateInt(i, j - 2, 0, &iDirection, &bData);
1241    
1242            } while (!(iDirection));
1243    
1244    /* halfpel refinement. luckly we can use normal halfpel function for it */
1245    
1246            if (MotionFlags & PMV_HALFPELREFINE16) {
1247                    CheckCandidate = CheckCandidateInt;
1248                    HalfpelRefine(&fData);
1249                    currentMV[2] = currentMV[0];
1250                    HalfpelRefine(&bData);
1251            }
1252    
1253    // two bits are needed to code interpolate mode. we treat the bits just like they were vector's
1254            iMinSAD +=  2 * lambda_vec16[iQuant];
1255            if (iMinSAD < *best_sad) {
1256                    *best_sad = iMinSAD;
1257                    pMB->mvs[0] = currentMV[0];
1258                    pMB->b_mvs[0] = currentMV[1];
1259                    pMB->mode = MODE_INTERPOLATE;
1260    
1261                    pMB->pmvs[1].x = pMB->mvs[0].x - f_predMV->x;
1262                    pMB->pmvs[1].y = pMB->mvs[0].y - f_predMV->y;
1263                    pMB->pmvs[0].x = pMB->b_mvs[0].x - b_predMV->x;
1264                    pMB->pmvs[0].y = pMB->b_mvs[0].y - b_predMV->y;
1265            }
1266          }          }
         /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  
         //bPredEq = get_pmvdata(pMBs, x >> 1, y >> 1, iWcount, iSubBlock, pmv, psad);  
         bPredEq = get_pmvdata2(pMBs, iWcount, 0, x >> 1, y >> 1, iSubBlock, pmv, psad);  
1267    
1268    void
1269    MotionEstimationBVOP(MBParam * const pParam,
1270                                             FRAMEINFO * const frame,
1271                                             const int32_t time_bp,
1272                                             const int32_t time_pp,
1273                                             // forward (past) reference
1274                                             const MACROBLOCK * const f_mbs,
1275                                             const IMAGE * const f_ref,
1276                                             const IMAGE * const f_refH,
1277                                             const IMAGE * const f_refV,
1278                                             const IMAGE * const f_refHV,
1279                                             // backward (future) reference
1280                                             const MACROBLOCK * const b_mbs,
1281                                             const IMAGE * const b_ref,
1282                                             const IMAGE * const b_refH,
1283                                             const IMAGE * const b_refV,
1284                                             const IMAGE * const b_refHV)
1285    {
1286            uint32_t i, j;
1287            int32_t best_sad, skip_sad;
1288            int f_count = 0, b_count = 0, i_count = 0, d_count = 0, n_count = 0;
1289            static const VECTOR zeroMV={0,0};
1290    
1291  /* Step 4: Calculate SAD around the Median prediction.          VECTOR f_predMV, b_predMV;      /* there is no prediction for direct mode*/
         MinSAD=SAD  
         If Motion Vector equal to Previous frame motion vector  
                 and MinSAD<PrevFrmSAD goto Step 10.  
         If SAD<=256 goto Step 10.  
 */  
1292    
1293  // Prepare for main loop          const int32_t TRB = time_pp - time_bp;
1294            const int32_t TRD = time_pp;
1295    
1296            // note: i==horizontal, j==vertical
1297    
1298          if (!(MotionFlags & PMV_HALFPEL8)) {          for (j = 0; j < pParam->mb_height; j++) {
                 currMV->x = EVEN(currMV->x);  
                 currMV->y = EVEN(currMV->y);  
         }  
1299    
1300          if (currMV->x > max_dx)                  f_predMV = b_predMV = zeroMV;   /* prediction is reset at left boundary */
                 currMV->x = max_dx;  
         if (currMV->x < min_dx)  
                 currMV->x = min_dx;  
         if (currMV->y > max_dy)  
                 currMV->y = max_dy;  
         if (currMV->y < min_dy)  
                 currMV->y = min_dy;  
1301    
1302  /***************** This is predictor SET A: only median prediction ******************/                  for (i = 0; i < pParam->mb_width; i++) {
1303                            MACROBLOCK * const pMB = frame->mbs + i + j * pParam->mb_width;
1304                            const MACROBLOCK * const b_mb = b_mbs + i + j * pParam->mb_width;
1305    
1306    /* special case, if collocated block is SKIPed: encoding is forward (0,0), cpb=0 without further ado */
1307                            if (b_mb->mode == MODE_NOT_CODED) {
1308                                    pMB->mode = MODE_NOT_CODED;
1309                                    continue;
1310                            }
1311    
1312          iMinSAD =  /* direct search comes first, because it (1) checks for SKIP-mode
1313                  sad8(cur,          and (2) sets very good predictions for forward and backward search */
                          get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,  
                                                 iEdgedWidth), iEdgedWidth);  
         iMinSAD +=  
                 calc_delta_8(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                          (uint8_t) iFcode, iQuant);  
1314    
1315                            skip_sad = SearchDirect(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
1316                                                                            b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
1317                                                                            &frame->image,
1318                                                                            i, j,
1319                                                                            frame->motion_flags,
1320                                                                            frame->quant,
1321                                                                            TRB, TRD,
1322                                                                            pParam,
1323                                                                            pMB, b_mb,
1324                                                                            &best_sad);
1325    
1326  // thresh1 is fixed to 256                          if (!(frame->global_flags & XVID_HALFPEL)) best_sad = skip_sad = 256*4096;
1327          if (iMinSAD < 256 / 4) {                          else
1328                  if (MotionFlags & PMV_QUICKSTOP8)                                  if (pMB->mode == MODE_DIRECT_NONE_MV) { n_count++; continue; }
                         goto EPZS8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP8)  
                         goto EPZS8_Terminate_with_Refine;  
         }  
1329    
1330  /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/  //                      best_sad = 256*4096; //uncomment to disable Directsearch.
1331    //      To disable any other mode, just comment the function call
1332    
1333                            // forward search
1334                            SearchBF(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
1335                                                    &frame->image, i, j,
1336                                                    frame->motion_flags,
1337                                                    frame->quant, frame->fcode, pParam,
1338                                                    pMB, &f_predMV, &best_sad,
1339                                                    MODE_FORWARD);
1340    
1341  // MV=(0,0) is often a good choice                          // backward search
1342          CHECK_MV8_ZERO;                          SearchBF(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
1343                                                    &frame->image, i, j,
1344                                                    frame->motion_flags,
1345                                                    frame->quant, frame->bcode, pParam,
1346                                                    pMB, &b_predMV, &best_sad,
1347                                                    MODE_BACKWARD);
1348    
1349  // previous frame MV                          // interpolate search comes last, because it uses data from forward and backward as prediction
         CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x, prevMB->mvs[iSubBlock].y);  
1350    
1351  // left neighbour, if allowed                          SearchInterpolate(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
1352          if (psad[1] != MV_MAX_ERROR) {                                                  b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
1353                  if (!(MotionFlags & PMV_HALFPEL8)) {                                                  &frame->image,
1354                          pmv[1].x = EVEN(pmv[1].x);                                                  i, j,
1355                          pmv[1].y = EVEN(pmv[1].y);                                                  frame->fcode, frame->bcode,
1356                                                    frame->motion_flags,
1357                                                    frame->quant, pParam,
1358                                                    &f_predMV, &b_predMV,
1359                                                    pMB, &best_sad);
1360    
1361                            switch (pMB->mode) {
1362                                    case MODE_FORWARD:
1363                                            f_count++;
1364                                            f_predMV = pMB->mvs[0];
1365                                            break;
1366                                    case MODE_BACKWARD:
1367                                            b_count++;
1368                                            b_predMV = pMB->b_mvs[0];
1369                                            break;
1370                                    case MODE_INTERPOLATE:
1371                                            i_count++;
1372                                            f_predMV = pMB->mvs[0];
1373                                            b_predMV = pMB->b_mvs[0];
1374                                            break;
1375                                    case MODE_DIRECT:
1376                                    case MODE_DIRECT_NO4V:
1377                                            d_count++;
1378                                            break;
1379                                    default:
1380                                            break;
1381                  }                  }
                 CHECK_MV8_CANDIDATE(pmv[1].x, pmv[1].y);  
1382          }          }
 // top neighbour, if allowed  
         if (psad[2] != MV_MAX_ERROR) {  
                 if (!(MotionFlags & PMV_HALFPEL8)) {  
                         pmv[2].x = EVEN(pmv[2].x);  
                         pmv[2].y = EVEN(pmv[2].y);  
1383                  }                  }
                 CHECK_MV8_CANDIDATE(pmv[2].x, pmv[2].y);  
1384    
1385  // top right neighbour, if allowed  //      fprintf(debug,"B-Stat: F: %04d   B: %04d   I: %04d  D: %04d, N: %04d\n",
1386                  if (psad[3] != MV_MAX_ERROR) {  //                              f_count,b_count,i_count,d_count,n_count);
1387                          if (!(MotionFlags & PMV_HALFPEL8)) {  
                                 pmv[3].x = EVEN(pmv[3].x);  
                                 pmv[3].y = EVEN(pmv[3].y);  
                         }  
                         CHECK_MV8_CANDIDATE(pmv[3].x, pmv[3].y);  
                 }  
1388          }          }
1389    
1390  /*  // this bias is zero anyway, at the moment!  /* Hinted ME starts here */
1391    
1392          if ( (MVzero(*currMV)) && (!MVzero(pmv[0])) ) // && (iMinSAD <= iQuant * 96)  static __inline void
1393                  iMinSAD -= MV8_00_BIAS;  Search8hinted(  const SearchData * const OldData,
1394                                    const int x, const int y,
1395                                    const uint32_t MotionFlags,
1396                                    const MBParam * const pParam,
1397                                    MACROBLOCK * const pMB,
1398                                    const MACROBLOCK * const pMBs,
1399                                    const int block)
1400    {
1401            SearchData Data;
1402            MainSearchFunc *MainSearchPtr;
1403    
1404  */          Data.predMV = get_pmv2(pMBs, pParam->mb_width, 0, x/2 , y/2, block);
1405            Data.iMinSAD = OldData->iMinSAD + 1 + block;
1406            Data.currentMV = OldData->currentMV+1+block;
1407            Data.iFcode = OldData->iFcode;
1408            Data.iQuant = OldData->iQuant;
1409    
1410  /* Terminate if MinSAD <= T_2          Data.Ref = OldData->Ref + 8 * ((block&1) + pParam->edged_width*(block>>1));
1411     Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]          Data.RefH = OldData->RefH + 8 * ((block&1) + pParam->edged_width*(block>>1));
1412  */          Data.RefV = OldData->RefV + 8 * ((block&1) + pParam->edged_width*(block>>1));
1413            Data.RefHV = OldData->RefHV + 8 * ((block&1) + pParam->edged_width*(block>>1));
1414            Data.iEdgedWidth = pParam->edged_width;
1415            Data.Cur = OldData->Cur + 8 * ((block&1) + pParam->edged_width*(block>>1));
1416    
1417          if (iMinSAD < 512 / 4) {        /* T_2 == 512/4 hardcoded */          CheckCandidate = CheckCandidate8;
                 if (MotionFlags & PMV_QUICKSTOP8)  
                         goto EPZS8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP8)  
                         goto EPZS8_Terminate_with_Refine;  
         }  
1418    
1419  /************ (Diamond Search)  **************/          if (block != 0)
1420                    *(Data.iMinSAD) += lambda_vec8[Data.iQuant] *
1421                                                                    d_mv_bits(      Data.currentMV->x - Data.predMV.x,
1422                                                                                            Data.currentMV->y - Data.predMV.y,
1423                                                                                            Data.iFcode);
1424    
         backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  
1425    
1426          if (!(MotionFlags & PMV_HALFPELDIAMOND8))          get_range(&Data.min_dx, &Data.max_dx, &Data.min_dy, &Data.max_dy, x, y, 8,
1427                  iDiamondSize *= 2;                                  pParam->width, pParam->height, OldData->iFcode);
1428    
1429  /* default: use best prediction as starting point for one call of EPZS_MainSearch */          if (pMB->mode == MODE_INTER4V) {
1430                    int dummy;
1431                    CheckCandidate8(pMB->mvs[block].x, pMB->mvs[block].y, 0, &dummy, &Data); }
1432    
1433  // there is no EPZS^2 for inter4v at the moment          if (MotionFlags & PMV_USESQUARES8) MainSearchPtr = SquareSearch;
1434                    else if (MotionFlags & PMV_ADVANCEDDIAMOND8) MainSearchPtr = AdvDiamondSearch;
1435                            else MainSearchPtr = DiamondSearch;
1436    
1437  //  if (MotionFlags & PMV_USESQUARES8)          (*MainSearchPtr)(Data.currentMV->x, Data.currentMV->y, &Data, 255);
 //      MainSearchPtr = Square8_MainSearch;  
 //  else  
1438    
1439          if (MotionFlags & PMV_ADVANCEDDIAMOND8)          if (MotionFlags & PMV_HALFPELREFINE8) HalfpelRefine(&Data);
                 MainSearchPtr = AdvDiamond8_MainSearch;  
         else  
                 MainSearchPtr = Diamond8_MainSearch;  
1440    
1441          iSAD =          pMB->pmvs[block].x = Data.currentMV->x - Data.predMV.x;
1442                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,          pMB->pmvs[block].y = Data.currentMV->y - Data.predMV.y;
1443                                                    currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,          pMB->mvs[block] = *(Data.currentMV);
1444                                                    min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,          pMB->sad8[block] =  4 * (*(Data.iMinSAD));
1445                                                    iQuant, 0);  }
1446    
1447    
1448          if (iSAD < iMinSAD) {  static void
1449                  *currMV = newMV;  SearchPhinted ( const uint8_t * const pRef,
1450                  iMinSAD = iSAD;                                  const uint8_t * const pRefH,
1451          }                                  const uint8_t * const pRefV,
1452                                    const uint8_t * const pRefHV,
1453                                    const IMAGE * const pCur,
1454                                    const int x,
1455                                    const int y,
1456                                    const uint32_t MotionFlags,
1457                                    const uint32_t iQuant,
1458                                    const uint32_t iFcode,
1459                                    const MBParam * const pParam,
1460                                    const MACROBLOCK * const pMBs,
1461                                    int inter4v,
1462                                    MACROBLOCK * const pMB)
1463    {
1464    
1465          if (MotionFlags & PMV_EXTSEARCH8) {          const int32_t iEdgedWidth = pParam->edged_width;
 /* extended mode: search (up to) two more times: orignal prediction and (0,0) */  
1466    
1467                  if (!(MVequal(pmv[0], backupMV))) {          int i;
1468                          iSAD =          VECTOR currentMV[5];
1469                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,          int32_t iMinSAD[5];
1470                                                                    pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,          int32_t temp[5];
1471                                                                    min_dx, max_dx, min_dy, max_dy, iEdgedWidth,          MainSearchFunc * MainSearchPtr;
1472                                                                    iDiamondSize, iFcode, iQuant, 0);          SearchData Data;
1473    
1474            Data.predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);
1475            get_range(&Data.min_dx, &Data.max_dx, &Data.min_dy, &Data.max_dy, x, y, 16,
1476                                    pParam->width, pParam->height, iFcode);
1477    
1478            Data.Cur = pCur->y + (x + y * iEdgedWidth) * 16;
1479            Data.iEdgedWidth = iEdgedWidth;
1480            Data.currentMV = currentMV;
1481            Data.iMinSAD = iMinSAD;
1482            Data.Ref = pRef + (x + iEdgedWidth*y)*16;
1483            Data.RefH = pRefH + (x + iEdgedWidth*y) * 16;
1484            Data.RefV = pRefV + (x + iEdgedWidth*y) * 16;
1485            Data.RefHV = pRefHV + (x + iEdgedWidth*y) * 16;
1486            Data.temp = temp;
1487            Data.iQuant = iQuant;
1488            Data.iFcode = iFcode;
1489    
1490                          if (iSAD < iMinSAD) {          if (!(MotionFlags & PMV_HALFPEL16)) {
1491                                  *currMV = newMV;                  Data.min_dx = EVEN(Data.min_dx);
1492                                  iMinSAD = iSAD;                  Data.max_dx = EVEN(Data.max_dx);
1493                          }                  Data.min_dy = EVEN(Data.min_dy);
1494                    Data.max_dy = EVEN(Data.max_dy);
1495                  }                  }
1496    
1497                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {          for(i = 0; i < 5; i++) iMinSAD[i] = MV_MAX_ERROR;
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  
                                                                   iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, 0);  
1498    
1499                          if (iSAD < iMinSAD) {          if (pMB->dquant != NO_CHANGE) inter4v = 0;
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
                 }  
         }  
1500    
1501  /***************        Choose best MV found     **************/          if (inter4v)
1502                    CheckCandidate = CheckCandidate16;
1503            else CheckCandidate = CheckCandidate16no4v;
1504    
   EPZS8_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE8)   // perform final half-pel step  
                 iMinSAD =  
                         Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                         iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                         iFcode, iQuant, iEdgedWidth);  
1505    
1506    EPZS8_Terminate_without_Refine:          pMB->mvs[0].x = EVEN(pMB->mvs[0].x);
1507            pMB->mvs[0].y = EVEN(pMB->mvs[0].y);
1508            if (pMB->mvs[0].x > Data.max_dx) pMB->mvs[0].x = Data.max_dx; // this is in case iFcode changed
1509            if (pMB->mvs[0].x < Data.min_dx) pMB->mvs[0].x = Data.min_dx;
1510            if (pMB->mvs[0].y > Data.max_dy) pMB->mvs[0].y = Data.max_dy;
1511            if (pMB->mvs[0].y < Data.min_dy) pMB->mvs[0].y = Data.min_dy;
1512    
1513          currPMV->x = currMV->x - pmv[0].x;          CheckCandidate16(pMB->mvs[0].x, pMB->mvs[0].y, 0, &i, &Data);
1514          currPMV->y = currMV->y - pmv[0].y;  
1515          return iMinSAD;          if (pMB->mode == MODE_INTER4V)
1516                    for (i = 1; i < 4; i++) { // all four vectors will be used as four predictions for 16x16 search
1517                            pMB->mvs[i].x = EVEN(pMB->mvs[i].x);
1518                            pMB->mvs[i].y = EVEN(pMB->mvs[i].y);
1519                            if (!(make_mask(pMB->mvs, i)))
1520                                    CheckCandidate16(pMB->mvs[i].x, pMB->mvs[i].y, 0, &i, &Data);
1521  }  }
1522    
1523            if (MotionFlags & PMV_USESQUARES16)
1524                    MainSearchPtr = SquareSearch;
1525            else if (MotionFlags & PMV_ADVANCEDDIAMOND16)
1526                    MainSearchPtr = AdvDiamondSearch;
1527                    else MainSearchPtr = DiamondSearch;
1528    
1529            (*MainSearchPtr)(currentMV->x, currentMV->y, &Data, 255);
1530    
1531            if (MotionFlags & PMV_HALFPELREFINE16) HalfpelRefine(&Data);
1532    
1533            if (inter4v)
1534                    for(i = 0; i < 4; i++)
1535                            Search8hinted(&Data, 2*x+(i&1), 2*y+(i>>1), MotionFlags, pParam, pMB, pMBs, i);
1536    
1537  /* ***********************************************************          if (!(inter4v) ||
1538          bvop motion estimation                  (iMinSAD[0] < iMinSAD[1] + iMinSAD[2] + iMinSAD[3] + iMinSAD[4] + IMV16X16 * (int32_t)iQuant )) {
1539  // TODO: need to incorporate prediction here (eg. sad += calc_delta_16)  // INTER MODE
 ***************************************************************/  
1540    
1541                    pMB->mode = MODE_INTER;
1542                    pMB->mv16 = pMB->mvs[0] = pMB->mvs[1]
1543                            = pMB->mvs[2] = pMB->mvs[3] = currentMV[0];
1544    
1545  void                  pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] =
1546  MotionEstimationBVOP(MBParam * const pParam,                          pMB->sad8[2] = pMB->sad8[3] =  iMinSAD[0];
                                          FRAMEINFO * const frame,  
                                          // forward (past) reference  
                                          const MACROBLOCK * const f_mbs,  
                                          const IMAGE * const f_ref,  
                                          const IMAGE * const f_refH,  
                                          const IMAGE * const f_refV,  
                                          const IMAGE * const f_refHV,  
                                          // backward (future) reference  
                                          const MACROBLOCK * const b_mbs,  
                                          const IMAGE * const b_ref,  
                                          const IMAGE * const b_refH,  
                                          const IMAGE * const b_refV,  
                                          const IMAGE * const b_refHV)  
 {  
         const uint32_t mb_width = pParam->mb_width;  
         const uint32_t mb_height = pParam->mb_height;  
         const int32_t edged_width = pParam->edged_width;  
1547    
1548          uint32_t i, j;                  pMB->pmvs[0].x = currentMV[0].x - Data.predMV.x;
1549                    pMB->pmvs[0].y = currentMV[0].y - Data.predMV.y;
1550            } else {
1551    // INTER4V MODE; all other things are already set in Search8hinted
1552                    pMB->mode = MODE_INTER4V;
1553                    pMB->sad16 = iMinSAD[1] + iMinSAD[2] + iMinSAD[3] + iMinSAD[4] + IMV16X16 * iQuant;
1554            }
1555    
1556    }
1557    
1558          int32_t f_sad16;  void
1559          int32_t b_sad16;  MotionEstimationHinted( MBParam * const pParam,
1560          int32_t i_sad16;                                                  FRAMEINFO * const current,
1561          int32_t d_sad16;                                                  FRAMEINFO * const reference,
1562          int32_t best_sad;                                                  const IMAGE * const pRefH,
1563                                                    const IMAGE * const pRefV,
1564                                                    const IMAGE * const pRefHV)
1565    {
1566            MACROBLOCK *const pMBs = current->mbs;
1567            const IMAGE *const pCurrent = &current->image;
1568            const IMAGE *const pRef = &reference->image;
1569    
1570          VECTOR pmv_dontcare;          uint32_t x, y;
1571    
1572          // note: i==horizontal, j==vertical          if (sadInit) (*sadInit) ();
         for (j = 0; j < mb_height; j++) {  
                 for (i = 0; i < mb_width; i++) {  
                         MACROBLOCK *mb = &frame->mbs[i + j * mb_width];  
                         const MACROBLOCK *f_mb = &f_mbs[i + j * mb_width];  
                         const MACROBLOCK *b_mb = &b_mbs[i + j * mb_width];  
   
                         if (b_mb->mode == MODE_INTER && b_mb->cbp == 0 &&  
                                 b_mb->mvs[0].x == 0 && b_mb->mvs[0].y == 0) {  
                                 mb->mode = MODE_NOT_CODED;  
                                 mb->mvs[0].x = 0;  
                                 mb->mvs[0].y = 0;  
                                 mb->b_mvs[0].x = 0;  
                                 mb->b_mvs[0].y = 0;  
                                 continue;  
                         }  
                 /* force F_SAD16  
                         f_sad16 = 100;  
                         b_sad16 = 65535;  
   
                         mb->mode = MODE_FORWARD;  
                         mb->mvs[0].x = 1;  
                         mb->mvs[0].y = 1;  
                         mb->b_mvs[0].x = 1;  
                         mb->b_mvs[0].y = 1;  
                         continue;  
                  ^^ force F_SAD16 */  
1573    
1574            for (y = 0; y < pParam->mb_height; y++) {
1575                    for (x = 0; x < pParam->mb_width; x++)  {
1576                            int32_t sad00;
1577    
1578                          // forward search                          MACROBLOCK *pMB = &pMBs[x + y * pParam->mb_width];
                         f_sad16 =  
                                 SEARCH16(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,  
                                                  &frame->image, i, j, frame->motion_flags,  
                                                  frame->quant, frame->fcode, pParam,  
                                                  f_mbs,  f_mbs, /* todo */  
                                                  &mb->mvs[0], &pmv_dontcare);   // ignore pmv  
1579    
1580                          // backward search  //intra mode is copied from the first pass. At least for the time being
1581                          b_sad16 = SEARCH16(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,                          if  ((pMB->mode == MODE_INTRA) || (pMB->mode == MODE_NOT_CODED) ) continue;
                                                 &frame->image, i, j, frame->motion_flags,  
                                                 frame->quant, frame->bcode, pParam,  
                                                 b_mbs, b_mbs,   /* todo */  
                                                 &mb->b_mvs[0], &pmv_dontcare);  // ignore pmv  
1582    
1583                          // interpolate search (simple, but effective)                          if (!(current->global_flags & XVID_LUMIMASKING)) {
1584                          i_sad16 = 65535;                                  pMB->dquant = NO_CHANGE;
1585                                    pMB->quant = current->quant; }
1586    
1587                          /*                          if (pMB->dquant == NO_CHANGE) //no skip otherwise, anyway
1588                          x/y range somewhat buggy                                  sad00 = pMB->sad16
1589                          i_sad16 =                                          = sad16(pCurrent->y + (x + y * pParam->edged_width) * 16,
1590                                  sad16bi_c(frame->image.y + i * 16 + j * 16 * edged_width,                                                                  pRef->y + (x + y * pParam->edged_width) * 16,
1591                                                    get_ref(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,                                                                  pParam->edged_width, 256*4096 );
1592                                                                    i, j, 16, mb->mvs[0].x, mb->mvs[0].y,                          else sad00 = 256*4096;
                                                                   edged_width), get_ref(b_ref->y, b_refH->y,  
                                                                                                                 b_refV->y, b_refHV->y,  
                                                                                                                 i, j, 16,  
                                                                                                                 mb->b_mvs[0].x,  
                                                                                                                 mb->b_mvs[0].x,  
                                                                                                                 edged_width),  
                                                   edged_width);  
                         */  
1593    
                         // TODO: direct search  
                         // predictor + range of [-32,32]  
                         d_sad16 = 65535;  
1594    
1595    //initial skip decision
1596    
1597                          if (f_sad16 < b_sad16) {                          if ( (pMB->dquant == NO_CHANGE) && (sad00 <= MAX_SAD00_FOR_SKIP * pMB->quant)
1598                                  best_sad = f_sad16;                                  && ( //(pMB->mode == MODE_NOT_CODED) ||
1599                                  mb->mode = MODE_FORWARD;                                          (SkipDecisionP(pCurrent, pRef, x, y, pParam->edged_width, pMB->quant) )) ) {
1600                          } else {                                  if (sad00 < pMB->quant * INITIAL_SKIP_THRESH) {
1601                                  best_sad = b_sad16;                                          SkipMacroblockP(pMB, sad00);
1602                                  mb->mode = MODE_BACKWARD;                                          continue; } //skipped
1603                          }                          }
1604                            else sad00 = 256*4096;
1605    
1606                          if (i_sad16 < best_sad) {                          if (pMB->mode == MODE_NOT_CODED)
1607                                  best_sad = i_sad16;                                  SearchP(        pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,
1608                                  mb->mode = MODE_INTERPOLATE;                                                          y, current->motion_flags, pMB->quant,
1609                          }                                                          current->fcode, pParam, pMBs, reference->mbs,
1610                                                            current->global_flags & XVID_INTER4V, pMB);
1611    
1612                          if (d_sad16 < best_sad) {                          else
1613                                  best_sad = d_sad16;                                  SearchPhinted(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,
1614                                  mb->mode = MODE_DIRECT;                                                          y, current->motion_flags, pMB->quant,
1615                          }                                                          current->fcode, pParam, pMBs,
1616                                                            current->global_flags & XVID_INTER4V, pMB);
1617    
1618    /* final skip decision, a.k.a. "the vector you found, really that good?" */
1619                            if (sad00 < pMB->quant * MAX_SAD00_FOR_SKIP)
1620                                    if ((100*pMB->sad16)/(sad00+1) > FINAL_SKIP_THRESH)
1621                                    SkipMacroblockP(pMB, sad00);
1622    
1623                  }                  }
1624          }          }
1625  }  }
1626    

Legend:
Removed from v.285  
changed lines
  Added in v.530

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4