[svn] / branches / dev-api-3 / xvidcore / src / motion / motion_est.c Repository:
ViewVC logotype

Diff of /branches/dev-api-3/xvidcore/src/motion/motion_est.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/xvidcore/src/motion/motion_est.c revision 337, Wed Jul 24 20:58:41 2002 UTC branches/dev-api-3/xvidcore/src/motion/motion_est.c revision 767, Wed Jan 8 14:37:52 2003 UTC
# Line 28  Line 28 
28   *   *
29   *************************************************************************/   *************************************************************************/
30    
 /**************************************************************************  
  *  
  *  Modifications:  
  *  
  *      01.05.2002      updated MotionEstimationBVOP  
  *      25.04.2002 partial prevMB conversion  
  *  22.04.2002 remove some compile warning by chenm001 <chenm001@163.com>  
  *  14.04.2002 added MotionEstimationBVOP()  
  *  02.04.2002 add EPZS(^2) as ME algorithm, use PMV_USESQUARES to choose between  
  *             EPZS and EPZS^2  
  *  08.02.2002 split up PMVfast into three routines: PMVFast, PMVFast_MainLoop  
  *             PMVFast_Refine to support multiple searches with different start points  
  *  07.01.2002 uv-block-based interpolation  
  *  06.01.2002 INTER/INTRA-decision is now done before any SEARCH8 (speedup)  
  *             changed INTER_BIAS to 150 (as suggested by suxen_drol)  
  *             removed halfpel refinement step in PMVfastSearch8 + quality=5  
  *             added new quality mode = 6 which performs halfpel refinement  
  *             filesize difference between quality 5 and 6 is smaller than 1%  
  *             (Isibaar)  
  *  31.12.2001 PMVfastSearch16 and PMVfastSearch8 (gruel)  
  *  30.12.2001 get_range/MotionSearchX simplified; blue/green bug fix  
  *  22.12.2001 commented best_point==99 check  
  *  19.12.2001 modified get_range (purple bug fix)  
  *  15.12.2001 moved pmv displacement from mbprediction  
  *  02.12.2001 motion estimation/compensation split (Isibaar)  
  *  16.11.2001 rewrote/tweaked search algorithms; pross@cs.rmit.edu.au  
  *  10.11.2001 support for sad16/sad8 functions  
  *  28.08.2001 reactivated MODE_INTER4V for EXT_MODE  
  *  24.08.2001 removed MODE_INTER4V_Q, disabled MODE_INTER4V for EXT_MODE  
  *  22.08.2001 added MODE_INTER4V_Q  
  *  20.08.2001 added pragma to get rid of internal compiler error with VC6  
  *             idea by Cyril. Thanks.  
  *  
  *  Michael Militzer <isibaar@videocoding.de>  
  *  
  **************************************************************************/  
   
31  #include <assert.h>  #include <assert.h>
32  #include <stdio.h>  #include <stdio.h>
33  #include <stdlib.h>  #include <stdlib.h>
34    #include <string.h>     // memcpy
35    
36  #include "../encoder.h"  #include "../encoder.h"
37  #include "../utils/mbfunctions.h"  #include "../utils/mbfunctions.h"
38  #include "../prediction/mbprediction.h"  #include "../prediction/mbprediction.h"
39  #include "../global.h"  #include "../global.h"
40  #include "../utils/timer.h"  #include "../utils/timer.h"
41    #include "../image/interpolate8x8.h"
42    #include "motion_est.h"
43  #include "motion.h"  #include "motion.h"
44  #include "sad.h"  #include "sad.h"
45    #include "../utils/emms.h"
46    
47    #define INITIAL_SKIP_THRESH     (10)
48    #define FINAL_SKIP_THRESH       (50)
49    #define MAX_SAD00_FOR_SKIP      (20)
50    #define MAX_CHROMA_SAD_FOR_SKIP (22)
51    
52    #define CHECK_CANDIDATE(X,Y,D) { \
53    (*CheckCandidate)((const int)(X),(const int)(Y), (D), &iDirection, data ); }
54    
55    static __inline int
56    d_mv_bits(int x, int y, const VECTOR pred, const uint32_t iFcode, const int qpel, const int rrv)
57    {
58            int xb, yb;
59            if (qpel) { x *= 2; y *= 2;}
60            else if (rrv) { x = RRV_MV_SCALEDOWN(x); y = RRV_MV_SCALEDOWN(y); }
61            x -= pred.x;
62            y -= pred.y;
63    
64            if (x) {
65                    if (x < 0) x = -x;
66                    x += (1 << (iFcode - 1)) - 1;
67                    x >>= (iFcode - 1);
68                    if (x > 32) x = 32;
69                    xb = mvtab[x] + iFcode;
70            } else xb = 1;
71    
72            if (y) {
73                    if (y < 0) y = -y;
74                    y += (1 << (iFcode - 1)) - 1;
75                    y >>= (iFcode - 1);
76                    if (y > 32) y = 32;
77                    yb = mvtab[y] + iFcode;
78            } else yb = 1;
79            return xb + yb;
80    }
81    
82    static int32_t
83    ChromaSAD(int dx, int dy, const SearchData * const data)
84    {
85            int sad;
86            const uint32_t stride = data->iEdgedWidth/2;
87    
88            if (dx == data->temp[5] && dy == data->temp[6]) return data->temp[7]; //it has been checked recently
89            data->temp[5]  = dx; data->temp[6] = dy; // backup
90    
91            switch (((dx & 1) << 1) | (dy & 1))     {
92                    case 0:
93                            dx = dx / 2; dy = dy / 2;
94                            sad = sad8(data->CurU, data->RefCU + dy * stride + dx, stride);
95                            sad += sad8(data->CurV, data->RefCV + dy * stride + dx, stride);
96                            break;
97                    case 1:
98                            dx = dx / 2; dy = (dy - 1) / 2;
99                            sad = sad8bi(data->CurU, data->RefCU + dy * stride + dx, data->RefCU + (dy+1) * stride + dx, stride);
100                            sad += sad8bi(data->CurV, data->RefCV + dy * stride + dx, data->RefCV + (dy+1) * stride + dx, stride);
101                            break;
102                    case 2:
103                            dx = (dx - 1) / 2; dy = dy / 2;
104                            sad = sad8bi(data->CurU, data->RefCU + dy * stride + dx, data->RefCU + dy * stride + dx+1, stride);
105                            sad += sad8bi(data->CurV, data->RefCV + dy * stride + dx, data->RefCV + dy * stride + dx+1, stride);
106                            break;
107                    default:
108                            dx = (dx - 1) / 2; dy = (dy - 1) / 2;
109                            interpolate8x8_halfpel_hv(data->RefQ, data->RefCU + dy * stride + dx, stride, data->rounding);
110                            sad = sad8(data->CurU, data->RefQ, stride);
111    
112                            interpolate8x8_halfpel_hv(data->RefQ, data->RefCV + dy * stride + dx, stride, data->rounding);
113  static int32_t lambda_vec16[32] =       /* rounded values for lambda param for weight of motion bits as in modified H.26L */                          sad += sad8(data->CurV, data->RefQ, stride);
114  { 0, (int) (1.00235 + 0.5), (int) (1.15582 + 0.5), (int) (1.31976 + 0.5),                          break;
                 (int) (1.49591 + 0.5), (int) (1.68601 + 0.5),  
         (int) (1.89187 + 0.5), (int) (2.11542 + 0.5), (int) (2.35878 + 0.5),  
                 (int) (2.62429 + 0.5), (int) (2.91455 + 0.5),  
         (int) (3.23253 + 0.5), (int) (3.58158 + 0.5), (int) (3.96555 + 0.5),  
                 (int) (4.38887 + 0.5), (int) (4.85673 + 0.5),  
         (int) (5.37519 + 0.5), (int) (5.95144 + 0.5), (int) (6.59408 + 0.5),  
                 (int) (7.31349 + 0.5), (int) (8.12242 + 0.5),  
         (int) (9.03669 + 0.5), (int) (10.0763 + 0.5), (int) (11.2669 + 0.5),  
                 (int) (12.6426 + 0.5), (int) (14.2493 + 0.5),  
         (int) (16.1512 + 0.5), (int) (18.442 + 0.5), (int) (21.2656 + 0.5),  
                 (int) (24.8580 + 0.5), (int) (29.6436 + 0.5),  
         (int) (36.4949 + 0.5)  
 };  
   
 static int32_t *lambda_vec8 = lambda_vec16;     /* same table for INTER and INTER4V for now */  
   
   
   
 // mv.length table  
 static const uint32_t mvtab[33] = {  
         1, 2, 3, 4, 6, 7, 7, 7,  
         9, 9, 9, 10, 10, 10, 10, 10,  
         10, 10, 10, 10, 10, 10, 10, 10,  
         10, 11, 11, 11, 11, 11, 11, 12, 12  
 };  
   
   
 static __inline uint32_t  
 mv_bits(int32_t component,  
                 const uint32_t iFcode)  
 {  
         if (component == 0)  
                 return 1;  
   
         if (component < 0)  
                 component = -component;  
   
         if (iFcode == 1) {  
                 if (component > 32)  
                         component = 32;  
   
                 return mvtab[component] + 1;  
115          }          }
116            data->temp[7] = sad; //backup, part 2
117          component += (1 << (iFcode - 1)) - 1;          return sad;
         component >>= (iFcode - 1);  
   
         if (component > 32)  
                 component = 32;  
   
         return mvtab[component] + 1 + iFcode - 1;  
118  }  }
119    
120    static __inline const uint8_t *
121  static __inline uint32_t  GetReferenceB(const int x, const int y, const int dir, const SearchData * const data)
 calc_delta_16(const int32_t dx,  
                           const int32_t dy,  
                           const uint32_t iFcode,  
                           const uint32_t iQuant)  
122  {  {
123          return NEIGH_TEND_16X16 * lambda_vec16[iQuant] * (mv_bits(dx, iFcode) +  //      dir : 0 = forward, 1 = backward
124                                                                                                            mv_bits(dy, iFcode));          switch ( (dir << 2) | ((x&1)<<1) | (y&1) ) {
125                    case 0 : return data->Ref + x/2 + (y/2)*(data->iEdgedWidth);
126                    case 1 : return data->RefV + x/2 + ((y-1)/2)*(data->iEdgedWidth);
127                    case 2 : return data->RefH + (x-1)/2 + (y/2)*(data->iEdgedWidth);
128                    case 3 : return data->RefHV + (x-1)/2 + ((y-1)/2)*(data->iEdgedWidth);
129                    case 4 : return data->bRef + x/2 + (y/2)*(data->iEdgedWidth);
130                    case 5 : return data->bRefV + x/2 + ((y-1)/2)*(data->iEdgedWidth);
131                    case 6 : return data->bRefH + (x-1)/2 + (y/2)*(data->iEdgedWidth);
132                    default : return data->bRefHV + (x-1)/2 + ((y-1)/2)*(data->iEdgedWidth);
133            }
134  }  }
135    
136  static __inline uint32_t  // this is a simpler copy of GetReferenceB, but as it's __inline anyway, we can keep the two separate
137  calc_delta_8(const int32_t dx,  static __inline const uint8_t *
138                           const int32_t dy,  GetReference(const int x, const int y, const SearchData * const data)
                          const uint32_t iFcode,  
                          const uint32_t iQuant)  
139  {  {
140          return NEIGH_TEND_8X8 * lambda_vec8[iQuant] * (mv_bits(dx, iFcode) +          switch ( ((x&1)<<1) | (y&1) ) {
141                                                                                                     mv_bits(dy, iFcode));                  case 0 : return data->Ref + x/2 + (y/2)*(data->iEdgedWidth);
142                    case 1 : return data->RefV + x/2 + ((y-1)/2)*(data->iEdgedWidth);
143                    case 2 : return data->RefH + (x-1)/2 + (y/2)*(data->iEdgedWidth);
144                    default : return data->RefHV + (x-1)/2 + ((y-1)/2)*(data->iEdgedWidth);
145            }
146  }  }
147    
148  bool  static uint8_t *
149  MotionEstimation(MBParam * const pParam,  Interpolate8x8qpel(const int x, const int y, const int block, const int dir, const SearchData * const data)
                                  FRAMEINFO * const current,  
                                  FRAMEINFO * const reference,  
                                  const IMAGE * const pRefH,  
                                  const IMAGE * const pRefV,  
                                  const IMAGE * const pRefHV,  
                                  const uint32_t iLimit)  
150  {  {
151          const uint32_t iWcount = pParam->mb_width;  // create or find a qpel-precision reference picture; return pointer to it
152          const uint32_t iHcount = pParam->mb_height;          uint8_t * Reference = (uint8_t *)data->RefQ + 16*dir;
153          MACROBLOCK *const pMBs = current->mbs;          const int32_t iEdgedWidth = data->iEdgedWidth;
154          MACROBLOCK *const prevMBs = reference->mbs;          const uint32_t rounding = data->rounding;
155          const IMAGE *const pCurrent = &current->image;          const int halfpel_x = x/2;
156          const IMAGE *const pRef = &reference->image;          const int halfpel_y = y/2;
157            const uint8_t *ref1, *ref2, *ref3, *ref4;
         static const VECTOR zeroMV = { 0, 0 };  
         VECTOR predMV;  
   
         int32_t x, y;  
         int32_t iIntra = 0;  
         VECTOR pmv;  
   
         if (sadInit)  
                 (*sadInit) ();  
   
         for (y = 0; y < iHcount; y++)   {  
                 for (x = 0; x < iWcount; x ++)  {  
   
                         MACROBLOCK *const pMB = &pMBs[x + y * iWcount];  
   
                         predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);  
158    
159                          pMB->sad16 =          ref1 = GetReferenceB(halfpel_x, halfpel_y, dir, data);
160                                  SEARCH16(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent,          ref1 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
161                                                   x, y, predMV.x, predMV.y, predMV.x, predMV.y,          switch( ((x&1)<<1) + (y&1) ) {
162                                                   current->motion_flags, current->quant,          case 0: // pure halfpel position
163                                                   current->fcode, pParam, pMBs, prevMBs, &pMB->mv16,                  return (uint8_t *) ref1;
164                                                   &pMB->pmvs[0]);                  break;
   
                         if (0 < (pMB->sad16 - MV16_INTER_BIAS)) {  
                                 int32_t deviation;  
   
                                 deviation =  
                                         dev16(pCurrent->y + x * 16 + y * 16 * pParam->edged_width,  
                                                   pParam->edged_width);  
165    
166                                  if (deviation < (pMB->sad16 - MV16_INTER_BIAS)) {          case 1: // x halfpel, y qpel - top or bottom during qpel refinement
167                                          pMB->mode = MODE_INTRA;                  ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
168                                          pMB->mv16 = pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] =                  ref2 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
169                                                  pMB->mvs[3] = zeroMV;                  interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
170                                          pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] =                  break;
                                                 pMB->sad8[3] = 0;  
171    
172                                          iIntra++;          case 2: // x qpel, y halfpel - left or right during qpel refinement
173                                          if (iIntra >= iLimit)                  ref2 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
174                                                  return 1;                  ref2 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
175                    interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
176                    break;
177    
178                                          continue;          default: // x and y in qpel resolution - the "corners" (top left/right and
179                             // bottom left/right) during qpel refinement
180                    ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
181                    ref3 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
182                    ref4 = GetReferenceB(x - halfpel_x, y - halfpel_y, dir, data);
183                    ref2 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
184                    ref3 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
185                    ref4 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
186                    interpolate8x8_avg4(Reference, ref1, ref2, ref3, ref4, iEdgedWidth, rounding);
187                    break;
188                                  }                                  }
189            return Reference;
190                          }                          }
191    
192                          pmv = pMB->pmvs[0];  static uint8_t *
193                          if (current->global_flags & XVID_INTER4V)  Interpolate16x16qpel(const int x, const int y, const int dir, const SearchData * const data)
194                                  if ((!(current->global_flags & XVID_LUMIMASKING) ||  {
195                                           pMB->dquant == NO_CHANGE)) {  // create or find a qpel-precision reference picture; return pointer to it
196                                          int32_t sad8 = IMV16X16 * current->quant;          uint8_t * Reference = (uint8_t *)data->RefQ + 16*dir;
197            const int32_t iEdgedWidth = data->iEdgedWidth;
198                                          if (sad8 < pMB->sad16) {          const uint32_t rounding = data->rounding;
199                                                  sad8 += pMB->sad8[0] =          const int halfpel_x = x/2;
200                                                          SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,          const int halfpel_y = y/2;
201                                                                          pCurrent, 2 * x, 2 * y,          const uint8_t *ref1, *ref2, *ref3, *ref4;
                                                                         pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,  
                                                                         current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[0],  
                                                                         &pMB->pmvs[0]);  
                                         }  
                                         if (sad8 < pMB->sad16) {  
   
                                                 predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 1);  
                                                 sad8 += pMB->sad8[1] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x + 1, 2 * y,  
                                                                         pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,  
                                                                         current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[1],  
                                                                         &pMB->pmvs[1]);  
                                         }  
                                         if (sad8 < pMB->sad16) {  
                                                 predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 2);  
                                                 sad8 += pMB->sad8[2] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x, 2 * y + 1,  
                                                                         pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,  
                                                                         current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[2],  
                                                                         &pMB->pmvs[2]);  
                                         }  
                                         if (sad8 < pMB->sad16) {  
                                                 predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 3);  
                                                 sad8 += pMB->sad8[3] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x + 1, 2 * y + 1,  
                                                                         pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,  
                                                                         current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs,  
                                                                         &pMB->mvs[3],  
                                                                         &pMB->pmvs[3]);  
                                         }  
   
                                         /* decide: MODE_INTER or MODE_INTER4V  
                                            mpeg4:   if (sad8 < pMB->sad16 - nb/2+1) use_inter4v  
                                          */  
202    
203                                          if (sad8 < pMB->sad16) {          ref1 = GetReferenceB(halfpel_x, halfpel_y, dir, data);
204                                                  pMB->mode = MODE_INTER4V;          switch( ((x&1)<<1) + (y&1) ) {
205                                                  pMB->sad8[0] *= 4;          case 0: // pure halfpel position
206                                                  pMB->sad8[1] *= 4;                  return (uint8_t *) ref1;
207                                                  pMB->sad8[2] *= 4;          case 1: // x halfpel, y qpel - top or bottom during qpel refinement
208                                                  pMB->sad8[3] *= 4;                  ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
209                                                  continue;                  interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
210                                          }                  interpolate8x8_avg2(Reference+8, ref1+8, ref2+8, iEdgedWidth, rounding, 8);
211                    interpolate8x8_avg2(Reference+8*iEdgedWidth, ref1+8*iEdgedWidth, ref2+8*iEdgedWidth, iEdgedWidth, rounding, 8);
212                    interpolate8x8_avg2(Reference+8*iEdgedWidth+8, ref1+8*iEdgedWidth+8, ref2+8*iEdgedWidth+8, iEdgedWidth, rounding, 8);
213                    break;
214    
215                                  }          case 2: // x qpel, y halfpel - left or right during qpel refinement
216                    ref2 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
217                    interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
218                    interpolate8x8_avg2(Reference+8, ref1+8, ref2+8, iEdgedWidth, rounding, 8);
219                    interpolate8x8_avg2(Reference+8*iEdgedWidth, ref1+8*iEdgedWidth, ref2+8*iEdgedWidth, iEdgedWidth, rounding, 8);
220                    interpolate8x8_avg2(Reference+8*iEdgedWidth+8, ref1+8*iEdgedWidth+8, ref2+8*iEdgedWidth+8, iEdgedWidth, rounding, 8);
221                    break;
222    
223                          pMB->mode = MODE_INTER;          default: // x and y in qpel resolution - the "corners" (top left/right and
224                          pMB->pmvs[0] = pmv;     /* pMB->pmvs[1] = pMB->pmvs[2] = pMB->pmvs[3]  are not needed for INTER */                           // bottom left/right) during qpel refinement
225                          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->mv16;                  ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
226                          pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] =                  ref3 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
227                                  pMB->sad16;                  ref4 = GetReferenceB(x - halfpel_x, y - halfpel_y, dir, data);
228                          }                  interpolate8x8_avg4(Reference, ref1, ref2, ref3, ref4, iEdgedWidth, rounding);
229                    interpolate8x8_avg4(Reference+8, ref1+8, ref2+8, ref3+8, ref4+8, iEdgedWidth, rounding);
230                    interpolate8x8_avg4(Reference+8*iEdgedWidth, ref1+8*iEdgedWidth, ref2+8*iEdgedWidth, ref3+8*iEdgedWidth, ref4+8*iEdgedWidth, iEdgedWidth, rounding);
231                    interpolate8x8_avg4(Reference+8*iEdgedWidth+8, ref1+8*iEdgedWidth+8, ref2+8*iEdgedWidth+8, ref3+8*iEdgedWidth+8, ref4+8*iEdgedWidth+8, iEdgedWidth, rounding);
232                    break;
233                          }                          }
234            return Reference;
         return 0;  
235  }  }
236    
237    /* CHECK_CANDIATE FUNCTIONS START */
238    
239  #define CHECK_MV16_ZERO {\  static void
240    if ( (0 <= max_dx) && (0 >= min_dx) \  CheckCandidate16(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
     && (0 <= max_dy) && (0 >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0, 0 , iEdgedWidth), iEdgedWidth, MV_MAX_ERROR); \  
     iSAD += calc_delta_16(-center_x, -center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=0; currMV->y=0; }  }     \  
 }  
   
 #define NOCHECK_MV16_CANDIDATE(X,Y) { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \  
 }  
   
 #define CHECK_MV16_CANDIDATE(X,Y) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
 }  
   
 #define CHECK_MV16_CANDIDATE_DIR(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \  
 }  
   
 #define CHECK_MV16_CANDIDATE_FOUND(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
 }  
   
   
 #define CHECK_MV8_ZERO {\  
   iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, 0, 0 , iEdgedWidth), iEdgedWidth); \  
   iSAD += calc_delta_8(-center_x, -center_y, (uint8_t)iFcode, iQuant);\  
   if (iSAD < iMinSAD) \  
   { iMinSAD=iSAD; currMV->x=0; currMV->y=0; } \  
 }  
   
 #define NOCHECK_MV8_CANDIDATE(X,Y) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \  
 }  
   
 #define CHECK_MV8_CANDIDATE(X,Y) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
 }  
   
 #define CHECK_MV8_CANDIDATE_DIR(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \  
 }  
   
 #define CHECK_MV8_CANDIDATE_FOUND(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
 }  
   
 /* too slow and not fully functional at the moment */  
 /*  
 int32_t ZeroSearch16(  
                                         const uint8_t * const pRef,  
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const IMAGE * const pCur,  
                                         const int x, const int y,  
                                         const uint32_t MotionFlags,  
                                         const uint32_t iQuant,  
                                         const uint32_t iFcode,  
                                         MBParam * const pParam,  
                                         const MACROBLOCK * const pMBs,  
                                         const MACROBLOCK * const prevMBs,  
                                         VECTOR * const currMV,  
                                         VECTOR * const currPMV)  
241  {  {
242          const int32_t iEdgedWidth = pParam->edged_width;          int t, xc, yc;
243          const uint8_t * cur = pCur->y + x*16 + y*16*iEdgedWidth;          const uint8_t * Reference;
244          int32_t iSAD;          VECTOR * current;
         VECTOR pred;  
   
   
         pred = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);  
   
         iSAD = sad16( cur,  
                 get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0,0, iEdgedWidth),  
                 iEdgedWidth, MV_MAX_ERROR);  
         if (iSAD <= iQuant * 96)  
                 iSAD -= MV16_00_BIAS;  
245    
246          currMV->x = 0;          if (( x > data->max_dx) || ( x < data->min_dx)
247          currMV->y = 0;                  || ( y > data->max_dy) || (y < data->min_dy)) return;
         currPMV->x = -pred.x;  
         currPMV->y = -pred.y;  
   
         return iSAD;  
248    
249            if (data->qpel_precision) { // x and y are in 1/4 precision
250                    Reference = Interpolate16x16qpel(x, y, 0, data);
251                    xc = x/2; yc = y/2; //for chroma sad
252                    current = data->currentQMV;
253            } else {
254                    Reference = GetReference(x, y, data);
255                    current = data->currentMV;
256                    xc = x; yc = y;
257  }  }
258  */          t = d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel && !data->qpel_precision, 0);
259    
260  int32_t          data->temp[0] = sad16v(data->Cur, Reference, data->iEdgedWidth, data->temp + 1);
 Diamond16_MainSearch(const uint8_t * const pRef,  
                                          const uint8_t * const pRefH,  
                                          const uint8_t * const pRefV,  
                                          const uint8_t * const pRefHV,  
                                          const uint8_t * const cur,  
                                          const int x,  
                                          const int y,  
                                    const int start_x,  
                                    const int start_y,  
                                    int iMinSAD,  
                                    VECTOR * const currMV,  
                                    const int center_x,  
                                    const int center_y,  
                                          const int32_t min_dx,  
                                          const int32_t max_dx,  
                                          const int32_t min_dy,  
                                          const int32_t max_dy,  
                                          const int32_t iEdgedWidth,  
                                          const int32_t iDiamondSize,  
                                          const int32_t iFcode,  
                                          const int32_t iQuant,  
                                          int iFound)  
 {  
 /* Do a diamond search around given starting point, return SAD of best */  
261    
262          int32_t iDirection = 0;          data->temp[0] += (data->lambda16 * t * data->temp[0])/1000;
263          int32_t iSAD;          data->temp[1] += (data->lambda8 * t * (data->temp[1] + NEIGH_8X8_BIAS))/100;
         VECTOR backupMV;  
264    
265          backupMV.x = start_x;          if (data->chroma) data->temp[0] += ChromaSAD((xc >> 1) + roundtab_79[xc & 0x3],
266          backupMV.y = start_y;                                                                                                          (yc >> 1) + roundtab_79[yc & 0x3], data);
267    
268  /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */          if (data->temp[0] < data->iMinSAD[0]) {
269                    data->iMinSAD[0] = data->temp[0];
270                    current[0].x = x; current[0].y = y;
271                    *dir = Direction; }
272    
273            if (data->temp[1] < data->iMinSAD[1]) {
274                    data->iMinSAD[1] = data->temp[1]; current[1].x = x; current[1].y= y; }
275            if (data->temp[2] < data->iMinSAD[2]) {
276                    data->iMinSAD[2] = data->temp[2]; current[2].x = x; current[2].y = y; }
277            if (data->temp[3] < data->iMinSAD[3]) {
278                    data->iMinSAD[3] = data->temp[3]; current[3].x = x; current[3].y = y; }
279            if (data->temp[4] < data->iMinSAD[4]) {
280                    data->iMinSAD[4] = data->temp[4]; current[4].x = x; current[4].y = y; }
281    
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;  
   
                         if (iDirection != 2)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,  
                                                                                    backupMV.y, 1);  
                         if (iDirection != 1)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x + iDiamondSize,  
                                                                                    backupMV.y, 2);  
                         if (iDirection != 4)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y - iDiamondSize, 3);  
                         if (iDirection != 3)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y + iDiamondSize, 4);  
         } else {  
                 currMV->x = start_x;  
                 currMV->y = start_y;  
         }  
         return iMinSAD;  
282  }  }
283    
284  int32_t  static void
285  Square16_MainSearch(const uint8_t * const pRef,  CheckCandidate32(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const uint8_t * const cur,  
                                         const int x,  
                                         const int y,  
                                    const int start_x,  
                                    const int start_y,  
                                    int iMinSAD,  
                                    VECTOR * const currMV,  
                                    const int center_x,  
                                    const int center_y,  
                                         const int32_t min_dx,  
                                         const int32_t max_dx,  
                                         const int32_t min_dy,  
                                         const int32_t max_dy,  
                                         const int32_t iEdgedWidth,  
                                         const int32_t iDiamondSize,  
                                         const int32_t iFcode,  
                                         const int32_t iQuant,  
                                         int iFound)  
286  {  {
287  /* Do a square search around given starting point, return SAD of best */          int t;
288            const uint8_t * Reference;
289    
290          int32_t iDirection = 0;          if ( (!(x&1) && x !=0) || (!(y&1) && y !=0) || //non-zero integer value
291          int32_t iSAD;                  ( x > data->max_dx) || ( x < data->min_dx)
292          VECTOR backupMV;                  || ( y > data->max_dy) || (y < data->min_dy)) return;
293    
294          backupMV.x = start_x;          Reference = GetReference(x, y, data);
295          backupMV.y = start_y;          t = d_mv_bits(x, y, data->predMV, data->iFcode, 0, 1);
296    
297  /* It's one search with full square pattern, and new parts for all following diamonds */          data->temp[0] = sad32v_c(data->Cur, Reference, data->iEdgedWidth, data->temp + 1);
298    
299  /*   new direction are extra, so 1-4 is normal diamond          data->temp[0] += (data->lambda16 * t * data->temp[0])/1000;
300        537          data->temp[1] += (data->lambda8 * t * (data->temp[1] + NEIGH_8X8_BIAS))/100;
       1*2  
       648  
 */  
   
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                          backupMV.y - iDiamondSize, 5);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                          backupMV.y + iDiamondSize, 6);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                          backupMV.y - iDiamondSize, 7);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                          backupMV.y + iDiamondSize, 8);  
   
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;  
301    
302                          switch (iDirection) {          if (data->temp[0] < data->iMinSAD[0]) {
303                          case 1:                  data->iMinSAD[0] = data->temp[0];
304                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,                  data->currentMV[0].x = x; data->currentMV[0].y = y;
305                                                                                     backupMV.y, 1);                  *dir = Direction; }
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 break;  
                         case 2:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
306    
307                          case 3:          if (data->temp[1] < data->iMinSAD[1]) {
308                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,                  data->iMinSAD[1] = data->temp[1]; data->currentMV[1].x = x; data->currentMV[1].y = y; }
309                                                                                   4);          if (data->temp[2] < data->iMinSAD[2]) {
310                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,                  data->iMinSAD[2] = data->temp[2]; data->currentMV[2].x = x; data->currentMV[2].y = y; }
311                                                                                   backupMV.y - iDiamondSize, 7);          if (data->temp[3] < data->iMinSAD[3]) {
312                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,                  data->iMinSAD[3] = data->temp[3]; data->currentMV[3].x = x; data->currentMV[3].y = y; }
313                                                                                   backupMV.y + iDiamondSize, 8);          if (data->temp[4] < data->iMinSAD[4]) {
314                                  break;                  data->iMinSAD[4] = data->temp[4]; data->currentMV[4].x = x; data->currentMV[4].y = y; }
315    }
316    
317                          case 4:  static void
318                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  CheckCandidate16no4v(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
319                                                                                   3);  {
320                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,          int32_t sad;
321                                                                                   backupMV.y - iDiamondSize, 5);          const uint8_t * Reference;
322                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,          int t;
323                                                                                   backupMV.y + iDiamondSize, 6);          VECTOR * current;
                                 break;  
   
                         case 5:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,  
                                                                                  1);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 break;  
   
                         case 6:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
   
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
324    
325                                  break;          if (( x > data->max_dx) || ( x < data->min_dx)
326                    || ( y > data->max_dy) || (y < data->min_dy)) return;
327    
328                          case 7:          if (data->rrv)
329                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,                  if ( (!(x&1) && x !=0) || (!(y&1) && y !=0) ) return; //non-zero integer value
                                                                                    backupMV.y, 1);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,  
                                                                                  4);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
330    
331                          case 8:          if (data->qpel_precision) { // x and y are in 1/4 precision
332                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,                  Reference = Interpolate16x16qpel(x, y, 0, data);
333                                                                                   2);                  current = data->currentQMV;
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,  
                                                                                  4);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
                         default:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,  
                                                                                  1);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,  
                                                                                  4);  
   
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
                         }  
334          } else {          } else {
335                  currMV->x = start_x;                  Reference = GetReference(x, y, data);
336                  currMV->y = start_y;                  current = data->currentMV;
337          }          }
338          return iMinSAD;          t = d_mv_bits(x, y, data->predMV, data->iFcode,
339  }                                          data->qpel && !data->qpel_precision, data->rrv);
   
   
 int32_t  
 Full16_MainSearch(const uint8_t * const pRef,  
                                   const uint8_t * const pRefH,  
                                   const uint8_t * const pRefV,  
                                   const uint8_t * const pRefHV,  
                                   const uint8_t * const cur,  
                                   const int x,  
                                   const int y,  
                                    const int start_x,  
                                    const int start_y,  
                                    int iMinSAD,  
                                    VECTOR * const currMV,  
                                    const int center_x,  
                                    const int center_y,  
                                   const int32_t min_dx,  
                                   const int32_t max_dx,  
                                   const int32_t min_dy,  
                                   const int32_t max_dy,  
                                   const int32_t iEdgedWidth,  
                                   const int32_t iDiamondSize,  
                                   const int32_t iFcode,  
                                   const int32_t iQuant,  
                                   int iFound)  
 {  
         int32_t iSAD;  
         int32_t dx, dy;  
         VECTOR backupMV;  
340    
341          backupMV.x = start_x;          sad = sad16(data->Cur, Reference, data->iEdgedWidth, 256*4096);
342          backupMV.y = start_y;          sad += (data->lambda16 * t * sad)/1000;
343    
344          for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)          if (sad < *(data->iMinSAD)) {
345                  for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)                  *(data->iMinSAD) = sad;
346                          NOCHECK_MV16_CANDIDATE(dx, dy);                  current->x = x; current->y = y;
347                    *dir = Direction; }
348    }
349    
350    static void
351    CheckCandidate32I(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
352    {
353    // maximum speed - for P/B/I decision
354    
355            if (( x > data->max_dx) || ( x < data->min_dx)
356                    || ( y > data->max_dy) || (y < data->min_dy)) return;
357    
358            data->temp[0] = sad32v_c(data->Cur, data->Ref + x/2 + (y/2)*(data->iEdgedWidth),
359                                                            data->iEdgedWidth, data->temp+1);
360            if (data->temp[0] < *(data->iMinSAD)) {
361                    *(data->iMinSAD) = data->temp[0];
362                    data->currentMV[0].x = x; data->currentMV[0].y = y;
363                    *dir = Direction; }
364            if (data->temp[1] < data->iMinSAD[1]) {
365                    data->iMinSAD[1] = data->temp[1]; data->currentMV[1].x = x; data->currentMV[1].y = y; }
366            if (data->temp[2] < data->iMinSAD[2]) {
367                    data->iMinSAD[2] = data->temp[2]; data->currentMV[2].x = x; data->currentMV[2].y = y; }
368            if (data->temp[3] < data->iMinSAD[3]) {
369                    data->iMinSAD[3] = data->temp[3]; data->currentMV[3].x = x; data->currentMV[3].y = y; }
370            if (data->temp[4] < data->iMinSAD[4]) {
371                    data->iMinSAD[4] = data->temp[4]; data->currentMV[4].x = x; data->currentMV[4].y = y; }
372    
         return iMinSAD;  
373  }  }
374    
375  int32_t  static void
376  AdvDiamond16_MainSearch(const uint8_t * const pRef,  CheckCandidateInt(const int xf, const int yf, const int Direction, int * const dir, const SearchData * const data)
377                                                  const uint8_t * const pRefH,  {
378                                                  const uint8_t * const pRefV,          int32_t sad;
379                                                  const uint8_t * const pRefHV,          int xb, yb, t;
380                                                  const uint8_t * const cur,          const uint8_t *ReferenceF, *ReferenceB;
381                                                  const int x,          VECTOR *current;
382                                                  const int y,  
383                                             int start_x,          if (( xf > data->max_dx) || ( xf < data->min_dx)
384                                             int start_y,                  || ( yf > data->max_dy) || (yf < data->min_dy)) return;
385                                             int iMinSAD,  
386                                             VECTOR * const currMV,          if (data->qpel_precision) {
387                                             const int center_x,                  ReferenceF = Interpolate16x16qpel(xf, yf, 0, data);
388                                             const int center_y,                  xb = data->currentQMV[1].x; yb = data->currentQMV[1].y;
389                                                  const int32_t min_dx,                  current = data->currentQMV;
390                                                  const int32_t max_dx,                  ReferenceB = Interpolate16x16qpel(xb, yb, 1, data);
391                                                  const int32_t min_dy,          } else {
392                                                  const int32_t max_dy,                  ReferenceF = GetReference(xf, yf, data);
393                                                  const int32_t iEdgedWidth,                  xb = data->currentMV[1].x; yb = data->currentMV[1].y;
394                                                  const int32_t iDiamondSize,                  ReferenceB = GetReferenceB(xb, yb, 1, data);
395                                                  const int32_t iFcode,                  current = data->currentMV;
396                                                  const int32_t iQuant,          }
                                                 int iDirection)  
 {  
397    
398          int32_t iSAD;          t = d_mv_bits(xf, yf, data->predMV, data->iFcode, data->qpel && !data->qpel_precision, 0)
399                     + d_mv_bits(xb, yb, data->bpredMV, data->iFcode, data->qpel && !data->qpel_precision, 0);
400    
401  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */          sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
402            sad += (data->lambda16 * t * sad)/1000;
403    
404          if (iDirection) {          if (sad < *(data->iMinSAD)) {
405                  CHECK_MV16_CANDIDATE(start_x - iDiamondSize, start_y);                  *(data->iMinSAD) = sad;
406                  CHECK_MV16_CANDIDATE(start_x + iDiamondSize, start_y);                  current->x = xf; current->y = yf;
407                  CHECK_MV16_CANDIDATE(start_x, start_y - iDiamondSize);                  *dir = Direction; }
408                  CHECK_MV16_CANDIDATE(start_x, start_y + iDiamondSize);  }
         } else {  
                 int bDirection = 1 + 2 + 4 + 8;  
409    
410                  do {  static void
411                          iDirection = 0;  CheckCandidateDirect(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
412                          if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)  {
413                                  CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);          int32_t sad = 0;
414            int k;
415            const uint8_t *ReferenceF;
416            const uint8_t *ReferenceB;
417            VECTOR mvs, b_mvs;
418            const VECTOR zeroMV={0,0};
419    
420                          if (bDirection & 2)          if (( x > 31) || ( x < -32) || ( y > 31) || (y < -32)) return;
                                 CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);  
421    
422                          if (bDirection & 4)          for (k = 0; k < 4; k++) {
423                                  CHECK_MV16_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);                  mvs.x = data->directmvF[k].x + x;
424                    b_mvs.x = ((x == 0) ?
425                            data->directmvB[k].x
426                            : mvs.x - data->referencemv[k].x);
427    
428                          if (bDirection & 8)                  mvs.y = data->directmvF[k].y + y;
429                                  CHECK_MV16_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);                  b_mvs.y = ((y == 0) ?
430                            data->directmvB[k].y
431                            : mvs.y - data->referencemv[k].y);
432    
433                          /* now we're doing diagonal checks near our candidate */                  if (( mvs.x > data->max_dx ) || ( mvs.x < data->min_dx )
434                            || ( mvs.y > data->max_dy ) || ( mvs.y < data->min_dy )
435                            || ( b_mvs.x > data->max_dx ) || ( b_mvs.x < data->min_dx )
436                            || ( b_mvs.y > data->max_dy ) || ( b_mvs.y < data->min_dy )) return;
437    
438                          if (iDirection)         //checking if anything found                  if (!data->qpel) {
439                          {                          mvs.x *= 2; mvs.y *= 2;
440                                  bDirection = iDirection;                          b_mvs.x *= 2; b_mvs.y *= 2; //we move to qpel precision anyway
                                 iDirection = 0;  
                                 start_x = currMV->x;  
                                 start_y = currMV->y;  
                                 if (bDirection & 3)     //our candidate is left or right  
                                 {  
                                         CHECK_MV16_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);  
                                 } else                  // what remains here is up or down  
                                 {  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);  
441                                  }                                  }
442                    ReferenceF = Interpolate8x8qpel(mvs.x, mvs.y, k, 0, data);
443                    ReferenceB = Interpolate8x8qpel(b_mvs.x, b_mvs.y, k, 1, data);
444    
445                                  if (iDirection) {                  sad += sad8bi(data->Cur + 8*(k&1) + 8*(k>>1)*(data->iEdgedWidth),
446                                          bDirection += iDirection;                                                  ReferenceF, ReferenceB,
447                                          start_x = currMV->x;                                                  data->iEdgedWidth);
448                                          start_y = currMV->y;                  if (sad > *(data->iMinSAD)) return;
449                                  }                                  }
                         } else                          //about to quit, eh? not so fast....  
                         {  
                                 switch (bDirection) {  
                                 case 2:  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 1:  
450    
451                                          CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,          sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0, 0) * sad)/1000;
                                                                                          start_y - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y + iDiamondSize, 1 + 8);  
                                         break;  
                                 case 2 + 4:  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 4:  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y - iDiamondSize, 1 + 4);  
                                         break;  
                                 case 8:  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y + iDiamondSize, 2 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y + iDiamondSize, 1 + 8);  
                                         break;  
                                 case 1 + 4:  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y + iDiamondSize, 1 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y - iDiamondSize, 2 + 4);  
                                         break;  
                                 case 2 + 8:  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y + iDiamondSize, 1 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 1 + 8:  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y + iDiamondSize, 2 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y + iDiamondSize, 1 + 8);  
                                         break;  
                                 default:                //1+2+4+8 == we didn't find anything at all  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                          start_y + iDiamondSize, 1 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                          start_y + iDiamondSize, 2 + 8);  
                                         break;  
                                 }  
                                 if (!iDirection)  
                                         break;          //ok, the end. really  
                                 else {  
                                         bDirection = iDirection;  
                                         start_x = currMV->x;  
                                         start_y = currMV->y;  
                                 }  
                         }  
                 }  
                 while (1);                              //forever  
         }  
         return iMinSAD;  
 }  
452    
453            if (sad < *(data->iMinSAD)) {
454  #define CHECK_MV16_F_INTERPOL(X,Y,BX,BY) { \                  *(data->iMinSAD) = sad;
455    if ( ((X) <= max_dx) && ((X) >= min_dx) \                  data->currentMV->x = x; data->currentMV->y = y;
456      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \                  *dir = Direction; }
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
457  }  }
458    
459  #define CHECK_MV16_F_INTERPOL_DIR(X,Y,BX,BY,D) { \  static void
460    if ( ((X) <= max_dx) && ((X) >= min_dx) \  CheckCandidateDirectno4v(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
461      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  {
462    { \          int32_t sad;
463      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \          const uint8_t *ReferenceF;
464      iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\          const uint8_t *ReferenceB;
465      if (iSAD < iMinSAD) \          VECTOR mvs, b_mvs;
466      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \          const VECTOR zeroMV = {0,0};
 }  
467    
468  #define CHECK_MV16_F_INTERPOL_FOUND(X,Y,BX,BY,D) { \          if (( x > 31) || ( x < -32) || ( y > 31) || (y < -32)) return;
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
 }  
469    
470            mvs.x = data->directmvF[0].x + x;
471            b_mvs.x = ((x == 0) ?
472                    data->directmvB[0].x
473                    : mvs.x - data->referencemv[0].x);
474    
475  #define CHECK_MV16_B_INTERPOL(FX,FY,X,Y) { \          mvs.y = data->directmvF[0].y + y;
476    if ( ((X) <= max_dx) && ((X) >= min_dx) \          b_mvs.y = ((y == 0) ?
477      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \                  data->directmvB[0].y
478    { \                  : mvs.y - data->referencemv[0].y);
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
 }  
479    
480            if (( mvs.x > data->max_dx ) || ( mvs.x < data->min_dx )
481                    || ( mvs.y > data->max_dy ) || ( mvs.y < data->min_dy )
482                    || ( b_mvs.x > data->max_dx ) || ( b_mvs.x < data->min_dx )
483                    || ( b_mvs.y > data->max_dy ) || ( b_mvs.y < data->min_dy )) return;
484    
485  #define CHECK_MV16_B_INTERPOL_DIR(FX,FY,X,Y,D) { \          if (!data->qpel) {
486    if ( ((X) <= max_dx) && ((X) >= min_dx) \                          mvs.x *= 2; mvs.y *= 2;
487      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \                          b_mvs.x *= 2; b_mvs.y *= 2; //we move to qpel precision anyway
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \  
488  }  }
489            ReferenceF = Interpolate16x16qpel(mvs.x, mvs.y, 0, data);
490            ReferenceB = Interpolate16x16qpel(b_mvs.x, b_mvs.y, 1, data);
491    
492            sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
493            sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0, 0) * sad)/1000;
494    
495  #define CHECK_MV16_B_INTERPOL_FOUND(FX,FY,X,Y,D) { \          if (sad < *(data->iMinSAD)) {
496    if ( ((X) <= max_dx) && ((X) >= min_dx) \                  *(data->iMinSAD) = sad;
497      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \                  data->currentMV->x = x; data->currentMV->y = y;
498    { \                  *dir = Direction; }
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
499  }  }
500    
501    static void
502    CheckCandidate8(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
503    {
504            int32_t sad; int t;
505            const uint8_t * Reference;
506    
507  #if (0==1)          if (( x > data->max_dx) || ( x < data->min_dx)
508  int32_t                  || ( y > data->max_dy) || (y < data->min_dy)) return;
 Diamond16_InterpolMainSearch(  
                                         const uint8_t * const f_pRef,  
                                          const uint8_t * const f_pRefH,  
                                          const uint8_t * const f_pRefV,  
                                          const uint8_t * const f_pRefHV,  
                                          const uint8_t * const cur,  
509    
510                                          const uint8_t * const b_pRef,          if (data->qpel) Reference = Interpolate16x16qpel(x, y, 0, data);
511                                           const uint8_t * const b_pRefH,          else Reference =  GetReference(x, y, data);
                                          const uint8_t * const b_pRefV,  
                                          const uint8_t * const b_pRefHV,  
512    
513                                           const int x,          sad = sad8(data->Cur, Reference, data->iEdgedWidth);
514                                           const int y,          t = d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel && !data->qpel_precision, 0);
515    
516                                     const int f_start_x,          sad += (data->lambda8 * t * (sad+NEIGH_8X8_BIAS))/100;
517                                     const int f_start_y,  
518                                     const int b_start_x,          if (sad < *(data->iMinSAD)) {
519                                     const int b_start_y,                  *(data->iMinSAD) = sad;
520                    data->currentMV->x = x; data->currentMV->y = y;
521                                     int iMinSAD,                  *dir = Direction; }
                                    VECTOR * const f_currMV,  
                                    VECTOR * const b_currMV,  
   
                                    const int f_center_x,  
                                    const int f_center_y,  
                                    const int b_center_x,  
                                    const int b_center_y,  
   
                                          const int32_t min_dx,  
                                          const int32_t max_dx,  
                                          const int32_t min_dy,  
                                          const int32_t max_dy,  
                                          const int32_t iEdgedWidth,  
                                          const int32_t iDiamondSize,  
   
                                          const int32_t f_iFcode,  
                                          const int32_t b_iFcode,  
   
                                          const int32_t iQuant,  
                                          int iFound)  
 {  
 /* Do a diamond search around given starting point, return SAD of best */  
   
         int32_t f_iDirection = 0;  
         int32_t b_iDirection = 0;  
         int32_t iSAD;  
   
         VECTOR f_backupMV;  
         VECTOR b_backupMV;  
   
         f_backupMV.x = start_x;  
         f_backupMV.y = start_y;  
         b_backupMV.x = start_x;  
         b_backupMV.y = start_y;  
   
 /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  
   
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;  
   
                         if (iDirection != 2)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,  
                                                                                    backupMV.y, 1);  
                         if (iDirection != 1)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x + iDiamondSize,  
                                                                                    backupMV.y, 2);  
                         if (iDirection != 4)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y - iDiamondSize, 3);  
                         if (iDirection != 3)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y + iDiamondSize, 4);  
         } else {  
                 currMV->x = start_x;  
                 currMV->y = start_y;  
         }  
         return iMinSAD;  
522  }  }
 #endif  
523    
524    /* CHECK_CANDIATE FUNCTIONS END */
525    
526  int32_t  /* MAINSEARCH FUNCTIONS START */
 AdvDiamond8_MainSearch(const uint8_t * const pRef,  
                                            const uint8_t * const pRefH,  
                                            const uint8_t * const pRefV,  
                                            const uint8_t * const pRefHV,  
                                            const uint8_t * const cur,  
                                            const int x,  
                                            const int y,  
                                            int start_x,  
                                            int start_y,  
                                            int iMinSAD,  
                                            VECTOR * const currMV,  
                                            const int center_x,  
                                            const int center_y,  
                                            const int32_t min_dx,  
                                            const int32_t max_dx,  
                                            const int32_t min_dy,  
                                            const int32_t max_dy,  
                                            const int32_t iEdgedWidth,  
                                            const int32_t iDiamondSize,  
                                            const int32_t iFcode,  
                                            const int32_t iQuant,  
                                            int iDirection)  
 {  
527    
528          int32_t iSAD;  static void
529    AdvDiamondSearch(int x, int y, const SearchData * const data, int bDirection)
530    {
531    
532  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
533    
534          if (iDirection) {          int iDirection;
                 CHECK_MV8_CANDIDATE(start_x - iDiamondSize, start_y);  
                 CHECK_MV8_CANDIDATE(start_x + iDiamondSize, start_y);  
                 CHECK_MV8_CANDIDATE(start_x, start_y - iDiamondSize);  
                 CHECK_MV8_CANDIDATE(start_x, start_y + iDiamondSize);  
         } else {  
                 int bDirection = 1 + 2 + 4 + 8;  
535    
536                  do {          for(;;) { //forever
537                          iDirection = 0;                          iDirection = 0;
538                          if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)                  if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1);
539                                  CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);                  if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2);
540                    if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4);
541                          if (bDirection & 2)                  if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8);
                                 CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);  
   
                         if (bDirection & 4)  
                                 CHECK_MV8_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);  
   
                         if (bDirection & 8)  
                                 CHECK_MV8_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);  
542    
543                          /* now we're doing diagonal checks near our candidate */                          /* now we're doing diagonal checks near our candidate */
544    
545                          if (iDirection)         //checking if anything found                  if (iDirection) {               //checking if anything found
                         {  
546                                  bDirection = iDirection;                                  bDirection = iDirection;
547                                  iDirection = 0;                                  iDirection = 0;
548                                  start_x = currMV->x;                          x = data->currentMV->x; y = data->currentMV->y;
549                                  start_y = currMV->y;                          if (bDirection & 3) {   //our candidate is left or right
550                                  if (bDirection & 3)     //our candidate is left or right                                  CHECK_CANDIDATE(x, y + iDiamondSize, 8);
551                                  {                                  CHECK_CANDIDATE(x, y - iDiamondSize, 4);
552                                          CHECK_MV8_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);                          } else {                        // what remains here is up or down
553                                          CHECK_MV8_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);                                  CHECK_CANDIDATE(x + iDiamondSize, y, 2);
554                                  } else                  // what remains here is up or down                                  CHECK_CANDIDATE(x - iDiamondSize, y, 1);
                                 {  
                                         CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);  
                                         CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);  
555                                  }                                  }
556    
557                                  if (iDirection) {                                  if (iDirection) {
558                                          bDirection += iDirection;                                          bDirection += iDirection;
559                                          start_x = currMV->x;                                  x = data->currentMV->x; y = data->currentMV->y;
                                         start_y = currMV->y;  
560                                  }                                  }
561                          } else                          //about to quit, eh? not so fast....                  } else {                                //about to quit, eh? not so fast....
                         {  
562                                  switch (bDirection) {                                  switch (bDirection) {
563                                  case 2:                                  case 2:
564                                          CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
565                                                                                          start_y - iDiamondSize, 2 + 4);                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                         CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                         start_y + iDiamondSize, 2 + 8);  
566                                          break;                                          break;
567                                  case 1:                                  case 1:
568                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
569                                                                                          start_y - iDiamondSize, 1 + 4);                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                         CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                         start_y + iDiamondSize, 1 + 8);  
570                                          break;                                          break;
571                                  case 2 + 4:                                  case 2 + 4:
572                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
573                                                                                          start_y - iDiamondSize, 1 + 4);                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
574                                          CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                                                                         start_y - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                         start_y + iDiamondSize, 2 + 8);  
575                                          break;                                          break;
576                                  case 4:                                  case 4:
577                                          CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
578                                                                                          start_y - iDiamondSize, 2 + 4);                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
                                         CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                         start_y - iDiamondSize, 1 + 4);  
579                                          break;                                          break;
580                                  case 8:                                  case 8:
581                                          CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
582                                                                                          start_y + iDiamondSize, 2 + 8);                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                         CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                         start_y + iDiamondSize, 1 + 8);  
583                                          break;                                          break;
584                                  case 1 + 4:                                  case 1 + 4:
585                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
586                                                                                          start_y + iDiamondSize, 1 + 8);                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
587                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
                                                                                         start_y - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                         start_y - iDiamondSize, 2 + 4);  
588                                          break;                                          break;
589                                  case 2 + 8:                                  case 2 + 8:
590                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
591                                                                                          start_y - iDiamondSize, 1 + 4);                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
592                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                                                                         start_y + iDiamondSize, 1 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                         start_y + iDiamondSize, 2 + 8);  
593                                          break;                                          break;
594                                  case 1 + 8:                                  case 1 + 8:
595                                          CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
596                                                                                          start_y - iDiamondSize, 2 + 4);                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
597                                          CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                                                                         start_y + iDiamondSize, 2 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,  
                                                                                         start_y + iDiamondSize, 1 + 8);  
598                                          break;                                          break;
599                                  default:                //1+2+4+8 == we didn't find anything at all                                  default:                //1+2+4+8 == we didn't find anything at all
600                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
601                                                                                          start_y - iDiamondSize, 1 + 4);                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
602                                          CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
603                                                                                          start_y + iDiamondSize, 1 + 8);                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                         CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                         start_y - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,  
                                                                                         start_y + iDiamondSize, 2 + 8);  
604                                          break;                                          break;
605                                  }                                  }
606                                  if (!(iDirection))                          if (!iDirection) break;         //ok, the end. really
                                         break;          //ok, the end. really  
                                 else {  
607                                          bDirection = iDirection;                                          bDirection = iDirection;
608                                          start_x = currMV->x;                          x = data->currentMV->x; y = data->currentMV->y;
                                         start_y = currMV->y;  
                                 }  
609                          }                          }
610                  }                  }
                 while (1);                              //forever  
611          }          }
         return iMinSAD;  
 }  
   
612    
613  int32_t  static void
614  Full8_MainSearch(const uint8_t * const pRef,  SquareSearch(int x, int y, const SearchData * const data, int bDirection)
                                  const uint8_t * const pRefH,  
                                  const uint8_t * const pRefV,  
                                  const uint8_t * const pRefHV,  
                                  const uint8_t * const cur,  
                                  const int x,  
                                  const int y,  
                            const int start_x,  
                            const int start_y,  
                            int iMinSAD,  
                            VECTOR * const currMV,  
                            const int center_x,  
                            const int center_y,  
                                  const int32_t min_dx,  
                                  const int32_t max_dx,  
                                  const int32_t min_dy,  
                                  const int32_t max_dy,  
                                  const int32_t iEdgedWidth,  
                                  const int32_t iDiamondSize,  
                                  const int32_t iFcode,  
                                  const int32_t iQuant,  
                                  int iFound)  
615  {  {
616          int32_t iSAD;          int iDirection;
         int32_t dx, dy;  
         VECTOR backupMV;  
   
         backupMV.x = start_x;  
         backupMV.y = start_y;  
   
         for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)  
                 for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)  
                         NOCHECK_MV8_CANDIDATE(dx, dy);  
   
         return iMinSAD;  
 }  
   
 Halfpel8_RefineFuncPtr Halfpel8_Refine;  
   
 int32_t  
 Halfpel16_Refine(const uint8_t * const pRef,  
                                  const uint8_t * const pRefH,  
                                  const uint8_t * const pRefV,  
                                  const uint8_t * const pRefHV,  
                                  const uint8_t * const cur,  
                                  const int x,  
                                  const int y,  
                                  VECTOR * const currMV,  
                                  int32_t iMinSAD,  
                            const int center_x,  
                            const int center_y,  
                                  const int32_t min_dx,  
                                  const int32_t max_dx,  
                                  const int32_t min_dy,  
                                  const int32_t max_dy,  
                                  const int32_t iFcode,  
                                  const int32_t iQuant,  
                                  const int32_t iEdgedWidth)  
 {  
 /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */  
   
         int32_t iSAD;  
         VECTOR backupMV = *currMV;  
   
         CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y - 1);  
         CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y - 1);  
         CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y - 1);  
         CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y);  
         CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y);  
         CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y + 1);  
         CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y + 1);  
         CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y + 1);  
617    
618          return iMinSAD;          do {
619  }                  iDirection = 0;
620                    if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1+16+64);
621  #define PMV_HALFPEL16 (PMV_HALFPELDIAMOND16|PMV_HALFPELREFINE16)                  if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2+32+128);
622                    if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4+16+32);
623                    if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8+64+128);
624                    if (bDirection & 16) CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1+4+16+32+64);
625  int32_t                  if (bDirection & 32) CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2+4+16+32+128);
626  PMVfastSearch16(const uint8_t * const pRef,                  if (bDirection & 64) CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1+8+16+64+128);
627                                  const uint8_t * const pRefH,                  if (bDirection & 128) CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2+8+32+64+128);
                                 const uint8_t * const pRefV,  
                                 const uint8_t * const pRefHV,  
                                 const IMAGE * const pCur,  
                                 const int x,  
                                 const int y,  
                                 const int start_x,  
                                 const int start_y,  
                                 const int center_x,  
                                 const int center_y,  
                                 const uint32_t MotionFlags,  
                                 const uint32_t iQuant,  
                                 const uint32_t iFcode,  
                                 const MBParam * const pParam,  
                                 const MACROBLOCK * const pMBs,  
                                 const MACROBLOCK * const prevMBs,  
                                 VECTOR * const currMV,  
                                 VECTOR * const currPMV)  
 {  
         const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
   
         const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;  
   
         int32_t iDiamondSize;  
   
         int32_t min_dx;  
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
   
         int32_t iFound;  
   
         VECTOR newMV;  
         VECTOR backupMV;                        /* just for PMVFAST */  
   
         VECTOR pmv[4];  
         int32_t psad[4];  
   
         MainSearch16FuncPtr MainSearchPtr;  
   
         const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;  
   
         int32_t threshA, threshB;  
         int32_t bPredEq;  
         int32_t iMinSAD, iSAD;  
   
 /* Get maximum range */  
         get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,  
                           iFcode);  
   
 /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */  
   
         if (!(MotionFlags & PMV_HALFPEL16)) {  
                 min_dx = EVEN(min_dx);  
                 max_dx = EVEN(max_dx);  
                 min_dy = EVEN(min_dy);  
                 max_dy = EVEN(max_dy);  
         }  
   
         /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  
         //bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);  
         bPredEq = get_pmvdata2(pMBs, iWcount, 0, x, y, 0, pmv, psad);  
   
         if ((x == 0) && (y == 0)) {  
                 threshA = 512;  
                 threshB = 1024;  
         } else {  
                 threshA = psad[0];  
                 threshB = threshA + 256;  
                 if (threshA < 512)  
                         threshA = 512;  
                 if (threshA > 1024)  
                         threshA = 1024;  
                 if (threshB > 1792)  
                         threshB = 1792;  
         }  
   
         iFound = 0;  
   
 /* Step 4: Calculate SAD around the Median prediction.  
    MinSAD=SAD  
    If Motion Vector equal to Previous frame motion vector  
    and MinSAD<PrevFrmSAD goto Step 10.  
    If SAD<=256 goto Step 10.  
 */  
   
         currMV->x = start_x;  
         currMV->y = start_y;  
   
         if (!(MotionFlags & PMV_HALFPEL16)) {   /* This should NOT be necessary! */  
                 currMV->x = EVEN(currMV->x);  
                 currMV->y = EVEN(currMV->y);  
         }  
628    
629          if (currMV->x > max_dx) {                  bDirection = iDirection;
630                  currMV->x = max_dx;                  x = data->currentMV->x; y = data->currentMV->y;
631          }          } while (iDirection);
         if (currMV->x < min_dx) {  
                 currMV->x = min_dx;  
         }  
         if (currMV->y > max_dy) {  
                 currMV->y = max_dy;  
         }  
         if (currMV->y < min_dy) {  
                 currMV->y = min_dy;  
632          }          }
633    
634          iMinSAD =  static void
635                  sad16(cur,  DiamondSearch(int x, int y, const SearchData * const data, int bDirection)
                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,  
                                                  iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);  
         iMinSAD +=  
                 calc_delta_16(currMV->x - center_x, currMV->y - center_y,  
                                           (uint8_t) iFcode, iQuant);  
   
         if ((iMinSAD < 256) ||  
                 ((MVequal(*currMV, prevMB->mvs[0])) &&  
                  ((int32_t) iMinSAD < prevMB->sad16))) {  
                 if (iMinSAD < 2 * iQuant)       // high chances for SKIP-mode  
636                  {                  {
                         if (!MVzero(*currMV)) {  
                                 iMinSAD += MV16_00_BIAS;  
                                 CHECK_MV16_ZERO;        // (0,0) saves space for letterboxed pictures  
                                 iMinSAD -= MV16_00_BIAS;  
                         }  
                 }  
   
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast16_Terminate_with_Refine;  
         }  
   
   
 /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  
    vector of the median.  
    If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2  
 */  
   
         if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[0])))  
                 iFound = 2;  
   
 /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.  
    Otherwise select large Diamond Search.  
 */  
   
         if ((!MVzero(pmv[0])) || (threshB < 1536) || (bPredEq))  
                 iDiamondSize = 1;               // halfpel!  
         else  
                 iDiamondSize = 2;               // halfpel!  
   
         if (!(MotionFlags & PMV_HALFPELDIAMOND16))  
                 iDiamondSize *= 2;  
637    
638  /*  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
    Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  
    Also calculate (0,0) but do not subtract offset.  
    Let MinSAD be the smallest SAD up to this point.  
    If MV is (0,0) subtract offset.  
 */  
   
 // (0,0) is always possible  
   
         if (!MVzero(pmv[0]))  
                 CHECK_MV16_ZERO;  
   
 // previous frame MV is always possible  
   
         if (!MVzero(prevMB->mvs[0]))  
                 if (!MVequal(prevMB->mvs[0], pmv[0]))  
                         CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);  
   
 // left neighbour, if allowed  
   
         if (!MVzero(pmv[1]))  
                 if (!MVequal(pmv[1], prevMB->mvs[0]))  
                         if (!MVequal(pmv[1], pmv[0])) {  
                                 if (!(MotionFlags & PMV_HALFPEL16)) {  
                                         pmv[1].x = EVEN(pmv[1].x);  
                                         pmv[1].y = EVEN(pmv[1].y);  
                                 }  
   
                                 CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);  
                         }  
 // top neighbour, if allowed  
         if (!MVzero(pmv[2]))  
                 if (!MVequal(pmv[2], prevMB->mvs[0]))  
                         if (!MVequal(pmv[2], pmv[0]))  
                                 if (!MVequal(pmv[2], pmv[1])) {  
                                         if (!(MotionFlags & PMV_HALFPEL16)) {  
                                                 pmv[2].x = EVEN(pmv[2].x);  
                                                 pmv[2].y = EVEN(pmv[2].y);  
                                         }  
                                         CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);  
   
 // top right neighbour, if allowed  
                                         if (!MVzero(pmv[3]))  
                                                 if (!MVequal(pmv[3], prevMB->mvs[0]))  
                                                         if (!MVequal(pmv[3], pmv[0]))  
                                                                 if (!MVequal(pmv[3], pmv[1]))  
                                                                         if (!MVequal(pmv[3], pmv[2])) {  
                                                                                 if (!(MotionFlags & PMV_HALFPEL16)) {  
                                                                                         pmv[3].x = EVEN(pmv[3].x);  
                                                                                         pmv[3].y = EVEN(pmv[3].y);  
                                                                                 }  
                                                                                 CHECK_MV16_CANDIDATE(pmv[3].x,  
                                                                                                                          pmv[3].y);  
                                                                         }  
                                 }  
   
         if ((MVzero(*currMV)) &&  
                 (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )  
                 iMinSAD -= MV16_00_BIAS;  
   
   
 /* Step 6: If MinSAD <= thresa goto Step 10.  
    If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.  
 */  
   
         if ((iMinSAD <= threshA) ||  
                 (MVequal(*currMV, prevMB->mvs[0]) &&  
                  ((int32_t) iMinSAD < prevMB->sad16))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast16_Terminate_with_Refine;  
         }  
   
   
 /************ (Diamond Search)  **************/  
 /*  
    Step 7: Perform Diamond search, with either the small or large diamond.  
    If Found=2 only examine one Diamond pattern, and afterwards goto step 10  
    Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.  
    If center then goto step 10.  
    Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.  
    Refine by using small diamond and goto step 10.  
 */  
   
         if (MotionFlags & PMV_USESQUARES16)  
                 MainSearchPtr = Square16_MainSearch;  
         else if (MotionFlags & PMV_ADVANCEDDIAMOND16)  
                 MainSearchPtr = AdvDiamond16_MainSearch;  
         else  
                 MainSearchPtr = Diamond16_MainSearch;  
   
         backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  
   
   
 /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  
         iSAD =  
                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  
                                                   currMV->x, currMV->y, iMinSAD, &newMV, center_x, center_y,  
                                                   min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                   iQuant, iFound);  
   
         if (iSAD < iMinSAD) {  
                 *currMV = newMV;  
                 iMinSAD = iSAD;  
         }  
   
         if (MotionFlags & PMV_EXTSEARCH16) {  
 /* extended: search (up to) two more times: orignal prediction and (0,0) */  
639    
640                  if (!(MVequal(pmv[0], backupMV))) {          int iDirection;
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  
                                                                   center_x, center_y, iMinSAD, &newMV, center_x, center_y,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   iDiamondSize, iFcode, iQuant, iFound);  
641    
642                          if (iSAD < iMinSAD) {          do {
643                                  *currMV = newMV;                  iDirection = 0;
644                                  iMinSAD = iSAD;                  if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1);
645                          }                  if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2);
646                  }                  if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4);
647                    if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8);
648    
649                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {                  /* now we're doing diagonal checks near our candidate */
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  
                                                                   iMinSAD, &newMV, center_x, center_y,  
                                                                   min_dx, max_dx, min_dy, max_dy,  
                                                                   iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, iFound);  
650    
651                          if (iSAD < iMinSAD) {                  if (iDirection) {               //checking if anything found
652                                  *currMV = newMV;                          bDirection = iDirection;
653                                  iMinSAD = iSAD;                          iDirection = 0;
654                            x = data->currentMV->x; y = data->currentMV->y;
655                            if (bDirection & 3) {   //our candidate is left or right
656                                    CHECK_CANDIDATE(x, y + iDiamondSize, 8);
657                                    CHECK_CANDIDATE(x, y - iDiamondSize, 4);
658                            } else {                        // what remains here is up or down
659                                    CHECK_CANDIDATE(x + iDiamondSize, y, 2);
660                                    CHECK_CANDIDATE(x - iDiamondSize, y, 1);
661                          }                          }
662                            bDirection += iDirection;
663                            x = data->currentMV->x; y = data->currentMV->y;
664                  }                  }
665          }          }
666            while (iDirection);
 /*  
    Step 10:  The motion vector is chosen according to the block corresponding to MinSAD.  
 */  
   
   PMVfast16_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step  
                 iMinSAD =  
                         Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                          iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,  
                                                          iFcode, iQuant, iEdgedWidth);  
   
   PMVfast16_Terminate_without_Refine:  
         currPMV->x = currMV->x - center_x;  
         currPMV->y = currMV->y - center_y;  
         return iMinSAD;  
667  }  }
668    
669    /* MAINSEARCH FUNCTIONS END */
670    
671    /* HALFPELREFINE COULD BE A MAINSEARCH FUNCTION, BUT THERE IS NO NEED FOR IT */
672    
673    static void
674    SubpelRefine(const SearchData * const data)
   
 int32_t  
 Diamond8_MainSearch(const uint8_t * const pRef,  
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const uint8_t * const cur,  
                                         const int x,  
                                         const int y,  
                                         int32_t start_x,  
                                         int32_t start_y,  
                                         int32_t iMinSAD,  
                                         VECTOR * const currMV,  
                                    const int center_x,  
                                    const int center_y,  
                                         const int32_t min_dx,  
                                         const int32_t max_dx,  
                                         const int32_t min_dy,  
                                         const int32_t max_dy,  
                                         const int32_t iEdgedWidth,  
                                         const int32_t iDiamondSize,  
                                         const int32_t iFcode,  
                                         const int32_t iQuant,  
                                         int iFound)  
675  {  {
676  /* Do a diamond search around given starting point, return SAD of best */  /* Do a half-pel or q-pel refinement */
   
         int32_t iDirection = 0;  
         int32_t iSAD;  
677          VECTOR backupMV;          VECTOR backupMV;
678            int iDirection; //not needed
679    
680          backupMV.x = start_x;          if (data->qpel_precision)
681          backupMV.y = start_y;                  backupMV = *(data->currentQMV);
682            else backupMV = *(data->currentMV);
683  /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  
684            CHECK_CANDIDATE(backupMV.x, backupMV.y - 1, 0);
685          CHECK_MV8_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);          CHECK_CANDIDATE(backupMV.x + 1, backupMV.y - 1, 0);
686          CHECK_MV8_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);          CHECK_CANDIDATE(backupMV.x + 1, backupMV.y, 0);
687          CHECK_MV8_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);          CHECK_CANDIDATE(backupMV.x + 1, backupMV.y + 1, 0);
688          CHECK_MV8_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);          CHECK_CANDIDATE(backupMV.x, backupMV.y + 1, 0);
689            CHECK_CANDIDATE(backupMV.x - 1, backupMV.y + 1, 0);
690          if (iDirection)          CHECK_CANDIDATE(backupMV.x - 1, backupMV.y, 0);
691                  while (!iFound) {          CHECK_CANDIDATE(backupMV.x - 1, backupMV.y - 1, 0);
                         iFound = 1;  
                         backupMV = *currMV;     // since iDirection!=0, this is well defined!  
   
                         if (iDirection != 2)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x - iDiamondSize,  
                                                                                   backupMV.y, 1);  
                         if (iDirection != 1)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x + iDiamondSize,  
                                                                                   backupMV.y, 2);  
                         if (iDirection != 4)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x,  
                                                                                   backupMV.y - iDiamondSize, 3);  
                         if (iDirection != 3)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x,  
                                                                                   backupMV.y + iDiamondSize, 4);  
         } else {  
                 currMV->x = start_x;  
                 currMV->y = start_y;  
         }  
         return iMinSAD;  
692  }  }
693    
694  int32_t  static __inline int
695  Halfpel8_Refine_c(const uint8_t * const pRef,  SkipDecisionP(const IMAGE * current, const IMAGE * reference,
696                                  const uint8_t * const pRefH,                                                          const int x, const int y,
697                                  const uint8_t * const pRefV,                                                          const uint32_t iEdgedWidth, const uint32_t iQuant, int rrv)
                                 const uint8_t * const pRefHV,  
                                 const uint8_t * const cur,  
                                 const int x,  
                                 const int y,  
                                 VECTOR * const currMV,  
                                 int32_t iMinSAD,  
                            const int center_x,  
                            const int center_y,  
                                 const int32_t min_dx,  
                                 const int32_t max_dx,  
                                 const int32_t min_dy,  
                                 const int32_t max_dy,  
                                 const int32_t iFcode,  
                                 const int32_t iQuant,  
                                 const int32_t iEdgedWidth)  
 {  
 /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */  
   
         int32_t iSAD;  
         VECTOR backupMV = *currMV;  
   
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y - 1);  
         CHECK_MV8_CANDIDATE(backupMV.x, backupMV.y - 1);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y - 1);  
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y);  
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y + 1);  
         CHECK_MV8_CANDIDATE(backupMV.x, backupMV.y + 1);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y + 1);  
   
         return iMinSAD;  
 }  
   
   
 #define PMV_HALFPEL8 (PMV_HALFPELDIAMOND8|PMV_HALFPELREFINE8)  
698    
 int32_t  
 PMVfastSearch8(const uint8_t * const pRef,  
                            const uint8_t * const pRefH,  
                            const uint8_t * const pRefV,  
                            const uint8_t * const pRefHV,  
                            const IMAGE * const pCur,  
                            const int x,  
                            const int y,  
                            const int start_x,  
                            const int start_y,  
                                 const int center_x,  
                                 const int center_y,  
                            const uint32_t MotionFlags,  
                            const uint32_t iQuant,  
                            const uint32_t iFcode,  
                            const MBParam * const pParam,  
                            const MACROBLOCK * const pMBs,  
                            const MACROBLOCK * const prevMBs,  
                            VECTOR * const currMV,  
                            VECTOR * const currPMV)  
699  {  {
700          const uint32_t iWcount = pParam->mb_width;  /*      keep repeating checks for all b-frames before this P frame,
701          const int32_t iWidth = pParam->width;          to make sure that SKIP is possible (todo)
702          const int32_t iHeight = pParam->height;          how: if skip is not possible set sad00 to a very high value */
703          const int32_t iEdgedWidth = pParam->edged_width;          if(rrv) {
704                    uint32_t sadC = sad16(current->u + x*16 + y*(iEdgedWidth/2)*16,
705          const uint8_t *cur = pCur->y + x * 8 + y * 8 * iEdgedWidth;                                                  reference->u + x*16 + y*(iEdgedWidth/2)*16, iEdgedWidth/2, 256*4096);
706                    if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP*4) return 0;
707          int32_t iDiamondSize;                  sadC += sad16(current->v + (x + y*(iEdgedWidth/2))*16,
708                                                    reference->v + (x + y*(iEdgedWidth/2))*16, iEdgedWidth/2, 256*4096);
709          int32_t min_dx;                  if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP*4) return 0;
710          int32_t max_dx;                  return 1;
         int32_t min_dy;  
         int32_t max_dy;  
   
         VECTOR pmv[4];  
         int32_t psad[4];  
         VECTOR newMV;  
         VECTOR backupMV;  
         VECTOR startMV;  
   
 //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;  
         const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;  
   
          int32_t threshA, threshB;  
         int32_t iFound, bPredEq;  
         int32_t iMinSAD, iSAD;  
   
         int32_t iSubBlock = (y & 1) + (y & 1) + (x & 1);  
   
         MainSearch8FuncPtr MainSearchPtr;  
   
         /* Init variables */  
         startMV.x = start_x;  
         startMV.y = start_y;  
   
         /* Get maximum range */  
         get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,  
                           iFcode);  
   
         if (!(MotionFlags & PMV_HALFPELDIAMOND8)) {  
                 min_dx = EVEN(min_dx);  
                 max_dx = EVEN(max_dx);  
                 min_dy = EVEN(min_dy);  
                 max_dy = EVEN(max_dy);  
         }  
   
         /* because we might use IF (dx>max_dx) THEN dx=max_dx; */  
         //bPredEq = get_pmvdata(pMBs, (x >> 1), (y >> 1), iWcount, iSubBlock, pmv, psad);  
         bPredEq = get_pmvdata2(pMBs, iWcount, 0, (x >> 1), (y >> 1), iSubBlock, pmv, psad);  
   
         if ((x == 0) && (y == 0)) {  
                 threshA = 512 / 4;  
                 threshB = 1024 / 4;  
   
711          } else {          } else {
712                  threshA = psad[0] / 4;  /* good estimate? */                  uint32_t sadC = sad8(current->u + x*8 + y*(iEdgedWidth/2)*8,
713                  threshB = threshA + 256 / 4;                                                  reference->u + x*8 + y*(iEdgedWidth/2)*8, iEdgedWidth/2);
714                  if (threshA < 512 / 4)                  if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP) return 0;
715                          threshA = 512 / 4;                  sadC += sad8(current->v + (x + y*(iEdgedWidth/2))*8,
716                  if (threshA > 1024 / 4)                                                  reference->v + (x + y*(iEdgedWidth/2))*8, iEdgedWidth/2);
717                          threshA = 1024 / 4;                  if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP) return 0;
718                  if (threshB > 1792 / 4)                  return 1;
                         threshB = 1792 / 4;  
         }  
   
         iFound = 0;  
   
 /* Step 4: Calculate SAD around the Median prediction.  
    MinSAD=SAD  
    If Motion Vector equal to Previous frame motion vector  
    and MinSAD<PrevFrmSAD goto Step 10.  
    If SAD<=256 goto Step 10.  
 */  
   
   
 // Prepare for main loop  
   
 //  if (MotionFlags & PMV_USESQUARES8)  
 //      MainSearchPtr = Square8_MainSearch;  
 //  else  
   
         if (MotionFlags & PMV_ADVANCEDDIAMOND8)  
                 MainSearchPtr = AdvDiamond8_MainSearch;  
         else  
                 MainSearchPtr = Diamond8_MainSearch;  
   
   
         *currMV = startMV;  
   
         iMinSAD =  
                 sad8(cur,  
                          get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,  
                                                 iEdgedWidth), iEdgedWidth);  
         iMinSAD +=  
                 calc_delta_8(currMV->x - center_x, currMV->y - center_y,  
                                          (uint8_t) iFcode, iQuant);  
   
         if ((iMinSAD < 256 / 4) || ((MVequal(*currMV, prevMB->mvs[iSubBlock]))  
                                                                 && ((int32_t) iMinSAD <  
                                                                         prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
   
 /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  
    vector of the median.  
    If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2  
 */  
   
         if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[iSubBlock])))  
                 iFound = 2;  
   
 /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.  
    Otherwise select large Diamond Search.  
 */  
   
         if ((!MVzero(pmv[0])) || (threshB < 1536 / 4) || (bPredEq))  
                 iDiamondSize = 1;               // 1 halfpel!  
         else  
                 iDiamondSize = 2;               // 2 halfpel = 1 full pixel!  
   
         if (!(MotionFlags & PMV_HALFPELDIAMOND8))  
                 iDiamondSize *= 2;  
   
   
 /*  
    Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  
    Also calculate (0,0) but do not subtract offset.  
    Let MinSAD be the smallest SAD up to this point.  
    If MV is (0,0) subtract offset.  
 */  
   
 // the median prediction might be even better than mv16  
   
         if (!MVequal(pmv[0], startMV))  
                 CHECK_MV8_CANDIDATE(center_x, center_y);  
   
 // (0,0) if needed  
         if (!MVzero(pmv[0]))  
                 if (!MVzero(startMV))  
                         CHECK_MV8_ZERO;  
   
 // previous frame MV if needed  
         if (!MVzero(prevMB->mvs[iSubBlock]))  
                 if (!MVequal(prevMB->mvs[iSubBlock], startMV))  
                         if (!MVequal(prevMB->mvs[iSubBlock], pmv[0]))  
                                 CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x,  
                                                                         prevMB->mvs[iSubBlock].y);  
   
         if ((iMinSAD <= threshA) ||  
                 (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&  
                  ((int32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
   
 // left neighbour, if allowed and needed  
         if (!MVzero(pmv[1]))  
                 if (!MVequal(pmv[1], startMV))  
                         if (!MVequal(pmv[1], prevMB->mvs[iSubBlock]))  
                                 if (!MVequal(pmv[1], pmv[0])) {  
                                         if (!(MotionFlags & PMV_HALFPEL8)) {  
                                                 pmv[1].x = EVEN(pmv[1].x);  
                                                 pmv[1].y = EVEN(pmv[1].y);  
                                         }  
                                         CHECK_MV8_CANDIDATE(pmv[1].x, pmv[1].y);  
                                 }  
 // top neighbour, if allowed and needed  
         if (!MVzero(pmv[2]))  
                 if (!MVequal(pmv[2], startMV))  
                         if (!MVequal(pmv[2], prevMB->mvs[iSubBlock]))  
                                 if (!MVequal(pmv[2], pmv[0]))  
                                         if (!MVequal(pmv[2], pmv[1])) {  
                                                 if (!(MotionFlags & PMV_HALFPEL8)) {  
                                                         pmv[2].x = EVEN(pmv[2].x);  
                                                         pmv[2].y = EVEN(pmv[2].y);  
                                                 }  
                                                 CHECK_MV8_CANDIDATE(pmv[2].x, pmv[2].y);  
   
 // top right neighbour, if allowed and needed  
                                                 if (!MVzero(pmv[3]))  
                                                         if (!MVequal(pmv[3], startMV))  
                                                                 if (!MVequal(pmv[3], prevMB->mvs[iSubBlock]))  
                                                                         if (!MVequal(pmv[3], pmv[0]))  
                                                                                 if (!MVequal(pmv[3], pmv[1]))  
                                                                                         if (!MVequal(pmv[3], pmv[2])) {  
                                                                                                 if (!  
                                                                                                         (MotionFlags &  
                                                                                                          PMV_HALFPEL8)) {  
                                                                                                         pmv[3].x = EVEN(pmv[3].x);  
                                                                                                         pmv[3].y = EVEN(pmv[3].y);  
                                                                                                 }  
                                                                                                 CHECK_MV8_CANDIDATE(pmv[3].x,  
                                                                                                                                         pmv[3].y);  
                                                                                         }  
                                         }  
   
         if ((MVzero(*currMV)) &&  
                 (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )  
                 iMinSAD -= MV8_00_BIAS;  
   
   
 /* Step 6: If MinSAD <= thresa goto Step 10.  
    If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.  
 */  
   
         if ((iMinSAD <= threshA) ||  
                 (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&  
                  ((int32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
   
 /************ (Diamond Search)  **************/  
 /*  
    Step 7: Perform Diamond search, with either the small or large diamond.  
    If Found=2 only examine one Diamond pattern, and afterwards goto step 10  
    Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.  
    If center then goto step 10.  
    Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.  
    Refine by using small diamond and goto step 10.  
 */  
   
         backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  
   
 /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  
         iSAD =  
                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  
                                                   currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                   iQuant, iFound);  
   
         if (iSAD < iMinSAD) {  
                 *currMV = newMV;  
                 iMinSAD = iSAD;  
         }  
   
         if (MotionFlags & PMV_EXTSEARCH8) {  
 /* extended: search (up to) two more times: orignal prediction and (0,0) */  
   
                 if (!(MVequal(pmv[0], backupMV))) {  
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  
                                                                   pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   iDiamondSize, iFcode, iQuant, iFound);  
   
                         if (iSAD < iMinSAD) {  
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
                 }  
   
                 if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {  
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  
                                                                   iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, iFound);  
   
                         if (iSAD < iMinSAD) {  
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
                 }  
719          }          }
   
 /* Step 10: The motion vector is chosen according to the block corresponding to MinSAD.  
    By performing an optional local half-pixel search, we can refine this result even further.  
 */  
   
   PMVfast8_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE8)   // perform final half-pel step  
                 iMinSAD =  
                         Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                         iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,  
                                                         iFcode, iQuant, iEdgedWidth);  
   
   
   PMVfast8_Terminate_without_Refine:  
         currPMV->x = currMV->x - center_x;  
         currPMV->y = currMV->y - center_y;  
   
         return iMinSAD;  
720  }  }
721    
722  int32_t  static __inline void
723  EPZSSearch16(const uint8_t * const pRef,  SkipMacroblockP(MACROBLOCK *pMB, const int32_t sad)
                          const uint8_t * const pRefH,  
                          const uint8_t * const pRefV,  
                          const uint8_t * const pRefHV,  
                          const IMAGE * const pCur,  
                          const int x,  
                          const int y,  
                         const int start_x,  
                         const int start_y,  
                         const int center_x,  
                         const int center_y,  
                          const uint32_t MotionFlags,  
                          const uint32_t iQuant,  
                          const uint32_t iFcode,  
                          const MBParam * const pParam,  
                          const MACROBLOCK * const pMBs,  
                          const MACROBLOCK * const prevMBs,  
                          VECTOR * const currMV,  
                          VECTOR * const currPMV)  
724  {  {
725          const uint32_t iWcount = pParam->mb_width;          pMB->mode = MODE_NOT_CODED;
726          const uint32_t iHcount = pParam->mb_height;          pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = 0;
727            pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = 0;
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
   
         const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;  
   
         int32_t min_dx;  
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
   
         VECTOR newMV;  
         VECTOR backupMV;  
   
         VECTOR pmv[4];  
         int32_t psad[8];  
728    
729          static MACROBLOCK *oldMBs = NULL;          pMB->qmvs[0].x = pMB->qmvs[1].x = pMB->qmvs[2].x = pMB->qmvs[3].x = 0;
730            pMB->qmvs[0].y = pMB->qmvs[1].y = pMB->qmvs[2].y = pMB->qmvs[3].y = 0;
731    
732  //  const MACROBLOCK * const pMB = pMBs + x + y * iWcount;          pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = sad;
         const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;  
         MACROBLOCK *oldMB = NULL;  
   
          int32_t thresh2;  
         int32_t bPredEq;  
         int32_t iMinSAD, iSAD = 9999;  
   
         MainSearch16FuncPtr MainSearchPtr;  
   
         if (oldMBs == NULL) {  
                 oldMBs = (MACROBLOCK *) calloc(iWcount * iHcount, sizeof(MACROBLOCK));  
 //      fprintf(stderr,"allocated %d bytes for oldMBs\n",iWcount*iHcount*sizeof(MACROBLOCK));  
733          }          }
         oldMB = oldMBs + x + y * iWcount;  
   
 /* Get maximum range */  
         get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,  
                           iFcode);  
   
         if (!(MotionFlags & PMV_HALFPEL16)) {  
                 min_dx = EVEN(min_dx);  
                 max_dx = EVEN(max_dx);  
                 min_dy = EVEN(min_dy);  
                 max_dy = EVEN(max_dy);  
         }  
         /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  
         //bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);  
         bPredEq = get_pmvdata2(pMBs, iWcount, 0, x, y, 0, pmv, psad);  
   
 /* Step 4: Calculate SAD around the Median prediction.  
         MinSAD=SAD  
         If Motion Vector equal to Previous frame motion vector  
                 and MinSAD<PrevFrmSAD goto Step 10.  
         If SAD<=256 goto Step 10.  
 */  
734    
735  // Prepare for main loop  bool
736    MotionEstimation(MBParam * const pParam,
737          currMV->x = start_x;                                   FRAMEINFO * const current,
738          currMV->y = start_y;                                   FRAMEINFO * const reference,
739                                     const IMAGE * const pRefH,
740          if (!(MotionFlags & PMV_HALFPEL16)) {                                   const IMAGE * const pRefV,
741                  currMV->x = EVEN(currMV->x);                                   const IMAGE * const pRefHV,
742                  currMV->y = EVEN(currMV->y);                                   const uint32_t iLimit)
743          }  {
744            MACROBLOCK *const pMBs = current->mbs;
745          if (currMV->x > max_dx)          const IMAGE *const pCurrent = &current->image;
746                  currMV->x = max_dx;          const IMAGE *const pRef = &reference->image;
         if (currMV->x < min_dx)  
                 currMV->x = min_dx;  
         if (currMV->y > max_dy)  
                 currMV->y = max_dy;  
         if (currMV->y < min_dy)  
                 currMV->y = min_dy;  
   
 /***************** This is predictor SET A: only median prediction ******************/  
   
         iMinSAD =  
                 sad16(cur,  
                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,  
                                                  iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);  
         iMinSAD +=  
                 calc_delta_16(currMV->x - center_x, currMV->y - center_y,  
                                           (uint8_t) iFcode, iQuant);  
   
 // thresh1 is fixed to 256  
         if ((iMinSAD < 256) ||  
                 ((MVequal(*currMV, prevMB->mvs[0])) &&  
                  ((int32_t) iMinSAD < prevMB->sad16))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto EPZS16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto EPZS16_Terminate_with_Refine;  
         }  
   
 /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/  
   
 // previous frame MV  
         CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);  
   
 // set threshhold based on Min of Prediction and SAD of collocated block  
 // CHECK_MV16 always uses iSAD for the SAD of last vector to check, so now iSAD is what we want  
   
         if ((x == 0) && (y == 0)) {  
                 thresh2 = 512;  
         } else {  
 /* T_k = 1.2 * MIN(SAD_top,SAD_left,SAD_topleft,SAD_coll) +128;   [Tourapis, 2002] */  
   
                 thresh2 = MIN(psad[0], iSAD) * 6 / 5 + 128;  
         }  
   
 // MV=(0,0) is often a good choice  
747    
748          CHECK_MV16_ZERO;          const VECTOR zeroMV = { 0, 0 };
749    
750            uint32_t mb_width = pParam->mb_width;
751            uint32_t mb_height = pParam->mb_height;
752    
753  // left neighbour, if allowed          uint32_t x, y;
754          if (x != 0) {          uint32_t iIntra = 0;
755                  if (!(MotionFlags & PMV_HALFPEL16)) {          int32_t InterBias, quant = current->quant, sad00;
756                          pmv[1].x = EVEN(pmv[1].x);  
757                          pmv[1].y = EVEN(pmv[1].y);          // some pre-initialized thingies for SearchP
758                  }          int32_t temp[8];
759                  CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);          VECTOR currentMV[5];
760          }          VECTOR currentQMV[5];
761  // top neighbour, if allowed          int32_t iMinSAD[5];
762          if (y != 0) {          SearchData Data;
763                  if (!(MotionFlags & PMV_HALFPEL16)) {          memset(&Data, 0, sizeof(SearchData));
764                          pmv[2].x = EVEN(pmv[2].x);          Data.iEdgedWidth = pParam->edged_width;
765                          pmv[2].y = EVEN(pmv[2].y);          Data.currentMV = currentMV;
766            Data.currentQMV = currentQMV;
767            Data.iMinSAD = iMinSAD;
768            Data.temp = temp;
769            Data.iFcode = current->fcode;
770            Data.rounding = pParam->m_rounding_type;
771            Data.qpel = pParam->m_quarterpel;
772            Data.chroma = current->global_flags & XVID_ME_COLOUR;
773            Data.rrv = current->global_flags & XVID_REDUCED;
774    
775            if ((current->global_flags & XVID_REDUCED)) {
776                    mb_width = (pParam->width + 31) / 32;
777                    mb_height = (pParam->height + 31) / 32;
778                    Data.qpel = Data.chroma = 0;
779            }
780    
781            Data.RefQ = pRefV->u; // a good place, also used in MC (for similar purpose)
782            if (sadInit) (*sadInit) ();
783    
784            for (y = 0; y < mb_height; y++) {
785                    for (x = 0; x < mb_width; x++)  {
786                            MACROBLOCK *pMB = &pMBs[x + y * pParam->mb_width];
787    
788                            if (Data.rrv) pMB->sad16 =
789                                    sad32v_c(pCurrent->y + (x + y * pParam->edged_width) * 32,
790                                                            pRef->y + (x + y * pParam->edged_width) * 32,
791                                                            pParam->edged_width, pMB->sad8 );
792    
793                            else pMB->sad16 =
794                                    sad16v(pCurrent->y + (x + y * pParam->edged_width) * 16,
795                                                            pRef->y + (x + y * pParam->edged_width) * 16,
796                                                            pParam->edged_width, pMB->sad8 );
797    
798                            if (Data.chroma) {
799                                    pMB->sad16 += sad8(pCurrent->u + x*8 + y*(pParam->edged_width/2)*8,
800                                                                    pRef->u + x*8 + y*(pParam->edged_width/2)*8, pParam->edged_width/2);
801    
802                                    pMB->sad16 += sad8(pCurrent->v + (x + y*(pParam->edged_width/2))*8,
803                                                                    pRef->v + (x + y*(pParam->edged_width/2))*8, pParam->edged_width/2);
804                            }
805    
806                            sad00 = pMB->sad16; //if no gmc; else sad00 = (..)
807    
808                            if (!(current->global_flags & XVID_LUMIMASKING)) {
809                                    pMB->dquant = NO_CHANGE;
810                                    pMB->quant = current->quant;
811                            } else {
812                                    if (pMB->dquant != NO_CHANGE) {
813                                            quant += DQtab[pMB->dquant];
814                                            if (quant > 31) quant = 31;
815                                            else if (quant < 1) quant = 1;
816                                    }
817                                    pMB->quant = quant;
818                  }                  }
                 CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);  
819    
820  // top right neighbour, if allowed  //initial skip decision
821                  if ((uint32_t) x != (iWcount - 1)) {  /* no early skip for GMC (global vector = skip vector is unknown!)  */
822                          if (!(MotionFlags & PMV_HALFPEL16)) {                          if (current->coding_type == P_VOP)      { /* no fast SKIP for S(GMC)-VOPs */
823                                  pmv[3].x = EVEN(pmv[3].x);                                  if (pMB->dquant == NO_CHANGE && sad00 < pMB->quant * INITIAL_SKIP_THRESH  * (Data.rrv ? 4:1) )
824                                  pmv[3].y = EVEN(pmv[3].y);                                          if (Data.chroma || SkipDecisionP(pCurrent, pRef, x, y, pParam->edged_width, pMB->quant, Data.rrv)) {
825                          }                                                  SkipMacroblockP(pMB, sad00);
826                          CHECK_MV16_CANDIDATE(pmv[3].x, pmv[3].y);                                                  continue;
827                  }                  }
828          }          }
829    
830  /* Terminate if MinSAD <= T_2                          SearchP(pRef, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,
831     Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]                                                  y, current->motion_flags, pMB->quant,
832  */                                                  &Data, pParam, pMBs, reference->mbs,
833                                                    current->global_flags & XVID_INTER4V, pMB);
834          if ((iMinSAD <= thresh2)  
835                  || (MVequal(*currMV, prevMB->mvs[0]) &&  /* final skip decision, a.k.a. "the vector you found, really that good?" */
836                          ((int32_t) iMinSAD <= prevMB->sad16))) {                          if (current->coding_type == P_VOP)      {
837                  if (MotionFlags & PMV_QUICKSTOP16)                                  if ( (pMB->dquant == NO_CHANGE) && (sad00 < pMB->quant * MAX_SAD00_FOR_SKIP)
838                          goto EPZS16_Terminate_without_Refine;                                          && ((100*pMB->sad16)/(sad00+1) > FINAL_SKIP_THRESH * (Data.rrv ? 4:1)) )
839                  if (MotionFlags & PMV_EARLYSTOP16)                                          if (Data.chroma || SkipDecisionP(pCurrent, pRef, x, y, pParam->edged_width, pMB->quant, Data.rrv)) {
840                          goto EPZS16_Terminate_with_Refine;                                                  SkipMacroblockP(pMB, sad00);
841                                                    continue;
842                                            }
843          }          }
844    
845  /***** predictor SET C: acceleration MV (new!), neighbours in prev. frame(new!) ****/  /* finally, intra decision */
   
         backupMV = prevMB->mvs[0];      // collocated MV  
         backupMV.x += (prevMB->mvs[0].x - oldMB->mvs[0].x);     // acceleration X  
         backupMV.y += (prevMB->mvs[0].y - oldMB->mvs[0].y);     // acceleration Y  
   
         CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y);  
   
 // left neighbour  
         if (x != 0)  
                 CHECK_MV16_CANDIDATE((prevMB - 1)->mvs[0].x, (prevMB - 1)->mvs[0].y);  
846    
847  // top neighbour                          InterBias = MV16_INTER_BIAS;
848                            if (pMB->quant > 8)  InterBias += 100 * (pMB->quant - 8); // to make high quants work
849          if (y != 0)          if (y != 0)
850                  CHECK_MV16_CANDIDATE((prevMB - iWcount)->mvs[0].x,                                  if ((pMB - pParam->mb_width)->mode == MODE_INTRA ) InterBias -= 80;
851                                                           (prevMB - iWcount)->mvs[0].y);                          if (x != 0)
852                                    if ((pMB - 1)->mode == MODE_INTRA ) InterBias -= 80;
 // right neighbour, if allowed (this value is not written yet, so take it from   pMB->mvs  
853    
854          if ((uint32_t) x != iWcount - 1)                          if (Data.chroma) InterBias += 50; // to compensate bigger SAD
855                  CHECK_MV16_CANDIDATE((prevMB + 1)->mvs[0].x, (prevMB + 1)->mvs[0].y);                          if (Data.rrv) InterBias *= 4; //??
856    
857  // bottom neighbour, dito                          if (InterBias < pMB->sad16)  {
858          if ((uint32_t) y != iHcount - 1)                                  int32_t deviation;
859                  CHECK_MV16_CANDIDATE((prevMB + iWcount)->mvs[0].x,                                  if (Data.rrv) {
860                                                           (prevMB + iWcount)->mvs[0].y);                                          deviation = dev16(pCurrent->y + (x + y * pParam->edged_width) * 32,
861                                                                                    pParam->edged_width)
862                                                    + dev16(pCurrent->y + (x + y * pParam->edged_width) * 32 + 16,
863                                                                                    pParam->edged_width)
864                                                    + dev16(pCurrent->y + (x + y * pParam->edged_width) * 32 + 16 * pParam->edged_width,
865                                                                                    pParam->edged_width)
866                                                    + dev16(pCurrent->y + (x + y * pParam->edged_width) * 32 + 16 * (pParam->edged_width+1),
867                                                                                    pParam->edged_width);
868                                    } else
869                                            deviation = dev16(pCurrent->y + (x + y * pParam->edged_width) * 16,
870                                                      pParam->edged_width);
871    
872  /* Terminate if MinSAD <= T_3 (here T_3 = T_2)  */                                          if (deviation < (pMB->sad16 - InterBias)) {
873          if (iMinSAD <= thresh2) {                                          if (++iIntra >= iLimit) return 1;
874                  if (MotionFlags & PMV_QUICKSTOP16)                                          pMB->mode = MODE_INTRA;
875                          goto EPZS16_Terminate_without_Refine;                                          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] =
876                  if (MotionFlags & PMV_EARLYSTOP16)                                                          pMB->mvs[3] = zeroMV;
877                          goto EPZS16_Terminate_with_Refine;                                          pMB->qmvs[0] = pMB->qmvs[1] = pMB->qmvs[2] =
878                                                            pMB->qmvs[3] = zeroMV;
879                                            pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] =
880                                                    pMB->sad8[3] = 0;
881                                    }
882                            }
883                    }
884          }          }
885    
886  /************ (if Diamond Search)  **************/          if (current->coding_type == S_VOP)      /* first GMC step only for S(GMC)-VOPs */
887                    current->GMC_MV = GlobalMotionEst( pMBs, pParam, current->fcode );
         backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  
   
         if (MotionFlags & PMV_USESQUARES16)  
                 MainSearchPtr = Square16_MainSearch;  
         else  
          if (MotionFlags & PMV_ADVANCEDDIAMOND16)  
                 MainSearchPtr = AdvDiamond16_MainSearch;  
888          else          else
889                  MainSearchPtr = Diamond16_MainSearch;                  current->GMC_MV = zeroMV;
890    
891  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */          return 0;
   
         iSAD =  
                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  
                                                   currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);  
   
         if (iSAD < iMinSAD) {  
                 *currMV = newMV;  
                 iMinSAD = iSAD;  
892          }          }
893    
894    
895          if (MotionFlags & PMV_EXTSEARCH16) {  #define PMV_HALFPEL16 (PMV_HALFPELDIAMOND16|PMV_HALFPELREFINE16)
 /* extended mode: search (up to) two more times: orignal prediction and (0,0) */  
896    
897                  if (!(MVequal(pmv[0], backupMV))) {  static __inline int
898                          iSAD =  make_mask(const VECTOR * const pmv, const int i)
899                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  {
900                                                                    pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,          int mask = 255, j;
901                                                                    min_dx, max_dx, min_dy, max_dy, iEdgedWidth,          for (j = 0; j < i; j++) {
902                                                                    2, iFcode, iQuant, 0);                  if (MVequal(pmv[i], pmv[j])) return 0; // same vector has been checked already
903                    if (pmv[i].x == pmv[j].x) {
904                            if (pmv[i].y == pmv[j].y + iDiamondSize) { mask &= ~4; continue; }
905                            if (pmv[i].y == pmv[j].y - iDiamondSize) { mask &= ~8; continue; }
906                    } else
907                            if (pmv[i].y == pmv[j].y) {
908                                    if (pmv[i].x == pmv[j].x + iDiamondSize) { mask &= ~1; continue; }
909                                    if (pmv[i].x == pmv[j].x - iDiamondSize) { mask &= ~2; continue; }
910                  }                  }
911            }
912                  if (iSAD < iMinSAD) {          return mask;
                         *currMV = newMV;  
                         iMinSAD = iSAD;  
913                  }                  }
914    
915                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {  static __inline void
916                          iSAD =  PreparePredictionsP(VECTOR * const pmv, int x, int y, int iWcount,
917                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,                          int iHcount, const MACROBLOCK * const prevMB, int rrv)
918                                                                    iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,  {
                                                                   max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);  
919    
920                          if (iSAD < iMinSAD) {  //this function depends on get_pmvdata which means that it sucks. It should get the predictions by itself
921                                  *currMV = newMV;          if (rrv) { iWcount /= 2; iHcount /= 2; }
                                 iMinSAD = iSAD;  
                         }  
                 }  
         }  
922    
923  /***************        Choose best MV found     **************/          if ( (y != 0) && (x < (iWcount-1)) ) {          // [5] top-right neighbour
924                    pmv[5].x = EVEN(pmv[3].x);
925                    pmv[5].y = EVEN(pmv[3].y);
926            } else pmv[5].x = pmv[5].y = 0;
927    
928    EPZS16_Terminate_with_Refine:          if (x != 0) { pmv[3].x = EVEN(pmv[1].x); pmv[3].y = EVEN(pmv[1].y); }// pmv[3] is left neighbour
929          if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step          else pmv[3].x = pmv[3].y = 0;
                 iMinSAD =  
                         Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                          iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,  
                                                          iFcode, iQuant, iEdgedWidth);  
930    
931    EPZS16_Terminate_without_Refine:          if (y != 0) { pmv[4].x = EVEN(pmv[2].x); pmv[4].y = EVEN(pmv[2].y); }// [4] top neighbour
932        else pmv[4].x = pmv[4].y = 0;
933    
934          *oldMB = *prevMB;          // [1] median prediction
935            pmv[1].x = EVEN(pmv[0].x); pmv[1].y = EVEN(pmv[0].y);
936    
937          currPMV->x = currMV->x - center_x;          pmv[0].x = pmv[0].y = 0; // [0] is zero; not used in the loop (checked before) but needed here for make_mask
938          currPMV->y = currMV->y - center_y;  
939          return iMinSAD;          pmv[2].x = EVEN(prevMB->mvs[0].x); // [2] is last frame
940  }          pmv[2].y = EVEN(prevMB->mvs[0].y);
941    
942            if ((x < iWcount-1) && (y < iHcount-1)) {
943                    pmv[6].x = EVEN((prevMB+1+iWcount)->mvs[0].x); //[6] right-down neighbour in last frame
944                    pmv[6].y = EVEN((prevMB+1+iWcount)->mvs[0].y);
945            } else pmv[6].x = pmv[6].y = 0;
946    
947            if (rrv) {
948                    int i;
949                    for (i = 0; i < 7; i++) {
950                            pmv[i].x = RRV_MV_SCALEUP(pmv[i].x); // halfzero->halfpel
951                            pmv[i].y = RRV_MV_SCALEUP(pmv[i].y);
952                    }
953            }
954    }
955    
956  int32_t  static void
957  EPZSSearch8(const uint8_t * const pRef,  SearchP(const IMAGE * const pRef,
958                          const uint8_t * const pRefH,                          const uint8_t * const pRefH,
959                          const uint8_t * const pRefV,                          const uint8_t * const pRefV,
960                          const uint8_t * const pRefHV,                          const uint8_t * const pRefHV,
961                          const IMAGE * const pCur,                          const IMAGE * const pCur,
962                          const int x,                          const int x,
963                          const int y,                          const int y,
                         const int start_x,  
                         const int start_y,  
                         const int center_x,  
                         const int center_y,  
964                          const uint32_t MotionFlags,                          const uint32_t MotionFlags,
965                          const uint32_t iQuant,                          const uint32_t iQuant,
966                          const uint32_t iFcode,                  SearchData * const Data,
967                          const MBParam * const pParam,                          const MBParam * const pParam,
968                          const MACROBLOCK * const pMBs,                          const MACROBLOCK * const pMBs,
969                          const MACROBLOCK * const prevMBs,                          const MACROBLOCK * const prevMBs,
970                          VECTOR * const currMV,                  int inter4v,
971                          VECTOR * const currPMV)                  MACROBLOCK * const pMB)
972  {  {
 /* Please not that EPZS might not be a good choice for 8x8-block motion search ! */  
973    
974          const uint32_t iWcount = pParam->mb_width;          int i, iDirection = 255, mask, threshA;
975          const int32_t iWidth = pParam->width;          VECTOR pmv[7];
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
   
         const uint8_t *cur = pCur->y + x * 8 + y * 8 * iEdgedWidth;  
   
         int32_t iDiamondSize = 1;  
   
         int32_t min_dx;  
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
976    
977          VECTOR newMV;          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
978          VECTOR backupMV;                                                  pParam->width, pParam->height, Data->iFcode - Data->qpel, 0, Data->rrv);
979    
980          VECTOR pmv[4];          get_pmvdata2(pMBs, pParam->mb_width, 0, x, y, 0, pmv, Data->temp);  //has to be changed to get_pmv(2)()
         int32_t psad[8];  
981    
982          const int32_t iSubBlock = ((y & 1) << 1) + (x & 1);          Data->temp[5] = Data->temp[7] = 256*4096; // to reset chroma-sad cache
983            if (Data->rrv) i = 2; else i = 1;
984            Data->Cur = pCur->y + (x + y * Data->iEdgedWidth) * 16*i;
985            Data->CurV = pCur->v + (x + y * (Data->iEdgedWidth/2)) * 8*i;
986            Data->CurU = pCur->u + (x + y * (Data->iEdgedWidth/2)) * 8*i;
987    
988  //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;          Data->Ref = pRef->y + (x + Data->iEdgedWidth*y) * 16*i;
989          const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;          Data->RefH = pRefH + (x + Data->iEdgedWidth*y) * 16*i;
990            Data->RefV = pRefV + (x + Data->iEdgedWidth*y) * 16*i;
991            Data->RefHV = pRefHV + (x + Data->iEdgedWidth*y) * 16*i;
992            Data->RefCV = pRef->v + (x + y * (Data->iEdgedWidth/2)) * 8*i;
993            Data->RefCU = pRef->u + (x + y * (Data->iEdgedWidth/2)) * 8*i;
994    
995          int32_t bPredEq;          Data->lambda16 = lambda_vec16[iQuant];
996          int32_t iMinSAD, iSAD = 9999;          Data->lambda8 = lambda_vec8[iQuant];
997            Data->qpel_precision = 0;
998    
999          MainSearch8FuncPtr MainSearchPtr;          if (pMB->dquant != NO_CHANGE) inter4v = 0;
1000    
1001  /* Get maximum range */          for(i = 0;  i < 5; i++)
1002          get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,                  Data->currentMV[i].x = Data->currentMV[i].y = 0;
                           iFcode);  
1003    
1004  /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */          if (pParam->m_quarterpel) Data->predMV = get_qpmv2(pMBs, pParam->mb_width, 0, x, y, 0);
1005            else Data->predMV = pmv[0];
1006    
1007          if (!(MotionFlags & PMV_HALFPEL8)) {          i = d_mv_bits(0, 0, Data->predMV, Data->iFcode, 0, 0);
1008                  min_dx = EVEN(min_dx);          Data->iMinSAD[0] = pMB->sad16 + (Data->lambda16 * i * pMB->sad16)/1000;
1009                  max_dx = EVEN(max_dx);          Data->iMinSAD[1] = pMB->sad8[0] + (Data->lambda8 * i * (pMB->sad8[0]+NEIGH_8X8_BIAS))/100;
1010                  min_dy = EVEN(min_dy);          Data->iMinSAD[2] = pMB->sad8[1];
1011                  max_dy = EVEN(max_dy);          Data->iMinSAD[3] = pMB->sad8[2];
1012          }          Data->iMinSAD[4] = pMB->sad8[3];
         /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  
         //bPredEq = get_pmvdata(pMBs, x >> 1, y >> 1, iWcount, iSubBlock, pmv[0].x, pmv[0].y, psad);  
         bPredEq = get_pmvdata2(pMBs, iWcount, 0, x >> 1, y >> 1, iSubBlock, pmv, psad);  
1013    
1014            if ((x == 0) && (y == 0)) threshA = 512;
1015            else {
1016                    threshA = Data->temp[0]; // that's when we keep this SAD atm
1017                    if (threshA < 512) threshA = 512;
1018                    if (threshA > 1024) threshA = 1024; }
1019    
1020  /* Step 4: Calculate SAD around the Median prediction.          PreparePredictionsP(pmv, x, y, pParam->mb_width, pParam->mb_height,
1021          MinSAD=SAD                                          prevMBs + x + y * pParam->mb_width, Data->rrv);
         If Motion Vector equal to Previous frame motion vector  
                 and MinSAD<PrevFrmSAD goto Step 10.  
         If SAD<=256 goto Step 10.  
 */  
1022    
1023  // Prepare for main loop          if (Data->rrv) CheckCandidate = CheckCandidate32;
1024            else if (inter4v || Data->chroma) CheckCandidate = CheckCandidate16;
1025                    else CheckCandidate = CheckCandidate16no4v; //for extra speed
1026    
1027    /* main loop. checking all predictions */
1028    
1029          if (!(MotionFlags & PMV_HALFPEL8)) {          for (i = 1; i < 7; i++) {
1030                  currMV->x = EVEN(currMV->x);                  if (!(mask = make_mask(pmv, i)) ) continue;
1031                  currMV->y = EVEN(currMV->y);                  (*CheckCandidate)(pmv[i].x, pmv[i].y, mask, &iDirection, Data);
1032                    if (Data->iMinSAD[0] <= threshA) break;
1033          }          }
1034    
1035          if (currMV->x > max_dx)          if ((Data->iMinSAD[0] <= threshA) ||
1036                  currMV->x = max_dx;                          (MVequal(Data->currentMV[0], (prevMBs+x+y*pParam->mb_width)->mvs[0]) &&
1037          if (currMV->x < min_dx)                          (Data->iMinSAD[0] < (prevMBs+x+y*pParam->mb_width)->sad16))) {
1038                  currMV->x = min_dx;                  inter4v = 0;
1039          if (currMV->y > max_dy)          } else {
                 currMV->y = max_dy;  
         if (currMV->y < min_dy)  
                 currMV->y = min_dy;  
   
 /***************** This is predictor SET A: only median prediction ******************/  
   
   
         iMinSAD =  
                 sad8(cur,  
                          get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,  
                                                 iEdgedWidth), iEdgedWidth);  
         iMinSAD +=  
                 calc_delta_8(currMV->x - center_x, currMV->y - center_y,  
                                          (uint8_t) iFcode, iQuant);  
1040    
1041                    MainSearchFunc * MainSearchPtr;
1042                    if (MotionFlags & PMV_USESQUARES16) MainSearchPtr = SquareSearch;
1043                    else if (MotionFlags & PMV_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1044                            else MainSearchPtr = DiamondSearch;
1045    
1046                    (*MainSearchPtr)(Data->currentMV->x, Data->currentMV->y, Data, iDirection);
1047    
1048    /* extended search, diamond starting in 0,0 and in prediction.
1049            note that this search is/might be done in halfpel positions,
1050            which makes it more different than the diamond above */
1051    
1052  // thresh1 is fixed to 256                  if (MotionFlags & PMV_EXTSEARCH16) {
1053          if (iMinSAD < 256 / 4) {                          int32_t bSAD;
1054                  if (MotionFlags & PMV_QUICKSTOP8)                          VECTOR startMV = Data->predMV, backupMV = Data->currentMV[0];
1055                          goto EPZS8_Terminate_without_Refine;                          if (Data->rrv) {
1056                  if (MotionFlags & PMV_EARLYSTOP8)                                  startMV.x = RRV_MV_SCALEUP(startMV.x);
1057                          goto EPZS8_Terminate_with_Refine;                                  startMV.y = RRV_MV_SCALEUP(startMV.y);
1058                            } else
1059                                    if (!(MotionFlags & PMV_HALFPELREFINE16)) // who's gonna use extsearch and no halfpel?
1060                                            startMV.x = EVEN(startMV.x); startMV.y = EVEN(startMV.y);
1061                            if (!(MVequal(startMV, backupMV))) {
1062                                    bSAD = Data->iMinSAD[0]; Data->iMinSAD[0] = MV_MAX_ERROR;
1063    
1064                                    (*CheckCandidate)(startMV.x, startMV.y, 255, &iDirection, Data);
1065                                    (*MainSearchPtr)(startMV.x, startMV.y, Data, 255);
1066                                    if (bSAD < Data->iMinSAD[0]) {
1067                                            Data->currentMV[0] = backupMV;
1068                                            Data->iMinSAD[0] = bSAD; }
1069                            }
1070    
1071                            backupMV = Data->currentMV[0];
1072                            if (!MotionFlags & PMV_HALFPELREFINE16 || Data->rrv) startMV.x = startMV.y = 0;
1073                            else startMV.x = startMV.y = 1;
1074                            if (!(MVequal(startMV, backupMV))) {
1075                                    bSAD = Data->iMinSAD[0]; Data->iMinSAD[0] = MV_MAX_ERROR;
1076    
1077                                    (*CheckCandidate)(startMV.x, startMV.y, 255, &iDirection, Data);
1078                                    (*MainSearchPtr)(startMV.x, startMV.y, Data, 255);
1079                                    if (bSAD < Data->iMinSAD[0]) {
1080                                            Data->currentMV[0] = backupMV;
1081                                            Data->iMinSAD[0] = bSAD; }
1082                            }
1083                    }
1084            }
1085    
1086            if (MotionFlags & PMV_HALFPELREFINE16) SubpelRefine(Data);
1087    
1088            for(i = 0; i < 5; i++) {
1089                    Data->currentQMV[i].x = 2 * Data->currentMV[i].x; // initialize qpel vectors
1090                    Data->currentQMV[i].y = 2 * Data->currentMV[i].y;
1091            }
1092    
1093            if((Data->qpel) && (MotionFlags & PMV_QUARTERPELREFINE16)) {
1094    
1095                    Data->qpel_precision = 1;
1096                    get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
1097                                    pParam->width, pParam->height, Data->iFcode, 1, 0);
1098    
1099                    SubpelRefine(Data);
1100            }
1101    
1102            if (Data->iMinSAD[0] < (int32_t)iQuant * 30 ) inter4v = 0;
1103            if (inter4v) {
1104                    SearchData Data8;
1105                    Data8.iFcode = Data->iFcode;
1106                    Data8.lambda8 = Data->lambda8;
1107                    Data8.iEdgedWidth = Data->iEdgedWidth;
1108                    Data8.RefQ = Data->RefQ;
1109                    Data8.qpel = Data->qpel;
1110                    Data8.rrv = Data->rrv;
1111                    Search8(Data, 2*x, 2*y, MotionFlags, pParam, pMB, pMBs, 0, &Data8);
1112                    Search8(Data, 2*x + 1, 2*y, MotionFlags, pParam, pMB, pMBs, 1, &Data8);
1113                    Search8(Data, 2*x, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 2, &Data8);
1114                    Search8(Data, 2*x + 1, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 3, &Data8);
1115    
1116                    if (Data->chroma) {
1117                            int sumx, sumy;
1118    
1119                            if(pParam->m_quarterpel) {
1120                                    sumx = pMB->qmvs[0].x/2 + pMB->qmvs[1].x/2 + pMB->qmvs[2].x/2 + pMB->qmvs[3].x/2;
1121                                    sumy = pMB->qmvs[0].y/2 + pMB->qmvs[1].y/2 + pMB->qmvs[2].y/2 + pMB->qmvs[3].y/2;
1122                            } else {
1123                                    sumx = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
1124                                    sumy = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
1125          }          }
1126    
1127  /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/                          Data->iMinSAD[1] += ChromaSAD(  (sumx >> 3) + roundtab_76[sumx & 0xf],
1128                                                                                            (sumy >> 3) + roundtab_76[sumy & 0xf], Data);
1129                    }
1130            }
1131    
1132            if (Data->rrv) {
1133                            Data->currentMV[0].x = RRV_MV_SCALEDOWN(Data->currentMV[0].x);
1134                            Data->currentMV[0].y = RRV_MV_SCALEDOWN(Data->currentMV[0].y);
1135            }
1136    
1137  // MV=(0,0) is often a good choice          if (!(inter4v) ||
1138          CHECK_MV8_ZERO;                  (Data->iMinSAD[0] < Data->iMinSAD[1] + Data->iMinSAD[2] +
1139                            Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * (int32_t)iQuant )) {
1140    // INTER MODE
1141                    pMB->mode = MODE_INTER;
1142                    pMB->mvs[0] = pMB->mvs[1]
1143                            = pMB->mvs[2] = pMB->mvs[3] = Data->currentMV[0];
1144    
1145  // previous frame MV                  pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] =
1146          CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x, prevMB->mvs[iSubBlock].y);                          pMB->sad8[2] = pMB->sad8[3] =  Data->iMinSAD[0];
1147    
1148  // left neighbour, if allowed                  if(pParam->m_quarterpel) {
1149          if (psad[1] != MV_MAX_ERROR) {                          pMB->qmvs[0] = pMB->qmvs[1]
1150                  if (!(MotionFlags & PMV_HALFPEL8)) {                                  = pMB->qmvs[2] = pMB->qmvs[3] = Data->currentQMV[0];
1151                          pmv[1].x = EVEN(pmv[1].x);                          pMB->pmvs[0].x = Data->currentQMV[0].x - Data->predMV.x;
1152                          pmv[1].y = EVEN(pmv[1].y);                          pMB->pmvs[0].y = Data->currentQMV[0].y - Data->predMV.y;
1153                    } else {
1154                            pMB->pmvs[0].x = Data->currentMV[0].x - Data->predMV.x;
1155                            pMB->pmvs[0].y = Data->currentMV[0].y - Data->predMV.y;
1156                  }                  }
1157                  CHECK_MV8_CANDIDATE(pmv[1].x, pmv[1].y);          } else {
1158    // INTER4V MODE; all other things are already set in Search8
1159                    pMB->mode = MODE_INTER4V;
1160                    pMB->sad16 = Data->iMinSAD[1] + Data->iMinSAD[2] +
1161                            Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * iQuant;
1162          }          }
 // top neighbour, if allowed  
         if (psad[2] != MV_MAX_ERROR) {  
                 if (!(MotionFlags & PMV_HALFPEL8)) {  
                         pmv[2].x = EVEN(pmv[2].x);  
                         pmv[2].y = EVEN(pmv[2].y);  
1163                  }                  }
                 CHECK_MV8_CANDIDATE(pmv[2].x, pmv[2].y);  
1164    
1165  // top right neighbour, if allowed  static void
1166                  if (psad[3] != MV_MAX_ERROR) {  Search8(const SearchData * const OldData,
1167                          if (!(MotionFlags & PMV_HALFPEL8)) {                  const int x, const int y,
1168                                  pmv[3].x = EVEN(pmv[3].x);                  const uint32_t MotionFlags,
1169                                  pmv[3].y = EVEN(pmv[3].y);                  const MBParam * const pParam,
1170                          }                  MACROBLOCK * const pMB,
1171                          CHECK_MV8_CANDIDATE(pmv[3].x, pmv[3].y);                  const MACROBLOCK * const pMBs,
1172                    const int block,
1173                    SearchData * const Data)
1174    {
1175            int i = 0;
1176            Data->iMinSAD = OldData->iMinSAD + 1 + block;
1177            Data->currentMV = OldData->currentMV + 1 + block;
1178            Data->currentQMV = OldData->currentQMV + 1 + block;
1179    
1180            if(pParam->m_quarterpel) {
1181                    Data->predMV = get_qpmv2(pMBs, pParam->mb_width, 0, x/2, y/2, block);
1182                    if (block != 0) i = d_mv_bits(  Data->currentQMV->x, Data->currentQMV->y,
1183                                                                                    Data->predMV, Data->iFcode, 0, 0);
1184    
1185            } else {
1186                    Data->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x/2, y/2, block);
1187                    if (block != 0) {
1188                            if (block != 0) i = d_mv_bits(  Data->currentMV->x, Data->currentMV->y,
1189                                                                                            Data->predMV, Data->iFcode, 0, Data->rrv);
1190                  }                  }
1191          }          }
1192    
1193  /*  // this bias is zero anyway, at the moment!          *(Data->iMinSAD) += (Data->lambda8 * i * (*Data->iMinSAD + NEIGH_8X8_BIAS))/100;
1194    
1195          if ( (MVzero(*currMV)) && (!MVzero(pmv[0])) ) // && (iMinSAD <= iQuant * 96)          if (MotionFlags & (PMV_EXTSEARCH8|PMV_HALFPELREFINE8)) {
1196                  iMinSAD -= MV8_00_BIAS;                  if (Data->rrv) i = 2; else i = 1;
1197    
1198  */                  Data->Ref = OldData->Ref + i*8 * ((block&1) + pParam->edged_width*(block>>1));
1199                    Data->RefH = OldData->RefH + i*8 * ((block&1) + pParam->edged_width*(block>>1));
1200                    Data->RefV = OldData->RefV + i*8 * ((block&1) + pParam->edged_width*(block>>1));
1201                    Data->RefHV = OldData->RefHV + i*8 * ((block&1) + pParam->edged_width*(block>>1));
1202    
1203  /* Terminate if MinSAD <= T_2                  Data->Cur = OldData->Cur + i*8 * ((block&1) + pParam->edged_width*(block>>1));
1204     Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]                  Data->qpel_precision = 0;
 */  
1205    
1206          if (iMinSAD < 512 / 4) {        /* T_2 == 512/4 hardcoded */                  get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 8,
1207                  if (MotionFlags & PMV_QUICKSTOP8)                                          pParam->width, pParam->height, OldData->iFcode - Data->qpel, 0, Data->rrv);
                         goto EPZS8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP8)  
                         goto EPZS8_Terminate_with_Refine;  
         }  
   
 /************ (Diamond Search)  **************/  
1208    
1209          backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */                  if (Data->rrv) CheckCandidate = CheckCandidate16no4v;
1210                    else CheckCandidate = CheckCandidate8;
1211    
1212          if (!(MotionFlags & PMV_HALFPELDIAMOND8))                  if (MotionFlags & PMV_EXTSEARCH8) {
1213                  iDiamondSize *= 2;                          int32_t temp_sad = *(Data->iMinSAD); // store current MinSAD
   
 /* default: use best prediction as starting point for one call of EPZS_MainSearch */  
1214    
1215  // there is no EPZS^2 for inter4v at the moment                          MainSearchFunc *MainSearchPtr;
1216                            if (MotionFlags & PMV_USESQUARES8) MainSearchPtr = SquareSearch;
1217                                    else if (MotionFlags & PMV_ADVANCEDDIAMOND8) MainSearchPtr = AdvDiamondSearch;
1218                                            else MainSearchPtr = DiamondSearch;
1219    
1220  //  if (MotionFlags & PMV_USESQUARES8)                          (*MainSearchPtr)(Data->currentMV->x, Data->currentMV->y, Data, 255);
 //      MainSearchPtr = Square8_MainSearch;  
 //  else  
1221    
1222          if (MotionFlags & PMV_ADVANCEDDIAMOND8)                          if(*(Data->iMinSAD) < temp_sad) {
1223                  MainSearchPtr = AdvDiamond8_MainSearch;                                          Data->currentQMV->x = 2 * Data->currentMV->x; // update our qpel vector
1224          else                                          Data->currentQMV->y = 2 * Data->currentMV->y;
1225                  MainSearchPtr = Diamond8_MainSearch;                          }
1226                    }
1227    
1228          iSAD =                  if (MotionFlags & PMV_HALFPELREFINE8) {
1229                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,                          int32_t temp_sad = *(Data->iMinSAD); // store current MinSAD
                                                   currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                   iQuant, 0);  
1230    
1231                            SubpelRefine(Data); // perform halfpel refine of current best vector
1232    
1233          if (iSAD < iMinSAD) {                          if(*(Data->iMinSAD) < temp_sad) { // we have found a better match
1234                  *currMV = newMV;                                  Data->currentQMV->x = 2 * Data->currentMV->x; // update our qpel vector
1235                  iMinSAD = iSAD;                                  Data->currentQMV->y = 2 * Data->currentMV->y;
1236                            }
1237          }          }
1238    
1239          if (MotionFlags & PMV_EXTSEARCH8) {                  if(Data->qpel) {
1240  /* extended mode: search (up to) two more times: orignal prediction and (0,0) */                          if((!(Data->currentQMV->x & 1)) && (!(Data->currentQMV->y & 1)) &&
1241                                    (MotionFlags & PMV_QUARTERPELREFINE8)) {
1242                  if (!(MVequal(pmv[0], backupMV))) {                          Data->qpel_precision = 1;
1243                          iSAD =                          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 8,
1244                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,                                  pParam->width, pParam->height, OldData->iFcode, 1, 0);
1245                                                                    pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,                          SubpelRefine(Data);
1246                                                                    min_dx, max_dx, min_dy, max_dy, iEdgedWidth,                          }
                                                                   iDiamondSize, iFcode, iQuant, 0);  
   
                         if (iSAD < iMinSAD) {  
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
1247                          }                          }
1248                  }                  }
1249    
1250                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {          if (Data->rrv) {
1251                          iSAD =                          Data->currentMV->x = RRV_MV_SCALEDOWN(Data->currentMV->x);
1252                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,                          Data->currentMV->y = RRV_MV_SCALEDOWN(Data->currentMV->y);
1253                                                                    iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,          }
                                                                   max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, 0);  
1254    
1255                          if (iSAD < iMinSAD) {          if(Data->qpel) {
1256                                  *currMV = newMV;                  pMB->pmvs[block].x = Data->currentQMV->x - Data->predMV.x;
1257                                  iMinSAD = iSAD;                  pMB->pmvs[block].y = Data->currentQMV->y - Data->predMV.y;
1258                    pMB->qmvs[block] = *(Data->currentQMV);
1259            } else {
1260                    pMB->pmvs[block].x = Data->currentMV->x - Data->predMV.x;
1261                    pMB->pmvs[block].y = Data->currentMV->y - Data->predMV.y;
1262                          }                          }
1263    
1264            pMB->mvs[block] = *(Data->currentMV);
1265            pMB->sad8[block] =  4 * (*Data->iMinSAD);
1266                  }                  }
1267    
1268    /* B-frames code starts here */
1269    
1270    static __inline VECTOR
1271    ChoosePred(const MACROBLOCK * const pMB, const uint32_t mode)
1272    {
1273    /* the stupidiest function ever */
1274            if (mode == MODE_FORWARD) return pMB->mvs[0];
1275            else return pMB->b_mvs[0];
1276          }          }
1277    
1278  /***************        Choose best MV found     **************/  static void __inline
1279    PreparePredictionsBF(VECTOR * const pmv, const int x, const int y,
1280                                                            const uint32_t iWcount,
1281                                                            const MACROBLOCK * const pMB,
1282                                                            const uint32_t mode_curr)
1283    {
1284    
1285    EPZS8_Terminate_with_Refine:          // [0] is prediction
1286          if (MotionFlags & PMV_HALFPELREFINE8)   // perform final half-pel step          pmv[0].x = EVEN(pmv[0].x); pmv[0].y = EVEN(pmv[0].y);
                 iMinSAD =  
                         Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                         iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,  
                                                         iFcode, iQuant, iEdgedWidth);  
1287    
1288    EPZS8_Terminate_without_Refine:          pmv[1].x = pmv[1].y = 0; // [1] is zero
1289    
1290          currPMV->x = currMV->x - center_x;          pmv[2] = ChoosePred(pMB, mode_curr);
1291          currPMV->y = currMV->y - center_y;          pmv[2].x = EVEN(pmv[2].x); pmv[2].y = EVEN(pmv[2].y);
         return iMinSAD;  
 }  
1292    
1293            if ((y != 0)&&(x != (int)(iWcount+1))) {                        // [3] top-right neighbour
1294                    pmv[3] = ChoosePred(pMB+1-iWcount, mode_curr);
1295                    pmv[3].x = EVEN(pmv[3].x); pmv[3].y = EVEN(pmv[3].y);
1296            } else pmv[3].x = pmv[3].y = 0;
1297    
1298            if (y != 0) {
1299                    pmv[4] = ChoosePred(pMB-iWcount, mode_curr);
1300                    pmv[4].x = EVEN(pmv[4].x); pmv[4].y = EVEN(pmv[4].y);
1301            } else pmv[4].x = pmv[4].y = 0;
1302    
1303            if (x != 0) {
1304                    pmv[5] = ChoosePred(pMB-1, mode_curr);
1305                    pmv[5].x = EVEN(pmv[5].x); pmv[5].y = EVEN(pmv[5].y);
1306            } else pmv[5].x = pmv[5].y = 0;
1307    
1308            if ((x != 0)&&(y != 0)) {
1309                    pmv[6] = ChoosePred(pMB-1-iWcount, mode_curr);
1310                    pmv[6].x = EVEN(pmv[6].x); pmv[6].y = EVEN(pmv[6].y);
1311            } else pmv[6].x = pmv[6].y = 0;
1312    
1313  int32_t  // more?
1314  PMVfastIntSearch16(const uint8_t * const pRef,  }
1315    
1316    
1317    /* search backward or forward, for b-frames */
1318    static void
1319    SearchBF(       const uint8_t * const pRef,
1320                                  const uint8_t * const pRefH,                                  const uint8_t * const pRefH,
1321                                  const uint8_t * const pRefV,                                  const uint8_t * const pRefV,
1322                                  const uint8_t * const pRefHV,                                  const uint8_t * const pRefHV,
1323                                  const IMAGE * const pCur,                                  const IMAGE * const pCur,
1324                                  const int x,                          const int x, const int y,
                                 const int y,  
                         const int start_x,  
                         const int start_y,  
                         const int center_x,  
                         const int center_y,  
1325                                  const uint32_t MotionFlags,                                  const uint32_t MotionFlags,
                                 const uint32_t iQuant,  
1326                                  const uint32_t iFcode,                                  const uint32_t iFcode,
1327                                  const MBParam * const pParam,                                  const MBParam * const pParam,
1328                                  const MACROBLOCK * const pMBs,                          MACROBLOCK * const pMB,
1329                                  const MACROBLOCK * const prevMBs,                          const VECTOR * const predMV,
1330                                  VECTOR * const currMV,                          int32_t * const best_sad,
1331                                  VECTOR * const currPMV)                          const int32_t mode_current,
1332                            SearchData * const Data)
1333  {  {
         const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
   
         const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;  
         const VECTOR zeroMV = { 0, 0 };  
1334    
1335          int32_t iDiamondSize;          const int32_t iEdgedWidth = pParam->edged_width;
   
         int32_t min_dx;  
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
   
         int32_t iFound;  
1336    
1337          VECTOR newMV;          int i, iDirection = 255, mask;
1338          VECTOR backupMV;                        /* just for PMVFAST */          VECTOR pmv[7];
1339            MainSearchFunc *MainSearchPtr;
1340            *Data->iMinSAD = MV_MAX_ERROR;
1341            Data->iFcode = iFcode;
1342            Data->qpel_precision = 0;
1343    
1344            Data->Ref = pRef + (x + y * iEdgedWidth) * 16;
1345            Data->RefH = pRefH + (x + y * iEdgedWidth) * 16;
1346            Data->RefV = pRefV + (x + y * iEdgedWidth) * 16;
1347            Data->RefHV = pRefHV + (x + y * iEdgedWidth) * 16;
1348    
1349            Data->predMV = *predMV;
1350    
1351            get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
1352                                    pParam->width, pParam->height, iFcode - Data->qpel, 0, 0);
1353    
1354            pmv[0] = Data->predMV;
1355            if (Data->qpel) { pmv[0].x /= 2; pmv[0].y /= 2; }
1356            PreparePredictionsBF(pmv, x, y, pParam->mb_width, pMB, mode_current);
1357    
1358            Data->currentMV->x = Data->currentMV->y = 0;
1359            CheckCandidate = CheckCandidate16no4v;
1360    
1361    // main loop. checking all predictions
1362            for (i = 0; i < 7; i++) {
1363                    if (!(mask = make_mask(pmv, i)) ) continue;
1364                    CheckCandidate16no4v(pmv[i].x, pmv[i].y, mask, &iDirection, Data);
1365            }
1366    
1367          VECTOR pmv[4];          if (MotionFlags & PMV_USESQUARES16)
1368          int32_t psad[4];                  MainSearchPtr = SquareSearch;
1369            else if (MotionFlags & PMV_ADVANCEDDIAMOND16)
1370                    MainSearchPtr = AdvDiamondSearch;
1371                    else MainSearchPtr = DiamondSearch;
1372    
1373          MainSearch16FuncPtr MainSearchPtr;          (*MainSearchPtr)(Data->currentMV->x, Data->currentMV->y, Data, iDirection);
1374    
1375          const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;          SubpelRefine(Data);
         MACROBLOCK *const pMB = pMBs + x + y * iWcount;  
1376    
1377          int32_t threshA, threshB;          if (Data->qpel && *Data->iMinSAD < *best_sad + 300) {
1378          int32_t bPredEq;                  Data->currentQMV->x = 2*Data->currentMV->x;
1379          int32_t iMinSAD, iSAD;                  Data->currentQMV->y = 2*Data->currentMV->y;
1380                    Data->qpel_precision = 1;
1381                    get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
1382                                            pParam->width, pParam->height, iFcode, 1, 0);
1383                    SubpelRefine(Data);
1384            }
1385    
1386    // three bits are needed to code backward mode. four for forward
1387    
1388            if (mode_current == MODE_FORWARD) *Data->iMinSAD +=  4 * Data->lambda16;
1389            else *Data->iMinSAD +=  3 * Data->lambda16;
1390    
1391            if (*Data->iMinSAD < *best_sad) {
1392                    *best_sad = *Data->iMinSAD;
1393                    pMB->mode = mode_current;
1394                    if (Data->qpel) {
1395                            pMB->pmvs[0].x = Data->currentQMV->x - predMV->x;
1396                            pMB->pmvs[0].y = Data->currentQMV->y - predMV->y;
1397                            if (mode_current == MODE_FORWARD)
1398                                    pMB->qmvs[0] = *Data->currentQMV;
1399                            else
1400                                    pMB->b_qmvs[0] = *Data->currentQMV;
1401                    } else {
1402                            pMB->pmvs[0].x = Data->currentMV->x - predMV->x;
1403                            pMB->pmvs[0].y = Data->currentMV->y - predMV->y;
1404                    }
1405                    if (mode_current == MODE_FORWARD) pMB->mvs[0] = *Data->currentMV;
1406                    else pMB->b_mvs[0] = *Data->currentMV;
1407            }
1408            if (mode_current == MODE_FORWARD)  *(Data->currentMV+2) = *Data->currentMV;
1409            else *(Data->currentMV+1) = *Data->currentMV; //we store currmv for interpolate search
1410    
1411    }
1412    
1413  /* Get maximum range */  static void
1414          get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,  SkipDecisionB(const IMAGE * const pCur,
1415                            iFcode);                                  const IMAGE * const f_Ref,
1416                                    const IMAGE * const b_Ref,
1417                                    MACROBLOCK * const pMB,
1418                                    const uint32_t x, const uint32_t y,
1419                                    const SearchData * const Data)
1420    {
1421            int dx = 0, dy = 0, b_dx = 0, b_dy = 0;
1422            uint32_t sum;
1423            const int div = 1 + Data->qpel;
1424            int k;
1425            const uint32_t quant = pMB->quant;
1426    //this is not full chroma compensation, only it's fullpel approximation. should work though
1427    
1428  /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */          for (k = 0; k < 4; k++) {
1429                    dy += Data->directmvF[k].y / div;
1430                    dx += Data->directmvF[0].x / div;
1431                    b_dy += Data->directmvB[0].y / div;
1432                    b_dx += Data->directmvB[0].x / div;
1433            }
1434    
1435            dy = (dy >> 3) + roundtab_76[dy & 0xf];
1436            dx = (dx >> 3) + roundtab_76[dx & 0xf];
1437            b_dy = (b_dy >> 3) + roundtab_76[b_dy & 0xf];
1438            b_dx = (b_dx >> 3) + roundtab_76[b_dx & 0xf];
1439    
1440            sum = sad8bi(pCur->u + 8*x + 8*y*(Data->iEdgedWidth/2),
1441                                            f_Ref->u + (y*8 + dy/2) * (Data->iEdgedWidth/2) + x*8 + dx/2,
1442                                            b_Ref->u + (y*8 + b_dy/2) * (Data->iEdgedWidth/2) + x*8 + b_dx/2,
1443                                            Data->iEdgedWidth/2);
1444    
1445            if (sum >= 2 * MAX_CHROMA_SAD_FOR_SKIP * quant) return; //no skip
1446    
1447            sum += sad8bi(pCur->v + 8*x + 8*y*(Data->iEdgedWidth/2),
1448                                            f_Ref->v + (y*8 + dy/2) * (Data->iEdgedWidth/2) + x*8 + dx/2,
1449                                            b_Ref->v + (y*8 + b_dy/2) * (Data->iEdgedWidth/2) + x*8 + b_dx/2,
1450                                            Data->iEdgedWidth/2);
1451    
1452          if ((x == 0) && (y == 0)) {          if (sum < 2 * MAX_CHROMA_SAD_FOR_SKIP * quant) pMB->mode = MODE_DIRECT_NONE_MV; //skipped
1453                  threshA = 512;  }
                 threshB = 1024;  
1454    
                 bPredEq = 0;  
                 psad[0] = psad[1] = psad[2] = psad[3] = 0;  
                 *currMV = pmv[0] = pmv[1] = pmv[2] = pmv[3] = zeroMV;  
1455    
         } else {  
                 threshA = psad[0];  
                 threshB = threshA + 256;  
                 if (threshA < 512)  
                         threshA = 512;  
                 if (threshA > 1024)  
                         threshA = 1024;  
                 if (threshB > 1792)  
                         threshB = 1792;  
1456    
1457                  bPredEq = get_ipmvdata(pMBs, iWcount, 0, x, y, 0, pmv, psad);  static __inline uint32_t
1458                  *currMV = pmv[0];                       /* current best := prediction */  SearchDirect(const IMAGE * const f_Ref,
1459          }                                  const uint8_t * const f_RefH,
1460                                    const uint8_t * const f_RefV,
1461                                    const uint8_t * const f_RefHV,
1462                                    const IMAGE * const b_Ref,
1463                                    const uint8_t * const b_RefH,
1464                                    const uint8_t * const b_RefV,
1465                                    const uint8_t * const b_RefHV,
1466                                    const IMAGE * const pCur,
1467                                    const int x, const int y,
1468                                    const uint32_t MotionFlags,
1469                                    const int32_t TRB, const int32_t TRD,
1470                                    const MBParam * const pParam,
1471                                    MACROBLOCK * const pMB,
1472                                    const MACROBLOCK * const b_mb,
1473                                    int32_t * const best_sad,
1474                                    SearchData * const Data)
1475    
1476    {
1477            int32_t skip_sad;
1478            int k;
1479    
1480            MainSearchFunc *MainSearchPtr;
1481    
1482            *Data->iMinSAD = 256*4096;
1483    
1484            Data->Ref = f_Ref->y + (x + Data->iEdgedWidth*y) * 16;
1485            Data->RefH = f_RefH + (x + Data->iEdgedWidth*y) * 16;
1486            Data->RefV = f_RefV + (x + Data->iEdgedWidth*y) * 16;
1487            Data->RefHV = f_RefHV + (x + Data->iEdgedWidth*y) * 16;
1488            Data->bRef = b_Ref->y + (x + Data->iEdgedWidth*y) * 16;
1489            Data->bRefH = b_RefH + (x + Data->iEdgedWidth*y) * 16;
1490            Data->bRefV = b_RefV + (x + Data->iEdgedWidth*y) * 16;
1491            Data->bRefHV = b_RefHV + (x + Data->iEdgedWidth*y) * 16;
1492    
1493            Data->max_dx = 2 * pParam->width - 2 * (x) * 16;
1494            Data->max_dy = 2 * pParam->height - 2 * (y) * 16;
1495            Data->min_dx = -(2 * 16 + 2 * (x) * 16);
1496            Data->min_dy = -(2 * 16 + 2 * (y) * 16);
1497            if (Data->qpel) { //we measure in qpixels
1498                    Data->max_dx *= 2;
1499                    Data->max_dy *= 2;
1500                    Data->min_dx *= 2;
1501                    Data->min_dy *= 2;
1502                    Data->referencemv = b_mb->qmvs;
1503            } else Data->referencemv = b_mb->mvs;
1504            Data->qpel_precision = 0; // it's a trick. it's 1 not 0, but we need 0 here
1505    
1506          iFound = 0;          for (k = 0; k < 4; k++) {
1507                    pMB->mvs[k].x = Data->directmvF[k].x = ((TRB * Data->referencemv[k].x) / TRD);
1508                    pMB->b_mvs[k].x = Data->directmvB[k].x = ((TRB - TRD) * Data->referencemv[k].x) / TRD;
1509                    pMB->mvs[k].y = Data->directmvF[k].y = ((TRB * Data->referencemv[k].y) / TRD);
1510                    pMB->b_mvs[k].y = Data->directmvB[k].y = ((TRB - TRD) * Data->referencemv[k].y) / TRD;
1511    
1512  /* Step 4: Calculate SAD around the Median prediction.                  if ( ( pMB->b_mvs[k].x > Data->max_dx ) || ( pMB->b_mvs[k].x < Data->min_dx )
1513     MinSAD=SAD                          || ( pMB->b_mvs[k].y > Data->max_dy ) || ( pMB->b_mvs[k].y < Data->min_dy )) {
    If Motion Vector equal to Previous frame motion vector  
    and MinSAD<PrevFrmSAD goto Step 10.  
    If SAD<=256 goto Step 10.  
 */  
1514    
1515          if (currMV->x > max_dx) {                          *best_sad = 256*4096; // in that case, we won't use direct mode
1516                  currMV->x = EVEN(max_dx);                          pMB->mode = MODE_DIRECT; // just to make sure it doesn't say "MODE_DIRECT_NONE_MV"
1517          }                          pMB->b_mvs[0].x = pMB->b_mvs[0].y = 0;
1518          if (currMV->x < min_dx) {                          return 256*4096;
                 currMV->x = EVEN(min_dx);  
1519          }          }
1520          if (currMV->y > max_dy) {                  if (b_mb->mode != MODE_INTER4V) {
1521                  currMV->y = EVEN(max_dy);                          pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->mvs[0];
1522                            pMB->b_mvs[1] = pMB->b_mvs[2] = pMB->b_mvs[3] = pMB->b_mvs[0];
1523                            Data->directmvF[1] = Data->directmvF[2] = Data->directmvF[3] = Data->directmvF[0];
1524                            Data->directmvB[1] = Data->directmvB[2] = Data->directmvB[3] = Data->directmvB[0];
1525                            break;
1526          }          }
         if (currMV->y < min_dy) {  
                 currMV->y = EVEN(min_dy);  
1527          }          }
1528    
1529          iMinSAD =          if (b_mb->mode == MODE_INTER4V) CheckCandidate = CheckCandidateDirect;
1530                  sad16(cur,          else CheckCandidate = CheckCandidateDirectno4v;
                           get_iref_mv(pRef, x, y, 16, currMV,  
                                                  iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);  
         iMinSAD +=  
                 calc_delta_16(currMV->x - center_x, currMV->y - center_y,  
                                           (uint8_t) iFcode, iQuant);  
1531    
1532          if ((iMinSAD < 256) ||          (*CheckCandidate)(0, 0, 255, &k, Data);
                 ((MVequal(*currMV, prevMB->i_mvs[0])) &&  
                  ((int32_t) iMinSAD < prevMB->i_sad16))) {  
                 if (iMinSAD < 2 * iQuant)       // high chances for SKIP-mode  
                 {  
                         if (!MVzero(*currMV)) {  
                                 iMinSAD += MV16_00_BIAS;  
                                 CHECK_MV16_ZERO;        // (0,0) saves space for letterboxed pictures  
                                 iMinSAD -= MV16_00_BIAS;  
                         }  
                 }  
1533    
1534                  if (MotionFlags & PMV_EARLYSTOP16)  // initial (fast) skip decision
1535                          goto PMVfastInt16_Terminate_with_Refine;          if (*Data->iMinSAD < pMB->quant * INITIAL_SKIP_THRESH*2) {
1536                    SkipDecisionB(pCur, f_Ref, b_Ref, pMB, x, y, Data); //possible skip - checking chroma
1537                    if (pMB->mode == MODE_DIRECT_NONE_MV) return *Data->iMinSAD; // skip.
1538          }          }
1539    
1540            skip_sad = *Data->iMinSAD;
1541    
1542  /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  //  DIRECT MODE DELTA VECTOR SEARCH.
1543     vector of the median.  //      This has to be made more effective, but at the moment I'm happy it's running at all
    If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2  
 */  
   
         if ((bPredEq) && (MVequal(pmv[0], prevMB->i_mvs[0])))  
                 iFound = 2;  
   
 /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.  
    Otherwise select large Diamond Search.  
 */  
1544    
1545          if ((!MVzero(pmv[0])) || (threshB < 1536) || (bPredEq))          if (MotionFlags & PMV_USESQUARES16) MainSearchPtr = SquareSearch;
1546                  iDiamondSize = 2;               // halfpel units!                  else if (MotionFlags & PMV_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1547          else                          else MainSearchPtr = DiamondSearch;
                 iDiamondSize = 4;               // halfpel units!  
1548    
1549  /*          (*MainSearchPtr)(0, 0, Data, 255);
    Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  
    Also calculate (0,0) but do not subtract offset.  
    Let MinSAD be the smallest SAD up to this point.  
    If MV is (0,0) subtract offset.  
 */  
   
 // (0,0) is often a good choice  
   
         if (!MVzero(pmv[0]))  
                 CHECK_MV16_ZERO;  
   
 // previous frame MV is always possible  
   
         if (!MVzero(prevMB->i_mvs[0]))  
                 if (!MVequal(prevMB->i_mvs[0], pmv[0]))  
                         CHECK_MV16_CANDIDATE(prevMB->i_mvs[0].x, prevMB->i_mvs[0].y);  
   
 // left neighbour, if allowed  
   
         if (!MVzero(pmv[1]))  
                 if (!MVequal(pmv[1], prevMB->i_mvs[0]))  
                         if (!MVequal(pmv[1], pmv[0]))  
                                 CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);  
   
 // top neighbour, if allowed  
         if (!MVzero(pmv[2]))  
                 if (!MVequal(pmv[2], prevMB->i_mvs[0]))  
                         if (!MVequal(pmv[2], pmv[0]))  
                                 if (!MVequal(pmv[2], pmv[1]))  
                                         CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);  
   
 // top right neighbour, if allowed  
                                         if (!MVzero(pmv[3]))  
                                                 if (!MVequal(pmv[3], prevMB->i_mvs[0]))  
                                                         if (!MVequal(pmv[3], pmv[0]))  
                                                                 if (!MVequal(pmv[3], pmv[1]))  
                                                                         if (!MVequal(pmv[3], pmv[2]))  
                                                                                 CHECK_MV16_CANDIDATE(pmv[3].x,  
                                                                                                                          pmv[3].y);  
   
         if ((MVzero(*currMV)) &&  
                 (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )  
                 iMinSAD -= MV16_00_BIAS;  
   
   
 /* Step 6: If MinSAD <= thresa goto Step 10.  
    If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.  
 */  
   
         if ((iMinSAD <= threshA) ||  
                 (MVequal(*currMV, prevMB->i_mvs[0]) &&  
                  ((int32_t) iMinSAD < prevMB->i_sad16))) {  
   
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfastInt16_Terminate_with_Refine;  
         }  
   
   
 /************ (Diamond Search)  **************/  
 /*  
    Step 7: Perform Diamond search, with either the small or large diamond.  
    If Found=2 only examine one Diamond pattern, and afterwards goto step 10  
    Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.  
    If center then goto step 10.  
    Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.  
    Refine by using small diamond and goto step 10.  
 */  
1550    
1551          if (MotionFlags & PMV_USESQUARES16)          SubpelRefine(Data);
                 MainSearchPtr = Square16_MainSearch;  
         else if (MotionFlags & PMV_ADVANCEDDIAMOND16)  
                 MainSearchPtr = AdvDiamond16_MainSearch;  
         else  
                 MainSearchPtr = Diamond16_MainSearch;  
1552    
1553          backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */          *best_sad = *Data->iMinSAD;
1554    
1555            if (b_mb->mode == MODE_INTER4V || Data->qpel) pMB->mode = MODE_DIRECT;
1556            else pMB->mode = MODE_DIRECT_NO4V; //for faster compensation
1557    
1558  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */          pMB->pmvs[3] = *Data->currentMV;
         iSAD =  
                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  
                                                   currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                   iQuant, iFound);  
1559    
1560          if (iSAD < iMinSAD) {          for (k = 0; k < 4; k++) {
1561                  *currMV = newMV;                  pMB->mvs[k].x = Data->directmvF[k].x + Data->currentMV->x;
1562                  iMinSAD = iSAD;                  pMB->b_mvs[k].x = (     (Data->currentMV->x == 0)
1563                                                            ? Data->directmvB[k].x
1564                                                            :pMB->mvs[k].x - Data->referencemv[k].x);
1565                    pMB->mvs[k].y = (Data->directmvF[k].y + Data->currentMV->y);
1566                    pMB->b_mvs[k].y = ((Data->currentMV->y == 0)
1567                                                            ? Data->directmvB[k].y
1568                                                            : pMB->mvs[k].y - Data->referencemv[k].y);
1569                    if (Data->qpel) {
1570                            pMB->qmvs[k].x = pMB->mvs[k].x; pMB->mvs[k].x /= 2;
1571                            pMB->b_qmvs[k].x = pMB->b_mvs[k].x; pMB->b_mvs[k].x /= 2;
1572                            pMB->qmvs[k].y = pMB->mvs[k].y; pMB->mvs[k].y /= 2;
1573                            pMB->b_qmvs[k].y = pMB->b_mvs[k].y; pMB->b_mvs[k].y /= 2;
1574                    }
1575    
1576                    if (b_mb->mode != MODE_INTER4V) {
1577                            pMB->mvs[3] = pMB->mvs[2] = pMB->mvs[1] = pMB->mvs[0];
1578                            pMB->b_mvs[3] = pMB->b_mvs[2] = pMB->b_mvs[1] = pMB->b_mvs[0];
1579                            pMB->qmvs[3] = pMB->qmvs[2] = pMB->qmvs[1] = pMB->qmvs[0];
1580                            pMB->b_qmvs[3] = pMB->b_qmvs[2] = pMB->b_qmvs[1] = pMB->b_qmvs[0];
1581                            break;
1582          }          }
   
         if (MotionFlags & PMV_EXTSEARCH16) {  
 /* extended: search (up to) two more times: orignal prediction and (0,0) */  
   
                 if (!(MVequal(pmv[0], backupMV))) {  
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,  
                                                                   pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   iDiamondSize, iFcode, iQuant, iFound);  
   
                         if (iSAD < iMinSAD) {  
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
1583                          }                          }
1584            return skip_sad;
1585                  }                  }
1586    
                 if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {  
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  
                                                                   iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, iFound);  
   
                         if (iSAD < iMinSAD) {  
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
                 }  
         }  
1587    
1588  /*  static void
1589     Step 10:  The motion vector is chosen according to the block corresponding to MinSAD.  SearchInterpolate(const uint8_t * const f_Ref,
1590  */                                  const uint8_t * const f_RefH,
1591                                    const uint8_t * const f_RefV,
1592                                    const uint8_t * const f_RefHV,
1593                                    const uint8_t * const b_Ref,
1594                                    const uint8_t * const b_RefH,
1595                                    const uint8_t * const b_RefV,
1596                                    const uint8_t * const b_RefHV,
1597                                    const IMAGE * const pCur,
1598                                    const int x, const int y,
1599                                    const uint32_t fcode,
1600                                    const uint32_t bcode,
1601                                    const uint32_t MotionFlags,
1602                                    const MBParam * const pParam,
1603                                    const VECTOR * const f_predMV,
1604                                    const VECTOR * const b_predMV,
1605                                    MACROBLOCK * const pMB,
1606                                    int32_t * const best_sad,
1607                                    SearchData * const fData)
1608    
1609  PMVfastInt16_Terminate_with_Refine:  {
1610    
1611          pMB->i_mvs[0] = pMB->i_mvs[1] = pMB->i_mvs[2] = pMB->i_mvs[3] = pMB->i_mv16 = *currMV;          int iDirection, i, j;
1612          pMB->i_sad8[0] = pMB->i_sad8[1] = pMB->i_sad8[2] = pMB->i_sad8[3] = pMB->i_sad16 = iMinSAD;          SearchData bData;
1613    
1614            fData->qpel_precision = 0;
1615            memcpy(&bData, fData, sizeof(SearchData)); //quick copy of common data
1616            *fData->iMinSAD = 4096*256;
1617            bData.currentMV++; bData.currentQMV++;
1618            fData->iFcode = bData.bFcode = fcode; fData->bFcode = bData.iFcode = bcode;
1619    
1620            i = (x + y * fData->iEdgedWidth) * 16;
1621            bData.bRef = fData->Ref = f_Ref + i;
1622            bData.bRefH = fData->RefH = f_RefH + i;
1623            bData.bRefV = fData->RefV = f_RefV + i;
1624            bData.bRefHV = fData->RefHV = f_RefHV + i;
1625            bData.Ref = fData->bRef = b_Ref + i;
1626            bData.RefH = fData->bRefH = b_RefH + i;
1627            bData.RefV = fData->bRefV = b_RefV + i;
1628            bData.RefHV = fData->bRefHV = b_RefHV + i;
1629    
1630            bData.bpredMV = fData->predMV = *f_predMV;
1631            fData->bpredMV = bData.predMV = *b_predMV;
1632            fData->currentMV[0] = fData->currentMV[2];
1633    
1634            get_range(&fData->min_dx, &fData->max_dx, &fData->min_dy, &fData->max_dy, x, y, 16, pParam->width, pParam->height, fcode - fData->qpel, 0, 0);
1635            get_range(&bData.min_dx, &bData.max_dx, &bData.min_dy, &bData.max_dy, x, y, 16, pParam->width, pParam->height, bcode - fData->qpel, 0, 0);
1636    
1637            if (fData->currentMV[0].x > fData->max_dx) fData->currentMV[0].x = fData->max_dx;
1638            if (fData->currentMV[0].x < fData->min_dx) fData->currentMV[0].x = fData->min_dx;
1639            if (fData->currentMV[0].y > fData->max_dy) fData->currentMV[0].y = fData->max_dy;
1640            if (fData->currentMV[0].y < fData->min_dy) fData->currentMV[0].y = fData->min_dy;
1641    
1642            if (fData->currentMV[1].x > bData.max_dx) fData->currentMV[1].x = bData.max_dx;
1643            if (fData->currentMV[1].x < bData.min_dx) fData->currentMV[1].x = bData.min_dx;
1644            if (fData->currentMV[1].y > bData.max_dy) fData->currentMV[1].y = bData.max_dy;
1645            if (fData->currentMV[1].y < bData.min_dy) fData->currentMV[1].y = bData.min_dy;
1646    
1647          if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step          CheckCandidateInt(fData->currentMV[0].x, fData->currentMV[0].y, 255, &iDirection, fData);
                 iMinSAD =  
                         Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                          iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,  
                                                          iFcode, iQuant, iEdgedWidth);  
1648    
1649          pmv[0] = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);          // get _REAL_ prediction (halfpel possible)  //diamond. I wish we could use normal mainsearch functions (square, advdiamond)
1650    
1651  PMVfastInt16_Terminate_without_Refine:          do {
1652          currPMV->x = currMV->x - center_x;                  iDirection = 255;
1653          currPMV->y = currMV->y - center_y;                  // forward MV moves
1654          return iMinSAD;                  i = fData->currentMV[0].x; j = fData->currentMV[0].y;
1655    
1656                    CheckCandidateInt(i + 1, j, 0, &iDirection, fData);
1657                    CheckCandidateInt(i, j + 1, 0, &iDirection, fData);
1658                    CheckCandidateInt(i - 1, j, 0, &iDirection, fData);
1659                    CheckCandidateInt(i, j - 1, 0, &iDirection, fData);
1660    
1661                    // backward MV moves
1662                    i = fData->currentMV[1].x; j = fData->currentMV[1].y;
1663                    fData->currentMV[2] = fData->currentMV[0];
1664                    CheckCandidateInt(i + 1, j, 0, &iDirection, &bData);
1665                    CheckCandidateInt(i, j + 1, 0, &iDirection, &bData);
1666                    CheckCandidateInt(i - 1, j, 0, &iDirection, &bData);
1667                    CheckCandidateInt(i, j - 1, 0, &iDirection, &bData);
1668    
1669            } while (!(iDirection));
1670    
1671            if (fData->qpel) {
1672                    if (*fData->iMinSAD > *best_sad + 500) return;
1673                    CheckCandidate = CheckCandidateInt;
1674                    fData->qpel_precision = bData.qpel_precision = 1;
1675                    get_range(&fData->min_dx, &fData->max_dx, &fData->min_dy, &fData->max_dy, x, y, 16, pParam->width, pParam->height, fcode, 1, 0);
1676                    get_range(&bData.min_dx, &bData.max_dx, &bData.min_dy, &bData.max_dy, x, y, 16, pParam->width, pParam->height, bcode, 1, 0);
1677                    fData->currentQMV[2].x = fData->currentQMV[0].x = 2 * fData->currentMV[0].x;
1678                    fData->currentQMV[2].y = fData->currentQMV[0].y = 2 * fData->currentMV[0].y;
1679                    fData->currentQMV[1].x = 2 * fData->currentMV[1].x;
1680                    fData->currentQMV[1].y = 2 * fData->currentMV[1].y;
1681                    SubpelRefine(fData);
1682                    if (*fData->iMinSAD > *best_sad + 300) return;
1683                    fData->currentQMV[2] = fData->currentQMV[0];
1684                    SubpelRefine(&bData);
1685            }
1686    
1687            *fData->iMinSAD +=  (2+3) * fData->lambda16; // two bits are needed to code interpolate mode.
1688    
1689            if (*fData->iMinSAD < *best_sad) {
1690                    *best_sad = *fData->iMinSAD;
1691                    pMB->mvs[0] = fData->currentMV[0];
1692                    pMB->b_mvs[0] = fData->currentMV[1];
1693                    pMB->mode = MODE_INTERPOLATE;
1694                    if (fData->qpel) {
1695                            pMB->qmvs[0] = fData->currentQMV[0];
1696                            pMB->b_qmvs[0] = fData->currentQMV[1];
1697                            pMB->pmvs[1].x = pMB->qmvs[0].x - f_predMV->x;
1698                            pMB->pmvs[1].y = pMB->qmvs[0].y - f_predMV->y;
1699                            pMB->pmvs[0].x = pMB->b_qmvs[0].x - b_predMV->x;
1700                            pMB->pmvs[0].y = pMB->b_qmvs[0].y - b_predMV->y;
1701                    } else {
1702                            pMB->pmvs[1].x = pMB->mvs[0].x - f_predMV->x;
1703                            pMB->pmvs[1].y = pMB->mvs[0].y - f_predMV->y;
1704                            pMB->pmvs[0].x = pMB->b_mvs[0].x - b_predMV->x;
1705                            pMB->pmvs[0].y = pMB->b_mvs[0].y - b_predMV->y;
1706                    }
1707            }
1708  }  }
   
   
   
 /* ***********************************************************  
         bvop motion estimation  
 // TODO: need to incorporate prediction here (eg. sad += calc_delta_16)  
 ***************************************************************/  
   
   
 #define DIRECT_PENALTY 0  
 #define DIRECT_UPPERLIMIT 256   // never use direct mode if SAD is larger than this  
1709    
1710  void  void
1711  MotionEstimationBVOP(MBParam * const pParam,  MotionEstimationBVOP(MBParam * const pParam,
# Line 2850  Line 1719 
1719                                           const IMAGE * const f_refV,                                           const IMAGE * const f_refV,
1720                                           const IMAGE * const f_refHV,                                           const IMAGE * const f_refHV,
1721                                           // backward (future) reference                                           // backward (future) reference
1722                                           const MACROBLOCK * const b_mbs,                                           const FRAMEINFO * const b_reference,
1723                                           const IMAGE * const b_ref,                                           const IMAGE * const b_ref,
1724                                           const IMAGE * const b_refH,                                           const IMAGE * const b_refH,
1725                                           const IMAGE * const b_refV,                                           const IMAGE * const b_refV,
1726                                           const IMAGE * const b_refHV)                                           const IMAGE * const b_refHV)
1727  {  {
1728          const int mb_width = pParam->mb_width;          uint32_t i, j;
1729          const int mb_height = pParam->mb_height;          int32_t best_sad;
1730          const int edged_width = pParam->edged_width;          uint32_t skip_sad;
1731            int f_count = 0, b_count = 0, i_count = 0, d_count = 0, n_count = 0;
1732            static const VECTOR zeroMV={0,0};
1733            const MACROBLOCK * const b_mbs = b_reference->mbs;
1734    
1735          int i, j, k;          VECTOR f_predMV, b_predMV;      /* there is no prediction for direct mode*/
1736    
1737          static const VECTOR zeroMV={0,0};          const int32_t TRB = time_pp - time_bp;
1738            const int32_t TRD = time_pp;
1739    
1740          int f_sad16;    /* forward (as usual) search */  // some pre-inintialized data for the rest of the search
         int b_sad16;    /* backward (only in b-frames) search */  
         int i_sad16;    /* interpolated (both direction, b-frames only) */  
         int d_sad16;    /* direct mode (assume linear motion) */  
         int dnv_sad16;  /* direct mode (assume linear motion) without correction vector */  
   
         int best_sad;  
   
         VECTOR f_predMV, b_predMV;      /* there is no direct prediction */  
         VECTOR pmv_dontcare;  
   
         int f_count=0;  
         int b_count=0;  
         int i_count=0;  
         int d_count=0;  
         int dnv_count=0;  
         int s_count=0;  
         const int64_t TRB = (int32_t)time_pp - (int32_t)time_bp;  
     const int64_t TRD = (int32_t)time_pp;  
1741    
1742          // fprintf(stderr,"TRB = %lld  TRD = %lld  time_bp =%d time_pp =%d\n\n",TRB,TRD,time_bp,time_pp);          SearchData Data;
1743            int32_t iMinSAD;
1744            VECTOR currentMV[3];
1745            VECTOR currentQMV[3];
1746            memset(&Data, 0, sizeof(SearchData));
1747            Data.iEdgedWidth = pParam->edged_width;
1748            Data.currentMV = currentMV; Data.currentQMV = currentQMV;
1749            Data.iMinSAD = &iMinSAD;
1750            Data.lambda16 = lambda_vec16[frame->quant];
1751            Data.chroma = frame->quant;
1752            Data.qpel = pParam->m_quarterpel;
1753            Data.rounding = 0;
1754    
1755            Data.RefQ = f_refV->u; // a good place, also used in MC (for similar purpose)
1756          // note: i==horizontal, j==vertical          // note: i==horizontal, j==vertical
1757          for (j = 0; j < mb_height; j++) {          for (j = 0; j < pParam->mb_height; j++) {
1758    
1759                  f_predMV = zeroMV;      /* prediction is reset at left boundary */                  f_predMV = b_predMV = zeroMV;   /* prediction is reset at left boundary */
                 b_predMV = zeroMV;  
1760    
1761                  for (i = 0; i < mb_width; i++) {                  for (i = 0; i < pParam->mb_width; i++) {
1762                          MACROBLOCK *mb = &frame->mbs[i + j * mb_width];                          MACROBLOCK * const pMB = frame->mbs + i + j * pParam->mb_width;
1763                          const MACROBLOCK *f_mb = &f_mbs[i + j * mb_width];                          const MACROBLOCK * const b_mb = b_mbs + i + j * pParam->mb_width;
1764                          const MACROBLOCK *b_mb = &b_mbs[i + j * mb_width];  
1765    /* special case, if collocated block is SKIPed in P-VOP: encoding is forward (0,0), cpb=0 without further ado */
1766                          VECTOR directMV;                          if (b_reference->coding_type != S_VOP)
1767                          VECTOR deltaMV=zeroMV;                                  if (b_mb->mode == MODE_NOT_CODED) {
1768                                            pMB->mode = MODE_NOT_CODED;
 /* special case, if collocated block is SKIPed: encoding is forward(0,0)  */  
   
 #ifndef _DISABLE_SKIP  
                         if (b_mb->mode == MODE_INTER && b_mb->cbp == 0 &&  
                                 b_mb->mvs[0].x == 0 && b_mb->mvs[0].y == 0) {  
                                 mb->mode = MODE_NOT_CODED;  
                                 mb->mvs[0].x = 0;  
                                 mb->mvs[0].y = 0;  
                                 mb->b_mvs[0].x = 0;  
                                 mb->b_mvs[0].y = 0;  
1769                                  continue;                                  continue;
1770                          }                          }
 #endif  
1771    
1772                          dnv_sad16 = DIRECT_PENALTY;                          Data.Cur = frame->image.y + (j * Data.iEdgedWidth + i) * 16;
1773                            pMB->quant = frame->quant;
1774    
1775                          if (b_mb->mode == MODE_INTER4V)  /* direct search comes first, because it (1) checks for SKIP-mode
1776                          {          and (2) sets very good predictions for forward and backward search */
1777                            skip_sad = SearchDirect(f_ref, f_refH->y, f_refV->y, f_refHV->y,
1778                                                                            b_ref, b_refH->y, b_refV->y, b_refHV->y,
1779                                                                            &frame->image,
1780                                                                            i, j,
1781                                                                            frame->motion_flags,
1782                                                                            TRB, TRD,
1783                                                                            pParam,
1784                                                                            pMB, b_mb,
1785                                                                            &best_sad,
1786                                                                            &Data);
1787    
1788                          /* same method of scaling as in decoder.c, so we copy from there */                          if (pMB->mode == MODE_DIRECT_NONE_MV) { n_count++; continue; }
1789                      for (k = 0; k < 4; k++) {  
1790                            // forward search
1791                            SearchBF(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
1792                                                    &frame->image, i, j,
1793                                                    frame->motion_flags,
1794                                                    frame->fcode, pParam,
1795                                                    pMB, &f_predMV, &best_sad,
1796                                                    MODE_FORWARD, &Data);
1797    
1798                                          directMV = b_mb->mvs[k];                          // backward search
1799                            SearchBF(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
1800                                                    &frame->image, i, j,
1801                                                    frame->motion_flags,
1802                                                    frame->bcode, pParam,
1803                                                    pMB, &b_predMV, &best_sad,
1804                                                    MODE_BACKWARD, &Data);
1805    
1806                            // interpolate search comes last, because it uses data from forward and backward as prediction
1807                            SearchInterpolate(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
1808                                                    b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
1809                                                    &frame->image,
1810                                                    i, j,
1811                                                    frame->fcode, frame->bcode,
1812                                                    frame->motion_flags,
1813                                                    pParam,
1814                                                    &f_predMV, &b_predMV,
1815                                                    pMB, &best_sad,
1816                                                    &Data);
1817    
1818    // final skip decision
1819                            if ( (skip_sad < frame->quant * MAX_SAD00_FOR_SKIP*2)
1820                                            && ((100*best_sad)/(skip_sad+1) > FINAL_SKIP_THRESH) )
1821                                    SkipDecisionB(&frame->image, f_ref, b_ref, pMB, i, j, &Data);
1822    
1823                                          mb->mvs[k].x = (int32_t) ((TRB * directMV.x) / TRD + deltaMV.x);                          switch (pMB->mode) {
1824                      mb->b_mvs[k].x = (int32_t) ((deltaMV.x == 0)                                  case MODE_FORWARD:
1825                                                                                  ? ((TRB - TRD) * directMV.x) / TRD                                          f_count++;
1826                                              : mb->mvs[k].x - directMV.x);                                          if (Data.qpel) f_predMV = pMB->qmvs[0];
1827                      mb->mvs[k].y = (int32_t) ((TRB * directMV.y) / TRD + deltaMV.y);                                          else f_predMV = pMB->mvs[0];
1828                          mb->b_mvs[k].y = (int32_t) ((deltaMV.y == 0)                                          break;
1829                                                                                  ? ((TRB - TRD) * directMV.y) / TRD                                  case MODE_BACKWARD:
1830                                              : mb->mvs[k].y - directMV.y);                                          b_count++;
1831                                            if (Data.qpel) b_predMV = pMB->b_qmvs[0];
1832                                          dnv_sad16 +=                                          else b_predMV = pMB->b_mvs[0];
1833                                                  sad8bi(frame->image.y + 2*(i+(k&1))*8 + 2*(j+(k>>1))*8*edged_width,                                          break;
1834                                                    get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,                                  case MODE_INTERPOLATE:
1835                                                                  2*(i+(k&1)), 2*(j+(k>>1)), 8, &mb->mvs[k], edged_width),                                          i_count++;
1836                                                    get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,                                          if (Data.qpel) {
1837                                                                  2*(i+(k&1)), 2*(j+(k>>1)), 8, &mb->b_mvs[k], edged_width),                                                  f_predMV = pMB->qmvs[0];
1838                                                    edged_width);                                                  b_predMV = pMB->b_qmvs[0];
1839                                            } else {
1840                                                    f_predMV = pMB->mvs[0];
1841                                                    b_predMV = pMB->b_mvs[0];
1842                                  }                                  }
1843                                            break;
1844                                    case MODE_DIRECT:
1845                                    case MODE_DIRECT_NO4V:
1846                                            d_count++;
1847                                    default:
1848                                            break;
1849                          }                          }
1850                          else                  }
1851            }
1852    }
1853    
1854    static __inline void
1855    MEanalyzeMB (   const uint8_t * const pRef,
1856                                    const uint8_t * const pCur,
1857                                    const int x,
1858                                    const int y,
1859                                    const MBParam * const pParam,
1860                                    MACROBLOCK * const pMBs,
1861                                    SearchData * const Data)
1862                          {                          {
                                 directMV = b_mb->mvs[0];  
1863    
1864                                  mb->mvs[0].x = (int32_t) ((TRB * directMV.x) / TRD + deltaMV.x);          int i, mask;
1865                  mb->b_mvs[0].x = (int32_t) ((deltaMV.x == 0)          VECTOR pmv[3];
1866                                                                  ? ((TRB - TRD) * directMV.x) / TRD          MACROBLOCK * pMB = &pMBs[x + y * pParam->mb_width];
                                     : mb->mvs[0].x - directMV.x);  
                 mb->mvs[0].y = (int32_t) ((TRB * directMV.y) / TRD + deltaMV.y);  
                     mb->b_mvs[0].y = (int32_t) ((deltaMV.y == 0)  
                                                                 ? ((TRB - TRD) * directMV.y) / TRD  
                                 : mb->mvs[0].y - directMV.y);  
   
                                 dnv_sad16 = DIRECT_PENALTY +  
                                         sad16bi(frame->image.y + i * 16 + j * 16 * edged_width,  
                                                   get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,  
                                                                 i, j, 16, &mb->mvs[0], edged_width),  
                                                   get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,  
                                                                 i, j, 16, &mb->b_mvs[0], edged_width),  
                                                   edged_width);  
1867    
1868            for (i = 0; i < 5; i++) Data->iMinSAD[i] = MV_MAX_ERROR;
1869    
1870              }          //median is only used as prediction. it doesn't have to be real
1871            if (x == 1 && y == 1) Data->predMV.x = Data->predMV.y = 0;
1872            else
1873                    if (x == 1) //left macroblock does not have any vector now
1874                            Data->predMV = (pMB - pParam->mb_width)->mvs[0]; // top instead of median
1875                    else if (y == 1) // top macroblock doesn't have it's vector
1876                            Data->predMV = (pMB - 1)->mvs[0]; // left instead of median
1877                            else Data->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0); //else median
1878    
1879                          // forward search          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
1880                          f_sad16 = SEARCH16(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,                                  pParam->width, pParam->height, Data->iFcode - pParam->m_quarterpel, 0, Data->rrv);
                                                 &frame->image, i, j,  
                                                 mb->mvs[0].x, mb->mvs[0].y,                     /* start point f_directMV */  
                                                 f_predMV.x, f_predMV.y,                         /* center is f-prediction */  
                                                 frame->motion_flags & (~(PMV_EARLYSTOP16|PMV_QUICKSTOP16)),  
                                                 frame->quant, frame->fcode, pParam,  
                                                 f_mbs, f_mbs,  
                                                 &mb->mvs[0], &pmv_dontcare);  
1881    
1882            Data->Cur = pCur + (x + y * pParam->edged_width) * 16;
1883            Data->Ref = pRef + (x + y * pParam->edged_width) * 16;
1884    
1885                          // backward search          pmv[1].x = EVEN(pMB->mvs[0].x);
1886                          b_sad16 = SEARCH16(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,          pmv[1].y = EVEN(pMB->mvs[0].y);
1887                                                  &frame->image, i, j,          pmv[2].x = EVEN(Data->predMV.x);
1888                                                  mb->b_mvs[0].x, mb->b_mvs[0].y,         /* start point b_directMV */          pmv[2].y = EVEN(Data->predMV.y);
1889                                                  b_predMV.x, b_predMV.y,                         /* center is b-prediction */          pmv[0].x = pmv[0].y = 0;
1890                                                  frame->motion_flags & (~(PMV_EARLYSTOP16|PMV_QUICKSTOP16)),  
1891                                                  frame->quant, frame->bcode, pParam,          CheckCandidate32I(0, 0, 255, &i, Data);
                                                 b_mbs, b_mbs,  
                                                 &mb->b_mvs[0], &pmv_dontcare);  
   
                         i_sad16 =  
                                 sad16bi(frame->image.y + i * 16 + j * 16 * edged_width,  
                                                   get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,  
                                                                 i, j, 16, &mb->mvs[0], edged_width),  
                                                   get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,  
                                                                 i, j, 16, &mb->b_mvs[0], edged_width),  
                                                   edged_width);  
                     i_sad16 += calc_delta_16(mb->mvs[0].x-f_predMV.x, mb->mvs[0].y-f_predMV.y,  
                                                                 frame->fcode, frame->quant);  
                     i_sad16 += calc_delta_16(mb->b_mvs[0].y-b_predMV.y, mb->b_mvs[0].y-b_predMV.y,  
                                                                 frame->bcode, frame->quant);  
   
                         // TODO: direct search  
                         // predictor + delta vector in range [-32,32] (fcode=1)  
   
 //                      i_sad16 = 65535;  
 //                      f_sad16 = 65535;  
 //                      b_sad16 = 65535;  
   
                         if (f_sad16 < b_sad16) {  
                                 best_sad = f_sad16;  
                                 mb->mode = MODE_FORWARD;  
                         } else {  
                                 best_sad = b_sad16;  
                                 mb->mode = MODE_BACKWARD;  
                         }  
1892    
1893                          if (i_sad16 < best_sad) {          if (*Data->iMinSAD > 4 * MAX_SAD00_FOR_SKIP * 4) {
1894                                  best_sad = i_sad16;  
1895                                  mb->mode = MODE_INTERPOLATE;                  if (!(mask = make_mask(pmv, 1)))
1896                            CheckCandidate32I(pmv[1].x, pmv[1].y, mask, &i, Data);
1897                    if (!(mask = make_mask(pmv, 2)))
1898                            CheckCandidate32I(pmv[2].x, pmv[2].y, mask, &i, Data);
1899    
1900                    if (*Data->iMinSAD > 4 * MAX_SAD00_FOR_SKIP * 4) // diamond only if needed
1901                            DiamondSearch(Data->currentMV->x, Data->currentMV->y, Data, i);
1902    
1903                    for (i = 0; i < 4; i++) {
1904                            MACROBLOCK * MB = &pMBs[x + (i&1) + (y+(i>>1) * pParam->mb_width)];
1905                            MB->mvs[0] = MB->mvs[1] = MB->mvs[2] = MB->mvs[3] = Data->currentMV[i];
1906                            MB->mode = MODE_INTER;
1907                            MB->sad16 = Data->iMinSAD[i+1];
1908                    }
1909            }
1910                          }                          }
1911    
1912                          if (dnv_sad16 < best_sad) {  #define INTRA_BIAS              2500
1913    #define INTRA_THRESH    1500
1914    #define INTER_THRESH    1400
1915    
                                 if (dnv_sad16 > DIRECT_UPPERLIMIT)  
                                 {  
                                         /* if SAD value is too large, try same vector with MODE_INTERPOLATE  
                                            instead (interpolate has residue encoding, direct mode without MV  
                                            doesn't)  
1916    
1917                                                  This has to be replaced later by "real" direct mode, including delta  int
1918                                                  vector and (if needed) residue encoding  MEanalysis(     const IMAGE * const pRef,
1919                            FRAMEINFO * const Current,
1920                            MBParam * const pParam,
1921                            int maxIntra, //maximum number if non-I frames
1922                            int intraCount, //number of non-I frames after last I frame; 0 if we force P/B frame
1923                            int bCount) // number if B frames in a row
1924    {
1925            uint32_t x, y, intra = 0;
1926            int sSAD = 0;
1927            MACROBLOCK * const pMBs = Current->mbs;
1928            const IMAGE * const pCurrent = &Current->image;
1929            int IntraThresh = INTRA_THRESH, InterThresh = INTER_THRESH;
1930            const VECTOR zeroMV = {0,0};
1931    
1932            int32_t iMinSAD[5], temp[5];
1933            VECTOR currentMV[5];
1934            SearchData Data;
1935            Data.iEdgedWidth = pParam->edged_width;
1936            Data.currentMV = currentMV;
1937            Data.iMinSAD = iMinSAD;
1938            Data.iFcode = Current->fcode;
1939            Data.rrv = Current->global_flags & XVID_REDUCED;
1940            Data.temp = temp;
1941            CheckCandidate = CheckCandidate32I;
1942    
1943            if (intraCount < 10) // we're right after an I frame
1944                    IntraThresh += 4 * (intraCount - 10) * (intraCount - 10);
1945            else
1946                    if ( 5*(maxIntra - intraCount) < maxIntra) // we're close to maximum. 2 sec when max is 10 sec
1947                            IntraThresh -= (IntraThresh * (maxIntra - 5*(maxIntra - intraCount)))/maxIntra;
1948    
1949                                          */          InterThresh += 400 * (1 - bCount);
1950            if (InterThresh < 300) InterThresh = 300;
1951    
1952                                          directMV = b_mb->mvs[0];          if (sadInit) (*sadInit) ();
1953    
1954                                          mb->mvs[0].x = (int32_t) ((TRB * directMV.x) / TRD + deltaMV.x);          for (y = 1; y < pParam->mb_height-1; y+=2) {
1955                      mb->b_mvs[0].x = (int32_t) ((deltaMV.x == 0)                  for (x = 1; x < pParam->mb_width-1; x+=2) {
1956                                                                                  ? ((TRB - TRD) * directMV.x) / TRD                          int i;
                                         : mb->mvs[0].x - directMV.x);  
                         mb->mvs[0].y = (int32_t) ((TRB * directMV.y) / TRD + deltaMV.y);  
                         mb->b_mvs[0].y = (int32_t) ((deltaMV.y == 0)  
                                                                                 ? ((TRB - TRD) * directMV.y) / TRD  
                                             : mb->mvs[0].y - directMV.y);  
1957    
1958                                          dnv_sad16 =                          if (bCount == 0) pMBs[x + y * pParam->mb_width].mvs[0] = zeroMV;
                                                 sad16bi(frame->image.y + i * 16 + j * 16 * edged_width,  
                                                   get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,  
                                                                 i, j, 16, &mb->mvs[0], edged_width),  
                                                   get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,  
                                                                 i, j, 16, &mb->b_mvs[0], edged_width),  
                                                   edged_width);  
                                 dnv_sad16 += calc_delta_16(mb->mvs[0].x-f_predMV.x, mb->mvs[0].y-f_predMV.y,  
                                                                 frame->fcode, frame->quant);  
                                     dnv_sad16 += calc_delta_16(mb->b_mvs[0].y-b_predMV.y, mb->b_mvs[0].y-b_predMV.y,  
                                                                 frame->bcode, frame->quant);  
1959    
1960                                          if (dnv_sad16 < best_sad)                          MEanalyzeMB(pRef->y, pCurrent->y, x, y, pParam, pMBs, &Data);
                                         {  
                                                 best_sad = dnv_sad16;  
                                                 mb->mode = MODE_INTERPOLATE;  
1961    
1962  /*                                              fprintf(stderr,"f_sad16 = %d, b_sad16 = %d, i_sad16 = %d, dnv_sad16 = %d\n",                          for (i = 0; i < 4; i++) {
1963                                                          f_sad16,b_sad16,i_sad16,dnv_sad16);                                  int dev;
1964  */                                      }                                  MACROBLOCK *pMB = &pMBs[x+(i&1) + y+(i>>1) * pParam->mb_width];
1965                                    if (pMB->sad16 > IntraThresh) {
1966                                            dev = dev16(pCurrent->y + (x + (i&1) + (y + (i>>1))* pParam->edged_width) * 16,
1967                                                                              pParam->edged_width);
1968                                            if (dev + IntraThresh < pMB->sad16) {
1969                                                    pMB->mode = MODE_INTRA;
1970                                                    if (++intra > (pParam->mb_height-2)*(pParam->mb_width-2)/2) return I_VOP;
1971                                  }                                  }
                                 else  
                                 {  
                                         best_sad = dnv_sad16;  
                                         mb->mode = MODE_DIRECT_NONE_MV;  
1972                                  }                                  }
1973                                    sSAD += pMB->sad16;
1974                            }
1975                    }
1976            }
1977            sSAD /= (pParam->mb_height-2)*(pParam->mb_width-2);
1978            if (sSAD > IntraThresh + INTRA_BIAS ) return I_VOP;
1979            if (sSAD > InterThresh ) return P_VOP;
1980            emms();
1981            return B_VOP;
1982    
1983                          }                          }
1984    
1985                          switch (mb->mode)  static void
1986    CheckGMC(int x, int y, const int dir, int * iDirection,
1987                    const MACROBLOCK * const pMBs, uint32_t * bestcount, VECTOR * GMC,
1988                    const MBParam * const pParam)
1989                          {                          {
1990                                  case MODE_FORWARD:          uint32_t mx, my, a, count = 0;
                                         f_count++;  
                                         f_predMV = mb->mvs[0];  
                                         break;  
                                 case MODE_BACKWARD:  
                                         b_count++;  
                                         b_predMV = mb->b_mvs[0];  
1991    
1992                                          break;          for (my = 1; my < pParam->mb_height-1; my++)
1993                                  case MODE_INTERPOLATE:                  for (mx = 1; mx < pParam->mb_width-1; mx++) {
1994                                          i_count++;                          VECTOR mv;
1995                                          f_predMV = mb->mvs[0];                          const MACROBLOCK *pMB = &pMBs[mx + my * pParam->mb_width];
1996                                          b_predMV = mb->b_mvs[0];                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_NOT_CODED) continue;
1997                                          break;                          mv = pMB->mvs[0];
1998                                  case MODE_DIRECT:                          a = ABS(mv.x - x) + ABS(mv.y - y);
1999                                          d_count++; break;                          if (a < 6) count += 6 - a;
2000                                  case MODE_DIRECT_NONE_MV:                  }
2001                                          dnv_count++; break;  
2002                                  default:          if (count > *bestcount) {
2003                                          s_count++; break;                  *bestcount = count;
2004                    *iDirection = dir;
2005                    GMC->x = x; GMC->y = y;
2006            }
2007                          }                          }
2008    
2009    
2010    static VECTOR
2011    GlobalMotionEst(const MACROBLOCK * const pMBs, const MBParam * const pParam, const uint32_t iFcode)
2012    {
2013    
2014            uint32_t count, bestcount = 0;
2015            int x, y;
2016            VECTOR gmc = {0,0};
2017            int step, min_x, max_x, min_y, max_y;
2018            uint32_t mx, my;
2019            int iDirection, bDirection;
2020    
2021            min_x = min_y = -32<<iFcode;
2022            max_x = max_y = 32<<iFcode;
2023    
2024    //step1: let's find a rough camera panning
2025            for (step = 32; step >= 2; step /= 2) {
2026                    bestcount = 0;
2027                    for (y = min_y; y <= max_y; y += step)
2028                            for (x = min_x ; x <= max_x; x += step) {
2029                                    count = 0;
2030                                    //for all macroblocks
2031                                    for (my = 1; my < pParam->mb_height-1; my++)
2032                                            for (mx = 1; mx < pParam->mb_width-1; mx++) {
2033                                                    const MACROBLOCK *pMB = &pMBs[mx + my * pParam->mb_width];
2034                                                    VECTOR mv;
2035    
2036                                                    if (pMB->mode == MODE_INTRA || pMB->mode == MODE_NOT_CODED)
2037                                                            continue;
2038    
2039                                                    mv = pMB->mvs[0];
2040                                                    if ( ABS(mv.x - x) <= step && ABS(mv.y - y) <= step )   /* GMC translation is always halfpel-res */
2041                                                            count++;
2042                  }                  }
2043                                    if (count >= bestcount) { bestcount = count; gmc.x = x; gmc.y = y; }
2044          }          }
2045                    min_x = gmc.x - step;
2046                    max_x = gmc.x + step;
2047                    min_y = gmc.y - step;
2048                    max_y = gmc.y + step;
2049            }
2050    
2051            if (bestcount < (pParam->mb_height-2)*(pParam->mb_width-2)/10)
2052                    gmc.x = gmc.y = 0; //no camara pan, no GMC
2053    
2054  #ifdef _DEBUG_BFRAME_STAT  // step2: let's refine camera panning using gradiend-descent approach
2055          fprintf(stderr,"B-Stat: F: %04d   B: %04d   I: %04d  D0: %04d   D: %04d   S: %04d\n",  // TODO: more warping points may be evaluated here (like in interpolate mode search - two vectors in one diamond)
2056                                  f_count,b_count,i_count,dnv_count,d_count,s_count);          bestcount = 0;
2057  #endif          CheckGMC(gmc.x, gmc.y, 255, &iDirection, pMBs, &bestcount, &gmc, pParam);
2058            do {
2059                    x = gmc.x; y = gmc.y;
2060                    bDirection = iDirection; iDirection = 0;
2061                    if (bDirection & 1) CheckGMC(x - 1, y, 1+4+8, &iDirection, pMBs, &bestcount, &gmc, pParam);
2062                    if (bDirection & 2) CheckGMC(x + 1, y, 2+4+8, &iDirection, pMBs, &bestcount, &gmc, pParam);
2063                    if (bDirection & 4) CheckGMC(x, y - 1, 1+2+4, &iDirection, pMBs, &bestcount, &gmc, pParam);
2064                    if (bDirection & 8) CheckGMC(x, y + 1, 1+2+8, &iDirection, pMBs, &bestcount, &gmc, pParam);
2065    
2066            } while (iDirection);
2067    
2068            if (pParam->m_quarterpel) {
2069                    gmc.x *= 2;
2070                    gmc.y *= 2;     /* we store the halfpel value as pseudo-qpel to make comparison easier */
2071            }
2072    
2073            return gmc;
2074  }  }

Legend:
Removed from v.337  
changed lines
  Added in v.767

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4