[svn] / trunk / xvidcore / src / motion / motion_est.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/src/motion/motion_est.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 3, Fri Mar 8 02:46:11 2002 UTC revision 326, Sun Jul 21 23:34:08 2002 UTC
# Line 1  Line 1 
1  /**************************************************************************  /**************************************************************************
2   *   *
3     *      XVID MPEG-4 VIDEO CODEC
4     *      motion estimation
5     *
6     *      This program is an implementation of a part of one or more MPEG-4
7     *      Video tools as specified in ISO/IEC 14496-2 standard.  Those intending
8     *      to use this software module in hardware or software products are
9     *      advised that its use may infringe existing patents or copyrights, and
10     *      any such use would be at such party's own risk.  The original
11     *      developer of this software module and his/her company, and subsequent
12     *      editors and their companies, will have no liability for use of this
13     *      software or modifications or derivatives thereof.
14     *
15     *      This program is free software; you can redistribute it and/or modify
16     *      it under the terms of the GNU General Public License as published by
17     *      the Free Software Foundation; either version 2 of the License, or
18     *      (at your option) any later version.
19     *
20     *      This program is distributed in the hope that it will be useful,
21     *      but WITHOUT ANY WARRANTY; without even the implied warranty of
22     *      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
23     *      GNU General Public License for more details.
24     *
25     *      You should have received a copy of the GNU General Public License
26     *      along with this program; if not, write to the Free Software
27     *      Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
28     *
29     *************************************************************************/
30    
31    /**************************************************************************
32     *
33   *  Modifications:   *  Modifications:
34   *   *
35     *      01.05.2002      updated MotionEstimationBVOP
36     *      25.04.2002 partial prevMB conversion
37     *  22.04.2002 remove some compile warning by chenm001 <chenm001@163.com>
38     *  14.04.2002 added MotionEstimationBVOP()
39     *  02.04.2002 add EPZS(^2) as ME algorithm, use PMV_USESQUARES to choose between
40     *             EPZS and EPZS^2
41   *  08.02.2002 split up PMVfast into three routines: PMVFast, PMVFast_MainLoop   *  08.02.2002 split up PMVfast into three routines: PMVFast, PMVFast_MainLoop
42   *             PMVFast_Refine to support multiple searches with different start points   *             PMVFast_Refine to support multiple searches with different start points
43   *      07.01.2002 uv-block-based interpolation   *      07.01.2002 uv-block-based interpolation
# Line 31  Line 67 
67    
68  #include <assert.h>  #include <assert.h>
69  #include <stdio.h>  #include <stdio.h>
70    #include <stdlib.h>
71    
72  #include "../encoder.h"  #include "../encoder.h"
73  #include "../utils/mbfunctions.h"  #include "../utils/mbfunctions.h"
74  #include "../prediction/mbprediction.h"  #include "../prediction/mbprediction.h"
75  #include "../global.h"  #include "../global.h"
76  #include "../utils/timer.h"  #include "../utils/timer.h"
77    #include "motion.h"
78  #include "sad.h"  #include "sad.h"
79    
 // very large value  
 #define MV_MAX_ERROR    (4096 * 256)  
   
 // stop search if sdelta < THRESHOLD  
 #define MV16_THRESHOLD  192  
 #define MV8_THRESHOLD   56  
   
 /* sad16(0,0) bias; mpeg4 spec suggests nb/2+1 */  
 /* nb  = vop pixels * 2^(bpp-8) */  
 #define MV16_00_BIAS    (128+1)  
   
 /* INTER bias for INTER/INTRA decision; mpeg4 spec suggests 2*nb */  
 #define INTER_BIAS      512  
   
 /* Parameters which control inter/inter4v decision */  
 #define IMV16X16                        5  
   
 /* vector map (vlc delta size) smoother parameters */  
 #define NEIGH_TEND_16X16        2  
 #define NEIGH_TEND_8X8          2  
   
   
 // fast ((A)/2)*2  
 #define EVEN(A)         (((A)<0?(A)+1:(A)) & ~1)  
   
   
 #define MIN(X, Y) ((X)<(Y)?(X):(Y))  
 #define MAX(X, Y) ((X)>(Y)?(X):(Y))  
 #define ABS(X) (((X)>0)?(X):-(X))  
 #define SIGN(X) (((X)>0)?1:-1)  
   
   
 int32_t PMVfastSearch8(  
                                         const uint8_t * const pRef,  
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const IMAGE * const pCur,  
                                         const int x, const int y,  
                                         const int start_x, int start_y,  
                                         const uint32_t iQuality,  
                                         MBParam * const pParam,  
                                         MACROBLOCK * const pMBs,  
                                         VECTOR * const currMV,  
                                         VECTOR * const currPMV);  
   
 int32_t PMVfastSearch16(  
                                         const uint8_t * const pRef,  
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const IMAGE * const pCur,  
                                         const int x, const int y,  
                                         const uint32_t iQuality,  
                                         MBParam * const pParam,  
                                         MACROBLOCK * const pMBs,  
                                         VECTOR * const currMV,  
                                         VECTOR * const currPMV);  
   
   
   
 /* diamond search stuff  
    keep the the sequence in circular order (so optimization works)  
 */  
   
 typedef struct  
 {  
         int32_t dx;  
         int32_t dy;  
 }  
 DPOINT;  
80    
81    
82  static const DPOINT diamond_small[4] =  static int32_t lambda_vec16[32] =       /* rounded values for lambda param for weight of motion bits as in modified H.26L */
83  {  { 0, (int) (1.00235 + 0.5), (int) (1.15582 + 0.5), (int) (1.31976 + 0.5),
84          {0, 1}, {1, 0}, {0, -1}, {-1, 0}                  (int) (1.49591 + 0.5), (int) (1.68601 + 0.5),
85            (int) (1.89187 + 0.5), (int) (2.11542 + 0.5), (int) (2.35878 + 0.5),
86                    (int) (2.62429 + 0.5), (int) (2.91455 + 0.5),
87            (int) (3.23253 + 0.5), (int) (3.58158 + 0.5), (int) (3.96555 + 0.5),
88                    (int) (4.38887 + 0.5), (int) (4.85673 + 0.5),
89            (int) (5.37519 + 0.5), (int) (5.95144 + 0.5), (int) (6.59408 + 0.5),
90                    (int) (7.31349 + 0.5), (int) (8.12242 + 0.5),
91            (int) (9.03669 + 0.5), (int) (10.0763 + 0.5), (int) (11.2669 + 0.5),
92                    (int) (12.6426 + 0.5), (int) (14.2493 + 0.5),
93            (int) (16.1512 + 0.5), (int) (18.442 + 0.5), (int) (21.2656 + 0.5),
94                    (int) (24.8580 + 0.5), (int) (29.6436 + 0.5),
95            (int) (36.4949 + 0.5)
96  };  };
97    
98    static int32_t *lambda_vec8 = lambda_vec16;     /* same table for INTER and INTER4V for now */
99    
 static const DPOINT diamond_large[8] =  
 {  
         {0, 2}, {1, 1}, {2, 0}, {1, -1}, {0, -2}, {-1, -1}, {-2, 0}, {-1, 1}  
 };  
100    
101    
102  // mv.length table  // mv.length table
# Line 133  Line 108 
108  };  };
109    
110    
111  static __inline uint32_t mv_bits(int32_t component, const uint32_t iFcode)  static __inline uint32_t
112    mv_bits(int32_t component,
113                    const uint32_t iFcode)
114  {  {
115      if (component == 0)      if (component == 0)
116                  return 1;                  return 1;
# Line 141  Line 118 
118      if (component < 0)      if (component < 0)
119                  component = -component;                  component = -component;
120    
121      if (iFcode == 1)          if (iFcode == 1) {
     {  
122                  if (component > 32)                  if (component > 32)
123                      component = 32;                      component = 32;
124    
# Line 159  Line 135 
135  }  }
136    
137    
138  static __inline uint32_t calc_delta_16(const int32_t dx, const int32_t dy, const uint32_t iFcode)  static __inline uint32_t
139  {  calc_delta_16(const int32_t dx,
140          return NEIGH_TEND_16X16 * (mv_bits(dx, iFcode) + mv_bits(dy, iFcode));                            const int32_t dy,
141  }                            const uint32_t iFcode,
142                              const uint32_t iQuant)
143  static __inline uint32_t calc_delta_8(const int32_t dx, const int32_t dy, const uint32_t iFcode)  {
144            return NEIGH_TEND_16X16 * lambda_vec16[iQuant] * (mv_bits(dx, iFcode) +
145  {                                                                                                            mv_bits(dy, iFcode));
146      return NEIGH_TEND_8X8 * (mv_bits(dx, iFcode) + mv_bits(dy, iFcode));  }
147  }  
148    static __inline uint32_t
149    calc_delta_8(const int32_t dx,
150                             const int32_t dy,
151                             const uint32_t iFcode,
152  /* calculate the min/max range (in halfpixels)                           const uint32_t iQuant)
153          relative to the _MACROBLOCK_ position  {
154  */          return NEIGH_TEND_8X8 * lambda_vec8[iQuant] * (mv_bits(dx, iFcode) +
155                                                                                                       mv_bits(dy, iFcode));
156  static void __inline get_range(  }
157                          int32_t * const min_dx, int32_t * const max_dx,  
158                          int32_t * const min_dy, int32_t * const max_dy,  bool
159                          const uint32_t x, const uint32_t y,  MotionEstimation(MBParam * const pParam,
160                          const uint32_t block_sz,                                        // block dimension, 8 or 16                                   FRAMEINFO * const current,
161                          const uint32_t width, const uint32_t height,                                   FRAMEINFO * const reference,
                         const uint32_t fcode)  
 {  
         const int search_range = 32 << (fcode - 1);  
     const int high = search_range - 1;  
     const int low = -search_range;  
   
         // convert full-pixel measurements to half pixel  
         const int hp_width = 2 * width;  
         const int hp_height = 2 * height;  
         const int hp_edge = 2 * block_sz;  
         const int hp_x = 2 * (x) * block_sz;            // we need _right end_ of block, not x-coordinate  
         const int hp_y = 2 * (y) * block_sz;            // same for _bottom end_  
   
     *max_dx = MIN(high, hp_width - hp_x);  
     *max_dy = MIN(high, hp_height - hp_y);  
     *min_dx = MAX(low,  -(hp_edge + hp_x));  
     *min_dy = MAX(low,  -(hp_edge + hp_y));  
 }  
   
   
 /* getref: calculate reference image pointer  
 the decision to use interpolation h/v/hv or the normal image is  
 based on dx & dy.  
 */  
   
 static __inline const uint8_t * get_ref(  
                                 const uint8_t * const refn,  
                                 const uint8_t * const refh,  
                                 const uint8_t * const refv,  
                                 const uint8_t * const refhv,  
                                 const uint32_t x, const uint32_t y,  
                                 const uint32_t block,                                   // block dimension, 8 or 16  
                                 const int32_t dx, const int32_t dy,  
                                 const uint32_t stride)  
 {  
         switch ( ((dx&1)<<1) + (dy&1) )         // ((dx%2)?2:0)+((dy%2)?1:0)  
     {  
         case 0 : return refn + (x*block+dx/2) + (y*block+dy/2)*stride;  
     case 1 : return refv + (x*block+dx/2) + (y*block+(dy-1)/2)*stride;  
         case 2 : return refh + (x*block+(dx-1)/2) + (y*block+dy/2)*stride;  
         default :  
         case 3 : return refhv + (x*block+(dx-1)/2) + (y*block+(dy-1)/2)*stride;  
         }  
 }  
   
   
 /* This is somehow a copy of get_ref, but with MV instead of X,Y */  
   
 static __inline const uint8_t * get_ref_mv(  
                                 const uint8_t * const refn,  
                                 const uint8_t * const refh,  
                                 const uint8_t * const refv,  
                                 const uint8_t * const refhv,  
                                 const uint32_t x, const uint32_t y,  
                                 const uint32_t block,                   // block dimension, 8 or 16  
                                 const VECTOR* mv,       // measured in half-pel!  
                                 const uint32_t stride)  
 {  
         switch ( (((mv->x)&1)<<1) + ((mv->y)&1) )  
     {  
         case 0 : return refn + (x*block+(mv->x)/2) + (y*block+(mv->y)/2)*stride;  
         case 1 : return refv + (x*block+(mv->x)/2) + (y*block+((mv->y)-1)/2)*stride;  
         case 2 : return refh + (x*block+((mv->x)-1)/2) + (y*block+(mv->y)/2)*stride;  
         default :  
         case 3 : return refhv + (x*block+((mv->x)-1)/2) + (y*block+((mv->y)-1)/2)*stride;  
         }  
 }  
   
 #ifndef SEARCH16  
 #define SEARCH16        PMVfastSearch16  
 #endif  
   
 #ifndef SEARCH8  
 #define SEARCH8         PMVfastSearch8  
 #endif  
   
 bool MotionEstimation(  
                         MACROBLOCK * const pMBs,  
                         MBParam * const pParam,  
                     const IMAGE * const pRef,  
162                          const IMAGE * const pRefH,                          const IMAGE * const pRefH,
163                      const IMAGE * const pRefV,                      const IMAGE * const pRefV,
164                          const IMAGE * const pRefHV,                          const IMAGE * const pRefHV,
                     IMAGE * const pCurrent,  
165                          const uint32_t iLimit)                          const uint32_t iLimit)
   
166  {  {
167      const uint32_t iWcount = pParam->mb_width;      const uint32_t iWcount = pParam->mb_width;
168      const uint32_t iHcount = pParam->mb_height;      const uint32_t iHcount = pParam->mb_height;
169            MACROBLOCK *const pMBs = current->mbs;
170            MACROBLOCK *const prevMBs = reference->mbs;
171            const IMAGE *const pCurrent = &current->image;
172            const IMAGE *const pRef = &reference->image;
173    
174          uint32_t i, j, iIntra = 0;          static const VECTOR zeroMV = { 0, 0 };
175            VECTOR predMV;
176    
177      VECTOR mv16;          int32_t x, y;
178      VECTOR pmv16;          int32_t iIntra = 0;
179            VECTOR pmv;
180    
181      int32_t sad8 = 0;          if (sadInit)
182      int32_t sad16;                  (*sadInit) ();
     int32_t deviation;  
183    
184          // note: i==horizontal, j==vertical          for (y = 0; y < iHcount; y++)   {
185      for (i = 0; i < iHcount; i++)                  for (x = 0; x < iWcount; x ++)  {
                 for (j = 0; j < iWcount; j++)  
                 {  
                         MACROBLOCK *pMB = &pMBs[j + i * iWcount];  
186    
187                          sad16 = SEARCH16(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent,                          MACROBLOCK *const pMB = &pMBs[x + y * iWcount];
                                           j, i, pParam->motion_flags,  
                                           pParam, pMBs, &mv16, &pmv16);  
                         pMB->sad16=sad16;  
188    
189                            predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);
190    
191                  /* decide: MODE_INTER or MODE_INTRA                          pMB->sad16 =
192                          if (dev_intra < sad_inter - 2 * nb) use_intra                                  SEARCH16(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent,
193                  */                                                   x, y, predMV.x, predMV.y, predMV.x, predMV.y,
194                                                     current->motion_flags, current->quant,
195                                                     current->fcode, pParam, pMBs, prevMBs, &pMB->mv16,
196                                                     &pMB->pmvs[0]);
197    
198                            if (0 < (pMB->sad16 - MV16_INTER_BIAS)) {
199                                    int32_t deviation;
200    
201                  deviation = dev16(pCurrent->y + j*16 + i*16*pParam->edged_width, pParam->edged_width);                                  deviation =
202                                            dev16(pCurrent->y + x * 16 + y * 16 * pParam->edged_width,
203                                                      pParam->edged_width);
204    
205                  if (deviation < (sad16 - INTER_BIAS))                                  if (deviation < (pMB->sad16 - MV16_INTER_BIAS)) {
                 {  
206                          pMB->mode = MODE_INTRA;                          pMB->mode = MODE_INTRA;
207                          pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = 0;                                          pMB->mv16 = pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] =
208                          pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = 0;                                                  pMB->mvs[3] = zeroMV;
209                                            pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] =
210                                                    pMB->sad8[3] = 0;
211    
212                          iIntra++;                          iIntra++;
213                          if(iIntra >= iLimit)                          if(iIntra >= iLimit)
# Line 312  Line 215 
215    
216                          continue;                          continue;
217                  }                  }
   
                 if (pParam->global_flags & XVID_INTER4V)  
                 {  
                         pMB->sad8[0] = SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent,  
                                         2 * j, 2 * i, mv16.x, mv16.y, pParam->motion_flags,  
                                         pParam, pMBs, &pMB->mvs[0], &pMB->pmvs[0]);  
   
                         pMB->sad8[1] = SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent,  
                                         2 * j + 1, 2 * i, mv16.x, mv16.y, pParam->motion_flags,  
                                         pParam, pMBs, &pMB->mvs[1], &pMB->pmvs[1]);  
   
                         pMB->sad8[2] = SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent,  
                                         2 * j, 2 * i + 1, mv16.x, mv16.y, pParam->motion_flags,  
                                         pParam, pMBs, &pMB->mvs[2], &pMB->pmvs[2]);  
   
                         pMB->sad8[3] = SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent,  
                                         2 * j + 1, 2 * i + 1, mv16.x, mv16.y, pParam->motion_flags,  
                                         pParam, pMBs, &pMB->mvs[3], &pMB->pmvs[3]);  
   
                         sad8 = pMB->sad8[0] + pMB->sad8[1] + pMB->sad8[2] + pMB->sad8[3];  
218                  }                  }
219    
220                            pmv = pMB->pmvs[0];
221                            if (current->global_flags & XVID_INTER4V)
222                                    if ((!(current->global_flags & XVID_LUMIMASKING) ||
223                                             pMB->dquant == NO_CHANGE)) {
224                                            int32_t sad8 = IMV16X16 * current->quant;
225    
226                                            if (sad8 < pMB->sad16) {
227                                                    sad8 += pMB->sad8[0] =
228                                                            SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,
229                                                                            pCurrent, 2 * x, 2 * y,
230                                                                            pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,
231                                                                            current->motion_flags,
232                                                                            current->quant, current->fcode, pParam,
233                                                                            pMBs, prevMBs, &pMB->mvs[0],
234                                                                            &pMB->pmvs[0]);
235                                            }
236                                            if (sad8 < pMB->sad16) {
237    
238                                                    predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 1);
239                                                    sad8 += pMB->sad8[1] =
240                                                            SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,
241                                                                            pCurrent, 2 * x + 1, 2 * y,
242                                                                            pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,
243                                                                            current->motion_flags,
244                                                                            current->quant, current->fcode, pParam,
245                                                                            pMBs, prevMBs, &pMB->mvs[1],
246                                                                            &pMB->pmvs[1]);
247                                            }
248                                            if (sad8 < pMB->sad16) {
249                                                    predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 2);
250                                                    sad8 += pMB->sad8[2] =
251                                                            SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,
252                                                                            pCurrent, 2 * x, 2 * y + 1,
253                                                                            pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,
254                                                                            current->motion_flags,
255                                                                            current->quant, current->fcode, pParam,
256                                                                            pMBs, prevMBs, &pMB->mvs[2],
257                                                                            &pMB->pmvs[2]);
258                                            }
259                                            if (sad8 < pMB->sad16) {
260                                                    predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 3);
261                                                    sad8 += pMB->sad8[3] =
262                                                            SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,
263                                                                            pCurrent, 2 * x + 1, 2 * y + 1,
264                                                                            pMB->mv16.x, pMB->mv16.y, predMV.x, predMV.y,
265                                                                            current->motion_flags,
266                                                                            current->quant, current->fcode, pParam,
267                                                                            pMBs, prevMBs,
268                                                                            &pMB->mvs[3],
269                                                                            &pMB->pmvs[3]);
270                                            }
271    
272                  /* decide: MODE_INTER or MODE_INTER4V                  /* decide: MODE_INTER or MODE_INTER4V
273                          mpeg4:   if (sad8 < sad16 - nb/2+1) use_inter4v                                             mpeg4:   if (sad8 < pMB->sad16 - nb/2+1) use_inter4v
274                  */                  */
275    
276                  if (pMB->dquant == NO_CHANGE) {                                          if (sad8 < pMB->sad16) {
                         if (((pParam->global_flags & XVID_INTER4V)==0) ||  
                                 (sad16 < (sad8 + (int32_t)(IMV16X16 * pParam->quant)))) {  
   
                                 sad8 = sad16;  
                                 pMB->mode = MODE_INTER;  
                                 pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = mv16.x;  
                                 pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = mv16.y;  
                                 pMB->pmvs[0].x = pmv16.x;  
                                 pMB->pmvs[0].y = pmv16.y;  
                         }  
                         else  
277                                  pMB->mode = MODE_INTER4V;                                  pMB->mode = MODE_INTER4V;
278                                                    pMB->sad8[0] *= 4;
279                                                    pMB->sad8[1] *= 4;
280                                                    pMB->sad8[2] *= 4;
281                                                    pMB->sad8[3] *= 4;
282                                                    continue;
283                  }                  }
284                  else  
285                  {                                  }
286                          sad8 = sad16;  
287                          pMB->mode = MODE_INTER;                          pMB->mode = MODE_INTER;
288                          pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = mv16.x;                          pMB->pmvs[0] = pmv;     /* pMB->pmvs[1] = pMB->pmvs[2] = pMB->pmvs[3]  are not needed for INTER */
289                          pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = mv16.y;                          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->mv16;
290                          pMB->pmvs[0].x = pmv16.x;                          pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] =
291                          pMB->pmvs[0].y = pmv16.y;                                  pMB->sad16;
292                  }                  }
293          }          }
294    
295          return 0;          return 0;
296  }  }
297    
 #define MVzero(A) ( ((A).x)==(0) && ((A).y)==(0) )  
   
 #define MVequal(A,B) ( ((A).x)==((B).x) && ((A).y)==((B).y) )  
   
298    
299  #define CHECK_MV16_ZERO {\  #define CHECK_MV16_ZERO {\
300    if ( (0 <= max_dx) && (0 >= min_dx) \    if ( (0 <= max_dx) && (0 >= min_dx) \
301      && (0 <= max_dy) && (0 >= min_dy) ) \      && (0 <= max_dy) && (0 >= min_dy) ) \
302    { \    { \
303      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0, 0 , iEdgedWidth), iEdgedWidth, MV_MAX_ERROR); \      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0, 0 , iEdgedWidth), iEdgedWidth, MV_MAX_ERROR); \
304      iSAD += calc_delta_16(-pmv[0].x, -pmv[0].y, (uint8_t)iFcode) * iQuant;\      iSAD += calc_delta_16(-center_x, -center_y, (uint8_t)iFcode, iQuant);\
     if (iSAD <= iQuant * 96)    \  
         iSAD -= MV16_00_BIAS; \  
305      if (iSAD < iMinSAD) \      if (iSAD < iMinSAD) \
306      {  iMinSAD=iSAD; currMV->x=0; currMV->y=0; }  }     \      {  iMinSAD=iSAD; currMV->x=0; currMV->y=0; }  }     \
307  }  }
308    
309    #define NOCHECK_MV16_CANDIDATE(X,Y) { \
310        iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
311        iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
312        if (iSAD < iMinSAD) \
313        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \
314    }
315    
316  #define CHECK_MV16_CANDIDATE(X,Y) { \  #define CHECK_MV16_CANDIDATE(X,Y) { \
317    if ( ((X) <= max_dx) && ((X) >= min_dx) \    if ( ((X) <= max_dx) && ((X) >= min_dx) \
318      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
319    { \    { \
320      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
321      iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode) * iQuant;\      iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
322      if (iSAD < iMinSAD) \      if (iSAD < iMinSAD) \
323      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \
324  }  }
# Line 400  Line 328 
328      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
329    { \    { \
330      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
331      iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode) * iQuant;\      iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
332      if (iSAD < iMinSAD) \      if (iSAD < iMinSAD) \
333      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \
334  }  }
# Line 410  Line 338 
338      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
339    { \    { \
340      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
341      iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode) * iQuant;\      iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
342      if (iSAD < iMinSAD) \      if (iSAD < iMinSAD) \
343      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \
344  }  }
# Line 418  Line 346 
346    
347  #define CHECK_MV8_ZERO {\  #define CHECK_MV8_ZERO {\
348    iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, 0, 0 , iEdgedWidth), iEdgedWidth); \    iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, 0, 0 , iEdgedWidth), iEdgedWidth); \
349    iSAD += calc_delta_8(-pmv[0].x, -pmv[0].y, (uint8_t)iFcode) * iQuant;\    iSAD += calc_delta_8(-center_x, -center_y, (uint8_t)iFcode, iQuant);\
350    if (iSAD < iMinSAD) \    if (iSAD < iMinSAD) \
351    { iMinSAD=iSAD; currMV->x=0; currMV->y=0; } \    { iMinSAD=iSAD; currMV->x=0; currMV->y=0; } \
352  }  }
353    
354    #define NOCHECK_MV8_CANDIDATE(X,Y) \
355      { \
356        iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \
357        iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\
358        if (iSAD < iMinSAD) \
359        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \
360    }
361    
362  #define CHECK_MV8_CANDIDATE(X,Y) { \  #define CHECK_MV8_CANDIDATE(X,Y) { \
363    if ( ((X) <= max_dx) && ((X) >= min_dx) \    if ( ((X) <= max_dx) && ((X) >= min_dx) \
364      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
365    { \    { \
366      iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \      iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \
367      iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode) * iQuant;\      iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\
368      if (iSAD < iMinSAD) \      if (iSAD < iMinSAD) \
369      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \
370  }  }
# Line 439  Line 374 
374      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
375    { \    { \
376      iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \      iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \
377      iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode) * iQuant;\      iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\
378      if (iSAD < iMinSAD) \      if (iSAD < iMinSAD) \
379      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \
380  }  }
# Line 449  Line 384 
384      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
385    { \    { \
386      iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \      iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \
387      iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode) * iQuant;\      iSAD += calc_delta_8((X)-center_x, (Y)-center_y, (uint8_t)iFcode, iQuant);\
388      if (iSAD < iMinSAD) \      if (iSAD < iMinSAD) \
389      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \      {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \
390  }  }
# Line 464  Line 399 
399                                          const IMAGE * const pCur,                                          const IMAGE * const pCur,
400                                          const int x, const int y,                                          const int x, const int y,
401                                          const uint32_t MotionFlags,                                          const uint32_t MotionFlags,
402                                            const uint32_t iQuant,
403                                            const uint32_t iFcode,
404                                          MBParam * const pParam,                                          MBParam * const pParam,
405                                          MACROBLOCK * const pMBs,                                          const MACROBLOCK * const pMBs,
406                                            const MACROBLOCK * const prevMBs,
407                                          VECTOR * const currMV,                                          VECTOR * const currMV,
408                                          VECTOR * const currPMV)                                          VECTOR * const currPMV)
409  {  {
410          const int32_t iEdgedWidth = pParam->edged_width;          const int32_t iEdgedWidth = pParam->edged_width;
         const int32_t iQuant = pParam->quant;  
411          const uint8_t * cur = pCur->y + x*16 + y*16*iEdgedWidth;          const uint8_t * cur = pCur->y + x*16 + y*16*iEdgedWidth;
412          int32_t iSAD;          int32_t iSAD;
413          int32_t pred_x,pred_y;          VECTOR pred;
414    
415          get_pmv(pMBs, x, y, pParam->mb_width, 0, &pred_x, &pred_y);  
416            pred = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);
417    
418          iSAD = sad16( cur,          iSAD = sad16( cur,
419                  get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0,0, iEdgedWidth),                  get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0,0, iEdgedWidth),
# Line 485  Line 423 
423    
424          currMV->x = 0;          currMV->x = 0;
425          currMV->y = 0;          currMV->y = 0;
426          currPMV->x = -pred_x;          currPMV->x = -pred.x;
427          currPMV->y = -pred_y;          currPMV->y = -pred.y;
428    
429          return iSAD;          return iSAD;
430    
431  }  }
432  */  */
433    
434  int32_t PMVfastSearch16_MainSearch(  int32_t
435                                          const uint8_t * const pRef,  Diamond16_MainSearch(const uint8_t * const pRef,
436                                          const uint8_t * const pRefH,                                          const uint8_t * const pRefH,
437                                          const uint8_t * const pRefV,                                          const uint8_t * const pRefV,
438                                          const uint8_t * const pRefHV,                                          const uint8_t * const pRefHV,
439                                          const uint8_t * const cur,                                          const uint8_t * const cur,
440                                          const int x, const int y,                                           const int x,
441                                          int32_t startx, int32_t starty,                                           const int y,
442                                          int32_t iMinSAD,                                     const int start_x,
443                                       const int start_y,
444                                       int iMinSAD,
445                                          VECTOR * const currMV,                                          VECTOR * const currMV,
446                                          const VECTOR * const pmv,                                     const int center_x,
447                                          const int32_t min_dx, const int32_t max_dx,                                     const int center_y,
448                                          const int32_t min_dy, const int32_t max_dy,                                           const int32_t min_dx,
449                                             const int32_t max_dx,
450                                             const int32_t min_dy,
451                                             const int32_t max_dy,
452                                          const int32_t iEdgedWidth,                                          const int32_t iEdgedWidth,
453                                          const int32_t iDiamondSize,                                          const int32_t iDiamondSize,
454                                          const int32_t iFcode,                                          const int32_t iFcode,
# Line 517  Line 460 
460          int32_t iDirection=0;          int32_t iDirection=0;
461          int32_t iSAD;          int32_t iSAD;
462          VECTOR backupMV;          VECTOR backupMV;
463          backupMV.x = startx;  
464          backupMV.y = starty;          backupMV.x = start_x;
465            backupMV.y = start_y;
466    
467  /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */
468    
# Line 528  Line 472 
472          CHECK_MV16_CANDIDATE_DIR(backupMV.x,backupMV.y+iDiamondSize,4);          CHECK_MV16_CANDIDATE_DIR(backupMV.x,backupMV.y+iDiamondSize,4);
473    
474          if (iDirection)          if (iDirection)
475                  while (!iFound)                  while (!iFound) {
                 {  
476                          iFound = 1;                          iFound = 1;
477                          backupMV=*currMV;                          backupMV=*currMV;
478    
479                          if ( iDirection != 2)                          if ( iDirection != 2)
480                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x-iDiamondSize,backupMV.y,1);                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,
481                                                                                       backupMV.y, 1);
482                          if ( iDirection != 1)                          if ( iDirection != 1)
483                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x+iDiamondSize,backupMV.y,2);                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x + iDiamondSize,
484                                                                                       backupMV.y, 2);
485                          if ( iDirection != 4)                          if ( iDirection != 4)
486                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x,backupMV.y-iDiamondSize,3);                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x,
487                                                                                       backupMV.y - iDiamondSize, 3);
488                          if ( iDirection != 3)                          if ( iDirection != 3)
489                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x,backupMV.y+iDiamondSize,4);                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x,
490                  }                                                                                     backupMV.y + iDiamondSize, 4);
491          else          } else {
492                  {                  currMV->x = start_x;
493                          currMV->x = startx;                  currMV->y = start_y;
                         currMV->y = starty;  
494                  }                  }
495          return iMinSAD;          return iMinSAD;
496  }  }
497    
498  int32_t PMVfastSearch16_Refine(  int32_t
499                                          const uint8_t * const pRef,  Square16_MainSearch(const uint8_t * const pRef,
500                                          const uint8_t * const pRefH,                                          const uint8_t * const pRefH,
501                                          const uint8_t * const pRefV,                                          const uint8_t * const pRefV,
502                                          const uint8_t * const pRefHV,                                          const uint8_t * const pRefHV,
503                                          const uint8_t * const cur,                                          const uint8_t * const cur,
504                                          const int x, const int y,                                          const int x,
505                                            const int y,
506                                       const int start_x,
507                                       const int start_y,
508                                       int iMinSAD,
509                                          VECTOR * const currMV,                                          VECTOR * const currMV,
510                                          int32_t iMinSAD,                                     const int center_x,
511                                          const VECTOR * const pmv,                                     const int center_y,
512                                          const int32_t min_dx, const int32_t max_dx,                                          const int32_t min_dx,
513                                          const int32_t min_dy, const int32_t max_dy,                                          const int32_t max_dx,
514                                            const int32_t min_dy,
515                                            const int32_t max_dy,
516                                            const int32_t iEdgedWidth,
517                                            const int32_t iDiamondSize,
518                                          const int32_t iFcode,                                          const int32_t iFcode,
519                                          const int32_t iQuant,                                          const int32_t iQuant,
520                                          const int32_t iEdgedWidth)                                          int iFound)
521  {  {
522  /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */  /* Do a square search around given starting point, return SAD of best */
523    
524            int32_t iDirection = 0;
525          int32_t iSAD;          int32_t iSAD;
526          VECTOR backupMV = *currMV;          VECTOR backupMV;
527    
528          CHECK_MV16_CANDIDATE(backupMV.x-1,backupMV.y-1);          backupMV.x = start_x;
529          CHECK_MV16_CANDIDATE(backupMV.x  ,backupMV.y-1);          backupMV.y = start_y;
530          CHECK_MV16_CANDIDATE(backupMV.x+1,backupMV.y-1);  
531          CHECK_MV16_CANDIDATE(backupMV.x-1,backupMV.y);  /* It's one search with full square pattern, and new parts for all following diamonds */
532          CHECK_MV16_CANDIDATE(backupMV.x+1,backupMV.y);  
533          CHECK_MV16_CANDIDATE(backupMV.x-1,backupMV.y+1);  /*   new direction are extra, so 1-4 is normal diamond
534          CHECK_MV16_CANDIDATE(backupMV.x  ,backupMV.y+1);        537
535          CHECK_MV16_CANDIDATE(backupMV.x+1,backupMV.y+1);        1*2
536          648
537    */
538    
539            CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);
540            CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);
541            CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);
542            CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);
543    
544            CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
545                                                             backupMV.y - iDiamondSize, 5);
546            CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
547                                                             backupMV.y + iDiamondSize, 6);
548            CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
549                                                             backupMV.y - iDiamondSize, 7);
550            CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
551                                                             backupMV.y + iDiamondSize, 8);
552    
553    
554            if (iDirection)
555                    while (!iFound) {
556                            iFound = 1;
557                            backupMV = *currMV;
558    
559                            switch (iDirection) {
560                            case 1:
561                                    CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,
562                                                                                       backupMV.y, 1);
563                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
564                                                                                     backupMV.y - iDiamondSize, 5);
565                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
566                                                                                     backupMV.y - iDiamondSize, 7);
567                                    break;
568                            case 2:
569                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,
570                                                                                     2);
571                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
572                                                                                     backupMV.y + iDiamondSize, 6);
573                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
574                                                                                     backupMV.y + iDiamondSize, 8);
575                                    break;
576    
577                            case 3:
578                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,
579                                                                                     4);
580                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
581                                                                                     backupMV.y - iDiamondSize, 7);
582                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
583                                                                                     backupMV.y + iDiamondSize, 8);
584                                    break;
585    
586                            case 4:
587                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,
588                                                                                     3);
589                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
590                                                                                     backupMV.y - iDiamondSize, 5);
591                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
592                                                                                     backupMV.y + iDiamondSize, 6);
593                                    break;
594    
595                            case 5:
596                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,
597                                                                                     1);
598                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,
599                                                                                     3);
600                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
601                                                                                     backupMV.y - iDiamondSize, 5);
602                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
603                                                                                     backupMV.y + iDiamondSize, 6);
604                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
605                                                                                     backupMV.y - iDiamondSize, 7);
606                                    break;
607    
608                            case 6:
609                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,
610                                                                                     2);
611                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,
612                                                                                     3);
613    
614                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
615                                                                                     backupMV.y - iDiamondSize, 5);
616                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
617                                                                                     backupMV.y + iDiamondSize, 6);
618                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
619                                                                                     backupMV.y + iDiamondSize, 8);
620    
621                                    break;
622    
623                            case 7:
624                                    CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,
625                                                                                       backupMV.y, 1);
626                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,
627                                                                                     4);
628                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
629                                                                                     backupMV.y - iDiamondSize, 5);
630                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
631                                                                                     backupMV.y - iDiamondSize, 7);
632                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
633                                                                                     backupMV.y + iDiamondSize, 8);
634                                    break;
635    
636                            case 8:
637                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,
638                                                                                     2);
639                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,
640                                                                                     4);
641                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
642                                                                                     backupMV.y + iDiamondSize, 6);
643                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
644                                                                                     backupMV.y - iDiamondSize, 7);
645                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
646                                                                                     backupMV.y + iDiamondSize, 8);
647                                    break;
648                            default:
649                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,
650                                                                                     1);
651                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,
652                                                                                     2);
653                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,
654                                                                                     3);
655                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,
656                                                                                     4);
657    
658                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
659                                                                                     backupMV.y - iDiamondSize, 5);
660                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,
661                                                                                     backupMV.y + iDiamondSize, 6);
662                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
663                                                                                     backupMV.y - iDiamondSize, 7);
664                                    CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,
665                                                                                     backupMV.y + iDiamondSize, 8);
666                                    break;
667                            }
668            } else {
669                    currMV->x = start_x;
670                    currMV->y = start_y;
671            }
672          return iMinSAD;          return iMinSAD;
673  }  }
674    
 #define PMV_HALFPEL16 (PMV_HALFPELDIAMOND16|PMV_HALFPELREFINE16)  
675    
676  int32_t PMVfastSearch16(  int32_t
677                                          const uint8_t * const pRef,  Full16_MainSearch(const uint8_t * const pRef,
678                                          const uint8_t * const pRefH,                                          const uint8_t * const pRefH,
679                                          const uint8_t * const pRefV,                                          const uint8_t * const pRefV,
680                                          const uint8_t * const pRefHV,                                          const uint8_t * const pRefHV,
681                                          const IMAGE * const pCur,                                    const uint8_t * const cur,
682                                          const int x, const int y,                                    const int x,
683                                          const uint32_t MotionFlags,                                    const int y,
684                                          MBParam * const pParam,                                     const int start_x,
685                                          MACROBLOCK * const pMBs,                                     const int start_y,
686                                       int iMinSAD,
687                                          VECTOR * const currMV,                                          VECTOR * const currMV,
688                                          VECTOR * const currPMV)                                     const int center_x,
689                                       const int center_y,
690                                      const int32_t min_dx,
691                                      const int32_t max_dx,
692                                      const int32_t min_dy,
693                                      const int32_t max_dy,
694                                      const int32_t iEdgedWidth,
695                                      const int32_t iDiamondSize,
696                                      const int32_t iFcode,
697                                      const int32_t iQuant,
698                                      int iFound)
699  {  {
700          const uint32_t iWcount = pParam->mb_width;          int32_t iSAD;
701          const int32_t iFcode = pParam->fixed_code;          int32_t dx, dy;
702          const int32_t iQuant = pParam->quant;          VECTOR backupMV;
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
703    
704          const uint8_t * cur = pCur->y + x*16 + y*16*iEdgedWidth;          backupMV.x = start_x;
705            backupMV.y = start_y;
706    
707          int32_t iDiamondSize;          for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)
708                    for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)
709                            NOCHECK_MV16_CANDIDATE(dx, dy);
710    
711          int32_t min_dx;          return iMinSAD;
712          int32_t max_dx;  }
         int32_t min_dy;  
         int32_t max_dy;  
713    
714          int32_t iFound;  int32_t
715    AdvDiamond16_MainSearch(const uint8_t * const pRef,
716                                                    const uint8_t * const pRefH,
717                                                    const uint8_t * const pRefV,
718                                                    const uint8_t * const pRefHV,
719                                                    const uint8_t * const cur,
720                                                    const int x,
721                                                    const int y,
722                                               int start_x,
723                                               int start_y,
724                                               int iMinSAD,
725                                               VECTOR * const currMV,
726                                               const int center_x,
727                                               const int center_y,
728                                                    const int32_t min_dx,
729                                                    const int32_t max_dx,
730                                                    const int32_t min_dy,
731                                                    const int32_t max_dy,
732                                                    const int32_t iEdgedWidth,
733                                                    const int32_t iDiamondSize,
734                                                    const int32_t iFcode,
735                                                    const int32_t iQuant,
736                                                    int iDirection)
737    {
738    
739          VECTOR newMV;          int32_t iSAD;
         VECTOR backupMV;        /* just for PMVFAST */  
740    
741          VECTOR pmv[4];  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
         int32_t psad[4];  
742    
743          MACROBLOCK * const pMB = pMBs + x + y * iWcount;          if (iDirection) {
744                    CHECK_MV16_CANDIDATE(start_x - iDiamondSize, start_y);
745                    CHECK_MV16_CANDIDATE(start_x + iDiamondSize, start_y);
746                    CHECK_MV16_CANDIDATE(start_x, start_y - iDiamondSize);
747                    CHECK_MV16_CANDIDATE(start_x, start_y + iDiamondSize);
748            } else {
749                    int bDirection = 1 + 2 + 4 + 8;
750    
751                    do {
752                            iDirection = 0;
753                            if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)
754                                    CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);
755    
756                            if (bDirection & 2)
757                                    CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);
758    
759                            if (bDirection & 4)
760                                    CHECK_MV16_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);
761    
762                            if (bDirection & 8)
763                                    CHECK_MV16_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);
764    
765                            /* now we're doing diagonal checks near our candidate */
766    
767                            if (iDirection)         //checking if anything found
768                            {
769                                    bDirection = iDirection;
770                                    iDirection = 0;
771                                    start_x = currMV->x;
772                                    start_y = currMV->y;
773                                    if (bDirection & 3)     //our candidate is left or right
774                                    {
775                                            CHECK_MV16_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);
776                                            CHECK_MV16_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);
777                                    } else                  // what remains here is up or down
778                                    {
779                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);
780                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);
781                                    }
782    
783                                    if (iDirection) {
784                                            bDirection += iDirection;
785                                            start_x = currMV->x;
786                                            start_y = currMV->y;
787                                    }
788                            } else                          //about to quit, eh? not so fast....
789                            {
790                                    switch (bDirection) {
791                                    case 2:
792                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
793                                                                                             start_y - iDiamondSize, 2 + 4);
794                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
795                                                                                             start_y + iDiamondSize, 2 + 8);
796                                            break;
797                                    case 1:
798    
799                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
800                                                                                             start_y - iDiamondSize, 1 + 4);
801                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
802                                                                                             start_y + iDiamondSize, 1 + 8);
803                                            break;
804                                    case 2 + 4:
805                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
806                                                                                             start_y - iDiamondSize, 1 + 4);
807                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
808                                                                                             start_y - iDiamondSize, 2 + 4);
809                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
810                                                                                             start_y + iDiamondSize, 2 + 8);
811                                            break;
812                                    case 4:
813                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
814                                                                                             start_y - iDiamondSize, 2 + 4);
815                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
816                                                                                             start_y - iDiamondSize, 1 + 4);
817                                            break;
818                                    case 8:
819                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
820                                                                                             start_y + iDiamondSize, 2 + 8);
821                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
822                                                                                             start_y + iDiamondSize, 1 + 8);
823                                            break;
824                                    case 1 + 4:
825                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
826                                                                                             start_y + iDiamondSize, 1 + 8);
827                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
828                                                                                             start_y - iDiamondSize, 1 + 4);
829                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
830                                                                                             start_y - iDiamondSize, 2 + 4);
831                                            break;
832                                    case 2 + 8:
833                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
834                                                                                             start_y - iDiamondSize, 1 + 4);
835                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
836                                                                                             start_y + iDiamondSize, 1 + 8);
837                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
838                                                                                             start_y + iDiamondSize, 2 + 8);
839                                            break;
840                                    case 1 + 8:
841                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
842                                                                                             start_y - iDiamondSize, 2 + 4);
843                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
844                                                                                             start_y + iDiamondSize, 2 + 8);
845                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
846                                                                                             start_y + iDiamondSize, 1 + 8);
847                                            break;
848                                    default:                //1+2+4+8 == we didn't find anything at all
849                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
850                                                                                             start_y - iDiamondSize, 1 + 4);
851                                            CHECK_MV16_CANDIDATE_DIR(start_x - iDiamondSize,
852                                                                                             start_y + iDiamondSize, 1 + 8);
853                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
854                                                                                             start_y - iDiamondSize, 2 + 4);
855                                            CHECK_MV16_CANDIDATE_DIR(start_x + iDiamondSize,
856                                                                                             start_y + iDiamondSize, 2 + 8);
857                                            break;
858                                    }
859                                    if (!iDirection)
860                                            break;          //ok, the end. really
861                                    else {
862                                            bDirection = iDirection;
863                                            start_x = currMV->x;
864                                            start_y = currMV->y;
865                                    }
866                            }
867                    }
868                    while (1);                              //forever
869            }
870            return iMinSAD;
871    }
872    
         static int32_t threshA,threshB;  
         int32_t bPredEq;  
         int32_t iMinSAD,iSAD;  
873    
874  /* Get maximum range */  #define CHECK_MV16_F_INTERPOL(X,Y,BX,BY) { \
875          get_range(&min_dx, &max_dx, &min_dy, &max_dy,    if ( ((X) <= max_dx) && ((X) >= min_dx) \
876                          x, y, 16, iWidth, iHeight, iFcode);      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
877      { \
878        iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
879        iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
880        if (iSAD < iMinSAD) \
881        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \
882    }
883    
884  /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */  #define CHECK_MV16_F_INTERPOL_DIR(X,Y,BX,BY,D) { \
885      if ( ((X) <= max_dx) && ((X) >= min_dx) \
886        && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
887      { \
888        iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
889        iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
890        if (iSAD < iMinSAD) \
891        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \
892    }
893    
894          if (!(MotionFlags & PMV_HALFPEL16 ))  #define CHECK_MV16_F_INTERPOL_FOUND(X,Y,BX,BY,D) { \
895          { min_dx = EVEN(min_dx);    if ( ((X) <= max_dx) && ((X) >= min_dx) \
896            max_dx = EVEN(max_dx);      && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
897            min_dy = EVEN(min_dy);    { \
898            max_dy = EVEN(max_dy);      iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
899          }               /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */      iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
900        if (iSAD < iMinSAD) \
901        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \
902    }
903    
904    
905          bPredEq  = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);  #define CHECK_MV16_B_INTERPOL(FX,FY,X,Y) { \
906      if ( ((X) <= max_dx) && ((X) >= min_dx) \
907        && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
908      { \
909        iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
910        iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
911        if (iSAD < iMinSAD) \
912        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \
913    }
914    
         if ((x==0) && (y==0) )  
         {  
                 threshA =  512;  
                 threshB = 1024;  
915    
916          }  #define CHECK_MV16_B_INTERPOL_DIR(FX,FY,X,Y,D) { \
917          else    if ( ((X) <= max_dx) && ((X) >= min_dx) \
918        && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
919      { \
920        iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
921        iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
922        if (iSAD < iMinSAD) \
923        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \
924    }
925    
926    
927    #define CHECK_MV16_B_INTERPOL_FOUND(FX,FY,X,Y,D) { \
928      if ( ((X) <= max_dx) && ((X) >= min_dx) \
929        && ((Y) <= max_dy) && ((Y) >= min_dy) ) \
930      { \
931        iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \
932        iSAD += calc_delta_16((X) - center_x, (Y) - center_y, (uint8_t)iFcode, iQuant);\
933        if (iSAD < iMinSAD) \
934        {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \
935    }
936    
937    
938    #if (0==1)
939    int32_t
940    Diamond16_InterpolMainSearch(
941                                            const uint8_t * const f_pRef,
942                                             const uint8_t * const f_pRefH,
943                                             const uint8_t * const f_pRefV,
944                                             const uint8_t * const f_pRefHV,
945                                             const uint8_t * const cur,
946    
947                                            const uint8_t * const b_pRef,
948                                             const uint8_t * const b_pRefH,
949                                             const uint8_t * const b_pRefV,
950                                             const uint8_t * const b_pRefHV,
951    
952                                             const int x,
953                                             const int y,
954    
955                                       const int f_start_x,
956                                       const int f_start_y,
957                                       const int b_start_x,
958                                       const int b_start_y,
959    
960                                       int iMinSAD,
961                                       VECTOR * const f_currMV,
962                                       VECTOR * const b_currMV,
963    
964                                       const int f_center_x,
965                                       const int f_center_y,
966                                       const int b_center_x,
967                                       const int b_center_y,
968    
969                                             const int32_t min_dx,
970                                             const int32_t max_dx,
971                                             const int32_t min_dy,
972                                             const int32_t max_dy,
973                                             const int32_t iEdgedWidth,
974                                             const int32_t iDiamondSize,
975    
976                                             const int32_t f_iFcode,
977                                             const int32_t b_iFcode,
978    
979                                             const int32_t iQuant,
980                                             int iFound)
981          {          {
982                  threshA = psad[0];  /* Do a diamond search around given starting point, return SAD of best */
983                  threshB = threshA+256;  
984                  if (threshA< 512) threshA =  512;          int32_t f_iDirection = 0;
985                  if (threshA>1024) threshA = 1024;          int32_t b_iDirection = 0;
986                  if (threshB>1792) threshB = 1792;          int32_t iSAD;
987    
988            VECTOR f_backupMV;
989            VECTOR b_backupMV;
990    
991            f_backupMV.x = start_x;
992            f_backupMV.y = start_y;
993            b_backupMV.x = start_x;
994            b_backupMV.y = start_y;
995    
996    /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */
997    
998            CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);
999            CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);
1000            CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);
1001            CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);
1002    
1003            if (iDirection)
1004                    while (!iFound) {
1005                            iFound = 1;
1006                            backupMV = *currMV;
1007    
1008                            if (iDirection != 2)
1009                                    CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,
1010                                                                                       backupMV.y, 1);
1011                            if (iDirection != 1)
1012                                    CHECK_MV16_CANDIDATE_FOUND(backupMV.x + iDiamondSize,
1013                                                                                       backupMV.y, 2);
1014                            if (iDirection != 4)
1015                                    CHECK_MV16_CANDIDATE_FOUND(backupMV.x,
1016                                                                                       backupMV.y - iDiamondSize, 3);
1017                            if (iDirection != 3)
1018                                    CHECK_MV16_CANDIDATE_FOUND(backupMV.x,
1019                                                                                       backupMV.y + iDiamondSize, 4);
1020            } else {
1021                    currMV->x = start_x;
1022                    currMV->y = start_y;
1023            }
1024            return iMinSAD;
1025          }          }
1026    #endif
1027    
         iFound=0;  
1028    
1029  /* Step 2: Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  int32_t
1030          vector of the median.  AdvDiamond8_MainSearch(const uint8_t * const pRef,
1031          If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2                                             const uint8_t * const pRefH,
1032  */                                             const uint8_t * const pRefV,
1033                                               const uint8_t * const pRefHV,
1034                                               const uint8_t * const cur,
1035                                               const int x,
1036                                               const int y,
1037                                               int start_x,
1038                                               int start_y,
1039                                               int iMinSAD,
1040                                               VECTOR * const currMV,
1041                                               const int center_x,
1042                                               const int center_y,
1043                                               const int32_t min_dx,
1044                                               const int32_t max_dx,
1045                                               const int32_t min_dy,
1046                                               const int32_t max_dy,
1047                                               const int32_t iEdgedWidth,
1048                                               const int32_t iDiamondSize,
1049                                               const int32_t iFcode,
1050                                               const int32_t iQuant,
1051                                               int iDirection)
1052    {
1053    
1054          if ((bPredEq) && (MVequal(pmv[0],pMB->mvs[0]) ) )          int32_t iSAD;
                 iFound=2;  
1055    
1056  /* Step 3: If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
         Otherwise select large Diamond Search.  
 */  
1057    
1058          if ( (pmv[0].x != 0) || (pmv[0].y != 0) || (threshB<1536) || (bPredEq) )          if (iDirection) {
1059                  iDiamondSize=1; // halfpel!                  CHECK_MV8_CANDIDATE(start_x - iDiamondSize, start_y);
1060          else                  CHECK_MV8_CANDIDATE(start_x + iDiamondSize, start_y);
1061                  iDiamondSize=2; // halfpel!                  CHECK_MV8_CANDIDATE(start_x, start_y - iDiamondSize);
1062                    CHECK_MV8_CANDIDATE(start_x, start_y + iDiamondSize);
1063            } else {
1064                    int bDirection = 1 + 2 + 4 + 8;
1065    
1066                    do {
1067                            iDirection = 0;
1068                            if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)
1069                                    CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);
1070    
1071                            if (bDirection & 2)
1072                                    CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);
1073    
1074                            if (bDirection & 4)
1075                                    CHECK_MV8_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);
1076    
1077                            if (bDirection & 8)
1078                                    CHECK_MV8_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);
1079    
1080                            /* now we're doing diagonal checks near our candidate */
1081    
1082                            if (iDirection)         //checking if anything found
1083                            {
1084                                    bDirection = iDirection;
1085                                    iDirection = 0;
1086                                    start_x = currMV->x;
1087                                    start_y = currMV->y;
1088                                    if (bDirection & 3)     //our candidate is left or right
1089                                    {
1090                                            CHECK_MV8_CANDIDATE_DIR(start_x, start_y + iDiamondSize, 8);
1091                                            CHECK_MV8_CANDIDATE_DIR(start_x, start_y - iDiamondSize, 4);
1092                                    } else                  // what remains here is up or down
1093                                    {
1094                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize, start_y, 2);
1095                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize, start_y, 1);
1096                                    }
1097    
1098                                    if (iDirection) {
1099                                            bDirection += iDirection;
1100                                            start_x = currMV->x;
1101                                            start_y = currMV->y;
1102                                    }
1103                            } else                          //about to quit, eh? not so fast....
1104                            {
1105                                    switch (bDirection) {
1106                                    case 2:
1107                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1108                                                                                            start_y - iDiamondSize, 2 + 4);
1109                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1110                                                                                            start_y + iDiamondSize, 2 + 8);
1111                                            break;
1112                                    case 1:
1113                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1114                                                                                            start_y - iDiamondSize, 1 + 4);
1115                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1116                                                                                            start_y + iDiamondSize, 1 + 8);
1117                                            break;
1118                                    case 2 + 4:
1119                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1120                                                                                            start_y - iDiamondSize, 1 + 4);
1121                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1122                                                                                            start_y - iDiamondSize, 2 + 4);
1123                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1124                                                                                            start_y + iDiamondSize, 2 + 8);
1125                                            break;
1126                                    case 4:
1127                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1128                                                                                            start_y - iDiamondSize, 2 + 4);
1129                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1130                                                                                            start_y - iDiamondSize, 1 + 4);
1131                                            break;
1132                                    case 8:
1133                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1134                                                                                            start_y + iDiamondSize, 2 + 8);
1135                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1136                                                                                            start_y + iDiamondSize, 1 + 8);
1137                                            break;
1138                                    case 1 + 4:
1139                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1140                                                                                            start_y + iDiamondSize, 1 + 8);
1141                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1142                                                                                            start_y - iDiamondSize, 1 + 4);
1143                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1144                                                                                            start_y - iDiamondSize, 2 + 4);
1145                                            break;
1146                                    case 2 + 8:
1147                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1148                                                                                            start_y - iDiamondSize, 1 + 4);
1149                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1150                                                                                            start_y + iDiamondSize, 1 + 8);
1151                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1152                                                                                            start_y + iDiamondSize, 2 + 8);
1153                                            break;
1154                                    case 1 + 8:
1155                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1156                                                                                            start_y - iDiamondSize, 2 + 4);
1157                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1158                                                                                            start_y + iDiamondSize, 2 + 8);
1159                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1160                                                                                            start_y + iDiamondSize, 1 + 8);
1161                                            break;
1162                                    default:                //1+2+4+8 == we didn't find anything at all
1163                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1164                                                                                            start_y - iDiamondSize, 1 + 4);
1165                                            CHECK_MV8_CANDIDATE_DIR(start_x - iDiamondSize,
1166                                                                                            start_y + iDiamondSize, 1 + 8);
1167                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1168                                                                                            start_y - iDiamondSize, 2 + 4);
1169                                            CHECK_MV8_CANDIDATE_DIR(start_x + iDiamondSize,
1170                                                                                            start_y + iDiamondSize, 2 + 8);
1171                                            break;
1172                                    }
1173                                    if (!(iDirection))
1174                                            break;          //ok, the end. really
1175                                    else {
1176                                            bDirection = iDirection;
1177                                            start_x = currMV->x;
1178                                            start_y = currMV->y;
1179                                    }
1180                            }
1181                    }
1182                    while (1);                              //forever
1183            }
1184            return iMinSAD;
1185    }
1186    
1187          if (!(MotionFlags & PMV_HALFPELDIAMOND16) )  
1188                  iDiamondSize*=2;  int32_t
1189    Full8_MainSearch(const uint8_t * const pRef,
1190                                     const uint8_t * const pRefH,
1191                                     const uint8_t * const pRefV,
1192                                     const uint8_t * const pRefHV,
1193                                     const uint8_t * const cur,
1194                                     const int x,
1195                                     const int y,
1196                               const int start_x,
1197                               const int start_y,
1198                               int iMinSAD,
1199                               VECTOR * const currMV,
1200                               const int center_x,
1201                               const int center_y,
1202                                     const int32_t min_dx,
1203                                     const int32_t max_dx,
1204                                     const int32_t min_dy,
1205                                     const int32_t max_dy,
1206                                     const int32_t iEdgedWidth,
1207                                     const int32_t iDiamondSize,
1208                                     const int32_t iFcode,
1209                                     const int32_t iQuant,
1210                                     int iFound)
1211    {
1212            int32_t iSAD;
1213            int32_t dx, dy;
1214            VECTOR backupMV;
1215    
1216            backupMV.x = start_x;
1217            backupMV.y = start_y;
1218    
1219            for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)
1220                    for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)
1221                            NOCHECK_MV8_CANDIDATE(dx, dy);
1222    
1223            return iMinSAD;
1224    }
1225    
1226    Halfpel8_RefineFuncPtr Halfpel8_Refine;
1227    
1228    int32_t
1229    Halfpel16_Refine(const uint8_t * const pRef,
1230                                     const uint8_t * const pRefH,
1231                                     const uint8_t * const pRefV,
1232                                     const uint8_t * const pRefHV,
1233                                     const uint8_t * const cur,
1234                                     const int x,
1235                                     const int y,
1236                                     VECTOR * const currMV,
1237                                     int32_t iMinSAD,
1238                               const int center_x,
1239                               const int center_y,
1240                                     const int32_t min_dx,
1241                                     const int32_t max_dx,
1242                                     const int32_t min_dy,
1243                                     const int32_t max_dy,
1244                                     const int32_t iFcode,
1245                                     const int32_t iQuant,
1246                                     const int32_t iEdgedWidth)
1247    {
1248    /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */
1249    
1250            int32_t iSAD;
1251            VECTOR backupMV = *currMV;
1252    
1253            CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y - 1);
1254            CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y - 1);
1255            CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y - 1);
1256            CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y);
1257            CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y);
1258            CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y + 1);
1259            CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y + 1);
1260            CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y + 1);
1261    
1262            return iMinSAD;
1263    }
1264    
1265    #define PMV_HALFPEL16 (PMV_HALFPELDIAMOND16|PMV_HALFPELREFINE16)
1266    
1267    
1268    
1269    int32_t
1270    PMVfastSearch16(const uint8_t * const pRef,
1271                                    const uint8_t * const pRefH,
1272                                    const uint8_t * const pRefV,
1273                                    const uint8_t * const pRefHV,
1274                                    const IMAGE * const pCur,
1275                                    const int x,
1276                                    const int y,
1277                                    const int start_x,
1278                                    const int start_y,
1279                                    const int center_x,
1280                                    const int center_y,
1281                                    const uint32_t MotionFlags,
1282                                    const uint32_t iQuant,
1283                                    const uint32_t iFcode,
1284                                    const MBParam * const pParam,
1285                                    const MACROBLOCK * const pMBs,
1286                                    const MACROBLOCK * const prevMBs,
1287                                    VECTOR * const currMV,
1288                                    VECTOR * const currPMV)
1289    {
1290            const uint32_t iWcount = pParam->mb_width;
1291            const int32_t iWidth = pParam->width;
1292            const int32_t iHeight = pParam->height;
1293            const int32_t iEdgedWidth = pParam->edged_width;
1294    
1295            const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;
1296    
1297            int32_t iDiamondSize;
1298    
1299            int32_t min_dx;
1300            int32_t max_dx;
1301            int32_t min_dy;
1302            int32_t max_dy;
1303    
1304            int32_t iFound;
1305    
1306            VECTOR newMV;
1307            VECTOR backupMV;                        /* just for PMVFAST */
1308    
1309            VECTOR pmv[4];
1310            int32_t psad[4];
1311    
1312            MainSearch16FuncPtr MainSearchPtr;
1313    
1314            const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;
1315    
1316            int32_t threshA, threshB;
1317            int32_t bPredEq;
1318            int32_t iMinSAD, iSAD;
1319    
1320    /* Get maximum range */
1321            get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,
1322                              iFcode);
1323    
1324    /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */
1325    
1326            if (!(MotionFlags & PMV_HALFPEL16)) {
1327                    min_dx = EVEN(min_dx);
1328                    max_dx = EVEN(max_dx);
1329                    min_dy = EVEN(min_dy);
1330                    max_dy = EVEN(max_dy);
1331            }
1332    
1333            /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */
1334            //bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);
1335            bPredEq = get_pmvdata2(pMBs, iWcount, 0, x, y, 0, pmv, psad);
1336    
1337            if ((x == 0) && (y == 0)) {
1338                    threshA = 512;
1339                    threshB = 1024;
1340            } else {
1341                    threshA = psad[0];
1342                    threshB = threshA + 256;
1343                    if (threshA < 512)
1344                            threshA = 512;
1345                    if (threshA > 1024)
1346                            threshA = 1024;
1347                    if (threshB > 1792)
1348                            threshB = 1792;
1349            }
1350    
1351            iFound = 0;
1352    
1353  /* Step 4: Calculate SAD around the Median prediction.  /* Step 4: Calculate SAD around the Median prediction.
1354          MinSAD=SAD          MinSAD=SAD
# Line 688  Line 1357 
1357          If SAD<=256 goto Step 10.          If SAD<=256 goto Step 10.
1358  */  */
1359    
1360            currMV->x = start_x;
1361            currMV->y = start_y;
1362    
1363  // Prepare for main loop          if (!(MotionFlags & PMV_HALFPEL16)) {   /* This should NOT be necessary! */
   
         *currMV=pmv[0];         /* current best := prediction */  
         if (!(MotionFlags & PMV_HALFPEL16 ))  
         {       /* This should NOT be necessary! */  
1364                  currMV->x = EVEN(currMV->x);                  currMV->x = EVEN(currMV->x);
1365                  currMV->y = EVEN(currMV->y);                  currMV->y = EVEN(currMV->y);
1366          }          }
1367    
1368          if (currMV->x > max_dx)          if (currMV->x > max_dx) {
                 {  
1369                          currMV->x=max_dx;                          currMV->x=max_dx;
1370                  }                  }
1371          if (currMV->x < min_dx)          if (currMV->x < min_dx) {
                 {  
1372                          currMV->x=min_dx;                          currMV->x=min_dx;
1373                  }                  }
1374          if (currMV->y > max_dy)          if (currMV->y > max_dy) {
                 {  
1375                          currMV->y=max_dy;                          currMV->y=max_dy;
1376                  }                  }
1377          if (currMV->y < min_dy)          if (currMV->y < min_dy) {
                 {  
1378                          currMV->y=min_dy;                          currMV->y=min_dy;
1379                  }                  }
1380    
1381          iMinSAD = sad16( cur,          iMinSAD =
1382                  get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV, iEdgedWidth),                  sad16(cur,
1383                  iEdgedWidth, MV_MAX_ERROR);                            get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,
1384          iMinSAD += calc_delta_16(currMV->x-pmv[0].x, currMV->y-pmv[0].y, (uint8_t)iFcode) * iQuant;                                                   iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);
1385            iMinSAD +=
1386          if ( (iMinSAD < 256 ) || ( (MVequal(*currMV,pMB->mvs[0])) && (iMinSAD < pMB->sad16) ) )                  calc_delta_16(currMV->x - center_x, currMV->y - center_y,
1387                  {                                            (uint8_t) iFcode, iQuant);
1388    
1389            if ((iMinSAD < 256) ||
1390                    ((MVequal(*currMV, prevMB->mvs[0])) &&
1391                     ((int32_t) iMinSAD < prevMB->sad16))) {
1392                    if (iMinSAD < 2 * iQuant)       // high chances for SKIP-mode
1393                    {
1394                            if (!MVzero(*currMV)) {
1395                                    iMinSAD += MV16_00_BIAS;
1396                                    CHECK_MV16_ZERO;        // (0,0) saves space for letterboxed pictures
1397                                    iMinSAD -= MV16_00_BIAS;
1398                            }
1399                    }
1400    
1401                          if (MotionFlags & PMV_QUICKSTOP16)                          if (MotionFlags & PMV_QUICKSTOP16)
1402                                  goto step10b;                          goto PMVfast16_Terminate_without_Refine;
1403                          if (MotionFlags & PMV_EARLYSTOP16)                          if (MotionFlags & PMV_EARLYSTOP16)
1404                                  goto step10;                          goto PMVfast16_Terminate_with_Refine;
1405                  }                  }
1406    
1407    
1408    /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion
1409       vector of the median.
1410       If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2
1411    */
1412    
1413            if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[0])))
1414                    iFound = 2;
1415    
1416    /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.
1417       Otherwise select large Diamond Search.
1418    */
1419    
1420            if ((!MVzero(pmv[0])) || (threshB < 1536) || (bPredEq))
1421                    iDiamondSize = 1;               // halfpel!
1422            else
1423                    iDiamondSize = 2;               // halfpel!
1424    
1425            if (!(MotionFlags & PMV_HALFPELDIAMOND16))
1426                    iDiamondSize *= 2;
1427    
1428  /*  /*
1429  Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.
1430          Also calculate (0,0) but do not subtract offset.          Also calculate (0,0) but do not subtract offset.
1431          Let MinSAD be the smallest SAD up to this point.          Let MinSAD be the smallest SAD up to this point.
1432          If MV is (0,0) subtract offset. ******** WHAT'S THIS 'OFFSET' ??? ***********     If MV is (0,0) subtract offset.
1433  */  */
1434    
1435  // (0,0) is always possible  // (0,0) is always possible
1436    
1437            if (!MVzero(pmv[0]))
1438          CHECK_MV16_ZERO;          CHECK_MV16_ZERO;
1439    
1440  // previous frame MV is always possible  // previous frame MV is always possible
1441          CHECK_MV16_CANDIDATE(pMB->mvs[0].x,pMB->mvs[0].y);  
1442            if (!MVzero(prevMB->mvs[0]))
1443                    if (!MVequal(prevMB->mvs[0], pmv[0]))
1444                            CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);
1445    
1446  // left neighbour, if allowed  // left neighbour, if allowed
1447          if (x != 0)  
1448          {          if (!MVzero(pmv[1]))
1449                  if (!(MotionFlags & PMV_HALFPEL16 ))                  if (!MVequal(pmv[1], prevMB->mvs[0]))
1450                  {       pmv[1].x = EVEN(pmv[1].x);                          if (!MVequal(pmv[1], pmv[0])) {
1451                                    if (!(MotionFlags & PMV_HALFPEL16)) {
1452                                            pmv[1].x = EVEN(pmv[1].x);
1453                          pmv[1].y = EVEN(pmv[1].y);                          pmv[1].y = EVEN(pmv[1].y);
1454                  }                  }
1455    
1456                  CHECK_MV16_CANDIDATE(pmv[1].x,pmv[1].y);                  CHECK_MV16_CANDIDATE(pmv[1].x,pmv[1].y);
1457          }          }
   
1458  // top neighbour, if allowed  // top neighbour, if allowed
1459          if (y != 0)          if (!MVzero(pmv[2]))
1460          {                  if (!MVequal(pmv[2], prevMB->mvs[0]))
1461                  if (!(MotionFlags & PMV_HALFPEL16 ))                          if (!MVequal(pmv[2], pmv[0]))
1462                  {       pmv[2].x = EVEN(pmv[2].x);                                  if (!MVequal(pmv[2], pmv[1])) {
1463                                            if (!(MotionFlags & PMV_HALFPEL16)) {
1464                                                    pmv[2].x = EVEN(pmv[2].x);
1465                          pmv[2].y = EVEN(pmv[2].y);                          pmv[2].y = EVEN(pmv[2].y);
1466                  }                  }
1467                  CHECK_MV16_CANDIDATE(pmv[2].x,pmv[2].y);                  CHECK_MV16_CANDIDATE(pmv[2].x,pmv[2].y);
1468    
1469  // top right neighbour, if allowed  // top right neighbour, if allowed
1470                  if (x != (iWcount-1))                                          if (!MVzero(pmv[3]))
1471                  {                                                  if (!MVequal(pmv[3], prevMB->mvs[0]))
1472                          if (!(MotionFlags & PMV_HALFPEL16 ))                                                          if (!MVequal(pmv[3], pmv[0]))
1473                          {       pmv[3].x = EVEN(pmv[3].x);                                                                  if (!MVequal(pmv[3], pmv[1]))
1474                                                                            if (!MVequal(pmv[3], pmv[2])) {
1475                                                                                    if (!(MotionFlags & PMV_HALFPEL16)) {
1476                                                                                            pmv[3].x = EVEN(pmv[3].x);
1477                                  pmv[3].y = EVEN(pmv[3].y);                                  pmv[3].y = EVEN(pmv[3].y);
1478                          }                          }
1479                          CHECK_MV16_CANDIDATE(pmv[3].x,pmv[3].y);                                                                                  CHECK_MV16_CANDIDATE(pmv[3].x,
1480                                                                                                                             pmv[3].y);
1481                  }                  }
1482          }          }
1483    
1484            if ((MVzero(*currMV)) &&
1485                    (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )
1486                    iMinSAD -= MV16_00_BIAS;
1487    
1488    
1489  /* Step 6: If MinSAD <= thresa goto Step 10.  /* Step 6: If MinSAD <= thresa goto Step 10.
1490     If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.     If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.
1491  */  */
1492    
1493          if ( (iMinSAD <= threshA) || ( MVequal(*currMV,pMB->mvs[0]) && (iMinSAD < pMB->sad16) ) )          if ((iMinSAD <= threshA) ||
1494                  {                  (MVequal(*currMV, prevMB->mvs[0]) &&
1495                     ((int32_t) iMinSAD < prevMB->sad16))) {
1496                          if (MotionFlags & PMV_QUICKSTOP16)                          if (MotionFlags & PMV_QUICKSTOP16)
1497                                  goto step10b;                          goto PMVfast16_Terminate_without_Refine;
1498                          if (MotionFlags & PMV_EARLYSTOP16)                          if (MotionFlags & PMV_EARLYSTOP16)
1499                                  goto step10;                          goto PMVfast16_Terminate_with_Refine;
1500                  }                  }
1501    
1502    
# Line 796  Line 1510 
1510          Refine by using small diamond and goto step 10.          Refine by using small diamond and goto step 10.
1511  */  */
1512    
1513            if (MotionFlags & PMV_USESQUARES16)
1514                    MainSearchPtr = Square16_MainSearch;
1515            else if (MotionFlags & PMV_ADVANCEDDIAMOND16)
1516                    MainSearchPtr = AdvDiamond16_MainSearch;
1517            else
1518                    MainSearchPtr = Diamond16_MainSearch;
1519    
1520          backupMV = *currMV; /* save best prediction, actually only for EXTSEARCH */          backupMV = *currMV; /* save best prediction, actually only for EXTSEARCH */
1521    
1522    
1523  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */
1524          iSAD = PMVfastSearch16_MainSearch(pRef, pRefH, pRefV, pRefHV, cur,          iSAD =
1525                  x, y,                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,
1526                  currMV->x, currMV->y, iMinSAD, &newMV,                                                    currMV->x, currMV->y, iMinSAD, &newMV, center_x, center_y,
1527                  pmv, min_dx, max_dx, min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode, iQuant, iFound);                                                    min_dx, max_dx,
1528                                                      min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,
1529                                                      iQuant, iFound);
1530    
1531          if (iSAD < iMinSAD)          if (iSAD < iMinSAD) {
         {  
1532                  *currMV = newMV;                  *currMV = newMV;
1533                  iMinSAD = iSAD;                  iMinSAD = iSAD;
1534          }          }
1535    
1536          if (MotionFlags & PMV_EXTSEARCH16)          if (MotionFlags & PMV_EXTSEARCH16) {
         {  
1537  /* extended: search (up to) two more times: orignal prediction and (0,0) */  /* extended: search (up to) two more times: orignal prediction and (0,0) */
1538    
1539                  if (!(MVequal(pmv[0],backupMV)) )                  if (!(MVequal(pmv[0], backupMV))) {
1540                  {       iSAD = PMVfastSearch16_MainSearch(pRef, pRefH, pRefV, pRefHV, cur,                          iSAD =
1541                                  x, y,                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,
1542                          pmv[0].x, pmv[0].y, iMinSAD, &newMV,                                                                    center_x, center_y, iMinSAD, &newMV, center_x, center_y,
1543                          pmv, min_dx, max_dx, min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode, iQuant, iFound);                                                                    min_dx, max_dx, min_dy, max_dy, iEdgedWidth,
1544                                                                      iDiamondSize, iFcode, iQuant, iFound);
1545    
1546                          if (iSAD < iMinSAD)                          if (iSAD < iMinSAD) {
                         {  
1547                                  *currMV = newMV;                                  *currMV = newMV;
1548                                  iMinSAD = iSAD;                                  iMinSAD = iSAD;
1549                          }                          }
1550                  }                  }
1551    
1552                  if ( (!(MVzero(pmv[0]))) && (!(MVzero(backupMV))) )                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {
1553                  {       iSAD = PMVfastSearch16_MainSearch(pRef, pRefH, pRefV, pRefHV, cur,                          iSAD =
1554                                  x, y,                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,
1555                          0, 0, iMinSAD, &newMV,                                                                    iMinSAD, &newMV, center_x, center_y,
1556                          pmv, min_dx, max_dx, min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode, iQuant, iFound);                                                                    min_dx, max_dx, min_dy, max_dy,
1557                                                                      iEdgedWidth, iDiamondSize, iFcode,
1558                                                                      iQuant, iFound);
1559    
1560                          if (iSAD < iMinSAD)                          if (iSAD < iMinSAD) {
                         {  
1561                                  *currMV = newMV;                                  *currMV = newMV;
1562                                  iMinSAD = iSAD;                                  iMinSAD = iSAD;
1563                          }                          }
# Line 845  Line 1568 
1568          Step 10:  The motion vector is chosen according to the block corresponding to MinSAD.          Step 10:  The motion vector is chosen according to the block corresponding to MinSAD.
1569  */  */
1570    
1571  step10:    PMVfast16_Terminate_with_Refine:
1572          if (MotionFlags & PMV_HALFPELREFINE16)          // perform final half-pel step          if (MotionFlags & PMV_HALFPELREFINE16)          // perform final half-pel step
1573                  iMinSAD = PMVfastSearch16_Refine( pRef, pRefH, pRefV, pRefHV, cur,                  iMinSAD =
1574                                  x, y,                          Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,
1575                                  currMV, iMinSAD,                                                           iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,
1576                                  pmv, min_dx, max_dx, min_dy, max_dy, iFcode, iQuant, iEdgedWidth);                                                           iFcode, iQuant, iEdgedWidth);
1577    
1578  step10b:    PMVfast16_Terminate_without_Refine:
1579          currPMV->x = currMV->x - pmv[0].x;          currPMV->x = currMV->x - center_x;
1580          currPMV->y = currMV->y - pmv[0].y;          currPMV->y = currMV->y - center_y;
1581          return iMinSAD;          return iMinSAD;
1582  }  }
1583    
# Line 863  Line 1586 
1586    
1587    
1588    
1589  int32_t PMVfastSearch8_MainSearch(  int32_t
1590                                          const uint8_t * const pRef,  Diamond8_MainSearch(const uint8_t * const pRef,
1591                                          const uint8_t * const pRefH,                                          const uint8_t * const pRefH,
1592                                          const uint8_t * const pRefV,                                          const uint8_t * const pRefV,
1593                                          const uint8_t * const pRefHV,                                          const uint8_t * const pRefHV,
1594                                          const uint8_t * const cur,                                          const uint8_t * const cur,
1595                                          const int x, const int y,                                          const int x,
1596                                          int32_t startx, int32_t starty,                                          const int y,
1597                                            int32_t start_x,
1598                                            int32_t start_y,
1599                                          int32_t iMinSAD,                                          int32_t iMinSAD,
1600                                          VECTOR * const currMV,                                          VECTOR * const currMV,
1601                                          const VECTOR * const pmv,                                     const int center_x,
1602                                          const int32_t min_dx, const int32_t max_dx,                                     const int center_y,
1603                                          const int32_t min_dy, const int32_t max_dy,                                          const int32_t min_dx,
1604                                            const int32_t max_dx,
1605                                            const int32_t min_dy,
1606                                            const int32_t max_dy,
1607                                          const int32_t iEdgedWidth,                                          const int32_t iEdgedWidth,
1608                                          const int32_t iDiamondSize,                                          const int32_t iDiamondSize,
1609                                          const int32_t iFcode,                                          const int32_t iFcode,
# Line 887  Line 1615 
1615          int32_t iDirection=0;          int32_t iDirection=0;
1616          int32_t iSAD;          int32_t iSAD;
1617          VECTOR backupMV;          VECTOR backupMV;
1618          backupMV.x = startx;  
1619          backupMV.y = starty;          backupMV.x = start_x;
1620            backupMV.y = start_y;
1621    
1622  /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */
1623    
# Line 898  Line 1627 
1627          CHECK_MV8_CANDIDATE_DIR(backupMV.x,backupMV.y+iDiamondSize,4);          CHECK_MV8_CANDIDATE_DIR(backupMV.x,backupMV.y+iDiamondSize,4);
1628    
1629          if (iDirection)          if (iDirection)
1630                  while (!iFound)                  while (!iFound) {
                 {  
1631                          iFound = 1;                          iFound = 1;
1632                          backupMV=*currMV;       // since iDirection!=0, this is well defined!                          backupMV=*currMV;       // since iDirection!=0, this is well defined!
1633    
1634                          if ( iDirection != 2)                          if ( iDirection != 2)
1635                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x-iDiamondSize,backupMV.y,1);                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x - iDiamondSize,
1636                                                                                      backupMV.y, 1);
1637                          if ( iDirection != 1)                          if ( iDirection != 1)
1638                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x+iDiamondSize,backupMV.y,2);                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x + iDiamondSize,
1639                                                                                      backupMV.y, 2);
1640                          if ( iDirection != 4)                          if ( iDirection != 4)
1641                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x,backupMV.y-iDiamondSize,3);                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x,
1642                                                                                      backupMV.y - iDiamondSize, 3);
1643                          if ( iDirection != 3)                          if ( iDirection != 3)
1644                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x,backupMV.y+iDiamondSize,4);                                  CHECK_MV8_CANDIDATE_FOUND(backupMV.x,
1645                  }                                                                                    backupMV.y + iDiamondSize, 4);
1646          else          } else {
1647                  {                  currMV->x = start_x;
1648                          currMV->x = startx;                  currMV->y = start_y;
                         currMV->y = starty;  
1649                  }                  }
1650          return iMinSAD;          return iMinSAD;
1651  }  }
1652    
1653  int32_t PMVfastSearch8_Refine(  int32_t
1654                                          const uint8_t * const pRef,  Halfpel8_Refine_c(const uint8_t * const pRef,
1655                                          const uint8_t * const pRefH,                                          const uint8_t * const pRefH,
1656                                          const uint8_t * const pRefV,                                          const uint8_t * const pRefV,
1657                                          const uint8_t * const pRefHV,                                          const uint8_t * const pRefHV,
1658                                          const uint8_t * const cur,                                          const uint8_t * const cur,
1659                                          const int x, const int y,                                  const int x,
1660                                    const int y,
1661                                          VECTOR * const currMV,                                          VECTOR * const currMV,
1662                                          int32_t iMinSAD,                                          int32_t iMinSAD,
1663                                          const VECTOR * const pmv,                             const int center_x,
1664                                          const int32_t min_dx, const int32_t max_dx,                             const int center_y,
1665                                          const int32_t min_dy, const int32_t max_dy,                                  const int32_t min_dx,
1666                                    const int32_t max_dx,
1667                                    const int32_t min_dy,
1668                                    const int32_t max_dy,
1669                                          const int32_t iFcode,                                          const int32_t iFcode,
1670                                          const int32_t iQuant,                                          const int32_t iQuant,
1671                                          const int32_t iEdgedWidth)                                          const int32_t iEdgedWidth)
# Line 956  Line 1690 
1690    
1691  #define PMV_HALFPEL8 (PMV_HALFPELDIAMOND8|PMV_HALFPELREFINE8)  #define PMV_HALFPEL8 (PMV_HALFPELDIAMOND8|PMV_HALFPELREFINE8)
1692    
1693  int32_t PMVfastSearch8(  int32_t
1694                                          const uint8_t * const pRef,  PMVfastSearch8(const uint8_t * const pRef,
1695                                          const uint8_t * const pRefH,                                          const uint8_t * const pRefH,
1696                                          const uint8_t * const pRefV,                                          const uint8_t * const pRefV,
1697                                          const uint8_t * const pRefHV,                                          const uint8_t * const pRefHV,
1698                                          const IMAGE * const pCur,                                          const IMAGE * const pCur,
1699                                          const int x, const int y,                             const int x,
1700                                          const int start_x, int start_y,                             const int y,
1701                               const int start_x,
1702                               const int start_y,
1703                                    const int center_x,
1704                                    const int center_y,
1705                                          const uint32_t MotionFlags,                                          const uint32_t MotionFlags,
1706                                          MBParam * const pParam,                             const uint32_t iQuant,
1707                                          MACROBLOCK * const pMBs,                             const uint32_t iFcode,
1708                               const MBParam * const pParam,
1709                               const MACROBLOCK * const pMBs,
1710                               const MACROBLOCK * const prevMBs,
1711                                          VECTOR * const currMV,                                          VECTOR * const currMV,
1712                                          VECTOR * const currPMV)                                          VECTOR * const currPMV)
1713  {  {
1714          const uint32_t iWcount = pParam->mb_width;          const uint32_t iWcount = pParam->mb_width;
   
         const int32_t iFcode = pParam->fixed_code;  
         const int32_t iQuant = pParam->quant;  
1715          const int32_t iWidth = pParam->width;          const int32_t iWidth = pParam->width;
1716          const int32_t iHeight = pParam->height;          const int32_t iHeight = pParam->height;
1717          const int32_t iEdgedWidth = pParam->edged_width;          const int32_t iEdgedWidth = pParam->edged_width;
# Line 991  Line 1729 
1729          int32_t psad[4];          int32_t psad[4];
1730          VECTOR newMV;          VECTOR newMV;
1731          VECTOR backupMV;          VECTOR backupMV;
1732            VECTOR startMV;
1733    
1734          MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;  //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;
1735            const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;
1736    
1737          static int32_t threshA,threshB;           int32_t threshA, threshB;
1738          int32_t iFound,bPredEq;          int32_t iFound,bPredEq;
1739          int32_t iMinSAD,iSAD;          int32_t iMinSAD,iSAD;
1740    
1741          int32_t iSubBlock = ((y&1)<<1) + (x&1);          int32_t iSubBlock = (y & 1) + (y & 1) + (x & 1);
1742    
1743  /* Get maximum range */          MainSearch8FuncPtr MainSearchPtr;
     get_range(&min_dx, &max_dx, &min_dy, &max_dy,  
                         x, y, 8, iWidth, iHeight, iFcode);  
1744    
1745  /* we work with abs. MVs, not relative to prediction, so range is relative to 0,0 */          /* Init variables */
1746            startMV.x = start_x;
1747            startMV.y = start_y;
1748    
1749          if (!(MotionFlags & PMV_HALFPELDIAMOND8 ))          /* Get maximum range */
1750          { min_dx = EVEN(min_dx);          get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,
1751                              iFcode);
1752    
1753            if (!(MotionFlags & PMV_HALFPELDIAMOND8)) {
1754                    min_dx = EVEN(min_dx);
1755            max_dx = EVEN(max_dx);            max_dx = EVEN(max_dx);
1756            min_dy = EVEN(min_dy);            min_dy = EVEN(min_dy);
1757            max_dy = EVEN(max_dy);            max_dy = EVEN(max_dy);
1758          }               /* because we might use IF (dx>max_dx) THEN dx=max_dx; */          }
   
1759    
1760          bPredEq  = get_pmvdata(pMBs, (x>>1), (y>>1), iWcount, iSubBlock, pmv, psad);          /* because we might use IF (dx>max_dx) THEN dx=max_dx; */
1761            //bPredEq = get_pmvdata(pMBs, (x >> 1), (y >> 1), iWcount, iSubBlock, pmv, psad);
1762            bPredEq = get_pmvdata2(pMBs, iWcount, 0, (x >> 1), (y >> 1), iSubBlock, pmv, psad);
1763    
1764          if ((x==0) && (y==0) )          if ((x == 0) && (y == 0)) {
         {  
1765                  threshA =  512/4;                  threshA =  512/4;
1766                  threshB = 1024/4;                  threshB = 1024/4;
1767    
1768          }          } else {
1769          else                  threshA = psad[0] / 4;  /* good estimate? */
         {  
                 threshA = psad[0]/4;                    /* good estimate */  
1770                  threshB = threshA+256/4;                  threshB = threshA+256/4;
1771                  if (threshA< 512/4) threshA =  512/4;                  if (threshA < 512 / 4)
1772                  if (threshA>1024/4) threshA = 1024/4;                          threshA = 512 / 4;
1773                  if (threshB>1792/4) threshB = 1792/4;                  if (threshA > 1024 / 4)
1774                            threshA = 1024 / 4;
1775                    if (threshB > 1792 / 4)
1776                            threshB = 1792 / 4;
1777          }          }
1778    
1779          iFound=0;          iFound=0;
1780    
1781  /* Step 2: Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  /* Step 4: Calculate SAD around the Median prediction.
1782       MinSAD=SAD
1783       If Motion Vector equal to Previous frame motion vector
1784       and MinSAD<PrevFrmSAD goto Step 10.
1785       If SAD<=256 goto Step 10.
1786    */
1787    
1788    
1789    // Prepare for main loop
1790    
1791    //  if (MotionFlags & PMV_USESQUARES8)
1792    //      MainSearchPtr = Square8_MainSearch;
1793    //  else
1794    
1795            if (MotionFlags & PMV_ADVANCEDDIAMOND8)
1796                    MainSearchPtr = AdvDiamond8_MainSearch;
1797            else
1798                    MainSearchPtr = Diamond8_MainSearch;
1799    
1800    
1801            *currMV = startMV;
1802    
1803            iMinSAD =
1804                    sad8(cur,
1805                             get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,
1806                                                    iEdgedWidth), iEdgedWidth);
1807            iMinSAD +=
1808                    calc_delta_8(currMV->x - center_x, currMV->y - center_y,
1809                                             (uint8_t) iFcode, iQuant);
1810    
1811            if ((iMinSAD < 256 / 4) || ((MVequal(*currMV, prevMB->mvs[iSubBlock]))
1812                                                                    && ((int32_t) iMinSAD <
1813                                                                            prevMB->sad8[iSubBlock]))) {
1814                    if (MotionFlags & PMV_QUICKSTOP16)
1815                            goto PMVfast8_Terminate_without_Refine;
1816                    if (MotionFlags & PMV_EARLYSTOP16)
1817                            goto PMVfast8_Terminate_with_Refine;
1818            }
1819    
1820    /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion
1821          vector of the median.          vector of the median.
1822          If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2          If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2
1823  */  */
1824    
1825          if ((bPredEq) && (MVequal(pmv[0],pMB->mvs[iSubBlock]) ) )          if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[iSubBlock])))
1826                  iFound=2;                  iFound=2;
1827    
1828  /* Step 3: If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.  /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.
1829          Otherwise select large Diamond Search.          Otherwise select large Diamond Search.
1830  */  */
1831    
1832          if ( (pmv[0].x != 0) || (pmv[0].y != 0) || (threshB<1536/4) || (bPredEq) )          if ((!MVzero(pmv[0])) || (threshB < 1536 / 4) || (bPredEq))
1833                  iDiamondSize=1; // 1 halfpel!                  iDiamondSize=1; // 1 halfpel!
1834          else          else
1835                  iDiamondSize=2; // 2 halfpel = 1 full pixel!                  iDiamondSize=2; // 2 halfpel = 1 full pixel!
# Line 1053  Line 1837 
1837          if (!(MotionFlags & PMV_HALFPELDIAMOND8) )          if (!(MotionFlags & PMV_HALFPELDIAMOND8) )
1838                  iDiamondSize*=2;                  iDiamondSize*=2;
1839    
 /* Step 4: Calculate SAD around the Median prediction.  
         MinSAD=SAD  
         If Motion Vector equal to Previous frame motion vector  
                 and MinSAD<PrevFrmSAD goto Step 10.  
         If SAD<=256 goto Step 10.  
 */  
   
   
 // Prepare for main loop  
   
         currMV->x=start_x;              /* start with mv16 */  
         currMV->y=start_y;  
   
         iMinSAD = sad8( cur,  
                 get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV, iEdgedWidth),  
                 iEdgedWidth);  
         iMinSAD += calc_delta_8(currMV->x - pmv[0].x, currMV->y - pmv[0].y, (uint8_t)iFcode) * iQuant;  
   
         if ( (iMinSAD < 256/4 ) || ( (MVequal(*currMV,pMB->mvs[iSubBlock])) && (iMinSAD < pMB->sad8[iSubBlock]) ) )  
                 {  
                         if (MotionFlags & PMV_QUICKSTOP8)  
                                 goto step10_8b;  
                         if (MotionFlags & PMV_EARLYSTOP8)  
                                 goto step10_8;  
                 }  
1840    
1841  /*  /*
1842  Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.
1843          Also calculate (0,0) but do not subtract offset.          Also calculate (0,0) but do not subtract offset.
1844          Let MinSAD be the smallest SAD up to this point.          Let MinSAD be the smallest SAD up to this point.
1845          If MV is (0,0) subtract offset. ******** WHAT'S THIS 'OFFSET' ??? ***********     If MV is (0,0) subtract offset.
1846  */  */
1847    
1848  // the prediction might be even better than mv16  // the median prediction might be even better than mv16
         CHECK_MV8_CANDIDATE(pmv[0].x,pmv[0].y);  
1849    
1850  // (0,0) is always possible          if (!MVequal(pmv[0], startMV))
1851                    CHECK_MV8_CANDIDATE(center_x, center_y);
1852    
1853    // (0,0) if needed
1854            if (!MVzero(pmv[0]))
1855                    if (!MVzero(startMV))
1856          CHECK_MV8_ZERO;          CHECK_MV8_ZERO;
1857    
1858  // previous frame MV is always possible  // previous frame MV if needed
1859          CHECK_MV8_CANDIDATE(pMB->mvs[iSubBlock].x,pMB->mvs[iSubBlock].y);          if (!MVzero(prevMB->mvs[iSubBlock]))
1860                    if (!MVequal(prevMB->mvs[iSubBlock], startMV))
1861                            if (!MVequal(prevMB->mvs[iSubBlock], pmv[0]))
1862                                    CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x,
1863                                                                            prevMB->mvs[iSubBlock].y);
1864    
1865            if ((iMinSAD <= threshA) ||
1866                    (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&
1867                     ((int32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {
1868                    if (MotionFlags & PMV_QUICKSTOP16)
1869                            goto PMVfast8_Terminate_without_Refine;
1870                    if (MotionFlags & PMV_EARLYSTOP16)
1871                            goto PMVfast8_Terminate_with_Refine;
1872            }
1873    
1874  // left neighbour, if allowed  // left neighbour, if allowed and needed
1875          if (psad[1] != MV_MAX_ERROR)          if (!MVzero(pmv[1]))
1876          {                  if (!MVequal(pmv[1], startMV))
1877                  if (!(MotionFlags & PMV_HALFPEL8 ))                          if (!MVequal(pmv[1], prevMB->mvs[iSubBlock]))
1878                  {       pmv[1].x = EVEN(pmv[1].x);                                  if (!MVequal(pmv[1], pmv[0])) {
1879                                            if (!(MotionFlags & PMV_HALFPEL8)) {
1880                                                    pmv[1].x = EVEN(pmv[1].x);
1881                          pmv[1].y = EVEN(pmv[1].y);                          pmv[1].y = EVEN(pmv[1].y);
1882                  }                  }
1883                  CHECK_MV8_CANDIDATE(pmv[1].x,pmv[1].y);                  CHECK_MV8_CANDIDATE(pmv[1].x,pmv[1].y);
1884          }          }
1885    // top neighbour, if allowed and needed
1886  // top neighbour, if allowed          if (!MVzero(pmv[2]))
1887          if (psad[2] != MV_MAX_ERROR)                  if (!MVequal(pmv[2], startMV))
1888          {                          if (!MVequal(pmv[2], prevMB->mvs[iSubBlock]))
1889                  if (!(MotionFlags & PMV_HALFPEL8 ))                                  if (!MVequal(pmv[2], pmv[0]))
1890                  {       pmv[2].x = EVEN(pmv[2].x);                                          if (!MVequal(pmv[2], pmv[1])) {
1891                                                    if (!(MotionFlags & PMV_HALFPEL8)) {
1892                                                            pmv[2].x = EVEN(pmv[2].x);
1893                          pmv[2].y = EVEN(pmv[2].y);                          pmv[2].y = EVEN(pmv[2].y);
1894                  }                  }
1895                  CHECK_MV8_CANDIDATE(pmv[2].x,pmv[2].y);                  CHECK_MV8_CANDIDATE(pmv[2].x,pmv[2].y);
1896    
1897  // top right neighbour, if allowed  // top right neighbour, if allowed and needed
1898                  if (psad[3] != MV_MAX_ERROR)                                                  if (!MVzero(pmv[3]))
1899                  {                                                          if (!MVequal(pmv[3], startMV))
1900                  if (!(MotionFlags & PMV_HALFPEL8 ))                                                                  if (!MVequal(pmv[3], prevMB->mvs[iSubBlock]))
1901                  {       pmv[3].x = EVEN(pmv[3].x);                                                                          if (!MVequal(pmv[3], pmv[0]))
1902                                                                                    if (!MVequal(pmv[3], pmv[1]))
1903                                                                                            if (!MVequal(pmv[3], pmv[2])) {
1904                                                                                                    if (!
1905                                                                                                            (MotionFlags &
1906                                                                                                             PMV_HALFPEL8)) {
1907                                                                                                            pmv[3].x = EVEN(pmv[3].x);
1908                          pmv[3].y = EVEN(pmv[3].y);                          pmv[3].y = EVEN(pmv[3].y);
1909                  }                  }
1910                          CHECK_MV8_CANDIDATE(pmv[3].x,pmv[3].y);                                                                                                  CHECK_MV8_CANDIDATE(pmv[3].x,
1911                                                                                                                                            pmv[3].y);
1912                  }                  }
1913          }          }
1914    
1915            if ((MVzero(*currMV)) &&
1916                    (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )
1917                    iMinSAD -= MV8_00_BIAS;
1918    
1919    
1920  /* Step 6: If MinSAD <= thresa goto Step 10.  /* Step 6: If MinSAD <= thresa goto Step 10.
1921     If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.     If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.
1922  */  */
1923    
1924          if ( (iMinSAD <= threshA) || ( MVequal(*currMV,pMB->mvs[iSubBlock]) && (iMinSAD < pMB->sad8[iSubBlock]) ) )          if ((iMinSAD <= threshA) ||
1925                  {                  (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&
1926                          if (MotionFlags & PMV_QUICKSTOP8)                   ((int32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {
1927                                  goto step10_8b;                  if (MotionFlags & PMV_QUICKSTOP16)
1928                          if (MotionFlags & PMV_EARLYSTOP8)                          goto PMVfast8_Terminate_without_Refine;
1929                                  goto step10_8;                  if (MotionFlags & PMV_EARLYSTOP16)
1930                            goto PMVfast8_Terminate_with_Refine;
1931                  }                  }
1932    
1933  /************ (Diamond Search)  **************/  /************ (Diamond Search)  **************/
# Line 1150  Line 1943 
1943          backupMV = *currMV; /* save best prediction, actually only for EXTSEARCH */          backupMV = *currMV; /* save best prediction, actually only for EXTSEARCH */
1944    
1945  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */
1946          iSAD = PMVfastSearch8_MainSearch(pRef, pRefH, pRefV, pRefHV, cur,          iSAD =
1947                  x, y,                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,
1948                  currMV->x, currMV->y, iMinSAD, &newMV,                                                    currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,
1949                  pmv, min_dx, max_dx, min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode, iQuant, iFound);                                                    min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,
1950                                                      iQuant, iFound);
1951    
1952          if (iSAD < iMinSAD)          if (iSAD < iMinSAD) {
         {  
1953                  *currMV = newMV;                  *currMV = newMV;
1954                  iMinSAD = iSAD;                  iMinSAD = iSAD;
1955          }          }
1956    
1957          if (MotionFlags & PMV_EXTSEARCH8)          if (MotionFlags & PMV_EXTSEARCH8) {
         {  
1958  /* extended: search (up to) two more times: orignal prediction and (0,0) */  /* extended: search (up to) two more times: orignal prediction and (0,0) */
1959    
1960                  if (!(MVequal(pmv[0],backupMV)) )                  if (!(MVequal(pmv[0], backupMV))) {
1961                  {       iSAD = PMVfastSearch16_MainSearch(pRef, pRefH, pRefV, pRefHV, cur,                          iSAD =
1962                                  x, y,                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,
1963                          pmv[0].x, pmv[0].y, iMinSAD, &newMV,                                                                    pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,
1964                          pmv, min_dx, max_dx, min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode, iQuant, iFound);                                                                    min_dx, max_dx, min_dy, max_dy, iEdgedWidth,
1965                                                                      iDiamondSize, iFcode, iQuant, iFound);
1966    
1967                          if (iSAD < iMinSAD)                          if (iSAD < iMinSAD) {
                         {  
1968                                  *currMV = newMV;                                  *currMV = newMV;
1969                                  iMinSAD = iSAD;                                  iMinSAD = iSAD;
1970                          }                          }
1971                  }                  }
1972    
1973                  if ( (!(MVzero(pmv[0]))) && (!(MVzero(backupMV))) )                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {
1974                  {       iSAD = PMVfastSearch16_MainSearch(pRef, pRefH, pRefV, pRefHV, cur,                          iSAD =
1975                                  x, y,                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,
1976                          0, 0, iMinSAD, &newMV,                                                                    iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,
1977                          pmv, min_dx, max_dx, min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode, iQuant, iFound);                                                                    max_dy, iEdgedWidth, iDiamondSize, iFcode,
1978                                                                      iQuant, iFound);
1979    
1980                          if (iSAD < iMinSAD)                          if (iSAD < iMinSAD) {
                         {  
1981                                  *currMV = newMV;                                  *currMV = newMV;
1982                                  iMinSAD = iSAD;                                  iMinSAD = iSAD;
1983                          }                          }
# Line 1196  Line 1988 
1988           By performing an optional local half-pixel search, we can refine this result even further.           By performing an optional local half-pixel search, we can refine this result even further.
1989  */  */
1990    
1991  step10_8:    PMVfast8_Terminate_with_Refine:
1992          if (MotionFlags & PMV_HALFPELREFINE8)           // perform final half-pel step          if (MotionFlags & PMV_HALFPELREFINE8)           // perform final half-pel step
1993                  iMinSAD = PMVfastSearch8_Refine( pRef, pRefH, pRefV, pRefHV, cur,                  iMinSAD =
1994                                  x, y,                          Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,
1995                                  currMV, iMinSAD,                                                          iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,
1996                                  pmv, min_dx, max_dx, min_dy, max_dy, iFcode, iQuant, iEdgedWidth);                                                          iFcode, iQuant, iEdgedWidth);
1997    
1998    
1999      PMVfast8_Terminate_without_Refine:
2000            currPMV->x = currMV->x - center_x;
2001            currPMV->y = currMV->y - center_y;
2002    
2003            return iMinSAD;
2004    }
2005    
2006    int32_t
2007    EPZSSearch16(const uint8_t * const pRef,
2008                             const uint8_t * const pRefH,
2009                             const uint8_t * const pRefV,
2010                             const uint8_t * const pRefHV,
2011                             const IMAGE * const pCur,
2012                             const int x,
2013                             const int y,
2014                            const int start_x,
2015                            const int start_y,
2016                            const int center_x,
2017                            const int center_y,
2018                             const uint32_t MotionFlags,
2019                             const uint32_t iQuant,
2020                             const uint32_t iFcode,
2021                             const MBParam * const pParam,
2022                             const MACROBLOCK * const pMBs,
2023                             const MACROBLOCK * const prevMBs,
2024                             VECTOR * const currMV,
2025                             VECTOR * const currPMV)
2026    {
2027            const uint32_t iWcount = pParam->mb_width;
2028            const uint32_t iHcount = pParam->mb_height;
2029    
2030            const int32_t iWidth = pParam->width;
2031            const int32_t iHeight = pParam->height;
2032            const int32_t iEdgedWidth = pParam->edged_width;
2033    
2034            const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;
2035    
2036            int32_t min_dx;
2037            int32_t max_dx;
2038            int32_t min_dy;
2039            int32_t max_dy;
2040    
2041            VECTOR newMV;
2042            VECTOR backupMV;
2043    
2044            VECTOR pmv[4];
2045            int32_t psad[8];
2046    
2047            static MACROBLOCK *oldMBs = NULL;
2048    
2049    //  const MACROBLOCK * const pMB = pMBs + x + y * iWcount;
2050            const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;
2051            MACROBLOCK *oldMB = NULL;
2052    
2053             int32_t thresh2;
2054            int32_t bPredEq;
2055            int32_t iMinSAD, iSAD = 9999;
2056    
2057            MainSearch16FuncPtr MainSearchPtr;
2058    
2059            if (oldMBs == NULL) {
2060                    oldMBs = (MACROBLOCK *) calloc(iWcount * iHcount, sizeof(MACROBLOCK));
2061    //      fprintf(stderr,"allocated %d bytes for oldMBs\n",iWcount*iHcount*sizeof(MACROBLOCK));
2062            }
2063            oldMB = oldMBs + x + y * iWcount;
2064    
2065    /* Get maximum range */
2066            get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,
2067                              iFcode);
2068    
2069            if (!(MotionFlags & PMV_HALFPEL16)) {
2070                    min_dx = EVEN(min_dx);
2071                    max_dx = EVEN(max_dx);
2072                    min_dy = EVEN(min_dy);
2073                    max_dy = EVEN(max_dy);
2074            }
2075            /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */
2076            //bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);
2077            bPredEq = get_pmvdata2(pMBs, iWcount, 0, x, y, 0, pmv, psad);
2078    
2079    /* Step 4: Calculate SAD around the Median prediction.
2080            MinSAD=SAD
2081            If Motion Vector equal to Previous frame motion vector
2082                    and MinSAD<PrevFrmSAD goto Step 10.
2083            If SAD<=256 goto Step 10.
2084    */
2085    
2086    // Prepare for main loop
2087    
2088            currMV->x = start_x;
2089            currMV->y = start_y;
2090    
2091            if (!(MotionFlags & PMV_HALFPEL16)) {
2092                    currMV->x = EVEN(currMV->x);
2093                    currMV->y = EVEN(currMV->y);
2094            }
2095    
2096            if (currMV->x > max_dx)
2097                    currMV->x = max_dx;
2098            if (currMV->x < min_dx)
2099                    currMV->x = min_dx;
2100            if (currMV->y > max_dy)
2101                    currMV->y = max_dy;
2102            if (currMV->y < min_dy)
2103                    currMV->y = min_dy;
2104    
2105    /***************** This is predictor SET A: only median prediction ******************/
2106    
2107            iMinSAD =
2108                    sad16(cur,
2109                              get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,
2110                                                     iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);
2111            iMinSAD +=
2112                    calc_delta_16(currMV->x - center_x, currMV->y - center_y,
2113                                              (uint8_t) iFcode, iQuant);
2114    
2115    // thresh1 is fixed to 256
2116            if ((iMinSAD < 256) ||
2117                    ((MVequal(*currMV, prevMB->mvs[0])) &&
2118                     ((int32_t) iMinSAD < prevMB->sad16))) {
2119                    if (MotionFlags & PMV_QUICKSTOP16)
2120                            goto EPZS16_Terminate_without_Refine;
2121                    if (MotionFlags & PMV_EARLYSTOP16)
2122                            goto EPZS16_Terminate_with_Refine;
2123            }
2124    
2125    /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/
2126    
2127    // previous frame MV
2128            CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);
2129    
2130    // set threshhold based on Min of Prediction and SAD of collocated block
2131    // CHECK_MV16 always uses iSAD for the SAD of last vector to check, so now iSAD is what we want
2132    
2133            if ((x == 0) && (y == 0)) {
2134                    thresh2 = 512;
2135            } else {
2136    /* T_k = 1.2 * MIN(SAD_top,SAD_left,SAD_topleft,SAD_coll) +128;   [Tourapis, 2002] */
2137    
2138                    thresh2 = MIN(psad[0], iSAD) * 6 / 5 + 128;
2139            }
2140    
2141    // MV=(0,0) is often a good choice
2142    
2143            CHECK_MV16_ZERO;
2144    
2145    
2146    // left neighbour, if allowed
2147            if (x != 0) {
2148                    if (!(MotionFlags & PMV_HALFPEL16)) {
2149                            pmv[1].x = EVEN(pmv[1].x);
2150                            pmv[1].y = EVEN(pmv[1].y);
2151                    }
2152                    CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);
2153            }
2154    // top neighbour, if allowed
2155            if (y != 0) {
2156                    if (!(MotionFlags & PMV_HALFPEL16)) {
2157                            pmv[2].x = EVEN(pmv[2].x);
2158                            pmv[2].y = EVEN(pmv[2].y);
2159                    }
2160                    CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);
2161    
2162    // top right neighbour, if allowed
2163                    if ((uint32_t) x != (iWcount - 1)) {
2164                            if (!(MotionFlags & PMV_HALFPEL16)) {
2165                                    pmv[3].x = EVEN(pmv[3].x);
2166                                    pmv[3].y = EVEN(pmv[3].y);
2167                            }
2168                            CHECK_MV16_CANDIDATE(pmv[3].x, pmv[3].y);
2169                    }
2170            }
2171    
2172    /* Terminate if MinSAD <= T_2
2173       Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]
2174    */
2175    
2176            if ((iMinSAD <= thresh2)
2177                    || (MVequal(*currMV, prevMB->mvs[0]) &&
2178                            ((int32_t) iMinSAD <= prevMB->sad16))) {
2179                    if (MotionFlags & PMV_QUICKSTOP16)
2180                            goto EPZS16_Terminate_without_Refine;
2181                    if (MotionFlags & PMV_EARLYSTOP16)
2182                            goto EPZS16_Terminate_with_Refine;
2183            }
2184    
2185    /***** predictor SET C: acceleration MV (new!), neighbours in prev. frame(new!) ****/
2186    
2187            backupMV = prevMB->mvs[0];      // collocated MV
2188            backupMV.x += (prevMB->mvs[0].x - oldMB->mvs[0].x);     // acceleration X
2189            backupMV.y += (prevMB->mvs[0].y - oldMB->mvs[0].y);     // acceleration Y
2190    
2191            CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y);
2192    
2193    // left neighbour
2194            if (x != 0)
2195                    CHECK_MV16_CANDIDATE((prevMB - 1)->mvs[0].x, (prevMB - 1)->mvs[0].y);
2196    
2197    // top neighbour
2198            if (y != 0)
2199                    CHECK_MV16_CANDIDATE((prevMB - iWcount)->mvs[0].x,
2200                                                             (prevMB - iWcount)->mvs[0].y);
2201    
2202    // right neighbour, if allowed (this value is not written yet, so take it from   pMB->mvs
2203    
2204            if ((uint32_t) x != iWcount - 1)
2205                    CHECK_MV16_CANDIDATE((prevMB + 1)->mvs[0].x, (prevMB + 1)->mvs[0].y);
2206    
2207    // bottom neighbour, dito
2208            if ((uint32_t) y != iHcount - 1)
2209                    CHECK_MV16_CANDIDATE((prevMB + iWcount)->mvs[0].x,
2210                                                             (prevMB + iWcount)->mvs[0].y);
2211    
2212    /* Terminate if MinSAD <= T_3 (here T_3 = T_2)  */
2213            if (iMinSAD <= thresh2) {
2214                    if (MotionFlags & PMV_QUICKSTOP16)
2215                            goto EPZS16_Terminate_without_Refine;
2216                    if (MotionFlags & PMV_EARLYSTOP16)
2217                            goto EPZS16_Terminate_with_Refine;
2218            }
2219    
2220    /************ (if Diamond Search)  **************/
2221    
2222            backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */
2223    
2224            if (MotionFlags & PMV_USESQUARES16)
2225                    MainSearchPtr = Square16_MainSearch;
2226            else
2227             if (MotionFlags & PMV_ADVANCEDDIAMOND16)
2228                    MainSearchPtr = AdvDiamond16_MainSearch;
2229            else
2230                    MainSearchPtr = Diamond16_MainSearch;
2231    
2232    /* default: use best prediction as starting point for one call of PMVfast_MainSearch */
2233    
2234            iSAD =
2235                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,
2236                                                      currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,
2237                                                      min_dy, max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);
2238    
2239            if (iSAD < iMinSAD) {
2240                    *currMV = newMV;
2241                    iMinSAD = iSAD;
2242            }
2243    
2244    
2245            if (MotionFlags & PMV_EXTSEARCH16) {
2246    /* extended mode: search (up to) two more times: orignal prediction and (0,0) */
2247    
2248                    if (!(MVequal(pmv[0], backupMV))) {
2249                            iSAD =
2250                                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,
2251                                                                      pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,
2252                                                                      min_dx, max_dx, min_dy, max_dy, iEdgedWidth,
2253                                                                      2, iFcode, iQuant, 0);
2254                    }
2255    
2256                    if (iSAD < iMinSAD) {
2257                            *currMV = newMV;
2258                            iMinSAD = iSAD;
2259                    }
2260    
2261                    if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {
2262                            iSAD =
2263                                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,
2264                                                                      iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,
2265                                                                      max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);
2266    
2267                            if (iSAD < iMinSAD) {
2268                                    *currMV = newMV;
2269                                    iMinSAD = iSAD;
2270                            }
2271                    }
2272            }
2273    
2274    /***************        Choose best MV found     **************/
2275    
2276      EPZS16_Terminate_with_Refine:
2277            if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step
2278                    iMinSAD =
2279                            Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,
2280                                                             iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,
2281                                                             iFcode, iQuant, iEdgedWidth);
2282    
2283  step10_8b:    EPZS16_Terminate_without_Refine:
2284    
2285          currPMV->x = currMV->x - pmv[0].x;          *oldMB = *prevMB;
         currPMV->y = currMV->y - pmv[0].y;  
2286    
2287            currPMV->x = currMV->x - center_x;
2288            currPMV->y = currMV->y - center_y;
2289          return iMinSAD;          return iMinSAD;
2290  }  }
2291    
2292    
2293    int32_t
2294    EPZSSearch8(const uint8_t * const pRef,
2295                            const uint8_t * const pRefH,
2296                            const uint8_t * const pRefV,
2297                            const uint8_t * const pRefHV,
2298                            const IMAGE * const pCur,
2299                            const int x,
2300                            const int y,
2301                            const int start_x,
2302                            const int start_y,
2303                            const int center_x,
2304                            const int center_y,
2305                            const uint32_t MotionFlags,
2306                            const uint32_t iQuant,
2307                            const uint32_t iFcode,
2308                            const MBParam * const pParam,
2309                            const MACROBLOCK * const pMBs,
2310                            const MACROBLOCK * const prevMBs,
2311                            VECTOR * const currMV,
2312                            VECTOR * const currPMV)
2313    {
2314    /* Please not that EPZS might not be a good choice for 8x8-block motion search ! */
2315    
2316            const uint32_t iWcount = pParam->mb_width;
2317            const int32_t iWidth = pParam->width;
2318            const int32_t iHeight = pParam->height;
2319            const int32_t iEdgedWidth = pParam->edged_width;
2320    
2321            const uint8_t *cur = pCur->y + x * 8 + y * 8 * iEdgedWidth;
2322    
2323            int32_t iDiamondSize = 1;
2324    
2325            int32_t min_dx;
2326            int32_t max_dx;
2327            int32_t min_dy;
2328            int32_t max_dy;
2329    
2330            VECTOR newMV;
2331            VECTOR backupMV;
2332    
2333            VECTOR pmv[4];
2334            int32_t psad[8];
2335    
2336            const int32_t iSubBlock = ((y & 1) << 1) + (x & 1);
2337    
2338    //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;
2339            const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;
2340    
2341            int32_t bPredEq;
2342            int32_t iMinSAD, iSAD = 9999;
2343    
2344            MainSearch8FuncPtr MainSearchPtr;
2345    
2346    /* Get maximum range */
2347            get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,
2348                              iFcode);
2349    
2350    /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */
2351    
2352            if (!(MotionFlags & PMV_HALFPEL8)) {
2353                    min_dx = EVEN(min_dx);
2354                    max_dx = EVEN(max_dx);
2355                    min_dy = EVEN(min_dy);
2356                    max_dy = EVEN(max_dy);
2357            }
2358            /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */
2359            //bPredEq = get_pmvdata(pMBs, x >> 1, y >> 1, iWcount, iSubBlock, pmv[0].x, pmv[0].y, psad);
2360            bPredEq = get_pmvdata2(pMBs, iWcount, 0, x >> 1, y >> 1, iSubBlock, pmv, psad);
2361    
2362    
2363    /* Step 4: Calculate SAD around the Median prediction.
2364            MinSAD=SAD
2365            If Motion Vector equal to Previous frame motion vector
2366                    and MinSAD<PrevFrmSAD goto Step 10.
2367            If SAD<=256 goto Step 10.
2368    */
2369    
2370    // Prepare for main loop
2371    
2372    
2373            if (!(MotionFlags & PMV_HALFPEL8)) {
2374                    currMV->x = EVEN(currMV->x);
2375                    currMV->y = EVEN(currMV->y);
2376            }
2377    
2378            if (currMV->x > max_dx)
2379                    currMV->x = max_dx;
2380            if (currMV->x < min_dx)
2381                    currMV->x = min_dx;
2382            if (currMV->y > max_dy)
2383                    currMV->y = max_dy;
2384            if (currMV->y < min_dy)
2385                    currMV->y = min_dy;
2386    
2387    /***************** This is predictor SET A: only median prediction ******************/
2388    
2389    
2390            iMinSAD =
2391                    sad8(cur,
2392                             get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,
2393                                                    iEdgedWidth), iEdgedWidth);
2394            iMinSAD +=
2395                    calc_delta_8(currMV->x - center_x, currMV->y - center_y,
2396                                             (uint8_t) iFcode, iQuant);
2397    
2398    
2399    // thresh1 is fixed to 256
2400            if (iMinSAD < 256 / 4) {
2401                    if (MotionFlags & PMV_QUICKSTOP8)
2402                            goto EPZS8_Terminate_without_Refine;
2403                    if (MotionFlags & PMV_EARLYSTOP8)
2404                            goto EPZS8_Terminate_with_Refine;
2405            }
2406    
2407    /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/
2408    
2409    
2410    // MV=(0,0) is often a good choice
2411            CHECK_MV8_ZERO;
2412    
2413    // previous frame MV
2414            CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x, prevMB->mvs[iSubBlock].y);
2415    
2416    // left neighbour, if allowed
2417            if (psad[1] != MV_MAX_ERROR) {
2418                    if (!(MotionFlags & PMV_HALFPEL8)) {
2419                            pmv[1].x = EVEN(pmv[1].x);
2420                            pmv[1].y = EVEN(pmv[1].y);
2421                    }
2422                    CHECK_MV8_CANDIDATE(pmv[1].x, pmv[1].y);
2423            }
2424    // top neighbour, if allowed
2425            if (psad[2] != MV_MAX_ERROR) {
2426                    if (!(MotionFlags & PMV_HALFPEL8)) {
2427                            pmv[2].x = EVEN(pmv[2].x);
2428                            pmv[2].y = EVEN(pmv[2].y);
2429                    }
2430                    CHECK_MV8_CANDIDATE(pmv[2].x, pmv[2].y);
2431    
2432    // top right neighbour, if allowed
2433                    if (psad[3] != MV_MAX_ERROR) {
2434                            if (!(MotionFlags & PMV_HALFPEL8)) {
2435                                    pmv[3].x = EVEN(pmv[3].x);
2436                                    pmv[3].y = EVEN(pmv[3].y);
2437                            }
2438                            CHECK_MV8_CANDIDATE(pmv[3].x, pmv[3].y);
2439                    }
2440            }
2441    
2442    /*  // this bias is zero anyway, at the moment!
2443    
2444            if ( (MVzero(*currMV)) && (!MVzero(pmv[0])) ) // && (iMinSAD <= iQuant * 96)
2445                    iMinSAD -= MV8_00_BIAS;
2446    
2447    */
2448    
2449    /* Terminate if MinSAD <= T_2
2450       Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]
2451    */
2452    
2453            if (iMinSAD < 512 / 4) {        /* T_2 == 512/4 hardcoded */
2454                    if (MotionFlags & PMV_QUICKSTOP8)
2455                            goto EPZS8_Terminate_without_Refine;
2456                    if (MotionFlags & PMV_EARLYSTOP8)
2457                            goto EPZS8_Terminate_with_Refine;
2458            }
2459    
2460    /************ (Diamond Search)  **************/
2461    
2462            backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */
2463    
2464            if (!(MotionFlags & PMV_HALFPELDIAMOND8))
2465                    iDiamondSize *= 2;
2466    
2467    /* default: use best prediction as starting point for one call of EPZS_MainSearch */
2468    
2469    // there is no EPZS^2 for inter4v at the moment
2470    
2471    //  if (MotionFlags & PMV_USESQUARES8)
2472    //      MainSearchPtr = Square8_MainSearch;
2473    //  else
2474    
2475            if (MotionFlags & PMV_ADVANCEDDIAMOND8)
2476                    MainSearchPtr = AdvDiamond8_MainSearch;
2477            else
2478                    MainSearchPtr = Diamond8_MainSearch;
2479    
2480            iSAD =
2481                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,
2482                                                      currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,
2483                                                      min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,
2484                                                      iQuant, 0);
2485    
2486    
2487            if (iSAD < iMinSAD) {
2488                    *currMV = newMV;
2489                    iMinSAD = iSAD;
2490            }
2491    
2492            if (MotionFlags & PMV_EXTSEARCH8) {
2493    /* extended mode: search (up to) two more times: orignal prediction and (0,0) */
2494    
2495                    if (!(MVequal(pmv[0], backupMV))) {
2496                            iSAD =
2497                                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,
2498                                                                      pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,
2499                                                                      min_dx, max_dx, min_dy, max_dy, iEdgedWidth,
2500                                                                      iDiamondSize, iFcode, iQuant, 0);
2501    
2502                            if (iSAD < iMinSAD) {
2503                                    *currMV = newMV;
2504                                    iMinSAD = iSAD;
2505                            }
2506                    }
2507    
2508                    if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {
2509                            iSAD =
2510                                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,
2511                                                                      iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,
2512                                                                      max_dy, iEdgedWidth, iDiamondSize, iFcode,
2513                                                                      iQuant, 0);
2514    
2515                            if (iSAD < iMinSAD) {
2516                                    *currMV = newMV;
2517                                    iMinSAD = iSAD;
2518                            }
2519                    }
2520            }
2521    
2522    /***************        Choose best MV found     **************/
2523    
2524      EPZS8_Terminate_with_Refine:
2525            if (MotionFlags & PMV_HALFPELREFINE8)   // perform final half-pel step
2526                    iMinSAD =
2527                            Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,
2528                                                            iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,
2529                                                            iFcode, iQuant, iEdgedWidth);
2530    
2531      EPZS8_Terminate_without_Refine:
2532    
2533            currPMV->x = currMV->x - center_x;
2534            currPMV->y = currMV->y - center_y;
2535            return iMinSAD;
2536    }
2537    
2538    
2539    
2540    int32_t
2541    PMVfastIntSearch16(const uint8_t * const pRef,
2542                                    const uint8_t * const pRefH,
2543                                    const uint8_t * const pRefV,
2544                                    const uint8_t * const pRefHV,
2545                                    const IMAGE * const pCur,
2546                                    const int x,
2547                                    const int y,
2548                            const int start_x,
2549                            const int start_y,
2550                            const int center_x,
2551                            const int center_y,
2552                                    const uint32_t MotionFlags,
2553                                    const uint32_t iQuant,
2554                                    const uint32_t iFcode,
2555                                    const MBParam * const pParam,
2556                                    const MACROBLOCK * const pMBs,
2557                                    const MACROBLOCK * const prevMBs,
2558                                    VECTOR * const currMV,
2559                                    VECTOR * const currPMV)
2560    {
2561            const uint32_t iWcount = pParam->mb_width;
2562            const int32_t iWidth = pParam->width;
2563            const int32_t iHeight = pParam->height;
2564            const int32_t iEdgedWidth = pParam->edged_width;
2565    
2566            const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;
2567            const VECTOR zeroMV = { 0, 0 };
2568    
2569            int32_t iDiamondSize;
2570    
2571            int32_t min_dx;
2572            int32_t max_dx;
2573            int32_t min_dy;
2574            int32_t max_dy;
2575    
2576            int32_t iFound;
2577    
2578            VECTOR newMV;
2579            VECTOR backupMV;                        /* just for PMVFAST */
2580    
2581            VECTOR pmv[4];
2582            int32_t psad[4];
2583    
2584            MainSearch16FuncPtr MainSearchPtr;
2585    
2586            const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;
2587            MACROBLOCK *const pMB = pMBs + x + y * iWcount;
2588    
2589            int32_t threshA, threshB;
2590            int32_t bPredEq;
2591            int32_t iMinSAD, iSAD;
2592    
2593    
2594    /* Get maximum range */
2595            get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,
2596                              iFcode);
2597    
2598    /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */
2599    
2600            if ((x == 0) && (y == 0)) {
2601                    threshA = 512;
2602                    threshB = 1024;
2603    
2604                    bPredEq = 0;
2605                    psad[0] = psad[1] = psad[2] = psad[3] = 0;
2606                    *currMV = pmv[0] = pmv[1] = pmv[2] = pmv[3] = zeroMV;
2607    
2608            } else {
2609                    threshA = psad[0];
2610                    threshB = threshA + 256;
2611                    if (threshA < 512)
2612                            threshA = 512;
2613                    if (threshA > 1024)
2614                            threshA = 1024;
2615                    if (threshB > 1792)
2616                            threshB = 1792;
2617    
2618                    bPredEq = get_ipmvdata(pMBs, iWcount, 0, x, y, 0, pmv, psad);
2619                    *currMV = pmv[0];                       /* current best := prediction */
2620            }
2621    
2622            iFound = 0;
2623    
2624    /* Step 4: Calculate SAD around the Median prediction.
2625       MinSAD=SAD
2626       If Motion Vector equal to Previous frame motion vector
2627       and MinSAD<PrevFrmSAD goto Step 10.
2628       If SAD<=256 goto Step 10.
2629    */
2630    
2631            if (currMV->x > max_dx) {
2632                    currMV->x = EVEN(max_dx);
2633            }
2634            if (currMV->x < min_dx) {
2635                    currMV->x = EVEN(min_dx);
2636            }
2637            if (currMV->y > max_dy) {
2638                    currMV->y = EVEN(max_dy);
2639            }
2640            if (currMV->y < min_dy) {
2641                    currMV->y = EVEN(min_dy);
2642            }
2643    
2644            iMinSAD =
2645                    sad16(cur,
2646                              get_iref_mv(pRef, x, y, 16, currMV,
2647                                                     iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);
2648            iMinSAD +=
2649                    calc_delta_16(currMV->x - center_x, currMV->y - center_y,
2650                                              (uint8_t) iFcode, iQuant);
2651    
2652            if ((iMinSAD < 256) ||
2653                    ((MVequal(*currMV, prevMB->i_mvs[0])) &&
2654                     ((int32_t) iMinSAD < prevMB->i_sad16))) {
2655                    if (iMinSAD < 2 * iQuant)       // high chances for SKIP-mode
2656                    {
2657                            if (!MVzero(*currMV)) {
2658                                    iMinSAD += MV16_00_BIAS;
2659                                    CHECK_MV16_ZERO;        // (0,0) saves space for letterboxed pictures
2660                                    iMinSAD -= MV16_00_BIAS;
2661                            }
2662                    }
2663    
2664                    if (MotionFlags & PMV_EARLYSTOP16)
2665                            goto PMVfastInt16_Terminate_with_Refine;
2666            }
2667    
2668    
2669    /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion
2670       vector of the median.
2671       If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2
2672    */
2673    
2674            if ((bPredEq) && (MVequal(pmv[0], prevMB->i_mvs[0])))
2675                    iFound = 2;
2676    
2677    /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.
2678       Otherwise select large Diamond Search.
2679    */
2680    
2681            if ((!MVzero(pmv[0])) || (threshB < 1536) || (bPredEq))
2682                    iDiamondSize = 2;               // halfpel units!
2683            else
2684                    iDiamondSize = 4;               // halfpel units!
2685    
2686    /*
2687       Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.
2688       Also calculate (0,0) but do not subtract offset.
2689       Let MinSAD be the smallest SAD up to this point.
2690       If MV is (0,0) subtract offset.
2691    */
2692    
2693    // (0,0) is often a good choice
2694    
2695            if (!MVzero(pmv[0]))
2696                    CHECK_MV16_ZERO;
2697    
2698    // previous frame MV is always possible
2699    
2700            if (!MVzero(prevMB->i_mvs[0]))
2701                    if (!MVequal(prevMB->i_mvs[0], pmv[0]))
2702                            CHECK_MV16_CANDIDATE(prevMB->i_mvs[0].x, prevMB->i_mvs[0].y);
2703    
2704    // left neighbour, if allowed
2705    
2706            if (!MVzero(pmv[1]))
2707                    if (!MVequal(pmv[1], prevMB->i_mvs[0]))
2708                            if (!MVequal(pmv[1], pmv[0]))
2709                                    CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);
2710    
2711    // top neighbour, if allowed
2712            if (!MVzero(pmv[2]))
2713                    if (!MVequal(pmv[2], prevMB->i_mvs[0]))
2714                            if (!MVequal(pmv[2], pmv[0]))
2715                                    if (!MVequal(pmv[2], pmv[1]))
2716                                            CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);
2717    
2718    // top right neighbour, if allowed
2719                                            if (!MVzero(pmv[3]))
2720                                                    if (!MVequal(pmv[3], prevMB->i_mvs[0]))
2721                                                            if (!MVequal(pmv[3], pmv[0]))
2722                                                                    if (!MVequal(pmv[3], pmv[1]))
2723                                                                            if (!MVequal(pmv[3], pmv[2]))
2724                                                                                    CHECK_MV16_CANDIDATE(pmv[3].x,
2725                                                                                                                             pmv[3].y);
2726    
2727            if ((MVzero(*currMV)) &&
2728                    (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )
2729                    iMinSAD -= MV16_00_BIAS;
2730    
2731    
2732    /* Step 6: If MinSAD <= thresa goto Step 10.
2733       If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.
2734    */
2735    
2736            if ((iMinSAD <= threshA) ||
2737                    (MVequal(*currMV, prevMB->i_mvs[0]) &&
2738                     ((int32_t) iMinSAD < prevMB->i_sad16))) {
2739    
2740                    if (MotionFlags & PMV_EARLYSTOP16)
2741                            goto PMVfastInt16_Terminate_with_Refine;
2742            }
2743    
2744    
2745    /************ (Diamond Search)  **************/
2746    /*
2747       Step 7: Perform Diamond search, with either the small or large diamond.
2748       If Found=2 only examine one Diamond pattern, and afterwards goto step 10
2749       Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.
2750       If center then goto step 10.
2751       Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.
2752       Refine by using small diamond and goto step 10.
2753    */
2754    
2755            if (MotionFlags & PMV_USESQUARES16)
2756                    MainSearchPtr = Square16_MainSearch;
2757            else if (MotionFlags & PMV_ADVANCEDDIAMOND16)
2758                    MainSearchPtr = AdvDiamond16_MainSearch;
2759            else
2760                    MainSearchPtr = Diamond16_MainSearch;
2761    
2762            backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */
2763    
2764    
2765    /* default: use best prediction as starting point for one call of PMVfast_MainSearch */
2766            iSAD =
2767                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,
2768                                                      currMV->y, iMinSAD, &newMV, center_x, center_y, min_dx, max_dx,
2769                                                      min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,
2770                                                      iQuant, iFound);
2771    
2772            if (iSAD < iMinSAD) {
2773                    *currMV = newMV;
2774                    iMinSAD = iSAD;
2775            }
2776    
2777            if (MotionFlags & PMV_EXTSEARCH16) {
2778    /* extended: search (up to) two more times: orignal prediction and (0,0) */
2779    
2780                    if (!(MVequal(pmv[0], backupMV))) {
2781                            iSAD =
2782                                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,
2783                                                                      pmv[0].x, pmv[0].y, iMinSAD, &newMV, center_x, center_y,
2784                                                                      min_dx, max_dx, min_dy, max_dy, iEdgedWidth,
2785                                                                      iDiamondSize, iFcode, iQuant, iFound);
2786    
2787                            if (iSAD < iMinSAD) {
2788                                    *currMV = newMV;
2789                                    iMinSAD = iSAD;
2790                            }
2791                    }
2792    
2793                    if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {
2794                            iSAD =
2795                                    (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,
2796                                                                      iMinSAD, &newMV, center_x, center_y, min_dx, max_dx, min_dy,
2797                                                                      max_dy, iEdgedWidth, iDiamondSize, iFcode,
2798                                                                      iQuant, iFound);
2799    
2800                            if (iSAD < iMinSAD) {
2801                                    *currMV = newMV;
2802                                    iMinSAD = iSAD;
2803                            }
2804                    }
2805            }
2806    
2807    /*
2808       Step 10:  The motion vector is chosen according to the block corresponding to MinSAD.
2809    */
2810    
2811    PMVfastInt16_Terminate_with_Refine:
2812    
2813            pMB->i_mvs[0] = pMB->i_mvs[1] = pMB->i_mvs[2] = pMB->i_mvs[3] = pMB->i_mv16 = *currMV;
2814            pMB->i_sad8[0] = pMB->i_sad8[1] = pMB->i_sad8[2] = pMB->i_sad8[3] = pMB->i_sad16 = iMinSAD;
2815    
2816            if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step
2817                    iMinSAD =
2818                            Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,
2819                                                             iMinSAD, center_x, center_y, min_dx, max_dx, min_dy, max_dy,
2820                                                             iFcode, iQuant, iEdgedWidth);
2821    
2822            pmv[0] = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);          // get _REAL_ prediction (halfpel possible)
2823    
2824    PMVfastInt16_Terminate_without_Refine:
2825            currPMV->x = currMV->x - center_x;
2826            currPMV->y = currMV->y - center_y;
2827            return iMinSAD;
2828    }
2829    
2830    
2831    
2832    /* ***********************************************************
2833            bvop motion estimation
2834    // TODO: need to incorporate prediction here (eg. sad += calc_delta_16)
2835    ***************************************************************/
2836    
2837    
2838    #define DIRECT_PENALTY 0
2839    #define DIRECT_UPPERLIMIT 256   // never use direct mode if SAD is larger than this
2840    
2841    void
2842    MotionEstimationBVOP(MBParam * const pParam,
2843                                             FRAMEINFO * const frame,
2844                                             const int32_t time_bp,
2845                                             const int32_t time_pp,
2846                                             // forward (past) reference
2847                                             const MACROBLOCK * const f_mbs,
2848                                             const IMAGE * const f_ref,
2849                                             const IMAGE * const f_refH,
2850                                             const IMAGE * const f_refV,
2851                                             const IMAGE * const f_refHV,
2852                                             // backward (future) reference
2853                                             const MACROBLOCK * const b_mbs,
2854                                             const IMAGE * const b_ref,
2855                                             const IMAGE * const b_refH,
2856                                             const IMAGE * const b_refV,
2857                                             const IMAGE * const b_refHV)
2858    {
2859            const int mb_width = pParam->mb_width;
2860            const int mb_height = pParam->mb_height;
2861            const int edged_width = pParam->edged_width;
2862    
2863            int i, j, k;
2864    
2865            static const VECTOR zeroMV={0,0};
2866    
2867            int f_sad16;    /* forward (as usual) search */
2868            int b_sad16;    /* backward (only in b-frames) search */
2869            int i_sad16;    /* interpolated (both direction, b-frames only) */
2870            int d_sad16;    /* direct mode (assume linear motion) */
2871            int dnv_sad16;  /* direct mode (assume linear motion) without correction vector */
2872    
2873            int best_sad;
2874    
2875            VECTOR f_predMV, b_predMV;      /* there is no direct prediction */
2876            VECTOR pmv_dontcare;
2877    
2878            int f_count=0;
2879            int b_count=0;
2880            int i_count=0;
2881            int d_count=0;
2882            int dnv_count=0;
2883            int s_count=0;
2884            const int64_t TRB = (int32_t)time_pp - (int32_t)time_bp;
2885        const int64_t TRD = (int32_t)time_pp;
2886    
2887            // fprintf(stderr,"TRB = %lld  TRD = %lld  time_bp =%d time_pp =%d\n\n",TRB,TRD,time_bp,time_pp);
2888            // note: i==horizontal, j==vertical
2889            for (j = 0; j < mb_height; j++) {
2890    
2891                    f_predMV = zeroMV;      /* prediction is reset at left boundary */
2892                    b_predMV = zeroMV;
2893    
2894                    for (i = 0; i < mb_width; i++) {
2895                            MACROBLOCK *mb = &frame->mbs[i + j * mb_width];
2896                            const MACROBLOCK *f_mb = &f_mbs[i + j * mb_width];
2897                            const MACROBLOCK *b_mb = &b_mbs[i + j * mb_width];
2898    
2899                            VECTOR directMV;
2900                            VECTOR deltaMV=zeroMV;
2901    
2902    /* special case, if collocated block is SKIPed: encoding is forward(0,0)  */
2903    
2904                            if (b_mb->mode == MODE_INTER && b_mb->cbp == 0 &&
2905                                    b_mb->mvs[0].x == 0 && b_mb->mvs[0].y == 0) {
2906                                    mb->mode = MODE_NOT_CODED;
2907                                    mb->mvs[0].x = 0;
2908                                    mb->mvs[0].y = 0;
2909                                    mb->b_mvs[0].x = 0;
2910                                    mb->b_mvs[0].y = 0;
2911                                    continue;
2912                            }
2913    
2914                            dnv_sad16 = DIRECT_PENALTY;
2915    
2916                            if (b_mb->mode == MODE_INTER4V)
2917                            {
2918    
2919                            /* same method of scaling as in decoder.c, so we copy from there */
2920                        for (k = 0; k < 4; k++) {
2921    
2922                                            directMV = b_mb->mvs[k];
2923    
2924                                            mb->mvs[k].x = (int32_t) ((TRB * directMV.x) / TRD + deltaMV.x);
2925                        mb->b_mvs[k].x = (int32_t) ((deltaMV.x == 0)
2926                                                                                    ? ((TRB - TRD) * directMV.x) / TRD
2927                                                : mb->mvs[k].x - directMV.x);
2928                        mb->mvs[k].y = (int32_t) ((TRB * directMV.y) / TRD + deltaMV.y);
2929                            mb->b_mvs[k].y = (int32_t) ((deltaMV.y == 0)
2930                                                                                    ? ((TRB - TRD) * directMV.y) / TRD
2931                                                : mb->mvs[k].y - directMV.y);
2932    
2933                                            dnv_sad16 +=
2934                                                    sad8bi(frame->image.y + 2*(i+(k&1))*8 + 2*(j+(k>>1))*8*edged_width,
2935                                                      get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
2936                                                                    2*(i+(k&1)), 2*(j+(k>>1)), 8, &mb->mvs[k], edged_width),
2937                                                      get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
2938                                                                    2*(i+(k&1)), 2*(j+(k>>1)), 8, &mb->b_mvs[k], edged_width),
2939                                                      edged_width);
2940                                    }
2941                            }
2942                            else
2943                            {
2944                                    directMV = b_mb->mvs[0];
2945    
2946                                    mb->mvs[0].x = (int32_t) ((TRB * directMV.x) / TRD + deltaMV.x);
2947                    mb->b_mvs[0].x = (int32_t) ((deltaMV.x == 0)
2948                                                                    ? ((TRB - TRD) * directMV.x) / TRD
2949                                        : mb->mvs[0].x - directMV.x);
2950                    mb->mvs[0].y = (int32_t) ((TRB * directMV.y) / TRD + deltaMV.y);
2951                        mb->b_mvs[0].y = (int32_t) ((deltaMV.y == 0)
2952                                                                    ? ((TRB - TRD) * directMV.y) / TRD
2953                                    : mb->mvs[0].y - directMV.y);
2954    
2955                                    dnv_sad16 = DIRECT_PENALTY +
2956                                            sad16bi(frame->image.y + i * 16 + j * 16 * edged_width,
2957                                                      get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
2958                                                                    i, j, 16, &mb->mvs[0], edged_width),
2959                                                      get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
2960                                                                    i, j, 16, &mb->b_mvs[0], edged_width),
2961                                                      edged_width);
2962    
2963    
2964                }
2965    
2966                            // forward search
2967                            f_sad16 = SEARCH16(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
2968                                                    &frame->image, i, j,
2969                                                    mb->mvs[0].x, mb->mvs[0].y,                     /* start point f_directMV */
2970                                                    f_predMV.x, f_predMV.y,                         /* center is f-prediction */
2971                                                    frame->motion_flags & (~(PMV_EARLYSTOP16|PMV_QUICKSTOP16)),
2972                                                    frame->quant, frame->fcode, pParam,
2973                                                    f_mbs, f_mbs,
2974                                                    &mb->mvs[0], &pmv_dontcare);
2975    
2976    
2977                            // backward search
2978                            b_sad16 = SEARCH16(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
2979                                                    &frame->image, i, j,
2980                                                    mb->b_mvs[0].x, mb->b_mvs[0].y,         /* start point b_directMV */
2981                                                    b_predMV.x, b_predMV.y,                         /* center is b-prediction */
2982                                                    frame->motion_flags & (~(PMV_EARLYSTOP16|PMV_QUICKSTOP16)),
2983                                                    frame->quant, frame->bcode, pParam,
2984                                                    b_mbs, b_mbs,
2985                                                    &mb->b_mvs[0], &pmv_dontcare);
2986    
2987                            i_sad16 =
2988                                    sad16bi(frame->image.y + i * 16 + j * 16 * edged_width,
2989                                                      get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
2990                                                                    i, j, 16, &mb->mvs[0], edged_width),
2991                                                      get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
2992                                                                    i, j, 16, &mb->b_mvs[0], edged_width),
2993                                                      edged_width);
2994                        i_sad16 += calc_delta_16(mb->mvs[0].x-f_predMV.x, mb->mvs[0].y-f_predMV.y,
2995                                                                    frame->fcode, frame->quant);
2996                        i_sad16 += calc_delta_16(mb->b_mvs[0].y-b_predMV.y, mb->b_mvs[0].y-b_predMV.y,
2997                                                                    frame->bcode, frame->quant);
2998    
2999                            // TODO: direct search
3000                            // predictor + delta vector in range [-32,32] (fcode=1)
3001    
3002    //                      i_sad16 = 65535;
3003    //                      f_sad16 = 65535;
3004    //                      b_sad16 = 65535;
3005    
3006                            if (f_sad16 < b_sad16) {
3007                                    best_sad = f_sad16;
3008                                    mb->mode = MODE_FORWARD;
3009                            } else {
3010                                    best_sad = b_sad16;
3011                                    mb->mode = MODE_BACKWARD;
3012                            }
3013    
3014                            if (i_sad16 < best_sad) {
3015                                    best_sad = i_sad16;
3016                                    mb->mode = MODE_INTERPOLATE;
3017                            }
3018    
3019                            if (dnv_sad16 < best_sad) {
3020    
3021                                    if (dnv_sad16 > DIRECT_UPPERLIMIT)
3022                                    {
3023                                            /* if SAD value is too large, try same vector with MODE_INTERPOLATE
3024                                               instead (interpolate has residue encoding, direct mode without MV
3025                                               doesn't)
3026    
3027                                                    This has to be replaced later by "real" direct mode, including delta
3028                                                    vector and (if needed) residue encoding
3029    
3030                                            */
3031    
3032                                            directMV = b_mb->mvs[0];
3033    
3034                                            mb->mvs[0].x = (int32_t) ((TRB * directMV.x) / TRD + deltaMV.x);
3035                        mb->b_mvs[0].x = (int32_t) ((deltaMV.x == 0)
3036                                                                                    ? ((TRB - TRD) * directMV.x) / TRD
3037                                            : mb->mvs[0].x - directMV.x);
3038                            mb->mvs[0].y = (int32_t) ((TRB * directMV.y) / TRD + deltaMV.y);
3039                            mb->b_mvs[0].y = (int32_t) ((deltaMV.y == 0)
3040                                                                                    ? ((TRB - TRD) * directMV.y) / TRD
3041                                                : mb->mvs[0].y - directMV.y);
3042    
3043                                            dnv_sad16 =
3044                                                    sad16bi(frame->image.y + i * 16 + j * 16 * edged_width,
3045                                                      get_ref_mv(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,
3046                                                                    i, j, 16, &mb->mvs[0], edged_width),
3047                                                      get_ref_mv(b_ref->y, b_refH->y, b_refV->y, b_refHV->y,
3048                                                                    i, j, 16, &mb->b_mvs[0], edged_width),
3049                                                      edged_width);
3050                                    dnv_sad16 += calc_delta_16(mb->mvs[0].x-f_predMV.x, mb->mvs[0].y-f_predMV.y,
3051                                                                    frame->fcode, frame->quant);
3052                                        dnv_sad16 += calc_delta_16(mb->b_mvs[0].y-b_predMV.y, mb->b_mvs[0].y-b_predMV.y,
3053                                                                    frame->bcode, frame->quant);
3054    
3055                                            if (dnv_sad16 < best_sad)
3056                                            {
3057                                                    best_sad = dnv_sad16;
3058                                                    mb->mode = MODE_INTERPOLATE;
3059    
3060    /*                                              fprintf(stderr,"f_sad16 = %d, b_sad16 = %d, i_sad16 = %d, dnv_sad16 = %d\n",
3061                                                            f_sad16,b_sad16,i_sad16,dnv_sad16);
3062    */                                      }
3063                                    }
3064                                    else
3065                                    {
3066                                            best_sad = dnv_sad16;
3067                                            mb->mode = MODE_DIRECT_NONE_MV;
3068                                    }
3069                            }
3070    
3071                            switch (mb->mode)
3072                            {
3073                                    case MODE_FORWARD:
3074                                            f_count++;
3075                                            f_predMV = mb->mvs[0];
3076                                            break;
3077                                    case MODE_BACKWARD:
3078                                            b_count++;
3079                                            b_predMV = mb->b_mvs[0];
3080    
3081                                            break;
3082                                    case MODE_INTERPOLATE:
3083                                            i_count++;
3084                                            f_predMV = mb->mvs[0];
3085                                            b_predMV = mb->b_mvs[0];
3086                                            break;
3087                                    case MODE_DIRECT:
3088                                            d_count++; break;
3089                                    case MODE_DIRECT_NONE_MV:
3090                                            dnv_count++; break;
3091                                    default:
3092                                            s_count++; break;
3093                            }
3094    
3095                    }
3096            }
3097    
3098    #ifdef _DEBUG_BFRAME_STAT
3099            fprintf(stderr,"B-Stat: F: %04d   B: %04d   I: %04d  D0: %04d   D: %04d   S: %04d\n",
3100                                    f_count,b_count,i_count,dnv_count,d_count,s_count);
3101    #endif
3102    
3103    }

Legend:
Removed from v.3  
changed lines
  Added in v.326

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4