[svn] / branches / dev-api-4 / xvidcore / src / motion / motion_est.c Repository:
ViewVC logotype

Diff of /branches/dev-api-4/xvidcore/src/motion/motion_est.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/xvidcore/src/motion/motion_est.c revision 232, Fri Jun 21 16:12:48 2002 UTC branches/dev-api-4/xvidcore/src/motion/motion_est.c revision 1133, Thu Aug 28 11:14:04 2003 UTC
# Line 1  Line 1 
1  /**************************************************************************  /*****************************************************************************
2   *   *
3   *  Modifications:   *  XVID MPEG-4 VIDEO CODEC
4     *  - Motion Estimation related code  -
5   *   *
6   *      01.05.2002      updated MotionEstimationBVOP   *  Copyright(C) 2002 Christoph Lampert <gruel@web.de>
7   *      25.04.2002 partial prevMB conversion   *               2002 Michael Militzer <michael@xvid.org>
8   *  22.04.2002 remove some compile warning by chenm001 <chenm001@163.com>   *               2002-2003 Radoslaw Czyz <xvid@syskin.cjb.net>
  *  14.04.2002 added MotionEstimationBVOP()  
  *  02.04.2002 add EPZS(^2) as ME algorithm, use PMV_USESQUARES to choose between  
  *             EPZS and EPZS^2  
  *  08.02.2002 split up PMVfast into three routines: PMVFast, PMVFast_MainLoop  
  *             PMVFast_Refine to support multiple searches with different start points  
  *  07.01.2002 uv-block-based interpolation  
  *  06.01.2002 INTER/INTRA-decision is now done before any SEARCH8 (speedup)  
  *             changed INTER_BIAS to 150 (as suggested by suxen_drol)  
  *             removed halfpel refinement step in PMVfastSearch8 + quality=5  
  *             added new quality mode = 6 which performs halfpel refinement  
  *             filesize difference between quality 5 and 6 is smaller than 1%  
  *             (Isibaar)  
  *  31.12.2001 PMVfastSearch16 and PMVfastSearch8 (gruel)  
  *  30.12.2001 get_range/MotionSearchX simplified; blue/green bug fix  
  *  22.12.2001 commented best_point==99 check  
  *  19.12.2001 modified get_range (purple bug fix)  
  *  15.12.2001 moved pmv displacement from mbprediction  
  *  02.12.2001 motion estimation/compensation split (Isibaar)  
  *  16.11.2001 rewrote/tweaked search algorithms; pross@cs.rmit.edu.au  
  *  10.11.2001 support for sad16/sad8 functions  
  *  28.08.2001 reactivated MODE_INTER4V for EXT_MODE  
  *  24.08.2001 removed MODE_INTER4V_Q, disabled MODE_INTER4V for EXT_MODE  
  *  22.08.2001 added MODE_INTER4V_Q  
  *  20.08.2001 added pragma to get rid of internal compiler error with VC6  
  *             idea by Cyril. Thanks.  
9   *   *
10   *  Michael Militzer <isibaar@videocoding.de>   *  This program is free software ; you can redistribute it and/or modify
11     *  it under the terms of the GNU General Public License as published by
12     *  the Free Software Foundation ; either version 2 of the License, or
13     *  (at your option) any later version.
14   *   *
15   **************************************************************************/   *  This program is distributed in the hope that it will be useful,
16     *  but WITHOUT ANY WARRANTY ; without even the implied warranty of
17     *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18     *  GNU General Public License for more details.
19     *
20     *  You should have received a copy of the GNU General Public License
21     *  along with this program ; if not, write to the Free Software
22     *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
23     *
24     * $Id: motion_est.c,v 1.58.2.30 2003-08-28 11:14:04 syskin Exp $
25     *
26     ****************************************************************************/
27    
28  #include <assert.h>  #include <assert.h>
29  #include <stdio.h>  #include <stdio.h>
30  #include <stdlib.h>  #include <stdlib.h>
31    #include <string.h>     /* memcpy */
32    #include <math.h>       /* lrint */
33    
34  #include "../encoder.h"  #include "../encoder.h"
35  #include "../utils/mbfunctions.h"  #include "../utils/mbfunctions.h"
36  #include "../prediction/mbprediction.h"  #include "../prediction/mbprediction.h"
37  #include "../global.h"  #include "../global.h"
38  #include "../utils/timer.h"  #include "../utils/timer.h"
39    #include "../image/interpolate8x8.h"
40    #include "motion_est.h"
41  #include "motion.h"  #include "motion.h"
42  #include "sad.h"  #include "sad.h"
43    #include "gmc.h"
44    #include "../utils/emms.h"
45    #include "../dct/fdct.h"
46    
47    /*****************************************************************************
48     * Modified rounding tables -- declared in motion.h
49     * Original tables see ISO spec tables 7-6 -> 7-9
50     ****************************************************************************/
51    
52    const uint32_t roundtab[16] =
53    {0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2 };
54    
55    /* K = 4 */
56    const uint32_t roundtab_76[16] =
57    { 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1 };
58    
59    /* K = 2 */
60    const uint32_t roundtab_78[8] =
61    { 0, 0, 1, 1, 0, 0, 0, 1  };
62    
63    /* K = 1 */
64    const uint32_t roundtab_79[4] =
65    { 0, 1, 0, 0 };
66    
67    #define INITIAL_SKIP_THRESH     (10)
68    #define FINAL_SKIP_THRESH       (50)
69    #define MAX_SAD00_FOR_SKIP      (20)
70    #define MAX_CHROMA_SAD_FOR_SKIP (22)
71    
72    #define CHECK_CANDIDATE(X,Y,D) { \
73    CheckCandidate((X),(Y), data, (D) ); }
74    
75    
76    /*****************************************************************************
77     * Code
78     ****************************************************************************/
79    
80  // very large value  static __inline uint32_t
81  #define MV_MAX_ERROR    (4096 * 256)  d_mv_bits(int x, int y, const VECTOR pred, const uint32_t iFcode, const int qpel, const int rrv)
82    {
83            int bits;
84            const int q = (1 << (iFcode - 1)) - 1;
85    
86  // stop search if sdelta < THRESHOLD          x <<= qpel;
87  #define MV16_THRESHOLD  192          y <<= qpel;
88  #define MV8_THRESHOLD   56          if (rrv) { x = RRV_MV_SCALEDOWN(x); y = RRV_MV_SCALEDOWN(y); }
89    
90            x -= pred.x;
91            bits = (x != 0 ? iFcode:0);
92            x = abs(x);
93            x += q;
94            x >>= (iFcode - 1);
95            bits += mvtab[x];
96    
97            y -= pred.y;
98            bits += (y != 0 ? iFcode:0);
99            y = abs(y);
100            y += q;
101            y >>= (iFcode - 1);
102            bits += mvtab[y];
103    
104            return bits;
105    }
106    
107    static int32_t ChromaSAD2(const int fx, const int fy, const int bx, const int by,
108                                                            const SearchData * const data)
109    {
110            int sad;
111            const uint32_t stride = data->iEdgedWidth/2;
112            uint8_t *f_refu, *f_refv, *b_refu, *b_refv;
113    
114            const INTERPOLATE8X8_PTR interpolate8x8_halfpel[] = {
115                    NULL,
116                    interpolate8x8_halfpel_v,
117                    interpolate8x8_halfpel_h,
118                    interpolate8x8_halfpel_hv
119            };
120    
121  #define NEIGH_MOVE_THRESH 0          int offset = (fx>>1) + (fy>>1)*stride;
122  // how much a block's MV must differ from his neighbour          int filter = ((fx & 1) << 1) | (fy & 1);
 // to be search for INTER4V. The more, the faster...  
123    
124  /* sad16(0,0) bias; mpeg4 spec suggests nb/2+1 */          if (filter != 0) {
125  /* nb  = vop pixels * 2^(bpp-8) */                  f_refu = data->RefQ;
126  #define MV16_00_BIAS    (128+1)                  f_refv = data->RefQ + 8;
127  #define MV8_00_BIAS     (0)                  interpolate8x8_halfpel[filter](f_refu, data->RefP[4] + offset, stride, data->rounding);
128                    interpolate8x8_halfpel[filter](f_refv, data->RefP[5] + offset, stride, data->rounding);
129            } else {
130                    f_refu = (uint8_t*)data->RefP[4] + offset;
131                    f_refv = (uint8_t*)data->RefP[5] + offset;
132            }
133    
134  /* INTER bias for INTER/INTRA decision; mpeg4 spec suggests 2*nb */          offset = (bx>>1) + (by>>1)*stride;
135  #define MV16_INTER_BIAS 512          filter = ((bx & 1) << 1) | (by & 1);
136    
137  /* Parameters which control inter/inter4v decision */          if (filter != 0) {
138  #define IMV16X16                        5                  b_refu = data->RefQ + 16;
139                    b_refv = data->RefQ + 24;
140                    interpolate8x8_halfpel[filter](b_refu, data->b_RefP[4] + offset, stride, data->rounding);
141                    interpolate8x8_halfpel[filter](b_refv, data->b_RefP[5] + offset, stride, data->rounding);
142            } else {
143                    b_refu = (uint8_t*)data->b_RefP[4] + offset;
144                    b_refv = (uint8_t*)data->b_RefP[5] + offset;
145            }
146    
147  /* vector map (vlc delta size) smoother parameters */          sad = sad8bi(data->CurU, b_refu, f_refu, stride);
148  #define NEIGH_TEND_16X16        2          sad += sad8bi(data->CurV, b_refv, f_refv, stride);
 #define NEIGH_TEND_8X8          2  
149    
150  // fast ((A)/2)*2          return sad;
151  #define EVEN(A)         (((A)<0?(A)+1:(A)) & ~1)  }
152    
153  #define MVzero(A) ( ((A).x)==(0) && ((A).y)==(0) )  static int32_t
154  #define MVequal(A,B) ( ((A).x)==((B).x) && ((A).y)==((B).y) )  ChromaSAD(const int dx, const int dy, const SearchData * const data)
155    {
156            int sad;
157            const uint32_t stride = data->iEdgedWidth/2;
158            int offset = (dx>>1) + (dy>>1)*stride;
159            int next = 1;
160    
161  int32_t PMVfastSearch16(const uint8_t * const pRef,          if (dx == data->temp[5] && dy == data->temp[6]) return data->temp[7]; /* it has been checked recently */
162                                                  const uint8_t * const pRefH,          data->temp[5] = dx; data->temp[6] = dy; /* backup */
                                                 const uint8_t * const pRefV,  
                                                 const uint8_t * const pRefHV,  
                                                 const IMAGE * const pCur,  
                                                 const int x,  
                                                 const int y,  
                                                 const uint32_t MotionFlags,  
                                                 const uint32_t iQuant,  
                                                 const uint32_t iFcode,  
                                                 const MBParam * const pParam,  
                                                 const MACROBLOCK * const pMBs,  
                                                 const MACROBLOCK * const prevMBs,  
                                                 VECTOR * const currMV,  
                                                 VECTOR * const currPMV);  
163    
164  int32_t EPZSSearch16(const uint8_t * const pRef,          switch (((dx & 1) << 1) | (dy & 1))     {
165                                           const uint8_t * const pRefH,                  case 0:
166                                           const uint8_t * const pRefV,                          sad = sad8(data->CurU, data->RefP[4] + offset, stride);
167                                           const uint8_t * const pRefHV,                          sad += sad8(data->CurV, data->RefP[5] + offset, stride);
168                                           const IMAGE * const pCur,                          break;
169                                           const int x,                  case 1:
170                                           const int y,                          next = stride;
171                                           const uint32_t MotionFlags,                  case 2:
172                                           const uint32_t iQuant,                          sad = sad8bi(data->CurU, data->RefP[4] + offset, data->RefP[4] + offset + next, stride);
173                                           const uint32_t iFcode,                          sad += sad8bi(data->CurV, data->RefP[5] + offset, data->RefP[5] + offset + next, stride);
174                                           const MBParam * const pParam,                          break;
175                                           const MACROBLOCK * const pMBs,                  default:
176                                           const MACROBLOCK * const prevMBs,                          interpolate8x8_halfpel_hv(data->RefQ, data->RefP[4] + offset, stride, data->rounding);
177                                           VECTOR * const currMV,                          sad = sad8(data->CurU, data->RefQ, stride);
                                          VECTOR * const currPMV);  
178    
179                            interpolate8x8_halfpel_hv(data->RefQ, data->RefP[5] + offset, stride, data->rounding);
180                            sad += sad8(data->CurV, data->RefQ, stride);
181                            break;
182            }
183            data->temp[7] = sad; /* backup, part 2 */
184            return sad;
185    }
186    
187  int32_t PMVfastSearch8(const uint8_t * const pRef,  static __inline const uint8_t *
188                                             const uint8_t * const pRefH,  GetReferenceB(const int x, const int y, const uint32_t dir, const SearchData * const data)
189                                             const uint8_t * const pRefV,  {
190                                             const uint8_t * const pRefHV,          /* dir : 0 = forward, 1 = backward */
191                                             const IMAGE * const pCur,          const uint8_t *const *const direction = ( dir == 0 ? data->RefP : data->b_RefP );
192                                             const int x,          const int picture = ((x&1)<<1) | (y&1);
193                                             const int y,          const int offset = (x>>1) + (y>>1)*data->iEdgedWidth;
194                                             const int start_x,          return direction[picture] + offset;
195                                             const int start_y,  }
                                            const uint32_t MotionFlags,  
                                            const uint32_t iQuant,  
                                            const uint32_t iFcode,  
                                            const MBParam * const pParam,  
                                            const MACROBLOCK * const pMBs,  
                                            const MACROBLOCK * const prevMBs,  
                                            VECTOR * const currMV,  
                                            VECTOR * const currPMV);  
196    
197  int32_t EPZSSearch8(const uint8_t * const pRef,  /* this is a simpler copy of GetReferenceB, but as it's __inline anyway, we can keep the two separate */
198                                          const uint8_t * const pRefH,  static __inline const uint8_t *
199                                          const uint8_t * const pRefV,  GetReference(const int x, const int y, const SearchData * const data)
200                                          const uint8_t * const pRefHV,  {
201                                          const IMAGE * const pCur,          const int picture = ((x&1)<<1) | (y&1);
202                                          const int x,          const int offset = (x>>1) + (y>>1)*data->iEdgedWidth;
203                                          const int y,          return data->RefP[picture] + offset;
204                                          const int start_x,  }
                                         const int start_y,  
                                         const uint32_t MotionFlags,  
                                         const uint32_t iQuant,  
                                         const uint32_t iFcode,  
                                         const MBParam * const pParam,  
                                         const MACROBLOCK * const pMBs,  
                                         const MACROBLOCK * const prevMBs,  
                                         VECTOR * const currMV,  
                                         VECTOR * const currPMV);  
205    
206    static uint8_t *
207    Interpolate8x8qpel(const int x, const int y, const uint32_t block, const uint32_t dir, const SearchData * const data)
208    {
209            /* create or find a qpel-precision reference picture; return pointer to it */
210            uint8_t * Reference = data->RefQ + 16*dir;
211            const uint32_t iEdgedWidth = data->iEdgedWidth;
212            const uint32_t rounding = data->rounding;
213            const int halfpel_x = x/2;
214            const int halfpel_y = y/2;
215            const uint8_t *ref1, *ref2, *ref3, *ref4;
216    
217  typedef int32_t(MainSearch16Func) (const uint8_t * const pRef,          ref1 = GetReferenceB(halfpel_x, halfpel_y, dir, data);
218                                                                     const uint8_t * const pRefH,          ref1 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
219                                                                     const uint8_t * const pRefV,          switch( ((x&1)<<1) + (y&1) ) {
220                                                                     const uint8_t * const pRefHV,          case 3: /* x and y in qpel resolution - the "corners" (top left/right and */
221                                                                     const uint8_t * const cur,                          /* bottom left/right) during qpel refinement */
222                                                                     const int x,                  ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
223                                                                     const int y,                  ref3 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
224                                                                     int32_t startx,                  ref4 = GetReferenceB(x - halfpel_x, y - halfpel_y, dir, data);
225                                                                     int32_t starty,                  ref2 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
226                                                                     int32_t iMinSAD,                  ref3 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
227                                                                     VECTOR * const currMV,                  ref4 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
228                                                                     const VECTOR * const pmv,                  interpolate8x8_avg4(Reference, ref1, ref2, ref3, ref4, iEdgedWidth, rounding);
229                                                                     const int32_t min_dx,                  break;
                                                                    const int32_t max_dx,  
                                                                    const int32_t min_dy,  
                                                                    const int32_t max_dy,  
                                                                    const int32_t iEdgedWidth,  
                                                                    const int32_t iDiamondSize,  
                                                                    const int32_t iFcode,  
                                                                    const int32_t iQuant,  
                                                                    int iFound);  
230    
231  typedef MainSearch16Func *MainSearch16FuncPtr;          case 1: /* x halfpel, y qpel - top or bottom during qpel refinement */
232                    ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
233                    ref2 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
234                    interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
235                    break;
236    
237            case 2: /* x qpel, y halfpel - left or right during qpel refinement */
238                    ref2 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
239                    ref2 += 8 * (block&1) + 8 * (block>>1) * iEdgedWidth;
240                    interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
241                    break;
242    
243  typedef int32_t(MainSearch8Func) (const uint8_t * const pRef,          default: /* pure halfpel position */
244                                                                    const uint8_t * const pRefH,                  return (uint8_t *) ref1;
                                                                   const uint8_t * const pRefV,  
                                                                   const uint8_t * const pRefHV,  
                                                                   const uint8_t * const cur,  
                                                                   const int x,  
                                                                   const int y,  
                                                                   int32_t startx,  
                                                                   int32_t starty,  
                                                                   int32_t iMinSAD,  
                                                                   VECTOR * const currMV,  
                                                                   const VECTOR * const pmv,  
                                                                   const int32_t min_dx,  
                                                                   const int32_t max_dx,  
                                                                   const int32_t min_dy,  
                                                                   const int32_t max_dy,  
                                                                   const int32_t iEdgedWidth,  
                                                                   const int32_t iDiamondSize,  
                                                                   const int32_t iFcode,  
                                                                   const int32_t iQuant,  
                                                                   int iFound);  
   
 typedef MainSearch8Func *MainSearch8FuncPtr;  
   
 static int32_t lambda_vec16[32] =       /* rounded values for lambda param for weight of motion bits as in modified H.26L */  
 { 0, (int) (1.00235 + 0.5), (int) (1.15582 + 0.5), (int) (1.31976 + 0.5),  
                 (int) (1.49591 + 0.5), (int) (1.68601 + 0.5),  
         (int) (1.89187 + 0.5), (int) (2.11542 + 0.5), (int) (2.35878 + 0.5),  
                 (int) (2.62429 + 0.5), (int) (2.91455 + 0.5),  
         (int) (3.23253 + 0.5), (int) (3.58158 + 0.5), (int) (3.96555 + 0.5),  
                 (int) (4.38887 + 0.5), (int) (4.85673 + 0.5),  
         (int) (5.37519 + 0.5), (int) (5.95144 + 0.5), (int) (6.59408 + 0.5),  
                 (int) (7.31349 + 0.5), (int) (8.12242 + 0.5),  
         (int) (9.03669 + 0.5), (int) (10.0763 + 0.5), (int) (11.2669 + 0.5),  
                 (int) (12.6426 + 0.5), (int) (14.2493 + 0.5),  
         (int) (16.1512 + 0.5), (int) (18.442 + 0.5), (int) (21.2656 + 0.5),  
                 (int) (24.8580 + 0.5), (int) (29.6436 + 0.5),  
         (int) (36.4949 + 0.5)  
 };  
245    
246  static int32_t *lambda_vec8 = lambda_vec16;     /* same table for INTER and INTER4V for now */          }
247            return Reference;
248    }
249    
250    static uint8_t *
251    Interpolate16x16qpel(const int x, const int y, const uint32_t dir, const SearchData * const data)
252    {
253            /* create or find a qpel-precision reference picture; return pointer to it */
254            uint8_t * Reference = data->RefQ + 16*dir;
255            const uint32_t iEdgedWidth = data->iEdgedWidth;
256            const uint32_t rounding = data->rounding;
257            const int halfpel_x = x/2;
258            const int halfpel_y = y/2;
259            const uint8_t *ref1, *ref2, *ref3, *ref4;
260    
261            ref1 = GetReferenceB(halfpel_x, halfpel_y, dir, data);
262            switch( ((x&1)<<1) + (y&1) ) {
263            case 3:
264                    /*
265                     * x and y in qpel resolution - the "corners" (top left/right and
266                     * bottom left/right) during qpel refinement
267                     */
268                    ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
269                    ref3 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
270                    ref4 = GetReferenceB(x - halfpel_x, y - halfpel_y, dir, data);
271                    interpolate8x8_avg4(Reference, ref1, ref2, ref3, ref4, iEdgedWidth, rounding);
272                    interpolate8x8_avg4(Reference+8, ref1+8, ref2+8, ref3+8, ref4+8, iEdgedWidth, rounding);
273                    interpolate8x8_avg4(Reference+8*iEdgedWidth, ref1+8*iEdgedWidth, ref2+8*iEdgedWidth, ref3+8*iEdgedWidth, ref4+8*iEdgedWidth, iEdgedWidth, rounding);
274                    interpolate8x8_avg4(Reference+8*iEdgedWidth+8, ref1+8*iEdgedWidth+8, ref2+8*iEdgedWidth+8, ref3+8*iEdgedWidth+8, ref4+8*iEdgedWidth+8, iEdgedWidth, rounding);
275                    break;
276    
277  // mv.length table          case 1: /* x halfpel, y qpel - top or bottom during qpel refinement */
278  static const uint32_t mvtab[33] = {                  ref2 = GetReferenceB(halfpel_x, y - halfpel_y, dir, data);
279          1, 2, 3, 4, 6, 7, 7, 7,                  interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
280          9, 9, 9, 10, 10, 10, 10, 10,                  interpolate8x8_avg2(Reference+8, ref1+8, ref2+8, iEdgedWidth, rounding, 8);
281          10, 10, 10, 10, 10, 10, 10, 10,                  interpolate8x8_avg2(Reference+8*iEdgedWidth, ref1+8*iEdgedWidth, ref2+8*iEdgedWidth, iEdgedWidth, rounding, 8);
282          10, 11, 11, 11, 11, 11, 11, 12, 12                  interpolate8x8_avg2(Reference+8*iEdgedWidth+8, ref1+8*iEdgedWidth+8, ref2+8*iEdgedWidth+8, iEdgedWidth, rounding, 8);
283  };                  break;
284    
285            case 2: /* x qpel, y halfpel - left or right during qpel refinement */
286                    ref2 = GetReferenceB(x - halfpel_x, halfpel_y, dir, data);
287                    interpolate8x8_avg2(Reference, ref1, ref2, iEdgedWidth, rounding, 8);
288                    interpolate8x8_avg2(Reference+8, ref1+8, ref2+8, iEdgedWidth, rounding, 8);
289                    interpolate8x8_avg2(Reference+8*iEdgedWidth, ref1+8*iEdgedWidth, ref2+8*iEdgedWidth, iEdgedWidth, rounding, 8);
290                    interpolate8x8_avg2(Reference+8*iEdgedWidth+8, ref1+8*iEdgedWidth+8, ref2+8*iEdgedWidth+8, iEdgedWidth, rounding, 8);
291                    break;
292    
 static __inline uint32_t  
 mv_bits(int32_t component,  
                 const uint32_t iFcode)  
 {  
         if (component == 0)  
                 return 1;  
293    
294          if (component < 0)          default: /* pure halfpel position */
295                  component = -component;                  return (uint8_t *) ref1;
296            }
297            return Reference;
298    }
299    
300    /* CHECK_CANDIATE FUNCTIONS START */
301    
302    static void
303    CheckCandidate16(const int x, const int y, const SearchData * const data, const int Direction)
304    {
305            int xc, yc;
306            const uint8_t * Reference;
307            VECTOR * current;
308            int32_t sad; uint32_t t;
309    
310          if (iFcode == 1) {          if ( (x > data->max_dx) || (x < data->min_dx)
311                  if (component > 32)                  || (y > data->max_dy) || (y < data->min_dy) ) return;
                         component = 32;  
312    
313                  return mvtab[component] + 1;          if (!data->qpel_precision) {
314                    Reference = GetReference(x, y, data);
315                    current = data->currentMV;
316                    xc = x; yc = y;
317            } else { /* x and y are in 1/4 precision */
318                    Reference = Interpolate16x16qpel(x, y, 0, data);
319                    xc = x/2; yc = y/2; /* for chroma sad */
320                    current = data->currentQMV;
321          }          }
322    
323          component += (1 << (iFcode - 1)) - 1;          sad = sad16v(data->Cur, Reference, data->iEdgedWidth, data->temp);
324          component >>= (iFcode - 1);          t = d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);
325    
326            sad += (data->lambda16 * t * sad)>>10;
327            data->temp[0] += (data->lambda8 * t * (data->temp[0] + NEIGH_8X8_BIAS))>>10;
328    
329          if (component > 32)          if (data->chroma && sad < data->iMinSAD[0])
330                  component = 32;                  sad += ChromaSAD((xc >> 1) + roundtab_79[xc & 0x3],
331                                                            (yc >> 1) + roundtab_79[yc & 0x3], data);
332    
333          return mvtab[component] + 1 + iFcode - 1;          if (sad < data->iMinSAD[0]) {
334                    data->iMinSAD[0] = sad;
335                    current[0].x = x; current[0].y = y;
336                    *data->dir = Direction;
337  }  }
338    
339            if (data->temp[0] < data->iMinSAD[1]) {
340                    data->iMinSAD[1] = data->temp[0]; current[1].x = x; current[1].y = y; }
341            if (data->temp[1] < data->iMinSAD[2]) {
342                    data->iMinSAD[2] = data->temp[1]; current[2].x = x; current[2].y = y; }
343            if (data->temp[2] < data->iMinSAD[3]) {
344                    data->iMinSAD[3] = data->temp[2]; current[3].x = x; current[3].y = y; }
345            if (data->temp[3] < data->iMinSAD[4]) {
346                    data->iMinSAD[4] = data->temp[3]; current[4].x = x; current[4].y = y; }
347    }
348    
349  static __inline uint32_t  static void
350  calc_delta_16(const int32_t dx,  CheckCandidate8(const int x, const int y, const SearchData * const data, const int Direction)
                           const int32_t dy,  
                           const uint32_t iFcode,  
                           const uint32_t iQuant)  
351  {  {
352          return NEIGH_TEND_16X16 * lambda_vec16[iQuant] * (mv_bits(dx, iFcode) +          int32_t sad; uint32_t t;
353                                                                                                            mv_bits(dy, iFcode));          const uint8_t * Reference;
354            VECTOR * current;
355    
356            if ( (x > data->max_dx) || (x < data->min_dx)
357                    || (y > data->max_dy) || (y < data->min_dy) ) return;
358    
359            if (!data->qpel_precision) {
360                    Reference = GetReference(x, y, data);
361                    current = data->currentMV;
362            } else { /* x and y are in 1/4 precision */
363                    Reference = Interpolate8x8qpel(x, y, 0, 0, data);
364                    current = data->currentQMV;
365  }  }
366    
367  static __inline uint32_t          sad = sad8(data->Cur, Reference, data->iEdgedWidth);
368  calc_delta_8(const int32_t dx,          t = d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);
369                           const int32_t dy,  
370                           const uint32_t iFcode,          sad += (data->lambda8 * t * (sad+NEIGH_8X8_BIAS))>>10;
371                           const uint32_t iQuant)  
372  {          if (sad < *(data->iMinSAD)) {
373          return NEIGH_TEND_8X8 * lambda_vec8[iQuant] * (mv_bits(dx, iFcode) +                  *(data->iMinSAD) = sad;
374                                                                                                     mv_bits(dy, iFcode));                  current->x = x; current->y = y;
375                    *data->dir = Direction;
376            }
377  }  }
378    
379    static void
380    CheckCandidate32(const int x, const int y, const SearchData * const data, const int Direction)
381    {
382            uint32_t t;
383            const uint8_t * Reference;
384            int sad;
385    
386            if ( (!(x&1) && x !=0) || (!(y&1) && y !=0) || /* non-zero even value */
387                    (x > data->max_dx) || (x < data->min_dx)
388                    || (y > data->max_dy) || (y < data->min_dy) ) return;
389    
390            Reference = GetReference(x, y, data);
391            t = d_mv_bits(x, y, data->predMV, data->iFcode, 0, 1);
392    
393            sad = sad32v_c(data->Cur, Reference, data->iEdgedWidth, data->temp);
394    
395  #ifndef SEARCH16          sad += (data->lambda16 * t * sad) >> 10;
396  #define SEARCH16        PMVfastSearch16          data->temp[0] += (data->lambda8 * t * (data->temp[0] + NEIGH_8X8_BIAS))>>10;
 //#define SEARCH16  FullSearch16  
 //#define SEARCH16  EPZSSearch16  
 #endif  
397    
398  #ifndef SEARCH8          if (sad < data->iMinSAD[0]) {
399  #define SEARCH8         PMVfastSearch8                  data->iMinSAD[0] = sad;
400  //#define SEARCH8   EPZSSearch8                  data->currentMV[0].x = x; data->currentMV[0].y = y;
401  #endif                  *data->dir = Direction;
402            }
403    
404  bool          if (data->temp[0] < data->iMinSAD[1]) {
405  MotionEstimation(MBParam * const pParam,                  data->iMinSAD[1] = data->temp[0]; data->currentMV[1].x = x; data->currentMV[1].y = y; }
406                                   FRAMEINFO * const current,          if (data->temp[1] < data->iMinSAD[2]) {
407                                   FRAMEINFO * const reference,                  data->iMinSAD[2] = data->temp[1]; data->currentMV[2].x = x; data->currentMV[2].y = y; }
408                                   const IMAGE * const pRefH,          if (data->temp[2] < data->iMinSAD[3]) {
409                                   const IMAGE * const pRefV,                  data->iMinSAD[3] = data->temp[2]; data->currentMV[3].x = x; data->currentMV[3].y = y; }
410                                   const IMAGE * const pRefHV,          if (data->temp[3] < data->iMinSAD[4]) {
411                                   const uint32_t iLimit)                  data->iMinSAD[4] = data->temp[3]; data->currentMV[4].x = x; data->currentMV[4].y = y; }
412  {  }
         const uint32_t iWcount = pParam->mb_width;  
         const uint32_t iHcount = pParam->mb_height;  
         MACROBLOCK *const pMBs = current->mbs;  
         MACROBLOCK *const prevMBs = reference->mbs;  
         const IMAGE *const pCurrent = &current->image;  
         const IMAGE *const pRef = &reference->image;  
413    
414          const VECTOR zeroMV = { 0, 0 };  static void
415    CheckCandidate16no4v(const int x, const int y, const SearchData * const data, const int Direction)
416    {
417            int32_t sad, xc, yc;
418            const uint8_t * Reference;
419            uint32_t t;
420            VECTOR * current;
421    
422          int32_t x, y;          if ( (x > data->max_dx) || ( x < data->min_dx)
423          int32_t iIntra = 0;                  || (y > data->max_dy) || (y < data->min_dy) ) return;
         VECTOR pmv;  
   
         if (sadInit)  
                 (*sadInit) ();  
   
         for (y = 0; y < iHcount; y++)  
                 for (x = 0; x < iWcount; x++) {  
                         MACROBLOCK *const pMB = &pMBs[x + y * iWcount];  
   
                         pMB->sad16 =  
                                 SEARCH16(pRef->y, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,  
                                                  y, current->motion_flags, current->quant,  
                                                  current->fcode, pParam, pMBs, prevMBs, &pMB->mv16,  
                                                  &pMB->pmvs[0]);  
424    
425                          if (0 < (pMB->sad16 - MV16_INTER_BIAS)) {          if (data->rrv && (!(x&1) && x !=0) | (!(y&1) && y !=0) ) return; /* non-zero even value */
                                 int32_t deviation;  
426    
427                                  deviation =          if (data->qpel_precision) { /* x and y are in 1/4 precision */
428                                          dev16(pCurrent->y + x * 16 + y * 16 * pParam->edged_width,                  Reference = Interpolate16x16qpel(x, y, 0, data);
429                                                    pParam->edged_width);                  current = data->currentQMV;
430                    xc = x/2; yc = y/2;
431            } else {
432                    Reference = GetReference(x, y, data);
433                    current = data->currentMV;
434                    xc = x; yc = y;
435            }
436            t = d_mv_bits(x, y, data->predMV, data->iFcode,
437                                            data->qpel^data->qpel_precision, data->rrv);
438    
439                                  if (deviation < (pMB->sad16 - MV16_INTER_BIAS)) {          sad = sad16(data->Cur, Reference, data->iEdgedWidth, 256*4096);
440                                          pMB->mode = MODE_INTRA;          sad += (data->lambda16 * t * sad)>>10;
                                         pMB->mv16 = pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] =  
                                                 pMB->mvs[3] = zeroMV;  
                                         pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] =  
                                                 pMB->sad8[3] = 0;  
441    
442                                          iIntra++;          if (data->chroma && sad < *data->iMinSAD)
443                                          if (iIntra >= iLimit)                  sad += ChromaSAD((xc >> 1) + roundtab_79[xc & 0x3],
444                                                  return 1;                                                          (yc >> 1) + roundtab_79[yc & 0x3], data);
445    
446                                          continue;          if (sad < *(data->iMinSAD)) {
447                    *(data->iMinSAD) = sad;
448                    current->x = x; current->y = y;
449                    *data->dir = Direction;
450                                  }                                  }
451                          }                          }
452    
453                          pmv = pMB->pmvs[0];  static void
454                          if (current->global_flags & XVID_INTER4V)  CheckCandidate16I(const int x, const int y, const SearchData * const data, const int Direction)
455                                  if ((!(current->global_flags & XVID_LUMIMASKING) ||  {
456                                           pMB->dquant == NO_CHANGE)) {          int sad;
457                                          int32_t sad8 = IMV16X16 * current->quant;  //      int xc, yc;
458            const uint8_t * Reference;
459                                          if (sad8 < pMB->sad16)  //      VECTOR * current;
460    
461                                                  sad8 += pMB->sad8[0] =          if ( (x > data->max_dx) || ( x < data->min_dx)
462                                                          SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,                  || (y > data->max_dy) || (y < data->min_dy) ) return;
463                                                                          pCurrent, 2 * x, 2 * y, pMB->mv16.x,  
464                                                                          pMB->mv16.y, current->motion_flags,          Reference = GetReference(x, y, data);
465                                                                          current->quant, current->fcode, pParam,  //      xc = x; yc = y;
466                                                                          pMBs, prevMBs, &pMB->mvs[0],  
467                                                                          &pMB->pmvs[0]);          sad = sad16(data->Cur, Reference, data->iEdgedWidth, 256*4096);
468    //      sad += d_mv_bits(x, y, data->predMV, data->iFcode, 0, 0);
                                         if (sad8 < pMB->sad16)  
                                                 sad8 += pMB->sad8[1] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x + 1, 2 * y, pMB->mv16.x,  
                                                                         pMB->mv16.y, current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[1],  
                                                                         &pMB->pmvs[1]);  
   
                                         if (sad8 < pMB->sad16)  
                                                 sad8 += pMB->sad8[2] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x, 2 * y + 1, pMB->mv16.x,  
                                                                         pMB->mv16.y, current->motion_flags,  
                                                                         current->quant, current->fcode, pParam,  
                                                                         pMBs, prevMBs, &pMB->mvs[2],  
                                                                         &pMB->pmvs[2]);  
   
                                         if (sad8 < pMB->sad16)  
                                                 sad8 += pMB->sad8[3] =  
                                                         SEARCH8(pRef->y, pRefH->y, pRefV->y, pRefHV->y,  
                                                                         pCurrent, 2 * x + 1, 2 * y + 1,  
                                                                         pMB->mv16.x, pMB->mv16.y,  
                                                                         current->motion_flags, current->quant,  
                                                                         current->fcode, pParam, pMBs, prevMBs,  
                                                                         &pMB->mvs[3], &pMB->pmvs[3]);  
469    
470                                          /* decide: MODE_INTER or MODE_INTER4V  /*      if (data->chroma) sad += ChromaSAD((xc >> 1) + roundtab_79[xc & 0x3],
471                                             mpeg4:   if (sad8 < pMB->sad16 - nb/2+1) use_inter4v                                                                                  (yc >> 1) + roundtab_79[yc & 0x3], data);
472                                           */                                           */
473    
474                                          if (sad8 < pMB->sad16) {          if (sad < data->iMinSAD[0]) {
475                                                  pMB->mode = MODE_INTER4V;                  data->iMinSAD[0] = sad;
476                                                  pMB->sad8[0] *= 4;                  data->currentMV[0].x = x; data->currentMV[0].y = y;
477                                                  pMB->sad8[1] *= 4;                  *data->dir = Direction;
                                                 pMB->sad8[2] *= 4;  
                                                 pMB->sad8[3] *= 4;  
                                                 continue;  
478                                          }                                          }
   
479                                  }                                  }
480    
481                          pMB->mode = MODE_INTER;  static void
482                          pMB->pmvs[0] = pmv;     /* pMB->pmvs[1] = pMB->pmvs[2] = pMB->pmvs[3]  are not needed for INTER */  CheckCandidate32I(const int x, const int y, const SearchData * const data, const int Direction)
483                          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->mv16;  {
484                          pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] =          /* maximum speed - for P/B/I decision */
485                                  pMB->sad16;          int32_t sad;
486    
487            if ( (x > data->max_dx) || (x < data->min_dx)
488                    || (y > data->max_dy) || (y < data->min_dy) ) return;
489    
490            sad = sad32v_c(data->Cur, data->RefP[0] + (x>>1) + (y>>1)*((int)data->iEdgedWidth),
491                                            data->iEdgedWidth, data->temp);
492    
493            if (sad < *(data->iMinSAD)) {
494                    *(data->iMinSAD) = sad;
495                    data->currentMV[0].x = x; data->currentMV[0].y = y;
496                    *data->dir = Direction;
497                  }                  }
498          return 0;          if (data->temp[0] < data->iMinSAD[1]) {
499  }                  data->iMinSAD[1] = data->temp[0]; data->currentMV[1].x = x; data->currentMV[1].y = y; }
500            if (data->temp[1] < data->iMinSAD[2]) {
501                    data->iMinSAD[2] = data->temp[1]; data->currentMV[2].x = x; data->currentMV[2].y = y; }
502            if (data->temp[2] < data->iMinSAD[3]) {
503                    data->iMinSAD[3] = data->temp[2]; data->currentMV[3].x = x; data->currentMV[3].y = y; }
504            if (data->temp[3] < data->iMinSAD[4]) {
505                    data->iMinSAD[4] = data->temp[3]; data->currentMV[4].x = x; data->currentMV[4].y = y; }
506    
 #define CHECK_MV16_ZERO {\  
   if ( (0 <= max_dx) && (0 >= min_dx) \  
     && (0 <= max_dy) && (0 >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0, 0 , iEdgedWidth), iEdgedWidth, MV_MAX_ERROR); \  
     iSAD += calc_delta_16(-pmv[0].x, -pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=0; currMV->y=0; }  }     \  
 }  
   
 #define NOCHECK_MV16_CANDIDATE(X,Y) { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \  
 }  
   
 #define CHECK_MV16_CANDIDATE(X,Y) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
 }  
   
 #define CHECK_MV16_CANDIDATE_DIR(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \  
 }  
   
 #define CHECK_MV16_CANDIDATE_FOUND(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad16( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, X, Y, iEdgedWidth),iEdgedWidth, iMinSAD); \  
     iSAD += calc_delta_16((X) - pmv[0].x, (Y) - pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
 }  
   
   
 #define CHECK_MV8_ZERO {\  
   iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, 0, 0 , iEdgedWidth), iEdgedWidth); \  
   iSAD += calc_delta_8(-pmv[0].x, -pmv[0].y, (uint8_t)iFcode, iQuant);\  
   if (iSAD < iMinSAD) \  
   { iMinSAD=iSAD; currMV->x=0; currMV->y=0; } \  
 }  
   
 #define NOCHECK_MV8_CANDIDATE(X,Y) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } \  
 }  
   
 #define CHECK_MV8_CANDIDATE(X,Y) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); } } \  
 }  
   
 #define CHECK_MV8_CANDIDATE_DIR(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); } } \  
 }  
   
 #define CHECK_MV8_CANDIDATE_FOUND(X,Y,D) { \  
   if ( ((X) <= max_dx) && ((X) >= min_dx) \  
     && ((Y) <= max_dy) && ((Y) >= min_dy) ) \  
   { \  
     iSAD = sad8( cur, get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 8, (X), (Y), iEdgedWidth),iEdgedWidth); \  
     iSAD += calc_delta_8((X)-pmv[0].x, (Y)-pmv[0].y, (uint8_t)iFcode, iQuant);\  
     if (iSAD < iMinSAD) \  
     {  iMinSAD=iSAD; currMV->x=(X); currMV->y=(Y); iDirection=(D); iFound=0; } } \  
507  }  }
508    
509  /* too slow and not fully functional at the moment */  static void
510  /*  CheckCandidateInt(const int xf, const int yf, const SearchData * const data, const int Direction)
 int32_t ZeroSearch16(  
                                         const uint8_t * const pRef,  
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const IMAGE * const pCur,  
                                         const int x, const int y,  
                                         const uint32_t MotionFlags,  
                                         const uint32_t iQuant,  
                                         const uint32_t iFcode,  
                                         MBParam * const pParam,  
                                         const MACROBLOCK * const pMBs,  
                                         const MACROBLOCK * const prevMBs,  
                                         VECTOR * const currMV,  
                                         VECTOR * const currPMV)  
511  {  {
512          const int32_t iEdgedWidth = pParam->edged_width;          int32_t sad, xb, yb, xcf, ycf, xcb, ycb;
513          const uint8_t * cur = pCur->y + x*16 + y*16*iEdgedWidth;          uint32_t t;
514          int32_t iSAD;          const uint8_t *ReferenceF, *ReferenceB;
515          int32_t pred_x,pred_y;          VECTOR *current;
   
         get_pmv(pMBs, x, y, pParam->mb_width, 0, &pred_x, &pred_y);  
   
         iSAD = sad16( cur,  
                 get_ref(pRef, pRefH, pRefV, pRefHV, x, y, 16, 0,0, iEdgedWidth),  
                 iEdgedWidth, MV_MAX_ERROR);  
         if (iSAD <= iQuant * 96)  
                 iSAD -= MV16_00_BIAS;  
   
         currMV->x = 0;  
         currMV->y = 0;  
         currPMV->x = -pred_x;  
         currPMV->y = -pred_y;  
516    
517          return iSAD;          if ((xf > data->max_dx) || (xf < data->min_dx) ||
518                    (yf > data->max_dy) || (yf < data->min_dy))
519                    return;
520    
521            if (!data->qpel_precision) {
522                    ReferenceF = GetReference(xf, yf, data);
523                    xb = data->currentMV[1].x; yb = data->currentMV[1].y;
524                    ReferenceB = GetReferenceB(xb, yb, 1, data);
525                    current = data->currentMV;
526                    xcf = xf; ycf = yf;
527                    xcb = xb; ycb = yb;
528            } else {
529                    ReferenceF = Interpolate16x16qpel(xf, yf, 0, data);
530                    xb = data->currentQMV[1].x; yb = data->currentQMV[1].y;
531                    current = data->currentQMV;
532                    ReferenceB = Interpolate16x16qpel(xb, yb, 1, data);
533                    xcf = xf/2; ycf = yf/2;
534                    xcb = xb/2; ycb = yb/2;
535            }
536    
537            t = d_mv_bits(xf, yf, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0)
538                     + d_mv_bits(xb, yb, data->bpredMV, data->iFcode, data->qpel^data->qpel_precision, 0);
539    
540            sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
541            sad += (data->lambda16 * t * sad)>>10;
542    
543            if (data->chroma && sad < *data->iMinSAD)
544                    sad += ChromaSAD2((xcf >> 1) + roundtab_79[xcf & 0x3],
545                                                            (ycf >> 1) + roundtab_79[ycf & 0x3],
546                                                            (xcb >> 1) + roundtab_79[xcb & 0x3],
547                                                            (ycb >> 1) + roundtab_79[ycb & 0x3], data);
548    
549            if (sad < *(data->iMinSAD)) {
550                    *(data->iMinSAD) = sad;
551                    current->x = xf; current->y = yf;
552                    *data->dir = Direction;
553            }
554  }  }
 */  
555    
556  int32_t  static void
557  Diamond16_MainSearch(const uint8_t * const pRef,  CheckCandidateDirect(const int x, const int y, const SearchData * const data, const int Direction)
558                                           const uint8_t * const pRefH,  {
559                                           const uint8_t * const pRefV,          int32_t sad = 0, xcf = 0, ycf = 0, xcb = 0, ycb = 0;
560                                           const uint8_t * const pRefHV,          uint32_t k;
561                                           const uint8_t * const cur,          const uint8_t *ReferenceF;
562                                           const int x,          const uint8_t *ReferenceB;
563                                           const int y,          VECTOR mvs, b_mvs;
564                                           int32_t startx,  
565                                           int32_t starty,          if (( x > 31) || ( x < -32) || ( y > 31) || (y < -32)) return;
566                                           int32_t iMinSAD,  
567                                           VECTOR * const currMV,          for (k = 0; k < 4; k++) {
568                                           const VECTOR * const pmv,                  mvs.x = data->directmvF[k].x + x;
569                                           const int32_t min_dx,                  b_mvs.x = ((x == 0) ?
570                                           const int32_t max_dx,                          data->directmvB[k].x
571                                           const int32_t min_dy,                          : mvs.x - data->referencemv[k].x);
572                                           const int32_t max_dy,  
573                                           const int32_t iEdgedWidth,                  mvs.y = data->directmvF[k].y + y;
574                                           const int32_t iDiamondSize,                  b_mvs.y = ((y == 0) ?
575                                           const int32_t iFcode,                          data->directmvB[k].y
576                                           const int32_t iQuant,                          : mvs.y - data->referencemv[k].y);
577                                           int iFound)  
578  {                  if ((mvs.x > data->max_dx)   || (mvs.x < data->min_dx)   ||
579  /* Do a diamond search around given starting point, return SAD of best */                          (mvs.y > data->max_dy)   || (mvs.y < data->min_dy)   ||
580                            (b_mvs.x > data->max_dx) || (b_mvs.x < data->min_dx) ||
581          int32_t iDirection = 0;                          (b_mvs.y > data->max_dy) || (b_mvs.y < data->min_dy) )
582          int32_t iSAD;                          return;
583          VECTOR backupMV;  
584                    if (data->qpel) {
585          backupMV.x = startx;                          xcf += mvs.x/2; ycf += mvs.y/2;
586          backupMV.y = starty;                          xcb += b_mvs.x/2; ycb += b_mvs.y/2;
   
 /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  
   
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;  
   
                         if (iDirection != 2)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,  
                                                                                    backupMV.y, 1);  
                         if (iDirection != 1)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x + iDiamondSize,  
                                                                                    backupMV.y, 2);  
                         if (iDirection != 4)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y - iDiamondSize, 3);  
                         if (iDirection != 3)  
                                 CHECK_MV16_CANDIDATE_FOUND(backupMV.x,  
                                                                                    backupMV.y + iDiamondSize, 4);  
587          } else {          } else {
588                  currMV->x = startx;                          xcf += mvs.x; ycf += mvs.y;
589                  currMV->y = starty;                          xcb += b_mvs.x; ycb += b_mvs.y;
590                            mvs.x *= 2; mvs.y *= 2; /* we move to qpel precision anyway */
591                            b_mvs.x *= 2; b_mvs.y *= 2;
592          }          }
593          return iMinSAD;  
594                    ReferenceF = Interpolate8x8qpel(mvs.x, mvs.y, k, 0, data);
595                    ReferenceB = Interpolate8x8qpel(b_mvs.x, b_mvs.y, k, 1, data);
596    
597                    sad += sad8bi(data->Cur + 8*(k&1) + 8*(k>>1)*(data->iEdgedWidth),
598                                                    ReferenceF, ReferenceB, data->iEdgedWidth);
599                    if (sad > *(data->iMinSAD)) return;
600  }  }
601    
602  int32_t          sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0, 0) * sad)>>10;
 Square16_MainSearch(const uint8_t * const pRef,  
                                         const uint8_t * const pRefH,  
                                         const uint8_t * const pRefV,  
                                         const uint8_t * const pRefHV,  
                                         const uint8_t * const cur,  
                                         const int x,  
                                         const int y,  
                                         int32_t startx,  
                                         int32_t starty,  
                                         int32_t iMinSAD,  
                                         VECTOR * const currMV,  
                                         const VECTOR * const pmv,  
                                         const int32_t min_dx,  
                                         const int32_t max_dx,  
                                         const int32_t min_dy,  
                                         const int32_t max_dy,  
                                         const int32_t iEdgedWidth,  
                                         const int32_t iDiamondSize,  
                                         const int32_t iFcode,  
                                         const int32_t iQuant,  
                                         int iFound)  
 {  
 /* Do a square search around given starting point, return SAD of best */  
   
         int32_t iDirection = 0;  
         int32_t iSAD;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
 /* It's one search with full square pattern, and new parts for all following diamonds */  
   
 /*   new direction are extra, so 1-4 is normal diamond  
       537  
       1*2  
       648  
 */  
603    
604          CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);          if (data->chroma && sad < *data->iMinSAD)
605          CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);                  sad += ChromaSAD2((xcf >> 3) + roundtab_76[xcf & 0xf],
606          CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);                                                          (ycf >> 3) + roundtab_76[ycf & 0xf],
607          CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);                                                          (xcb >> 3) + roundtab_76[xcb & 0xf],
608                                                            (ycb >> 3) + roundtab_76[ycb & 0xf], data);
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                          backupMV.y - iDiamondSize, 5);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                          backupMV.y + iDiamondSize, 6);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                          backupMV.y - iDiamondSize, 7);  
         CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                          backupMV.y + iDiamondSize, 8);  
   
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;  
609    
610                          switch (iDirection) {          if (sad < *(data->iMinSAD)) {
611                          case 1:                  *(data->iMinSAD) = sad;
612                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,                  data->currentMV->x = x; data->currentMV->y = y;
613                                                                                     backupMV.y, 1);                  *data->dir = Direction;
614                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,          }
615                                                                                   backupMV.y - iDiamondSize, 5);  }
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 break;  
                         case 2:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
616    
617                          case 3:  static void
618                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,  CheckCandidateDirectno4v(const int x, const int y, const SearchData * const data, const int Direction)
619                                                                                   4);  {
620                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,          int32_t sad, xcf, ycf, xcb, ycb;
621                                                                                   backupMV.y - iDiamondSize, 7);          const uint8_t *ReferenceF;
622                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,          const uint8_t *ReferenceB;
623                                                                                   backupMV.y + iDiamondSize, 8);          VECTOR mvs, b_mvs;
                                 break;  
624    
625                          case 4:          if (( x > 31) || ( x < -32) || ( y > 31) || (y < -32)) return;
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 break;  
   
                         case 5:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,  
                                                                                  1);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 break;  
   
                         case 6:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
   
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
626    
627                                  break;          mvs.x = data->directmvF[0].x + x;
628            b_mvs.x = ((x == 0) ?
629                    data->directmvB[0].x
630                    : mvs.x - data->referencemv[0].x);
631    
632                          case 7:          mvs.y = data->directmvF[0].y + y;
633                                  CHECK_MV16_CANDIDATE_FOUND(backupMV.x - iDiamondSize,          b_mvs.y = ((y == 0) ?
634                                                                                     backupMV.y, 1);                  data->directmvB[0].y
635                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,                  : mvs.y - data->referencemv[0].y);
                                                                                  4);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
636    
637                          case 8:          if ( (mvs.x > data->max_dx) || (mvs.x < data->min_dx)
638                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,                  || (mvs.y > data->max_dy) || (mvs.y < data->min_dy)
639                                                                                   2);                  || (b_mvs.x > data->max_dx) || (b_mvs.x < data->min_dx)
640                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,                  || (b_mvs.y > data->max_dy) || (b_mvs.y < data->min_dy) ) return;
641                                                                                   4);  
642                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,          if (data->qpel) {
643                                                                                   backupMV.y + iDiamondSize, 6);                  xcf = 4*(mvs.x/2); ycf = 4*(mvs.y/2);
644                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,                  xcb = 4*(b_mvs.x/2); ycb = 4*(b_mvs.y/2);
645                                                                                   backupMV.y - iDiamondSize, 7);                  ReferenceF = Interpolate16x16qpel(mvs.x, mvs.y, 0, data);
646                                  CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,                  ReferenceB = Interpolate16x16qpel(b_mvs.x, b_mvs.y, 1, data);
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
                         default:  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y,  
                                                                                  1);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y,  
                                                                                  2);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize,  
                                                                                  3);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize,  
                                                                                  4);  
   
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 5);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x - iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 6);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y - iDiamondSize, 7);  
                                 CHECK_MV16_CANDIDATE_DIR(backupMV.x + iDiamondSize,  
                                                                                  backupMV.y + iDiamondSize, 8);  
                                 break;  
                         }  
647          } else {          } else {
648                  currMV->x = startx;                  xcf = 4*mvs.x; ycf = 4*mvs.y;
649                  currMV->y = starty;                  xcb = 4*b_mvs.x; ycb = 4*b_mvs.y;
650          }                  ReferenceF = GetReference(mvs.x, mvs.y, data);
651          return iMinSAD;                  ReferenceB = GetReferenceB(b_mvs.x, b_mvs.y, 1, data);
652  }  }
653    
654            sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
655            sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0, 0) * sad)>>10;
656    
657  int32_t          if (data->chroma && sad < *data->iMinSAD)
658  Full16_MainSearch(const uint8_t * const pRef,                  sad += ChromaSAD2((xcf >> 3) + roundtab_76[xcf & 0xf],
659                                    const uint8_t * const pRefH,                                                          (ycf >> 3) + roundtab_76[ycf & 0xf],
660                                    const uint8_t * const pRefV,                                                          (xcb >> 3) + roundtab_76[xcb & 0xf],
661                                    const uint8_t * const pRefHV,                                                          (ycb >> 3) + roundtab_76[ycb & 0xf], data);
                                   const uint8_t * const cur,  
                                   const int x,  
                                   const int y,  
                                   int32_t startx,  
                                   int32_t starty,  
                                   int32_t iMinSAD,  
                                   VECTOR * const currMV,  
                                   const VECTOR * const pmv,  
                                   const int32_t min_dx,  
                                   const int32_t max_dx,  
                                   const int32_t min_dy,  
                                   const int32_t max_dy,  
                                   const int32_t iEdgedWidth,  
                                   const int32_t iDiamondSize,  
                                   const int32_t iFcode,  
                                   const int32_t iQuant,  
                                   int iFound)  
 {  
         int32_t iSAD;  
         int32_t dx, dy;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
         for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)  
                 for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)  
                         NOCHECK_MV16_CANDIDATE(dx, dy);  
662    
663          return iMinSAD;          if (sad < *(data->iMinSAD)) {
664                    *(data->iMinSAD) = sad;
665                    data->currentMV->x = x; data->currentMV->y = y;
666                    *data->dir = Direction;
667            }
668  }  }
669    
670  int32_t  
671  AdvDiamond16_MainSearch(const uint8_t * const pRef,  static void
672                                                  const uint8_t * const pRefH,  CheckCandidateRD16(const int x, const int y, const SearchData * const data, const int Direction)
                                                 const uint8_t * const pRefV,  
                                                 const uint8_t * const pRefHV,  
                                                 const uint8_t * const cur,  
                                                 const int x,  
                                                 const int y,  
                                                 int32_t startx,  
                                                 int32_t starty,  
                                                 int32_t iMinSAD,  
                                                 VECTOR * const currMV,  
                                                 const VECTOR * const pmv,  
                                                 const int32_t min_dx,  
                                                 const int32_t max_dx,  
                                                 const int32_t min_dy,  
                                                 const int32_t max_dy,  
                                                 const int32_t iEdgedWidth,  
                                                 const int32_t iDiamondSize,  
                                                 const int32_t iFcode,  
                                                 const int32_t iQuant,  
                                                 int iDirection)  
673  {  {
674    
675          int32_t iSAD;          int16_t *in = data->dctSpace, *coeff = data->dctSpace + 64;
676            int32_t rd = 0;
677            VECTOR * current;
678            const uint8_t * ptr;
679            int i, cbp = 0, t, xc, yc;
680    
681  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */          if ( (x > data->max_dx) || (x < data->min_dx)
682                    || (y > data->max_dy) || (y < data->min_dy) ) return;
683    
684          if (iDirection) {          if (!data->qpel_precision) {
685                  CHECK_MV16_CANDIDATE(startx - iDiamondSize, starty);                  ptr = GetReference(x, y, data);
686                  CHECK_MV16_CANDIDATE(startx + iDiamondSize, starty);                  current = data->currentMV;
687                  CHECK_MV16_CANDIDATE(startx, starty - iDiamondSize);                  xc = x; yc = y;
688                  CHECK_MV16_CANDIDATE(startx, starty + iDiamondSize);          } else { /* x and y are in 1/4 precision */
689          } else {                  ptr = Interpolate16x16qpel(x, y, 0, data);
690                  int bDirection = 1 + 2 + 4 + 8;                  current = data->currentQMV;
691                    xc = x/2; yc = y/2;
692            }
693    
694                  do {          for(i = 0; i < 4; i++) {
695                          iDirection = 0;                  int s = 8*((i&1) + (i>>1)*data->iEdgedWidth);
696                          if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)                  transfer_8to16subro(in, data->Cur + s, ptr + s, data->iEdgedWidth);
697                                  CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);                  rd += data->temp[i] = Block_CalcBits(coeff, in, data->dctSpace + 128, data->iQuant, data->quant_type, &cbp, i);
698            }
699    
700                          if (bDirection & 2)          rd += t = BITS_MULT*d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);
                                 CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);  
701    
702                          if (bDirection & 4)          if (data->temp[0] + t < data->iMinSAD[1]) {
703                                  CHECK_MV16_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);                  data->iMinSAD[1] = data->temp[0] + t; current[1].x = x; current[1].y = y; data->cbp[1] = (data->cbp[1]&~32) | (cbp&32); }
704            if (data->temp[1] < data->iMinSAD[2]) {
705                    data->iMinSAD[2] = data->temp[1]; current[2].x = x; current[2].y = y; data->cbp[1] = (data->cbp[1]&~16) | (cbp&16); }
706            if (data->temp[2] < data->iMinSAD[3]) {
707                    data->iMinSAD[3] = data->temp[2]; current[3].x = x; current[3].y = y; data->cbp[1] = (data->cbp[1]&~8) | (cbp&8); }
708            if (data->temp[3] < data->iMinSAD[4]) {
709                    data->iMinSAD[4] = data->temp[3]; current[4].x = x; current[4].y = y; data->cbp[1] = (data->cbp[1]&~4) | (cbp&4); }
710    
711                          if (bDirection & 8)          rd += BITS_MULT*xvid_cbpy_tab[15-(cbp>>2)].len;
                                 CHECK_MV16_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);  
712    
713                          /* now we're doing diagonal checks near our candidate */          if (rd >= data->iMinSAD[0]) return;
714    
715                          if (iDirection)         //checking if anything found          /* chroma */
716                          {          xc = (xc >> 1) + roundtab_79[xc & 0x3];
717                                  bDirection = iDirection;          yc = (yc >> 1) + roundtab_79[yc & 0x3];
718                                  iDirection = 0;  
719                                  startx = currMV->x;          /* chroma U */
720                                  starty = currMV->y;          ptr = interpolate8x8_switch2(data->RefQ, data->RefP[4], 0, 0, xc, yc, data->iEdgedWidth/2, data->rounding);
721                                  if (bDirection & 3)     //our candidate is left or right          transfer_8to16subro(in, data->CurU, ptr, data->iEdgedWidth/2);
722                                  {          rd += Block_CalcBits(coeff, in, data->dctSpace + 128, data->iQuant, data->quant_type, &cbp, 4);
723                                          CHECK_MV16_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);          if (rd >= data->iMinSAD[0]) return;
724                                          CHECK_MV16_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);  
725                                  } else                  // what remains here is up or down          /* chroma V */
726            ptr = interpolate8x8_switch2(data->RefQ, data->RefP[5], 0, 0, xc, yc, data->iEdgedWidth/2, data->rounding);
727            transfer_8to16subro(in, data->CurV, ptr, data->iEdgedWidth/2);
728            rd += Block_CalcBits(coeff, in, data->dctSpace + 128, data->iQuant, data->quant_type, &cbp, 5);
729    
730            rd += BITS_MULT*mcbpc_inter_tab[(MODE_INTER & 7) | ((cbp & 3) << 3)].len;
731    
732            if (rd < data->iMinSAD[0]) {
733                    data->iMinSAD[0] = rd;
734                    current[0].x = x; current[0].y = y;
735                    *data->dir = Direction;
736                    *data->cbp = cbp;
737            }
738    }
739    
740    static void
741    CheckCandidateRD8(const int x, const int y, const SearchData * const data, const int Direction)
742                                  {                                  {
743                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);  
744                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);          int16_t *in = data->dctSpace, *coeff = data->dctSpace + 64;
745            int32_t rd;
746            VECTOR * current;
747            const uint8_t * ptr;
748            int cbp = 0;
749    
750            if ( (x > data->max_dx) || (x < data->min_dx)
751                    || (y > data->max_dy) || (y < data->min_dy) ) return;
752    
753            if (!data->qpel_precision) {
754                    ptr = GetReference(x, y, data);
755                    current = data->currentMV;
756            } else { /* x and y are in 1/4 precision */
757                    ptr = Interpolate8x8qpel(x, y, 0, 0, data);
758                    current = data->currentQMV;
759                                  }                                  }
760    
761                                  if (iDirection) {          transfer_8to16subro(in, data->Cur, ptr, data->iEdgedWidth);
762                                          bDirection += iDirection;          rd = Block_CalcBits(coeff, in, data->dctSpace + 128, data->iQuant, data->quant_type, &cbp, 5);
763                                          startx = currMV->x;          rd += BITS_MULT*d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);
764                                          starty = currMV->y;  
765            if (rd < data->iMinSAD[0]) {
766                    *data->cbp = cbp;
767                    data->iMinSAD[0] = rd;
768                    current[0].x = x; current[0].y = y;
769                    *data->dir = Direction;
770            }
771                                  }                                  }
772                          } else                          //about to quit, eh? not so fast....  
773    /* CHECK_CANDIATE FUNCTIONS END */
774    
775    /* MAINSEARCH FUNCTIONS START */
776    
777    static void
778    AdvDiamondSearch(int x, int y, const SearchData * const data, int bDirection, CheckFunc * const CheckCandidate)
779                          {                          {
780    
781    /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
782    
783            unsigned int * const iDirection = data->dir;
784    
785            for(;;) { /* forever */
786                    *iDirection = 0;
787                    if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1);
788                    if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2);
789                    if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4);
790                    if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8);
791    
792                    /* now we're doing diagonal checks near our candidate */
793    
794                    if (*iDirection) {              /* if anything found */
795                            bDirection = *iDirection;
796                            *iDirection = 0;
797                            x = data->currentMV->x; y = data->currentMV->y;
798                            if (bDirection & 3) {   /* our candidate is left or right */
799                                    CHECK_CANDIDATE(x, y + iDiamondSize, 8);
800                                    CHECK_CANDIDATE(x, y - iDiamondSize, 4);
801                            } else {                        /* what remains here is up or down */
802                                    CHECK_CANDIDATE(x + iDiamondSize, y, 2);
803                                    CHECK_CANDIDATE(x - iDiamondSize, y, 1);
804                            }
805    
806                            if (*iDirection) {
807                                    bDirection += *iDirection;
808                                    x = data->currentMV->x; y = data->currentMV->y;
809                            }
810                    } else {                                /* about to quit, eh? not so fast.... */
811                                  switch (bDirection) {                                  switch (bDirection) {
812                                  case 2:                                  case 2:
813                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
814                                                                                           starty - iDiamondSize, 2 + 4);                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
815                                          break;                                          break;
816                                  case 1:                                  case 1:
817                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
818                                                                                           starty - iDiamondSize, 1 + 4);                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty + iDiamondSize, 1 + 8);  
819                                          break;                                          break;
820                                  case 2 + 4:                                  case 2 + 4:
821                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
822                                                                                           starty - iDiamondSize, 1 + 4);                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
823                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                                                                          starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
824                                          break;                                          break;
825                                  case 4:                                  case 4:
826                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
827                                                                                           starty - iDiamondSize, 2 + 4);                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty - iDiamondSize, 1 + 4);  
828                                          break;                                          break;
829                                  case 8:                                  case 8:
830                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
831                                                                                           starty + iDiamondSize, 2 + 8);                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty + iDiamondSize, 1 + 8);  
832                                          break;                                          break;
833                                  case 1 + 4:                                  case 1 + 4:
834                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
835                                                                                           starty + iDiamondSize, 1 + 8);                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
836                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
                                                                                          starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty - iDiamondSize, 2 + 4);  
837                                          break;                                          break;
838                                  case 2 + 8:                                  case 2 + 8:
839                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
840                                                                                           starty - iDiamondSize, 1 + 4);                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
841                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                                                                          starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
842                                          break;                                          break;
843                                  case 1 + 8:                                  case 1 + 8:
844                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
845                                                                                           starty - iDiamondSize, 2 + 4);                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
846                                          CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
847                                                                                           starty + iDiamondSize, 2 + 8);                                  break;
848                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                          default:                /* 1+2+4+8 == we didn't find anything at all */
849                                                                                           starty + iDiamondSize, 1 + 8);                                  CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1 + 4);
850                                          break;                                  CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1 + 8);
851                                  default:                //1+2+4+8 == we didn't find anything at all                                  CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2 + 4);
852                                          CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,                                  CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2 + 8);
                                                                                          starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                          starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV16_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                          starty + iDiamondSize, 2 + 8);  
853                                          break;                                          break;
854                                  }                                  }
855                                  if (!iDirection)                          if (!*iDirection) break;                /* ok, the end. really */
856                                          break;          //ok, the end. really                          bDirection = *iDirection;
857                                  else {                          x = data->currentMV->x; y = data->currentMV->y;
                                         bDirection = iDirection;  
                                         startx = currMV->x;  
                                         starty = currMV->y;  
                                 }  
                         }  
858                  }                  }
                 while (1);                              //forever  
859          }          }
         return iMinSAD;  
860  }  }
861    
862  int32_t  static void
863  AdvDiamond8_MainSearch(const uint8_t * const pRef,  SquareSearch(int x, int y, const SearchData * const data, int bDirection, CheckFunc * const CheckCandidate)
                                            const uint8_t * const pRefH,  
                                            const uint8_t * const pRefV,  
                                            const uint8_t * const pRefHV,  
                                            const uint8_t * const cur,  
                                            const int x,  
                                            const int y,  
                                            int32_t startx,  
                                            int32_t starty,  
                                            int32_t iMinSAD,  
                                            VECTOR * const currMV,  
                                            const VECTOR * const pmv,  
                                            const int32_t min_dx,  
                                            const int32_t max_dx,  
                                            const int32_t min_dy,  
                                            const int32_t max_dy,  
                                            const int32_t iEdgedWidth,  
                                            const int32_t iDiamondSize,  
                                            const int32_t iFcode,  
                                            const int32_t iQuant,  
                                            int iDirection)  
864  {  {
865            unsigned int * const iDirection = data->dir;
866    
867            do {
868                    *iDirection = 0;
869                    if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1+16+64);
870                    if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2+32+128);
871                    if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4+16+32);
872                    if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8+64+128);
873                    if (bDirection & 16) CHECK_CANDIDATE(x - iDiamondSize, y - iDiamondSize, 1+4+16+32+64);
874                    if (bDirection & 32) CHECK_CANDIDATE(x + iDiamondSize, y - iDiamondSize, 2+4+16+32+128);
875                    if (bDirection & 64) CHECK_CANDIDATE(x - iDiamondSize, y + iDiamondSize, 1+8+16+64+128);
876                    if (bDirection & 128) CHECK_CANDIDATE(x + iDiamondSize, y + iDiamondSize, 2+8+32+64+128);
877    
878                    bDirection = *iDirection;
879                    x = data->currentMV->x; y = data->currentMV->y;
880            } while (*iDirection);
881    }
882    
883          int32_t iSAD;  static void
884    DiamondSearch(int x, int y, const SearchData * const data, int bDirection, CheckFunc * const CheckCandidate)
885    {
886    
887  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */  /* directions: 1 - left (x-1); 2 - right (x+1), 4 - up (y-1); 8 - down (y+1) */
888    
889          if (iDirection) {          unsigned int * const iDirection = data->dir;
                 CHECK_MV8_CANDIDATE(startx - iDiamondSize, starty);  
                 CHECK_MV8_CANDIDATE(startx + iDiamondSize, starty);  
                 CHECK_MV8_CANDIDATE(startx, starty - iDiamondSize);  
                 CHECK_MV8_CANDIDATE(startx, starty + iDiamondSize);  
         } else {  
                 int bDirection = 1 + 2 + 4 + 8;  
890    
891                  do {                  do {
892                          iDirection = 0;                  *iDirection = 0;
893                          if (bDirection & 1)     //we only want to check left if we came from the right (our last motion was to the left, up-left or down-left)                  if (bDirection & 1) CHECK_CANDIDATE(x - iDiamondSize, y, 1);
894                                  CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);                  if (bDirection & 2) CHECK_CANDIDATE(x + iDiamondSize, y, 2);
895                    if (bDirection & 4) CHECK_CANDIDATE(x, y - iDiamondSize, 4);
896                    if (bDirection & 8) CHECK_CANDIDATE(x, y + iDiamondSize, 8);
897    
898                          if (bDirection & 2)                  /* now we're doing diagonal checks near our candidate */
                                 CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);  
899    
900                          if (bDirection & 4)                  if (*iDirection) {              /* checking if anything found */
901                                  CHECK_MV8_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);                          bDirection = *iDirection;
902                            *iDirection = 0;
903                            x = data->currentMV->x; y = data->currentMV->y;
904                            if (bDirection & 3) {   /* our candidate is left or right */
905                                    CHECK_CANDIDATE(x, y + iDiamondSize, 8);
906                                    CHECK_CANDIDATE(x, y - iDiamondSize, 4);
907                            } else {                        /* what remains here is up or down */
908                                    CHECK_CANDIDATE(x + iDiamondSize, y, 2);
909                                    CHECK_CANDIDATE(x - iDiamondSize, y, 1);
910                            }
911                            bDirection += *iDirection;
912                            x = data->currentMV->x; y = data->currentMV->y;
913                    }
914            }
915            while (*iDirection);
916    }
917    
918                          if (bDirection & 8)  /* MAINSEARCH FUNCTIONS END */
                                 CHECK_MV8_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);  
919    
920                          /* now we're doing diagonal checks near our candidate */  static void
921    SubpelRefine(const SearchData * const data, CheckFunc * const CheckCandidate)
                         if (iDirection)         //checking if anything found  
922                          {                          {
923                                  bDirection = iDirection;  /* Do a half-pel or q-pel refinement */
924                                  iDirection = 0;          const VECTOR centerMV = data->qpel_precision ? *data->currentQMV : *data->currentMV;
925                                  startx = currMV->x;  
926                                  starty = currMV->y;          CHECK_CANDIDATE(centerMV.x, centerMV.y - 1, 0);
927                                  if (bDirection & 3)     //our candidate is left or right          CHECK_CANDIDATE(centerMV.x + 1, centerMV.y - 1, 0);
928            CHECK_CANDIDATE(centerMV.x + 1, centerMV.y, 0);
929            CHECK_CANDIDATE(centerMV.x + 1, centerMV.y + 1, 0);
930            CHECK_CANDIDATE(centerMV.x, centerMV.y + 1, 0);
931            CHECK_CANDIDATE(centerMV.x - 1, centerMV.y + 1, 0);
932            CHECK_CANDIDATE(centerMV.x - 1, centerMV.y, 0);
933            CHECK_CANDIDATE(centerMV.x - 1, centerMV.y - 1, 0);
934    }
935    
936    static __inline int
937    SkipDecisionP(const IMAGE * current, const IMAGE * reference,
938                                                            const int x, const int y,
939                                                            const uint32_t stride, const uint32_t iQuant, int rrv)
940    
941                                  {                                  {
942                                          CHECK_MV8_CANDIDATE_DIR(startx, starty + iDiamondSize, 8);          int offset = (x + y*stride)*8;
943                                          CHECK_MV8_CANDIDATE_DIR(startx, starty - iDiamondSize, 4);          if(!rrv) {
944                                  } else                  // what remains here is up or down                  uint32_t sadC = sad8(current->u + offset,
945                                                    reference->u + offset, stride);
946                    if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP) return 0;
947                    sadC += sad8(current->v + offset,
948                                                    reference->v + offset, stride);
949                    if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP) return 0;
950                    return 1;
951    
952            } else {
953                    uint32_t sadC = sad16(current->u + 2*offset,
954                                                    reference->u + 2*offset, stride, 256*4096);
955                    if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP*4) return 0;
956                    sadC += sad16(current->v + 2*offset,
957                                                    reference->v + 2*offset, stride, 256*4096);
958                    if (sadC > iQuant * MAX_CHROMA_SAD_FOR_SKIP*4) return 0;
959                    return 1;
960            }
961    }
962    
963    static __inline void
964    ZeroMacroblockP(MACROBLOCK *pMB, const int32_t sad)
965                                  {                                  {
966                                          CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize, starty, 2);          pMB->mode = MODE_INTER;
967                                          CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize, starty, 1);          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = zeroMV;
968            pMB->qmvs[0] = pMB->qmvs[1] = pMB->qmvs[2] = pMB->qmvs[3] = zeroMV;
969            pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = sad;
970                                  }                                  }
971    
972                                  if (iDirection) {  static __inline void
973                                          bDirection += iDirection;  ModeDecision(SearchData * const Data,
974                                          startx = currMV->x;                          MACROBLOCK * const pMB,
975                                          starty = currMV->y;                          const MACROBLOCK * const pMBs,
976                            const int x, const int y,
977                            const MBParam * const pParam,
978                            const uint32_t MotionFlags,
979                            const uint32_t VopFlags,
980                            const uint32_t VolFlags,
981                            const IMAGE * const pCurrent,
982                            const IMAGE * const pRef,
983                            const IMAGE * const vGMC,
984                            const int coding_type)
985    {
986            int mode = MODE_INTER;
987            int mcsel = 0;
988            int inter4v = (VopFlags & XVID_VOP_INTER4V) && (pMB->dquant == 0);
989            const uint32_t iQuant = pMB->quant;
990    
991            const int skip_possible = (coding_type == P_VOP) && (pMB->dquant == 0);
992    
993            pMB->mcsel = 0;
994    
995            if (!(VopFlags & XVID_VOP_MODEDECISION_RD)) { /* normal, fast, SAD-based mode decision */
996                    int sad;
997                    int InterBias = MV16_INTER_BIAS;
998                    if (inter4v == 0 || Data->iMinSAD[0] < Data->iMinSAD[1] + Data->iMinSAD[2] +
999                            Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * (int32_t)iQuant) {
1000                            mode = MODE_INTER;
1001                            sad = Data->iMinSAD[0];
1002                    } else {
1003                            mode = MODE_INTER4V;
1004                            sad = Data->iMinSAD[1] + Data->iMinSAD[2] +
1005                                                    Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * (int32_t)iQuant;
1006                            Data->iMinSAD[0] = sad;
1007                                  }                                  }
1008                          } else                          //about to quit, eh? not so fast....  
1009                          {                  /* final skip decision, a.k.a. "the vector you found, really that good?" */
1010                                  switch (bDirection) {                  if (skip_possible && (pMB->sad16 < (int)iQuant * MAX_SAD00_FOR_SKIP))
1011                                  case 2:                          if ( (100*sad)/(pMB->sad16+1) > FINAL_SKIP_THRESH)
1012                                          CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,                                  if (Data->chroma || SkipDecisionP(pCurrent, pRef, x, y, Data->iEdgedWidth/2, iQuant, Data->rrv)) {
1013                                                                                          starty - iDiamondSize, 2 + 4);                                          mode = MODE_NOT_CODED;
1014                                          CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,                                          sad = 0;
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 1:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         break;  
                                 case 2 + 4:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 4:  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         break;  
                                 case 8:  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         break;  
                                 case 1 + 4:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         break;  
                                 case 2 + 8:  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
                                 case 1 + 8:  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         break;  
                                 default:                //1+2+4+8 == we didn't find anything at all  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty - iDiamondSize, 1 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx - iDiamondSize,  
                                                                                         starty + iDiamondSize, 1 + 8);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty - iDiamondSize, 2 + 4);  
                                         CHECK_MV8_CANDIDATE_DIR(startx + iDiamondSize,  
                                                                                         starty + iDiamondSize, 2 + 8);  
                                         break;  
1015                                  }                                  }
1016                                  if (!(iDirection))  
1017                                          break;          //ok, the end. really                  /* mcsel */
1018                                  else {                  if (coding_type == S_VOP) {
1019                                          bDirection = iDirection;  
1020                                          startx = currMV->x;                          int32_t iSAD = sad16(Data->Cur,
1021                                          starty = currMV->y;                                  vGMC->y + 16*y*Data->iEdgedWidth + 16*x, Data->iEdgedWidth, 65536);
1022    
1023                            if (Data->chroma) {
1024                                    iSAD += sad8(Data->CurU, vGMC->u + 8*y*(Data->iEdgedWidth/2) + 8*x, Data->iEdgedWidth/2);
1025                                    iSAD += sad8(Data->CurV, vGMC->v + 8*y*(Data->iEdgedWidth/2) + 8*x, Data->iEdgedWidth/2);
1026                                  }                                  }
1027    
1028                            if (iSAD <= sad) {              /* mode decision GMC */
1029                                    mode = MODE_INTER;
1030                                    mcsel = 1;
1031                                    sad = iSAD;
1032                          }                          }
1033    
1034                  }                  }
1035                  while (1);                              //forever  
1036                    /* intra decision */
1037    
1038                    if (iQuant > 8) InterBias += 100 * (iQuant - 8); /* to make high quants work */
1039                    if (y != 0)
1040                            if ((pMB - pParam->mb_width)->mode == MODE_INTRA ) InterBias -= 80;
1041                    if (x != 0)
1042                            if ((pMB - 1)->mode == MODE_INTRA ) InterBias -= 80;
1043    
1044                    if (Data->chroma) InterBias += 50; /* dev8(chroma) ??? <-- yes, we need dev8 (no big difference though) */
1045                    if (Data->rrv) InterBias *= 4;
1046    
1047                    if (InterBias < sad) {
1048                            int32_t deviation;
1049                            if (!Data->rrv)
1050                                    deviation = dev16(Data->Cur, Data->iEdgedWidth);
1051                            else
1052                                    deviation = dev16(Data->Cur, Data->iEdgedWidth) + /* dev32() */
1053                                                            dev16(Data->Cur+16, Data->iEdgedWidth) +
1054                                                            dev16(Data->Cur + 16*Data->iEdgedWidth, Data->iEdgedWidth) +
1055                                                            dev16(Data->Cur+16+16*Data->iEdgedWidth, Data->iEdgedWidth);
1056    
1057                            if (deviation < (sad - InterBias)) mode = MODE_INTRA;
1058          }          }
1059          return iMinSAD;  
1060                    pMB->cbp = 63;
1061                    pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = sad;
1062    
1063            } else { /* Rate-Distortion */
1064    
1065                    int min_rd, intra_rd, i, cbp, c[2] = {0, 0};
1066                    VECTOR backup[5], *v;
1067                    Data->iQuant = iQuant;
1068                    Data->cbp = c;
1069    
1070                    v = Data->qpel ? Data->currentQMV : Data->currentMV;
1071                    for (i = 0; i < 5; i++) {
1072                            Data->iMinSAD[i] = 256*4096;
1073                            backup[i] = v[i];
1074  }  }
1075    
1076                    min_rd = findRDinter(Data, pMBs, x, y, pParam, MotionFlags);
1077                    cbp = *Data->cbp;
1078    
1079  int32_t                  if (coding_type == S_VOP) {
1080  Full8_MainSearch(const uint8_t * const pRef,                          int gmc_rd;
1081                                   const uint8_t * const pRefH,                          *Data->iMinSAD = min_rd += BITS_MULT*1; /* mcsel */
1082                                   const uint8_t * const pRefV,                          gmc_rd = findRDgmc(Data, vGMC, x, y);
1083                                   const uint8_t * const pRefHV,                          if (gmc_rd < min_rd) {
1084                                   const uint8_t * const cur,                                  mcsel = 1;
1085                                   const int x,                                  *Data->iMinSAD = min_rd = gmc_rd;
1086                                   const int y,                                  mode = MODE_INTER;
1087                                   int32_t startx,                                  cbp = *Data->cbp;
1088                                   int32_t starty,                          }
1089                                   int32_t iMinSAD,                  }
                                  VECTOR * const currMV,  
                                  const VECTOR * const pmv,  
                                  const int32_t min_dx,  
                                  const int32_t max_dx,  
                                  const int32_t min_dy,  
                                  const int32_t max_dy,  
                                  const int32_t iEdgedWidth,  
                                  const int32_t iDiamondSize,  
                                  const int32_t iFcode,  
                                  const int32_t iQuant,  
                                  int iFound)  
 {  
         int32_t iSAD;  
         int32_t dx, dy;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
         for (dx = min_dx; dx <= max_dx; dx += iDiamondSize)  
                 for (dy = min_dy; dy <= max_dy; dy += iDiamondSize)  
                         NOCHECK_MV8_CANDIDATE(dx, dy);  
1090    
1091          return iMinSAD;                  if (inter4v) {
1092                            int v4_rd;
1093                            v4_rd = findRDinter4v(Data, pMB, pMBs, x, y, pParam, MotionFlags, backup);
1094                            if (v4_rd < min_rd) {
1095                                    Data->iMinSAD[0] = min_rd = v4_rd;
1096                                    mode = MODE_INTER4V;
1097                                    cbp = *Data->cbp;
1098                            }
1099  }  }
1100    
1101                    intra_rd = findRDintra(Data);
1102                    if (intra_rd < min_rd) {
1103                            *Data->iMinSAD = min_rd = intra_rd;
1104                            mode = MODE_INTRA;
1105                    }
1106    
1107                    pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = 0;
1108                    pMB->cbp = cbp;
1109            }
1110    
1111  int32_t          if (Data->rrv) {
1112  Halfpel16_Refine(const uint8_t * const pRef,                          Data->currentMV[0].x = RRV_MV_SCALEDOWN(Data->currentMV[0].x);
1113                                   const uint8_t * const pRefH,                          Data->currentMV[0].y = RRV_MV_SCALEDOWN(Data->currentMV[0].y);
1114                                   const uint8_t * const pRefV,          }
1115                                   const uint8_t * const pRefHV,  
1116                                   const uint8_t * const cur,          if (mode == MODE_INTER && mcsel == 0) {
1117                                   const int x,                  pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = Data->currentMV[0];
1118                                   const int y,  
1119                                   VECTOR * const currMV,                  if(Data->qpel) {
1120                                   int32_t iMinSAD,                          pMB->qmvs[0] = pMB->qmvs[1]
1121                                   const VECTOR * const pmv,                                  = pMB->qmvs[2] = pMB->qmvs[3] = Data->currentQMV[0];
1122                                   const int32_t min_dx,                          pMB->pmvs[0].x = Data->currentQMV[0].x - Data->predMV.x;
1123                                   const int32_t max_dx,                          pMB->pmvs[0].y = Data->currentQMV[0].y - Data->predMV.y;
1124                                   const int32_t min_dy,                  } else {
1125                                   const int32_t max_dy,                          pMB->pmvs[0].x = Data->currentMV[0].x - Data->predMV.x;
1126                                   const int32_t iFcode,                          pMB->pmvs[0].y = Data->currentMV[0].y - Data->predMV.y;
1127                                   const int32_t iQuant,                  }
1128                                   const int32_t iEdgedWidth)  
1129  {          } else if (mode == MODE_INTER ) { // but mcsel == 1
1130  /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */  
1131                    pMB->mcsel = 1;
1132          int32_t iSAD;                  if (Data->qpel) {
1133          VECTOR backupMV = *currMV;                          pMB->qmvs[0] = pMB->qmvs[1] = pMB->qmvs[2] = pMB->qmvs[3] = pMB->amv;
1134                            pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = pMB->amv.x/2;
1135          CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y - 1);                          pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = pMB->amv.y/2;
1136          CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y - 1);                  } else
1137          CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y - 1);                          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->amv;
1138          CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y);  
1139          CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y);          } else
1140          CHECK_MV16_CANDIDATE(backupMV.x - 1, backupMV.y + 1);                  if (mode == MODE_INTER4V) ; /* anything here? */
1141          CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y + 1);          else    /* INTRA, NOT_CODED */
1142          CHECK_MV16_CANDIDATE(backupMV.x + 1, backupMV.y + 1);                  ZeroMacroblockP(pMB, 0);
1143    
1144            pMB->mode = mode;
1145    }
1146    
1147    bool
1148    MotionEstimation(MBParam * const pParam,
1149                                     FRAMEINFO * const current,
1150                                     FRAMEINFO * const reference,
1151                                     const IMAGE * const pRefH,
1152                                     const IMAGE * const pRefV,
1153                                     const IMAGE * const pRefHV,
1154                                    const IMAGE * const pGMC,
1155                                     const uint32_t iLimit)
1156    {
1157            MACROBLOCK *const pMBs = current->mbs;
1158            const IMAGE *const pCurrent = &current->image;
1159            const IMAGE *const pRef = &reference->image;
1160    
1161            uint32_t mb_width = pParam->mb_width;
1162            uint32_t mb_height = pParam->mb_height;
1163            const uint32_t iEdgedWidth = pParam->edged_width;
1164            const uint32_t MotionFlags = MakeGoodMotionFlags(current->motion_flags, current->vop_flags, current->vol_flags);
1165    
1166            uint32_t x, y;
1167            uint32_t iIntra = 0;
1168            int32_t sad00;
1169            int skip_thresh = INITIAL_SKIP_THRESH * \
1170                    (current->vop_flags & XVID_VOP_REDUCED ? 4:1) * \
1171                    (current->vop_flags & XVID_VOP_MODEDECISION_RD ? 2:1);
1172    
1173            /* some pre-initialized thingies for SearchP */
1174            int32_t temp[8]; uint32_t dir;
1175            VECTOR currentMV[5];
1176            VECTOR currentQMV[5];
1177            int32_t iMinSAD[5];
1178            DECLARE_ALIGNED_MATRIX(dct_space, 3, 64, int16_t, CACHE_LINE);
1179            SearchData Data;
1180            memset(&Data, 0, sizeof(SearchData));
1181            Data.iEdgedWidth = iEdgedWidth;
1182            Data.currentMV = currentMV;
1183            Data.currentQMV = currentQMV;
1184            Data.iMinSAD = iMinSAD;
1185            Data.temp = temp;
1186            Data.dir = &dir;
1187            Data.iFcode = current->fcode;
1188            Data.rounding = pParam->m_rounding_type;
1189            Data.qpel = (current->vol_flags & XVID_VOL_QUARTERPEL ? 1:0);
1190            Data.chroma = MotionFlags & XVID_ME_CHROMA_PVOP;
1191            Data.rrv = (current->vop_flags & XVID_VOP_REDUCED) ? 1:0;
1192            Data.dctSpace = dct_space;
1193            Data.quant_type = !(pParam->vol_flags & XVID_VOL_MPEGQUANT);
1194    
1195            if ((current->vop_flags & XVID_VOP_REDUCED)) {
1196                    mb_width = (pParam->width + 31) / 32;
1197                    mb_height = (pParam->height + 31) / 32;
1198                    Data.qpel = 0;
1199            }
1200    
1201            Data.RefQ = pRefV->u; /* a good place, also used in MC (for similar purpose) */
1202            if (sadInit) (*sadInit) ();
1203    
1204            for (y = 0; y < mb_height; y++) {
1205                    for (x = 0; x < mb_width; x++)  {
1206                            MACROBLOCK *pMB = &pMBs[x + y * pParam->mb_width];
1207    
1208                            if (!Data.rrv) pMB->sad16 =
1209                                    sad16v(pCurrent->y + (x + y * iEdgedWidth) * 16,
1210                                                            pRef->y + (x + y * iEdgedWidth) * 16,
1211                                                            pParam->edged_width, pMB->sad8 );
1212    
1213                            else pMB->sad16 =
1214                                    sad32v_c(pCurrent->y + (x + y * iEdgedWidth) * 32,
1215                                                            pRef->y + (x + y * iEdgedWidth) * 32,
1216                                                            pParam->edged_width, pMB->sad8 );
1217    
1218                            if (Data.chroma) {
1219                                    Data.temp[7] = sad8(pCurrent->u + x*8 + y*(iEdgedWidth/2)*8,
1220                                                                            pRef->u + x*8 + y*(iEdgedWidth/2)*8, iEdgedWidth/2)
1221                                                                    + sad8(pCurrent->v + (x + y*(iEdgedWidth/2))*8,
1222                                                                            pRef->v + (x + y*(iEdgedWidth/2))*8, iEdgedWidth/2);
1223                                    pMB->sad16 += Data.temp[7];
1224                            }
1225    
1226                            sad00 = pMB->sad16;
1227    
1228                            /* initial skip decision */
1229                            /* no early skip for GMC (global vector = skip vector is unknown!)  */
1230                            if (current->coding_type != S_VOP)      { /* no fast SKIP for S(GMC)-VOPs */
1231                                    if (pMB->dquant == 0 && sad00 < pMB->quant * skip_thresh)
1232                                            if (Data.chroma || SkipDecisionP(pCurrent, pRef, x, y, iEdgedWidth/2, pMB->quant, Data.rrv)) {
1233                                                    ZeroMacroblockP(pMB, sad00);
1234                                                    pMB->mode = MODE_NOT_CODED;
1235                                                    continue;
1236                                            }
1237                            }
1238    
1239                            if ((current->vop_flags & XVID_VOP_CARTOON) &&
1240                                    (sad00 < pMB->quant * 4 * skip_thresh)) { /* favorize (0,0) vector for cartoons */
1241                                    ZeroMacroblockP(pMB, sad00);
1242                                    continue;
1243                            }
1244    
1245                            SearchP(pRef, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,
1246                                            y, MotionFlags, current->vop_flags, current->vol_flags,
1247                                            &Data, pParam, pMBs, reference->mbs, pMB);
1248    
1249                            ModeDecision(&Data, pMB, pMBs, x, y, pParam,
1250                                                     MotionFlags, current->vop_flags, current->vol_flags,
1251                                                     pCurrent, pRef, pGMC, current->coding_type);
1252    
1253                            if (pMB->mode == MODE_INTRA)
1254                                    if (++iIntra > iLimit) return 1;
1255                    }
1256            }
1257    
1258            return 0;
1259    }
1260    
1261          return iMinSAD;  /* check if given vector is equal to any vector checked before */
1262    static __inline int
1263    vector_repeats(const VECTOR * const pmv, const int i)
1264    {
1265            unsigned int j;
1266            for (j = 0; j < i; j++)
1267                    if (MVequal(pmv[i], pmv[j])) return 1; /* same vector has been checked already */
1268            return 0;
1269    }
1270    
1271    /*      make a binary mask that prevents diamonds/squares
1272            from checking a vector which has been checked as a prediction */
1273    static __inline int
1274    make_mask(const VECTOR * const pmv, const int i, const int current)
1275    {
1276            unsigned int mask = 255, j;
1277            for (j = 0; j < i; j++) {
1278                    if (pmv[current].x == pmv[j].x) {
1279                            if (pmv[current].y == pmv[j].y + iDiamondSize) mask &= ~4;
1280                            else if (pmv[current].y == pmv[j].y - iDiamondSize) mask &= ~8;
1281                    } else
1282                            if (pmv[current].y == pmv[j].y) {
1283                                    if (pmv[current].x == pmv[j].x + iDiamondSize) mask &= ~1;
1284                                    else if (pmv[current].x == pmv[j].x - iDiamondSize) mask &= ~2;
1285  }  }
1286            }
1287            return mask;
1288    }
1289    
1290    static __inline void
1291    PreparePredictionsP(VECTOR * const pmv, int x, int y, int iWcount,
1292                            int iHcount, const MACROBLOCK * const prevMB, int rrv)
1293    {
1294            /* this function depends on get_pmvdata which means that it sucks. It should get the predictions by itself */
1295            if (rrv) { iWcount /= 2; iHcount /= 2; }
1296    
1297  #define PMV_HALFPEL16 (PMV_HALFPELDIAMOND16|PMV_HALFPELREFINE16)          if ( (y != 0) && (x < (iWcount-1)) ) {          /* [5] top-right neighbour */
1298                    pmv[5].x = EVEN(pmv[3].x);
1299                    pmv[5].y = EVEN(pmv[3].y);
1300            } else pmv[5].x = pmv[5].y = 0;
1301    
1302            if (x != 0) { pmv[3].x = EVEN(pmv[1].x); pmv[3].y = EVEN(pmv[1].y); }/* pmv[3] is left neighbour */
1303            else pmv[3].x = pmv[3].y = 0;
1304    
1305            if (y != 0) { pmv[4].x = EVEN(pmv[2].x); pmv[4].y = EVEN(pmv[2].y); }/* [4] top neighbour */
1306            else pmv[4].x = pmv[4].y = 0;
1307    
1308            /* [1] median prediction */
1309            pmv[1].x = EVEN(pmv[0].x); pmv[1].y = EVEN(pmv[0].y);
1310    
1311            pmv[0].x = pmv[0].y = 0; /* [0] is zero; not used in the loop (checked before) but needed here for make_mask */
1312    
1313            pmv[2].x = EVEN(prevMB->mvs[0].x); /* [2] is last frame */
1314            pmv[2].y = EVEN(prevMB->mvs[0].y);
1315    
1316            if ((x < iWcount-1) && (y < iHcount-1)) {
1317                    pmv[6].x = EVEN((prevMB+1+iWcount)->mvs[0].x); /* [6] right-down neighbour in last frame */
1318                    pmv[6].y = EVEN((prevMB+1+iWcount)->mvs[0].y);
1319            } else pmv[6].x = pmv[6].y = 0;
1320    
1321            if (rrv) {
1322                    int i;
1323                    for (i = 0; i < 7; i++) {
1324                            pmv[i].x = RRV_MV_SCALEUP(pmv[i].x);
1325                            pmv[i].y = RRV_MV_SCALEUP(pmv[i].y);
1326                    }
1327            }
1328    }
1329    
1330  int32_t  static void
1331  PMVfastSearch16(const uint8_t * const pRef,  SearchP(const IMAGE * const pRef,
1332                                  const uint8_t * const pRefH,                                  const uint8_t * const pRefH,
1333                                  const uint8_t * const pRefV,                                  const uint8_t * const pRefV,
1334                                  const uint8_t * const pRefHV,                                  const uint8_t * const pRefHV,
# Line 1227  Line 1336 
1336                                  const int x,                                  const int x,
1337                                  const int y,                                  const int y,
1338                                  const uint32_t MotionFlags,                                  const uint32_t MotionFlags,
1339                                  const uint32_t iQuant,                  const uint32_t VopFlags,
1340                                  const uint32_t iFcode,                  const uint32_t VolFlags,
1341                    SearchData * const Data,
1342                                  const MBParam * const pParam,                                  const MBParam * const pParam,
1343                                  const MACROBLOCK * const pMBs,                                  const MACROBLOCK * const pMBs,
1344                                  const MACROBLOCK * const prevMBs,                                  const MACROBLOCK * const prevMBs,
1345                                  VECTOR * const currMV,                  MACROBLOCK * const pMB)
                                 VECTOR * const currPMV)  
1346  {  {
         const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
1347    
1348          const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;          int i, threshA;
1349            VECTOR pmv[7];
1350            int inter4v = (VopFlags & XVID_VOP_INTER4V) && (pMB->dquant == 0);
1351            CheckFunc * CheckCandidate;
1352    
1353            get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
1354                                                    pParam->width, pParam->height, Data->iFcode - Data->qpel, 1, Data->rrv);
1355    
1356            get_pmvdata2(pMBs, pParam->mb_width, 0, x, y, 0, pmv, Data->temp);
1357    
1358            Data->temp[5] = Data->temp[6] = 0; /* chroma-sad cache */
1359            i = Data->rrv ? 2 : 1;
1360            Data->Cur = pCur->y + (x + y * Data->iEdgedWidth) * 16*i;
1361            Data->CurV = pCur->v + (x + y * (Data->iEdgedWidth/2)) * 8*i;
1362            Data->CurU = pCur->u + (x + y * (Data->iEdgedWidth/2)) * 8*i;
1363    
1364            Data->RefP[0] = pRef->y + (x + Data->iEdgedWidth*y) * 16*i;
1365            Data->RefP[2] = pRefH + (x + Data->iEdgedWidth*y) * 16*i;
1366            Data->RefP[1] = pRefV + (x + Data->iEdgedWidth*y) * 16*i;
1367            Data->RefP[3] = pRefHV + (x + Data->iEdgedWidth*y) * 16*i;
1368            Data->RefP[4] = pRef->u + (x + y * (Data->iEdgedWidth/2)) * 8*i;
1369            Data->RefP[5] = pRef->v + (x + y * (Data->iEdgedWidth/2)) * 8*i;
1370    
1371            Data->lambda16 = lambda_vec16[pMB->quant];
1372            Data->lambda8 = lambda_vec8[pMB->quant];
1373            Data->qpel_precision = 0;
1374            *Data->dir = 0;
1375    
1376            memset(Data->currentMV, 0, 5*sizeof(VECTOR));
1377    
1378            if (Data->qpel) Data->predMV = get_qpmv2(pMBs, pParam->mb_width, 0, x, y, 0);
1379            else Data->predMV = pmv[0];
1380    
1381            i = d_mv_bits(0, 0, Data->predMV, Data->iFcode, 0, 0);
1382            Data->iMinSAD[0] = pMB->sad16 + ((Data->lambda16 * i * pMB->sad16)>>10);
1383            Data->iMinSAD[1] = pMB->sad8[0] + ((Data->lambda8 * i * (pMB->sad8[0]+NEIGH_8X8_BIAS)) >> 10);
1384            Data->iMinSAD[2] = pMB->sad8[1];
1385            Data->iMinSAD[3] = pMB->sad8[2];
1386            Data->iMinSAD[4] = pMB->sad8[3];
1387    
1388            if ((!(VopFlags & XVID_VOP_MODEDECISION_RD)) && (x | y)) {
1389                    threshA = Data->temp[0]; /* that's where we keep this SAD atm */
1390                    if (threshA < 512) threshA = 512;
1391                    else if (threshA > 1024) threshA = 1024;
1392            } else
1393                    threshA = 512;
1394    
1395          int32_t iDiamondSize;          PreparePredictionsP(pmv, x, y, pParam->mb_width, pParam->mb_height,
1396                                            prevMBs + x + y * pParam->mb_width, Data->rrv);
1397    
1398          int32_t min_dx;          if (!Data->rrv) {
1399          int32_t max_dx;                  if (inter4v) CheckCandidate = CheckCandidate16;
1400          int32_t min_dy;                          else CheckCandidate = CheckCandidate16no4v; /* for extra speed */
1401          int32_t max_dy;          } else CheckCandidate = CheckCandidate32;
1402    
1403    /* main loop. checking all predictions (but first, which is 0,0 and has been checked in MotionEstimation())*/
1404    
1405            for (i = 1; i < 7; i++)
1406                    if (!vector_repeats(pmv, i)) {
1407                            CheckCandidate(pmv[i].x, pmv[i].y, Data, i);
1408                            if (Data->iMinSAD[0] <= threshA) { i++; break; }
1409                    }
1410    
1411            if ((Data->iMinSAD[0] <= threshA) ||
1412                            (MVequal(Data->currentMV[0], (prevMBs+x+y*pParam->mb_width)->mvs[0]) &&
1413                            (Data->iMinSAD[0] < (prevMBs+x+y*pParam->mb_width)->sad16)))
1414                    inter4v = 0;
1415            else {
1416    
1417          int32_t iFound;                  MainSearchFunc * MainSearchPtr;
1418                    int mask = make_mask(pmv, i, *Data->dir); // all vectors pmv[0..i-1] have been checked
1419    
1420          VECTOR newMV;                  if (MotionFlags & XVID_ME_USESQUARES16) MainSearchPtr = SquareSearch;
1421          VECTOR backupMV;                        /* just for PMVFAST */                  else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1422                            else MainSearchPtr = DiamondSearch;
1423    
1424          VECTOR pmv[4];                  MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, mask, CheckCandidate);
         int32_t psad[4];  
1425    
1426          MainSearch16FuncPtr MainSearchPtr;  /* extended search, diamond starting in 0,0 and in prediction.
1427            note that this search is/might be done in halfpel positions,
1428            which makes it more different than the diamond above */
1429    
1430  //  const MACROBLOCK * const pMB = pMBs + x + y * iWcount;                  if (MotionFlags & XVID_ME_EXTSEARCH16) {
1431          const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;                          int32_t bSAD;
1432                            VECTOR startMV = Data->predMV, backupMV = Data->currentMV[0];
1433                            if (Data->rrv) {
1434                                    startMV.x = RRV_MV_SCALEUP(startMV.x);
1435                                    startMV.y = RRV_MV_SCALEUP(startMV.y);
1436                            }
1437                            if (!(MVequal(startMV, backupMV))) {
1438                                    bSAD = Data->iMinSAD[0]; Data->iMinSAD[0] = MV_MAX_ERROR;
1439    
1440          static int32_t threshA, threshB;                                  CheckCandidate(startMV.x, startMV.y, Data, 255);
1441          int32_t bPredEq;                                  MainSearchPtr(startMV.x, startMV.y, Data, 255, CheckCandidate);
1442          int32_t iMinSAD, iSAD;                                  if (bSAD < Data->iMinSAD[0]) {
1443                                            Data->currentMV[0] = backupMV;
1444                                            Data->iMinSAD[0] = bSAD; }
1445                            }
1446    
1447                            backupMV = Data->currentMV[0];
1448                            startMV.x = startMV.y = 1;
1449                            if (!(MVequal(startMV, backupMV))) {
1450                                    bSAD = Data->iMinSAD[0]; Data->iMinSAD[0] = MV_MAX_ERROR;
1451    
1452                                    CheckCandidate(startMV.x, startMV.y, Data, 255);
1453                                    MainSearchPtr(startMV.x, startMV.y, Data, 255, CheckCandidate);
1454                                    if (bSAD < Data->iMinSAD[0]) {
1455                                            Data->currentMV[0] = backupMV;
1456                                            Data->iMinSAD[0] = bSAD;
1457                                    }
1458                            }
1459                    }
1460            }
1461    
1462  /* Get maximum range */          if (MotionFlags & XVID_ME_HALFPELREFINE16)
1463          get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,                          SubpelRefine(Data, CheckCandidate);
                           iFcode);  
1464    
1465  /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */          for(i = 0; i < 5; i++) {
1466                    Data->currentQMV[i].x = 2 * Data->currentMV[i].x; /* initialize qpel vectors */
1467                    Data->currentQMV[i].y = 2 * Data->currentMV[i].y;
1468            }
1469    
1470          if (!(MotionFlags & PMV_HALFPEL16)) {          if (Data->qpel) {
1471                  min_dx = EVEN(min_dx);                  get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
1472                  max_dx = EVEN(max_dx);                                  pParam->width, pParam->height, Data->iFcode, 2, 0);
1473                  min_dy = EVEN(min_dy);                  Data->qpel_precision = 1;
1474                  max_dy = EVEN(max_dy);                  if (MotionFlags & XVID_ME_QUARTERPELREFINE16)
1475                            SubpelRefine(Data, CheckCandidate);
1476          }          }
1477    
1478          /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */          if (Data->iMinSAD[0] < (int32_t)pMB->quant * 30)
1479          bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);                  inter4v = 0;
1480    
1481          if ((x == 0) && (y == 0)) {          if (inter4v) {
1482                  threshA = 512;                  SearchData Data8;
1483                  threshB = 1024;                  memcpy(&Data8, Data, sizeof(SearchData)); /* quick copy of common data */
1484    
1485                    Search8(Data, 2*x, 2*y, MotionFlags, pParam, pMB, pMBs, 0, &Data8);
1486                    Search8(Data, 2*x + 1, 2*y, MotionFlags, pParam, pMB, pMBs, 1, &Data8);
1487                    Search8(Data, 2*x, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 2, &Data8);
1488                    Search8(Data, 2*x + 1, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 3, &Data8);
1489    
1490                    if ((Data->chroma) && (!(VopFlags & XVID_VOP_MODEDECISION_RD))) {
1491                            /* chroma is only used for comparsion to INTER. if the comparsion will be done in BITS domain, it will not be used */
1492                            int sumx = 0, sumy = 0;
1493    
1494                            if (Data->qpel)
1495                                    for (i = 1; i < 5; i++) {
1496                                            sumx += Data->currentQMV[i].x/2;
1497                                            sumy += Data->currentQMV[i].y/2;
1498                                    }
1499                            else
1500                                    for (i = 1; i < 5; i++) {
1501                                            sumx += Data->currentMV[i].x;
1502                                            sumy += Data->currentMV[i].y;
1503                                    }
1504    
1505                            Data->iMinSAD[1] += ChromaSAD(  (sumx >> 3) + roundtab_76[sumx & 0xf],
1506                                                                                            (sumy >> 3) + roundtab_76[sumy & 0xf], Data);
1507                    }
1508            } else Data->iMinSAD[1] = 4096*256;
1509    }
1510    
1511    static void
1512    Search8(const SearchData * const OldData,
1513                    const int x, const int y,
1514                    const uint32_t MotionFlags,
1515                    const MBParam * const pParam,
1516                    MACROBLOCK * const pMB,
1517                    const MACROBLOCK * const pMBs,
1518                    const int block,
1519                    SearchData * const Data)
1520    {
1521            int i = 0;
1522            CheckFunc * CheckCandidate;
1523            Data->iMinSAD = OldData->iMinSAD + 1 + block;
1524            Data->currentMV = OldData->currentMV + 1 + block;
1525            Data->currentQMV = OldData->currentQMV + 1 + block;
1526    
1527            if(Data->qpel) {
1528                    Data->predMV = get_qpmv2(pMBs, pParam->mb_width, 0, x/2, y/2, block);
1529                    if (block != 0) i = d_mv_bits(  Data->currentQMV->x, Data->currentQMV->y,
1530                                                                                    Data->predMV, Data->iFcode, 0, 0);
1531          } else {          } else {
1532                  threshA = psad[0];                  Data->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x/2, y/2, block);
1533                  threshB = threshA + 256;                  if (block != 0) i = d_mv_bits(  Data->currentMV->x, Data->currentMV->y,
1534                  if (threshA < 512)                                                                                  Data->predMV, Data->iFcode, 0, Data->rrv);
                         threshA = 512;  
                 if (threshA > 1024)  
                         threshA = 1024;  
                 if (threshB > 1792)  
                         threshB = 1792;  
1535          }          }
1536    
1537          iFound = 0;          *(Data->iMinSAD) += (Data->lambda8 * i * (*Data->iMinSAD + NEIGH_8X8_BIAS))>>10;
1538    
1539  /* Step 4: Calculate SAD around the Median prediction.          if (MotionFlags & (XVID_ME_EXTSEARCH8|XVID_ME_HALFPELREFINE8|XVID_ME_QUARTERPELREFINE8)) {
1540     MinSAD=SAD  
1541     If Motion Vector equal to Previous frame motion vector                  if (Data->rrv) i = 16; else i = 8;
1542     and MinSAD<PrevFrmSAD goto Step 10.  
1543     If SAD<=256 goto Step 10.                  Data->RefP[0] = OldData->RefP[0] + i * ((block&1) + Data->iEdgedWidth*(block>>1));
1544  */                  Data->RefP[1] = OldData->RefP[1] + i * ((block&1) + Data->iEdgedWidth*(block>>1));
1545                    Data->RefP[2] = OldData->RefP[2] + i * ((block&1) + Data->iEdgedWidth*(block>>1));
1546                    Data->RefP[3] = OldData->RefP[3] + i * ((block&1) + Data->iEdgedWidth*(block>>1));
1547    
1548                    Data->Cur = OldData->Cur + i * ((block&1) + Data->iEdgedWidth*(block>>1));
1549                    Data->qpel_precision = 0;
1550    
1551                    get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 3,
1552                                            pParam->width, pParam->height, Data->iFcode - Data->qpel, 1, Data->rrv);
1553    
1554                    if (!Data->rrv) CheckCandidate = CheckCandidate8;
1555                    else CheckCandidate = CheckCandidate16no4v;
1556    
1557                    if (MotionFlags & XVID_ME_EXTSEARCH8 && (!(MotionFlags & XVID_ME_EXTSEARCH_RD))) {
1558                            int32_t temp_sad = *(Data->iMinSAD); /* store current MinSAD */
1559    
1560          *currMV = pmv[0];                       /* current best := prediction */                          MainSearchFunc *MainSearchPtr;
1561          if (!(MotionFlags & PMV_HALFPEL16)) {   /* This should NOT be necessary! */                          if (MotionFlags & XVID_ME_USESQUARES8) MainSearchPtr = SquareSearch;
1562                  currMV->x = EVEN(currMV->x);                                  else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND8) MainSearchPtr = AdvDiamondSearch;
1563                  currMV->y = EVEN(currMV->y);                                          else MainSearchPtr = DiamondSearch;
1564    
1565                            MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, 255, CheckCandidate);
1566    
1567                            if(*(Data->iMinSAD) < temp_sad) {
1568                                            Data->currentQMV->x = 2 * Data->currentMV->x; /* update our qpel vector */
1569                                            Data->currentQMV->y = 2 * Data->currentMV->y;
1570                            }
1571          }          }
1572    
1573          if (currMV->x > max_dx) {                  if (MotionFlags & XVID_ME_HALFPELREFINE8) {
1574                  currMV->x = max_dx;                          int32_t temp_sad = *(Data->iMinSAD); /* store current MinSAD */
1575    
1576                            SubpelRefine(Data, CheckCandidate); /* perform halfpel refine of current best vector */
1577    
1578                            if(*(Data->iMinSAD) < temp_sad) { /* we have found a better match */
1579                                    Data->currentQMV->x = 2 * Data->currentMV->x; /* update our qpel vector */
1580                                    Data->currentQMV->y = 2 * Data->currentMV->y;
1581          }          }
         if (currMV->x < min_dx) {  
                 currMV->x = min_dx;  
1582          }          }
1583          if (currMV->y > max_dy) {  
1584                  currMV->y = max_dy;                  if (Data->qpel && MotionFlags & XVID_ME_QUARTERPELREFINE8) {
1585                                    Data->qpel_precision = 1;
1586                                    get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 3,
1587                                            pParam->width, pParam->height, Data->iFcode, 2, 0);
1588                                    SubpelRefine(Data, CheckCandidate);
1589          }          }
         if (currMV->y < min_dy) {  
                 currMV->y = min_dy;  
1590          }          }
1591    
1592          iMinSAD =          if (Data->rrv) {
1593                  sad16(cur,                          Data->currentMV->x = RRV_MV_SCALEDOWN(Data->currentMV->x);
1594                            get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,                          Data->currentMV->y = RRV_MV_SCALEDOWN(Data->currentMV->y);
1595                                                   iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);          }
         iMinSAD +=  
                 calc_delta_16(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                           (uint8_t) iFcode, iQuant);  
1596    
1597          if ((iMinSAD < 256) ||          if(Data->qpel) {
1598                  ((MVequal(*currMV, prevMB->mvs[0])) &&                  pMB->pmvs[block].x = Data->currentQMV->x - Data->predMV.x;
1599                   ((uint32_t) iMinSAD < prevMB->sad16))) {                  pMB->pmvs[block].y = Data->currentQMV->y - Data->predMV.y;
1600                  if (iMinSAD < 2 * iQuant)       // high chances for SKIP-mode                  pMB->qmvs[block] = *Data->currentQMV;
1601                  {          } else {
1602                          if (!MVzero(*currMV)) {                  pMB->pmvs[block].x = Data->currentMV->x - Data->predMV.x;
1603                                  iMinSAD += MV16_00_BIAS;                  pMB->pmvs[block].y = Data->currentMV->y - Data->predMV.y;
                                 CHECK_MV16_ZERO;        // (0,0) saves space for letterboxed pictures  
                                 iMinSAD -= MV16_00_BIAS;  
1604                          }                          }
1605    
1606            pMB->mvs[block] = *Data->currentMV;
1607            pMB->sad8[block] = 4 * *Data->iMinSAD;
1608                  }                  }
1609    
1610                  if (MotionFlags & PMV_QUICKSTOP16)  /* motion estimation for B-frames */
1611                          goto PMVfast16_Terminate_without_Refine;  
1612                  if (MotionFlags & PMV_EARLYSTOP16)  static __inline VECTOR
1613                          goto PMVfast16_Terminate_with_Refine;  ChoosePred(const MACROBLOCK * const pMB, const uint32_t mode)
1614    {
1615    /* the stupidiest function ever */
1616            return (mode == MODE_FORWARD ? pMB->mvs[0] : pMB->b_mvs[0]);
1617          }          }
1618    
1619    static void __inline
1620    PreparePredictionsBF(VECTOR * const pmv, const int x, const int y,
1621                                                            const uint32_t iWcount,
1622                                                            const MACROBLOCK * const pMB,
1623                                                            const uint32_t mode_curr)
1624    {
1625    
1626  /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion          /* [0] is prediction */
1627     vector of the median.          pmv[0].x = EVEN(pmv[0].x); pmv[0].y = EVEN(pmv[0].y);
    If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2  
 */  
1628    
1629          if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[0])))          pmv[1].x = pmv[1].y = 0; /* [1] is zero */
                 iFound = 2;  
1630    
1631  /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.          pmv[2] = ChoosePred(pMB, mode_curr);
1632     Otherwise select large Diamond Search.          pmv[2].x = EVEN(pmv[2].x); pmv[2].y = EVEN(pmv[2].y);
1633  */  
1634            if ((y != 0)&&(x != (int)(iWcount+1))) {                        /* [3] top-right neighbour */
1635                    pmv[3] = ChoosePred(pMB+1-iWcount, mode_curr);
1636                    pmv[3].x = EVEN(pmv[3].x); pmv[3].y = EVEN(pmv[3].y);
1637            } else pmv[3].x = pmv[3].y = 0;
1638    
1639            if (y != 0) {
1640                    pmv[4] = ChoosePred(pMB-iWcount, mode_curr);
1641                    pmv[4].x = EVEN(pmv[4].x); pmv[4].y = EVEN(pmv[4].y);
1642            } else pmv[4].x = pmv[4].y = 0;
1643    
1644          if ((!MVzero(pmv[0])) || (threshB < 1536) || (bPredEq))          if (x != 0) {
1645                  iDiamondSize = 1;               // halfpel!                  pmv[5] = ChoosePred(pMB-1, mode_curr);
1646                    pmv[5].x = EVEN(pmv[5].x); pmv[5].y = EVEN(pmv[5].y);
1647            } else pmv[5].x = pmv[5].y = 0;
1648    
1649            if (x != 0 && y != 0) {
1650                    pmv[6] = ChoosePred(pMB-1-iWcount, mode_curr);
1651                    pmv[6].x = EVEN(pmv[6].x); pmv[6].y = EVEN(pmv[6].y);
1652            } else pmv[6].x = pmv[6].y = 0;
1653    }
1654    
1655    
1656    /* search backward or forward */
1657    static void
1658    SearchBF(       const IMAGE * const pRef,
1659                            const uint8_t * const pRefH,
1660                            const uint8_t * const pRefV,
1661                            const uint8_t * const pRefHV,
1662                            const IMAGE * const pCur,
1663                            const int x, const int y,
1664                            const uint32_t MotionFlags,
1665                            const uint32_t iFcode,
1666                            const MBParam * const pParam,
1667                            MACROBLOCK * const pMB,
1668                            const VECTOR * const predMV,
1669                            int32_t * const best_sad,
1670                            const int32_t mode_current,
1671                            SearchData * const Data)
1672    {
1673    
1674            int i, mask;
1675            VECTOR pmv[7];
1676            MainSearchFunc *MainSearchPtr;
1677            *Data->iMinSAD = MV_MAX_ERROR;
1678            Data->iFcode = iFcode;
1679            Data->qpel_precision = 0;
1680            Data->temp[5] = Data->temp[6] = Data->temp[7] = 256*4096; /* reset chroma-sad cache */
1681    
1682            Data->RefP[0] = pRef->y + (x + Data->iEdgedWidth*y) * 16;
1683            Data->RefP[2] = pRefH + (x + Data->iEdgedWidth*y) * 16;
1684            Data->RefP[1] = pRefV + (x + Data->iEdgedWidth*y) * 16;
1685            Data->RefP[3] = pRefHV + (x + Data->iEdgedWidth*y) * 16;
1686            Data->RefP[4] = pRef->u + (x + y * (Data->iEdgedWidth/2)) * 8;
1687            Data->RefP[5] = pRef->v + (x + y * (Data->iEdgedWidth/2)) * 8;
1688    
1689            Data->predMV = *predMV;
1690    
1691            get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
1692                                    pParam->width, pParam->height, iFcode - Data->qpel, 1, 0);
1693    
1694            pmv[0] = Data->predMV;
1695            if (Data->qpel) { pmv[0].x /= 2; pmv[0].y /= 2; }
1696    
1697            PreparePredictionsBF(pmv, x, y, pParam->mb_width, pMB, mode_current);
1698    
1699            Data->currentMV->x = Data->currentMV->y = 0;
1700    
1701            /* main loop. checking all predictions */
1702            for (i = 0; i < 7; i++)
1703                    if (!vector_repeats(pmv, i) )
1704                            CheckCandidate16no4v(pmv[i].x, pmv[i].y, Data, i);
1705    
1706            if (MotionFlags & XVID_ME_USESQUARES16) MainSearchPtr = SquareSearch;
1707            else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1708                    else MainSearchPtr = DiamondSearch;
1709    
1710            mask = make_mask(pmv, 7, *Data->dir);
1711    
1712            MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, mask, CheckCandidate16no4v);
1713    
1714            SubpelRefine(Data, CheckCandidate16no4v);
1715    
1716            if (Data->qpel && *Data->iMinSAD < *best_sad + 300) {
1717                    Data->currentQMV->x = 2*Data->currentMV->x;
1718                    Data->currentQMV->y = 2*Data->currentMV->y;
1719                    Data->qpel_precision = 1;
1720                    get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
1721                                            pParam->width, pParam->height, iFcode, 2, 0);
1722                    SubpelRefine(Data, CheckCandidate16no4v);
1723            }
1724    
1725            /* three bits are needed to code backward mode. four for forward */
1726    
1727            if (mode_current == MODE_FORWARD) *Data->iMinSAD += 4 * Data->lambda16;
1728            else *Data->iMinSAD += 3 * Data->lambda16;
1729    
1730            if (*Data->iMinSAD < *best_sad) {
1731                    *best_sad = *Data->iMinSAD;
1732                    pMB->mode = mode_current;
1733                    if (Data->qpel) {
1734                            pMB->pmvs[0].x = Data->currentQMV->x - predMV->x;
1735                            pMB->pmvs[0].y = Data->currentQMV->y - predMV->y;
1736                            if (mode_current == MODE_FORWARD)
1737                                    pMB->qmvs[0] = *Data->currentQMV;
1738          else          else
1739                  iDiamondSize = 2;               // halfpel!                                  pMB->b_qmvs[0] = *Data->currentQMV;
1740                    } else {
1741                            pMB->pmvs[0].x = Data->currentMV->x - predMV->x;
1742                            pMB->pmvs[0].y = Data->currentMV->y - predMV->y;
1743                    }
1744                    if (mode_current == MODE_FORWARD) pMB->mvs[0] = *Data->currentMV;
1745                    else pMB->b_mvs[0] = *Data->currentMV;
1746            }
1747    
1748          if (!(MotionFlags & PMV_HALFPELDIAMOND16))          if (mode_current == MODE_FORWARD) *(Data->currentMV+2) = *Data->currentMV;
1749                  iDiamondSize *= 2;          else *(Data->currentMV+1) = *Data->currentMV; /* we store currmv for interpolate search */
1750    }
1751    
1752    static void
1753    SkipDecisionB(const IMAGE * const pCur,
1754                                    const IMAGE * const f_Ref,
1755                                    const IMAGE * const b_Ref,
1756                                    MACROBLOCK * const pMB,
1757                                    const uint32_t x, const uint32_t y,
1758                                    const SearchData * const Data)
1759    {
1760            int dx = 0, dy = 0, b_dx = 0, b_dy = 0;
1761            int32_t sum;
1762            const int div = 1 + Data->qpel;
1763            int k;
1764            const uint32_t stride = Data->iEdgedWidth/2;
1765            /* this is not full chroma compensation, only it's fullpel approximation. should work though */
1766    
1767            for (k = 0; k < 4; k++) {
1768                    dy += Data->directmvF[k].y / div;
1769                    dx += Data->directmvF[k].x / div;
1770                    b_dy += Data->directmvB[k].y / div;
1771                    b_dx += Data->directmvB[k].x / div;
1772            }
1773    
1774            dy = (dy >> 3) + roundtab_76[dy & 0xf];
1775            dx = (dx >> 3) + roundtab_76[dx & 0xf];
1776            b_dy = (b_dy >> 3) + roundtab_76[b_dy & 0xf];
1777            b_dx = (b_dx >> 3) + roundtab_76[b_dx & 0xf];
1778    
1779            sum = sad8bi(pCur->u + 8 * x + 8 * y * stride,
1780                                            f_Ref->u + (y*8 + dy/2) * stride + x*8 + dx/2,
1781                                            b_Ref->u + (y*8 + b_dy/2) * stride + x*8 + b_dx/2,
1782                                            stride);
1783    
1784            if (sum >= MAX_CHROMA_SAD_FOR_SKIP * pMB->quant) return; /* no skip */
1785    
1786            sum += sad8bi(pCur->v + 8*x + 8 * y * stride,
1787                                            f_Ref->v + (y*8 + dy/2) * stride + x*8 + dx/2,
1788                                            b_Ref->v + (y*8 + b_dy/2) * stride + x*8 + b_dx/2,
1789                                            stride);
1790    
1791            if (sum < MAX_CHROMA_SAD_FOR_SKIP * pMB->quant) {
1792                    pMB->mode = MODE_DIRECT_NONE_MV; /* skipped */
1793                    for (k = 0; k < 4; k++) {
1794                            pMB->qmvs[k] = pMB->mvs[k];
1795                            pMB->b_qmvs[k] = pMB->b_mvs[k];
1796                    }
1797            }
1798    }
1799    
1800    static __inline uint32_t
1801    SearchDirect(const IMAGE * const f_Ref,
1802                                    const uint8_t * const f_RefH,
1803                                    const uint8_t * const f_RefV,
1804                                    const uint8_t * const f_RefHV,
1805                                    const IMAGE * const b_Ref,
1806                                    const uint8_t * const b_RefH,
1807                                    const uint8_t * const b_RefV,
1808                                    const uint8_t * const b_RefHV,
1809                                    const IMAGE * const pCur,
1810                                    const int x, const int y,
1811                                    const uint32_t MotionFlags,
1812                                    const int32_t TRB, const int32_t TRD,
1813                                    const MBParam * const pParam,
1814                                    MACROBLOCK * const pMB,
1815                                    const MACROBLOCK * const b_mb,
1816                                    int32_t * const best_sad,
1817                                    SearchData * const Data)
1818    
1819    {
1820            int32_t skip_sad;
1821            int k = (x + Data->iEdgedWidth*y) * 16;
1822            MainSearchFunc *MainSearchPtr;
1823            CheckFunc * CheckCandidate;
1824    
1825            *Data->iMinSAD = 256*4096;
1826            Data->RefP[0] = f_Ref->y + k;
1827            Data->RefP[2] = f_RefH + k;
1828            Data->RefP[1] = f_RefV + k;
1829            Data->RefP[3] = f_RefHV + k;
1830            Data->b_RefP[0] = b_Ref->y + k;
1831            Data->b_RefP[2] = b_RefH + k;
1832            Data->b_RefP[1] = b_RefV + k;
1833            Data->b_RefP[3] = b_RefHV + k;
1834            Data->RefP[4] = f_Ref->u + (x + (Data->iEdgedWidth/2) * y) * 8;
1835            Data->RefP[5] = f_Ref->v + (x + (Data->iEdgedWidth/2) * y) * 8;
1836            Data->b_RefP[4] = b_Ref->u + (x + (Data->iEdgedWidth/2) * y) * 8;
1837            Data->b_RefP[5] = b_Ref->v + (x + (Data->iEdgedWidth/2) * y) * 8;
1838    
1839            k = Data->qpel ? 4 : 2;
1840            Data->max_dx = k * (pParam->width - x * 16);
1841            Data->max_dy = k * (pParam->height - y * 16);
1842            Data->min_dx = -k * (16 + x * 16);
1843            Data->min_dy = -k * (16 + y * 16);
1844    
1845            Data->referencemv = Data->qpel ? b_mb->qmvs : b_mb->mvs;
1846            Data->qpel_precision = 0;
1847    
1848            for (k = 0; k < 4; k++) {
1849                    pMB->mvs[k].x = Data->directmvF[k].x = ((TRB * Data->referencemv[k].x) / TRD);
1850                    pMB->b_mvs[k].x = Data->directmvB[k].x = ((TRB - TRD) * Data->referencemv[k].x) / TRD;
1851                    pMB->mvs[k].y = Data->directmvF[k].y = ((TRB * Data->referencemv[k].y) / TRD);
1852                    pMB->b_mvs[k].y = Data->directmvB[k].y = ((TRB - TRD) * Data->referencemv[k].y) / TRD;
1853    
1854                    if ( (pMB->b_mvs[k].x > Data->max_dx) | (pMB->b_mvs[k].x < Data->min_dx)
1855                            | (pMB->b_mvs[k].y > Data->max_dy) | (pMB->b_mvs[k].y < Data->min_dy) ) {
1856    
1857                            *best_sad = 256*4096; /* in that case, we won't use direct mode */
1858                            pMB->mode = MODE_DIRECT; /* just to make sure it doesn't say "MODE_DIRECT_NONE_MV" */
1859                            pMB->b_mvs[0].x = pMB->b_mvs[0].y = 0;
1860                            return 256*4096;
1861                    }
1862                    if (b_mb->mode != MODE_INTER4V) {
1863                            pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->mvs[0];
1864                            pMB->b_mvs[1] = pMB->b_mvs[2] = pMB->b_mvs[3] = pMB->b_mvs[0];
1865                            Data->directmvF[1] = Data->directmvF[2] = Data->directmvF[3] = Data->directmvF[0];
1866                            Data->directmvB[1] = Data->directmvB[2] = Data->directmvB[3] = Data->directmvB[0];
1867                            break;
1868                    }
1869            }
1870    
1871            CheckCandidate = b_mb->mode == MODE_INTER4V ? CheckCandidateDirect : CheckCandidateDirectno4v;
1872    
1873            CheckCandidate(0, 0, Data, 255);
1874    
1875            /* initial (fast) skip decision */
1876            if (*Data->iMinSAD < pMB->quant * INITIAL_SKIP_THRESH * (Data->chroma?3:2)) {
1877                    /* possible skip */
1878                    if (Data->chroma) {
1879                            pMB->mode = MODE_DIRECT_NONE_MV;
1880                            return *Data->iMinSAD; /* skip. */
1881                    } else {
1882                            SkipDecisionB(pCur, f_Ref, b_Ref, pMB, x, y, Data);
1883                            if (pMB->mode == MODE_DIRECT_NONE_MV) return *Data->iMinSAD; /* skip. */
1884                    }
1885            }
1886    
1887            *Data->iMinSAD += Data->lambda16;
1888            skip_sad = *Data->iMinSAD;
1889    
1890  /*  /*
1891     Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.           * DIRECT MODE DELTA VECTOR SEARCH.
1892     Also calculate (0,0) but do not subtract offset.           * This has to be made more effective, but at the moment I'm happy it's running at all
    Let MinSAD be the smallest SAD up to this point.  
    If MV is (0,0) subtract offset.  
1893  */  */
1894    
1895  // (0,0) is always possible          if (MotionFlags & XVID_ME_USESQUARES16) MainSearchPtr = SquareSearch;
1896                    else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1897                            else MainSearchPtr = DiamondSearch;
1898    
1899            MainSearchPtr(0, 0, Data, 255, CheckCandidate);
1900    
1901            SubpelRefine(Data, CheckCandidate);
1902    
1903            *best_sad = *Data->iMinSAD;
1904    
1905            if (Data->qpel || b_mb->mode == MODE_INTER4V) pMB->mode = MODE_DIRECT;
1906            else pMB->mode = MODE_DIRECT_NO4V; /* for faster compensation */
1907    
1908            pMB->pmvs[3] = *Data->currentMV;
1909    
1910            for (k = 0; k < 4; k++) {
1911                    pMB->mvs[k].x = Data->directmvF[k].x + Data->currentMV->x;
1912                    pMB->b_mvs[k].x = (     (Data->currentMV->x == 0)
1913                                                            ? Data->directmvB[k].x
1914                                                            :pMB->mvs[k].x - Data->referencemv[k].x);
1915                    pMB->mvs[k].y = (Data->directmvF[k].y + Data->currentMV->y);
1916                    pMB->b_mvs[k].y = ((Data->currentMV->y == 0)
1917                                                            ? Data->directmvB[k].y
1918                                                            : pMB->mvs[k].y - Data->referencemv[k].y);
1919                    if (Data->qpel) {
1920                            pMB->qmvs[k].x = pMB->mvs[k].x; pMB->mvs[k].x /= 2;
1921                            pMB->b_qmvs[k].x = pMB->b_mvs[k].x; pMB->b_mvs[k].x /= 2;
1922                            pMB->qmvs[k].y = pMB->mvs[k].y; pMB->mvs[k].y /= 2;
1923                            pMB->b_qmvs[k].y = pMB->b_mvs[k].y; pMB->b_mvs[k].y /= 2;
1924                    }
1925    
1926                    if (b_mb->mode != MODE_INTER4V) {
1927                            pMB->mvs[3] = pMB->mvs[2] = pMB->mvs[1] = pMB->mvs[0];
1928                            pMB->b_mvs[3] = pMB->b_mvs[2] = pMB->b_mvs[1] = pMB->b_mvs[0];
1929                            pMB->qmvs[3] = pMB->qmvs[2] = pMB->qmvs[1] = pMB->qmvs[0];
1930                            pMB->b_qmvs[3] = pMB->b_qmvs[2] = pMB->b_qmvs[1] = pMB->b_qmvs[0];
1931                            break;
1932                    }
1933            }
1934            return skip_sad;
1935    }
1936    
1937    static void
1938    SearchInterpolate(const IMAGE * const f_Ref,
1939                                    const uint8_t * const f_RefH,
1940                                    const uint8_t * const f_RefV,
1941                                    const uint8_t * const f_RefHV,
1942                                    const IMAGE * const b_Ref,
1943                                    const uint8_t * const b_RefH,
1944                                    const uint8_t * const b_RefV,
1945                                    const uint8_t * const b_RefHV,
1946                                    const IMAGE * const pCur,
1947                                    const int x, const int y,
1948                                    const uint32_t fcode,
1949                                    const uint32_t bcode,
1950                                    const uint32_t MotionFlags,
1951                                    const MBParam * const pParam,
1952                                    const VECTOR * const f_predMV,
1953                                    const VECTOR * const b_predMV,
1954                                    MACROBLOCK * const pMB,
1955                                    int32_t * const best_sad,
1956                                    SearchData * const fData)
1957    
1958    {
1959    
1960            int i, j;
1961            SearchData bData;
1962    
1963            fData->qpel_precision = 0;
1964            memcpy(&bData, fData, sizeof(SearchData)); /* quick copy of common data */
1965            *fData->iMinSAD = 4096*256;
1966            bData.currentMV++; bData.currentQMV++;
1967            fData->iFcode = bData.bFcode = fcode; fData->bFcode = bData.iFcode = bcode;
1968    
1969            i = (x + y * fData->iEdgedWidth) * 16;
1970    
1971            bData.b_RefP[0] = fData->RefP[0] = f_Ref->y + i;
1972            bData.b_RefP[2] = fData->RefP[2] = f_RefH + i;
1973            bData.b_RefP[1] = fData->RefP[1] = f_RefV + i;
1974            bData.b_RefP[3] = fData->RefP[3] = f_RefHV + i;
1975            bData.RefP[0] = fData->b_RefP[0] = b_Ref->y + i;
1976            bData.RefP[2] = fData->b_RefP[2] = b_RefH + i;
1977            bData.RefP[1] = fData->b_RefP[1] = b_RefV + i;
1978            bData.RefP[3] = fData->b_RefP[3] = b_RefHV + i;
1979            bData.b_RefP[4] = fData->RefP[4] = f_Ref->u + (x + (fData->iEdgedWidth/2) * y) * 8;
1980            bData.b_RefP[5] = fData->RefP[5] = f_Ref->v + (x + (fData->iEdgedWidth/2) * y) * 8;
1981            bData.RefP[4] = fData->b_RefP[4] = b_Ref->u + (x + (fData->iEdgedWidth/2) * y) * 8;
1982            bData.RefP[5] = fData->b_RefP[5] = b_Ref->v + (x + (fData->iEdgedWidth/2) * y) * 8;
1983            bData.dir = fData->dir;
1984    
1985            bData.bpredMV = fData->predMV = *f_predMV;
1986            fData->bpredMV = bData.predMV = *b_predMV;
1987            fData->currentMV[0] = fData->currentMV[2];
1988    
1989            get_range(&fData->min_dx, &fData->max_dx, &fData->min_dy, &fData->max_dy, x, y, 4, pParam->width, pParam->height, fcode - fData->qpel, 1, 0);
1990            get_range(&bData.min_dx, &bData.max_dx, &bData.min_dy, &bData.max_dy, x, y, 4, pParam->width, pParam->height, bcode - fData->qpel, 1, 0);
1991    
1992            if (fData->currentMV[0].x > fData->max_dx) fData->currentMV[0].x = fData->max_dx;
1993            if (fData->currentMV[0].x < fData->min_dx) fData->currentMV[0].x = fData->min_dx;
1994            if (fData->currentMV[0].y > fData->max_dy) fData->currentMV[0].y = fData->max_dy;
1995            if (fData->currentMV[0].y < fData->min_dy) fData->currentMV[0].y = fData->min_dy;
1996    
1997            if (fData->currentMV[1].x > bData.max_dx) fData->currentMV[1].x = bData.max_dx;
1998            if (fData->currentMV[1].x < bData.min_dx) fData->currentMV[1].x = bData.min_dx;
1999            if (fData->currentMV[1].y > bData.max_dy) fData->currentMV[1].y = bData.max_dy;
2000            if (fData->currentMV[1].y < bData.min_dy) fData->currentMV[1].y = bData.min_dy;
2001    
2002            CheckCandidateInt(fData->currentMV[0].x, fData->currentMV[0].y, fData, 255);
2003    
2004            /* diamond */
2005            do {
2006                    *fData->dir = 255;
2007                    /* forward MV moves */
2008                    i = fData->currentMV[0].x; j = fData->currentMV[0].y;
2009    
2010                    CheckCandidateInt(i + 1, j, fData, 0);
2011                    CheckCandidateInt(i, j + 1, fData, 0);
2012                    CheckCandidateInt(i - 1, j, fData, 0);
2013                    CheckCandidateInt(i, j - 1, fData, 0);
2014    
2015                    /* backward MV moves */
2016                    i = fData->currentMV[1].x; j = fData->currentMV[1].y;
2017                    fData->currentMV[2] = fData->currentMV[0];
2018                    CheckCandidateInt(i + 1, j, &bData, 0);
2019                    CheckCandidateInt(i, j + 1, &bData, 0);
2020                    CheckCandidateInt(i - 1, j, &bData, 0);
2021                    CheckCandidateInt(i, j - 1, &bData, 0);
2022    
2023            } while (!(*fData->dir));
2024    
2025            /* qpel refinement */
2026            if (fData->qpel) {
2027                    if (*fData->iMinSAD > *best_sad + 500) return;
2028                    fData->qpel_precision = bData.qpel_precision = 1;
2029                    get_range(&fData->min_dx, &fData->max_dx, &fData->min_dy, &fData->max_dy, x, y, 4, pParam->width, pParam->height, fcode, 2, 0);
2030                    get_range(&bData.min_dx, &bData.max_dx, &bData.min_dy, &bData.max_dy, x, y, 4, pParam->width, pParam->height, bcode, 2, 0);
2031                    fData->currentQMV[2].x = fData->currentQMV[0].x = 2 * fData->currentMV[0].x;
2032                    fData->currentQMV[2].y = fData->currentQMV[0].y = 2 * fData->currentMV[0].y;
2033                    fData->currentQMV[1].x = 2 * fData->currentMV[1].x;
2034                    fData->currentQMV[1].y = 2 * fData->currentMV[1].y;
2035                    SubpelRefine(fData, CheckCandidateInt);
2036                    if (*fData->iMinSAD > *best_sad + 300) return;
2037                    fData->currentQMV[2] = fData->currentQMV[0];
2038                    SubpelRefine(&bData, CheckCandidateInt);
2039            }
2040    
2041            *fData->iMinSAD += (2+3) * fData->lambda16; /* two bits are needed to code interpolate mode. */
2042    
2043            if (*fData->iMinSAD < *best_sad) {
2044                    *best_sad = *fData->iMinSAD;
2045                    pMB->mvs[0] = fData->currentMV[0];
2046                    pMB->b_mvs[0] = fData->currentMV[1];
2047                    pMB->mode = MODE_INTERPOLATE;
2048                    if (fData->qpel) {
2049                            pMB->qmvs[0] = fData->currentQMV[0];
2050                            pMB->b_qmvs[0] = fData->currentQMV[1];
2051                            pMB->pmvs[1].x = pMB->qmvs[0].x - f_predMV->x;
2052                            pMB->pmvs[1].y = pMB->qmvs[0].y - f_predMV->y;
2053                            pMB->pmvs[0].x = pMB->b_qmvs[0].x - b_predMV->x;
2054                            pMB->pmvs[0].y = pMB->b_qmvs[0].y - b_predMV->y;
2055                    } else {
2056                            pMB->pmvs[1].x = pMB->mvs[0].x - f_predMV->x;
2057                            pMB->pmvs[1].y = pMB->mvs[0].y - f_predMV->y;
2058                            pMB->pmvs[0].x = pMB->b_mvs[0].x - b_predMV->x;
2059                            pMB->pmvs[0].y = pMB->b_mvs[0].y - b_predMV->y;
2060                    }
2061            }
2062    }
2063    
2064    void
2065    MotionEstimationBVOP(MBParam * const pParam,
2066                                             FRAMEINFO * const frame,
2067                                             const int32_t time_bp,
2068                                             const int32_t time_pp,
2069                                             /* forward (past) reference */
2070                                             const MACROBLOCK * const f_mbs,
2071                                             const IMAGE * const f_ref,
2072                                             const IMAGE * const f_refH,
2073                                             const IMAGE * const f_refV,
2074                                             const IMAGE * const f_refHV,
2075                                             /* backward (future) reference */
2076                                             const FRAMEINFO * const b_reference,
2077                                             const IMAGE * const b_ref,
2078                                             const IMAGE * const b_refH,
2079                                             const IMAGE * const b_refV,
2080                                             const IMAGE * const b_refHV)
2081    {
2082            uint32_t i, j;
2083            int32_t best_sad;
2084            uint32_t skip_sad;
2085            int f_count = 0, b_count = 0, i_count = 0, d_count = 0, n_count = 0;
2086            const MACROBLOCK * const b_mbs = b_reference->mbs;
2087    
2088            VECTOR f_predMV, b_predMV;      /* there is no prediction for direct mode*/
2089    
2090            const int32_t TRB = time_pp - time_bp;
2091            const int32_t TRD = time_pp;
2092    
2093            /* some pre-inintialized data for the rest of the search */
2094    
2095            SearchData Data;
2096            int32_t iMinSAD;
2097            uint32_t dir;
2098            VECTOR currentMV[3];
2099            VECTOR currentQMV[3];
2100            int32_t temp[8];
2101            memset(&Data, 0, sizeof(SearchData));
2102            Data.iEdgedWidth = pParam->edged_width;
2103            Data.currentMV = currentMV; Data.currentQMV = currentQMV;
2104            Data.iMinSAD = &iMinSAD;
2105            Data.lambda16 = lambda_vec16[frame->quant];
2106            Data.qpel = pParam->vol_flags & XVID_VOL_QUARTERPEL ? 1 : 0;
2107            Data.rounding = 0;
2108            Data.chroma = frame->motion_flags & XVID_ME_CHROMA_BVOP;
2109            Data.temp = temp;
2110            Data.dir = &dir;
2111    
2112            Data.RefQ = f_refV->u; /* a good place, also used in MC (for similar purpose) */
2113    
2114            /* note: i==horizontal, j==vertical */
2115            for (j = 0; j < pParam->mb_height; j++) {
2116    
2117                    f_predMV = b_predMV = zeroMV;   /* prediction is reset at left boundary */
2118    
2119                    for (i = 0; i < pParam->mb_width; i++) {
2120                            MACROBLOCK * const pMB = frame->mbs + i + j * pParam->mb_width;
2121                            const MACROBLOCK * const b_mb = b_mbs + i + j * pParam->mb_width;
2122    
2123    /* special case, if collocated block is SKIPed in P-VOP: encoding is forward (0,0), cpb=0 without further ado */
2124                            if (b_reference->coding_type != S_VOP)
2125                                    if (b_mb->mode == MODE_NOT_CODED) {
2126                                            pMB->mode = MODE_NOT_CODED;
2127                                            continue;
2128                                    }
2129    
2130                            Data.Cur = frame->image.y + (j * Data.iEdgedWidth + i) * 16;
2131                            Data.CurU = frame->image.u + (j * Data.iEdgedWidth/2 + i) * 8;
2132                            Data.CurV = frame->image.v + (j * Data.iEdgedWidth/2 + i) * 8;
2133                            pMB->quant = frame->quant;
2134    
2135    /* direct search comes first, because it (1) checks for SKIP-mode
2136            and (2) sets very good predictions for forward and backward search */
2137                            skip_sad = SearchDirect(f_ref, f_refH->y, f_refV->y, f_refHV->y,
2138                                                                            b_ref, b_refH->y, b_refV->y, b_refHV->y,
2139                                                                            &frame->image,
2140                                                                            i, j,
2141                                                                            frame->motion_flags,
2142                                                                            TRB, TRD,
2143                                                                            pParam,
2144                                                                            pMB, b_mb,
2145                                                                            &best_sad,
2146                                                                            &Data);
2147    
2148                            if (pMB->mode == MODE_DIRECT_NONE_MV) { n_count++; continue; }
2149    
2150                            /* forward search */
2151                            SearchBF(f_ref, f_refH->y, f_refV->y, f_refHV->y,
2152                                                    &frame->image, i, j,
2153                                                    frame->motion_flags,
2154                                                    frame->fcode, pParam,
2155                                                    pMB, &f_predMV, &best_sad,
2156                                                    MODE_FORWARD, &Data);
2157    
2158                            /* backward search */
2159                            SearchBF(b_ref, b_refH->y, b_refV->y, b_refHV->y,
2160                                                    &frame->image, i, j,
2161                                                    frame->motion_flags,
2162                                                    frame->bcode, pParam,
2163                                                    pMB, &b_predMV, &best_sad,
2164                                                    MODE_BACKWARD, &Data);
2165    
2166                            /* interpolate search comes last, because it uses data from forward and backward as prediction */
2167                            SearchInterpolate(f_ref, f_refH->y, f_refV->y, f_refHV->y,
2168                                                    b_ref, b_refH->y, b_refV->y, b_refHV->y,
2169                                                    &frame->image,
2170                                                    i, j,
2171                                                    frame->fcode, frame->bcode,
2172                                                    frame->motion_flags,
2173                                                    pParam,
2174                                                    &f_predMV, &b_predMV,
2175                                                    pMB, &best_sad,
2176                                                    &Data);
2177    
2178                            /* final skip decision */
2179                            if ( (skip_sad < frame->quant * MAX_SAD00_FOR_SKIP * 2)
2180                                            && ((100*best_sad)/(skip_sad+1) > FINAL_SKIP_THRESH) )
2181                                    SkipDecisionB(&frame->image, f_ref, b_ref, pMB, i, j, &Data);
2182    
2183                            switch (pMB->mode) {
2184                                    case MODE_FORWARD:
2185                                            f_count++;
2186                                            f_predMV = Data.qpel ? pMB->qmvs[0] : pMB->mvs[0];
2187                                            break;
2188                                    case MODE_BACKWARD:
2189                                            b_count++;
2190                                            b_predMV = Data.qpel ? pMB->b_qmvs[0] : pMB->b_mvs[0];
2191                                            break;
2192                                    case MODE_INTERPOLATE:
2193                                            i_count++;
2194                                            f_predMV = Data.qpel ? pMB->qmvs[0] : pMB->mvs[0];
2195                                            b_predMV = Data.qpel ? pMB->b_qmvs[0] : pMB->b_mvs[0];
2196                                            break;
2197                                    case MODE_DIRECT:
2198                                    case MODE_DIRECT_NO4V:
2199                                            d_count++;
2200                                    default:
2201                                            break;
2202                            }
2203                    }
2204            }
2205    }
2206    
2207    static __inline void
2208    MEanalyzeMB (   const uint8_t * const pRef,
2209                                    const uint8_t * const pCur,
2210                                    const int x,
2211                                    const int y,
2212                                    const MBParam * const pParam,
2213                                    MACROBLOCK * const pMBs,
2214                                    SearchData * const Data)
2215    {
2216    
2217            int i;
2218            VECTOR pmv[3];
2219            MACROBLOCK * const pMB = &pMBs[x + y * pParam->mb_width];
2220    
2221            for (i = 0; i < 5; i++) Data->iMinSAD[i] = MV_MAX_ERROR;
2222    
2223            /* median is only used as prediction. it doesn't have to be real */
2224            if (x == 1 && y == 1) Data->predMV.x = Data->predMV.y = 0;
2225            else
2226                    if (x == 1) /* left macroblock does not have any vector now */
2227                            Data->predMV = (pMB - pParam->mb_width)->mvs[0]; /* top instead of median */
2228                    else if (y == 1) /* top macroblock doesn't have it's vector */
2229                            Data->predMV = (pMB - 1)->mvs[0]; /* left instead of median */
2230                            else Data->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0); /* else median */
2231    
2232          if (!MVzero(pmv[0]))          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
2233                  CHECK_MV16_ZERO;                          pParam->width, pParam->height, Data->iFcode - Data->qpel, 1, 0);
2234    
2235  // previous frame MV is always possible          Data->Cur = pCur + (x + y * pParam->edged_width) * 16;
2236            Data->RefP[0] = pRef + (x + y * pParam->edged_width) * 16;
2237    
2238          if (!MVzero(prevMB->mvs[0]))          pmv[1].x = EVEN(pMB->mvs[0].x);
2239                  if (!MVequal(prevMB->mvs[0], pmv[0]))          pmv[1].y = EVEN(pMB->mvs[0].y);
2240                          CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);          pmv[2].x = EVEN(Data->predMV.x);
2241            pmv[2].y = EVEN(Data->predMV.y);
2242            pmv[0].x = pmv[0].y = 0;
2243    
2244  // left neighbour, if allowed          CheckCandidate32I(0, 0, Data, 0);
2245    
2246          if (!MVzero(pmv[1]))          if (*Data->iMinSAD > 4 * MAX_SAD00_FOR_SKIP) {
                 if (!MVequal(pmv[1], prevMB->mvs[0]))  
                         if (!MVequal(pmv[1], pmv[0])) {  
                                 if (!(MotionFlags & PMV_HALFPEL16)) {  
                                         pmv[1].x = EVEN(pmv[1].x);  
                                         pmv[1].y = EVEN(pmv[1].y);  
                                 }  
2247    
2248                                  CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);                  if (!vector_repeats(pmv, 1))
2249                            CheckCandidate32I(pmv[1].x, pmv[1].y, Data, 1);
2250                    if (!vector_repeats(pmv, 2))
2251                            CheckCandidate32I(pmv[2].x, pmv[2].y, Data, 2);
2252    
2253                    if (*Data->iMinSAD > 4 * MAX_SAD00_FOR_SKIP) { /* diamond only if needed */
2254                            unsigned int mask = make_mask(pmv, 3, *Data->dir);
2255                            DiamondSearch(Data->currentMV->x, Data->currentMV->y, Data, 255/*mask*/, CheckCandidate32I);
2256                          }                          }
 // top neighbour, if allowed  
         if (!MVzero(pmv[2]))  
                 if (!MVequal(pmv[2], prevMB->mvs[0]))  
                         if (!MVequal(pmv[2], pmv[0]))  
                                 if (!MVequal(pmv[2], pmv[1])) {  
                                         if (!(MotionFlags & PMV_HALFPEL16)) {  
                                                 pmv[2].x = EVEN(pmv[2].x);  
                                                 pmv[2].y = EVEN(pmv[2].y);  
2257                                          }                                          }
                                         CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);  
2258    
2259  // top right neighbour, if allowed          for (i = 0; i < 4; i++) {
2260                                          if (!MVzero(pmv[3]))                  MACROBLOCK * MB = &pMBs[x + (i&1) + (y+(i>>1)) * pParam->mb_width];
2261                                                  if (!MVequal(pmv[3], prevMB->mvs[0]))                  MB->mvs[0] = MB->mvs[1] = MB->mvs[2] = MB->mvs[3] = Data->currentMV[i];
2262                                                          if (!MVequal(pmv[3], pmv[0]))                  MB->mode = MODE_INTER;
2263                                                                  if (!MVequal(pmv[3], pmv[1]))                  MB->sad16 = Data->iMinSAD[i+1];
                                                                         if (!MVequal(pmv[3], pmv[2])) {  
                                                                                 if (!(MotionFlags & PMV_HALFPEL16)) {  
                                                                                         pmv[3].x = EVEN(pmv[3].x);  
                                                                                         pmv[3].y = EVEN(pmv[3].y);  
                                                                                 }  
                                                                                 CHECK_MV16_CANDIDATE(pmv[3].x,  
                                                                                                                          pmv[3].y);  
2264                                                                          }                                                                          }
2265                                  }                                  }
2266    
2267          if ((MVzero(*currMV)) &&  #define INTRA_THRESH    2200
2268                  (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )  #define INTER_THRESH    50
2269                  iMinSAD -= MV16_00_BIAS;  #define INTRA_THRESH2   95
2270    
2271    int
2272  /* Step 6: If MinSAD <= thresa goto Step 10.  MEanalysis(     const IMAGE * const pRef,
2273     If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.                          const FRAMEINFO * const Current,
2274  */                          const MBParam * const pParam,
2275                            const int maxIntra, //maximum number if non-I frames
2276          if ((iMinSAD <= threshA) ||                          const int intraCount, //number of non-I frames after last I frame; 0 if we force P/B frame
2277                  (MVequal(*currMV, prevMB->mvs[0]) &&                          const int bCount, // number of B frames in a row
2278                   ((uint32_t) iMinSAD < prevMB->sad16))) {                          const int b_thresh)
2279                  if (MotionFlags & PMV_QUICKSTOP16)  {
2280                          goto PMVfast16_Terminate_without_Refine;          uint32_t x, y, intra = 0;
2281                  if (MotionFlags & PMV_EARLYSTOP16)          int sSAD = 0;
2282                          goto PMVfast16_Terminate_with_Refine;          MACROBLOCK * const pMBs = Current->mbs;
2283            const IMAGE * const pCurrent = &Current->image;
2284            int IntraThresh = INTRA_THRESH, InterThresh = INTER_THRESH + b_thresh;
2285            int blocks = 0;
2286            int complexity = 0;
2287    
2288            int32_t iMinSAD[5], temp[5];
2289            uint32_t dir;
2290            VECTOR currentMV[5];
2291            SearchData Data;
2292            Data.iEdgedWidth = pParam->edged_width;
2293            Data.currentMV = currentMV;
2294            Data.iMinSAD = iMinSAD;
2295            Data.iFcode = Current->fcode;
2296            Data.temp = temp;
2297            Data.dir = &dir;
2298            Data.qpel = (pParam->vol_flags & XVID_VOL_QUARTERPEL)? 1: 0;
2299    
2300            if (intraCount != 0) {
2301                    if (intraCount < 10) // we're right after an I frame
2302                            IntraThresh += 15* (intraCount - 10) * (intraCount - 10);
2303                    else
2304                            if ( 5*(maxIntra - intraCount) < maxIntra) // we're close to maximum. 2 sec when max is 10 sec
2305                                    IntraThresh -= (IntraThresh * (maxIntra - 8*(maxIntra - intraCount)))/maxIntra;
2306          }          }
2307    
2308            InterThresh -= 12 * bCount;
2309            if (InterThresh < 15 + b_thresh) InterThresh = 15 + b_thresh;
2310    
2311  /************ (Diamond Search)  **************/          if (sadInit) (*sadInit) ();
 /*  
    Step 7: Perform Diamond search, with either the small or large diamond.  
    If Found=2 only examine one Diamond pattern, and afterwards goto step 10  
    Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.  
    If center then goto step 10.  
    Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.  
    Refine by using small diamond and goto step 10.  
 */  
   
         if (MotionFlags & PMV_USESQUARES16)  
                 MainSearchPtr = Square16_MainSearch;  
         else if (MotionFlags & PMV_ADVANCEDDIAMOND16)  
                 MainSearchPtr = AdvDiamond16_MainSearch;  
         else  
                 MainSearchPtr = Diamond16_MainSearch;  
   
         backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */  
2312    
2313  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */          for (y = 1; y < pParam->mb_height-1; y += 2) {
2314          iSAD =                  for (x = 1; x < pParam->mb_width-1; x += 2) {
2315                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,                          int i;
2316                                                    currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,                          blocks += 10;
                                                   min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                   iQuant, iFound);  
2317    
2318          if (iSAD < iMinSAD) {                          if (bCount == 0) pMBs[x + y * pParam->mb_width].mvs[0] = zeroMV;
2319                  *currMV = newMV;                          else { //extrapolation of the vector found for last frame
2320                  iMinSAD = iSAD;                                  pMBs[x + y * pParam->mb_width].mvs[0].x =
2321                                            (pMBs[x + y * pParam->mb_width].mvs[0].x * (bCount+1) ) / bCount;
2322                                    pMBs[x + y * pParam->mb_width].mvs[0].y =
2323                                            (pMBs[x + y * pParam->mb_width].mvs[0].y * (bCount+1) ) / bCount;
2324          }          }
2325    
2326          if (MotionFlags & PMV_EXTSEARCH16) {                          MEanalyzeMB(pRef->y, pCurrent->y, x, y, pParam, pMBs, &Data);
 /* extended: search (up to) two more times: orignal prediction and (0,0) */  
2327    
2328                  if (!(MVequal(pmv[0], backupMV))) {                          for (i = 0; i < 4; i++) {
2329                          iSAD =                                  int dev;
2330                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,                                  MACROBLOCK *pMB = &pMBs[x+(i&1) + (y+(i>>1)) * pParam->mb_width];
2331                                                                    pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,                                  dev = dev16(pCurrent->y + (x + (i&1) + (y + (i>>1)) * pParam->edged_width) * 16,
2332                                                                    min_dx, max_dx, min_dy, max_dy, iEdgedWidth,                                                                  pParam->edged_width);
                                                                   iDiamondSize, iFcode, iQuant, iFound);  
2333    
2334                          if (iSAD < iMinSAD) {                                  complexity += MAX(dev, 300);
2335                                  *currMV = newMV;                                  if (dev + IntraThresh < pMB->sad16) {
2336                                  iMinSAD = iSAD;                                          pMB->mode = MODE_INTRA;
2337                          }                                          if (++intra > ((pParam->mb_height-2)*(pParam->mb_width-2))/2) return I_VOP;
2338                  }                  }
2339    
2340                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {                                  if (pMB->mvs[0].x == 0 && pMB->mvs[0].y == 0)
2341                          iSAD =                                          if (dev > 500 && pMB->sad16 < 1000)
2342                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,                                                  sSAD += 1000;
                                                                   iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, iFound);  
2343    
2344                          if (iSAD < iMinSAD) {                                  sSAD += (dev < 3000) ? pMB->sad16 : pMB->sad16/2; /* blocks with big contrast differences usually have large SAD - while they look very good in b-frames */
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
2345                          }                          }
2346                  }                  }
2347          }          }
2348            complexity >>= 7;
2349    
2350  /*          sSAD /= complexity + 4*blocks;
    Step 10:  The motion vector is chosen according to the block corresponding to MinSAD.  
 */  
   
   PMVfast16_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step  
                 iMinSAD =  
                         Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                          iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                          iFcode, iQuant, iEdgedWidth);  
2351    
2352    PMVfast16_Terminate_without_Refine:          if (intraCount > 80 && sSAD > INTRA_THRESH2 ) return I_VOP;
2353          currPMV->x = currMV->x - pmv[0].x;          if (sSAD > InterThresh ) return P_VOP;
2354          currPMV->y = currMV->y - pmv[0].y;          emms();
2355          return iMinSAD;          return B_VOP;
2356  }  }
2357    
2358    
2359    /* functions which perform BITS-based search/bitcount */
2360    
2361    static int
2362    findRDinter(SearchData * const Data,
2363                            const MACROBLOCK * const pMBs, const int x, const int y,
2364                            const MBParam * const pParam,
2365                            const uint32_t MotionFlags)
2366    {
2367            int i;
2368            int32_t bsad[5];
2369    
2370            if (Data->qpel) {
2371                    for(i = 0; i < 5; i++) {
2372                            Data->currentMV[i].x = Data->currentQMV[i].x/2;
2373                            Data->currentMV[i].y = Data->currentQMV[i].y/2;
2374                    }
2375                    Data->qpel_precision = 1;
2376                    CheckCandidateRD16(Data->currentQMV[0].x, Data->currentQMV[0].y, Data, 255);
2377    
2378                    if (MotionFlags & (XVID_ME_HALFPELREFINE16_RD | XVID_ME_EXTSEARCH_RD)) { /* we have to prepare for halfpixel-precision search */
2379  int32_t                          for(i = 0; i < 5; i++) bsad[i] = Data->iMinSAD[i];
2380  Diamond8_MainSearch(const uint8_t * const pRef,                          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
2381                                          const uint8_t * const pRefH,                                                  pParam->width, pParam->height, Data->iFcode - Data->qpel, 1, Data->rrv);
2382                                          const uint8_t * const pRefV,                          Data->qpel_precision = 0;
2383                                          const uint8_t * const pRefHV,                          if (Data->currentQMV->x & 1 || Data->currentQMV->y & 1)
2384                                          const uint8_t * const cur,                                  CheckCandidateRD16(Data->currentMV[0].x, Data->currentMV[0].y, Data, 255);
                                         const int x,  
                                         const int y,  
                                         int32_t startx,  
                                         int32_t starty,  
                                         int32_t iMinSAD,  
                                         VECTOR * const currMV,  
                                         const VECTOR * const pmv,  
                                         const int32_t min_dx,  
                                         const int32_t max_dx,  
                                         const int32_t min_dy,  
                                         const int32_t max_dy,  
                                         const int32_t iEdgedWidth,  
                                         const int32_t iDiamondSize,  
                                         const int32_t iFcode,  
                                         const int32_t iQuant,  
                                         int iFound)  
 {  
 /* Do a diamond search around given starting point, return SAD of best */  
   
         int32_t iDirection = 0;  
         int32_t iSAD;  
         VECTOR backupMV;  
   
         backupMV.x = startx;  
         backupMV.y = starty;  
   
 /* It's one search with full Diamond pattern, and only 3 of 4 for all following diamonds */  
   
         CHECK_MV8_CANDIDATE_DIR(backupMV.x - iDiamondSize, backupMV.y, 1);  
         CHECK_MV8_CANDIDATE_DIR(backupMV.x + iDiamondSize, backupMV.y, 2);  
         CHECK_MV8_CANDIDATE_DIR(backupMV.x, backupMV.y - iDiamondSize, 3);  
         CHECK_MV8_CANDIDATE_DIR(backupMV.x, backupMV.y + iDiamondSize, 4);  
   
         if (iDirection)  
                 while (!iFound) {  
                         iFound = 1;  
                         backupMV = *currMV;     // since iDirection!=0, this is well defined!  
   
                         if (iDirection != 2)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x - iDiamondSize,  
                                                                                   backupMV.y, 1);  
                         if (iDirection != 1)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x + iDiamondSize,  
                                                                                   backupMV.y, 2);  
                         if (iDirection != 4)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x,  
                                                                                   backupMV.y - iDiamondSize, 3);  
                         if (iDirection != 3)  
                                 CHECK_MV8_CANDIDATE_FOUND(backupMV.x,  
                                                                                   backupMV.y + iDiamondSize, 4);  
         } else {  
                 currMV->x = startx;  
                 currMV->y = starty;  
2385          }          }
2386          return iMinSAD;  
2387            } else { /* not qpel */
2388    
2389                    CheckCandidateRD16(Data->currentMV[0].x, Data->currentMV[0].y, Data, 255);
2390  }  }
2391    
2392  int32_t          if (MotionFlags&XVID_ME_EXTSEARCH_RD)
2393  Halfpel8_Refine(const uint8_t * const pRef,                  SquareSearch(Data->currentMV->x, Data->currentMV->y, Data, 255, CheckCandidateRD16);
2394                                  const uint8_t * const pRefH,  
2395                                  const uint8_t * const pRefV,          if (MotionFlags&XVID_ME_HALFPELREFINE16_RD)
2396                                  const uint8_t * const pRefHV,                  SubpelRefine(Data, CheckCandidateRD16);
                                 const uint8_t * const cur,  
                                 const int x,  
                                 const int y,  
                                 VECTOR * const currMV,  
                                 int32_t iMinSAD,  
                                 const VECTOR * const pmv,  
                                 const int32_t min_dx,  
                                 const int32_t max_dx,  
                                 const int32_t min_dy,  
                                 const int32_t max_dy,  
                                 const int32_t iFcode,  
                                 const int32_t iQuant,  
                                 const int32_t iEdgedWidth)  
 {  
 /* Do a half-pel refinement (or rather a "smallest possible amount" refinement) */  
   
         int32_t iSAD;  
         VECTOR backupMV = *currMV;  
   
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y - 1);  
         CHECK_MV8_CANDIDATE(backupMV.x, backupMV.y - 1);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y - 1);  
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y);  
         CHECK_MV8_CANDIDATE(backupMV.x - 1, backupMV.y + 1);  
         CHECK_MV8_CANDIDATE(backupMV.x, backupMV.y + 1);  
         CHECK_MV8_CANDIDATE(backupMV.x + 1, backupMV.y + 1);  
2397    
2398          return iMinSAD;          if (Data->qpel) {
2399                    if (MotionFlags&(XVID_ME_EXTSEARCH_RD | XVID_ME_HALFPELREFINE16_RD)) { /* there was halfpel-precision search */
2400                            for(i = 0; i < 5; i++) if (bsad[i] > Data->iMinSAD[i]) {
2401                                    Data->currentQMV[i].x = 2 * Data->currentMV[i].x; /* we have found a better match */
2402                                    Data->currentQMV[i].y = 2 * Data->currentMV[i].y;
2403  }  }
2404    
2405                            /* preparing for qpel-precision search */
2406                            Data->qpel_precision = 1;
2407                            get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
2408                                            pParam->width, pParam->height, Data->iFcode, 2, 0);
2409                    }
2410                    if (MotionFlags&XVID_ME_QUARTERPELREFINE16_RD)
2411                            SubpelRefine(Data, CheckCandidateRD16);
2412            }
2413    
2414  #define PMV_HALFPEL8 (PMV_HALFPELDIAMOND8|PMV_HALFPELREFINE8)          if (MotionFlags&XVID_ME_CHECKPREDICTION_RD) { /* let's check vector equal to prediction */
2415                    VECTOR * v = Data->qpel ? Data->currentQMV : Data->currentMV;
2416                    if (!(Data->predMV.x == v->x && Data->predMV.y == v->y))
2417                            CheckCandidateRD16(Data->predMV.x, Data->predMV.y, Data, 255);
2418            }
2419            return Data->iMinSAD[0];
2420    }
2421    
2422  int32_t  static int
2423  PMVfastSearch8(const uint8_t * const pRef,  findRDinter4v(const SearchData * const Data,
2424                             const uint8_t * const pRefH,                                  MACROBLOCK * const pMB, const MACROBLOCK * const pMBs,
2425                             const uint8_t * const pRefV,                                  const int x, const int y,
2426                             const uint8_t * const pRefHV,                                  const MBParam * const pParam, const uint32_t MotionFlags,
2427                             const IMAGE * const pCur,                                  const VECTOR * const backup)
                            const int x,  
                            const int y,  
                            const int start_x,  
                            const int start_y,  
                            const uint32_t MotionFlags,  
                            const uint32_t iQuant,  
                            const uint32_t iFcode,  
                            const MBParam * const pParam,  
                            const MACROBLOCK * const pMBs,  
                            const MACROBLOCK * const prevMBs,  
                            VECTOR * const currMV,  
                            VECTOR * const currPMV)  
2428  {  {
         const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
2429    
2430          const uint8_t *cur = pCur->y + x * 8 + y * 8 * iEdgedWidth;          int cbp = 0, bits = 0, t = 0, i;
2431            SearchData Data2, *Data8 = &Data2;
2432            int sumx = 0, sumy = 0;
2433            int16_t *in = Data->dctSpace, *coeff = Data->dctSpace + 64;
2434            uint8_t * ptr;
2435    
2436            memcpy(Data8, Data, sizeof(SearchData));
2437    
2438            for (i = 0; i < 4; i++) { /* for all luma blocks */
2439    
2440                    Data8->iMinSAD = Data->iMinSAD + i + 1;
2441                    Data8->currentMV = Data->currentMV + i + 1;
2442                    Data8->currentQMV = Data->currentQMV + i + 1;
2443                    Data8->Cur = Data->Cur + 8*((i&1) + (i>>1)*Data->iEdgedWidth);
2444                    Data8->RefP[0] = Data->RefP[0] + 8*((i&1) + (i>>1)*Data->iEdgedWidth);
2445                    Data8->RefP[2] = Data->RefP[2] + 8*((i&1) + (i>>1)*Data->iEdgedWidth);
2446                    Data8->RefP[1] = Data->RefP[1] + 8*((i&1) + (i>>1)*Data->iEdgedWidth);
2447                    Data8->RefP[3] = Data->RefP[3] + 8*((i&1) + (i>>1)*Data->iEdgedWidth);
2448                    *Data8->cbp = (Data->cbp[1] & (1<<(5-i))) ? 1:0; // copy corresponding cbp bit
2449    
2450                    if(Data->qpel) {
2451                            Data8->predMV = get_qpmv2(pMBs, pParam->mb_width, 0, x, y, i);
2452                            if (i != 0)     t = d_mv_bits(  Data8->currentQMV->x, Data8->currentQMV->y,
2453                                                                                    Data8->predMV, Data8->iFcode, 0, 0);
2454                    } else {
2455                            Data8->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, i);
2456                            if (i != 0)     t = d_mv_bits(  Data8->currentMV->x, Data8->currentMV->y,
2457                                                                                    Data8->predMV, Data8->iFcode, 0, 0);
2458                    }
2459    
2460          int32_t iDiamondSize;                  get_range(&Data8->min_dx, &Data8->max_dx, &Data8->min_dy, &Data8->max_dy, 2*x + (i&1), 2*y + (i>>1), 3,
2461                                            pParam->width, pParam->height, Data8->iFcode, Data8->qpel+1, 0);
2462    
2463          int32_t min_dx;                  *Data8->iMinSAD += BITS_MULT*t;
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
2464    
2465          VECTOR pmv[4];                  Data8->qpel_precision = Data8->qpel;
2466          int32_t psad[4];                  /* checking the vector which has been found by SAD-based 8x8 search (if it's different than the one found so far) */
2467          VECTOR newMV;                  {
2468          VECTOR backupMV;                          VECTOR *v = Data8->qpel ? Data8->currentQMV : Data8->currentMV;
2469          VECTOR startMV;                          if (!MVequal (*v, backup[i+1]) )
2470                                    CheckCandidateRD8(backup[i+1].x, backup[i+1].y, Data8, 255);
2471                    }
2472    
2473  //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;                  if (Data8->qpel) {
2474          const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;                          if (MotionFlags&XVID_ME_HALFPELREFINE8_RD || (MotionFlags&XVID_ME_EXTSEARCH8 && MotionFlags&XVID_ME_EXTSEARCH_RD)) { /* halfpixel motion search follows */
2475                                    int32_t s = *Data8->iMinSAD;
2476                                    Data8->currentMV->x = Data8->currentQMV->x/2;
2477                                    Data8->currentMV->y = Data8->currentQMV->y/2;
2478                                    Data8->qpel_precision = 0;
2479                                    get_range(&Data8->min_dx, &Data8->max_dx, &Data8->min_dy, &Data8->max_dy, 2*x + (i&1), 2*y + (i>>1), 3,
2480                                                            pParam->width, pParam->height, Data8->iFcode - 1, 1, 0);
2481    
2482          static int32_t threshA, threshB;                                  if (Data8->currentQMV->x & 1 || Data8->currentQMV->y & 1)
2483          int32_t iFound, bPredEq;                                          CheckCandidateRD8(Data8->currentMV->x, Data8->currentMV->y, Data8, 255);
         int32_t iMinSAD, iSAD;  
2484    
2485          int32_t iSubBlock = (y & 1) + (y & 1) + (x & 1);                                  if (MotionFlags & XVID_ME_EXTSEARCH8 && MotionFlags & XVID_ME_EXTSEARCH_RD)
2486                                            SquareSearch(Data8->currentMV->x, Data8->currentMV->x, Data8, 255, CheckCandidateRD8);
2487    
2488          MainSearch8FuncPtr MainSearchPtr;                                  if (MotionFlags & XVID_ME_HALFPELREFINE8_RD)
2489                                            SubpelRefine(Data8, CheckCandidateRD8);
2490    
2491          /* Init variables */                                  if(s > *Data8->iMinSAD) { /* we have found a better match */
2492          startMV.x = start_x;                                          Data8->currentQMV->x = 2*Data8->currentMV->x;
2493          startMV.y = start_y;                                          Data8->currentQMV->y = 2*Data8->currentMV->y;
2494                                    }
2495    
2496          /* Get maximum range */                                  Data8->qpel_precision = 1;
2497          get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,                                  get_range(&Data8->min_dx, &Data8->max_dx, &Data8->min_dy, &Data8->max_dy, 2*x + (i&1), 2*y + (i>>1), 3,
2498                            iFcode);                                                          pParam->width, pParam->height, Data8->iFcode, 2, 0);
2499    
         if (!(MotionFlags & PMV_HALFPELDIAMOND8)) {  
                 min_dx = EVEN(min_dx);  
                 max_dx = EVEN(max_dx);  
                 min_dy = EVEN(min_dy);  
                 max_dy = EVEN(max_dy);  
2500          }          }
2501                            if (MotionFlags & XVID_ME_QUARTERPELREFINE8_RD)
2502                                    SubpelRefine(Data8, CheckCandidateRD8);
2503    
2504          /* because we might use IF (dx>max_dx) THEN dx=max_dx; */                  } else { /* not qpel */
         bPredEq =  
                 get_pmvdata(pMBs, (x >> 1), (y >> 1), iWcount, iSubBlock, pmv, psad);  
   
         if ((x == 0) && (y == 0)) {  
                 threshA = 512 / 4;  
                 threshB = 1024 / 4;  
2505    
2506          } else {                          if (MotionFlags & XVID_ME_EXTSEARCH8 && MotionFlags & XVID_ME_EXTSEARCH_RD) /* extsearch */
2507                  threshA = psad[0] / 4;  /* good estimate */                                  SquareSearch(Data8->currentMV->x, Data8->currentMV->x, Data8, 255, CheckCandidateRD8);
                 threshB = threshA + 256 / 4;  
                 if (threshA < 512 / 4)  
                         threshA = 512 / 4;  
                 if (threshA > 1024 / 4)  
                         threshA = 1024 / 4;  
                 if (threshB > 1792 / 4)  
                         threshB = 1792 / 4;  
         }  
   
         iFound = 0;  
   
 /* Step 4: Calculate SAD around the Median prediction.  
    MinSAD=SAD  
    If Motion Vector equal to Previous frame motion vector  
    and MinSAD<PrevFrmSAD goto Step 10.  
    If SAD<=256 goto Step 10.  
 */  
2508    
2509                            if (MotionFlags & XVID_ME_HALFPELREFINE8_RD)
2510                                    SubpelRefine(Data8, CheckCandidateRD8); /* halfpel refinement */
2511                    }
2512    
2513  // Prepare for main loop                  /* checking vector equal to predicion */
2514                    if (i != 0 && MotionFlags & XVID_ME_CHECKPREDICTION_RD) {
2515                            const VECTOR * v = Data->qpel ? Data8->currentQMV : Data8->currentMV;
2516                            if (!MVequal(*v, Data8->predMV))
2517                                    CheckCandidateRD8(Data8->predMV.x, Data8->predMV.y, Data8, 255);
2518                    }
2519    
2520  //  if (MotionFlags & PMV_USESQUARES8)                  bits += *Data8->iMinSAD;
2521  //      MainSearchPtr = Square8_MainSearch;                  if (bits >= Data->iMinSAD[0]) return bits; /* no chances for INTER4V */
 //  else  
2522    
2523          if (MotionFlags & PMV_ADVANCEDDIAMOND8)                  /* MB structures for INTER4V mode; we have to set them here, we don't have predictor anywhere else */
2524                  MainSearchPtr = AdvDiamond8_MainSearch;                  if(Data->qpel) {
2525          else                          pMB->pmvs[i].x = Data8->currentQMV->x - Data8->predMV.x;
2526                  MainSearchPtr = Diamond8_MainSearch;                          pMB->pmvs[i].y = Data8->currentQMV->y - Data8->predMV.y;
2527                            pMB->qmvs[i] = *Data8->currentQMV;
2528                            sumx += Data8->currentQMV->x/2;
2529                            sumy += Data8->currentQMV->y/2;
2530                    } else {
2531                            pMB->pmvs[i].x = Data8->currentMV->x - Data8->predMV.x;
2532                            pMB->pmvs[i].y = Data8->currentMV->y - Data8->predMV.y;
2533                            sumx += Data8->currentMV->x;
2534                            sumy += Data8->currentMV->y;
2535                    }
2536                    pMB->mvs[i] = *Data8->currentMV;
2537                    pMB->sad8[i] = 4 * *Data8->iMinSAD;
2538                    if (Data8->cbp[0]) cbp |= 1 << (5 - i);
2539    
2540            } /* end - for all luma blocks */
2541    
2542          *currMV = startMV;          bits += BITS_MULT*xvid_cbpy_tab[15-(cbp>>2)].len;
2543    
2544          iMinSAD =          /* let's check chroma */
2545                  sad8(cur,          sumx = (sumx >> 3) + roundtab_76[sumx & 0xf];
2546                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,          sumy = (sumy >> 3) + roundtab_76[sumy & 0xf];
                                                 iEdgedWidth), iEdgedWidth);  
         iMinSAD +=  
                 calc_delta_8(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                          (uint8_t) iFcode, iQuant);  
   
         if ((iMinSAD < 256 / 4) || ((MVequal(*currMV, prevMB->mvs[iSubBlock]))  
                                                                 && ((uint32_t) iMinSAD <  
                                                                         prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
   
 /* Step 2 (lazy eval): Calculate Distance= |MedianMVX| + |MedianMVY| where MedianMV is the motion  
    vector of the median.  
    If PredEq=1 and MVpredicted = Previous Frame MV, set Found=2  
 */  
2547    
2548          if ((bPredEq) && (MVequal(pmv[0], prevMB->mvs[iSubBlock])))          /* chroma U */
2549                  iFound = 2;          ptr = interpolate8x8_switch2(Data->RefQ + 64, Data->RefP[4], 0, 0, sumx, sumy, Data->iEdgedWidth/2, Data->rounding);
2550            transfer_8to16subro(in, Data->CurU, ptr, Data->iEdgedWidth/2);
2551            bits += Block_CalcBits(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, 4);
2552    
2553  /* Step 3 (lazy eval): If Distance>0 or thresb<1536 or PredEq=1 Select small Diamond Search.          if (bits >= *Data->iMinSAD) return bits;
    Otherwise select large Diamond Search.  
 */  
2554    
2555          if ((!MVzero(pmv[0])) || (threshB < 1536 / 4) || (bPredEq))          /* chroma V */
2556                  iDiamondSize = 1;               // 1 halfpel!          ptr = interpolate8x8_switch2(Data->RefQ + 64, Data->RefP[5], 0, 0, sumx, sumy, Data->iEdgedWidth/2, Data->rounding);
2557          else          transfer_8to16subro(in, Data->CurV, ptr, Data->iEdgedWidth/2);
2558                  iDiamondSize = 2;               // 2 halfpel = 1 full pixel!          bits += Block_CalcBits(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, 5);
2559    
2560          if (!(MotionFlags & PMV_HALFPELDIAMOND8))          bits += BITS_MULT*mcbpc_inter_tab[(MODE_INTER4V & 7) | ((cbp & 3) << 3)].len;
                 iDiamondSize *= 2;  
2561    
2562            *Data->cbp = cbp;
2563            return bits;
2564    }
2565    
2566  /*  static int
2567     Step 5: Calculate SAD for motion vectors taken from left block, top, top-right, and Previous frame block.  findRDintra(const SearchData * const Data)
2568     Also calculate (0,0) but do not subtract offset.  {
2569     Let MinSAD be the smallest SAD up to this point.          int bits = BITS_MULT*1; /* this one is ac/dc prediction flag bit */
2570     If MV is (0,0) subtract offset.          int cbp = 0, i, dc = 0;
2571  */          int16_t *in = Data->dctSpace, * coeff = Data->dctSpace + 64;
2572    
2573  // the median prediction might be even better than mv16          for(i = 0; i < 4; i++) {
2574                    int s = 8*((i&1) + (i>>1)*Data->iEdgedWidth);
2575                    transfer_8to16copy(in, Data->Cur + s, Data->iEdgedWidth);
2576                    bits += Block_CalcBitsIntra(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, i, &dc);
2577    
2578          if (!MVequal(pmv[0], startMV))                  if (bits >= Data->iMinSAD[0]) return bits;
2579                  CHECK_MV8_CANDIDATE(pmv[0].x, pmv[0].y);          }
2580    
2581  // (0,0) if needed          bits += BITS_MULT*xvid_cbpy_tab[cbp>>2].len;
         if (!MVzero(pmv[0]))  
                 if (!MVzero(startMV))  
                         CHECK_MV8_ZERO;  
   
 // previous frame MV if needed  
         if (!MVzero(prevMB->mvs[iSubBlock]))  
                 if (!MVequal(prevMB->mvs[iSubBlock], startMV))  
                         if (!MVequal(prevMB->mvs[iSubBlock], pmv[0]))  
                                 CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x,  
                                                                         prevMB->mvs[iSubBlock].y);  
   
         if ((iMinSAD <= threshA) ||  
                 (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&  
                  ((uint32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
   
 // left neighbour, if allowed and needed  
         if (!MVzero(pmv[1]))  
                 if (!MVequal(pmv[1], startMV))  
                         if (!MVequal(pmv[1], prevMB->mvs[iSubBlock]))  
                                 if (!MVequal(pmv[1], pmv[0])) {  
                                         if (!(MotionFlags & PMV_HALFPEL8)) {  
                                                 pmv[1].x = EVEN(pmv[1].x);  
                                                 pmv[1].y = EVEN(pmv[1].y);  
                                         }  
                                         CHECK_MV8_CANDIDATE(pmv[1].x, pmv[1].y);  
                                 }  
 // top neighbour, if allowed and needed  
         if (!MVzero(pmv[2]))  
                 if (!MVequal(pmv[2], startMV))  
                         if (!MVequal(pmv[2], prevMB->mvs[iSubBlock]))  
                                 if (!MVequal(pmv[2], pmv[0]))  
                                         if (!MVequal(pmv[2], pmv[1])) {  
                                                 if (!(MotionFlags & PMV_HALFPEL8)) {  
                                                         pmv[2].x = EVEN(pmv[2].x);  
                                                         pmv[2].y = EVEN(pmv[2].y);  
                                                 }  
                                                 CHECK_MV8_CANDIDATE(pmv[2].x, pmv[2].y);  
   
 // top right neighbour, if allowed and needed  
                                                 if (!MVzero(pmv[3]))  
                                                         if (!MVequal(pmv[3], startMV))  
                                                                 if (!MVequal(pmv[3], prevMB->mvs[iSubBlock]))  
                                                                         if (!MVequal(pmv[3], pmv[0]))  
                                                                                 if (!MVequal(pmv[3], pmv[1]))  
                                                                                         if (!MVequal(pmv[3], pmv[2])) {  
                                                                                                 if (!  
                                                                                                         (MotionFlags &  
                                                                                                          PMV_HALFPEL8)) {  
                                                                                                         pmv[3].x = EVEN(pmv[3].x);  
                                                                                                         pmv[3].y = EVEN(pmv[3].y);  
                                                                                                 }  
                                                                                                 CHECK_MV8_CANDIDATE(pmv[3].x,  
                                                                                                                                         pmv[3].y);  
                                                                                         }  
                                         }  
   
         if ((MVzero(*currMV)) &&  
                 (!MVzero(pmv[0])) /* && (iMinSAD <= iQuant * 96) */ )  
                 iMinSAD -= MV8_00_BIAS;  
2582    
2583            /*chroma U */
2584            transfer_8to16copy(in, Data->CurU, Data->iEdgedWidth/2);
2585            bits += Block_CalcBitsIntra(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, 4, &dc);
2586    
2587  /* Step 6: If MinSAD <= thresa goto Step 10.          if (bits >= Data->iMinSAD[0]) return bits;
    If Motion Vector equal to Previous frame motion vector and MinSAD<PrevFrmSAD goto Step 10.  
 */  
2588    
2589          if ((iMinSAD <= threshA) ||          /* chroma V */
2590                  (MVequal(*currMV, prevMB->mvs[iSubBlock]) &&          transfer_8to16copy(in, Data->CurV, Data->iEdgedWidth/2);
2591                   ((uint32_t) iMinSAD < prevMB->sad8[iSubBlock]))) {          bits += Block_CalcBitsIntra(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, 5, &dc);
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto PMVfast8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto PMVfast8_Terminate_with_Refine;  
         }  
2592    
2593  /************ (Diamond Search)  **************/          bits += BITS_MULT*mcbpc_inter_tab[(MODE_INTRA & 7) | ((cbp & 3) << 3)].len;
 /*  
    Step 7: Perform Diamond search, with either the small or large diamond.  
    If Found=2 only examine one Diamond pattern, and afterwards goto step 10  
    Step 8: If small diamond, iterate small diamond search pattern until motion vector lies in the center of the diamond.  
    If center then goto step 10.  
    Step 9: If large diamond, iterate large diamond search pattern until motion vector lies in the center.  
    Refine by using small diamond and goto step 10.  
 */  
2594    
2595          backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */          return bits;
2596    }
2597    
2598  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */  static int
2599          iSAD =  findRDgmc(const SearchData * const Data, const IMAGE * const vGMC, const int x, const int y)
2600                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  {
2601                                                    currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,          int bits = BITS_MULT*1; /* this one is mcsel */
2602                                                    min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,          int cbp = 0, i;
2603                                                    iQuant, iFound);          int16_t *in = Data->dctSpace, * coeff = Data->dctSpace + 64;
2604    
2605          if (iSAD < iMinSAD) {          for(i = 0; i < 4; i++) {
2606                  *currMV = newMV;                  int s = 8*((i&1) + (i>>1)*Data->iEdgedWidth);
2607                  iMinSAD = iSAD;                  transfer_8to16subro(in, Data->Cur + s, vGMC->y + s + 16*(x+y*Data->iEdgedWidth), Data->iEdgedWidth);
2608                    bits += Block_CalcBits(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, i);
2609                    if (bits >= Data->iMinSAD[0]) return bits;
2610          }          }
2611    
2612          if (MotionFlags & PMV_EXTSEARCH8) {          bits += BITS_MULT*xvid_cbpy_tab[15-(cbp>>2)].len;
 /* extended: search (up to) two more times: orignal prediction and (0,0) */  
2613    
2614                  if (!(MVequal(pmv[0], backupMV))) {          /*chroma U */
2615                          iSAD =          transfer_8to16subro(in, Data->CurU, vGMC->u + 8*(x+y*(Data->iEdgedWidth/2)), Data->iEdgedWidth/2);
2616                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,          bits += Block_CalcBits(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, 4);
                                                                   pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   iDiamondSize, iFcode, iQuant, iFound);  
2617    
2618                          if (iSAD < iMinSAD) {          if (bits >= Data->iMinSAD[0]) return bits;
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
                 }  
2619    
2620                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {          /* chroma V */
2621                          iSAD =          transfer_8to16subro(in, Data->CurV , vGMC->v + 8*(x+y*(Data->iEdgedWidth/2)), Data->iEdgedWidth/2);
2622                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,          bits += Block_CalcBits(coeff, in, Data->dctSpace + 128, Data->iQuant, Data->quant_type, &cbp, 5);
                                                                   iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, iDiamondSize, iFcode,  
                                                                   iQuant, iFound);  
2623    
2624                          if (iSAD < iMinSAD) {          bits += BITS_MULT*mcbpc_inter_tab[(MODE_INTER & 7) | ((cbp & 3) << 3)].len;
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
                 }  
         }  
2625    
2626  /* Step 10: The motion vector is chosen according to the block corresponding to MinSAD.          *Data->cbp = cbp;
    By performing an optional local half-pixel search, we can refine this result even further.  
 */  
2627    
2628    PMVfast8_Terminate_with_Refine:          return bits;
2629          if (MotionFlags & PMV_HALFPELREFINE8)   // perform final half-pel step  }
                 iMinSAD =  
                         Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                         iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                         iFcode, iQuant, iEdgedWidth);  
2630    
2631    
   PMVfast8_Terminate_without_Refine:  
         currPMV->x = currMV->x - pmv[0].x;  
         currPMV->y = currMV->y - pmv[0].y;  
2632    
         return iMinSAD;  
 }  
2633    
2634  int32_t  static __inline void
2635  EPZSSearch16(const uint8_t * const pRef,  GMEanalyzeMB (  const uint8_t * const pCur,
2636                                    const uint8_t * const pRef,
2637                           const uint8_t * const pRefH,                           const uint8_t * const pRefH,
2638                           const uint8_t * const pRefV,                           const uint8_t * const pRefV,
2639                           const uint8_t * const pRefHV,                           const uint8_t * const pRefHV,
                          const IMAGE * const pCur,  
2640                           const int x,                           const int x,
2641                           const int y,                           const int y,
                          const uint32_t MotionFlags,  
                          const uint32_t iQuant,  
                          const uint32_t iFcode,  
2642                           const MBParam * const pParam,                           const MBParam * const pParam,
2643                           const MACROBLOCK * const pMBs,                                  MACROBLOCK * const pMBs,
2644                           const MACROBLOCK * const prevMBs,                                  SearchData * const Data)
                          VECTOR * const currMV,  
                          VECTOR * const currPMV)  
2645  {  {
         const uint32_t iWcount = pParam->mb_width;  
         const uint32_t iHcount = pParam->mb_height;  
   
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
2646    
2647          const uint8_t *cur = pCur->y + x * 16 + y * 16 * iEdgedWidth;          int i=0;
2648            MACROBLOCK * const pMB = &pMBs[x + y * pParam->mb_width];
2649    
2650          int32_t min_dx;          Data->iMinSAD[0] = MV_MAX_ERROR;
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
2651    
2652          VECTOR newMV;          Data->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0);
         VECTOR backupMV;  
2653    
2654          VECTOR pmv[4];          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
2655          int32_t psad[8];                                  pParam->width, pParam->height, 16, 1, 0);
2656    
2657          static MACROBLOCK *oldMBs = NULL;          Data->Cur = pCur + 16*(x + y * pParam->edged_width);
2658            Data->RefP[0] = pRef + 16*(x + y * pParam->edged_width);
2659            Data->RefP[1] = pRefV + 16*(x + y * pParam->edged_width);
2660            Data->RefP[2] = pRefH + 16*(x + y * pParam->edged_width);
2661            Data->RefP[3] = pRefHV + 16*(x + y * pParam->edged_width);
2662    
2663  //  const MACROBLOCK * const pMB = pMBs + x + y * iWcount;          Data->currentMV[0].x = Data->currentMV[0].y = 0;
2664          const MACROBLOCK *const prevMB = prevMBs + x + y * iWcount;          CheckCandidate16I(0, 0, Data, 255);
         MACROBLOCK *oldMB = NULL;  
2665    
2666          static int32_t thresh2;          if ( (Data->predMV.x !=0) || (Data->predMV.y != 0) )
2667          int32_t bPredEq;                  CheckCandidate16I(Data->predMV.x, Data->predMV.y, Data, 255);
         int32_t iMinSAD, iSAD = 9999;  
2668    
2669          MainSearch16FuncPtr MainSearchPtr;          DiamondSearch(Data->currentMV[0].x, Data->currentMV[0].y, Data, 255, CheckCandidate16I);
2670    
2671          if (oldMBs == NULL) {          SubpelRefine(Data, CheckCandidate16I);
                 oldMBs = (MACROBLOCK *) calloc(iWcount * iHcount, sizeof(MACROBLOCK));  
 //      fprintf(stderr,"allocated %d bytes for oldMBs\n",iWcount*iHcount*sizeof(MACROBLOCK));  
         }  
         oldMB = oldMBs + x + y * iWcount;  
2672    
 /* Get maximum range */  
         get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 16, iWidth, iHeight,  
                           iFcode);  
2673    
2674          if (!(MotionFlags & PMV_HALFPEL16)) {          /* for QPel halfpel positions are worse than in halfpel mode :( */
2675                  min_dx = EVEN(min_dx);  /*      if (Data->qpel) {
2676                  max_dx = EVEN(max_dx);                  Data->currentQMV->x = 2*Data->currentMV->x;
2677                  min_dy = EVEN(min_dy);                  Data->currentQMV->y = 2*Data->currentMV->y;
2678                  max_dy = EVEN(max_dy);                  Data->qpel_precision = 1;
2679                    get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 4,
2680                                            pParam->width, pParam->height, iFcode, 2, 0);
2681                    SubpelRefine(Data);
2682          }          }
         /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  
         bPredEq = get_pmvdata(pMBs, x, y, iWcount, 0, pmv, psad);  
   
 /* Step 4: Calculate SAD around the Median prediction.  
         MinSAD=SAD  
         If Motion Vector equal to Previous frame motion vector  
                 and MinSAD<PrevFrmSAD goto Step 10.  
         If SAD<=256 goto Step 10.  
2683  */  */
2684    
2685  // Prepare for main loop          pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = Data->currentMV[0];
2686            pMB->sad16 = Data->iMinSAD[0];
2687          *currMV = pmv[0];                       /* current best := median prediction */          pMB->mode = MODE_INTER;
2688          if (!(MotionFlags & PMV_HALFPEL16)) {          pMB->sad16 += 10*d_mv_bits(pMB->mvs[0].x, pMB->mvs[0].y, Data->predMV, Data->iFcode, 0, 0);
2689                  currMV->x = EVEN(currMV->x);          return;
                 currMV->y = EVEN(currMV->y);  
         }  
   
         if (currMV->x > max_dx)  
                 currMV->x = max_dx;  
         if (currMV->x < min_dx)  
                 currMV->x = min_dx;  
         if (currMV->y > max_dy)  
                 currMV->y = max_dy;  
         if (currMV->y < min_dy)  
                 currMV->y = min_dy;  
   
 /***************** This is predictor SET A: only median prediction ******************/  
   
         iMinSAD =  
                 sad16(cur,  
                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 16, currMV,  
                                                  iEdgedWidth), iEdgedWidth, MV_MAX_ERROR);  
         iMinSAD +=  
                 calc_delta_16(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                           (uint8_t) iFcode, iQuant);  
   
 // thresh1 is fixed to 256  
         if ((iMinSAD < 256) ||  
                 ((MVequal(*currMV, prevMB->mvs[0])) &&  
                  ((uint32_t) iMinSAD < prevMB->sad16))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto EPZS16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto EPZS16_Terminate_with_Refine;  
         }  
   
 /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/  
   
 // previous frame MV  
         CHECK_MV16_CANDIDATE(prevMB->mvs[0].x, prevMB->mvs[0].y);  
   
 // set threshhold based on Min of Prediction and SAD of collocated block  
 // CHECK_MV16 always uses iSAD for the SAD of last vector to check, so now iSAD is what we want  
   
         if ((x == 0) && (y == 0)) {  
                 thresh2 = 512;  
         } else {  
 /* T_k = 1.2 * MIN(SAD_top,SAD_left,SAD_topleft,SAD_coll) +128;   [Tourapis, 2002] */  
   
                 thresh2 = MIN(psad[0], iSAD) * 6 / 5 + 128;  
2690          }          }
2691    
2692  // MV=(0,0) is often a good choice  void
2693    GMEanalysis(const MBParam * const pParam,
2694                            const FRAMEINFO * const current,
2695                            const FRAMEINFO * const reference,
2696                            const IMAGE * const pRefH,
2697                            const IMAGE * const pRefV,
2698                            const IMAGE * const pRefHV)
2699    {
2700            uint32_t x, y;
2701            MACROBLOCK * const pMBs = current->mbs;
2702            const IMAGE * const pCurrent = &current->image;
2703            const IMAGE * const pReference = &reference->image;
2704    
2705          CHECK_MV16_ZERO;          int32_t iMinSAD[5], temp[5];
2706            VECTOR currentMV[5];
2707            uint32_t dir;
2708            SearchData Data;
2709            memset(&Data, 0, sizeof(SearchData));
2710    
2711            Data.iEdgedWidth = pParam->edged_width;
2712            Data.rounding = pParam->m_rounding_type;
2713    
2714  // left neighbour, if allowed          Data.currentMV = &currentMV[0];
2715          if (x != 0) {          Data.iMinSAD = &iMinSAD[0];
2716                  if (!(MotionFlags & PMV_HALFPEL16)) {          Data.iFcode = current->fcode;
2717                          pmv[1].x = EVEN(pmv[1].x);          Data.temp = temp;
2718                          pmv[1].y = EVEN(pmv[1].y);          Data.dir = &dir;
                 }  
                 CHECK_MV16_CANDIDATE(pmv[1].x, pmv[1].y);  
         }  
 // top neighbour, if allowed  
         if (y != 0) {  
                 if (!(MotionFlags & PMV_HALFPEL16)) {  
                         pmv[2].x = EVEN(pmv[2].x);  
                         pmv[2].y = EVEN(pmv[2].y);  
                 }  
                 CHECK_MV16_CANDIDATE(pmv[2].x, pmv[2].y);  
2719    
2720  // top right neighbour, if allowed          if (sadInit) (*sadInit) ();
2721                  if ((uint32_t) x != (iWcount - 1)) {  
2722                          if (!(MotionFlags & PMV_HALFPEL16)) {          for (y = 0; y < pParam->mb_height; y ++) {
2723                                  pmv[3].x = EVEN(pmv[3].x);                  for (x = 0; x < pParam->mb_width; x ++) {
2724                                  pmv[3].y = EVEN(pmv[3].y);                          GMEanalyzeMB(pCurrent->y, pReference->y, pRefH->y, pRefV->y, pRefHV->y, x, y, pParam, pMBs, &Data);
                         }  
                         CHECK_MV16_CANDIDATE(pmv[3].x, pmv[3].y);  
2725                  }                  }
2726          }          }
2727            return;
 /* Terminate if MinSAD <= T_2  
    Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]  
 */  
   
         if ((iMinSAD <= thresh2)  
                 || (MVequal(*currMV, prevMB->mvs[0]) &&  
                         ((uint32_t) iMinSAD <= prevMB->sad16))) {  
                 if (MotionFlags & PMV_QUICKSTOP16)  
                         goto EPZS16_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto EPZS16_Terminate_with_Refine;  
2728          }          }
2729    
 /***** predictor SET C: acceleration MV (new!), neighbours in prev. frame(new!) ****/  
   
         backupMV = prevMB->mvs[0];      // collocated MV  
         backupMV.x += (prevMB->mvs[0].x - oldMB->mvs[0].x);     // acceleration X  
         backupMV.y += (prevMB->mvs[0].y - oldMB->mvs[0].y);     // acceleration Y  
2730    
2731          CHECK_MV16_CANDIDATE(backupMV.x, backupMV.y);  WARPPOINTS
2732    GlobalMotionEst(MACROBLOCK * const pMBs,
2733  // left neighbour                                  const MBParam * const pParam,
2734          if (x != 0)                                  const FRAMEINFO * const current,
2735                  CHECK_MV16_CANDIDATE((prevMB - 1)->mvs[0].x, (prevMB - 1)->mvs[0].y);                                  const FRAMEINFO * const reference,
2736                                    const IMAGE * const pRefH,
2737                                    const IMAGE * const pRefV,
2738                                    const IMAGE * const pRefHV)
2739    {
2740    
2741  // top neighbour          const int deltax=8;             // upper bound for difference between a MV and it's neighbour MVs
2742          if (y != 0)          const int deltay=8;
2743                  CHECK_MV16_CANDIDATE((prevMB - iWcount)->mvs[0].x,          const unsigned int gradx=512;           // lower bound for gradient in MB (ignore "flat" blocks)
2744                                                           (prevMB - iWcount)->mvs[0].y);          const unsigned int grady=512;
2745    
2746  // right neighbour, if allowed (this value is not written yet, so take it from   pMB->mvs          double sol[4] = { 0., 0., 0., 0. };
2747    
2748          if ((uint32_t) x != iWcount - 1)          WARPPOINTS gmc;
                 CHECK_MV16_CANDIDATE((prevMB + 1)->mvs[0].x, (prevMB + 1)->mvs[0].y);  
2749    
2750  // bottom neighbour, dito          uint32_t mx, my;
         if ((uint32_t) y != iHcount - 1)  
                 CHECK_MV16_CANDIDATE((prevMB + iWcount)->mvs[0].x,  
                                                          (prevMB + iWcount)->mvs[0].y);  
2751    
2752  /* Terminate if MinSAD <= T_3 (here T_3 = T_2)  */          int MBh = pParam->mb_height;
2753          if (iMinSAD <= thresh2) {          int MBw = pParam->mb_width;
2754                  if (MotionFlags & PMV_QUICKSTOP16)          const int minblocks = 9; //MBh*MBw/32+3;                /* just some reasonable number 3% + 3 */
2755                          goto EPZS16_Terminate_without_Refine;          const int maxblocks = MBh*MBw/4;                /* just some reasonable number 3% + 3 */
                 if (MotionFlags & PMV_EARLYSTOP16)  
                         goto EPZS16_Terminate_with_Refine;  
         }  
2756    
2757  /************ (if Diamond Search)  **************/          int num=0;
2758            int oldnum;
2759    
2760          backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */          gmc.duv[0].x = gmc.duv[0].y = gmc.duv[1].x = gmc.duv[1].y = gmc.duv[2].x = gmc.duv[2].y = 0;
2761    
2762          if (MotionFlags & PMV_USESQUARES8)          GMEanalysis(pParam,current, reference, pRefH, pRefV, pRefHV);
                 MainSearchPtr = Square16_MainSearch;  
         else  
          if (MotionFlags & PMV_ADVANCEDDIAMOND8)  
                 MainSearchPtr = AdvDiamond16_MainSearch;  
         else  
                 MainSearchPtr = Diamond16_MainSearch;  
2763    
2764  /* default: use best prediction as starting point for one call of PMVfast_MainSearch */          /* block based ME isn't done, yet, so do a quick presearch */
2765    
2766          iSAD =  // filter mask of all blocks
                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,  
                                                   currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,  
                                                   min_dy, max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);  
2767    
2768          if (iSAD < iMinSAD) {          for (my = 0; my < (uint32_t)MBh; my++)
2769                  *currMV = newMV;          for (mx = 0; mx < (uint32_t)MBw; mx++)
2770                  iMinSAD = iSAD;          {
2771                    const int mbnum = mx + my * MBw;
2772                            pMBs[mbnum].mcsel = 0;
2773          }          }
2774    
2775    
2776          if (MotionFlags & PMV_EXTSEARCH16) {          for (my = 1; my < (uint32_t)MBh-1; my++) /* ignore boundary blocks */
2777  /* extended mode: search (up to) two more times: orignal prediction and (0,0) */          for (mx = 1; mx < (uint32_t)MBw-1; mx++) /* theirs MVs are often wrong */
2778            {
2779                  if (!(MVequal(pmv[0], backupMV))) {                  const int mbnum = mx + my * MBw;
2780                          iSAD =                  MACROBLOCK *const pMB = &pMBs[mbnum];
2781                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,                  const VECTOR mv = pMB->mvs[0];
                                                                   pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,  
                                                                   min_dx, max_dx, min_dy, max_dy, iEdgedWidth,  
                                                                   2, iFcode, iQuant, 0);  
                 }  
2782    
2783                  if (iSAD < iMinSAD) {                  /* don't use object boundaries */
2784                          *currMV = newMV;                  if   ( (abs(mv.x -   (pMB-1)->mvs[0].x) < deltax)
2785                          iMinSAD = iSAD;                          && (abs(mv.y -   (pMB-1)->mvs[0].y) < deltay)
2786                            && (abs(mv.x -   (pMB+1)->mvs[0].x) < deltax)
2787                            && (abs(mv.y -   (pMB+1)->mvs[0].y) < deltay)
2788                            && (abs(mv.x - (pMB-MBw)->mvs[0].x) < deltax)
2789                            && (abs(mv.y - (pMB-MBw)->mvs[0].y) < deltay)
2790                            && (abs(mv.x - (pMB+MBw)->mvs[0].x) < deltax)
2791                            && (abs(mv.y - (pMB+MBw)->mvs[0].y) < deltay) )
2792                    {       const int iEdgedWidth = pParam->edged_width;
2793                            const uint8_t *const pCur = current->image.y + 16*(my*iEdgedWidth + mx);
2794                            if ( (sad16 ( pCur, pCur+1 , iEdgedWidth, 65536) >= gradx )
2795                             &&  (sad16 ( pCur, pCur+iEdgedWidth, iEdgedWidth, 65536) >= grady ) )
2796                             {      pMB->mcsel = 1;
2797                                    num++;
2798                  }                  }
2799    
2800                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {                  /* only use "structured" blocks */
                         iSAD =  
                                 (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,  
                                                                   iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,  
                                                                   max_dy, iEdgedWidth, 2, iFcode, iQuant, 0);  
   
                         if (iSAD < iMinSAD) {  
                                 *currMV = newMV;  
                                 iMinSAD = iSAD;  
                         }  
2801                  }                  }
2802          }          }
2803            emms();
2804    
2805  /***************        Choose best MV found     **************/          /*      further filtering would be possible, but during iteration, remaining
2806                    outliers usually are removed, too */
   EPZS16_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE16)  // perform final half-pel step  
                 iMinSAD =  
                         Halfpel16_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                          iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                          iFcode, iQuant, iEdgedWidth);  
   
   EPZS16_Terminate_without_Refine:  
2807    
2808          *oldMB = *prevMB;          if (num>= minblocks)
2809            do {            /* until convergence */
2810                    double DtimesF[4];
2811                    double a,b,c,n,invdenom;
2812                    double meanx,meany;
2813    
2814          currPMV->x = currMV->x - pmv[0].x;                  a = b = c = n = 0;
2815          currPMV->y = currMV->y - pmv[0].y;                  DtimesF[0] = DtimesF[1] = DtimesF[2] = DtimesF[3] = 0.;
2816          return iMinSAD;                  for (my = 1; my < (uint32_t)MBh-1; my++)
2817  }                  for (mx = 1; mx < (uint32_t)MBw-1; mx++)
   
   
 int32_t  
 EPZSSearch8(const uint8_t * const pRef,  
                         const uint8_t * const pRefH,  
                         const uint8_t * const pRefV,  
                         const uint8_t * const pRefHV,  
                         const IMAGE * const pCur,  
                         const int x,  
                         const int y,  
                         const int start_x,  
                         const int start_y,  
                         const uint32_t MotionFlags,  
                         const uint32_t iQuant,  
                         const uint32_t iFcode,  
                         const MBParam * const pParam,  
                         const MACROBLOCK * const pMBs,  
                         const MACROBLOCK * const prevMBs,  
                         VECTOR * const currMV,  
                         VECTOR * const currPMV)  
2818  {  {
2819  /* Please not that EPZS might not be a good choice for 8x8-block motion search ! */                          const int mbnum = mx + my * MBw;
2820                            const VECTOR mv = pMBs[mbnum].mvs[0];
         const uint32_t iWcount = pParam->mb_width;  
         const int32_t iWidth = pParam->width;  
         const int32_t iHeight = pParam->height;  
         const int32_t iEdgedWidth = pParam->edged_width;  
   
         const uint8_t *cur = pCur->y + x * 8 + y * 8 * iEdgedWidth;  
2821    
2822          int32_t iDiamondSize = 1;                          if (!pMBs[mbnum].mcsel)
2823                                    continue;
         int32_t min_dx;  
         int32_t max_dx;  
         int32_t min_dy;  
         int32_t max_dy;  
2824    
2825          VECTOR newMV;                          n++;
2826          VECTOR backupMV;                          a += 16*mx+8;
2827                            b += 16*my+8;
2828                            c += (16*mx+8)*(16*mx+8)+(16*my+8)*(16*my+8);
2829    
2830          VECTOR pmv[4];                          DtimesF[0] += (double)mv.x;
2831          int32_t psad[8];                          DtimesF[1] += (double)mv.x*(16*mx+8) + (double)mv.y*(16*my+8);
2832                            DtimesF[2] += (double)mv.x*(16*my+8) - (double)mv.y*(16*mx+8);
2833                            DtimesF[3] += (double)mv.y;
2834                    }
2835    
2836          const int32_t iSubBlock = ((y & 1) << 1) + (x & 1);          invdenom = a*a+b*b-c*n;
2837    
2838  //  const MACROBLOCK * const pMB = pMBs + (x>>1) + (y>>1) * iWcount;  /* Solve the system:    sol = (D'*E*D)^{-1} D'*E*F   */
2839          const MACROBLOCK *const prevMB = prevMBs + (x >> 1) + (y >> 1) * iWcount;  /* D'*E*F has been calculated in the same loop as matrix */
2840    
2841          int32_t bPredEq;          sol[0] = -c*DtimesF[0] + a*DtimesF[1] + b*DtimesF[2];
2842          int32_t iMinSAD, iSAD = 9999;          sol[1] =  a*DtimesF[0] - n*DtimesF[1]                           + b*DtimesF[3];
2843            sol[2] =  b*DtimesF[0]                          - n*DtimesF[2] - a*DtimesF[3];
2844            sol[3] =                                 b*DtimesF[1] - a*DtimesF[2] - c*DtimesF[3];
2845    
2846          MainSearch8FuncPtr MainSearchPtr;          sol[0] /= invdenom;
2847            sol[1] /= invdenom;
2848            sol[2] /= invdenom;
2849            sol[3] /= invdenom;
2850    
2851  /* Get maximum range */          meanx = meany = 0.;
2852          get_range(&min_dx, &max_dx, &min_dy, &max_dy, x, y, 8, iWidth, iHeight,          oldnum = 0;
2853                            iFcode);          for (my = 1; my < (uint32_t)MBh-1; my++)
2854                    for (mx = 1; mx < (uint32_t)MBw-1; mx++)
2855                    {
2856                            const int mbnum = mx + my * MBw;
2857                            const VECTOR mv = pMBs[mbnum].mvs[0];
2858    
2859  /* we work with abs. MVs, not relative to prediction, so get_range is called relative to 0,0 */                          if (!pMBs[mbnum].mcsel)
2860                                    continue;
2861    
2862          if (!(MotionFlags & PMV_HALFPEL8)) {                          oldnum++;
2863                  min_dx = EVEN(min_dx);                          meanx += fabs(( sol[0] + (16*mx+8)*sol[1] + (16*my+8)*sol[2] ) - (double)mv.x );
2864                  max_dx = EVEN(max_dx);                          meany += fabs(( sol[3] - (16*mx+8)*sol[2] + (16*my+8)*sol[1] ) - (double)mv.y );
                 min_dy = EVEN(min_dy);  
                 max_dy = EVEN(max_dy);  
2865          }          }
         /* because we might use something like IF (dx>max_dx) THEN dx=max_dx; */  
         bPredEq = get_pmvdata(pMBs, x >> 1, y >> 1, iWcount, iSubBlock, pmv, psad);  
2866    
2867            if (4*meanx > oldnum)   /* better fit than 0.25 (=1/4pel) is useless */
2868                    meanx /= oldnum;
2869            else
2870                    meanx = 0.25;
2871    
2872  /* Step 4: Calculate SAD around the Median prediction.          if (4*meany > oldnum)
2873          MinSAD=SAD                  meany /= oldnum;
2874          If Motion Vector equal to Previous frame motion vector          else
2875                  and MinSAD<PrevFrmSAD goto Step 10.                  meany = 0.25;
         If SAD<=256 goto Step 10.  
 */  
2876    
2877  // Prepare for main loop          num = 0;
2878            for (my = 0; my < (uint32_t)MBh; my++)
2879                    for (mx = 0; mx < (uint32_t)MBw; mx++)
2880                    {
2881                            const int mbnum = mx + my * MBw;
2882                            const VECTOR mv = pMBs[mbnum].mvs[0];
2883    
2884                            if (!pMBs[mbnum].mcsel)
2885                                    continue;
2886    
2887          if (!(MotionFlags & PMV_HALFPEL8)) {                          if  ( ( fabs(( sol[0] + (16*mx+8)*sol[1] + (16*my+8)*sol[2] ) - (double)mv.x ) > meanx )
2888                  currMV->x = EVEN(currMV->x);                                  || ( fabs(( sol[3] - (16*mx+8)*sol[2] + (16*my+8)*sol[1] ) - (double)mv.y ) > meany ) )
2889                  currMV->y = EVEN(currMV->y);                                  pMBs[mbnum].mcsel=0;
2890                            else
2891                                    num++;
2892          }          }
2893    
2894          if (currMV->x > max_dx)          } while ( (oldnum != num) && (num>= minblocks) );
                 currMV->x = max_dx;  
         if (currMV->x < min_dx)  
                 currMV->x = min_dx;  
         if (currMV->y > max_dy)  
                 currMV->y = max_dy;  
         if (currMV->y < min_dy)  
                 currMV->y = min_dy;  
   
 /***************** This is predictor SET A: only median prediction ******************/  
2895    
2896            if (num < minblocks)
2897            {
2898                    const int iEdgedWidth = pParam->edged_width;
2899                    num = 0;
2900    
2901          iMinSAD =  /*              fprintf(stderr,"Warning! Unreliable GME (%d/%d blocks), falling back to translation.\n",num,MBh*MBw);
2902                  sad8(cur,  */
2903                           get_ref_mv(pRef, pRefH, pRefV, pRefHV, x, y, 8, currMV,                  gmc.duv[0].x= gmc.duv[0].y= gmc.duv[1].x= gmc.duv[1].y= gmc.duv[2].x= gmc.duv[2].y=0;
                                                 iEdgedWidth), iEdgedWidth);  
         iMinSAD +=  
                 calc_delta_8(currMV->x - pmv[0].x, currMV->y - pmv[0].y,  
                                          (uint8_t) iFcode, iQuant);  
2904    
2905                    if (!(current->motion_flags & XVID_ME_GME_REFINE))
2906                            return gmc;
2907    
2908  // thresh1 is fixed to 256                  for (my = 1; my < (uint32_t)MBh-1; my++) /* ignore boundary blocks */
2909          if (iMinSAD < 256 / 4) {                  for (mx = 1; mx < (uint32_t)MBw-1; mx++) /* theirs MVs are often wrong */
2910                  if (MotionFlags & PMV_QUICKSTOP8)                  {
2911                          goto EPZS8_Terminate_without_Refine;                          const int mbnum = mx + my * MBw;
2912                  if (MotionFlags & PMV_EARLYSTOP8)                          MACROBLOCK *const pMB = &pMBs[mbnum];
2913                          goto EPZS8_Terminate_with_Refine;                          const uint8_t *const pCur = current->image.y + 16*(my*iEdgedWidth + mx);
2914                            if ( (sad16 ( pCur, pCur+1 , iEdgedWidth, 65536) >= gradx )
2915                             &&  (sad16 ( pCur, pCur+iEdgedWidth, iEdgedWidth, 65536) >= grady ) )
2916                             {      pMB->mcsel = 1;
2917                                    gmc.duv[0].x += pMB->mvs[0].x;
2918                                    gmc.duv[0].y += pMB->mvs[0].y;
2919                                    num++;
2920                             }
2921          }          }
2922    
2923  /************** This is predictor SET B: (0,0), prev.frame MV, neighbours **************/                  if (gmc.duv[0].x)
2924                            gmc.duv[0].x /= num;
2925                    if (gmc.duv[0].y)
2926                            gmc.duv[0].y /= num;
2927            } else {
2928    
2929  // MV=(0,0) is often a good choice                  gmc.duv[0].x=(int)(sol[0]+0.5);
2930          CHECK_MV8_ZERO;                  gmc.duv[0].y=(int)(sol[3]+0.5);
2931    
2932  // previous frame MV                  gmc.duv[1].x=(int)(sol[1]*pParam->width+0.5);
2933          CHECK_MV8_CANDIDATE(prevMB->mvs[iSubBlock].x, prevMB->mvs[iSubBlock].y);                  gmc.duv[1].y=(int)(-sol[2]*pParam->width+0.5);
2934    
2935  // left neighbour, if allowed                  gmc.duv[2].x=-gmc.duv[1].y;             /* two warp points only */
2936          if (psad[1] != MV_MAX_ERROR) {                  gmc.duv[2].y=gmc.duv[1].x;
                 if (!(MotionFlags & PMV_HALFPEL8)) {  
                         pmv[1].x = EVEN(pmv[1].x);  
                         pmv[1].y = EVEN(pmv[1].y);  
                 }  
                 CHECK_MV8_CANDIDATE(pmv[1].x, pmv[1].y);  
         }  
 // top neighbour, if allowed  
         if (psad[2] != MV_MAX_ERROR) {  
                 if (!(MotionFlags & PMV_HALFPEL8)) {  
                         pmv[2].x = EVEN(pmv[2].x);  
                         pmv[2].y = EVEN(pmv[2].y);  
2937                  }                  }
2938                  CHECK_MV8_CANDIDATE(pmv[2].x, pmv[2].y);          if (num>maxblocks)
2939            {       for (my = 1; my < (uint32_t)MBh-1; my++)
2940  // top right neighbour, if allowed                  for (mx = 1; mx < (uint32_t)MBw-1; mx++)
2941                  if (psad[3] != MV_MAX_ERROR) {                  {
2942                          if (!(MotionFlags & PMV_HALFPEL8)) {                          const int mbnum = mx + my * MBw;
2943                                  pmv[3].x = EVEN(pmv[3].x);                          if (pMBs[mbnum-1].mcsel)
2944                                  pmv[3].y = EVEN(pmv[3].y);                                  pMBs[mbnum].mcsel=0;
2945                            else
2946                                    if (pMBs[mbnum-MBw].mcsel)
2947                                            pMBs[mbnum].mcsel=0;
2948                          }                          }
                         CHECK_MV8_CANDIDATE(pmv[3].x, pmv[3].y);  
2949                  }                  }
2950            return gmc;
2951          }          }
2952    
2953  /*  // this bias is zero anyway, at the moment!  int
2954    GlobalMotionEstRefine(
2955          if ( (MVzero(*currMV)) && (!MVzero(pmv[0])) ) // && (iMinSAD <= iQuant * 96)                                  WARPPOINTS *const startwp,
2956                  iMinSAD -= MV8_00_BIAS;                                  MACROBLOCK * const pMBs,
2957                                    const MBParam * const pParam,
2958                                    const FRAMEINFO * const current,
2959                                    const FRAMEINFO * const reference,
2960                                    const IMAGE * const pCurr,
2961                                    const IMAGE * const pRef,
2962                                    const IMAGE * const pRefH,
2963                                    const IMAGE * const pRefV,
2964                                    const IMAGE * const pRefHV)
2965    {
2966            uint8_t* GMCblock = (uint8_t*)malloc(16*pParam->edged_width);
2967            WARPPOINTS bestwp=*startwp;
2968            WARPPOINTS centerwp,currwp;
2969            int gmcminSAD=0;
2970            int gmcSAD=0;
2971            int direction;
2972    //      int mx,my;
2973    
2974    /* use many blocks... */
2975    /*              for (my = 0; my < (uint32_t)pParam->mb_height; my++)
2976                    for (mx = 0; mx < (uint32_t)pParam->mb_width; mx++)
2977                    {
2978                            const int mbnum = mx + my * pParam->mb_width;
2979                            pMBs[mbnum].mcsel=1;
2980                    }
2981  */  */
2982    
2983  /* Terminate if MinSAD <= T_2  /* or rather don't use too many blocks... */
2984     Terminate if MV[t] == MV[t-1] and MinSAD[t] <= MinSAD[t-1]  /*
2985  */                  for (my = 1; my < (uint32_t)MBh-1; my++)
2986                    for (mx = 1; mx < (uint32_t)MBw-1; mx++)
2987                    {
2988                            const int mbnum = mx + my * MBw;
2989                            if (MBmask[mbnum-1])
2990                                    MBmask[mbnum-1]=0;
2991                            else
2992                                    if (MBmask[mbnum-MBw])
2993                                            MBmask[mbnum-1]=0;
2994    
         if (iMinSAD < 512 / 4) {        /* T_2 == 512/4 hardcoded */  
                 if (MotionFlags & PMV_QUICKSTOP8)  
                         goto EPZS8_Terminate_without_Refine;  
                 if (MotionFlags & PMV_EARLYSTOP8)  
                         goto EPZS8_Terminate_with_Refine;  
2995          }          }
2996    */
2997                    gmcminSAD = globalSAD(&bestwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
2998    
2999  /************ (Diamond Search)  **************/                  if ( (reference->coding_type == S_VOP)
3000                            && ( (reference->warp.duv[1].x != bestwp.duv[1].x)
3001          backupMV = *currMV;                     /* save best prediction, actually only for EXTSEARCH */                            || (reference->warp.duv[1].y != bestwp.duv[1].y)
3002                              || (reference->warp.duv[0].x != bestwp.duv[0].x)
3003          if (!(MotionFlags & PMV_HALFPELDIAMOND8))                            || (reference->warp.duv[0].y != bestwp.duv[0].y)
3004                  iDiamondSize *= 2;                            || (reference->warp.duv[2].x != bestwp.duv[2].x)
3005                              || (reference->warp.duv[2].y != bestwp.duv[2].y) ) )
3006                    {
3007                            gmcSAD = globalSAD(&reference->warp, pParam, pMBs,
3008                                                                    current, pRef, pCurr, GMCblock);
3009    
3010  /* default: use best prediction as starting point for one call of EPZS_MainSearch */                          if (gmcSAD < gmcminSAD)
3011                            {       bestwp = reference->warp;
3012                                    gmcminSAD = gmcSAD;
3013                            }
3014                    }
3015    
3016  // there is no EPZS^2 for inter4v at the moment          do {
3017                    direction = 0;
3018                    centerwp = bestwp;
3019    
3020  //  if (MotionFlags & PMV_USESQUARES8)                  currwp = centerwp;
 //      MainSearchPtr = Square8_MainSearch;  
 //  else  
3021    
3022          if (MotionFlags & PMV_ADVANCEDDIAMOND8)                  currwp.duv[0].x--;
3023                  MainSearchPtr = AdvDiamond8_MainSearch;                  gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3024                    if (gmcSAD < gmcminSAD)
3025                    {       bestwp = currwp;
3026                            gmcminSAD = gmcSAD;
3027                            direction = 1;
3028                    }
3029          else          else
3030                  MainSearchPtr = Diamond8_MainSearch;                  {
3031                    currwp = centerwp; currwp.duv[0].x++;
3032          iSAD =                  gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3033                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV->x,                  if (gmcSAD < gmcminSAD)
3034                                                    currMV->y, iMinSAD, &newMV, pmv, min_dx, max_dx,                  {       bestwp = currwp;
3035                                                    min_dy, max_dy, iEdgedWidth, iDiamondSize, iFcode,                          gmcminSAD = gmcSAD;
3036                                                    iQuant, 0);                          direction = 2;
3037                    }
3038                    }
3039          if (iSAD < iMinSAD) {                  if (direction) continue;
3040                  *currMV = newMV;  
3041                  iMinSAD = iSAD;                  currwp = centerwp; currwp.duv[0].y--;
3042                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3043                    if (gmcSAD < gmcminSAD)
3044                    {       bestwp = currwp;
3045                            gmcminSAD = gmcSAD;
3046                            direction = 4;
3047          }          }
3048                    else
3049          if (MotionFlags & PMV_EXTSEARCH8) {                  {
3050  /* extended mode: search (up to) two more times: orignal prediction and (0,0) */                  currwp = centerwp; currwp.duv[0].y++;
3051                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3052                  if (!(MVequal(pmv[0], backupMV))) {                  if (gmcSAD < gmcminSAD)
3053                          iSAD =                  {       bestwp = currwp;
3054                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y,                          gmcminSAD = gmcSAD;
3055                                                                    pmv[0].x, pmv[0].y, iMinSAD, &newMV, pmv,                          direction = 8;
3056                                                                    min_dx, max_dx, min_dy, max_dy, iEdgedWidth,                  }
3057                                                                    iDiamondSize, iFcode, iQuant, 0);                  }
3058                    if (direction) continue;
3059                          if (iSAD < iMinSAD) {  
3060                                  *currMV = newMV;                  currwp = centerwp; currwp.duv[1].x++;
3061                                  iMinSAD = iSAD;                  gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3062                    if (gmcSAD < gmcminSAD)
3063                    {       bestwp = currwp;
3064                            gmcminSAD = gmcSAD;
3065                            direction = 32;
3066                    }
3067                    currwp.duv[2].y++;
3068                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3069                    if (gmcSAD < gmcminSAD)
3070                    {       bestwp = currwp;
3071                            gmcminSAD = gmcSAD;
3072                            direction = 1024;
3073                    }
3074    
3075                    currwp = centerwp; currwp.duv[1].x--;
3076                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3077                    if (gmcSAD < gmcminSAD)
3078                    {       bestwp = currwp;
3079                            gmcminSAD = gmcSAD;
3080                            direction = 16;
3081                          }                          }
3082                    else
3083                    {
3084                    currwp = centerwp; currwp.duv[1].x++;
3085                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3086                    if (gmcSAD < gmcminSAD)
3087                    {       bestwp = currwp;
3088                            gmcminSAD = gmcSAD;
3089                            direction = 32;
3090                    }
3091                    }
3092                    if (direction) continue;
3093    
3094    
3095                    currwp = centerwp; currwp.duv[1].y--;
3096                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3097                    if (gmcSAD < gmcminSAD)
3098                    {       bestwp = currwp;
3099                            gmcminSAD = gmcSAD;
3100                            direction = 64;
3101                  }                  }
3102                    else
3103                  if ((!(MVzero(pmv[0]))) && (!(MVzero(backupMV)))) {                  {
3104                          iSAD =                  currwp = centerwp; currwp.duv[1].y++;
3105                                  (*MainSearchPtr) (pRef, pRefH, pRefV, pRefHV, cur, x, y, 0, 0,                  gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3106                                                                    iMinSAD, &newMV, pmv, min_dx, max_dx, min_dy,                  if (gmcSAD < gmcminSAD)
3107                                                                    max_dy, iEdgedWidth, iDiamondSize, iFcode,                  {       bestwp = currwp;
3108                                                                    iQuant, 0);                          gmcminSAD = gmcSAD;
3109                            direction = 128;
3110                          if (iSAD < iMinSAD) {                  }
3111                                  *currMV = newMV;                  }
3112                                  iMinSAD = iSAD;                  if (direction) continue;
3113    
3114                    currwp = centerwp; currwp.duv[2].x--;
3115                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3116                    if (gmcSAD < gmcminSAD)
3117                    {       bestwp = currwp;
3118                            gmcminSAD = gmcSAD;
3119                            direction = 256;
3120                          }                          }
3121                    else
3122                    {
3123                    currwp = centerwp; currwp.duv[2].x++;
3124                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3125                    if (gmcSAD < gmcminSAD)
3126                    {       bestwp = currwp;
3127                            gmcminSAD = gmcSAD;
3128                            direction = 512;
3129                    }
3130                    }
3131                    if (direction) continue;
3132    
3133                    currwp = centerwp; currwp.duv[2].y--;
3134                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3135                    if (gmcSAD < gmcminSAD)
3136                    {       bestwp = currwp;
3137                            gmcminSAD = gmcSAD;
3138                            direction = 1024;
3139                  }                  }
3140                    else
3141                    {
3142                    currwp = centerwp; currwp.duv[2].y++;
3143                    gmcSAD = globalSAD(&currwp, pParam, pMBs, current, pRef, pCurr, GMCblock);
3144                    if (gmcSAD < gmcminSAD)
3145                    {       bestwp = currwp;
3146                            gmcminSAD = gmcSAD;
3147                            direction = 2048;
3148          }          }
   
 /***************        Choose best MV found     **************/  
   
   EPZS8_Terminate_with_Refine:  
         if (MotionFlags & PMV_HALFPELREFINE8)   // perform final half-pel step  
                 iMinSAD =  
                         Halfpel8_Refine(pRef, pRefH, pRefV, pRefHV, cur, x, y, currMV,  
                                                         iMinSAD, pmv, min_dx, max_dx, min_dy, max_dy,  
                                                         iFcode, iQuant, iEdgedWidth);  
   
   EPZS8_Terminate_without_Refine:  
   
         currPMV->x = currMV->x - pmv[0].x;  
         currPMV->y = currMV->y - pmv[0].y;  
         return iMinSAD;  
3149  }  }
3150            } while (direction);
3151            free(GMCblock);
3152    
3153            *startwp = bestwp;
3154    
3155            return gmcminSAD;
3156    }
3157    
3158    int
3159    globalSAD(const WARPPOINTS *const wp,
3160  /* ***********************************************************                    const MBParam * const pParam,
3161          bvop motion estimation                    const MACROBLOCK * const pMBs,
3162  // TODO: need to incorporate prediction here (eg. sad += calc_delta_16)                    const FRAMEINFO * const current,
3163  ***************************************************************/                    const IMAGE * const pRef,
3164                      const IMAGE * const pCurr,
3165                      uint8_t *const GMCblock)
 void  
 MotionEstimationBVOP(MBParam * const pParam,  
                                          FRAMEINFO * const frame,  
                                          // forward (past) reference  
                                          const MACROBLOCK * const f_mbs,  
                                          const IMAGE * const f_ref,  
                                          const IMAGE * const f_refH,  
                                          const IMAGE * const f_refV,  
                                          const IMAGE * const f_refHV,  
                                          // backward (future) reference  
                                          const MACROBLOCK * const b_mbs,  
                                          const IMAGE * const b_ref,  
                                          const IMAGE * const b_refH,  
                                          const IMAGE * const b_refV,  
                                          const IMAGE * const b_refHV)  
3166  {  {
3167          const uint32_t mb_width = pParam->mb_width;          NEW_GMC_DATA gmc_data;
3168          const uint32_t mb_height = pParam->mb_height;          int iSAD, gmcSAD=0;
3169          const int32_t edged_width = pParam->edged_width;          int num=0;
3170            unsigned int mx, my;
3171    
3172          uint32_t i, j;          generate_GMCparameters( 3, 3, wp, pParam->width, pParam->height, &gmc_data);
3173    
3174          int32_t f_sad16;          for (my = 0; my < (uint32_t)pParam->mb_height; my++)
3175          int32_t b_sad16;                  for (mx = 0; mx < (uint32_t)pParam->mb_width; mx++) {
         int32_t i_sad16;  
         int32_t d_sad16;  
         int32_t best_sad;  
3176    
3177          VECTOR pmv_dontcare;                  const int mbnum = mx + my * pParam->mb_width;
3178                    const int iEdgedWidth = pParam->edged_width;
3179    
3180          // note: i==horizontal, j==vertical                  if (!pMBs[mbnum].mcsel)
         for (j = 0; j < mb_height; j++) {  
                 for (i = 0; i < mb_width; i++) {  
                         MACROBLOCK *mb = &frame->mbs[i + j * mb_width];  
                         const MACROBLOCK *f_mb = &f_mbs[i + j * mb_width];  
                         const MACROBLOCK *b_mb = &b_mbs[i + j * mb_width];  
   
                         if (b_mb->mode == MODE_INTER && b_mb->cbp == 0 &&  
                                 b_mb->mvs[0].x == 0 && b_mb->mvs[0].y == 0) {  
                                 mb->mode = MODE_NOT_CODED;  
                                 mb->mvs[0].x = 0;  
                                 mb->mvs[0].y = 0;  
                                 mb->b_mvs[0].x = 0;  
                                 mb->b_mvs[0].y = 0;  
3181                                  continue;                                  continue;
                         }  
   
                         // forward search  
                         f_sad16 =  
                                 SEARCH16(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,  
                                                  &frame->image, i, j, frame->motion_flags,  
                                                  frame->quant, frame->fcode, pParam, f_mbs,  
                                                  f_mbs /* todo */ ,  
                                                  &mb->mvs[0], &pmv_dontcare);   // ignore pmv  
   
                         // backward search  
                         b_sad16 = SEARCH16(b_ref->y, b_refH->y, b_refV->y, b_refHV->y, &frame->image, i, j, frame->motion_flags, frame->quant, frame->bcode, pParam, b_mbs, b_mbs,      /* todo */  
                                                            &mb->b_mvs[0], &pmv_dontcare);       // ignore pmv  
   
                         // interpolate search (simple, but effective)  
                         i_sad16 = 65535;  
   
                         /*  
                         x/y range somewhat buggy  
                         i_sad16 =  
                                 sad16bi_c(frame->image.y + i * 16 + j * 16 * edged_width,  
                                                   get_ref(f_ref->y, f_refH->y, f_refV->y, f_refHV->y,  
                                                                   i, j, 16, mb->mvs[0].x, mb->mvs[0].y,  
                                                                   edged_width), get_ref(b_ref->y, b_refH->y,  
                                                                                                                 b_refV->y, b_refHV->y,  
                                                                                                                 i, j, 16,  
                                                                                                                 mb->b_mvs[0].x,  
                                                                                                                 mb->b_mvs[0].x,  
                                                                                                                 edged_width),  
                                                   edged_width);  
                         */  
   
                         // TODO: direct search  
                         // predictor + range of [-32,32]  
                         d_sad16 = 65535;  
3182    
3183                    gmc_data.predict_16x16(&gmc_data, GMCblock,
3184                          if (f_sad16 < b_sad16) {                                                  pRef->y,
3185                                  best_sad = f_sad16;                                                  iEdgedWidth,
3186                                  mb->mode = MODE_FORWARD;                                                  iEdgedWidth,
3187                          } else {                                                  mx, my,
3188                                  best_sad = b_sad16;                                                  pParam->m_rounding_type);
3189                                  mb->mode = MODE_BACKWARD;  
3190                          }                  iSAD = sad16 ( pCurr->y + 16*(my*iEdgedWidth + mx),
3191                                                    GMCblock , iEdgedWidth, 65536);
3192                          if (i_sad16 < best_sad) {                  iSAD -= pMBs[mbnum].sad16;
3193                                  best_sad = i_sad16;  
3194                                  mb->mode = MODE_INTERPOLATE;                  if (iSAD<0)
3195                            gmcSAD += iSAD;
3196                    num++;
3197                          }                          }
3198            return gmcSAD;
                         if (d_sad16 < best_sad) {  
                                 best_sad = d_sad16;  
                                 mb->mode = MODE_DIRECT;  
3199                          }                          }
3200    
                 }  
         }  
 }  

Legend:
Removed from v.232  
changed lines
  Added in v.1133

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4