[svn] / trunk / xvidcore / src / motion / estimation_bvop.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/src/motion/estimation_bvop.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1567, Wed Dec 8 12:43:48 2004 UTC revision 2051, Tue Oct 25 10:56:22 2011 UTC
# Line 4  Line 4 
4   *  - Motion Estimation for B-VOPs  -   *  - Motion Estimation for B-VOPs  -
5   *   *
6   *  Copyright(C) 2002 Christoph Lampert <gruel@web.de>   *  Copyright(C) 2002 Christoph Lampert <gruel@web.de>
7   *               2002 Michael Militzer <michael@xvid.org>   *               2002-2010 Michael Militzer <michael@xvid.org>
8   *               2002-2003 Radoslaw Czyz <xvid@syskin.cjb.net>   *               2002-2003 Radoslaw Czyz <xvid@syskin.cjb.net>
9   *   *
10   *  This program is free software ; you can redistribute it and/or modify   *  This program is free software ; you can redistribute it and/or modify
# Line 21  Line 21 
21   *  along with this program ; if not, write to the Free Software   *  along with this program ; if not, write to the Free Software
22   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
23   *   *
24   * $Id: estimation_bvop.c,v 1.18 2004-12-08 12:43:48 syskin Exp $   * $Id$
25   *   *
26   ****************************************************************************/   ****************************************************************************/
27    
# Line 141  Line 141 
141                   + d_mv_bits(xb, yb, data->bpredMV, data->iFcode, data->qpel^data->qpel_precision);                   + d_mv_bits(xb, yb, data->bpredMV, data->iFcode, data->qpel^data->qpel_precision);
142    
143          sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);          sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
144          sad += (data->lambda16 * t * sad)>>10;          sad += (data->lambda16 * t);
145    
146          if (data->chroma && sad < *data->iMinSAD)          if (data->chroma && sad < *data->iMinSAD)
147                  sad += ChromaSAD2((xcf >> 1) + roundtab_79[xcf & 0x3],                  sad += ChromaSAD2((xcf >> 1) + roundtab_79[xcf & 0x3],
# Line 207  Line 207 
207                  if (sad > *(data->iMinSAD)) return;                  if (sad > *(data->iMinSAD)) return;
208          }          }
209    
210          sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0) * sad)>>10;          sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0));
211    
212          if (data->chroma && sad < *data->iMinSAD)          if (data->chroma && sad < *data->iMinSAD)
213                  sad += ChromaSAD2((xcf >> 3) + roundtab_76[xcf & 0xf],                  sad += ChromaSAD2((xcf >> 3) + roundtab_76[xcf & 0xf],
# Line 265  Line 265 
265    
266  done:  done:
267          sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);          sad = sad16bi(data->Cur, ReferenceF, ReferenceB, data->iEdgedWidth);
268          sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0) * sad)>>10;          sad += (data->lambda16 * d_mv_bits(x, y, zeroMV, 1, 0));
269    
270          if (data->chroma && sad < *data->iMinSAD)          if (data->chroma && sad < *data->iMinSAD)
271                  sad += ChromaSAD2((xcf >> 3) + roundtab_76[xcf & 0xf],                  sad += ChromaSAD2((xcf >> 3) + roundtab_76[xcf & 0xf],
# Line 304  Line 304 
304                                          data->qpel^data->qpel_precision);                                          data->qpel^data->qpel_precision);
305    
306          sad = sad16(data->Cur, Reference, data->iEdgedWidth, 256*4096);          sad = sad16(data->Cur, Reference, data->iEdgedWidth, 256*4096);
307          sad += (data->lambda16 * t * sad)>>10;          sad += (data->lambda16 * t);
308    
309          if (data->chroma && sad < *data->iMinSAD)          if (data->chroma && sad < *data->iMinSAD)
310                  sad += xvid_me_ChromaSAD((xc >> 1) + roundtab_79[xc & 0x3],                  sad += xvid_me_ChromaSAD((xc >> 1) + roundtab_79[xc & 0x3],
# Line 396  Line 396 
396                                                          const uint32_t iWcount,                                                          const uint32_t iWcount,
397                                                          const MACROBLOCK * const pMB,                                                          const MACROBLOCK * const pMB,
398                                                          const uint32_t mode_curr,                                                          const uint32_t mode_curr,
399                                                          const VECTOR hint)                                                          const VECTOR hint, const int bound)
400  {  {
401            int lx, ly;             /* left */
402            int tx, ty;             /* top */
403            int rtx, rty;   /* top-right */
404            int ltx, lty;   /* top-left */
405            int lpos, tpos, rtpos, ltpos;
406    
407            lx  = x - 1;    ly  = y;
408            tx  = x;                ty  = y - 1;
409            rtx = x + 1;    rty = y - 1;
410            ltx = x - 1;    lty = y - 1;
411    
412            lpos  =  lx +  ly * iWcount;
413            rtpos = rtx + rty * iWcount;
414            tpos  =  tx +  ty * iWcount;
415            ltpos = ltx + lty * iWcount;
416    
417    
418          /* [0] is prediction */          /* [0] is prediction */
419          /* [1] is zero */          /* [1] is zero */
420          pmv[1].x = pmv[1].y = 0;          pmv[1].x = pmv[1].y = 0;
421    
422          pmv[2].x = hint.x; pmv[2].y = hint.y;          pmv[2].x = hint.x; pmv[2].y = hint.y;
423    
424          if ((y != 0)&&(x != (int)(iWcount+1))) {                        /* [3] top-right neighbour */          if (rtpos >= bound && rtx < (int)iWcount) {                     /* [3] top-right neighbour */
425                  pmv[3] = ChoosePred(pMB+1-iWcount, mode_curr);                  pmv[3] = ChoosePred(pMB+1-iWcount, mode_curr);
426          } else pmv[3].x = pmv[3].y = 0;          } else pmv[3].x = pmv[3].y = 0;
427    
428          if (y != 0) {          if (tpos >= bound) {
429                  pmv[4] = ChoosePred(pMB-iWcount, mode_curr);                  pmv[4] = ChoosePred(pMB-iWcount, mode_curr);    /* [4] top */
430          } else pmv[4].x = pmv[4].y = 0;          } else pmv[4].x = pmv[4].y = 0;
431    
432          if (x != 0) {          if (lpos >= bound && lx >= 0) {
433                  pmv[5] = ChoosePred(pMB-1, mode_curr);                  pmv[5] = ChoosePred(pMB-1, mode_curr);                  /* [5] left */
434          } else pmv[5].x = pmv[5].y = 0;          } else pmv[5].x = pmv[5].y = 0;
435    
436          if (x != 0 && y != 0) {          if (ltpos >= bound && ltx >= 0) {
437                  pmv[6] = ChoosePred(pMB-1-iWcount, mode_curr);                  pmv[6] = ChoosePred(pMB-1-iWcount, mode_curr);  /* [6] top-left */
438          } else pmv[6].x = pmv[6].y = 0;          } else pmv[6].x = pmv[6].y = 0;
439  }  }
440    
# Line 432  Line 449 
449                          int32_t * const best_sad,                          int32_t * const best_sad,
450                          const int32_t mode_current,                          const int32_t mode_current,
451                          SearchData * const Data,                          SearchData * const Data,
452                          VECTOR hint)                          VECTOR hint, const int bound)
453  {  {
454    
455          int i;          int i;
# Line 451  Line 468 
468                  hint.x /= 2; hint.y /= 2;                  hint.x /= 2; hint.y /= 2;
469          }          }
470    
471          PreparePredictionsBF(pmv, x, y, pParam->mb_width, pMB, mode_current, hint);          PreparePredictionsBF(pmv, x, y, pParam->mb_width, pMB, mode_current, hint, bound);
472    
473          Data->currentMV->x = Data->currentMV->y = 0;          Data->currentMV->x = Data->currentMV->y = 0;
474    
# Line 793  Line 810 
810  }  }
811    
812  static void  static void
813    SearchInterpolate_final_fast(const int x, const int y,
814                                                             const uint32_t MotionFlags,
815                                                             const MBParam * const pParam,
816                                                             int32_t * const best_sad,
817                                                             SearchData * const Data)
818    {
819            /* qpel refinement */
820            if (Data->qpel) {
821                    Data->qpel_precision = 1;
822                    get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy,
823                            x, y, 4, pParam->width, pParam->height, Data->iFcode, 2);
824    
825                    Data->currentQMV[0].x = 2 * Data->currentMV[0].x;
826                    Data->currentQMV[0].y = 2 * Data->currentMV[0].y;
827                    Data->currentQMV[1].x = 2 * Data->currentMV[1].x;
828                    Data->currentQMV[1].y = 2 * Data->currentMV[1].y;
829            }
830    }
831    
832    static void
833  ModeDecision_BVOP_SAD(const SearchData * const Data_d,  ModeDecision_BVOP_SAD(const SearchData * const Data_d,
834                                            const SearchData * const Data_b,                                            const SearchData * const Data_b,
835                                            const SearchData * const Data_f,                                            const SearchData * const Data_f,
# Line 800  Line 837 
837                                            MACROBLOCK * const pMB,                                            MACROBLOCK * const pMB,
838                                            const MACROBLOCK * const b_mb,                                            const MACROBLOCK * const b_mb,
839                                            VECTOR * f_predMV,                                            VECTOR * f_predMV,
840                                            VECTOR * b_predMV)                                            VECTOR * b_predMV,
841                                              int force_direct)
842  {  {
843          int mode = MODE_DIRECT, k;          int mode = MODE_DIRECT, k;
844          int best_sad, f_sad, b_sad, i_sad;          int best_sad, f_sad, b_sad, i_sad;
# Line 812  Line 850 
850          f_sad = Data_f->iMinSAD[0] + 4*Data_d->lambda16;          f_sad = Data_f->iMinSAD[0] + 4*Data_d->lambda16;
851          i_sad = Data_i->iMinSAD[0] + 2*Data_d->lambda16;          i_sad = Data_i->iMinSAD[0] + 2*Data_d->lambda16;
852    
853            if (force_direct)
854                    goto set_mode; /* bypass checks for non-direct modes */
855    
856          if (b_sad < best_sad) {          if (b_sad < best_sad) {
857                  mode = MODE_BACKWARD;                  mode = MODE_BACKWARD;
858                  best_sad = b_sad;                  best_sad = b_sad;
# Line 827  Line 868 
868                  best_sad = i_sad;                  best_sad = i_sad;
869          }          }
870    
871    set_mode:
872          pMB->sad16 = best_sad;          pMB->sad16 = best_sad;
873          pMB->mode = mode;          pMB->mode = mode;
874            pMB->cbp = 63;
875    
876          switch (mode) {          switch (mode) {
877    
# Line 960  Line 1003 
1003                                           const IMAGE * const b_ref,                                           const IMAGE * const b_ref,
1004                                           const IMAGE * const b_refH,                                           const IMAGE * const b_refH,
1005                                           const IMAGE * const b_refV,                                           const IMAGE * const b_refV,
1006                                           const IMAGE * const b_refHV)                                           const IMAGE * const b_refHV,
1007                                             const int num_slices)
1008  {  {
1009          uint32_t i, j;          uint32_t i, j;
1010          int32_t best_sad = 256*4096;          int32_t best_sad = 256*4096;
         int32_t sad2;  
1011          uint32_t skip_sad;          uint32_t skip_sad;
1012            int fb_thresh;
1013          const MACROBLOCK * const b_mbs = b_reference->mbs;          const MACROBLOCK * const b_mbs = b_reference->mbs;
1014    
1015          VECTOR f_predMV, b_predMV;          VECTOR f_predMV, b_predMV;
1016    
1017            int mb_width = pParam->mb_width;
1018            int mb_height = pParam->mb_height;
1019          int MVmaxF = 0, MVmaxB = 0;          int MVmaxF = 0, MVmaxB = 0;
1020          const int32_t TRB = time_pp - time_bp;          const int32_t TRB = time_pp - time_bp;
1021          const int32_t TRD = time_pp;          const int32_t TRD = time_pp;
# Line 985  Line 1030 
1030          Data_d.rounding = 0;          Data_d.rounding = 0;
1031          Data_d.chroma = frame->motion_flags & XVID_ME_CHROMA_BVOP;          Data_d.chroma = frame->motion_flags & XVID_ME_CHROMA_BVOP;
1032          Data_d.iQuant = frame->quant;          Data_d.iQuant = frame->quant;
1033            Data_d.quant_sq = frame->quant*frame->quant;
1034          Data_d.dctSpace = dct_space;          Data_d.dctSpace = dct_space;
1035          Data_d.quant_type = !(pParam->vol_flags & XVID_VOL_MPEGQUANT);          Data_d.quant_type = !(pParam->vol_flags & XVID_VOL_MPEGQUANT);
1036          Data_d.mpeg_quant_matrices = pParam->mpeg_quant_matrices;          Data_d.mpeg_quant_matrices = pParam->mpeg_quant_matrices;
# Line 999  Line 1045 
1045          Data_b.iFcode = Data_i.bFcode = frame->bcode = b_reference->fcode;          Data_b.iFcode = Data_i.bFcode = frame->bcode = b_reference->fcode;
1046    
1047          for (j = 0; j < pParam->mb_height; j++) {          for (j = 0; j < pParam->mb_height; j++) {
1048                    int new_bound = mb_width * ((((j*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1049    
1050                  f_predMV = b_predMV = zeroMV;   /* prediction is reset at left boundary */                  f_predMV = b_predMV = zeroMV;   /* prediction is reset at left boundary */
1051    
1052                  for (i = 0; i < pParam->mb_width; i++) {                  for (i = 0; i < pParam->mb_width; i++) {
1053                          MACROBLOCK * const pMB = frame->mbs + i + j * pParam->mb_width;                          MACROBLOCK * const pMB = frame->mbs + i + j * pParam->mb_width;
1054                          const MACROBLOCK * const b_mb = b_mbs + i + j * pParam->mb_width;                          const MACROBLOCK * const b_mb = b_mbs + i + j * pParam->mb_width;
1055                            int force_direct = (((j*mb_width+i)==new_bound) && (j > 0)) ? 1 : 0; /* MTK decoder chipsets do NOT reset predMVs upon resync marker in BVOPs. We workaround this problem
1056                                                                                                                                                                        by placing the slice border on second MB in a row and then force the first MB to be direct mode */
1057    
1058                          pMB->mode = -1;                          pMB->mode = -1;
1059    
1060                          initialize_searchData(&Data_d, &Data_f, &Data_b, &Data_i,                          initialize_searchData(&Data_d, &Data_f, &Data_b, &Data_i,
# Line 1028  Line 1078 
1078    
1079                          if (pMB->mode == MODE_DIRECT_NONE_MV) {                          if (pMB->mode == MODE_DIRECT_NONE_MV) {
1080                                  pMB->sad16 = best_sad;                                  pMB->sad16 = best_sad;
1081                                    pMB->cbp = 0;
1082                                  continue;                                  continue;
1083                          }                          }
1084    
1085                          SearchBF_initial(i, j, frame->motion_flags, frame->fcode, pParam, pMB,                          SearchBF_initial(i, j, frame->motion_flags, frame->fcode, pParam, pMB,
1086                                                  &f_predMV, &best_sad, MODE_FORWARD, &Data_f, Data_d.currentMV[1]);                                                  &f_predMV, &best_sad, MODE_FORWARD, &Data_f, Data_d.currentMV[1], new_bound);
1087    
1088                          SearchBF_initial(i, j, frame->motion_flags, frame->bcode, pParam, pMB,                          SearchBF_initial(i, j, frame->motion_flags, frame->bcode, pParam, pMB,
1089                                                  &b_predMV, &best_sad, MODE_BACKWARD, &Data_b, Data_d.currentMV[2]);                                                  &b_predMV, &best_sad, MODE_BACKWARD, &Data_b, Data_d.currentMV[2], new_bound);
1090    
1091                          sad2 = best_sad;                          if (frame->motion_flags&XVID_ME_BFRAME_EARLYSTOP)
1092                                    fb_thresh = best_sad;
1093                            else
1094                                    fb_thresh = best_sad + (best_sad>>1);
1095    
1096                          if (Data_f.iMinSAD[0] < 2*sad2+2000)                          if (Data_f.iMinSAD[0] <= fb_thresh)
1097                                  SearchBF_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_f);                                  SearchBF_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_f);
1098    
1099                          if (Data_b.iMinSAD[0] < 2*sad2+2000)                          if (Data_b.iMinSAD[0] <= fb_thresh)
1100                                  SearchBF_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_b);                                  SearchBF_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_b);
1101    
1102                          SearchInterpolate_initial(i, j, frame->motion_flags, pParam, &f_predMV, &b_predMV, &best_sad,                          SearchInterpolate_initial(i, j, frame->motion_flags, pParam, &f_predMV, &b_predMV, &best_sad,
1103                                                                    &Data_i, Data_f.currentMV[0], Data_b.currentMV[0]);                                                                    &Data_i, Data_f.currentMV[0], Data_b.currentMV[0]);
1104    
1105                          if (((Data_i.iMinSAD[0] < 2*best_sad+2000) && !(frame->motion_flags&XVID_ME_FAST_MODEINTERPOLATE))                          if (((Data_i.iMinSAD[0] < best_sad +(best_sad>>3)) && !(frame->motion_flags&XVID_ME_FAST_MODEINTERPOLATE))
1106                                  || Data_i.iMinSAD[0] <= best_sad)                                  || Data_i.iMinSAD[0] <= best_sad) {
1107    
1108                                  SearchInterpolate_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_i);                                  SearchInterpolate_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_i);
1109                            }
1110                            else {
1111                                    SearchInterpolate_final_fast(i, j, frame->motion_flags, pParam, &best_sad, &Data_i);
1112                            }
1113    
1114                            if (Data_d.iMinSAD[0] <= 2*best_sad)
1115                                    if ((!(frame->motion_flags&XVID_ME_SKIP_DELTASEARCH) && (best_sad > 750))
1116                                            || (best_sad > 1000))
1117    
                         if ((Data_d.iMinSAD[0] <= 2*best_sad) && (!frame->motion_flags&XVID_ME_SKIP_DELTASEARCH))  
1118                                  SearchDirect_final(frame->motion_flags, b_mb, &best_sad, &Data_d);                                  SearchDirect_final(frame->motion_flags, b_mb, &best_sad, &Data_d);
1119    
1120                          /* final skip decision */                          /* final skip decision */
# Line 1066  Line 1127 
1127    
1128                                  if (pMB->mode == MODE_DIRECT_NONE_MV) { /* skipped? */                                  if (pMB->mode == MODE_DIRECT_NONE_MV) { /* skipped? */
1129                                          pMB->sad16 = skip_sad;                                          pMB->sad16 = skip_sad;
1130                                            pMB->cbp = 0;
1131                                          continue;                                          continue;
1132                                  }                                  }
1133                          }                          }
1134    
1135                          if (frame->vop_flags & XVID_VOP_RD_BVOP)                          if (frame->vop_flags & XVID_VOP_RD_BVOP)
1136                                  ModeDecision_BVOP_RD(&Data_d, &Data_b, &Data_f, &Data_i,                                  ModeDecision_BVOP_RD(&Data_d, &Data_b, &Data_f, &Data_i,
1137                                          pMB, b_mb, &f_predMV, &b_predMV, frame->motion_flags, pParam, i, j);                                          pMB, b_mb, &f_predMV, &b_predMV, frame->motion_flags, frame->vop_flags, pParam, i, j, best_sad, force_direct);
1138                          else                          else
1139                                  ModeDecision_BVOP_SAD(&Data_d, &Data_b, &Data_f, &Data_i, pMB, b_mb, &f_predMV, &b_predMV);                                  ModeDecision_BVOP_SAD(&Data_d, &Data_b, &Data_f, &Data_i, pMB, b_mb, &f_predMV, &b_predMV, force_direct);
1140    
1141                          maxMotionBVOP(&MVmaxF, &MVmaxB, pMB, Data_d.qpel);                          maxMotionBVOP(&MVmaxF, &MVmaxB, pMB, Data_d.qpel);
1142    
# Line 1084  Line 1146 
1146          frame->fcode = getMinFcode(MVmaxF);          frame->fcode = getMinFcode(MVmaxF);
1147          frame->bcode = getMinFcode(MVmaxB);          frame->bcode = getMinFcode(MVmaxB);
1148  }  }
1149    
1150    
1151    
1152    void
1153    SMPMotionEstimationBVOP(SMPData * h)
1154    {
1155            Encoder *pEnc = (Encoder *) h->pEnc;
1156    
1157            const MBParam * const pParam = &pEnc->mbParam;
1158            const FRAMEINFO * const frame = h->current;
1159            const int32_t time_bp = (int32_t)(pEnc->current->stamp - frame->stamp);
1160            const int32_t time_pp = (int32_t)(pEnc->current->stamp - pEnc->reference->stamp);
1161            /* forward (past) reference */
1162            const IMAGE * const f_ref = &pEnc->reference->image;
1163            const IMAGE * const f_refH = &pEnc->f_refh;
1164            const IMAGE * const f_refV = &pEnc->f_refv;
1165            const IMAGE * const f_refHV = &pEnc->f_refhv;
1166            /* backward (future) reference */
1167            const FRAMEINFO * const b_reference = pEnc->current;
1168            const IMAGE * const b_ref = &pEnc->current->image;
1169            const IMAGE * const b_refH = &pEnc->vInterH;
1170            const IMAGE * const b_refV = &pEnc->vInterV;
1171            const IMAGE * const b_refHV = &pEnc->vInterHV;
1172    
1173            int mb_width = pParam->mb_width;
1174            int mb_height = pParam->mb_height;
1175            int num_slices = pEnc->num_slices;
1176            int y_row = h->y_row;
1177            int y_step = h->y_step;
1178            int start_y = h->start_y;
1179            int stop_y = h->stop_y;
1180            int * complete_count_self = h->complete_count_self;
1181            const int * complete_count_above = h->complete_count_above;
1182            int max_mbs;
1183            int current_mb = 0;
1184    
1185            int32_t i, j;
1186            int32_t best_sad = 256*4096;
1187            uint32_t skip_sad;
1188            int fb_thresh;
1189            const MACROBLOCK * const b_mbs = b_reference->mbs;
1190    
1191            VECTOR f_predMV, b_predMV;
1192    
1193            int MVmaxF = 0, MVmaxB = 0;
1194            const int32_t TRB = time_pp - time_bp;
1195            const int32_t TRD = time_pp;
1196            DECLARE_ALIGNED_MATRIX(dct_space, 3, 64, int16_t, CACHE_LINE);
1197    
1198            /* some pre-inintialized data for the rest of the search */
1199            SearchData Data_d, Data_f, Data_b, Data_i;
1200            memset(&Data_d, 0, sizeof(SearchData));
1201    
1202            Data_d.iEdgedWidth = pParam->edged_width;
1203            Data_d.qpel = pParam->vol_flags & XVID_VOL_QUARTERPEL ? 1 : 0;
1204            Data_d.rounding = 0;
1205            Data_d.chroma = frame->motion_flags & XVID_ME_CHROMA_BVOP;
1206            Data_d.iQuant = frame->quant;
1207            Data_d.quant_sq = frame->quant*frame->quant;
1208            Data_d.dctSpace = dct_space;
1209            Data_d.quant_type = !(pParam->vol_flags & XVID_VOL_MPEGQUANT);
1210            Data_d.mpeg_quant_matrices = pParam->mpeg_quant_matrices;
1211    
1212            Data_d.RefQ = h->RefQ;
1213    
1214            memcpy(&Data_f, &Data_d, sizeof(SearchData));
1215            memcpy(&Data_b, &Data_d, sizeof(SearchData));
1216            memcpy(&Data_i, &Data_d, sizeof(SearchData));
1217    
1218            Data_f.iFcode = Data_i.iFcode = frame->fcode;
1219            Data_b.iFcode = Data_i.bFcode = frame->bcode;
1220    
1221            max_mbs = 0;
1222    
1223            for (j = (start_y+y_row); j < stop_y; j += y_step) {
1224                    int new_bound = mb_width * ((((j*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1225    
1226                    if (j == start_y) max_mbs = pParam->mb_width; /* we can process all blocks of the first row */
1227    
1228                    f_predMV = b_predMV = zeroMV;   /* prediction is reset at left boundary */
1229    
1230                    for (i = 0; i < (int) pParam->mb_width; i++) {
1231                            MACROBLOCK * const pMB = frame->mbs + i + j * pParam->mb_width;
1232                            const MACROBLOCK * const b_mb = b_mbs + i + j * pParam->mb_width;
1233                            int force_direct = (((j*mb_width+i)==new_bound) && (j > 0)) ? 1 : 0; /* MTK decoder chipsets do NOT reset predMVs upon resync marker in BVOPs. We workaround this problem
1234                                                                                                                                                                        by placing the slice border on second MB in a row and then force the first MB to be direct mode */
1235                            pMB->mode = -1;
1236    
1237                            initialize_searchData(&Data_d, &Data_f, &Data_b, &Data_i,
1238                                              i, j, f_ref, f_refH->y, f_refV->y, f_refHV->y,
1239                                              b_ref, b_refH->y, b_refV->y, b_refHV->y,
1240                                              &frame->image, b_mb);
1241    
1242                            if (current_mb >= max_mbs) {
1243                                    /* we ME-ed all macroblocks we safely could. grab next portion */
1244                                    int above_count = *complete_count_above; /* sync point */
1245                                    if (above_count == pParam->mb_width) {
1246                                            /* full line above is ready */
1247                                            above_count = pParam->mb_width+1;
1248                                            if (j < stop_y-y_step) {
1249                                                    /* this is not last line, grab a portion of MBs from the next line too */
1250                                                    above_count += MAX(0, complete_count_above[1] - 1);
1251                                            }
1252                                    }
1253    
1254                                    max_mbs = current_mb + above_count - i - 1;
1255    
1256                                    if (current_mb >= max_mbs) {
1257                                            /* current workload is zero */
1258                                            i--;
1259                                            sched_yield();
1260                                            continue;
1261                                    }
1262                            }
1263    
1264    /* special case, if collocated block is SKIPed in P-VOP: encoding is forward (0,0), cpb=0 without further ado */
1265                            if (b_reference->coding_type != S_VOP)
1266                                    if (b_mb->mode == MODE_NOT_CODED) {
1267                                            pMB->mode = MODE_NOT_CODED;
1268                                            pMB->mvs[0] = pMB->b_mvs[0] = zeroMV;
1269                                            pMB->sad16 = 0;
1270                                            *complete_count_self = i+1;
1271                                            current_mb++;
1272                                            continue;
1273                                    }
1274    
1275    /* direct search comes first, because it (1) checks for SKIP-mode
1276            and (2) sets very good predictions for forward and backward search */
1277                            skip_sad = SearchDirect_initial(i, j, frame->motion_flags, TRB, TRD, pParam, pMB,
1278                                                                                            b_mb, &best_sad, &Data_d);
1279    
1280                            if (pMB->mode == MODE_DIRECT_NONE_MV) {
1281                                    pMB->sad16 = best_sad;
1282                                    pMB->cbp = 0;
1283                                    *complete_count_self = i+1;
1284                                    current_mb++;
1285                                    continue;
1286                            }
1287    
1288                            SearchBF_initial(i, j, frame->motion_flags, frame->fcode, pParam, pMB,
1289                                                    &f_predMV, &best_sad, MODE_FORWARD, &Data_f, Data_d.currentMV[1], new_bound);
1290    
1291                            SearchBF_initial(i, j, frame->motion_flags, frame->bcode, pParam, pMB,
1292                                                    &b_predMV, &best_sad, MODE_BACKWARD, &Data_b, Data_d.currentMV[2], new_bound);
1293    
1294                            if (frame->motion_flags&XVID_ME_BFRAME_EARLYSTOP)
1295                                    fb_thresh = best_sad;
1296                            else
1297                                    fb_thresh = best_sad + (best_sad>>1);
1298    
1299                            if (Data_f.iMinSAD[0] <= fb_thresh)
1300                                    SearchBF_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_f);
1301    
1302                            if (Data_b.iMinSAD[0] <= fb_thresh)
1303                                    SearchBF_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_b);
1304    
1305                            SearchInterpolate_initial(i, j, frame->motion_flags, pParam, &f_predMV, &b_predMV, &best_sad,
1306                                                                      &Data_i, Data_f.currentMV[0], Data_b.currentMV[0]);
1307    
1308                            if (((Data_i.iMinSAD[0] < best_sad +(best_sad>>3)) && !(frame->motion_flags&XVID_ME_FAST_MODEINTERPOLATE))
1309                                    || Data_i.iMinSAD[0] <= best_sad)
1310    
1311                                    SearchInterpolate_final(i, j, frame->motion_flags, pParam, &best_sad, &Data_i);
1312    
1313                            if (Data_d.iMinSAD[0] <= 2*best_sad)
1314                                    if ((!(frame->motion_flags&XVID_ME_SKIP_DELTASEARCH) && (best_sad > 750))
1315                                            || (best_sad > 1000))
1316    
1317                                            SearchDirect_final(frame->motion_flags, b_mb, &best_sad, &Data_d);
1318    
1319                            /* final skip decision */
1320                            if ( (skip_sad < 2 * Data_d.iQuant * MAX_SAD00_FOR_SKIP )
1321                                    && ((100*best_sad)/(skip_sad+1) > FINAL_SKIP_THRESH) ) {
1322    
1323                                    Data_d.chromaSAD = 0; /* green light for chroma check */
1324    
1325                                    SkipDecisionB(pMB, &Data_d);
1326    
1327                                    if (pMB->mode == MODE_DIRECT_NONE_MV) { /* skipped? */
1328                                            pMB->sad16 = skip_sad;
1329                                            pMB->cbp = 0;
1330                                            *complete_count_self = i+1;
1331                                            current_mb++;
1332                                            continue;
1333                                    }
1334                            }
1335    
1336                            if (frame->vop_flags & XVID_VOP_RD_BVOP)
1337                                    ModeDecision_BVOP_RD(&Data_d, &Data_b, &Data_f, &Data_i,
1338                                            pMB, b_mb, &f_predMV, &b_predMV, frame->motion_flags, frame->vop_flags, pParam, i, j, best_sad, force_direct);
1339                            else
1340                                    ModeDecision_BVOP_SAD(&Data_d, &Data_b, &Data_f, &Data_i, pMB, b_mb, &f_predMV, &b_predMV, force_direct);
1341    
1342                            *complete_count_self = i+1;
1343                            current_mb++;
1344                            maxMotionBVOP(&MVmaxF, &MVmaxB, pMB, Data_d.qpel);
1345                    }
1346    
1347                    complete_count_self++;
1348                    complete_count_above++;
1349            }
1350    
1351            h->minfcode = getMinFcode(MVmaxF);
1352            h->minbcode = getMinFcode(MVmaxB);
1353    }

Legend:
Removed from v.1567  
changed lines
  Added in v.2051

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4