[svn] / trunk / xvidcore / src / encoder.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/src/encoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 4, Fri Mar 8 19:17:46 2002 UTC revision 967, Fri Apr 4 03:16:09 2003 UTC
# Line 1  Line 1 
1    /*****************************************************************************
2     *
3     *  XVID MPEG-4 VIDEO CODEC
4     *  -  Encoder main module  -
5     *
6     *  This program is an implementation of a part of one or more MPEG-4
7     *  Video tools as specified in ISO/IEC 14496-2 standard.  Those intending
8     *  to use this software module in hardware or software products are
9     *  advised that its use may infringe existing patents or copyrights, and
10     *  any such use would be at such party's own risk.  The original
11     *  developer of this software module and his/her company, and subsequent
12     *  editors and their companies, will have no liability for use of this
13     *  software or modifications or derivatives thereof.
14     *
15     *  This program is free software; you can redistribute it and/or modify
16     *  it under the terms of the GNU General Public License as published by
17     *  the Free Software Foundation; either version 2 of the License, or
18     *  (at your option) any later version.
19     *
20     *  This program is distributed in the hope that it will be useful,
21     *  but WITHOUT ANY WARRANTY; without even the implied warranty of
22     *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
23     *  GNU General Public License for more details.
24     *
25     *  You should have received a copy of the GNU General Public License
26     *  along with this program; if not, write to the Free Software
27     *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
28     *
29     *  $Id: encoder.c,v 1.97 2003-04-04 03:15:59 Isibaar Exp $
30     *
31     ****************************************************************************/
32    
33  #include <stdlib.h>  #include <stdlib.h>
34  #include <stdio.h>  #include <stdio.h>
35  #include <math.h>  #include <math.h>
36    #include <string.h>
37    
38  #include "encoder.h"  #include "encoder.h"
39  #include "prediction/mbprediction.h"  #include "prediction/mbprediction.h"
40  #include "global.h"  #include "global.h"
41  #include "utils/timer.h"  #include "utils/timer.h"
42  #include "image/image.h"  #include "image/image.h"
43    #include "image/font.h"
44    #include "motion/sad.h"
45    #include "motion/motion.h"
46  #include "bitstream/cbp.h"  #include "bitstream/cbp.h"
47  #include "utils/mbfunctions.h"  #include "utils/mbfunctions.h"
48  #include "bitstream/bitstream.h"  #include "bitstream/bitstream.h"
# Line 16  Line 52 
52  #include "bitstream/mbcoding.h"  #include "bitstream/mbcoding.h"
53  #include "quant/adapt_quant.h"  #include "quant/adapt_quant.h"
54  #include "quant/quant_matrix.h"  #include "quant/quant_matrix.h"
55    #include "utils/mem_align.h"
56    
57  #define ENC_CHECK(X) if(!(X)) return XVID_ERR_FORMAT  /*****************************************************************************
58     * Local macros
59     ****************************************************************************/
60    
61    #define ENC_CHECK(X) if(!(X)) return XVID_ERR_FORMAT
62    #define SWAP(_T_,A,B)   { _T_ tmp = A; A = B; B = tmp; }
63    
64  static int FrameCodeI(Encoder * pEnc, Bitstream * bs, uint32_t *pBits);  /*****************************************************************************
65  static int FrameCodeP(Encoder * pEnc, Bitstream * bs, uint32_t *pBits, bool force_inter, bool vol_header);   * Local function prototypes
66     ****************************************************************************/
67    
68    static int FrameCodeI(Encoder * pEnc,
69                                              Bitstream * bs,
70                                              uint32_t * pBits);
71    
72    static int FrameCodeP(Encoder * pEnc,
73                                              Bitstream * bs,
74                                              uint32_t * pBits,
75                                              bool force_inter,
76                                              bool vol_header);
77    
78    static void FrameCodeB(Encoder * pEnc,
79                                               FRAMEINFO * frame,
80                                               Bitstream * bs,
81                                               uint32_t * pBits);
82    
83    /*****************************************************************************
84     * Local data
85     ****************************************************************************/
86    
87  static int DQtab[4] =  static int DQtab[4] = {
 {  
88          -1, -2, 1, 2          -1, -2, 1, 2
89  };  };
90    
91  static int iDQtab[5] =  static int iDQtab[5] = {
 {  
92          1, 0, NO_CHANGE, 2, 3          1, 0, NO_CHANGE, 2, 3
93  };  };
94    
95    
96  int encoder_create(XVID_ENC_PARAM * pParam)  /*****************************************************************************
97     * Encoder creation
98     *
99     * This function creates an Encoder instance, it allocates all necessary
100     * image buffers (reference, current and bframes) and initialize the internal
101     * xvid encoder paremeters according to the XVID_ENC_PARAM input parameter.
102     *
103     * The code seems to be very long but is very basic, mainly memory allocation
104     * and cleaning code.
105     *
106     * Returned values :
107     *      - XVID_ERR_OK    - no errors
108     *      - XVID_ERR_MEMORY - the libc could not allocate memory, the function
109     *                                              cleans the structure before exiting.
110     *                                              pParam->handle is also set to NULL.
111     *
112     ****************************************************************************/
113    
114    int
115    encoder_create(XVID_ENC_PARAM * pParam)
116  {  {
117      Encoder *pEnc;      Encoder *pEnc;
118          uint32_t i;          int i;
   
119      pParam->handle = NULL;      pParam->handle = NULL;
120    
121      ENC_CHECK(pParam);      ENC_CHECK(pParam);
# Line 48  Line 125 
125      ENC_CHECK(!(pParam->width % 2));      ENC_CHECK(!(pParam->width % 2));
126      ENC_CHECK(!(pParam->height % 2));      ENC_CHECK(!(pParam->height % 2));
127    
128          if (pParam->fincr <= 0 || pParam->fbase <= 0)          /* Fps */
129          {  
130            if (pParam->fincr <= 0 || pParam->fbase <= 0) {
131                  pParam->fincr = 1;                  pParam->fincr = 1;
132                  pParam->fbase = 25;                  pParam->fbase = 25;
133          }          }
134    
135          // simplify the "fincr/fbase" fraction          /*
136          // (neccessary, since windows supplies us with huge numbers)           * Simplify the "fincr/fbase" fraction
137             * (neccessary, since windows supplies us with huge numbers)
138             */
139    
140          i = pParam->fincr;          i = pParam->fincr;
141          while (i > 1)          while (i > 1) {
142          {                  if (pParam->fincr % i == 0 && pParam->fbase % i == 0) {
                 if (pParam->fincr % i == 0 && pParam->fbase % i == 0)  
                 {  
143                          pParam->fincr /= i;                          pParam->fincr /= i;
144                          pParam->fbase /= i;                          pParam->fbase /= i;
145                          i = pParam->fincr;                          i = pParam->fincr;
# Line 70  Line 148 
148                  i--;                  i--;
149          }          }
150    
151          if (pParam->fbase > 65535)          if (pParam->fbase > 65535) {
         {  
152                  float div = (float)pParam->fbase / 65535;                  float div = (float)pParam->fbase / 65535;
153    
154                  pParam->fbase = (int)(pParam->fbase / div);                  pParam->fbase = (int)(pParam->fbase / div);
155                  pParam->fincr = (int)(pParam->fincr / div);                  pParam->fincr = (int)(pParam->fincr / div);
156          }          }
157    
158          if (pParam->bitrate <= 0)          /* Bitrate allocator defaults */
159                  pParam->bitrate = 900000;  
160            if (pParam->rc_bitrate <= 0)
161                    pParam->rc_bitrate = 900000;
162    
163            if (pParam->rc_reaction_delay_factor <= 0)
164                    pParam->rc_reaction_delay_factor = 16;
165    
166            if (pParam->rc_averaging_period <= 0)
167                    pParam->rc_averaging_period = 100;
168    
169      if (pParam->rc_buffersize <= 0)          if (pParam->rc_buffer <= 0)
170                  pParam->rc_buffersize = pParam->bitrate * pParam->fbase;                  pParam->rc_buffer = 100;
171    
172            /* Max and min quantizers */
173    
174      if ((pParam->min_quantizer <= 0) || (pParam->min_quantizer > 31))      if ((pParam->min_quantizer <= 0) || (pParam->min_quantizer > 31))
175                  pParam->min_quantizer = 1;                  pParam->min_quantizer = 1;
# Line 89  Line 177 
177      if ((pParam->max_quantizer <= 0) || (pParam->max_quantizer > 31))      if ((pParam->max_quantizer <= 0) || (pParam->max_quantizer > 31))
178                  pParam->max_quantizer = 31;                  pParam->max_quantizer = 31;
179    
     if (pParam->max_key_interval == 0)          /* 1 keyframe each 10 seconds */  
                 pParam->max_key_interval = 10 * pParam->fincr / pParam->fbase;  
   
180      if (pParam->max_quantizer < pParam->min_quantizer)      if (pParam->max_quantizer < pParam->min_quantizer)
181                  pParam->max_quantizer = pParam->min_quantizer;                  pParam->max_quantizer = pParam->min_quantizer;
182    
183      if ((pEnc = (Encoder *) malloc(sizeof(Encoder))) == NULL)          /* 1 keyframe each 10 seconds */
184    
185            if (pParam->max_key_interval <= 0)
186                    pParam->max_key_interval = 10 * pParam->fincr / pParam->fbase;
187    
188            pEnc = (Encoder *) xvid_malloc(sizeof(Encoder), CACHE_LINE);
189            if (pEnc == NULL)
190                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
191    
192            /* Zero the Encoder Structure */
193    
194            memset(pEnc, 0, sizeof(Encoder));
195    
196          /* Fill members of Encoder structure */          /* Fill members of Encoder structure */
197    
198      pEnc->mbParam.width = pParam->width;      pEnc->mbParam.width = pParam->width;
# Line 109  Line 204 
204          pEnc->mbParam.edged_width = 16 * pEnc->mbParam.mb_width + 2 * EDGE_SIZE;          pEnc->mbParam.edged_width = 16 * pEnc->mbParam.mb_width + 2 * EDGE_SIZE;
205          pEnc->mbParam.edged_height = 16 * pEnc->mbParam.mb_height + 2 * EDGE_SIZE;          pEnc->mbParam.edged_height = 16 * pEnc->mbParam.mb_height + 2 * EDGE_SIZE;
206    
207      pEnc->sStat.fMvPrevSigma = -1;          pEnc->mbParam.fbase = pParam->fbase;
208            pEnc->mbParam.fincr = pParam->fincr;
209    
210            pEnc->mbParam.m_quant_type = H263_QUANT;
211    
212            pEnc->fMvPrevSigma = -1;
213    
214          /* Fill rate control parameters */          /* Fill rate control parameters */
215    
216      pEnc->mbParam.quant = 4;          pEnc->bitrate = pParam->rc_bitrate;
217    
218          pEnc->bitrate = pParam->bitrate;          pEnc->iFrameNum = -1;
219            pEnc->mbParam.iMaxKeyInterval = pParam->max_key_interval;
220    
221      pEnc->iFrameNum = 0;          /* try to allocate frame memory */
     pEnc->iMaxKeyInterval = pParam->max_key_interval;  
222    
223      if (image_create(&pEnc->sCurrent, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height) < 0)          pEnc->current = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
224      {          pEnc->reference = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
                 free(pEnc);  
                 return XVID_ERR_MEMORY;  
     }  
225    
226          if (image_create(&pEnc->sReference, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height) < 0)          if (pEnc->current == NULL || pEnc->reference == NULL)
227      {                  goto xvid_err_memory1;
                 image_destroy(&pEnc->sCurrent, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 free(pEnc);  
                 return XVID_ERR_MEMORY;  
     }  
228    
229      if (image_create(&pEnc->vInterH, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height) < 0)          /* try to allocate mb memory */
     {  
                 image_destroy(&pEnc->sCurrent, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->sReference, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 free(pEnc);  
                 return XVID_ERR_MEMORY;  
     }  
230    
231      if (image_create(&pEnc->vInterV, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height) < 0)          pEnc->current->mbs =
232      {                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *
233                  image_destroy(&pEnc->sCurrent, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);                                          pEnc->mbParam.mb_height, CACHE_LINE);
234                  image_destroy(&pEnc->sReference, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);          pEnc->reference->mbs =
235                  image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *
236                  free(pEnc);                                          pEnc->mbParam.mb_height, CACHE_LINE);
                 return XVID_ERR_MEMORY;  
     }  
237    
238      if (image_create(&pEnc->vInterHV, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height) < 0)          if (pEnc->current->mbs == NULL || pEnc->reference->mbs == NULL)
239      {                  goto xvid_err_memory2;
                 image_destroy(&pEnc->sCurrent, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->sReference, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 free(pEnc);  
                 return XVID_ERR_MEMORY;  
     }  
240    
241          pEnc->pMBs = malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width * pEnc->mbParam.mb_height);          /* try to allocate image memory */
         if (pEnc->pMBs == NULL)  
         {  
                 image_destroy(&pEnc->sCurrent, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->sReference, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
                 free(pEnc);  
                 return XVID_ERR_MEMORY;  
         }  
242    
243          // init macroblock array          if (pParam->global & XVID_GLOBAL_EXTRASTATS)
244          for (i = 0; i < pEnc->mbParam.mb_width * pEnc->mbParam.mb_height; i++)                  image_null(&pEnc->sOriginal);
         {  
                 pEnc->pMBs[i].dquant = NO_CHANGE;  
         }  
245    
246      pParam->handle = (void *)pEnc;          image_null(&pEnc->f_refh);
247            image_null(&pEnc->f_refv);
248            image_null(&pEnc->f_refhv);
249    
250          if (pParam->bitrate)          image_null(&pEnc->current->image);
251          {          image_null(&pEnc->reference->image);
252                  RateControlInit(pParam->bitrate, pParam->rc_buffersize, pParam->fbase, pParam->width,          image_null(&pEnc->vInterH);
253                                                  pParam->height, pParam->max_quantizer, pParam->min_quantizer);          image_null(&pEnc->vInterV);
254            image_null(&pEnc->vInterVf);
255            image_null(&pEnc->vInterHV);
256            image_null(&pEnc->vInterHVf);
257    
258            if (pParam->global & XVID_GLOBAL_EXTRASTATS)
259            {       if (image_create
260                            (&pEnc->sOriginal, pEnc->mbParam.edged_width,
261                             pEnc->mbParam.edged_height) < 0)
262                            goto xvid_err_memory3;
263          }          }
264    
265          create_vlc_tables();          if (image_create
266                    (&pEnc->f_refh, pEnc->mbParam.edged_width,
267                     pEnc->mbParam.edged_height) < 0)
268                    goto xvid_err_memory3;
269            if (image_create
270                    (&pEnc->f_refv, pEnc->mbParam.edged_width,
271                     pEnc->mbParam.edged_height) < 0)
272                    goto xvid_err_memory3;
273            if (image_create
274                    (&pEnc->f_refhv, pEnc->mbParam.edged_width,
275                     pEnc->mbParam.edged_height) < 0)
276                    goto xvid_err_memory3;
277    
278          return XVID_ERR_OK;          if (image_create
279  }                  (&pEnc->current->image, pEnc->mbParam.edged_width,
280                     pEnc->mbParam.edged_height) < 0)
281                    goto xvid_err_memory3;
282            if (image_create
283                    (&pEnc->reference->image, pEnc->mbParam.edged_width,
284                     pEnc->mbParam.edged_height) < 0)
285                    goto xvid_err_memory3;
286            if (image_create
287                    (&pEnc->vInterH, pEnc->mbParam.edged_width,
288                     pEnc->mbParam.edged_height) < 0)
289                    goto xvid_err_memory3;
290            if (image_create
291                    (&pEnc->vInterV, pEnc->mbParam.edged_width,
292                     pEnc->mbParam.edged_height) < 0)
293                    goto xvid_err_memory3;
294            if (image_create
295                    (&pEnc->vInterVf, pEnc->mbParam.edged_width,
296                     pEnc->mbParam.edged_height) < 0)
297                    goto xvid_err_memory3;
298            if (image_create
299                    (&pEnc->vInterHV, pEnc->mbParam.edged_width,
300                     pEnc->mbParam.edged_height) < 0)
301                    goto xvid_err_memory3;
302            if (image_create
303                    (&pEnc->vInterHVf, pEnc->mbParam.edged_width,
304                     pEnc->mbParam.edged_height) < 0)
305                    goto xvid_err_memory3;
306    
307    /* Create full bitplane for GMC, this might be wasteful */
308            if (image_create
309                    (&pEnc->vGMC, pEnc->mbParam.edged_width,
310                     pEnc->mbParam.edged_height) < 0)
311                    goto xvid_err_memory3;
312    
 int encoder_destroy(Encoder * pEnc)  
 {  
     ENC_CHECK(pEnc);  
     ENC_CHECK(pEnc->sCurrent.y);  
     ENC_CHECK(pEnc->sReference.y);  
313    
         free(pEnc->pMBs);  
     image_destroy(&pEnc->sCurrent, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
     image_destroy(&pEnc->sReference, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
     image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
     image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
     image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height);  
     free(pEnc);  
314    
315          destroy_vlc_tables();          pEnc->mbParam.global = pParam->global;
316    
317      return XVID_ERR_OK;          /* B Frames specific init */
318  }          pEnc->mbParam.max_bframes = pParam->max_bframes;
319            pEnc->mbParam.bquant_ratio = pParam->bquant_ratio;
320            pEnc->mbParam.bquant_offset = pParam->bquant_offset;
321            pEnc->mbParam.frame_drop_ratio = pParam->frame_drop_ratio;
322            pEnc->bframes = NULL;
323    
324  int encoder_encode(Encoder * pEnc, XVID_ENC_FRAME * pFrame, XVID_ENC_STATS * pResult)          if (pEnc->mbParam.max_bframes > 0) {
325  {                  int n;
     uint16_t x, y;  
     Bitstream bs;  
     uint32_t bits;  
         uint16_t quant_type = 0;  
         uint16_t write_vol_header = 0;  
326    
327      IMAGE *pCurrent = &(pEnc->sCurrent);                  pEnc->bframes =
328                            xvid_malloc(pEnc->mbParam.max_bframes * sizeof(FRAMEINFO *),
329                                                    CACHE_LINE);
330    
331          start_global_timer();                  if (pEnc->bframes == NULL)
332                            goto xvid_err_memory3;
333    
334      ENC_CHECK(pEnc);                  for (n = 0; n < pEnc->mbParam.max_bframes; n++)
335      ENC_CHECK(pFrame);                          pEnc->bframes[n] = NULL;
     ENC_CHECK(pFrame->bitstream);  
     ENC_CHECK(pFrame->image);  
336    
         pEnc->mbParam.global_flags = pFrame->general;  
         pEnc->mbParam.motion_flags = pFrame->motion;  
337    
338          start_timer();                  for (n = 0; n < pEnc->mbParam.max_bframes; n++) {
339          if (image_input(&pEnc->sCurrent, pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width,                          pEnc->bframes[n] = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
                                         pFrame->image, pFrame->colorspace))  
         {  
                 return XVID_ERR_FORMAT;  
         }  
         stop_conv_timer();  
340    
341      BitstreamInit(&bs, pFrame->bitstream, 0);                          if (pEnc->bframes[n] == NULL)
342                                    goto xvid_err_memory4;
343    
344          if (pFrame->quant == 0)                          pEnc->bframes[n]->mbs =
345          {                                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *
346                  pEnc->mbParam.quant = RateControlGetQ(0);                                                          pEnc->mbParam.mb_height, CACHE_LINE);
         }  
         else  
         {  
                 pEnc->mbParam.quant = pFrame->quant;  
         }  
347    
348          if ((pEnc->mbParam.global_flags & XVID_LUMIMASKING) > 0)                          if (pEnc->bframes[n]->mbs == NULL)
349          {                                  goto xvid_err_memory4;
                 int * temp_dquants = (int *) malloc(pEnc->mbParam.mb_width * pEnc->mbParam.mb_height * sizeof(int));  
350    
351                  pEnc->mbParam.quant = adaptive_quantization(pEnc->sCurrent.y, pEnc->mbParam.width,                          image_null(&pEnc->bframes[n]->image);
352                          temp_dquants, pFrame->quant, pFrame->quant,  
353                          2*pFrame->quant, pEnc->mbParam.mb_width, pEnc->mbParam.mb_height);                          if (image_create
354                                    (&pEnc->bframes[n]->image, pEnc->mbParam.edged_width,
355                                     pEnc->mbParam.edged_height) < 0)
356                                    goto xvid_err_memory4;
357    
                 for (y = 0; y < pEnc->mbParam.mb_height; y++)  
                         for (x = 0; x < pEnc->mbParam.mb_width; x++)  
                         {  
                                 MACROBLOCK *pMB = &pEnc->pMBs[x + y * pEnc->mbParam.mb_width];  
                                 pMB->dquant = iDQtab[(temp_dquants[y * pEnc->mbParam.mb_width + x] + 2)];  
358                          }                          }
                 free(temp_dquants);  
359          }          }
360    
361          if(pEnc->mbParam.global_flags & XVID_H263QUANT)          pEnc->bframenum_head = 0;
362                  quant_type = H263_QUANT;          pEnc->bframenum_tail = 0;
363          else if(pEnc->mbParam.global_flags & XVID_MPEGQUANT)          pEnc->flush_bframes = 0;
364                  quant_type = MPEG4_QUANT;          pEnc->bframenum_dx50bvop = -1;
365    
366          if(pEnc->mbParam.quant_type != quant_type) {          pEnc->queue = NULL;
                 pEnc->mbParam.quant_type = quant_type;  
                 write_vol_header = 1;  
         }  
         else  
                 write_vol_header = 0;  
367    
368          if ((pEnc->mbParam.global_flags & XVID_CUSTOM_QMATRIX) > 0)          if (pEnc->mbParam.max_bframes > 0) {
369          {                  int n;
                 int ret1, ret2;  
                 ret1 = set_intra_matrix(pFrame->quant_intra_matrix);  
                 ret2 = set_inter_matrix(pFrame->quant_inter_matrix);  
                 if(write_vol_header == 0)  
                         write_vol_header = ret1 | ret2;  
         }  
370    
371          if (pFrame->intra < 0)                  pEnc->queue =
372      {                          xvid_malloc(pEnc->mbParam.max_bframes * sizeof(IMAGE),
373                  if ((pEnc->iFrameNum == 0) || ((pEnc->iMaxKeyInterval > 0)                                                  CACHE_LINE);
374                          && (pEnc->iFrameNum >= pEnc->iMaxKeyInterval)))  
375                    if (pEnc->queue == NULL)
376                            goto xvid_err_memory4;
377    
378                    for (n = 0; n < pEnc->mbParam.max_bframes; n++)
379                            image_null(&pEnc->queue[n]);
380    
381                    for (n = 0; n < pEnc->mbParam.max_bframes; n++) {
382                            if (image_create
383                                    (&pEnc->queue[n], pEnc->mbParam.edged_width,
384                                     pEnc->mbParam.edged_height) < 0)
385                                    goto xvid_err_memory5;
386    
                         pFrame->intra = FrameCodeI(pEnc, &bs, &bits);  
                 else  
                         pFrame->intra = FrameCodeP(pEnc, &bs, &bits, 0, write_vol_header);  
387      }      }
     else  
     {  
                 if (pFrame->intra == 1)  
                     pFrame->intra = FrameCodeI(pEnc, &bs, &bits);  
                 else  
                         pFrame->intra = FrameCodeP(pEnc, &bs, &bits, 1, write_vol_header);  
388      }      }
389    
390          BitstreamPutBits(&bs, 0xFFFF, 16);          pEnc->queue_head = 0;
391      BitstreamPutBits(&bs, 0xFFFF, 16);          pEnc->queue_tail = 0;
392      BitstreamPad(&bs);          pEnc->queue_size = 0;
     pFrame->length = BitstreamLength(&bs);  
393    
394          if (pResult)          pEnc->mbParam.m_stamp = 0;
     {  
                 pResult->quant = pEnc->mbParam.quant;  
                 pResult->hlength = pFrame->length - (pEnc->sStat.iTextBits / 8);  
                 pResult->kblks = pEnc->sStat.kblks;  
                 pResult->mblks = pEnc->sStat.mblks;  
                 pResult->ublks = pEnc->sStat.ublks;  
     }  
395    
396      if (pEnc->bitrate)          pEnc->m_framenum = 0;
397          {          pEnc->current->stamp = 0;
398                  RateControlUpdate(pEnc->mbParam.quant, pFrame->length, pFrame->intra);          pEnc->reference->stamp = 0;
         }  
399    
400          pEnc->iFrameNum++;          pParam->handle = (void *) pEnc;
     image_swap(&pEnc->sCurrent, &pEnc->sReference);  
401    
402          stop_global_timer();          if (pParam->rc_bitrate) {
403          write_timer();                  RateControlInit(&pEnc->rate_control, pParam->rc_bitrate,
404                                                    pParam->rc_reaction_delay_factor,
405                                                    pParam->rc_averaging_period, pParam->rc_buffer,
406                                                    pParam->fbase * 1000 / pParam->fincr,
407                                                    pParam->max_quantizer, pParam->min_quantizer);
408            }
409    
410            init_timer();
411    
412          return XVID_ERR_OK;          return XVID_ERR_OK;
413    
414            /*
415             * We handle all XVID_ERR_MEMORY here, this makes the code lighter
416             */
417    
418      xvid_err_memory5:
419    
420            if (pEnc->mbParam.max_bframes > 0) {
421    
422                    for (i = 0; i < pEnc->mbParam.max_bframes; i++) {
423                            image_destroy(&pEnc->queue[i], pEnc->mbParam.edged_width,
424                                                      pEnc->mbParam.edged_height);
425                    }
426                    xvid_free(pEnc->queue);
427  }  }
428    
429      xvid_err_memory4:
430    
431  static __inline void CodeIntraMB(Encoder *pEnc, MACROBLOCK *pMB) {          if (pEnc->mbParam.max_bframes > 0) {
432    
433          pMB->mode = MODE_INTRA;                  for (i = 0; i < pEnc->mbParam.max_bframes; i++) {
434    
435          if ((pEnc->mbParam.global_flags & XVID_LUMIMASKING) > 0) {                          if (pEnc->bframes[i] == NULL)
436                  if(pMB->dquant != NO_CHANGE)                                  continue;
437                  {  
438                          pMB->mode = MODE_INTRA_Q;                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
439                          pEnc->mbParam.quant += DQtab[pMB->dquant];                                                    pEnc->mbParam.edged_height);
440    
441                            xvid_free(pEnc->bframes[i]->mbs);
442    
443                            xvid_free(pEnc->bframes[i]);
444    
                         if (pEnc->mbParam.quant > 31) pEnc->mbParam.quant = 31;  
                         if (pEnc->mbParam.quant < 1) pEnc->mbParam.quant = 1;  
445                  }                  }
446    
447                    xvid_free(pEnc->bframes);
448          }          }
449    
450          pMB->quant = pEnc->mbParam.quant;    xvid_err_memory3:
451    
452            if (pEnc->mbParam.global & XVID_GLOBAL_EXTRASTATS)
453            {       image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,
454                                              pEnc->mbParam.edged_height);
455  }  }
456    
457            image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,
458                                      pEnc->mbParam.edged_height);
459            image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,
460                                      pEnc->mbParam.edged_height);
461            image_destroy(&pEnc->f_refhv, pEnc->mbParam.edged_width,
462                                      pEnc->mbParam.edged_height);
463    
464  static int FrameCodeI(Encoder * pEnc, Bitstream * bs, uint32_t *pBits)          image_destroy(&pEnc->current->image, pEnc->mbParam.edged_width,
465  {                                    pEnc->mbParam.edged_height);
466      int16_t dct_codes[6][64];          image_destroy(&pEnc->reference->image, pEnc->mbParam.edged_width,
467      int16_t qcoeff[6][64];                                    pEnc->mbParam.edged_height);
468      uint16_t x, y;          image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width,
469      IMAGE *pCurrent = &pEnc->sCurrent;                                    pEnc->mbParam.edged_height);
470            image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
471                                      pEnc->mbParam.edged_height);
472            image_destroy(&pEnc->vInterVf, pEnc->mbParam.edged_width,
473                                      pEnc->mbParam.edged_height);
474            image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
475                                      pEnc->mbParam.edged_height);
476            image_destroy(&pEnc->vInterHVf, pEnc->mbParam.edged_width,
477                                      pEnc->mbParam.edged_height);
478    
479      pEnc->iFrameNum = 0;  /* destroy GMC image */
480      pEnc->mbParam.rounding_type = 1;          image_destroy(&pEnc->vGMC, pEnc->mbParam.edged_width,
481      pEnc->mbParam.coding_type = I_VOP;                                    pEnc->mbParam.edged_height);
482    
         BitstreamWriteVolHeader(bs, pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.quant_type);  
         BitstreamWriteVopHeader(bs, I_VOP, pEnc->mbParam.rounding_type,  
                         pEnc->mbParam.quant,  
                         pEnc->mbParam.fixed_code);  
483    
484      *pBits = BitstreamPos(bs);    xvid_err_memory2:
485            xvid_free(pEnc->current->mbs);
486            xvid_free(pEnc->reference->mbs);
487    
488      xvid_err_memory1:
489            xvid_free(pEnc->current);
490            xvid_free(pEnc->reference);
491            xvid_free(pEnc);
492    
493            pParam->handle = NULL;
494    
495            return XVID_ERR_MEMORY;
496    }
497    
498          pEnc->sStat.iTextBits = 0;  /*****************************************************************************
499          pEnc->sStat.kblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;   * Encoder destruction
500          pEnc->sStat.mblks = pEnc->sStat.ublks = 0;   *
501     * This function destroy the entire encoder structure created by a previous
502     * successful encoder_create call.
503     *
504     * Returned values (for now only one returned value) :
505     *      - XVID_ERR_OK    - no errors
506     *
507     ****************************************************************************/
508    
509      for (y = 0; y < pEnc->mbParam.mb_height; y++)  int
510                  for (x = 0; x < pEnc->mbParam.mb_width; x++)  encoder_destroy(Encoder * pEnc)
511                  {                  {
512                      MACROBLOCK *pMB = &pEnc->pMBs[x + y * pEnc->mbParam.mb_width];          int i;
513    
514                          CodeIntraMB(pEnc, pMB);          ENC_CHECK(pEnc);
515    
516                          MBTransQuantIntra(&pEnc->mbParam, x, y, dct_codes, qcoeff, pCurrent);          /* B Frames specific */
517            if (pEnc->mbParam.max_bframes > 0) {
518    
519                          start_timer();                  for (i = 0; i < pEnc->mbParam.max_bframes; i++) {
                         MBPrediction(&pEnc->mbParam, x, y, pEnc->mbParam.mb_width, qcoeff, pEnc->pMBs);  
                         stop_prediction_timer();  
520    
521                          start_timer();                          image_destroy(&pEnc->queue[i], pEnc->mbParam.edged_width,
522                          MBCoding(&pEnc->mbParam, pMB, qcoeff, bs, &pEnc->sStat);                                            pEnc->mbParam.edged_height);
523                          stop_coding_timer();                  }
524                    xvid_free(pEnc->queue);
525                  }                  }
526    
527          emms();          if (pEnc->mbParam.max_bframes > 0) {
528    
529      *pBits = BitstreamPos(bs) - *pBits;                  for (i = 0; i < pEnc->mbParam.max_bframes; i++) {
     pEnc->sStat.fMvPrevSigma = -1;  
     pEnc->sStat.iMvSum = 0;  
     pEnc->sStat.iMvCount = 0;  
     pEnc->mbParam.fixed_code = 2;  
530    
531      return 1;                                    // intra                          if (pEnc->bframes[i] == NULL)
532  }                                  continue;
533    
534                            image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
535                                              pEnc->mbParam.edged_height);
536    
537  #define INTRA_THRESHOLD 0.5                          xvid_free(pEnc->bframes[i]->mbs);
538    
539  static int FrameCodeP(Encoder * pEnc, Bitstream * bs, uint32_t *pBits, bool force_inter, bool vol_header)                          xvid_free(pEnc->bframes[i]);
540  {                  }
     float fSigma;  
     int16_t dct_codes[6][64];  
     int16_t qcoeff[6][64];  
         int iLimit;  
     uint32_t x, y;  
     int iSearchRange;  
         bool bIntra;  
541    
542      IMAGE *pCurrent = &pEnc->sCurrent;                  xvid_free(pEnc->bframes);
     IMAGE *pRef = &pEnc->sReference;  
543    
544          image_setedges(pRef,pEnc->mbParam.edged_width, pEnc->mbParam.edged_height, pEnc->mbParam.width, pEnc->mbParam.height);          }
545    
546      pEnc->mbParam.rounding_type = 1 - pEnc->mbParam.rounding_type;          /* All images, reference, current etc ... */
547    
548          if (!force_inter)          image_destroy(&pEnc->current->image, pEnc->mbParam.edged_width,
549                  iLimit = (int)(pEnc->mbParam.mb_width * pEnc->mbParam.mb_height * INTRA_THRESHOLD);                                    pEnc->mbParam.edged_height);
550      else          image_destroy(&pEnc->reference->image, pEnc->mbParam.edged_width,
551                  iLimit = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height + 1;                                    pEnc->mbParam.edged_height);
552            image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width,
553                                      pEnc->mbParam.edged_height);
554            image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
555                                      pEnc->mbParam.edged_height);
556            image_destroy(&pEnc->vInterVf, pEnc->mbParam.edged_width,
557                                      pEnc->mbParam.edged_height);
558            image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
559                                      pEnc->mbParam.edged_height);
560            image_destroy(&pEnc->vInterHVf, pEnc->mbParam.edged_width,
561                                      pEnc->mbParam.edged_height);
562    
563          if ((pEnc->mbParam.global_flags & XVID_HALFPEL) > 0) {          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,
564                  start_timer();                                    pEnc->mbParam.edged_height);
565                  image_interpolate(pRef, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,          image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,
566                          pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,                                    pEnc->mbParam.edged_height);
567                          pEnc->mbParam.rounding_type);          image_destroy(&pEnc->f_refhv, pEnc->mbParam.edged_width,
568                  stop_inter_timer();                                    pEnc->mbParam.edged_height);
569    
570            if (pEnc->mbParam.global & XVID_GLOBAL_EXTRASTATS)
571            {       image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,
572                                              pEnc->mbParam.edged_height);
573          }          }
574    
575          start_timer();          /* Encoder structure */
         bIntra = MotionEstimation(pEnc->pMBs, &pEnc->mbParam, &pEnc->sReference,  
                                 &pEnc->vInterH, &pEnc->vInterV,  
                                 &pEnc->vInterHV, &pEnc->sCurrent, iLimit);  
         stop_motion_timer();  
576    
577          if (bIntra == 1)          xvid_free(pEnc->current->mbs);
578                  return FrameCodeI(pEnc, bs, pBits);          xvid_free(pEnc->current);
579    
580      pEnc->mbParam.coding_type = P_VOP;          xvid_free(pEnc->reference->mbs);
581            xvid_free(pEnc->reference);
582    
583          if(vol_header)          xvid_free(pEnc);
                 BitstreamWriteVolHeader(bs, pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.quant_type);  
584    
585      BitstreamWriteVopHeader(bs, P_VOP, pEnc->mbParam.rounding_type,          return XVID_ERR_OK;
586                           pEnc->mbParam.quant,  }
                          pEnc->mbParam.fixed_code);  
587    
     *pBits = BitstreamPos(bs);  
588    
589      pEnc->sStat.iTextBits = 0;  static __inline void inc_frame_num(Encoder * pEnc)
590      pEnc->sStat.iMvSum = 0;  {
591      pEnc->sStat.iMvCount = 0;          pEnc->current->stamp = pEnc->mbParam.m_stamp;   /* first frame is zero */
592          pEnc->sStat.kblks = pEnc->sStat.mblks = pEnc->sStat.ublks = 0;          pEnc->mbParam.m_stamp += pEnc->mbParam.fincr;
593    }
594    
595    
596      for(y = 0; y < pEnc->mbParam.mb_height; y++)  static __inline void
597    queue_image(Encoder * pEnc, XVID_ENC_FRAME * pFrame)
598          {          {
599                  for(x = 0; x < pEnc->mbParam.mb_width; x++)          if (pEnc->queue_size >= pEnc->mbParam.max_bframes)
600                  {                  {
601                          MACROBLOCK * pMB = &pEnc->pMBs[x + y * pEnc->mbParam.mb_width];                  DPRINTF(DPRINTF_DEBUG,"FATAL: QUEUE FULL");
602                    return;
603            }
604    
605            DPRINTF(DPRINTF_DEBUG,"*** QUEUE bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",
606                                    pEnc->bframenum_head, pEnc->bframenum_tail,
607                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
608    
                     bIntra = (pMB->mode == MODE_INTRA) || (pMB->mode == MODE_INTRA_Q);  
609    
                         if (!bIntra)  
                     {  
610                                  start_timer();                                  start_timer();
611                                  MBMotionCompensation(pMB, x, y, &pEnc->sReference,          if (image_input
612                                          &pEnc->vInterH, &pEnc->vInterV,                  (&pEnc->queue[pEnc->queue_tail], pEnc->mbParam.width, pEnc->mbParam.height,
613                                          &pEnc->vInterHV, &pEnc->sCurrent, dct_codes,                   pEnc->mbParam.edged_width, pFrame->image, pFrame->stride, pFrame->colorspace, pFrame->general & XVID_INTERLACING))
614                                          pEnc->mbParam.width,                  return;
615                                          pEnc->mbParam.height,          stop_conv_timer();
                                         pEnc->mbParam.edged_width,  
                                         pEnc->mbParam.rounding_type);  
                                 stop_comp_timer();  
616    
617                                  if ((pEnc->mbParam.global_flags & XVID_LUMIMASKING) > 0) {          if ((pFrame->general & XVID_CHROMAOPT)) {
618                                          if(pMB->dquant != NO_CHANGE) {                  image_chroma_optimize(&pEnc->queue[pEnc->queue_tail],
619                                                  pMB->mode = MODE_INTER_Q;                          pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width);
                                                 pEnc->mbParam.quant += DQtab[pMB->dquant];  
                                                 if (pEnc->mbParam.quant > 31) pEnc->mbParam.quant = 31;  
                                                 else if(pEnc->mbParam.quant < 1) pEnc->mbParam.quant = 1;  
                                         }  
620                                  }                                  }
                                 pMB->quant = pEnc->mbParam.quant;  
621    
622                                  pMB->cbp = MBTransQuantInter(&pEnc->mbParam, x, y, dct_codes, qcoeff, pCurrent);          pEnc->queue_size++;
623            pEnc->queue_tail =  (pEnc->queue_tail + 1) % pEnc->mbParam.max_bframes;
624                      }                      }
625                          else  
626    static __inline void
627    set_timecodes(FRAMEINFO* pCur,FRAMEINFO *pRef, int32_t time_base)
628                          {                          {
                                 CodeIntraMB(pEnc, pMB);  
                                 MBTransQuantIntra(&pEnc->mbParam, x, y, dct_codes, qcoeff, pCurrent);  
                         }  
629    
630                      start_timer();                  pCur->ticks = (int32_t)pCur->stamp % time_base;
631                          MBPrediction(&pEnc->mbParam, x, y, pEnc->mbParam.mb_width, qcoeff, pEnc->pMBs);                  pCur->seconds =  ((int32_t)pCur->stamp / time_base)     - ((int32_t)pRef->stamp / time_base) ;
                         stop_prediction_timer();  
632    
633                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q)                  /* HEAVY DEBUG OUTPUT remove when timecodes prove to be stable */
634                          {  
635                                  pEnc->sStat.kblks++;  /*              fprintf(stderr,"WriteVop:   %d - %d \n",
636                            ((int32_t)pCur->stamp / time_base), ((int32_t)pRef->stamp / time_base));
637                    fprintf(stderr,"set_timecodes: VOP %1d   stamp=%lld ref_stamp=%lld  base=%d\n",
638                            pCur->coding_type, pCur->stamp, pRef->stamp, time_base);
639                    fprintf(stderr,"set_timecodes: VOP %1d   seconds=%d   ticks=%d   (ref-sec=%d  ref-tick=%d)\n",
640                            pCur->coding_type, pCur->seconds, pCur->ticks, pRef->seconds, pRef->ticks);
641    
642    */
643                          }                          }
644                          else if (pMB->cbp ||  
645                                          pMB->mvs[0].x || pMB->mvs[0].y ||  
646                                          pMB->mvs[1].x || pMB->mvs[1].y ||  
647                                          pMB->mvs[2].x || pMB->mvs[2].y ||  /* convert pFrame->intra to coding_type */
648                                          pMB->mvs[3].x || pMB->mvs[3].y)  static int intra2coding_type(int intra)
649                          {                          {
650                                  pEnc->sStat.mblks++;          if (intra < 0)  return -1;
651            if (intra == 1) return I_VOP;
652            if (intra == 2) return B_VOP;
653    
654            return P_VOP;
655                          }                          }
656                          else  
657    
658    
659    /*****************************************************************************
660     * IPB frame encoder entry point
661     *
662     * Returned values :
663     *      - XVID_ERR_OK    - no errors
664     *      - XVID_ERR_FORMAT - the image subsystem reported the image had a wrong
665     *                                              format
666     ****************************************************************************/
667    
668    int
669    encoder_encode_bframes(Encoder * pEnc,
670                                    XVID_ENC_FRAME * pFrame,
671                                    XVID_ENC_STATS * pResult)
672                          {                          {
673                                  pEnc->sStat.ublks++;          uint16_t x, y;
674            Bitstream bs;
675            uint32_t bits;
676            int mode = -1; /* Just to shut up compiler warning */
677    
678            int input_valid = 1;
679            int bframes_count = 0;
680    
681            ENC_CHECK(pEnc);
682            ENC_CHECK(pFrame);
683            ENC_CHECK(pFrame->image);
684    
685            start_global_timer();
686    
687            BitstreamInit(&bs, pFrame->bitstream, 0);
688    
689    ipvop_loop:
690    
691            /*
692             * bframe "flush" code
693             */
694    
695            if ((pFrame->image == NULL || pEnc->flush_bframes)
696                    && (pEnc->bframenum_head < pEnc->bframenum_tail)) {
697    
698                    if (pEnc->flush_bframes == 0) {
699                            /*
700                             * we have reached the end of stream without getting
701                             * a future reference frame... so encode last final
702                             * frame as a pframe
703                             */
704    
705                            DPRINTF(DPRINTF_DEBUG,"*** BFRAME (final frame) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",
706                                    pEnc->bframenum_head, pEnc->bframenum_tail,
707                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
708    
709                            pEnc->bframenum_tail--;
710                            SWAP(FRAMEINFO *, pEnc->current, pEnc->reference);
711    
712                            SWAP(FRAMEINFO *, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
713    
714                            FrameCodeP(pEnc, &bs, &bits, 1, 0);
715                            bframes_count = 0;
716    
717                            BitstreamPadAlways(&bs);
718                            pFrame->length = BitstreamLength(&bs);
719                            pFrame->intra = 0;
720    
721    
722                            emms();
723    
724                            if (pResult) {
725                                    pResult->quant = pEnc->current->quant;
726                                    pResult->hlength = pFrame->length - (pEnc->current->sStat.iTextBits / 8);
727                                    pResult->kblks = pEnc->current->sStat.kblks;
728                                    pResult->mblks = pEnc->current->sStat.mblks;
729                                    pResult->ublks = pEnc->current->sStat.ublks;
730                          }                          }
731    
732                          start_timer();                          return XVID_ERR_OK;
                         MBCoding(&pEnc->mbParam, pMB, qcoeff, bs, &pEnc->sStat);  
                         stop_coding_timer();  
733                  }                  }
734    
735    
736                    DPRINTF(DPRINTF_DEBUG,"*** BFRAME (flush) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",
737                                    pEnc->bframenum_head, pEnc->bframenum_tail,
738                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
739    
740                    FrameCodeB(pEnc, pEnc->bframes[pEnc->bframenum_head], &bs, &bits);
741                    pEnc->bframenum_head++;
742    
743                    BitstreamPadAlways(&bs);
744                    pFrame->length = BitstreamLength(&bs);
745                    pFrame->intra = 2;
746    
747                    if (pResult) {
748                            pResult->quant = pEnc->current->quant;
749                            pResult->hlength = pFrame->length - (pEnc->current->sStat.iTextBits / 8);
750                            pResult->kblks = pEnc->current->sStat.kblks;
751                            pResult->mblks = pEnc->current->sStat.mblks;
752                            pResult->ublks = pEnc->current->sStat.ublks;
753          }          }
754    
755          emms();          emms();
756    
757          if (pEnc->sStat.iMvCount == 0)                  if (pFrame->quant == 0) {
758                  pEnc->sStat.iMvCount = 1;                          RateControlUpdate(&pEnc->rate_control, pEnc->current->quant,
759                                                              pFrame->length, pFrame->intra);
760                    }
761    
762      fSigma = (float)sqrt((float) pEnc->sStat.iMvSum / pEnc->sStat.iMvCount);                  if (input_valid)
763                            queue_image(pEnc, pFrame);
764    
765      iSearchRange = 1 << (3 + pEnc->mbParam.fixed_code);                  emms();
766    
767      if ((fSigma > iSearchRange / 3)                  return XVID_ERR_OK;
                 && (pEnc->mbParam.fixed_code <= 3))     // maximum search range 128  
     {  
                 pEnc->mbParam.fixed_code++;  
                 iSearchRange *= 2;  
     }  
     else if ((fSigma < iSearchRange / 6)  
             && (pEnc->sStat.fMvPrevSigma >= 0)  
             && (pEnc->sStat.fMvPrevSigma < iSearchRange / 6)  
             && (pEnc->mbParam.fixed_code >= 2)) // minimum search range 16  
     {  
                 pEnc->mbParam.fixed_code--;  
                 iSearchRange /= 2;  
768      }      }
769    
770      pEnc->sStat.fMvPrevSigma = fSigma;          if (pEnc->bframenum_head > 0) {
771                    pEnc->bframenum_head = pEnc->bframenum_tail = 0;
772    
773          *pBits = BitstreamPos(bs) - *pBits;                  /* write an empty marker to the bitstream.
774                       for divx5 decoder compatibility, this marker must consist
775                       of a not-coded p-vop, with a time_base of zero, and time_increment
776                       indentical to the future-referece frame.
777                    */
778    
779                    if ((pEnc->mbParam.global & XVID_GLOBAL_PACKED)) {
780                            int tmp;
781    
782                            DPRINTF(DPRINTF_DEBUG,"*** EMPTY bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",
783                                    pEnc->bframenum_head, pEnc->bframenum_tail,
784                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
785    
786                            tmp = pEnc->current->seconds;
787                            pEnc->current->seconds = 0; /* force time_base = 0 */
788    
789      return 0;                                    // inter                          BitstreamWriteVopHeader(&bs, &pEnc->mbParam, pEnc->current, 0);
790                            pEnc->current->seconds = tmp;
791    
792                            BitstreamPadAlways(&bs);
793                            pFrame->length = BitstreamLength(&bs);
794                            pFrame->intra = 4;
795    
796                            if (pResult) {
797                                    pResult->quant = pEnc->current->quant;
798                                    pResult->hlength = pFrame->length - (pEnc->current->sStat.iTextBits / 8);
799                                    pResult->kblks = pEnc->current->sStat.kblks;
800                                    pResult->mblks = pEnc->current->sStat.mblks;
801                                    pResult->ublks = pEnc->current->sStat.ublks;
802                            }
803    
804                            emms();
805    
806                            if (pFrame->quant == 0) {
807                                    RateControlUpdate(&pEnc->rate_control, pEnc->current->quant,
808                                                                      pFrame->length, pFrame->intra);
809                            }
810    
811                            if (input_valid)
812                                    queue_image(pEnc, pFrame);
813    
814                            emms();
815    
816                            return XVID_ERR_OK;
817                    }
818            }
819    
820    
821    bvop_loop:
822    
823            if (pEnc->bframenum_dx50bvop != -1)
824            {
825    
826                    SWAP(FRAMEINFO *, pEnc->current, pEnc->reference);
827                    SWAP(FRAMEINFO *, pEnc->current, pEnc->bframes[pEnc->bframenum_dx50bvop]);
828    
829                    if ((pEnc->mbParam.global & XVID_GLOBAL_DEBUG)) {
830                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "DX50 IVOP");
831                    }
832    
833                    if (input_valid)
834                    {
835                            queue_image(pEnc, pFrame);
836                            input_valid = 0;
837                    }
838    
839            } else if (input_valid) {
840    
841                    SWAP(FRAMEINFO *, pEnc->current, pEnc->reference);
842    
843                    start_timer();
844                    if (image_input
845                            (&pEnc->current->image, pEnc->mbParam.width, pEnc->mbParam.height,
846                            pEnc->mbParam.edged_width, pFrame->image, pFrame->stride, pFrame->colorspace, pFrame->general & XVID_INTERLACING))
847                    {
848                            emms();
849                            return XVID_ERR_FORMAT;
850                    }
851                    stop_conv_timer();
852    
853                    if ((pFrame->general & XVID_CHROMAOPT)) {
854                            image_chroma_optimize(&pEnc->current->image,
855                                    pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width);
856                    }
857    
858                    /* queue input frame, and dequue next image */
859                    if (pEnc->queue_size > 0)
860                    {
861                            image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_tail]);
862                            if (pEnc->queue_head != pEnc->queue_tail)
863                            {
864                                    image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head]);
865                            }
866                            pEnc->queue_head =  (pEnc->queue_head + 1) % pEnc->mbParam.max_bframes;
867                            pEnc->queue_tail =  (pEnc->queue_tail + 1) % pEnc->mbParam.max_bframes;
868                    }
869    
870            } else if (pEnc->queue_size > 0) {
871    
872                    SWAP(FRAMEINFO *, pEnc->current, pEnc->reference);
873    
874                    image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head]);
875                    pEnc->queue_head =  (pEnc->queue_head + 1) % pEnc->mbParam.max_bframes;
876                    pEnc->queue_size--;
877    
878            } else {
879    
880                    /* if nothing was encoded, write an 'ignore this frame' flag
881                       to the bitstream */
882    
883                    if (BitstreamPos(&bs) == 0) {
884    
885                            DPRINTF(DPRINTF_DEBUG,"*** SKIP bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",
886                                    pEnc->bframenum_head, pEnc->bframenum_tail,
887                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
888    
889                            /* That disabled line of code was supposed to inform VirtualDub
890                             * that the frame was a dummy delay frame - now disabled (thx god :-)
891                             */
892                            //BitstreamPutBits(&bs, 0x7f, 8);
893                            pFrame->intra = 5;
894    
895                            if (pResult) {
896                                    /*
897                                     * We must decide what to put there because i know some apps
898                                     * are storing statistics about quantizers and just do
899                                     * stats[quant]++ or stats[quant-1]++
900                                     * transcode is one of these app with its 2pass module
901                                     */
902    
903                                    /*
904                                     * For now i prefer 31 than 0 that could lead to a segfault
905                                     * in transcode
906                                     */
907                                    pResult->quant = 31;
908    
909                                    pResult->hlength = 0;
910                                    pResult->kblks = 0;
911                                    pResult->mblks = 0;
912                                    pResult->ublks = 0;
913                            }
914                    } else {
915    
916                            if (pResult) {
917                                    pResult->quant = pEnc->current->quant;
918                                    pResult->hlength = pFrame->length - (pEnc->current->sStat.iTextBits / 8);
919                                    pResult->kblks = pEnc->current->sStat.kblks;
920                                    pResult->mblks = pEnc->current->sStat.mblks;
921                                    pResult->ublks = pEnc->current->sStat.ublks;
922                            }
923    
924                    }
925    
926                    pFrame->length = BitstreamLength(&bs);
927    
928                    emms();
929    
930                    return XVID_ERR_OK;
931            }
932    
933            pEnc->flush_bframes = 0;
934    
935            emms();
936    
937            /* only inc frame num, adapt quant, etc. if we havent seen it before */
938            if (pEnc->bframenum_dx50bvop < 0 )
939            {
940                    mode = intra2coding_type(pFrame->intra);
941                    if (pFrame->quant == 0)
942                            pEnc->current->quant = RateControlGetQ(&pEnc->rate_control, 0);
943                    else
944                            pEnc->current->quant = pFrame->quant;
945    
946    /*              if (pEnc->current->quant < 1)
947                            pEnc->current->quant = 1;
948    
949                    if (pEnc->current->quant > 31)
950                            pEnc->current->quant = 31;
951    */
952                    pEnc->current->global_flags = pFrame->general;
953                    pEnc->current->motion_flags = pFrame->motion;
954    
955                    /* ToDo : dynamic fcode (in both directions) */
956                    pEnc->current->fcode = pEnc->mbParam.m_fcode;
957                    pEnc->current->bcode = pEnc->mbParam.m_fcode;
958    
959                    inc_frame_num(pEnc);
960    
961                    if (pFrame->general & XVID_EXTRASTATS)
962                    {       image_copy(&pEnc->sOriginal, &pEnc->current->image,
963                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
964                    }
965    
966                    emms();
967    
968                    if ((pEnc->mbParam.global & XVID_GLOBAL_DEBUG)) {
969                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 5,
970                                    "%i  if:%i  st:%i", pEnc->m_framenum++, pEnc->iFrameNum, pEnc->current->stamp);
971                    }
972    
973            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
974             * Luminance masking
975             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
976    
977                    if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {
978                            int *temp_dquants =
979                                    (int *) xvid_malloc(pEnc->mbParam.mb_width *
980                                                                    pEnc->mbParam.mb_height * sizeof(int),
981                                                                    CACHE_LINE);
982    
983                            pEnc->current->quant =
984                                    adaptive_quantization(pEnc->current->image.y,
985                                                                      pEnc->mbParam.edged_width, temp_dquants,
986                                                                      pEnc->current->quant, pEnc->current->quant,
987                                                                      2 * pEnc->current->quant,
988                                                                      pEnc->mbParam.mb_width,
989                                                                      pEnc->mbParam.mb_height);
990    
991                            for (y = 0; y < pEnc->mbParam.mb_height; y++) {
992    
993    #define OFFSET(x,y) ((x) + (y)*pEnc->mbParam.mb_width)
994    
995                                    for (x = 0; x < pEnc->mbParam.mb_width; x++) {
996                                            MACROBLOCK *pMB = &pEnc->current->mbs[OFFSET(x, y)];
997    
998                                            pMB->dquant = iDQtab[temp_dquants[OFFSET(x, y)] + 2];
999                                    }
1000    #undef OFFSET
1001                            }
1002                            xvid_free(temp_dquants);
1003                    }
1004            }
1005    
1006            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1007             * ivop/pvop/bvop selection
1008             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1009            pEnc->iFrameNum++;
1010    
1011            if (pEnc->iFrameNum == 0 || pEnc->bframenum_dx50bvop >= 0 ||
1012                    (mode < 0 && pEnc->mbParam.iMaxKeyInterval > 0 &&
1013                            pEnc->iFrameNum >= pEnc->mbParam.iMaxKeyInterval)) {
1014                    mode = I_VOP;
1015            } else {
1016                    mode = MEanalysis(&pEnc->reference->image, pEnc->current,
1017                                            &pEnc->mbParam, pEnc->mbParam.iMaxKeyInterval,
1018                                            (/*mode < 0*/1/*hack*/) ? pEnc->iFrameNum : 0,
1019                                            bframes_count++, pFrame->bframe_threshold);
1020            }
1021    
1022            if (mode == I_VOP) {
1023                    /*
1024                     * This will be coded as an Intra Frame
1025                     */
1026                    if ((pEnc->current->global_flags & XVID_QUARTERPEL))
1027                            pEnc->mbParam.m_quarterpel = 1;
1028                    else
1029                            pEnc->mbParam.m_quarterpel = 0;
1030    
1031                    if (pEnc->current->global_flags & XVID_MPEGQUANT) pEnc->mbParam.m_quant_type = MPEG4_QUANT;
1032    
1033                    if ((pEnc->current->global_flags & XVID_CUSTOM_QMATRIX) > 0) {
1034                            if (pFrame->quant_intra_matrix != NULL)
1035                                    set_intra_matrix(pFrame->quant_intra_matrix);
1036                            if (pFrame->quant_inter_matrix != NULL)
1037                                    set_inter_matrix(pFrame->quant_inter_matrix);
1038                    }
1039    
1040    
1041                    DPRINTF(DPRINTF_DEBUG,"*** IFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",
1042                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1043                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1044    
1045                    if ((pEnc->mbParam.global & XVID_GLOBAL_DEBUG)) {
1046                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "IVOP");
1047                    }
1048    
1049                    /* when we reach an iframe in DX50BVOP mode, encode the last bframe as a pframe */
1050    
1051                    if ((pEnc->mbParam.global & XVID_GLOBAL_DX50BVOP) && pEnc->bframenum_tail > 0) {
1052    
1053                            pEnc->bframenum_tail--;
1054                            pEnc->bframenum_dx50bvop = pEnc->bframenum_tail;
1055    
1056                            SWAP(FRAMEINFO *, pEnc->current, pEnc->bframes[pEnc->bframenum_dx50bvop]);
1057                            if ((pEnc->mbParam.global & XVID_GLOBAL_DEBUG)) {
1058                                    image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "DX50 BVOP->PVOP");
1059                            }
1060                            FrameCodeP(pEnc, &bs, &bits, 1, 0);
1061                            bframes_count = 0;
1062                            pFrame->intra = 0;
1063    
1064                    } else {
1065    
1066                            FrameCodeI(pEnc, &bs, &bits);
1067                            bframes_count = 0;
1068                            pFrame->intra = 1;
1069    
1070                            pEnc->bframenum_dx50bvop = -1;
1071                    }
1072    
1073                    pEnc->flush_bframes = 1;
1074    
1075                    if ((pEnc->mbParam.global & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail > 0) {
1076                            BitstreamPadAlways(&bs);
1077                            input_valid = 0;
1078                            goto ipvop_loop;
1079                    }
1080    
1081                    /*
1082                     * NB : sequences like "IIBB" decode fine with msfdam but,
1083                     *        go screwy with divx 5.00
1084                     */
1085            } else if (mode == P_VOP || mode == S_VOP || pEnc->bframenum_tail >= pEnc->mbParam.max_bframes) {
1086                    /*
1087                     * This will be coded as a Predicted Frame
1088                     */
1089    
1090                    DPRINTF(DPRINTF_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",
1091                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1092                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1093    
1094                    if ((pEnc->mbParam.global & XVID_GLOBAL_DEBUG)) {
1095                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "PVOP");
1096                    }
1097    
1098                    FrameCodeP(pEnc, &bs, &bits, 1, 0);
1099                    bframes_count = 0;
1100                    pFrame->intra = 0;
1101                    pEnc->flush_bframes = 1;
1102    
1103                    if ((pEnc->mbParam.global & XVID_GLOBAL_PACKED) && (pEnc->bframenum_tail > 0)) {
1104                            BitstreamPadAlways(&bs);
1105                            input_valid = 0;
1106                            goto ipvop_loop;
1107                    }
1108    
1109            } else {        /* mode == B_VOP */
1110                    /*
1111                     * This will be coded as a Bidirectional Frame
1112                     */
1113    
1114                    if ((pEnc->mbParam.global & XVID_GLOBAL_DEBUG)) {
1115                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "BVOP");
1116                    }
1117    
1118                    if (pFrame->bquant < 1) {
1119                            pEnc->current->quant = ((((pEnc->reference->quant + pEnc->current->quant) *
1120                                    pEnc->mbParam.bquant_ratio) / 2) + pEnc->mbParam.bquant_offset)/100;
1121    
1122                    } else {
1123                            pEnc->current->quant = pFrame->bquant;
1124                    }
1125    
1126                    if (pEnc->current->quant < 1)
1127                            pEnc->current->quant = 1;
1128                    else if (pEnc->current->quant > 31)
1129                            pEnc->current->quant = 31;
1130    
1131                    DPRINTF(DPRINTF_DEBUG,"*** BFRAME (store) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i  quant=%i\n",
1132                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1133                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size,pEnc->current->quant);
1134    
1135                    /* store frame into bframe buffer & swap ref back to current */
1136                    SWAP(FRAMEINFO *, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1137                    SWAP(FRAMEINFO *, pEnc->current, pEnc->reference);
1138    
1139                    pEnc->bframenum_tail++;
1140    
1141                    /* bframe report by koepi */
1142                    pFrame->intra = 2;
1143                    pFrame->length = 0;
1144    
1145                    input_valid = 0;
1146                    goto bvop_loop;
1147            }
1148    
1149            BitstreamPadAlways(&bs);
1150            pFrame->length = BitstreamLength(&bs);
1151    
1152            if (pResult) {
1153                    pResult->quant = pEnc->current->quant;
1154                    pResult->hlength = pFrame->length - (pEnc->current->sStat.iTextBits / 8);
1155                    pResult->kblks = pEnc->current->sStat.kblks;
1156                    pResult->mblks = pEnc->current->sStat.mblks;
1157                    pResult->ublks = pEnc->current->sStat.ublks;
1158    
1159                    if (pFrame->general & XVID_EXTRASTATS)
1160                    {       pResult->sse_y =
1161                                    plane_sse( pEnc->sOriginal.y, pEnc->current->image.y,
1162                                                       pEnc->mbParam.edged_width, pEnc->mbParam.width,
1163                                                       pEnc->mbParam.height);
1164    
1165                            pResult->sse_u =
1166                                    plane_sse( pEnc->sOriginal.u, pEnc->current->image.u,
1167                                                       pEnc->mbParam.edged_width/2, pEnc->mbParam.width/2,
1168                                                       pEnc->mbParam.height/2);
1169    
1170                            pResult->sse_v =
1171                                    plane_sse( pEnc->sOriginal.v, pEnc->current->image.v,
1172                                                       pEnc->mbParam.edged_width/2, pEnc->mbParam.width/2,
1173                                                       pEnc->mbParam.height/2);
1174                    }
1175            }
1176    
1177            emms();
1178    
1179            if (pFrame->quant == 0) {
1180                    RateControlUpdate(&pEnc->rate_control, pEnc->current->quant,
1181                                                      pFrame->length, pFrame->intra);
1182            }
1183    
1184            stop_global_timer();
1185            write_timer();
1186    
1187            emms();
1188            return XVID_ERR_OK;
1189    }
1190    
1191    
1192    
1193    /*****************************************************************************
1194     * "original" IP frame encoder entry point
1195     *
1196     * Returned values :
1197     *      - XVID_ERR_OK    - no errors
1198     *      - XVID_ERR_FORMAT - the image subsystem reported the image had a wrong
1199     *                                              format
1200     ****************************************************************************/
1201    
1202    int
1203    encoder_encode(Encoder * pEnc,
1204                               XVID_ENC_FRAME * pFrame,
1205                               XVID_ENC_STATS * pResult)
1206    {
1207            uint16_t x, y;
1208            Bitstream bs;
1209            uint32_t bits;
1210            uint16_t write_vol_header = 0;
1211    
1212            float psnr;
1213            char temp[128];
1214    
1215            start_global_timer();
1216    
1217            ENC_CHECK(pEnc);
1218            ENC_CHECK(pFrame);
1219            ENC_CHECK(pFrame->bitstream);
1220            ENC_CHECK(pFrame->image);
1221    
1222            SWAP(FRAMEINFO *, pEnc->current, pEnc->reference);
1223    
1224            pEnc->current->global_flags = pFrame->general;
1225            pEnc->current->motion_flags = pFrame->motion;
1226            pEnc->mbParam.hint = &pFrame->hint;
1227    
1228            inc_frame_num(pEnc);
1229    
1230            /* disable alternate scan flag if interlacing is not enabled */
1231            if ((pEnc->current->global_flags & XVID_ALTERNATESCAN) &&
1232                    !(pEnc->current->global_flags & XVID_INTERLACING))
1233            {
1234                    pEnc->current->global_flags -= XVID_ALTERNATESCAN;
1235            }
1236    
1237            start_timer();
1238            if (image_input
1239                    (&pEnc->current->image, pEnc->mbParam.width, pEnc->mbParam.height,
1240                     pEnc->mbParam.edged_width, pFrame->image, pFrame->stride, pFrame->colorspace, pFrame->general & XVID_INTERLACING) < 0)
1241                    return XVID_ERR_FORMAT;
1242            stop_conv_timer();
1243    
1244            if ((pFrame->general & XVID_CHROMAOPT)) {
1245                    image_chroma_optimize(&pEnc->current->image,
1246                            pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width);
1247            }
1248    
1249            if (pFrame->general & XVID_EXTRASTATS)
1250            {       image_copy(&pEnc->sOriginal, &pEnc->current->image,
1251                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
1252            }
1253    
1254            emms();
1255    
1256            BitstreamInit(&bs, pFrame->bitstream, 0);
1257    
1258            if (pFrame->quant == 0) {
1259                    pEnc->current->quant = RateControlGetQ(&pEnc->rate_control, 0);
1260            } else {
1261                    pEnc->current->quant = pFrame->quant;
1262            }
1263    
1264            if ((pEnc->current->global_flags & XVID_QUARTERPEL))
1265                    pEnc->mbParam.m_quarterpel = 1;
1266            else
1267                    pEnc->mbParam.m_quarterpel = 0;
1268    
1269            if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {
1270                    int *temp_dquants =
1271                            (int *) xvid_malloc(pEnc->mbParam.mb_width *
1272                                                                    pEnc->mbParam.mb_height * sizeof(int),
1273                                                                    CACHE_LINE);
1274    
1275                    pEnc->current->quant =
1276                            adaptive_quantization(pEnc->current->image.y,
1277                                                                      pEnc->mbParam.edged_width, temp_dquants,
1278                                                                      pEnc->current->quant, pEnc->current->quant,
1279                                                                      2 * pEnc->current->quant,
1280                                                                      pEnc->mbParam.mb_width,
1281                                                                      pEnc->mbParam.mb_height);
1282    
1283                    for (y = 0; y < pEnc->mbParam.mb_height; y++) {
1284    
1285    #define OFFSET(x,y) ((x) + (y)*pEnc->mbParam.mb_width)
1286    
1287                            for (x = 0; x < pEnc->mbParam.mb_width; x++) {
1288    
1289    
1290                                    MACROBLOCK *pMB = &pEnc->current->mbs[OFFSET(x, y)];
1291    
1292                                    pMB->dquant = iDQtab[temp_dquants[OFFSET(x, y)] + 2];
1293                            }
1294    
1295    #undef OFFSET
1296                    }
1297    
1298                    xvid_free(temp_dquants);
1299            }
1300    
1301            if (pEnc->current->global_flags & XVID_H263QUANT) {
1302                    if (pEnc->mbParam.m_quant_type != H263_QUANT)
1303                            write_vol_header = 1;
1304                    pEnc->mbParam.m_quant_type = H263_QUANT;
1305            } else if (pEnc->current->global_flags & XVID_MPEGQUANT) {
1306                    int matrix1_changed, matrix2_changed;
1307    
1308                    matrix1_changed = matrix2_changed = 0;
1309    
1310                    if (pEnc->mbParam.m_quant_type != MPEG4_QUANT)
1311                            write_vol_header = 1;
1312    
1313                    pEnc->mbParam.m_quant_type = MPEG4_QUANT;
1314    
1315                    if ((pEnc->current->global_flags & XVID_CUSTOM_QMATRIX) > 0) {
1316                            if (pFrame->quant_intra_matrix != NULL)
1317                                    matrix1_changed = set_intra_matrix(pFrame->quant_intra_matrix);
1318                            if (pFrame->quant_inter_matrix != NULL)
1319                                    matrix2_changed = set_inter_matrix(pFrame->quant_inter_matrix);
1320                    } else {
1321                            matrix1_changed = set_intra_matrix(get_default_intra_matrix());
1322                            matrix2_changed = set_inter_matrix(get_default_inter_matrix());
1323                    }
1324                    if (write_vol_header == 0)
1325                            write_vol_header = matrix1_changed | matrix2_changed;
1326            }
1327    
1328            if (pFrame->intra < 0) {
1329                    if ((pEnc->iFrameNum == -1)
1330                            || ((pEnc->mbParam.iMaxKeyInterval > 0)
1331                                    && (pEnc->iFrameNum >= pEnc->mbParam.iMaxKeyInterval))) {
1332                            pFrame->intra = FrameCodeI(pEnc, &bs, &bits);
1333                    } else {
1334                            pFrame->intra = FrameCodeP(pEnc, &bs, &bits, 0, write_vol_header);
1335                    }
1336            } else {
1337                    if (pFrame->intra == 1) {
1338                            pFrame->intra = FrameCodeI(pEnc, &bs, &bits);
1339                    } else {
1340                            pFrame->intra = FrameCodeP(pEnc, &bs, &bits, 1, write_vol_header);
1341                    }
1342    
1343            }
1344    
1345            /* Relic from OpenDivX - now disabled
1346            BitstreamPutBits(&bs, 0xFFFF, 16);
1347            BitstreamPutBits(&bs, 0xFFFF, 16);
1348            */
1349    
1350            BitstreamPadAlways(&bs);
1351            pFrame->length = BitstreamLength(&bs);
1352    
1353            if (pResult) {
1354                    pResult->quant = pEnc->current->quant;
1355                    pResult->hlength = pFrame->length - (pEnc->current->sStat.iTextBits / 8);
1356                    pResult->kblks = pEnc->current->sStat.kblks;
1357                    pResult->mblks = pEnc->current->sStat.mblks;
1358                    pResult->ublks = pEnc->current->sStat.ublks;
1359            }
1360    
1361            emms();
1362    
1363            if (pFrame->quant == 0) {
1364                    RateControlUpdate(&pEnc->rate_control, pEnc->current->quant,
1365                                                      pFrame->length, pFrame->intra);
1366            }
1367            if (pFrame->general & XVID_EXTRASTATS)
1368            {
1369                    psnr =
1370                            image_psnr(&pEnc->sOriginal, &pEnc->current->image,
1371                                               pEnc->mbParam.edged_width, pEnc->mbParam.width,
1372                                               pEnc->mbParam.height);
1373    
1374                    snprintf(temp, 127, "PSNR: %f\n", psnr);
1375            }
1376    
1377            pEnc->iFrameNum++;
1378    
1379            stop_global_timer();
1380            write_timer();
1381    
1382            return XVID_ERR_OK;
1383    }
1384    
1385    
1386    static __inline void
1387    CodeIntraMB(Encoder * pEnc,
1388                            MACROBLOCK * pMB)
1389    {
1390    
1391            pMB->mode = MODE_INTRA;
1392    
1393            /* zero mv statistics */
1394            pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = 0;
1395            pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = 0;
1396            pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = 0;
1397            pMB->sad16 = 0;
1398    
1399            if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {
1400                    if (pMB->dquant != NO_CHANGE) {
1401                            pMB->mode = MODE_INTRA_Q;
1402                            pEnc->current->quant += DQtab[pMB->dquant];
1403    
1404                            if (pEnc->current->quant > 31)
1405                                    pEnc->current->quant = 31;
1406                            if (pEnc->current->quant < 1)
1407                                    pEnc->current->quant = 1;
1408                    }
1409            }
1410    
1411            pMB->quant = pEnc->current->quant;
1412    }
1413    
1414    
1415    #define FCODEBITS       3
1416    #define MODEBITS        5
1417    
1418    void
1419    HintedMESet(Encoder * pEnc,
1420                            int *intra)
1421    {
1422            HINTINFO *hint;
1423            Bitstream bs;
1424            int length, high;
1425            uint32_t x, y;
1426    
1427            hint = pEnc->mbParam.hint;
1428    
1429            if (hint->rawhints) {
1430                    *intra = hint->mvhint.intra;
1431            } else {
1432                    BitstreamInit(&bs, hint->hintstream, hint->hintlength);
1433                    *intra = BitstreamGetBit(&bs);
1434            }
1435    
1436            if (*intra) {
1437                    return;
1438            }
1439    
1440            pEnc->current->fcode = (hint->rawhints) ?
1441                    (uint32_t)hint->mvhint.fcode : BitstreamGetBits(&bs, FCODEBITS);
1442    
1443            length = pEnc->current->fcode + 5;
1444            high = 1 << (length - 1);
1445    
1446            for (y = 0; y < pEnc->mbParam.mb_height; ++y) {
1447                    for (x = 0; x < pEnc->mbParam.mb_width; ++x) {
1448                            MACROBLOCK *pMB =
1449                                    &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];
1450                            MVBLOCKHINT *bhint =
1451                                    &hint->mvhint.block[x + y * pEnc->mbParam.mb_width];
1452                            VECTOR pred;
1453                            VECTOR tmp;
1454                            int vec;
1455    
1456                            pMB->mode =     (hint->rawhints) ?
1457                                    (uint32_t)bhint->mode : BitstreamGetBits(&bs, MODEBITS);
1458    
1459                            pMB->mode = (pMB->mode == MODE_INTER_Q) ? MODE_INTER : pMB->mode;
1460                            pMB->mode = (pMB->mode == MODE_INTRA_Q) ? MODE_INTRA : pMB->mode;
1461    
1462                            if (pMB->mode == MODE_INTER) {
1463                                    tmp.x = (hint->rawhints) ?
1464                                            bhint->mvs[0].x : (int)BitstreamGetBits(&bs, length);
1465                                    tmp.y = (hint->rawhints) ?
1466                                            bhint->mvs[0].y : (int)BitstreamGetBits(&bs, length);
1467                                    tmp.x -= (tmp.x >= high) ? high * 2 : 0;
1468                                    tmp.y -= (tmp.y >= high) ? high * 2 : 0;
1469    
1470                                    pred = get_pmv2(pEnc->current->mbs,pEnc->mbParam.mb_width,0,x,y,0);
1471    
1472                                    for (vec = 0; vec < 4; ++vec) {
1473                                            pMB->mvs[vec].x = tmp.x;
1474                                            pMB->mvs[vec].y = tmp.y;
1475                                            pMB->pmvs[vec].x = pMB->mvs[0].x - pred.x;
1476                                            pMB->pmvs[vec].y = pMB->mvs[0].y - pred.y;
1477                                    }
1478                            } else if (pMB->mode == MODE_INTER4V) {
1479                                    for (vec = 0; vec < 4; ++vec) {
1480                                            tmp.x = (hint->rawhints) ?
1481                                                    bhint->mvs[vec].x : (int)BitstreamGetBits(&bs, length);
1482                                            tmp.y = (hint->rawhints) ?
1483                                                    bhint->mvs[vec].y : (int)BitstreamGetBits(&bs, length);
1484                                            tmp.x -= (tmp.x >= high) ? high * 2 : 0;
1485                                            tmp.y -= (tmp.y >= high) ? high * 2 : 0;
1486    
1487                                            pred = get_pmv2(pEnc->current->mbs,pEnc->mbParam.mb_width,0,x,y,vec);
1488    
1489                                            pMB->mvs[vec].x = tmp.x;
1490                                            pMB->mvs[vec].y = tmp.y;
1491                                            pMB->pmvs[vec].x = pMB->mvs[vec].x - pred.x;
1492                                            pMB->pmvs[vec].y = pMB->mvs[vec].y - pred.y;
1493                                    }
1494                            } else                          /* intra / stuffing / not_coded */
1495                            {
1496                                    for (vec = 0; vec < 4; ++vec) {
1497                                            pMB->mvs[vec].x = pMB->mvs[vec].y = 0;
1498                                    }
1499                            }
1500    
1501                            if (pMB->mode == MODE_INTER4V &&
1502                                    (pEnc->current->global_flags & XVID_LUMIMASKING)
1503                                    && pMB->dquant != NO_CHANGE) {
1504                                    pMB->mode = MODE_INTRA;
1505    
1506                                    for (vec = 0; vec < 4; ++vec) {
1507                                            pMB->mvs[vec].x = pMB->mvs[vec].y = 0;
1508                                    }
1509                            }
1510                    }
1511            }
1512    }
1513    
1514    
1515    void
1516    HintedMEGet(Encoder * pEnc,
1517                            int intra)
1518    {
1519            HINTINFO *hint;
1520            Bitstream bs;
1521            uint32_t x, y;
1522            int length, high;
1523    
1524            hint = pEnc->mbParam.hint;
1525    
1526            if (hint->rawhints) {
1527                    hint->mvhint.intra = intra;
1528            } else {
1529                    BitstreamInit(&bs, hint->hintstream, 0);
1530                    BitstreamPutBit(&bs, intra);
1531            }
1532    
1533            if (intra) {
1534                    if (!hint->rawhints) {
1535                            BitstreamPadAlways(&bs);
1536                            hint->hintlength = BitstreamLength(&bs);
1537                    }
1538                    return;
1539            }
1540    
1541            length = pEnc->current->fcode + 5;
1542            high = 1 << (length - 1);
1543    
1544            if (hint->rawhints) {
1545                    hint->mvhint.fcode = pEnc->current->fcode;
1546            } else {
1547                    BitstreamPutBits(&bs, pEnc->current->fcode, FCODEBITS);
1548            }
1549    
1550            for (y = 0; y < pEnc->mbParam.mb_height; ++y) {
1551                    for (x = 0; x < pEnc->mbParam.mb_width; ++x) {
1552                            MACROBLOCK *pMB =
1553                                    &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];
1554                            MVBLOCKHINT *bhint =
1555                                    &hint->mvhint.block[x + y * pEnc->mbParam.mb_width];
1556                            VECTOR tmp;
1557    
1558                            if (hint->rawhints) {
1559                                    bhint->mode = pMB->mode;
1560                            } else {
1561                                    BitstreamPutBits(&bs, pMB->mode, MODEBITS);
1562                            }
1563    
1564                            if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q) {
1565                                    tmp.x = pMB->mvs[0].x;
1566                                    tmp.y = pMB->mvs[0].y;
1567                                    tmp.x += (tmp.x < 0) ? high * 2 : 0;
1568                                    tmp.y += (tmp.y < 0) ? high * 2 : 0;
1569    
1570                                    if (hint->rawhints) {
1571                                            bhint->mvs[0].x = tmp.x;
1572                                            bhint->mvs[0].y = tmp.y;
1573                                    } else {
1574                                            BitstreamPutBits(&bs, tmp.x, length);
1575                                            BitstreamPutBits(&bs, tmp.y, length);
1576                                    }
1577                            } else if (pMB->mode == MODE_INTER4V) {
1578                                    int vec;
1579    
1580                                    for (vec = 0; vec < 4; ++vec) {
1581                                            tmp.x = pMB->mvs[vec].x;
1582                                            tmp.y = pMB->mvs[vec].y;
1583                                            tmp.x += (tmp.x < 0) ? high * 2 : 0;
1584                                            tmp.y += (tmp.y < 0) ? high * 2 : 0;
1585    
1586                                            if (hint->rawhints) {
1587                                                    bhint->mvs[vec].x = tmp.x;
1588                                                    bhint->mvs[vec].y = tmp.y;
1589                                            } else {
1590                                                    BitstreamPutBits(&bs, tmp.x, length);
1591                                                    BitstreamPutBits(&bs, tmp.y, length);
1592                                            }
1593                                    }
1594                            }
1595                    }
1596            }
1597    
1598            if (!hint->rawhints) {
1599                    BitstreamPad(&bs);
1600                    hint->hintlength = BitstreamLength(&bs);
1601            }
1602    }
1603    
1604    
1605    static int
1606    FrameCodeI(Encoder * pEnc,
1607                       Bitstream * bs,
1608                       uint32_t * pBits)
1609    {
1610            int mb_width = pEnc->mbParam.mb_width;
1611            int mb_height = pEnc->mbParam.mb_height;
1612    
1613            DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1614            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1615    
1616            uint16_t x, y;
1617    
1618            if ((pEnc->current->global_flags & XVID_REDUCED))
1619            {
1620                    mb_width = (pEnc->mbParam.width + 31) / 32;
1621                    mb_height = (pEnc->mbParam.height + 31) / 32;
1622    
1623                    /* 16x16->8x8 downsample requires 1 additional edge pixel*/
1624                    /* XXX: setedges is overkill */
1625                    start_timer();
1626                    image_setedges(&pEnc->current->image,
1627                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
1628                            pEnc->mbParam.width, pEnc->mbParam.height);
1629                    stop_edges_timer();
1630            }
1631            pEnc->iFrameNum = 0;
1632            pEnc->mbParam.m_rounding_type = 1;
1633            pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;
1634            pEnc->current->quarterpel =  pEnc->mbParam.m_quarterpel;
1635            pEnc->current->coding_type = I_VOP;
1636    
1637            BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current);
1638    
1639            set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);
1640    
1641            BitstreamPadAlways(bs);
1642            BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1);
1643    
1644            *pBits = BitstreamPos(bs);
1645    
1646            pEnc->current->sStat.iTextBits = 0;
1647            pEnc->current->sStat.kblks = mb_width * mb_height;
1648            pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;
1649    
1650            for (y = 0; y < mb_height; y++)
1651                    for (x = 0; x < mb_width; x++) {
1652                            MACROBLOCK *pMB =
1653                                    &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];
1654    
1655                            CodeIntraMB(pEnc, pMB);
1656    
1657                            MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y,
1658                                                              dct_codes, qcoeff);
1659    
1660                            start_timer();
1661                            MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);
1662                            stop_prediction_timer();
1663    
1664                            start_timer();
1665                            if (pEnc->current->global_flags & XVID_GREYSCALE)
1666                            {       pMB->cbp &= 0x3C;               /* keep only bits 5-2 */
1667                                    qcoeff[4*64+0]=0;               /* zero, because for INTRA MBs DC value is saved */
1668                                    qcoeff[5*64+0]=0;
1669                            }
1670                            MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);
1671                            stop_coding_timer();
1672                    }
1673    
1674            if ((pEnc->current->global_flags & XVID_REDUCED))
1675            {
1676                    image_deblock_rrv(&pEnc->current->image, pEnc->mbParam.edged_width,
1677                            pEnc->current->mbs, mb_width, mb_height, pEnc->mbParam.mb_width,
1678                            16, XVID_DEC_DEBLOCKY|XVID_DEC_DEBLOCKUV);
1679            }
1680            emms();
1681    
1682            *pBits = BitstreamPos(bs) - *pBits;
1683            pEnc->fMvPrevSigma = -1;
1684            pEnc->mbParam.m_fcode = 2;
1685    
1686            if (pEnc->current->global_flags & XVID_HINTEDME_GET) {
1687                    HintedMEGet(pEnc, 1);
1688            }
1689    
1690            return 1;                                       /* intra */
1691    }
1692    
1693    
1694    #define INTRA_THRESHOLD 0.5
1695    #define BFRAME_SKIP_THRESHHOLD 30
1696    
1697    
1698    /* FrameCodeP also handles S(GMC)-VOPs */
1699    static int
1700    FrameCodeP(Encoder * pEnc,
1701                       Bitstream * bs,
1702                       uint32_t * pBits,
1703                       bool force_inter,
1704                       bool vol_header)
1705    {
1706            float fSigma;
1707    
1708            DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1709            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1710    
1711            int mb_width = pEnc->mbParam.mb_width;
1712            int mb_height = pEnc->mbParam.mb_height;
1713    
1714            int iLimit;
1715            int x, y, k;
1716            int iSearchRange;
1717            int bIntra, skip_possible;
1718    
1719            /* IMAGE *pCurrent = &pEnc->current->image; */
1720            IMAGE *pRef = &pEnc->reference->image;
1721    
1722            if ((pEnc->current->global_flags & XVID_REDUCED))
1723            {
1724                    mb_width = (pEnc->mbParam.width + 31) / 32;
1725                    mb_height = (pEnc->mbParam.height + 31) / 32;
1726            }
1727    
1728            start_timer();
1729            image_setedges(pRef, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
1730                                       pEnc->mbParam.width, pEnc->mbParam.height);
1731            stop_edges_timer();
1732    
1733            pEnc->mbParam.m_rounding_type = 1 - pEnc->mbParam.m_rounding_type;
1734            pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;
1735            pEnc->current->quarterpel =  pEnc->mbParam.m_quarterpel;
1736            pEnc->current->fcode = pEnc->mbParam.m_fcode;
1737    
1738            if (!force_inter)
1739                    iLimit = (int)(mb_width * mb_height *  INTRA_THRESHOLD);
1740            else
1741                    iLimit = mb_width * mb_height + 1;
1742    
1743            if ((pEnc->current->global_flags & XVID_HALFPEL)) {
1744                    start_timer();
1745                    image_interpolate(pRef, &pEnc->vInterH, &pEnc->vInterV,
1746                                                      &pEnc->vInterHV, pEnc->mbParam.edged_width,
1747                                                      pEnc->mbParam.edged_height,
1748                                                      pEnc->mbParam.m_quarterpel,
1749                                                      pEnc->current->rounding_type);
1750                    stop_inter_timer();
1751            }
1752    
1753            pEnc->current->coding_type = P_VOP;
1754    
1755            start_timer();
1756            if (pEnc->current->global_flags & XVID_HINTEDME_SET)
1757                    HintedMESet(pEnc, &bIntra);
1758            else
1759                    bIntra =
1760                            MotionEstimation(&pEnc->mbParam, pEnc->current, pEnc->reference,
1761                                                     &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,
1762                                                     iLimit);
1763    
1764            stop_motion_timer();
1765    
1766            if (bIntra == 1) return FrameCodeI(pEnc, bs, pBits);
1767    
1768            if ( ( pEnc->current->global_flags & XVID_GMC )
1769                    && ( (pEnc->current->warp.duv[1].x != 0) || (pEnc->current->warp.duv[1].y != 0) ) )
1770            {
1771                    pEnc->current->coding_type = S_VOP;
1772    
1773                    generate_GMCparameters( 2, 16, &pEnc->current->warp,
1774                                            pEnc->mbParam.width, pEnc->mbParam.height,
1775                                            &pEnc->current->gmc_data);
1776    
1777                    generate_GMCimage(&pEnc->current->gmc_data, &pEnc->reference->image,
1778                                    pEnc->mbParam.mb_width, pEnc->mbParam.mb_height,
1779                                    pEnc->mbParam.edged_width, pEnc->mbParam.edged_width/2,
1780                                    pEnc->mbParam.m_fcode, pEnc->mbParam.m_quarterpel, 0,
1781                                    pEnc->current->rounding_type, pEnc->current->mbs, &pEnc->vGMC);
1782    
1783            }
1784    
1785            set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);
1786            if (vol_header)
1787            {       BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current);
1788                    BitstreamPadAlways(bs);
1789            }
1790    
1791            BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1);
1792    
1793            *pBits = BitstreamPos(bs);
1794    
1795            pEnc->current->sStat.iTextBits = pEnc->current->sStat.iMvSum = pEnc->current->sStat.iMvCount =
1796                    pEnc->current->sStat.kblks = pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;
1797    
1798    
1799            for (y = 0; y < mb_height; y++) {
1800                    for (x = 0; x < mb_width; x++) {
1801                            MACROBLOCK *pMB =
1802                                    &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];
1803    
1804    /* Mode decision: Check, if the block should be INTRA / INTER or GMC-coded */
1805    /* For a start, leave INTRA decision as is, only choose only between INTER/GMC  - gruel, 9.1.2002 */
1806    
1807                            bIntra = (pMB->mode == MODE_INTRA) || (pMB->mode == MODE_INTRA_Q);
1808    
1809                            if (bIntra) {
1810                                    CodeIntraMB(pEnc, pMB);
1811                                    MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y,
1812                                                                      dct_codes, qcoeff);
1813    
1814                                    start_timer();
1815                                    MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);
1816                                    stop_prediction_timer();
1817    
1818                                    pEnc->current->sStat.kblks++;
1819    
1820                                    MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);
1821                                    stop_coding_timer();
1822                                    continue;
1823                            }
1824    
1825                            if (pEnc->current->coding_type == S_VOP) {
1826    
1827                                    int32_t iSAD = sad16(pEnc->current->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,
1828                                            pEnc->vGMC.y + 16*y*pEnc->mbParam.edged_width + 16*x,
1829                                            pEnc->mbParam.edged_width, 65536);
1830    
1831                                    if (pEnc->current->motion_flags & PMV_CHROMA16) {
1832                                            iSAD += sad8(pEnc->current->image.u + 8*y*(pEnc->mbParam.edged_width/2) + 8*x,
1833                                            pEnc->vGMC.u + 8*y*(pEnc->mbParam.edged_width/2) + 8*x, pEnc->mbParam.edged_width/2);
1834    
1835                                            iSAD += sad8(pEnc->current->image.v + 8*y*(pEnc->mbParam.edged_width/2) + 8*x,
1836                                            pEnc->vGMC.v + 8*y*(pEnc->mbParam.edged_width/2) + 8*x, pEnc->mbParam.edged_width/2);
1837                                    }
1838    
1839                                    if (iSAD <= pMB->sad16) {               /* mode decision GMC */
1840    
1841                                            if (pEnc->mbParam.m_quarterpel)
1842                                                    pMB->qmvs[0] = pMB->qmvs[1] = pMB->qmvs[2] = pMB->qmvs[3] = pMB->amv;
1843                                            else
1844                                                    pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->amv;
1845    
1846                                            pMB->mode = MODE_INTER;
1847                                            pMB->mcsel = 1;
1848                                            pMB->sad16 = iSAD;
1849                                    } else {
1850                                            pMB->mcsel = 0;
1851                                    }
1852                            } else {
1853                                    pMB->mcsel = 0; /* just a precaution */
1854                            }
1855    
1856                            start_timer();
1857                            MBMotionCompensation(pMB, x, y, &pEnc->reference->image,
1858                                                                     &pEnc->vInterH, &pEnc->vInterV,
1859                                                                     &pEnc->vInterHV, &pEnc->vGMC,
1860                                                                     &pEnc->current->image,
1861                                                                     dct_codes, pEnc->mbParam.width,
1862                                                                     pEnc->mbParam.height,
1863                                                                     pEnc->mbParam.edged_width,
1864                                                                     pEnc->mbParam.m_quarterpel,
1865                                                                     (pEnc->current->global_flags & XVID_REDUCED),
1866                                                                     pEnc->current->rounding_type);
1867    
1868                            stop_comp_timer();
1869    
1870                            if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {
1871                                    if (pMB->dquant != NO_CHANGE) {
1872                                            pMB->mode = MODE_INTER_Q;
1873                                            pEnc->current->quant += DQtab[pMB->dquant];
1874                                            if (pEnc->current->quant > 31)
1875                                                    pEnc->current->quant = 31;
1876                                            else if (pEnc->current->quant < 1)
1877                                                    pEnc->current->quant = 1;
1878                                    }
1879                            }
1880                            pMB->quant = pEnc->current->quant;
1881    
1882                            pMB->field_pred = 0;
1883    
1884                            if (pMB->mode != MODE_NOT_CODED)
1885                            {       pMB->cbp =
1886                                            MBTransQuantInter(&pEnc->mbParam, pEnc->current, pMB, x, y,
1887                                                                              dct_codes, qcoeff);
1888                            }
1889    
1890                            if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||
1891                                       pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||
1892                                       pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {
1893                                    pEnc->current->sStat.mblks++;
1894                            }  else {
1895                                    pEnc->current->sStat.ublks++;
1896                            }
1897    
1898                            start_timer();
1899    
1900                            /* Finished processing the MB, now check if to CODE or SKIP */
1901    
1902                            skip_possible = (pMB->cbp == 0) && (pMB->mode == MODE_INTER) &&
1903                                                            (pMB->dquant == NO_CHANGE);
1904    
1905                            if (pEnc->current->coding_type == S_VOP)
1906                                    skip_possible &= (pMB->mcsel == 1);
1907                            else if (pEnc->current->coding_type == P_VOP) {
1908                                    if (pEnc->mbParam.m_quarterpel)
1909                                            skip_possible &= ( (pMB->qmvs[0].x == 0) && (pMB->qmvs[0].y == 0) );
1910                                    else
1911                                            skip_possible &= ( (pMB->mvs[0].x == 0) && (pMB->mvs[0].y == 0) );
1912                            }
1913    
1914                            if ( (pMB->mode == MODE_NOT_CODED) || (skip_possible)) {
1915    
1916    /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */
1917    
1918                                    if (pEnc->current->coding_type == P_VOP)        /* special rule for P-VOP's SKIP */
1919                                    {
1920                                            int bSkip = 1;
1921    
1922                                            for (k=pEnc->bframenum_head; k< pEnc->bframenum_tail; k++)
1923                                            {
1924                                                    int iSAD;
1925                                                    iSAD = sad16(pEnc->reference->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,
1926                                                                            pEnc->bframes[k]->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,
1927                                                                    pEnc->mbParam.edged_width,BFRAME_SKIP_THRESHHOLD);
1928                                                    if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant)
1929                                                    {       bSkip = 0;
1930                                                            break;
1931                                                    }
1932                                            }
1933    
1934                                            if (!bSkip) {   /* no SKIP, but trivial block */
1935                                                    if(pEnc->mbParam.m_quarterpel) {
1936                                                            VECTOR predMV = get_qpmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);
1937                                                            pMB->pmvs[0].x = - predMV.x;
1938                                                            pMB->pmvs[0].y = - predMV.y;
1939                                                    }
1940                                                    else {
1941                                                            VECTOR predMV = get_pmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);
1942                                                            pMB->pmvs[0].x = - predMV.x;
1943                                                            pMB->pmvs[0].y = - predMV.y;
1944                                                    }
1945                                                    pMB->mode = MODE_INTER;
1946                                                    pMB->cbp = 0;
1947                                                    MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);
1948                                                    stop_coding_timer();
1949    
1950                                                    continue;       /* next MB */
1951                                            }
1952                                    }
1953                                    /* do SKIP */
1954    
1955                                    pMB->mode = MODE_NOT_CODED;
1956                                    MBSkip(bs);
1957                                    stop_coding_timer();
1958                                    continue;       /* next MB */
1959                            }
1960                            /* ordinary case: normal coded INTER/INTER4V block */
1961    
1962                            if (pEnc->current->global_flags & XVID_GREYSCALE)
1963                            {       pMB->cbp &= 0x3C;               /* keep only bits 5-2 */
1964                                    qcoeff[4*64+0]=0;               /* zero, because DC for INTRA MBs DC value is saved */
1965                                    qcoeff[5*64+0]=0;
1966                            }
1967    
1968                            if(pEnc->mbParam.m_quarterpel) {
1969                                    VECTOR predMV = get_qpmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);
1970                                    pMB->pmvs[0].x = pMB->qmvs[0].x - predMV.x;
1971                                    pMB->pmvs[0].y = pMB->qmvs[0].y - predMV.y;
1972                                    DPRINTF(DPRINTF_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)", pMB->pmvs[0].x, pMB->pmvs[0].y, predMV.x, predMV.y, pMB->mvs[0].x, pMB->mvs[0].y);
1973                            } else {
1974                                    VECTOR predMV = get_pmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);
1975                                    pMB->pmvs[0].x = pMB->mvs[0].x - predMV.x;
1976                                    pMB->pmvs[0].y = pMB->mvs[0].y - predMV.y;
1977                                    DPRINTF(DPRINTF_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)", pMB->pmvs[0].x, pMB->pmvs[0].y, predMV.x, predMV.y, pMB->mvs[0].x, pMB->mvs[0].y);
1978                            }
1979    
1980    
1981                            if (pMB->mode == MODE_INTER4V)
1982                            {       int k;
1983                                    for (k=1;k<4;k++)
1984                                    {
1985                                            if(pEnc->mbParam.m_quarterpel) {
1986                                                    VECTOR predMV = get_qpmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, k);
1987                                                    pMB->pmvs[k].x = pMB->qmvs[k].x - predMV.x;
1988                                                    pMB->pmvs[k].y = pMB->qmvs[k].y - predMV.y;
1989                                    DPRINTF(DPRINTF_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)", pMB->pmvs[k].x, pMB->pmvs[k].y, predMV.x, predMV.y, pMB->mvs[k].x, pMB->mvs[k].y);
1990                                            } else {
1991                                                    VECTOR predMV = get_pmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, k);
1992                                                    pMB->pmvs[k].x = pMB->mvs[k].x - predMV.x;
1993                                                    pMB->pmvs[k].y = pMB->mvs[k].y - predMV.y;
1994                                    DPRINTF(DPRINTF_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)", pMB->pmvs[k].x, pMB->pmvs[k].y, predMV.x, predMV.y, pMB->mvs[k].x, pMB->mvs[k].y);
1995                                            }
1996    
1997                                    }
1998                            }
1999    
2000                            MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);
2001                            stop_coding_timer();
2002    
2003                    }
2004            }
2005    
2006            if ((pEnc->current->global_flags & XVID_REDUCED))
2007            {
2008                    image_deblock_rrv(&pEnc->current->image, pEnc->mbParam.edged_width,
2009                            pEnc->current->mbs, mb_width, mb_height, pEnc->mbParam.mb_width,
2010                            16, XVID_DEC_DEBLOCKY|XVID_DEC_DEBLOCKUV);
2011            }
2012    
2013            emms();
2014    
2015            if (pEnc->current->global_flags & XVID_HINTEDME_GET) {
2016                    HintedMEGet(pEnc, 0);
2017            }
2018    
2019            if (pEnc->current->sStat.iMvCount == 0)
2020                    pEnc->current->sStat.iMvCount = 1;
2021    
2022            fSigma = (float) sqrt((float) pEnc->current->sStat.iMvSum / pEnc->current->sStat.iMvCount);
2023    
2024            iSearchRange = 1 << (3 + pEnc->mbParam.m_fcode);
2025    
2026            if ((fSigma > iSearchRange / 3)
2027                    && (pEnc->mbParam.m_fcode <= (3 + pEnc->mbParam.m_quarterpel))) /* maximum search range 128 */
2028            {
2029                    pEnc->mbParam.m_fcode++;
2030                    iSearchRange *= 2;
2031            } else if ((fSigma < iSearchRange / 6)
2032                               && (pEnc->fMvPrevSigma >= 0)
2033                               && (pEnc->fMvPrevSigma < iSearchRange / 6)
2034                               && (pEnc->mbParam.m_fcode >= (2 + pEnc->mbParam.m_quarterpel)))      /* minimum search range 16 */
2035            {
2036                    pEnc->mbParam.m_fcode--;
2037                    iSearchRange /= 2;
2038            }
2039    
2040            pEnc->fMvPrevSigma = fSigma;
2041    
2042            /* frame drop code */
2043            DPRINTF(DPRINTF_DEBUG, "kmu %i %i %i", pEnc->current->sStat.kblks, pEnc->current->sStat.mblks, pEnc->current->sStat.ublks);
2044            if (pEnc->current->sStat.kblks + pEnc->current->sStat.mblks <
2045                    (pEnc->mbParam.frame_drop_ratio * mb_width * mb_height) / 100)
2046            {
2047                    pEnc->current->sStat.kblks = pEnc->current->sStat.mblks = 0;
2048                    pEnc->current->sStat.ublks = mb_width * mb_height;
2049    
2050                    BitstreamReset(bs);
2051    
2052                    set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);
2053                    BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 0);
2054    
2055                    /* copy reference frame details into the current frame */
2056                    pEnc->current->quant = pEnc->reference->quant;
2057                    pEnc->current->motion_flags = pEnc->reference->motion_flags;
2058                    pEnc->current->rounding_type = pEnc->reference->rounding_type;
2059                    pEnc->current->quarterpel =  pEnc->reference->quarterpel;
2060                    pEnc->current->fcode = pEnc->reference->fcode;
2061                    pEnc->current->bcode = pEnc->reference->bcode;
2062                    image_copy(&pEnc->current->image, &pEnc->reference->image, pEnc->mbParam.edged_width, pEnc->mbParam.height);
2063                    memcpy(pEnc->current->mbs, pEnc->reference->mbs, sizeof(MACROBLOCK) * mb_width * mb_height);
2064            }
2065    
2066            /* XXX: debug
2067            {
2068                    char s[100];
2069                    sprintf(s, "\\%05i_cur.pgm", pEnc->m_framenum);
2070                    image_dump_yuvpgm(&pEnc->current->image,
2071                            pEnc->mbParam.edged_width,
2072                            pEnc->mbParam.width, pEnc->mbParam.height, s);
2073    
2074                    sprintf(s, "\\%05i_ref.pgm", pEnc->m_framenum);
2075                    image_dump_yuvpgm(&pEnc->reference->image,
2076                            pEnc->mbParam.edged_width,
2077                            pEnc->mbParam.width, pEnc->mbParam.height, s);
2078            }
2079            */
2080    
2081    
2082            *pBits = BitstreamPos(bs) - *pBits;
2083    
2084            return 0;                                       /* inter */
2085    }
2086    
2087    
2088    static void
2089    FrameCodeB(Encoder * pEnc,
2090                       FRAMEINFO * frame,
2091                       Bitstream * bs,
2092                       uint32_t * pBits)
2093    {
2094            DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
2095            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
2096            uint32_t x, y;
2097    
2098            IMAGE *f_ref = &pEnc->reference->image;
2099            IMAGE *b_ref = &pEnc->current->image;
2100    
2101    #ifdef BFRAMES_DEC_DEBUG
2102            FILE *fp;
2103            static char first=0;
2104    #define BFRAME_DEBUG    if (!first && fp){ \
2105                    fprintf(fp,"Y=%3d   X=%3d   MB=%2d   CBP=%02X\n",y,x,mb->mode,mb->cbp); \
2106            }
2107    
2108            pEnc->current->global_flags &= ~XVID_REDUCED;   /* reduced resoltion not yet supported */
2109    
2110            if (!first){
2111                    fp=fopen("C:\\XVIDDBGE.TXT","w");
2112            }
2113    #endif
2114    
2115            frame->quarterpel =  pEnc->mbParam.m_quarterpel;
2116    
2117            /* forward  */
2118            image_setedges(f_ref, pEnc->mbParam.edged_width,
2119                                       pEnc->mbParam.edged_height, pEnc->mbParam.width,
2120                                       pEnc->mbParam.height);
2121            start_timer();
2122            image_interpolate(f_ref, &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,
2123                                              pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2124                                              pEnc->mbParam.m_quarterpel, 0);
2125            stop_inter_timer();
2126    
2127            /* backward */
2128            image_setedges(b_ref, pEnc->mbParam.edged_width,
2129                                       pEnc->mbParam.edged_height, pEnc->mbParam.width,
2130                                       pEnc->mbParam.height);
2131            start_timer();
2132            image_interpolate(b_ref, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,
2133                                              pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2134                                              pEnc->mbParam.m_quarterpel, 0);
2135            stop_inter_timer();
2136    
2137            start_timer();
2138    
2139            MotionEstimationBVOP(&pEnc->mbParam, frame,
2140                                                     ((int32_t)(pEnc->current->stamp - frame->stamp)),                              /* time_bp */
2141                                                     ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),    /* time_pp */
2142                                                     pEnc->reference->mbs, f_ref,
2143                                                     &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,
2144                                                     pEnc->current, b_ref, &pEnc->vInterH,
2145                                                     &pEnc->vInterV, &pEnc->vInterHV);
2146    
2147    
2148            stop_motion_timer();
2149            /*
2150            if (test_quant_type(&pEnc->mbParam, pEnc->current)) {
2151                    BitstreamWriteVolHeader(bs, pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.quant_type);
2152            }
2153            */
2154    
2155            frame->coding_type = B_VOP;
2156    
2157            set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);
2158            BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1);
2159    
2160            *pBits = BitstreamPos(bs);
2161    
2162            frame->sStat.iTextBits = 0;
2163            frame->sStat.iMvSum = 0;
2164            frame->sStat.iMvCount = 0;
2165            frame->sStat.kblks = frame->sStat.mblks = frame->sStat.ublks = 0;
2166    
2167    
2168            for (y = 0; y < pEnc->mbParam.mb_height; y++) {
2169                    for (x = 0; x < pEnc->mbParam.mb_width; x++) {
2170                            MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];
2171                            int direction = pEnc->mbParam.global & XVID_ALTERNATESCAN ? 2 : 0;
2172    
2173                            /* decoder ignores mb when refence block is INTER(0,0), CBP=0 */
2174                            if (mb->mode == MODE_NOT_CODED) {
2175                                    /* mb->mvs[0].x = mb->mvs[0].y = mb->cbp = 0; */
2176                                    continue;
2177                            }
2178    
2179                            if (mb->mode != MODE_DIRECT_NONE_MV) {
2180                                    MBMotionCompensationBVOP(&pEnc->mbParam, mb, x, y, &frame->image,
2181                                                                             f_ref, &pEnc->f_refh, &pEnc->f_refv,
2182                                                                             &pEnc->f_refhv, b_ref, &pEnc->vInterH,
2183                                                                             &pEnc->vInterV, &pEnc->vInterHV,
2184                                                                             dct_codes);
2185    
2186                                    if (mb->mode == MODE_DIRECT_NO4V) mb->mode = MODE_DIRECT;
2187                                    mb->quant = frame->quant;
2188    
2189                                    mb->cbp =
2190                                            MBTransQuantInterBVOP(&pEnc->mbParam, frame, mb, dct_codes, qcoeff);
2191    
2192                                    if ( (mb->mode == MODE_DIRECT) && (mb->cbp == 0)
2193                                            && (mb->pmvs[3].x == 0) && (mb->pmvs[3].y == 0) ) {
2194                                            mb->mode = MODE_DIRECT_NONE_MV; /* skipped */
2195                                    }
2196                            }
2197    
2198    #ifdef BFRAMES_DEC_DEBUG
2199            BFRAME_DEBUG
2200    #endif
2201                            start_timer();
2202                            MBCodingBVOP(mb, qcoeff, frame->fcode, frame->bcode, bs,
2203                                                     &frame->sStat, direction);
2204                            stop_coding_timer();
2205                    }
2206            }
2207    
2208            emms();
2209    
2210            /* TODO: dynamic fcode/bcode ??? */
2211    
2212            *pBits = BitstreamPos(bs) - *pBits;
2213    
2214    #ifdef BFRAMES_DEC_DEBUG
2215            if (!first){
2216                    first=1;
2217                    if (fp)
2218                            fclose(fp);
2219            }
2220    #endif
2221  }  }

Legend:
Removed from v.4  
changed lines
  Added in v.967

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4