[svn] / branches / release-1_3-branch / xvidcore / src / image / image.c Repository:
ViewVC logotype

Annotation of /branches/release-1_3-branch/xvidcore/src/image/image.c

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1815 - (view) (download)
Original Path: trunk/xvidcore/src/image/image.c

1 : edgomez 851 /**************************************************************************
2 : albeu 315 *
3 : edgomez 1382 * XVID MPEG-4 VIDEO CODEC
4 :     * - Image management functions -
5 : albeu 315 *
6 : suxen_drol 1397 * Copyright(C) 2001-2004 Peter Ross <pross@xvid.org>
7 : albeu 315 *
8 : edgomez 1382 * This program is free software ; you can redistribute it and/or modify
9 :     * it under the terms of the GNU General Public License as published by
10 :     * the Free Software Foundation ; either version 2 of the License, or
11 :     * (at your option) any later version.
12 : albeu 315 *
13 : edgomez 1382 * This program is distributed in the hope that it will be useful,
14 :     * but WITHOUT ANY WARRANTY ; without even the implied warranty of
15 :     * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
16 :     * GNU General Public License for more details.
17 : albeu 315 *
18 : edgomez 1382 * You should have received a copy of the GNU General Public License
19 :     * along with this program ; if not, write to the Free Software
20 :     * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
21 : albeu 315 *
22 : Isibaar 1815 * $Id: image.c,v 1.43 2008-11-28 10:58:07 Isibaar Exp $
23 : albeu 315 *
24 : edgomez 1382 ****************************************************************************/
25 : albeu 315
26 :     #include <stdlib.h>
27 : edgomez 1382 #include <string.h> /* memcpy, memset */
28 : albeu 315 #include <math.h>
29 :     #include "../portab.h"
30 : edgomez 1382 #include "../global.h"
31 :     #include "../xvid.h"
32 : albeu 315 #include "image.h"
33 :     #include "colorspace.h"
34 :     #include "interpolate8x8.h"
35 :     #include "../utils/mem_align.h"
36 : edgomez 1424 #include "../motion/sad.h"
37 : Skal 1733 #include "../utils/emms.h"
38 : albeu 315
39 : edgomez 1382 #include "font.h"
40 : edgomez 851
41 : albeu 315 #define SAFETY 64
42 :     #define EDGE_SIZE2 (EDGE_SIZE/2)
43 :    
44 :    
45 :     int32_t
46 :     image_create(IMAGE * image,
47 :     uint32_t edged_width,
48 :     uint32_t edged_height)
49 :     {
50 :     const uint32_t edged_width2 = edged_width / 2;
51 :     const uint32_t edged_height2 = edged_height / 2;
52 :    
53 :     image->y =
54 :     xvid_malloc(edged_width * (edged_height + 1) + SAFETY, CACHE_LINE);
55 :     if (image->y == NULL) {
56 :     return -1;
57 :     }
58 : edgomez 1382 memset(image->y, 0, edged_width * (edged_height + 1) + SAFETY);
59 : albeu 315
60 :     image->u = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);
61 :     if (image->u == NULL) {
62 :     xvid_free(image->y);
63 : edgomez 1382 image->y = NULL;
64 : albeu 315 return -1;
65 :     }
66 : edgomez 1382 memset(image->u, 0, edged_width2 * edged_height2 + SAFETY);
67 :    
68 : albeu 315 image->v = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);
69 :     if (image->v == NULL) {
70 :     xvid_free(image->u);
71 : edgomez 1382 image->u = NULL;
72 : albeu 315 xvid_free(image->y);
73 : edgomez 1382 image->y = NULL;
74 : albeu 315 return -1;
75 :     }
76 : edgomez 1382 memset(image->v, 0, edged_width2 * edged_height2 + SAFETY);
77 : albeu 315
78 :     image->y += EDGE_SIZE * edged_width + EDGE_SIZE;
79 :     image->u += EDGE_SIZE2 * edged_width2 + EDGE_SIZE2;
80 :     image->v += EDGE_SIZE2 * edged_width2 + EDGE_SIZE2;
81 :    
82 :     return 0;
83 :     }
84 :    
85 :    
86 :    
87 :     void
88 :     image_destroy(IMAGE * image,
89 :     uint32_t edged_width,
90 :     uint32_t edged_height)
91 :     {
92 :     const uint32_t edged_width2 = edged_width / 2;
93 :    
94 :     if (image->y) {
95 :     xvid_free(image->y - (EDGE_SIZE * edged_width + EDGE_SIZE));
96 : edgomez 1382 image->y = NULL;
97 : albeu 315 }
98 :     if (image->u) {
99 :     xvid_free(image->u - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));
100 : edgomez 1382 image->u = NULL;
101 : albeu 315 }
102 :     if (image->v) {
103 :     xvid_free(image->v - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));
104 : edgomez 1382 image->v = NULL;
105 : albeu 315 }
106 :     }
107 :    
108 :    
109 :     void
110 :     image_swap(IMAGE * image1,
111 :     IMAGE * image2)
112 :     {
113 : edgomez 1382 SWAP(uint8_t*, image1->y, image2->y);
114 :     SWAP(uint8_t*, image1->u, image2->u);
115 :     SWAP(uint8_t*, image1->v, image2->v);
116 : albeu 315 }
117 :    
118 :    
119 :     void
120 :     image_copy(IMAGE * image1,
121 :     IMAGE * image2,
122 :     uint32_t edged_width,
123 :     uint32_t height)
124 :     {
125 :     memcpy(image1->y, image2->y, edged_width * height);
126 :     memcpy(image1->u, image2->u, edged_width * height / 4);
127 :     memcpy(image1->v, image2->v, edged_width * height / 4);
128 :     }
129 :    
130 : edgomez 1382 /* setedges bug was fixed in this BS version */
131 :     #define SETEDGES_BUG_BEFORE 18
132 : albeu 315
133 :     void
134 :     image_setedges(IMAGE * image,
135 :     uint32_t edged_width,
136 :     uint32_t edged_height,
137 :     uint32_t width,
138 : edgomez 1382 uint32_t height,
139 :     int bs_version)
140 : albeu 315 {
141 :     const uint32_t edged_width2 = edged_width / 2;
142 : edgomez 1382 uint32_t width2;
143 : albeu 315 uint32_t i;
144 :     uint8_t *dst;
145 :     uint8_t *src;
146 :    
147 :     dst = image->y - (EDGE_SIZE + EDGE_SIZE * edged_width);
148 :     src = image->y;
149 :    
150 : edgomez 1382 /* According to the Standard Clause 7.6.4, padding is done starting at 16
151 :     * pixel width and height multiples. This was not respected in old xvids */
152 :     if (bs_version == 0 || bs_version >= SETEDGES_BUG_BEFORE) {
153 :     width = (width+15)&~15;
154 :     height = (height+15)&~15;
155 :     }
156 :    
157 :     width2 = width/2;
158 :    
159 : albeu 315 for (i = 0; i < EDGE_SIZE; i++) {
160 : edgomez 851 memset(dst, *src, EDGE_SIZE);
161 :     memcpy(dst + EDGE_SIZE, src, width);
162 :     memset(dst + edged_width - EDGE_SIZE, *(src + width - 1),
163 :     EDGE_SIZE);
164 : albeu 315 dst += edged_width;
165 :     }
166 :    
167 :     for (i = 0; i < height; i++) {
168 :     memset(dst, *src, EDGE_SIZE);
169 :     memset(dst + edged_width - EDGE_SIZE, src[width - 1], EDGE_SIZE);
170 :     dst += edged_width;
171 :     src += edged_width;
172 :     }
173 :    
174 :     src -= edged_width;
175 :     for (i = 0; i < EDGE_SIZE; i++) {
176 : edgomez 851 memset(dst, *src, EDGE_SIZE);
177 :     memcpy(dst + EDGE_SIZE, src, width);
178 :     memset(dst + edged_width - EDGE_SIZE, *(src + width - 1),
179 : albeu 315 EDGE_SIZE);
180 :     dst += edged_width;
181 :     }
182 :    
183 :    
184 : edgomez 1382 /* U */
185 : albeu 315 dst = image->u - (EDGE_SIZE2 + EDGE_SIZE2 * edged_width2);
186 :     src = image->u;
187 :    
188 :     for (i = 0; i < EDGE_SIZE2; i++) {
189 :     memset(dst, *src, EDGE_SIZE2);
190 :     memcpy(dst + EDGE_SIZE2, src, width2);
191 :     memset(dst + edged_width2 - EDGE_SIZE2, *(src + width2 - 1),
192 :     EDGE_SIZE2);
193 :     dst += edged_width2;
194 :     }
195 :    
196 :     for (i = 0; i < height / 2; i++) {
197 :     memset(dst, *src, EDGE_SIZE2);
198 :     memset(dst + edged_width2 - EDGE_SIZE2, src[width2 - 1], EDGE_SIZE2);
199 :     dst += edged_width2;
200 :     src += edged_width2;
201 :     }
202 :     src -= edged_width2;
203 :     for (i = 0; i < EDGE_SIZE2; i++) {
204 :     memset(dst, *src, EDGE_SIZE2);
205 :     memcpy(dst + EDGE_SIZE2, src, width2);
206 :     memset(dst + edged_width2 - EDGE_SIZE2, *(src + width2 - 1),
207 :     EDGE_SIZE2);
208 :     dst += edged_width2;
209 :     }
210 :    
211 :    
212 : edgomez 1382 /* V */
213 : albeu 315 dst = image->v - (EDGE_SIZE2 + EDGE_SIZE2 * edged_width2);
214 :     src = image->v;
215 :    
216 :     for (i = 0; i < EDGE_SIZE2; i++) {
217 :     memset(dst, *src, EDGE_SIZE2);
218 :     memcpy(dst + EDGE_SIZE2, src, width2);
219 :     memset(dst + edged_width2 - EDGE_SIZE2, *(src + width2 - 1),
220 :     EDGE_SIZE2);
221 :     dst += edged_width2;
222 :     }
223 :    
224 :     for (i = 0; i < height / 2; i++) {
225 :     memset(dst, *src, EDGE_SIZE2);
226 :     memset(dst + edged_width2 - EDGE_SIZE2, src[width2 - 1], EDGE_SIZE2);
227 :     dst += edged_width2;
228 :     src += edged_width2;
229 :     }
230 :     src -= edged_width2;
231 :     for (i = 0; i < EDGE_SIZE2; i++) {
232 :     memset(dst, *src, EDGE_SIZE2);
233 :     memcpy(dst + EDGE_SIZE2, src, width2);
234 :     memset(dst + edged_width2 - EDGE_SIZE2, *(src + width2 - 1),
235 :     EDGE_SIZE2);
236 :     dst += edged_width2;
237 :     }
238 :     }
239 :    
240 :     void
241 : syskin 1665 image_interpolate(const uint8_t * refn,
242 :     uint8_t * refh,
243 :     uint8_t * refv,
244 :     uint8_t * refhv,
245 : albeu 315 uint32_t edged_width,
246 :     uint32_t edged_height,
247 : edgomez 851 uint32_t quarterpel,
248 : albeu 315 uint32_t rounding)
249 :     {
250 : edgomez 1382 const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); /* we only interpolate half of the edge area */
251 : albeu 315 const uint32_t stride_add = 7 * edged_width;
252 : syskin 1664
253 : syskin 1665 uint8_t *n_ptr;
254 :     uint8_t *h_ptr, *v_ptr, *hv_ptr;
255 : albeu 315 uint32_t x, y;
256 :    
257 : syskin 1665 n_ptr = (uint8_t*)refn;
258 :     h_ptr = refh;
259 : syskin 1666 v_ptr = refv;
260 : albeu 315
261 :     n_ptr -= offset;
262 :     h_ptr -= offset;
263 :     v_ptr -= offset;
264 :    
265 : edgomez 1382 /* Note we initialize the hv pointer later, as we can optimize code a bit
266 :     * doing it down to up in quarterpel and up to down in halfpel */
267 : edgomez 851 if(quarterpel) {
268 : edgomez 1382
269 : edgomez 851 for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
270 :     for (x = 0; x < (edged_width - EDGE_SIZE); x += 8) {
271 :     interpolate8x8_6tap_lowpass_h(h_ptr, n_ptr, edged_width, rounding);
272 :     interpolate8x8_6tap_lowpass_v(v_ptr, n_ptr, edged_width, rounding);
273 : albeu 315
274 : edgomez 851 n_ptr += 8;
275 :     h_ptr += 8;
276 :     v_ptr += 8;
277 :     }
278 : edgomez 1382
279 : edgomez 851 n_ptr += EDGE_SIZE;
280 :     h_ptr += EDGE_SIZE;
281 :     v_ptr += EDGE_SIZE;
282 :    
283 :     h_ptr += stride_add;
284 :     v_ptr += stride_add;
285 :     n_ptr += stride_add;
286 :     }
287 :    
288 : syskin 1665 h_ptr = refh + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
289 :     hv_ptr = refhv + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
290 : edgomez 851
291 :     for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {
292 : edgomez 1382 hv_ptr -= stride_add;
293 :     h_ptr -= stride_add;
294 :     hv_ptr -= EDGE_SIZE;
295 :     h_ptr -= EDGE_SIZE;
296 :    
297 : edgomez 851 for (x = 0; x < (edged_width - EDGE_SIZE); x = x + 8) {
298 : edgomez 1382 hv_ptr -= 8;
299 :     h_ptr -= 8;
300 : edgomez 851 interpolate8x8_6tap_lowpass_v(hv_ptr, h_ptr, edged_width, rounding);
301 :     }
302 :     }
303 : edgomez 1382 } else {
304 : edgomez 851
305 : syskin 1665 hv_ptr = refhv;
306 : edgomez 1382 hv_ptr -= offset;
307 :    
308 : edgomez 851 for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
309 :     for (x = 0; x < (edged_width - EDGE_SIZE); x += 8) {
310 :     interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width, rounding);
311 :     interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width, rounding);
312 :     interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width, rounding);
313 :    
314 :     n_ptr += 8;
315 :     h_ptr += 8;
316 :     v_ptr += 8;
317 :     hv_ptr += 8;
318 :     }
319 : edgomez 1382
320 : edgomez 851 h_ptr += EDGE_SIZE;
321 :     v_ptr += EDGE_SIZE;
322 :     hv_ptr += EDGE_SIZE;
323 :     n_ptr += EDGE_SIZE;
324 :    
325 :     h_ptr += stride_add;
326 :     v_ptr += stride_add;
327 :     hv_ptr += stride_add;
328 :     n_ptr += stride_add;
329 :     }
330 :     }
331 : albeu 315 }
332 :    
333 :    
334 : edgomez 851 /*
335 :     chroma optimize filter, invented by mf
336 :     a chroma pixel is average from the surrounding pixels, when the
337 :     correpsonding luma pixels are pure black or white.
338 :     */
339 :    
340 :     void
341 :     image_chroma_optimize(IMAGE * img, int width, int height, int edged_width)
342 :     {
343 :     int x,y;
344 :     int pixels = 0;
345 :    
346 :     for (y = 1; y < height/2 - 1; y++)
347 :     for (x = 1; x < width/2 - 1; x++)
348 :     {
349 :     #define IS_PURE(a) ((a)<=16||(a)>=235)
350 :     #define IMG_Y(Y,X) img->y[(Y)*edged_width + (X)]
351 :     #define IMG_U(Y,X) img->u[(Y)*edged_width/2 + (X)]
352 :     #define IMG_V(Y,X) img->v[(Y)*edged_width/2 + (X)]
353 :    
354 : edgomez 1382 if (IS_PURE(IMG_Y(y*2 ,x*2 )) &&
355 : edgomez 851 IS_PURE(IMG_Y(y*2 ,x*2+1)) &&
356 : edgomez 1382 IS_PURE(IMG_Y(y*2+1,x*2 )) &&
357 : edgomez 851 IS_PURE(IMG_Y(y*2+1,x*2+1)))
358 :     {
359 :     IMG_U(y,x) = (IMG_U(y,x-1) + IMG_U(y-1, x) + IMG_U(y, x+1) + IMG_U(y+1, x)) / 4;
360 :     IMG_V(y,x) = (IMG_V(y,x-1) + IMG_V(y-1, x) + IMG_V(y, x+1) + IMG_V(y+1, x)) / 4;
361 :     pixels++;
362 :     }
363 :    
364 :     #undef IS_PURE
365 :     #undef IMG_Y
366 :     #undef IMG_U
367 :     #undef IMG_V
368 :     }
369 : edgomez 1382
370 :     DPRINTF(XVID_DEBUG_DEBUG,"chroma_optimized_pixels = %i/%i\n", pixels, width*height/4);
371 : edgomez 851 }
372 :    
373 :    
374 :    
375 :    
376 :    
377 :     /*
378 :     perform safe packed colorspace conversion, by splitting
379 :     the image up into an optimized area (pixel width divisible by 16),
380 :     and two unoptimized/plain-c areas (pixel width divisible by 2)
381 :     */
382 :    
383 : edgomez 1382 static void
384 : edgomez 851 safe_packed_conv(uint8_t * x_ptr, int x_stride,
385 :     uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,
386 :     int y_stride, int uv_stride,
387 :     int width, int height, int vflip,
388 : Isibaar 1815 packedFunc * func_opt, packedFunc func_c,
389 :     int size, int interlacing)
390 : edgomez 851 {
391 : Isibaar 1815 int width_opt, width_c, height_opt;
392 : edgomez 851
393 : Isibaar 1815 if (width==1 || height==1) return; /* forget about it */
394 :    
395 : edgomez 851 if (func_opt != func_c && x_stride < size*((width+15)/16)*16)
396 :     {
397 :     width_opt = width & (~15);
398 : Isibaar 1815 width_c = (width - width_opt) & (~1);
399 : edgomez 851 }
400 :     else
401 :     {
402 : Isibaar 1815 /* Enforce the width to be divisable by two. */
403 :     width_opt = width & (~1);
404 : edgomez 851 width_c = 0;
405 :     }
406 :    
407 : Isibaar 1815 /* packed conversions require height to be divisable by 2
408 :     (or even by 4 for interlaced conversion) */
409 :     if (interlacing)
410 :     height_opt = height & (~3);
411 :     else
412 :     height_opt = height & (~1);
413 :    
414 : edgomez 851 func_opt(x_ptr, x_stride,
415 :     y_ptr, u_ptr, v_ptr, y_stride, uv_stride,
416 : Isibaar 1815 width_opt, height_opt, vflip);
417 : edgomez 851
418 :     if (width_c)
419 :     {
420 :     func_c(x_ptr + size*width_opt, x_stride,
421 :     y_ptr + width_opt, u_ptr + width_opt/2, v_ptr + width_opt/2,
422 : Isibaar 1815 y_stride, uv_stride, width_c, height_opt, vflip);
423 : edgomez 851 }
424 :     }
425 :    
426 :    
427 :    
428 : albeu 315 int
429 :     image_input(IMAGE * image,
430 :     uint32_t width,
431 :     int height,
432 :     uint32_t edged_width,
433 : edgomez 1382 uint8_t * src[4],
434 :     int src_stride[4],
435 : edgomez 851 int csp,
436 :     int interlacing)
437 : albeu 315 {
438 : edgomez 851 const int edged_width2 = edged_width/2;
439 :     const int width2 = width/2;
440 :     const int height2 = height/2;
441 : edgomez 1382 #if 0
442 :     const int height_signed = (csp & XVID_CSP_VFLIP) ? -height : height;
443 :     #endif
444 : albeu 315
445 :     switch (csp & ~XVID_CSP_VFLIP) {
446 :     case XVID_CSP_RGB555:
447 : edgomez 851 safe_packed_conv(
448 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
449 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
450 :     interlacing?rgb555i_to_yv12 :rgb555_to_yv12,
451 : Isibaar 1815 interlacing?rgb555i_to_yv12_c:rgb555_to_yv12_c, 2, interlacing);
452 : edgomez 851 break;
453 : albeu 315
454 :     case XVID_CSP_RGB565:
455 : edgomez 851 safe_packed_conv(
456 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
457 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
458 :     interlacing?rgb565i_to_yv12 :rgb565_to_yv12,
459 : Isibaar 1815 interlacing?rgb565i_to_yv12_c:rgb565_to_yv12_c, 2, interlacing);
460 : edgomez 851 break;
461 : albeu 315
462 :    
463 : edgomez 1382 case XVID_CSP_BGR:
464 : edgomez 851 safe_packed_conv(
465 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
466 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
467 :     interlacing?bgri_to_yv12 :bgr_to_yv12,
468 : Isibaar 1815 interlacing?bgri_to_yv12_c:bgr_to_yv12_c, 3, interlacing);
469 : edgomez 851 break;
470 : albeu 315
471 : edgomez 1382 case XVID_CSP_BGRA:
472 : edgomez 851 safe_packed_conv(
473 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
474 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
475 :     interlacing?bgrai_to_yv12 :bgra_to_yv12,
476 : Isibaar 1815 interlacing?bgrai_to_yv12_c:bgra_to_yv12_c, 4, interlacing);
477 : edgomez 851 break;
478 : albeu 315
479 : edgomez 851 case XVID_CSP_ABGR :
480 :     safe_packed_conv(
481 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
482 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
483 :     interlacing?abgri_to_yv12 :abgr_to_yv12,
484 : Isibaar 1815 interlacing?abgri_to_yv12_c:abgr_to_yv12_c, 4, interlacing);
485 : edgomez 851 break;
486 : albeu 315
487 : chl 1759 case XVID_CSP_RGB:
488 :     safe_packed_conv(
489 :     src[0], src_stride[0], image->y, image->u, image->v,
490 :     edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
491 :     interlacing?rgbi_to_yv12 :rgb_to_yv12,
492 : Isibaar 1815 interlacing?rgbi_to_yv12_c:rgb_to_yv12_c, 3, interlacing);
493 : chl 1759 break;
494 :    
495 : edgomez 851 case XVID_CSP_RGBA :
496 :     safe_packed_conv(
497 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
498 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
499 :     interlacing?rgbai_to_yv12 :rgba_to_yv12,
500 : Isibaar 1815 interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4, interlacing);
501 : edgomez 851 break;
502 : edgomez 1382
503 :     case XVID_CSP_ARGB:
504 :     safe_packed_conv(
505 :     src[0], src_stride[0], image->y, image->u, image->v,
506 :     edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
507 :     interlacing?argbi_to_yv12 : argb_to_yv12,
508 : Isibaar 1815 interlacing?argbi_to_yv12_c: argb_to_yv12_c, 4, interlacing);
509 : edgomez 1382 break;
510 : albeu 315
511 :     case XVID_CSP_YUY2:
512 : edgomez 851 safe_packed_conv(
513 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
514 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
515 :     interlacing?yuyvi_to_yv12 :yuyv_to_yv12,
516 : Isibaar 1815 interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
517 : edgomez 851 break;
518 : albeu 315
519 :     case XVID_CSP_YVYU: /* u/v swapped */
520 : edgomez 851 safe_packed_conv(
521 : edgomez 1382 src[0], src_stride[0], image->y, image->v, image->u,
522 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
523 :     interlacing?yuyvi_to_yv12 :yuyv_to_yv12,
524 : Isibaar 1815 interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2, interlacing);
525 : edgomez 851 break;
526 : albeu 315
527 :     case XVID_CSP_UYVY:
528 : edgomez 851 safe_packed_conv(
529 : edgomez 1382 src[0], src_stride[0], image->y, image->u, image->v,
530 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
531 :     interlacing?uyvyi_to_yv12 :uyvy_to_yv12,
532 : Isibaar 1815 interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2, interlacing);
533 : edgomez 851 break;
534 : albeu 315
535 : edgomez 1382 case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */
536 : edgomez 851 yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,
537 : edgomez 1382 src[0], src[0] + src_stride[0]*height, src[0] + src_stride[0]*height + (src_stride[0]/2)*height2,
538 :     src_stride[0], src_stride[0]/2, width, height, (csp & XVID_CSP_VFLIP));
539 :     break;
540 :    
541 :     case XVID_CSP_YV12: /* YCrCb == YVA == U and V plane swapped */
542 : edgomez 851 yv12_to_yv12(image->y, image->v, image->u, edged_width, edged_width2,
543 : edgomez 1382 src[0], src[0] + src_stride[0]*height, src[0] + src_stride[0]*height + (src_stride[0]/2)*height2,
544 :     src_stride[0], src_stride[0]/2, width, height, (csp & XVID_CSP_VFLIP));
545 : edgomez 851 break;
546 :    
547 : edgomez 1382 case XVID_CSP_PLANAR: /* YCbCr with arbitrary pointers and different strides for Y and UV */
548 :     yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,
549 :     src[0], src[1], src[2], src_stride[0], src_stride[1], /* v: dst_stride[2] not yet supported */
550 :     width, height, (csp & XVID_CSP_VFLIP));
551 : edgomez 851 break;
552 : albeu 315
553 :     case XVID_CSP_NULL:
554 :     break;
555 :    
556 : edgomez 851 default :
557 :     return -1;
558 : albeu 315 }
559 :    
560 : edgomez 851
561 :     /* pad out image when the width and/or height is not a multiple of 16 */
562 :    
563 :     if (width & 15)
564 :     {
565 :     int i;
566 :     int pad_width = 16 - (width&15);
567 :     for (i = 0; i < height; i++)
568 :     {
569 : edgomez 1382 memset(image->y + i*edged_width + width,
570 : edgomez 851 *(image->y + i*edged_width + width - 1), pad_width);
571 :     }
572 :     for (i = 0; i < height/2; i++)
573 :     {
574 : edgomez 1382 memset(image->u + i*edged_width2 + width2,
575 : edgomez 851 *(image->u + i*edged_width2 + width2 - 1),pad_width/2);
576 : edgomez 1382 memset(image->v + i*edged_width2 + width2,
577 : edgomez 851 *(image->v + i*edged_width2 + width2 - 1),pad_width/2);
578 :     }
579 :     }
580 :    
581 :     if (height & 15)
582 :     {
583 : edgomez 1382 int pad_height = 16 - (height&15);
584 : edgomez 851 int length = ((width+15)/16)*16;
585 :     int i;
586 :     for (i = 0; i < pad_height; i++)
587 :     {
588 :     memcpy(image->y + (height+i)*edged_width,
589 :     image->y + (height-1)*edged_width,length);
590 :     }
591 :    
592 :     for (i = 0; i < pad_height/2; i++)
593 :     {
594 :     memcpy(image->u + (height2+i)*edged_width2,
595 :     image->u + (height2-1)*edged_width2,length/2);
596 :     memcpy(image->v + (height2+i)*edged_width2,
597 :     image->v + (height2-1)*edged_width2,length/2);
598 :     }
599 :     }
600 :    
601 :     /*
602 :     if (interlacing)
603 :     image_printf(image, edged_width, height, 5,5, "[i]");
604 :     image_dump_yuvpgm(image, edged_width, ((width+15)/16)*16, ((height+15)/16)*16, "\\encode.pgm");
605 :     */
606 :     return 0;
607 : albeu 315 }
608 :    
609 :    
610 :    
611 :     int
612 :     image_output(IMAGE * image,
613 :     uint32_t width,
614 :     int height,
615 :     uint32_t edged_width,
616 : edgomez 1382 uint8_t * dst[4],
617 : Skal 1617 int dst_stride[4],
618 : edgomez 851 int csp,
619 :     int interlacing)
620 : albeu 315 {
621 : edgomez 851 const int edged_width2 = edged_width/2;
622 :     int height2 = height/2;
623 :    
624 :     /*
625 :     if (interlacing)
626 :     image_printf(image, edged_width, height, 5,100, "[i]=%i,%i",width,height);
627 :     image_dump_yuvpgm(image, edged_width, width, height, "\\decode.pgm");
628 :     */
629 :    
630 : albeu 315 switch (csp & ~XVID_CSP_VFLIP) {
631 :     case XVID_CSP_RGB555:
632 : edgomez 851 safe_packed_conv(
633 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
634 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
635 :     interlacing?yv12_to_rgb555i :yv12_to_rgb555,
636 : Isibaar 1815 interlacing?yv12_to_rgb555i_c:yv12_to_rgb555_c, 2, interlacing);
637 : albeu 315 return 0;
638 :    
639 :     case XVID_CSP_RGB565:
640 : edgomez 851 safe_packed_conv(
641 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
642 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
643 :     interlacing?yv12_to_rgb565i :yv12_to_rgb565,
644 : Isibaar 1815 interlacing?yv12_to_rgb565i_c:yv12_to_rgb565_c, 2, interlacing);
645 : albeu 315 return 0;
646 :    
647 : edgomez 1382 case XVID_CSP_BGR:
648 : edgomez 851 safe_packed_conv(
649 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
650 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
651 :     interlacing?yv12_to_bgri :yv12_to_bgr,
652 : Isibaar 1815 interlacing?yv12_to_bgri_c:yv12_to_bgr_c, 3, interlacing);
653 : albeu 315 return 0;
654 :    
655 : edgomez 1382 case XVID_CSP_BGRA:
656 : edgomez 851 safe_packed_conv(
657 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
658 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
659 :     interlacing?yv12_to_bgrai :yv12_to_bgra,
660 : Isibaar 1815 interlacing?yv12_to_bgrai_c:yv12_to_bgra_c, 4, interlacing);
661 : albeu 315 return 0;
662 :    
663 : edgomez 851 case XVID_CSP_ABGR:
664 :     safe_packed_conv(
665 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
666 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
667 :     interlacing?yv12_to_abgri :yv12_to_abgr,
668 : Isibaar 1815 interlacing?yv12_to_abgri_c:yv12_to_abgr_c, 4, interlacing);
669 : albeu 315 return 0;
670 :    
671 : chl 1759 case XVID_CSP_RGB:
672 :     safe_packed_conv(
673 :     dst[0], dst_stride[0], image->y, image->u, image->v,
674 :     edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
675 :     interlacing?yv12_to_rgbi :yv12_to_rgb,
676 : Isibaar 1815 interlacing?yv12_to_rgbi_c:yv12_to_rgb_c, 3, interlacing);
677 : chl 1759 return 0;
678 :    
679 : edgomez 851 case XVID_CSP_RGBA:
680 :     safe_packed_conv(
681 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
682 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
683 :     interlacing?yv12_to_rgbai :yv12_to_rgba,
684 : Isibaar 1815 interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4, interlacing);
685 : albeu 315 return 0;
686 :    
687 : edgomez 1382 case XVID_CSP_ARGB:
688 :     safe_packed_conv(
689 :     dst[0], dst_stride[0], image->y, image->u, image->v,
690 :     edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
691 :     interlacing?yv12_to_argbi :yv12_to_argb,
692 : Isibaar 1815 interlacing?yv12_to_argbi_c:yv12_to_argb_c, 4, interlacing);
693 : edgomez 1382 return 0;
694 :    
695 : albeu 315 case XVID_CSP_YUY2:
696 : edgomez 851 safe_packed_conv(
697 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
698 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
699 :     interlacing?yv12_to_yuyvi :yv12_to_yuyv,
700 : Isibaar 1815 interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
701 : albeu 315 return 0;
702 :    
703 : edgomez 1382 case XVID_CSP_YVYU: /* u,v swapped */
704 : edgomez 851 safe_packed_conv(
705 : edgomez 1382 dst[0], dst_stride[0], image->y, image->v, image->u,
706 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
707 :     interlacing?yv12_to_yuyvi :yv12_to_yuyv,
708 : Isibaar 1815 interlacing?yv12_to_yuyvi_c:yv12_to_yuyv_c, 2, interlacing);
709 : albeu 315 return 0;
710 :    
711 :     case XVID_CSP_UYVY:
712 : edgomez 851 safe_packed_conv(
713 : edgomez 1382 dst[0], dst_stride[0], image->y, image->u, image->v,
714 : edgomez 851 edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
715 :     interlacing?yv12_to_uyvyi :yv12_to_uyvy,
716 : Isibaar 1815 interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2, interlacing);
717 : albeu 315 return 0;
718 :    
719 : edgomez 1382 case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */
720 :     yv12_to_yv12(dst[0], dst[0] + dst_stride[0]*height, dst[0] + dst_stride[0]*height + (dst_stride[0]/2)*height2,
721 :     dst_stride[0], dst_stride[0]/2,
722 : edgomez 851 image->y, image->u, image->v, edged_width, edged_width2,
723 :     width, height, (csp & XVID_CSP_VFLIP));
724 :     return 0;
725 :    
726 : edgomez 1382 case XVID_CSP_YV12: /* YCrCb == YVU == U and V plane swapped */
727 :     yv12_to_yv12(dst[0], dst[0] + dst_stride[0]*height, dst[0] + dst_stride[0]*height + (dst_stride[0]/2)*height2,
728 :     dst_stride[0], dst_stride[0]/2,
729 : edgomez 851 image->y, image->v, image->u, edged_width, edged_width2,
730 :     width, height, (csp & XVID_CSP_VFLIP));
731 :     return 0;
732 :    
733 : edgomez 1382 case XVID_CSP_PLANAR: /* YCbCr with arbitrary pointers and different strides for Y and UV */
734 :     yv12_to_yv12(dst[0], dst[1], dst[2],
735 :     dst_stride[0], dst_stride[1], /* v: dst_stride[2] not yet supported */
736 :     image->y, image->u, image->v, edged_width, edged_width2,
737 :     width, height, (csp & XVID_CSP_VFLIP));
738 : albeu 315 return 0;
739 :    
740 : edgomez 1382 case XVID_CSP_INTERNAL :
741 :     dst[0] = image->y;
742 :     dst[1] = image->u;
743 :     dst[2] = image->v;
744 :     dst_stride[0] = edged_width;
745 :     dst_stride[1] = edged_width/2;
746 :     dst_stride[2] = edged_width/2;
747 :     return 0;
748 :    
749 : albeu 315 case XVID_CSP_NULL:
750 : edgomez 1382 case XVID_CSP_SLICE:
751 : albeu 315 return 0;
752 :    
753 :     }
754 :    
755 :     return -1;
756 :     }
757 :    
758 :     float
759 :     image_psnr(IMAGE * orig_image,
760 :     IMAGE * recon_image,
761 :     uint16_t stride,
762 :     uint16_t width,
763 :     uint16_t height)
764 :     {
765 :     int32_t diff, x, y, quad = 0;
766 :     uint8_t *orig = orig_image->y;
767 :     uint8_t *recon = recon_image->y;
768 :     float psnr_y;
769 :    
770 :     for (y = 0; y < height; y++) {
771 :     for (x = 0; x < width; x++) {
772 :     diff = *(orig + x) - *(recon + x);
773 :     quad += diff * diff;
774 :     }
775 :     orig += stride;
776 :     recon += stride;
777 :     }
778 :    
779 :     psnr_y = (float) quad / (float) (width * height);
780 :    
781 :     if (psnr_y) {
782 :     psnr_y = (float) (255 * 255) / psnr_y;
783 :     psnr_y = 10 * (float) log10(psnr_y);
784 :     } else
785 :     psnr_y = (float) 99.99;
786 :    
787 :     return psnr_y;
788 :     }
789 :    
790 :    
791 : edgomez 851 float sse_to_PSNR(long sse, int pixels)
792 :     {
793 :     if (sse==0)
794 :     return 99.99F;
795 :    
796 : edgomez 1382 return 48.131F - 10*(float)log10((float)sse/(float)(pixels)); /* log10(255*255)=4.8131 */
797 : edgomez 851
798 :     }
799 :    
800 : edgomez 1424 long plane_sse(uint8_t *orig,
801 :     uint8_t *recon,
802 :     uint16_t stride,
803 :     uint16_t width,
804 :     uint16_t height)
805 : edgomez 851 {
806 : edgomez 1424 int y, bwidth, bheight;
807 :     long sse = 0;
808 : edgomez 851
809 : edgomez 1424 bwidth = width & (~0x07);
810 :     bheight = height & (~0x07);
811 :    
812 :     /* Compute the 8x8 integer part */
813 :     for (y = 0; y<bheight; y += 8) {
814 :     int x;
815 :    
816 :     /* Compute sse for the band */
817 :     for (x = 0; x<bwidth; x += 8)
818 :     sse += sse8_8bit(orig + x, recon + x, stride);
819 :    
820 :     /* remaining pixels of the 8 pixels high band */
821 :     for (x = bwidth; x < width; x++) {
822 :     int diff;
823 :     diff = *(orig + 0*stride + x) - *(recon + 0*stride + x);
824 :     sse += diff * diff;
825 :     diff = *(orig + 1*stride + x) - *(recon + 1*stride + x);
826 :     sse += diff * diff;
827 :     diff = *(orig + 2*stride + x) - *(recon + 2*stride + x);
828 :     sse += diff * diff;
829 :     diff = *(orig + 3*stride + x) - *(recon + 3*stride + x);
830 :     sse += diff * diff;
831 :     diff = *(orig + 4*stride + x) - *(recon + 4*stride + x);
832 :     sse += diff * diff;
833 :     diff = *(orig + 5*stride + x) - *(recon + 5*stride + x);
834 :     sse += diff * diff;
835 :     diff = *(orig + 6*stride + x) - *(recon + 6*stride + x);
836 :     sse += diff * diff;
837 :     diff = *(orig + 7*stride + x) - *(recon + 7*stride + x);
838 :     sse += diff * diff;
839 :     }
840 :    
841 :     orig += 8*stride;
842 :     recon += 8*stride;
843 :     }
844 :    
845 :     /* Compute the down rectangle sse */
846 :     for (y = bheight; y < height; y++) {
847 :     int x;
848 : edgomez 851 for (x = 0; x < width; x++) {
849 : edgomez 1424 int diff;
850 : edgomez 851 diff = *(orig + x) - *(recon + x);
851 :     sse += diff * diff;
852 :     }
853 :     orig += stride;
854 :     recon += stride;
855 :     }
856 : edgomez 1424
857 :     return (sse);
858 : edgomez 851 }
859 :    
860 : edgomez 1382 #if 0
861 : edgomez 851
862 : albeu 315 #include <stdio.h>
863 :     #include <string.h>
864 :    
865 :     int image_dump_pgm(uint8_t * bmp, uint32_t width, uint32_t height, char * filename)
866 :     {
867 :     FILE * f;
868 :     char hdr[1024];
869 : edgomez 1382
870 : albeu 315 f = fopen(filename, "wb");
871 :     if ( f == NULL)
872 :     {
873 :     return -1;
874 :     }
875 :     sprintf(hdr, "P5\n#xvid\n%i %i\n255\n", width, height);
876 :     fwrite(hdr, strlen(hdr), 1, f);
877 :     fwrite(bmp, width, height, f);
878 :     fclose(f);
879 :    
880 :     return 0;
881 :     }
882 :    
883 :    
884 : edgomez 1382 /* dump image+edges to yuv pgm files */
885 : albeu 315
886 :     int image_dump(IMAGE * image, uint32_t edged_width, uint32_t edged_height, char * path, int number)
887 :     {
888 :     char filename[1024];
889 :    
890 :     sprintf(filename, "%s_%i_%c.pgm", path, number, 'y');
891 :     image_dump_pgm(
892 :     image->y - (EDGE_SIZE * edged_width + EDGE_SIZE),
893 :     edged_width, edged_height, filename);
894 :    
895 :     sprintf(filename, "%s_%i_%c.pgm", path, number, 'u');
896 :     image_dump_pgm(
897 :     image->u - (EDGE_SIZE2 * edged_width / 2 + EDGE_SIZE2),
898 :     edged_width / 2, edged_height / 2, filename);
899 :    
900 :     sprintf(filename, "%s_%i_%c.pgm", path, number, 'v');
901 :     image_dump_pgm(
902 :     image->v - (EDGE_SIZE2 * edged_width / 2 + EDGE_SIZE2),
903 :     edged_width / 2, edged_height / 2, filename);
904 :    
905 :     return 0;
906 :     }
907 : edgomez 1382 #endif
908 : albeu 315
909 :    
910 :    
911 :     /* dump image to yuvpgm file */
912 :    
913 :     #include <stdio.h>
914 :    
915 :     int
916 :     image_dump_yuvpgm(const IMAGE * image,
917 :     const uint32_t edged_width,
918 :     const uint32_t width,
919 :     const uint32_t height,
920 :     char *filename)
921 :     {
922 :     FILE *f;
923 :     char hdr[1024];
924 :     uint32_t i;
925 :     uint8_t *bmp1;
926 :     uint8_t *bmp2;
927 :    
928 :    
929 :     f = fopen(filename, "wb");
930 :     if (f == NULL) {
931 :     return -1;
932 :     }
933 :     sprintf(hdr, "P5\n#xvid\n%i %i\n255\n", width, (3 * height) / 2);
934 :     fwrite(hdr, strlen(hdr), 1, f);
935 :    
936 :     bmp1 = image->y;
937 :     for (i = 0; i < height; i++) {
938 :     fwrite(bmp1, width, 1, f);
939 :     bmp1 += edged_width;
940 :     }
941 :    
942 :     bmp1 = image->u;
943 :     bmp2 = image->v;
944 :     for (i = 0; i < height / 2; i++) {
945 :     fwrite(bmp1, width / 2, 1, f);
946 :     fwrite(bmp2, width / 2, 1, f);
947 :     bmp1 += edged_width / 2;
948 :     bmp2 += edged_width / 2;
949 :     }
950 :    
951 :     fclose(f);
952 :     return 0;
953 :     }
954 :    
955 :    
956 :     float
957 :     image_mad(const IMAGE * img1,
958 :     const IMAGE * img2,
959 :     uint32_t stride,
960 :     uint32_t width,
961 :     uint32_t height)
962 :     {
963 :     const uint32_t stride2 = stride / 2;
964 :     const uint32_t width2 = width / 2;
965 :     const uint32_t height2 = height / 2;
966 :    
967 :     uint32_t x, y;
968 :     uint32_t sum = 0;
969 :    
970 :     for (y = 0; y < height; y++)
971 :     for (x = 0; x < width; x++)
972 : edgomez 1382 sum += abs(img1->y[x + y * stride] - img2->y[x + y * stride]);
973 : albeu 315
974 :     for (y = 0; y < height2; y++)
975 :     for (x = 0; x < width2; x++)
976 : edgomez 1382 sum += abs(img1->u[x + y * stride2] - img2->u[x + y * stride2]);
977 : albeu 315
978 :     for (y = 0; y < height2; y++)
979 :     for (x = 0; x < width2; x++)
980 : edgomez 1382 sum += abs(img1->v[x + y * stride2] - img2->v[x + y * stride2]);
981 : albeu 315
982 :     return (float) sum / (width * height * 3 / 2);
983 :     }
984 :    
985 :     void
986 : suxen_drol 1631 output_slice(IMAGE * cur, int stride, int width, xvid_image_t* out_frm, int mbx, int mby,int mbl) {
987 : albeu 315 uint8_t *dY,*dU,*dV,*sY,*sU,*sV;
988 : suxen_drol 1631 int stride2 = stride >> 1;
989 : albeu 315 int w = mbl << 4, w2,i;
990 :    
991 :     if(w > width)
992 :     w = width;
993 :     w2 = w >> 1;
994 : suxen_drol 323
995 : edgomez 1382 dY = (uint8_t*)out_frm->plane[0] + (mby << 4) * out_frm->stride[0] + (mbx << 4);
996 :     dU = (uint8_t*)out_frm->plane[1] + (mby << 3) * out_frm->stride[1] + (mbx << 3);
997 :     dV = (uint8_t*)out_frm->plane[2] + (mby << 3) * out_frm->stride[2] + (mbx << 3);
998 : suxen_drol 1631 sY = cur->y + (mby << 4) * stride + (mbx << 4);
999 :     sU = cur->u + (mby << 3) * stride2 + (mbx << 3);
1000 :     sV = cur->v + (mby << 3) * stride2 + (mbx << 3);
1001 : albeu 315
1002 :     for(i = 0 ; i < 16 ; i++) {
1003 :     memcpy(dY,sY,w);
1004 : edgomez 1382 dY += out_frm->stride[0];
1005 : suxen_drol 1631 sY += stride;
1006 : suxen_drol 323 }
1007 : albeu 315 for(i = 0 ; i < 8 ; i++) {
1008 :     memcpy(dU,sU,w2);
1009 : edgomez 1382 dU += out_frm->stride[1];
1010 : suxen_drol 1631 sU += stride2;
1011 : albeu 315 }
1012 :     for(i = 0 ; i < 8 ; i++) {
1013 :     memcpy(dV,sV,w2);
1014 : edgomez 1382 dV += out_frm->stride[2];
1015 : suxen_drol 1631 sV += stride2;
1016 : albeu 315 }
1017 :     }
1018 : edgomez 851
1019 :    
1020 :     void
1021 :     image_clear(IMAGE * img, int width, int height, int edged_width,
1022 :     int y, int u, int v)
1023 :     {
1024 :     uint8_t * p;
1025 :     int i;
1026 :    
1027 :     p = img->y;
1028 :     for (i = 0; i < height; i++) {
1029 :     memset(p, y, width);
1030 :     p += edged_width;
1031 :     }
1032 :    
1033 :     p = img->u;
1034 :     for (i = 0; i < height/2; i++) {
1035 :     memset(p, u, width/2);
1036 :     p += edged_width/2;
1037 :     }
1038 :    
1039 :     p = img->v;
1040 :     for (i = 0; i < height/2; i++) {
1041 :     memset(p, v, width/2);
1042 :     p += edged_width/2;
1043 :     }
1044 :     }
1045 : Skal 1733
1046 :     /****************************************************************************/
1047 :    
1048 : Isibaar 1734 static void (*deintl_core)(uint8_t *, int width, int height, const int stride) = 0;
1049 :     extern void xvid_deinterlace_sse(uint8_t *, int width, int height, const int stride);
1050 : Skal 1733
1051 :     #define CLIP_255(x) ( ((x)&~255) ? ((-(x)) >> (8*sizeof((x))-1))&0xff : (x) )
1052 :    
1053 : Isibaar 1734 static void deinterlace_c(uint8_t *pix, int width, int height, const int bps)
1054 : Skal 1733 {
1055 :     pix += bps;
1056 :     while(width-->0)
1057 :     {
1058 :     int p1 = pix[-bps];
1059 :     int p2 = pix[0];
1060 :     int p0 = p2;
1061 :     int j = (height>>1) - 1;
1062 :     int V;
1063 :     unsigned char *P = pix++;
1064 :     while(j-->0)
1065 :     {
1066 :     const int p3 = P[ bps];
1067 :     const int p4 = P[2*bps];
1068 :     V = ((p1+p3+1)>>1) + ((p2 - ((p0+p4+1)>>1)) >> 2);
1069 :     P[0] = CLIP_255( V );
1070 :     p0 = p2;
1071 :     p1 = p3;
1072 :     p2 = p4;
1073 :     P += 2*bps;
1074 :     }
1075 :     V = ((p1+p1+1)>>1) + ((p2 - ((p0+p2+1)>>1)) >> 2);
1076 :     P[0] = CLIP_255( V );
1077 :     }
1078 :     }
1079 :     #undef CLIP_255
1080 :    
1081 :     int xvid_image_deinterlace(xvid_image_t* img, int width, int height, int bottom_first)
1082 :     {
1083 :     if (height&1)
1084 :     return 0;
1085 :     if (img->csp!=XVID_CSP_PLANAR && img->csp!=XVID_CSP_I420 && img->csp!=XVID_CSP_YV12)
1086 :     return 0; /* not yet supported */
1087 :     if (deintl_core==0) {
1088 :     deintl_core = deinterlace_c;
1089 : Isibaar 1795 #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
1090 : Skal 1736 {
1091 :     int cpu_flags = check_cpu_features();
1092 :     if (cpu_flags & XVID_CPU_MMX)
1093 :     deintl_core = xvid_deinterlace_sse;
1094 :     }
1095 : Skal 1733 #endif
1096 :     }
1097 :     if (!bottom_first) {
1098 :     deintl_core(img->plane[0], width, height, img->stride[0]);
1099 :     deintl_core(img->plane[1], width>>1, height>>1, img->stride[1]);
1100 :     deintl_core(img->plane[2], width>>1, height>>1, img->stride[2]);
1101 :     }
1102 :     else {
1103 : Isibaar 1734 deintl_core((uint8_t *)img->plane[0] + ( height -1)*img->stride[0], width, height, -img->stride[0]);
1104 :     deintl_core((uint8_t *)img->plane[1] + ((height>>1)-1)*img->stride[1], width>>1, height>>1, -img->stride[1]);
1105 :     deintl_core((uint8_t *)img->plane[2] + ((height>>1)-1)*img->stride[2], width>>1, height>>1, -img->stride[2]);
1106 : Skal 1733 }
1107 :     emms();
1108 :    
1109 :     return 1;
1110 :     }
1111 :    

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4