[svn] / trunk / xvidcore / src / image / colorspace.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/src/image/colorspace.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 433, Fri Sep 6 17:37:07 2002 UTC revision 1382, Mon Mar 22 22:36:25 2004 UTC
# Line 1  Line 1 
1  /*****************************************************************************  /*****************************************************************************
2   *   *
3   *  XVID MPEG-4 VIDEO CODEC   *  XVID MPEG-4 VIDEO CODEC
4   *  - colorspace conversion module -   *  - Colorspace conversion functions -
5   *   *
6   *  Copyright(C) 2002 Peter Ross <pross@xvid.org>   *  Copyright(C) 2001-2003 Peter Ross <pross@xvid.org>
  *  
  *  This program is an implementation of a part of one or more MPEG-4  
  *  Video tools as specified in ISO/IEC 14496-2 standard.  Those intending  
  *  to use this software module in hardware or software products are  
  *  advised that its use may infringe existing patents or copyrights, and  
  *  any such use would be at such party's own risk.  The original  
  *  developer of this software module and his/her company, and subsequent  
  *  editors and their companies, will have no liability for use of this  
  *  software or modifications or derivatives thereof.  
7   *   *
8   *  This program is free software; you can redistribute it and/or modify   *  This program is free software; you can redistribute it and/or modify
9   *  it under the terms of the GNU General Public License as published by   *  it under the terms of the GNU General Public License as published by
# Line 28  Line 19 
19   *  along with this program; if not, write to the Free Software   *  along with this program; if not, write to the Free Software
20   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22     * $Id: colorspace.c,v 1.9 2004-03-22 22:36:23 edgomez Exp $
23     *
24   ****************************************************************************/   ****************************************************************************/
25    
26  #include <string.h>                             // memcpy  #include <string.h>                             /* memcpy */
27    
28    #include "../global.h"
29  #include "colorspace.h"  #include "colorspace.h"
 #include "../divx4.h"                   // DEC_PICTURE  
30    
31  // function pointers  /* function pointers */
32    
33  /* input */  /* input */
34  color_inputFuncPtr rgb555_to_yv12;  packedFuncPtr rgb555_to_yv12;
35  color_inputFuncPtr rgb565_to_yv12;  packedFuncPtr rgb565_to_yv12;
36  color_inputFuncPtr rgb24_to_yv12;  packedFuncPtr bgr_to_yv12;
37  color_inputFuncPtr rgb32_to_yv12;  packedFuncPtr bgra_to_yv12;
38  color_inputFuncPtr yuv_to_yv12;  packedFuncPtr abgr_to_yv12;
39  color_inputFuncPtr yuyv_to_yv12;  packedFuncPtr rgba_to_yv12;
40  color_inputFuncPtr uyvy_to_yv12;  packedFuncPtr argb_to_yv12;
41    packedFuncPtr yuv_to_yv12;
42    packedFuncPtr yuyv_to_yv12;
43    packedFuncPtr uyvy_to_yv12;
44    
45    packedFuncPtr rgb555i_to_yv12;
46    packedFuncPtr rgb565i_to_yv12;
47    packedFuncPtr bgri_to_yv12;
48    packedFuncPtr bgrai_to_yv12;
49    packedFuncPtr abgri_to_yv12;
50    packedFuncPtr rgbai_to_yv12;
51    packedFuncPtr argbi_to_yv12;
52    packedFuncPtr yuyvi_to_yv12;
53    packedFuncPtr uyvyi_to_yv12;
54    
55  /* output */  /* output */
56  color_outputFuncPtr yv12_to_rgb555;  packedFuncPtr yv12_to_rgb555;
57  color_outputFuncPtr yv12_to_rgb565;  packedFuncPtr yv12_to_rgb565;
58  color_outputFuncPtr yv12_to_rgb24;  packedFuncPtr yv12_to_bgr;
59  color_outputFuncPtr yv12_to_rgb32;  packedFuncPtr yv12_to_bgra;
60  color_outputFuncPtr yv12_to_yuv;  packedFuncPtr yv12_to_abgr;
61  color_outputFuncPtr yv12_to_yuyv;  packedFuncPtr yv12_to_rgba;
62  color_outputFuncPtr yv12_to_uyvy;  packedFuncPtr yv12_to_argb;
63    packedFuncPtr yv12_to_yuv;
64    packedFuncPtr yv12_to_yuyv;
65    packedFuncPtr yv12_to_uyvy;
66    
67    packedFuncPtr yv12_to_rgb555i;
68    packedFuncPtr yv12_to_rgb565i;
69    packedFuncPtr yv12_to_bgri;
70    packedFuncPtr yv12_to_bgrai;
71    packedFuncPtr yv12_to_abgri;
72    packedFuncPtr yv12_to_rgbai;
73    packedFuncPtr yv12_to_argbi;
74    packedFuncPtr yv12_to_yuyvi;
75    packedFuncPtr yv12_to_uyvyi;
76    
77    planarFuncPtr yv12_to_yv12;
78    
79    
80    int32_t RGB_Y_tab[256];
81    int32_t B_U_tab[256];
82    int32_t G_U_tab[256];
83    int32_t G_V_tab[256];
84    int32_t R_V_tab[256];
85    
86    
87    
88    /********** generic colorspace macro **********/
89    
90    
91    #define MAKE_COLORSPACE(NAME,SIZE,PIXELS,VPIXELS,FUNC,C1,C2,C3,C4) \
92    void    \
93    NAME(uint8_t * x_ptr, int x_stride,     \
94                                     uint8_t * y_ptr, uint8_t * u_ptr, uint8_t * v_ptr,     \
95                                     int y_stride, int uv_stride,   \
96                                     int width, int height, int vflip)      \
97    {       \
98            int fixed_width = (width + 1) & ~1;                             \
99            int x_dif = x_stride - (SIZE)*fixed_width;              \
100            int y_dif = y_stride - fixed_width;                             \
101            int uv_dif = uv_stride - (fixed_width / 2);             \
102            int x, y;                                                                               \
103            if (vflip) {                                                            \
104                    x_ptr += (height - 1) * x_stride;                       \
105                    x_dif = -(SIZE)*fixed_width - x_stride;         \
106                    x_stride = -x_stride;                                           \
107            }                                                                                               \
108            for (y = 0; y < height; y+=(VPIXELS)) {                 \
109                    FUNC##_ROW(SIZE,C1,C2,C3,C4);                           \
110                    for (x = 0; x < fixed_width; x+=(PIXELS)) {     \
111                            FUNC(SIZE,C1,C2,C3,C4);                         \
112                            x_ptr += (PIXELS)*(SIZE);                               \
113                            y_ptr += (PIXELS);                                              \
114                            u_ptr += (PIXELS)/2;                                    \
115                            v_ptr += (PIXELS)/2;                                    \
116                    }                                                                                       \
117                    x_ptr += x_dif + (VPIXELS-1)*x_stride;          \
118                    y_ptr += y_dif + (VPIXELS-1)*y_stride;          \
119                    u_ptr += uv_dif + ((VPIXELS/2)-1)*uv_stride;    \
120                    v_ptr += uv_dif + ((VPIXELS/2)-1)*uv_stride;    \
121            }                                                                                               \
122    }
123    
124    
125    
126  #define MIN(A,B)        ((A)<(B)?(A):(B))  /********** colorspace input (xxx_to_yv12) functions **********/
 #define MAX(A,B)        ((A)>(B)?(A):(B))  
127    
128  /*      rgb -> yuv def's  /*      rgb -> yuv def's
129    
# Line 87  Line 154 
154  #define FIX_IN(x)               ((uint16_t) ((x) * (1L<<SCALEBITS_IN) + 0.5))  #define FIX_IN(x)               ((uint16_t) ((x) * (1L<<SCALEBITS_IN) + 0.5))
155    
156    
157  int32_t RGB_Y_tab[256];  /* rgb16/rgb16i input */
 int32_t B_U_tab[256];  
 int32_t G_U_tab[256];  
 int32_t G_V_tab[256];  
 int32_t R_V_tab[256];  
   
   
 /* rgb555 -> yuv 4:2:0 planar */  
 void  
 rgb555_to_yv12_c(uint8_t * y_out,  
                                  uint8_t * u_out,  
                                  uint8_t * v_out,  
                                  uint8_t * src,  
                                  int width,  
                                  int height,  
                                  int y_stride)  
 {  
         int32_t src_stride = width * 2;  
         uint32_t y_dif = y_stride - width;  
         uint32_t uv_dif = (y_stride - width) / 2;  
         uint32_t x, y;  
   
         if (height < 0) {  
                 height = -height;  
                 src += (height - 1) * src_stride;  
                 src_stride = -src_stride;  
         }  
   
   
         for (y = height / 2; y; y--) {  
                 // process one 2x2 block per iteration  
                 for (x = 0; x < (uint32_t) width; x += 2) {  
                         int rgb, r, g, b, r4, g4, b4;  
   
                         rgb = *(uint16_t *) (src + x * 2);  
                         b4 = b = (rgb << 3) & 0xf8;  
                         g4 = g = (rgb >> 2) & 0xf8;  
                         r4 = r = (rgb >> 7) & 0xf8;  
                         y_out[0] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         rgb = *(uint16_t *) (src + x * 2 + src_stride);  
                         b4 += b = (rgb << 3) & 0xf8;  
                         g4 += g = (rgb >> 2) & 0xf8;  
                         r4 += r = (rgb >> 7) & 0xf8;  
                         y_out[y_stride] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         rgb = *(uint16_t *) (src + x * 2 + 2);  
                         b4 += b = (rgb << 3) & 0xf8;  
                         g4 += g = (rgb >> 2) & 0xf8;  
                         r4 += r = (rgb >> 7) & 0xf8;  
                         y_out[1] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         rgb = *(uint16_t *) (src + x * 2 + src_stride + 2);  
                         b4 += b = (rgb << 3) & 0xf8;  
                         g4 += g = (rgb >> 2) & 0xf8;  
                         r4 += r = (rgb >> 7) & 0xf8;  
                         y_out[y_stride + 1] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         *u_out++ =  
                                 (uint8_t) ((-FIX_IN(U_R_IN) * r4 - FIX_IN(U_G_IN) * g4 +  
                                                         FIX_IN(U_B_IN) * b4) >> (SCALEBITS_IN + 2)) +  
                                 U_ADD_IN;  
   
   
                         *v_out++ =  
                                 (uint8_t) ((FIX_IN(V_R_IN) * r4 - FIX_IN(V_G_IN) * g4 -  
                                                         FIX_IN(V_B_IN) * b4) >> (SCALEBITS_IN + 2)) +  
                                 V_ADD_IN;  
   
                         y_out += 2;  
                 }  
                 src += src_stride * 2;  
                 y_out += y_dif + y_stride;  
                 u_out += uv_dif;  
                 v_out += uv_dif;  
         }  
 }  
   
   
   
 /* rgb565_to_yuv_c  
         NOTE:   identical to rgb555 except for shift/mask  
                         not tested */  
   
 void  
 rgb565_to_yv12_c(uint8_t * y_out,  
                                  uint8_t * u_out,  
                                  uint8_t * v_out,  
                                  uint8_t * src,  
                                  int width,  
                                  int height,  
                                  int y_stride)  
 {  
         int32_t src_stride = width * 2;  
   
         uint32_t y_dif = y_stride - width;  
         uint32_t uv_dif = (y_stride - width) / 2;  
         uint32_t x, y;  
   
         if (height < 0) {  
                 height = -height;  
                 src += (height - 1) * src_stride;  
                 src_stride = -src_stride;  
         }  
   
   
         for (y = height / 2; y; y--) {  
                 // process one 2x2 block per iteration  
                 for (x = 0; x < (uint32_t) width; x += 2) {  
                         int rgb, r, g, b, r4, g4, b4;  
   
                         rgb = *(uint16_t *) (src + x * 2);  
                         b4 = b = (rgb << 3) & 0xf8;  
                         g4 = g = (rgb >> 3) & 0xfc;  
                         r4 = r = (rgb >> 8) & 0xf8;  
                         y_out[0] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         rgb = *(uint16_t *) (src + x * 2 + src_stride);  
                         b4 += b = (rgb << 3) & 0xf8;  
                         g4 += g = (rgb >> 3) & 0xfc;  
                         r4 += r = (rgb >> 8) & 0xf8;  
                         y_out[y_stride] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         rgb = *(uint16_t *) (src + x * 2 + 2);  
                         b4 += b = (rgb << 3) & 0xf8;  
                         g4 += g = (rgb >> 3) & 0xfc;  
                         r4 += r = (rgb >> 8) & 0xf8;  
                         y_out[1] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         rgb = *(uint16_t *) (src + x * 2 + src_stride + 2);  
                         b4 += b = (rgb << 3) & 0xf8;  
                         g4 += g = (rgb >> 3) & 0xfc;  
                         r4 += r = (rgb >> 8) & 0xf8;  
                         y_out[y_stride + 1] =  
                                 (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
                                                         FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
   
                         *u_out++ =  
                                 (uint8_t) ((-FIX_IN(U_R_IN) * r4 - FIX_IN(U_G_IN) * g4 +  
                                                         FIX_IN(U_B_IN) * b4) >> (SCALEBITS_IN + 2)) +  
                                 U_ADD_IN;  
   
   
                         *v_out++ =  
                                 (uint8_t) ((FIX_IN(V_R_IN) * r4 - FIX_IN(V_G_IN) * g4 -  
                                                         FIX_IN(V_B_IN) * b4) >> (SCALEBITS_IN + 2)) +  
                                 V_ADD_IN;  
   
                         y_out += 2;  
                 }  
                 src += src_stride * 2;  
                 y_out += y_dif + y_stride;  
                 u_out += uv_dif;  
                 v_out += uv_dif;  
         }  
 }  
   
   
158    
159    #define MK_RGB555_B(RGB)  ((RGB) << 3) & 0xf8
160  /*      rgb24 -> yuv 4:2:0 planar  #define MK_RGB555_G(RGB)  ((RGB) >> 2) & 0xf8
161    #define MK_RGB555_R(RGB)  ((RGB) >> 7) & 0xf8
162          NOTE: always flips.  
163  */  #define MK_RGB565_B(RGB)  ((RGB) << 3) & 0xf8
164    #define MK_RGB565_G(RGB)  ((RGB) >> 3) & 0xfc
165  void  #define MK_RGB565_R(RGB)  ((RGB) >> 8) & 0xf8
166  rgb24_to_yv12_c(uint8_t * y_out,  
167                                  uint8_t * u_out,  
168                                  uint8_t * v_out,  #define READ_RGB16_Y(ROW, UVID, C1,C2,C3,C4)    \
169                                  uint8_t * src,          rgb = *(uint16_t *) (x_ptr + ((ROW)*x_stride) + 0);     \
170                                  int width,          b##UVID += b = C1##_B(rgb);                             \
171                                  int height,          g##UVID += g = C1##_G(rgb);                             \
172                                  int stride)          r##UVID += r = C1##_R(rgb);                             \
173  {          y_ptr[(ROW)*y_stride+0] =                               \
174          uint32_t width3 = (width << 1) + width; /* width * 3 */                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +   \
175          uint32_t src_dif = (width << 3) + width;        /* width3 * 3 */                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;        \
176          uint32_t y_dif = (stride << 1) - width;          rgb = *(uint16_t *) (x_ptr + ((ROW)*x_stride) + 2);     \
177          uint32_t uv_dif = (stride - width) >> 1;          b##UVID += b = C1##_B(rgb);                             \
178          uint32_t x, y;          g##UVID += g = C1##_G(rgb);                             \
179            r##UVID += r = C1##_R(rgb);                             \
180          src += (height - 2) * width3;          y_ptr[(ROW)*y_stride+1] =                               \
181                    (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +                   \
182                                            FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;
183          for (y = height >> 1; y; y--) {  
184                  for (x = width >> 1; x; x--) {  #define READ_RGB16_UV(UV_ROW,UVID)      \
185                          uint32_t r, g, b, r4, g4, b4;          u_ptr[(UV_ROW)*uv_stride] =                                                                                                             \
186                    (uint8_t) ((-FIX_IN(U_R_IN) * r##UVID - FIX_IN(U_G_IN) * g##UVID +                      \
187                          b4 = b = src[0];                                          FIX_IN(U_B_IN) * b##UVID) >> (SCALEBITS_IN + 2)) + U_ADD_IN;    \
188                          g4 = g = src[1];          v_ptr[(UV_ROW)*uv_stride] =                                                                                                             \
189                          r4 = r = src[2];                  (uint8_t) ((FIX_IN(V_R_IN) * r##UVID - FIX_IN(V_G_IN) * g##UVID -                       \
190                          y_out[stride + 0] =                                          FIX_IN(V_B_IN) * b##UVID) >> (SCALEBITS_IN + 2)) + V_ADD_IN;
191                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  
192                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  #define RGB16_TO_YV12_ROW(SIZE,C1,C2,C3,C4) \
193            /* nothing */
194                          b4 += (b = src[3]);  #define RGB16_TO_YV12(SIZE,C1,C2,C3,C4) \
195                          g4 += (g = src[4]);          uint32_t rgb, r, g, b, r0, g0, b0;      \
196                          r4 += (r = src[5]);          r0 = g0 = b0 = 0;                                       \
197                          y_out[stride + 1] =          READ_RGB16_Y (0, 0, C1,C2,C3,C4)        \
198                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +          READ_RGB16_Y (1, 0, C1,C2,C3,C4)        \
199                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;          READ_RGB16_UV(0, 0)
200    
201                          b4 += (b = src[width3 + 0]);  
202                          g4 += (g = src[width3 + 1]);  #define RGB16I_TO_YV12_ROW(SIZE,C1,C2,C3,C4) \
203                          r4 += (r = src[width3 + 2]);          /* nothing */
204                          y_out[0] =  #define RGB16I_TO_YV12(SIZE,C1,C2,C3,C4)        \
205                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +          uint32_t rgb, r, g, b, r0, g0, b0, r1, g1, b1;  \
206                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;          r0 = g0 = b0 = r1 = g1 = b1 = 0;        \
207            READ_RGB16_Y (0, 0, C1,C2,C3,C4)        \
208                          b4 += (b = src[width3 + 3]);          READ_RGB16_Y (1, 1, C1,C2,C3,C4)        \
209                          g4 += (g = src[width3 + 4]);          READ_RGB16_Y (2, 0, C1,C2,C3,C4)        \
210                          r4 += (r = src[width3 + 5]);          READ_RGB16_Y (3, 1, C1,C2,C3,C4)        \
211                          y_out[1] =          READ_RGB16_UV(0, 0)                                     \
212                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +          READ_RGB16_UV(1, 1)
213                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  
214    
215                          *u_out++ =  /* rgb/rgbi input */
216                                  (uint8_t) ((-FIX_IN(U_R_IN) * r4 - FIX_IN(U_G_IN) * g4 +  
217                                                          FIX_IN(U_B_IN) * b4) >> (SCALEBITS_IN + 2)) +  #define READ_RGB_Y(SIZE, ROW, UVID, C1,C2,C3,C4)        \
218                                  U_ADD_IN;          r##UVID += r = x_ptr[(ROW)*x_stride+(C1)];                                              \
219            g##UVID += g = x_ptr[(ROW)*x_stride+(C2)];                                              \
220            b##UVID += b = x_ptr[(ROW)*x_stride+(C3)];                                              \
221                          *v_out++ =          y_ptr[(ROW)*y_stride+0] =                                                                       \
222                                  (uint8_t) ((FIX_IN(V_R_IN) * r4 - FIX_IN(V_G_IN) * g4 -                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +   \
223                                                          FIX_IN(V_B_IN) * b4) >> (SCALEBITS_IN + 2)) +                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;        \
224                                  V_ADD_IN;          r##UVID += r = x_ptr[(ROW)*x_stride+(SIZE)+(C1)];                               \
225            g##UVID += g = x_ptr[(ROW)*x_stride+(SIZE)+(C2)];                               \
226            b##UVID += b = x_ptr[(ROW)*x_stride+(SIZE)+(C3)];                               \
227                          src += 6;          y_ptr[(ROW)*y_stride+1] =                                                                       \
228                          y_out += 2;                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +   \
229                  }                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;
230                  src -= src_dif;  
231                  y_out += y_dif;  #define READ_RGB_UV(UV_ROW,UVID)        \
232                  u_out += uv_dif;          u_ptr[(UV_ROW)*uv_stride] =                                                                                                             \
233                  v_out += uv_dif;                  (uint8_t) ((-FIX_IN(U_R_IN) * r##UVID - FIX_IN(U_G_IN) * g##UVID +                      \
234          }                                          FIX_IN(U_B_IN) * b##UVID) >> (SCALEBITS_IN + 2)) + U_ADD_IN;    \
235  }          v_ptr[(UV_ROW)*uv_stride] =                                                                                                             \
236                    (uint8_t) ((FIX_IN(V_R_IN) * r##UVID - FIX_IN(V_G_IN) * g##UVID -                       \
237                                            FIX_IN(V_B_IN) * b##UVID) >> (SCALEBITS_IN + 2)) + V_ADD_IN;
238  /*      rgb32 -> yuv 4:2:0 planar  
239    
240          NOTE: always flips  #define RGB_TO_YV12_ROW(SIZE,C1,C2,C3,C4) \
241  */          /* nothing */
242    #define RGB_TO_YV12(SIZE,C1,C2,C3,C4)   \
243  void          uint32_t r, g, b, r0, g0, b0;           \
244  rgb32_to_yv12_c(uint8_t * y_out,          r0 = g0 = b0 = 0;                                       \
245                                  uint8_t * u_out,          READ_RGB_Y(SIZE, 0, 0, C1,C2,C3,C4)     \
246                                  uint8_t * v_out,          READ_RGB_Y(SIZE, 1, 0, C1,C2,C3,C4)     \
247                                  uint8_t * src,          READ_RGB_UV(     0, 0)
248                                  int width,  
249                                  int height,  #define RGBI_TO_YV12_ROW(SIZE,C1,C2,C3,C4) \
250                                  int stride)          /* nothing */
251  {  #define RGBI_TO_YV12(SIZE,C1,C2,C3,C4)  \
252          uint32_t width4 = (width << 2); /* width * 4 */          uint32_t r, g, b, r0, g0, b0, r1, g1, b1;       \
253          uint32_t src_dif = 3 * width4;          r0 = g0 = b0 = r1 = g1 = b1 = 0;        \
254          uint32_t y_dif = (stride << 1) - width;          READ_RGB_Y(SIZE, 0, 0, C1,C2,C3,C4)     \
255          uint32_t uv_dif = (stride - width) >> 1;          READ_RGB_Y(SIZE, 1, 1, C1,C2,C3,C4)     \
256          uint32_t x, y;          READ_RGB_Y(SIZE, 2, 0, C1,C2,C3,C4)     \
257            READ_RGB_Y(SIZE, 3, 1, C1,C2,C3,C4)     \
258          src += (height - 2) * width4;          READ_RGB_UV(     0, 0)                          \
259            READ_RGB_UV(     1, 1)
260          for (y = height >> 1; y; y--) {  
261                  for (x = width >> 1; x; x--) {  
262                          uint32_t r, g, b, r4, g4, b4;  /* yuyv/yuyvi input */
263    
264                          b4 = b = src[0];  #define READ_YUYV_Y(ROW,C1,C2,C3,C4)    \
265                          g4 = g = src[1];          y_ptr[(ROW)*y_stride+0] = x_ptr[(ROW)*x_stride+(C1)];   \
266                          r4 = r = src[2];          y_ptr[(ROW)*y_stride+1] = x_ptr[(ROW)*x_stride+(C3)];
267                          y_out[stride + 0] =  #define READ_YUYV_UV(UV_ROW,ROW1,ROW2,C1,C2,C3,C4) \
268                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +          u_ptr[(UV_ROW)*uv_stride] = (x_ptr[(ROW1)*x_stride+(C2)] + x_ptr[(ROW2)*x_stride+(C2)] + 1) / 2;        \
269                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;          v_ptr[(UV_ROW)*uv_stride] = (x_ptr[(ROW1)*x_stride+(C4)] + x_ptr[(ROW2)*x_stride+(C4)] + 1) / 2;
270    
271                          b4 += (b = src[4]);  #define YUYV_TO_YV12_ROW(SIZE,C1,C2,C3,C4) \
272                          g4 += (g = src[5]);          /* nothing */
273                          r4 += (r = src[6]);  #define YUYV_TO_YV12(SIZE,C1,C2,C3,C4)  \
274                          y_out[stride + 1] =          READ_YUYV_Y (0,      C1,C2,C3,C4)       \
275                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +          READ_YUYV_Y (1,      C1,C2,C3,C4)       \
276                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;          READ_YUYV_UV(0, 0,1, C1,C2,C3,C4)
277    
278                          b4 += (b = src[width4 + 0]);  #define YUYVI_TO_YV12_ROW(SIZE,C1,C2,C3,C4) \
279                          g4 += (g = src[width4 + 1]);          /* nothing */
280                          r4 += (r = src[width4 + 2]);  #define YUYVI_TO_YV12(SIZE,C1,C2,C3,C4) \
281            READ_YUYV_Y (0, C1,C2,C3,C4)    \
282                          y_out[0] =          READ_YUYV_Y (1, C1,C2,C3,C4)    \
283                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +          READ_YUYV_Y (2, C1,C2,C3,C4)    \
284                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;          READ_YUYV_Y (3, C1,C2,C3,C4)    \
285            READ_YUYV_UV(0, 0,2, C1,C2,C3,C4)       \
286                          b4 += (b = src[width4 + 4]);          READ_YUYV_UV(1, 1,3, C1,C2,C3,C4)
287                          g4 += (g = src[width4 + 5]);  
288                          r4 += (r = src[width4 + 6]);  
289                          y_out[1] =  MAKE_COLORSPACE(rgb555_to_yv12_c,  2,2,2, RGB16_TO_YV12,  MK_RGB555, 0,0,0)
290                                  (uint8_t) ((FIX_IN(Y_R_IN) * r + FIX_IN(Y_G_IN) * g +  MAKE_COLORSPACE(rgb565_to_yv12_c,  2,2,2, RGB16_TO_YV12,  MK_RGB565, 0,0,0)
291                                                          FIX_IN(Y_B_IN) * b) >> SCALEBITS_IN) + Y_ADD_IN;  MAKE_COLORSPACE(bgr_to_yv12_c,     3,2,2, RGB_TO_YV12,    2,1,0, 0)
292    MAKE_COLORSPACE(bgra_to_yv12_c,    4,2,2, RGB_TO_YV12,    2,1,0, 0)
293                          *u_out++ =  MAKE_COLORSPACE(abgr_to_yv12_c,    4,2,2, RGB_TO_YV12,    3,2,1, 0)
294                                  (uint8_t) ((-FIX_IN(U_R_IN) * r4 - FIX_IN(U_G_IN) * g4 +  MAKE_COLORSPACE(rgba_to_yv12_c,    4,2,2, RGB_TO_YV12,    0,1,2, 0)
295                                                          FIX_IN(U_B_IN) * b4) >> (SCALEBITS_IN + 2)) +  MAKE_COLORSPACE(argb_to_yv12_c,    4,2,2, RGB_TO_YV12,    1,2,3, 0)
296                                  U_ADD_IN;  MAKE_COLORSPACE(yuyv_to_yv12_c,    2,2,2, YUYV_TO_YV12,   0,1,2,3)
297    MAKE_COLORSPACE(uyvy_to_yv12_c,    2,2,2, YUYV_TO_YV12,   1,0,3,2)
298                          *v_out++ =  
299                                  (uint8_t) ((FIX_IN(V_R_IN) * r4 - FIX_IN(V_G_IN) * g4 -  MAKE_COLORSPACE(rgb555i_to_yv12_c, 2,2,4, RGB16I_TO_YV12, MK_RGB555, 0,0,0)
300                                                          FIX_IN(V_B_IN) * b4) >> (SCALEBITS_IN + 2)) +  MAKE_COLORSPACE(rgb565i_to_yv12_c, 2,2,4, RGB16I_TO_YV12, MK_RGB565, 0,0,0)
301                                  V_ADD_IN;  MAKE_COLORSPACE(bgri_to_yv12_c,    3,2,4, RGBI_TO_YV12,   2,1,0, 0)
302    MAKE_COLORSPACE(bgrai_to_yv12_c,   4,2,4, RGBI_TO_YV12,   2,1,0, 0)
303                          src += 8;  MAKE_COLORSPACE(abgri_to_yv12_c,   4,2,4, RGBI_TO_YV12,   3,2,1, 0)
304                          y_out += 2;  MAKE_COLORSPACE(rgbai_to_yv12_c,   4,2,4, RGBI_TO_YV12,   0,1,2, 0)
305                  }  MAKE_COLORSPACE(argbi_to_yv12_c,   4,2,4, RGBI_TO_YV12,   1,2,3, 0)
306                  src -= src_dif;  MAKE_COLORSPACE(yuyvi_to_yv12_c,   2,2,4, YUYVI_TO_YV12,  0,1,2,3)
307                  y_out += y_dif;  MAKE_COLORSPACE(uyvyi_to_yv12_c,   2,2,4, YUYVI_TO_YV12,  1,0,3,2)
                 u_out += uv_dif;  
                 v_out += uv_dif;  
         }  
 }  
   
 /*      yuv planar -> yuv 4:2:0 planar  
   
         NOTE: does not flip */  
   
 void  
 yuv_to_yv12_c(uint8_t * y_out,  
                           uint8_t * u_out,  
                           uint8_t * v_out,  
                           uint8_t * src,  
                           int width,  
                           int height,  
                           int stride)  
 {  
         uint32_t stride2 = stride >> 1;  
         uint32_t width2 = width >> 1;  
         uint32_t y;  
   
         for (y = height; y; y--) {  
                 memcpy(y_out, src, width);  
                 src += width;  
                 y_out += stride;  
         }  
   
         for (y = height >> 1; y; y--) {  
                 memcpy(u_out, src, width2);  
                 src += width2;  
                 u_out += stride2;  
         }  
   
         for (y = height >> 1; y; y--) {  
                 memcpy(v_out, src, width2);  
                 src += width2;  
                 v_out += stride2;  
         }  
 }  
   
   
   
 /* yuyv (yuv2) packed -> yuv 4:2:0 planar  
   
    NOTE: does not flip */  
   
 void  
 yuyv_to_yv12_c(uint8_t * y_out,  
                            uint8_t * u_out,  
                            uint8_t * v_out,  
                            uint8_t * src,  
                            int width,  
                            int height,  
                            int stride)  
 {  
         uint32_t width2 = width + width;  
         uint32_t y_dif = stride - width;  
         uint32_t uv_dif = y_dif >> 1;  
         uint32_t x, y;  
   
         for (y = height >> 1; y; y--) {  
   
                 for (x = width >> 1; x; x--) {  
                         *y_out++ = *src++;  
                         //*u_out++ = *src++;  
                         *u_out++ = (*(src + width2) + *src) >> 1;  
                         src++;  
                         *y_out++ = *src++;  
                         //*v_out++ = *src++;  
                         *v_out++ = (*(src + width2) + *src) >> 1;  
                         src++;  
   
                 }  
   
                 y_out += y_dif;  
                 u_out += uv_dif;  
                 v_out += uv_dif;  
   
                 for (x = width >> 1; x; x--) {  
                         *y_out++ = *src++;  
                         src++;  
                         *y_out++ = *src++;  
                         src++;  
                 }  
   
                 y_out += y_dif;  
   
         }  
   
 }  
308    
309    
310    /********** colorspace output (yv12_to_xxx) functions **********/
 /* uyvy packed -> yuv 4:2:0 planar  
   
    NOTE: does not flip */  
   
   
 void  
 uyvy_to_yv12_c(uint8_t * y_out,  
                            uint8_t * u_out,  
                            uint8_t * v_out,  
                            uint8_t * src,  
                            int width,  
                            int height,  
                            int stride)  
 {  
         uint32_t width2 = width + width;  
         uint32_t y_dif = stride - width;  
         uint32_t uv_dif = y_dif >> 1;  
         uint32_t x, y;  
   
         for (y = height >> 1; y; y--) {  
   
                 for (x = width >> 1; x; x--) {  
                         *u_out++ = *src++;  
                         // *u_out++ = (*(src+width2) + *src++) >> 1;  
                         *y_out++ = *src++;  
                         //*v_out++ = *src++;  
                         *v_out++ = (*(src + width2) + *src) >> 1;  
                         src++;  
                         *y_out++ = *src++;  
                 }  
   
                 y_out += y_dif;  
                 u_out += uv_dif;;  
                 v_out += uv_dif;;  
   
                 for (x = width >> 1; x; x--) {  
                         src++;  
                         *y_out++ = *src++;  
                         src++;  
                         *y_out++ = *src++;  
                 }  
   
                 y_out += y_dif;  
         }  
 }  
   
311    
312  /*      yuv -> rgb def's */  /*      yuv -> rgb def's */
313    
# Line 563  Line 322 
322  #define R_V_OUT                 1.596  #define R_V_OUT                 1.596
323  #define V_ADD_OUT               128  #define V_ADD_OUT               128
324    
   
325  #define SCALEBITS_OUT   13  #define SCALEBITS_OUT   13
326  #define FIX_OUT(x)              ((uint16_t) ((x) * (1L<<SCALEBITS_OUT) + 0.5))  #define FIX_OUT(x)              ((uint16_t) ((x) * (1L<<SCALEBITS_OUT) + 0.5))
327    
328    
329  /* initialize rgb lookup tables */  /* rgb16/rgb16i output */
330    
331  void  #define MK_RGB555(R,G,B)        \
332  colorspace_init(void)          ((MAX(0,MIN(255, R)) << 7) & 0x7c00) | \
 {  
         int32_t i;  
   
         for (i = 0; i < 256; i++) {  
                 RGB_Y_tab[i] = FIX_OUT(RGB_Y_OUT) * (i - Y_ADD_OUT);  
                 B_U_tab[i] = FIX_OUT(B_U_OUT) * (i - U_ADD_OUT);  
                 G_U_tab[i] = FIX_OUT(G_U_OUT) * (i - U_ADD_OUT);  
                 G_V_tab[i] = FIX_OUT(G_V_OUT) * (i - V_ADD_OUT);  
                 R_V_tab[i] = FIX_OUT(R_V_OUT) * (i - V_ADD_OUT);  
         }  
 }  
   
 /* yuv 4:2:0 planar -> rgb555 + very simple error diffusion  
 */  
   
 #define MK_RGB555(R,G,B)        ((MAX(0,MIN(255, R)) << 7) & 0x7c00) | \  
333                                                          ((MAX(0,MIN(255, G)) << 2) & 0x03e0) | \                                                          ((MAX(0,MIN(255, G)) << 2) & 0x03e0) | \
334                                                          ((MAX(0,MIN(255, B)) >> 3) & 0x001f)                                                          ((MAX(0,MIN(255, B)) >> 3) & 0x001f)
335    
336    #define MK_RGB565(R,G,B)        \
337  void          ((MAX(0,MIN(255, R)) << 8) & 0xf800) | \
 yv12_to_rgb555_c(uint8_t * dst,  
                                  int dst_stride,  
                                  uint8_t * y_src,  
                                  uint8_t * u_src,  
                                  uint8_t * v_src,  
                                  int y_stride,  
                                  int uv_stride,  
                                  int width,  
                                  int height)  
 {  
         const uint32_t dst_dif = 4 * dst_stride - 2 * width;  
         int32_t y_dif = 2 * y_stride - width;  
   
         uint8_t *dst2 = dst + 2 * dst_stride;  
         uint8_t *y_src2 = y_src + y_stride;  
         uint32_t x, y;  
   
         if (height < 0) {  
                 height = -height;  
                 y_src += (height - 1) * y_stride;  
                 y_src2 = y_src - y_stride;  
                 u_src += (height / 2 - 1) * uv_stride;  
                 v_src += (height / 2 - 1) * uv_stride;  
                 y_dif = -width - 2 * y_stride;  
                 uv_stride = -uv_stride;  
         }  
   
         for (y = height / 2; y; y--) {  
                 int r, g, b;  
                 int r2, g2, b2;  
   
                 r = g = b = 0;  
                 r2 = g2 = b2 = 0;  
   
                 // process one 2x2 block per iteration  
                 for (x = 0; x < (uint32_t) width / 2; x++) {  
                         int u, v;  
                         int b_u, g_uv, r_v, rgb_y;  
   
                         u = u_src[x];  
                         v = v_src[x];  
   
                         b_u = B_U_tab[u];  
                         g_uv = G_U_tab[u] + G_V_tab[v];  
                         r_v = R_V_tab[v];  
   
                         rgb_y = RGB_Y_tab[*y_src];  
                         b = (b & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);  
                         g = (g & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);  
                         r = (r & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);  
                         *(uint16_t *) dst = MK_RGB555(r, g, b);  
   
                         y_src++;  
                         rgb_y = RGB_Y_tab[*y_src];  
                         b = (b & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);  
                         g = (g & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);  
                         r = (r & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);  
                         *(uint16_t *) (dst + 2) = MK_RGB555(r, g, b);  
                         y_src++;  
   
                         rgb_y = RGB_Y_tab[*y_src2];  
                         b2 = (b2 & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);  
                         g2 = (g2 & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);  
                         r2 = (r2 & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);  
                         *(uint16_t *) (dst2) = MK_RGB555(r2, g2, b2);  
                         y_src2++;  
   
                         rgb_y = RGB_Y_tab[*y_src2];  
                         b2 = (b2 & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);  
                         g2 = (g2 & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);  
                         r2 = (r2 & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);  
                         *(uint16_t *) (dst2 + 2) = MK_RGB555(r2, g2, b2);  
                         y_src2++;  
   
                         dst += 4;  
                         dst2 += 4;  
                 }  
   
                 dst += dst_dif;  
                 dst2 += dst_dif;  
   
                 y_src += y_dif;  
                 y_src2 += y_dif;  
   
                 u_src += uv_stride;  
                 v_src += uv_stride;  
         }  
 }  
   
   
 /* yuv 4:2:0 planar -> rgb565 + very simple error diffusion  
         NOTE:   identical to rgb555 except for shift/mask  */  
   
   
 #define MK_RGB565(R,G,B)        ((MAX(0,MIN(255, R)) << 8) & 0xf800) | \  
338                                                          ((MAX(0,MIN(255, G)) << 3) & 0x07e0) | \                                                          ((MAX(0,MIN(255, G)) << 3) & 0x07e0) | \
339                                                          ((MAX(0,MIN(255, B)) >> 3) & 0x001f)                                                          ((MAX(0,MIN(255, B)) >> 3) & 0x001f)
340    
341  void  #define WRITE_RGB16(ROW,UV_ROW,C1)      \
342  yv12_to_rgb565_c(uint8_t * dst,          rgb_y = RGB_Y_tab[ y_ptr[y_stride + 0] ];                       \
343                                   int dst_stride,          b[ROW] = (b[ROW] & 0x7) + ((rgb_y + b_u##UV_ROW) >> SCALEBITS_OUT);     \
344                                   uint8_t * y_src,          g[ROW] = (g[ROW] & 0x7) + ((rgb_y - g_uv##UV_ROW) >> SCALEBITS_OUT);    \
345                                   uint8_t * u_src,          r[ROW] = (r[ROW] & 0x7) + ((rgb_y + r_v##UV_ROW) >> SCALEBITS_OUT);             \
346                                   uint8_t * v_src,          *(uint16_t *) (x_ptr+((ROW)*x_stride)+0) = C1(r[ROW], g[ROW], b[ROW]);  \
347                                   int y_stride,          rgb_y = RGB_Y_tab[ y_ptr[y_stride + 1] ];                               \
348                                   int uv_stride,          b[ROW] = (b[ROW] & 0x7) + ((rgb_y + b_u##UV_ROW) >> SCALEBITS_OUT);             \
349                                   int width,          g[ROW] = (g[ROW] & 0x7) + ((rgb_y - g_uv##UV_ROW) >> SCALEBITS_OUT);    \
350                                   int height)          r[ROW] = (r[ROW] & 0x7) + ((rgb_y + r_v##UV_ROW) >> SCALEBITS_OUT);             \
351  {          *(uint16_t *) (x_ptr+((ROW)*x_stride)+2) = C1(r[ROW], g[ROW], b[ROW]);
352          const uint32_t dst_dif = 4 * dst_stride - 2 * width;  
353          int32_t y_dif = 2 * y_stride - width;  #define YV12_TO_RGB16_ROW(SIZE,C1,C2,C3,C4) \
354            int r[2], g[2], b[2];                                   \
355          uint8_t *dst2 = dst + 2 * dst_stride;          r[0] = r[1] = g[0] = g[1] = b[0] = b[1] = 0;
356          uint8_t *y_src2 = y_src + y_stride;  #define YV12_TO_RGB16(SIZE,C1,C2,C3,C4)         \
357          uint32_t x, y;          int rgb_y;                                                                                              \
358            int b_u0 = B_U_tab[ u_ptr[0] ];                                                         \
359          if (height < 0) {                       // flip image?          int g_uv0 = G_U_tab[ u_ptr[0] ] + G_V_tab[ v_ptr[0] ];          \
360                  height = -height;          int r_v0 = R_V_tab[ v_ptr[0] ];                                                         \
361                  y_src += (height - 1) * y_stride;          WRITE_RGB16(0, 0, C1)                                                                           \
362                  y_src2 = y_src - y_stride;          WRITE_RGB16(1, 0, C1)
363                  u_src += (height / 2 - 1) * uv_stride;  
364                  v_src += (height / 2 - 1) * uv_stride;  #define YV12_TO_RGB16I_ROW(SIZE,C1,C2,C3,C4) \
365                  y_dif = -width - 2 * y_stride;          int r[4], g[4], b[4];                                   \
366                  uv_stride = -uv_stride;          r[0] = r[1] = r[2] = r[3] = 0;                  \
367          }          g[0] = g[1] = g[2] = g[3] = 0;                  \
368            b[0] = b[1] = b[2] = b[3] = 0;
369          for (y = height / 2; y; y--) {  #define YV12_TO_RGB16I(SIZE,C1,C2,C3,C4)                \
370                  int r, g, b;          int rgb_y;                                                                                                      \
371                  int r2, g2, b2;          int b_u0 = B_U_tab[ u_ptr[0] ];                                                         \
372            int g_uv0 = G_U_tab[ u_ptr[0] ] + G_V_tab[ v_ptr[0] ];          \
373                  r = g = b = 0;          int r_v0 = R_V_tab[ v_ptr[0] ];                                                         \
374                  r2 = g2 = b2 = 0;      int b_u1 = B_U_tab[ u_ptr[uv_stride] ];                                             \
375            int g_uv1 = G_U_tab[ u_ptr[uv_stride] ] + G_V_tab[ v_ptr[uv_stride] ];  \
376                  // process one 2x2 block per iteration          int r_v1 = R_V_tab[ v_ptr[uv_stride] ];                                         \
377                  for (x = 0; x < (uint32_t) width / 2; x++) {      WRITE_RGB16(0, 0, C1)                                                                               \
378                          int u, v;          WRITE_RGB16(1, 1, C1)                                                                           \
379                          int b_u, g_uv, r_v, rgb_y;      WRITE_RGB16(2, 0, C1)                                                                               \
380            WRITE_RGB16(3, 1, C1)                                                                           \
381                          u = u_src[x];  
382                          v = v_src[x];  
383    /* rgb/rgbi output */
384                          b_u = B_U_tab[u];  
385                          g_uv = G_U_tab[u] + G_V_tab[v];  #define WRITE_RGB(SIZE,ROW,UV_ROW,C1,C2,C3,C4)  \
386                          r_v = R_V_tab[v];          rgb_y = RGB_Y_tab[ y_ptr[(ROW)*y_stride + 0] ];                                         \
387            x_ptr[(ROW)*x_stride+(C3)] = MAX(0, MIN(255, (rgb_y + b_u##UV_ROW) >> SCALEBITS_OUT));  \
388                          rgb_y = RGB_Y_tab[*y_src];          x_ptr[(ROW)*x_stride+(C2)] = MAX(0, MIN(255, (rgb_y - g_uv##UV_ROW) >> SCALEBITS_OUT)); \
389                          b = (b & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);          x_ptr[(ROW)*x_stride+(C1)] = MAX(0, MIN(255, (rgb_y + r_v##UV_ROW) >> SCALEBITS_OUT));  \
390                          g = (g & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);          if ((SIZE)>3) x_ptr[(ROW)*x_stride+(C4)] = 0;                                                                   \
391                          r = (r & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);          rgb_y = RGB_Y_tab[ y_ptr[(ROW)*y_stride + 1] ];                                                                 \
392                          *(uint16_t *) dst = MK_RGB565(r, g, b);          x_ptr[(ROW)*x_stride+(SIZE)+(C3)] = MAX(0, MIN(255, (rgb_y + b_u##UV_ROW) >> SCALEBITS_OUT));   \
393            x_ptr[(ROW)*x_stride+(SIZE)+(C2)] = MAX(0, MIN(255, (rgb_y - g_uv##UV_ROW) >> SCALEBITS_OUT));  \
394                          y_src++;          x_ptr[(ROW)*x_stride+(SIZE)+(C1)] = MAX(0, MIN(255, (rgb_y + r_v##UV_ROW) >> SCALEBITS_OUT));   \
395                          rgb_y = RGB_Y_tab[*y_src];          if ((SIZE)>3) x_ptr[(ROW)*x_stride+(SIZE)+(C4)] = 0;
396                          b = (b & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);  
397                          g = (g & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);  
398                          r = (r & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);  #define YV12_TO_RGB_ROW(SIZE,C1,C2,C3,C4)       /* nothing */
399                          *(uint16_t *) (dst + 2) = MK_RGB565(r, g, b);  #define YV12_TO_RGB(SIZE,C1,C2,C3,C4)                           \
400                          y_src++;          int rgb_y;                                                                                              \
401            int b_u0 = B_U_tab[ u_ptr[0] ];                                                 \
402                          rgb_y = RGB_Y_tab[*y_src2];          int g_uv0 = G_U_tab[ u_ptr[0] ] + G_V_tab[ v_ptr[0] ];  \
403                          b2 = (b2 & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);          int r_v0 = R_V_tab[ v_ptr[0] ];                                                 \
404                          g2 = (g2 & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);          WRITE_RGB(SIZE, 0, 0, C1,C2,C3,C4)                                              \
405                          r2 = (r2 & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);          WRITE_RGB(SIZE, 1, 0, C1,C2,C3,C4)
406                          *(uint16_t *) (dst2) = MK_RGB565(r2, g2, b2);  
407                          y_src2++;  #define YV12_TO_RGBI_ROW(SIZE,C1,C2,C3,C4)      /* nothing */
408    #define YV12_TO_RGBI(SIZE,C1,C2,C3,C4)                          \
409                          rgb_y = RGB_Y_tab[*y_src2];          int rgb_y;                                                                                              \
410                          b2 = (b2 & 0x7) + ((rgb_y + b_u) >> SCALEBITS_OUT);          int b_u0 = B_U_tab[ u_ptr[0] ];                                                 \
411                          g2 = (g2 & 0x7) + ((rgb_y - g_uv) >> SCALEBITS_OUT);          int g_uv0 = G_U_tab[ u_ptr[0] ] + G_V_tab[ v_ptr[0] ];  \
412                          r2 = (r2 & 0x7) + ((rgb_y + r_v) >> SCALEBITS_OUT);          int r_v0 = R_V_tab[ v_ptr[0] ];                                                 \
413                          *(uint16_t *) (dst2 + 2) = MK_RGB565(r2, g2, b2);      int b_u1 = B_U_tab[ u_ptr[uv_stride] ];                                     \
414                          y_src2++;          int g_uv1 = G_U_tab[ u_ptr[uv_stride] ] + G_V_tab[ v_ptr[uv_stride] ];  \
415            int r_v1 = R_V_tab[ v_ptr[uv_stride] ];                                 \
416                          dst += 4;          WRITE_RGB(SIZE, 0, 0, C1,C2,C3,C4)              \
417                          dst2 += 4;          WRITE_RGB(SIZE, 1, 1, C1,C2,C3,C4)              \
418                  }          WRITE_RGB(SIZE, 2, 0, C1,C2,C3,C4)              \
419            WRITE_RGB(SIZE, 3, 1, C1,C2,C3,C4)
420                  dst += dst_dif;  
421                  dst2 += dst_dif;  
422    /* yuyv/yuyvi output */
423                  y_src += y_dif;  
424                  y_src2 += y_dif;  #define WRITE_YUYV(ROW,UV_ROW,C1,C2,C3,C4)      \
425            x_ptr[(ROW)*x_stride+(C1)] = y_ptr[   (ROW)*y_stride +0];       \
426                  u_src += uv_stride;          x_ptr[(ROW)*x_stride+(C2)] = u_ptr[(UV_ROW)*uv_stride+0];       \
427                  v_src += uv_stride;          x_ptr[(ROW)*x_stride+(C3)] = y_ptr[   (ROW)*y_stride +1];       \
428          }          x_ptr[(ROW)*x_stride+(C4)] = v_ptr[(UV_ROW)*uv_stride+0];       \
429  }  
430    #define YV12_TO_YUYV_ROW(SIZE,C1,C2,C3,C4)      /* nothing */
431    #define YV12_TO_YUYV(SIZE,C1,C2,C3,C4)  \
432            WRITE_YUYV(0, 0, C1,C2,C3,C4)           \
433  /* yuv 4:2:0 planar -> rgb24 */          WRITE_YUYV(1, 0, C1,C2,C3,C4)
434    
435  void  #define YV12_TO_YUYVI_ROW(SIZE,C1,C2,C3,C4) /* nothing */
436  yv12_to_rgb24_c(uint8_t * dst,  #define YV12_TO_YUYVI(SIZE,C1,C2,C3,C4) \
437                                  int dst_stride,          WRITE_YUYV(0, 0, C1,C2,C3,C4)           \
438                                  uint8_t * y_src,          WRITE_YUYV(1, 1, C1,C2,C3,C4)           \
439                                  uint8_t * u_src,          WRITE_YUYV(2, 0, C1,C2,C3,C4)           \
440                                  uint8_t * v_src,          WRITE_YUYV(3, 1, C1,C2,C3,C4)
441                                  int y_stride,  
442                                  int uv_stride,  
443                                  int width,  MAKE_COLORSPACE(yv12_to_rgb555_c,  2,2,2, YV12_TO_RGB16,  MK_RGB555, 0,0,0)
444                                  int height)  MAKE_COLORSPACE(yv12_to_rgb565_c,  2,2,2, YV12_TO_RGB16,  MK_RGB565, 0,0,0)
445  {  MAKE_COLORSPACE(yv12_to_bgr_c,     3,2,2, YV12_TO_RGB,    2,1,0, 0)
446          const uint32_t dst_dif = 6 * dst_stride - 3 * width;  MAKE_COLORSPACE(yv12_to_bgra_c,    4,2,2, YV12_TO_RGB,    2,1,0,3)
447          int32_t y_dif = 2 * y_stride - width;  MAKE_COLORSPACE(yv12_to_abgr_c,    4,2,2, YV12_TO_RGB,    3,2,1,0)
448    MAKE_COLORSPACE(yv12_to_rgba_c,    4,2,2, YV12_TO_RGB,    0,1,2,3)
449          uint8_t *dst2 = dst + 3 * dst_stride;  MAKE_COLORSPACE(yv12_to_argb_c,    4,2,2, YV12_TO_RGB,    1,2,3,0)
450          uint8_t *y_src2 = y_src + y_stride;  MAKE_COLORSPACE(yv12_to_yuyv_c,    2,2,2, YV12_TO_YUYV,   0,1,2,3)
451          uint32_t x, y;  MAKE_COLORSPACE(yv12_to_uyvy_c,    2,2,2, YV12_TO_YUYV,   1,0,3,2)
452    
453          if (height < 0) {                       // flip image?  MAKE_COLORSPACE(yv12_to_rgb555i_c, 2,2,4, YV12_TO_RGB16I, MK_RGB555, 0,0,0)
454                  height = -height;  MAKE_COLORSPACE(yv12_to_rgb565i_c, 2,2,4, YV12_TO_RGB16I, MK_RGB565, 0,0,0)
455                  y_src += (height - 1) * y_stride;  MAKE_COLORSPACE(yv12_to_bgri_c,    3,2,4, YV12_TO_RGBI,   2,1,0, 0)
456                  y_src2 = y_src - y_stride;  MAKE_COLORSPACE(yv12_to_bgrai_c,   4,2,4, YV12_TO_RGBI,   2,1,0,3)
457                  u_src += (height / 2 - 1) * uv_stride;  MAKE_COLORSPACE(yv12_to_abgri_c,   4,2,4, YV12_TO_RGBI,   3,2,1,0)
458                  v_src += (height / 2 - 1) * uv_stride;  MAKE_COLORSPACE(yv12_to_rgbai_c,   4,2,4, YV12_TO_RGBI,   0,1,2,3)
459                  y_dif = -width - 2 * y_stride;  MAKE_COLORSPACE(yv12_to_argbi_c,   4,2,4, YV12_TO_RGBI,   1,2,3,0)
460                  uv_stride = -uv_stride;  MAKE_COLORSPACE(yv12_to_yuyvi_c,   2,2,4, YV12_TO_YUYVI,  0,1,2,3)
461          }  MAKE_COLORSPACE(yv12_to_uyvyi_c,   2,2,4, YV12_TO_YUYVI,  1,0,3,2)
462    
463          for (y = height / 2; y; y--) {  
464                  // process one 2x2 block per iteration  
465                  for (x = 0; x < (uint32_t) width / 2; x++) {  /* yv12 to yv12 copy function */
466                          int u, v;  
467                          int b_u, g_uv, r_v, rgb_y;  void
468                          int r, g, b;  yv12_to_yv12_c(uint8_t * y_dst, uint8_t * u_dst, uint8_t * v_dst,
469                                    int y_dst_stride, int uv_dst_stride,
470                          u = u_src[x];                                  uint8_t * y_src, uint8_t * u_src, uint8_t * v_src,
471                          v = v_src[x];                                  int y_src_stride, int uv_src_stride,
472                                    int width, int height, int vflip)
473                          b_u = B_U_tab[u];  {
474                          g_uv = G_U_tab[u] + G_V_tab[v];          int width2 = width / 2;
475                          r_v = R_V_tab[v];          int height2 = height / 2;
476            int y;
477                          rgb_y = RGB_Y_tab[*y_src];  
478                          b = (rgb_y + b_u) >> SCALEBITS_OUT;          if (vflip) {
479                          g = (rgb_y - g_uv) >> SCALEBITS_OUT;                  y_src += (height - 1) * y_src_stride;
480                          r = (rgb_y + r_v) >> SCALEBITS_OUT;                  u_src += (height2 - 1) * uv_src_stride;
481                          dst[0] = MAX(0, MIN(255, b));                  v_src += (height2 - 1) * uv_src_stride;
482                          dst[1] = MAX(0, MIN(255, g));                  y_src_stride = -y_src_stride;
483                          dst[2] = MAX(0, MIN(255, r));                  uv_src_stride = -uv_src_stride;
   
                         y_src++;  
                         rgb_y = RGB_Y_tab[*y_src];  
                         b = (rgb_y + b_u) >> SCALEBITS_OUT;  
                         g = (rgb_y - g_uv) >> SCALEBITS_OUT;  
                         r = (rgb_y + r_v) >> SCALEBITS_OUT;  
                         dst[3] = MAX(0, MIN(255, b));  
                         dst[4] = MAX(0, MIN(255, g));  
                         dst[5] = MAX(0, MIN(255, r));  
                         y_src++;  
   
                         rgb_y = RGB_Y_tab[*y_src2];  
                         b = (rgb_y + b_u) >> SCALEBITS_OUT;  
                         g = (rgb_y - g_uv) >> SCALEBITS_OUT;  
                         r = (rgb_y + r_v) >> SCALEBITS_OUT;  
                         dst2[0] = MAX(0, MIN(255, b));  
                         dst2[1] = MAX(0, MIN(255, g));  
                         dst2[2] = MAX(0, MIN(255, r));  
                         y_src2++;  
   
                         rgb_y = RGB_Y_tab[*y_src2];  
                         b = (rgb_y + b_u) >> SCALEBITS_OUT;  
                         g = (rgb_y - g_uv) >> SCALEBITS_OUT;  
                         r = (rgb_y + r_v) >> SCALEBITS_OUT;  
                         dst2[3] = MAX(0, MIN(255, b));  
                         dst2[4] = MAX(0, MIN(255, g));  
                         dst2[5] = MAX(0, MIN(255, r));  
                         y_src2++;  
   
                         dst += 6;  
                         dst2 += 6;  
                 }  
   
                 dst += dst_dif;  
                 dst2 += dst_dif;  
   
                 y_src += y_dif;  
                 y_src2 += y_dif;  
   
                 u_src += uv_stride;  
                 v_src += uv_stride;  
         }  
 }  
   
   
   
 /* yuv 4:2:0 planar -> rgb32 */  
   
 void  
 yv12_to_rgb32_c(uint8_t * dst,  
                                 int dst_stride,  
                                 uint8_t * y_src,  
                                 uint8_t * v_src,  
                                 uint8_t * u_src,  
                                 int y_stride,  
                                 int uv_stride,  
                                 int width,  
                                 int height)  
 {  
         const uint32_t dst_dif = 8 * dst_stride - 4 * width;  
         int32_t y_dif = 2 * y_stride - width;  
   
         uint8_t *dst2 = dst + 4 * dst_stride;  
         uint8_t *y_src2 = y_src + y_stride;  
         uint32_t x, y;  
   
         if (height < 0) {                       // flip image?  
                 height = -height;  
                 y_src += (height - 1) * y_stride;  
                 y_src2 = y_src - y_stride;  
                 u_src += (height / 2 - 1) * uv_stride;  
                 v_src += (height / 2 - 1) * uv_stride;  
                 y_dif = -width - 2 * y_stride;  
                 uv_stride = -uv_stride;  
         }  
   
         for (y = height / 2; y; y--) {  
                 // process one 2x2 block per iteration  
                 for (x = 0; x < (uint32_t) width / 2; x++) {  
                         int u, v;  
                         int b_u, g_uv, r_v, rgb_y;  
                         int r, g, b;  
   
                         u = u_src[x];  
                         v = v_src[x];  
   
                         b_u = B_U_tab[u];  
                         g_uv = G_U_tab[u] + G_V_tab[v];  
                         r_v = R_V_tab[v];  
   
                         rgb_y = RGB_Y_tab[*y_src];  
                         b = (rgb_y + b_u) >> SCALEBITS_OUT;  
                         g = (rgb_y - g_uv) >> SCALEBITS_OUT;  
                         r = (rgb_y + r_v) >> SCALEBITS_OUT;  
                         dst[0] = MAX(0, MIN(255, r));  
                         dst[1] = MAX(0, MIN(255, g));  
                         dst[2] = MAX(0, MIN(255, b));  
                         dst[3] = 0;  
   
                         y_src++;  
                         rgb_y = RGB_Y_tab[*y_src];  
                         b = (rgb_y + b_u) >> SCALEBITS_OUT;  
                         g = (rgb_y - g_uv) >> SCALEBITS_OUT;  
                         r = (rgb_y + r_v) >> SCALEBITS_OUT;  
                         dst[4] = MAX(0, MIN(255, r));  
                         dst[5] = MAX(0, MIN(255, g));  
                         dst[6] = MAX(0, MIN(255, b));  
                         dst[7] = 0;  
                         y_src++;  
   
                         rgb_y = RGB_Y_tab[*y_src2];  
                         b = (rgb_y + b_u) >> SCALEBITS_OUT;  
                         g = (rgb_y - g_uv) >> SCALEBITS_OUT;  
                         r = (rgb_y + r_v) >> SCALEBITS_OUT;  
                         dst2[0] = MAX(0, MIN(255, r));  
                         dst2[1] = MAX(0, MIN(255, g));  
                         dst2[2] = MAX(0, MIN(255, b));  
                         dst2[3] = 0;  
                         y_src2++;  
   
                         rgb_y = RGB_Y_tab[*y_src2];  
                         b = (rgb_y + b_u) >> SCALEBITS_OUT;  
                         g = (rgb_y - g_uv) >> SCALEBITS_OUT;  
                         r = (rgb_y + r_v) >> SCALEBITS_OUT;  
                         dst2[4] = MAX(0, MIN(255, r));  
                         dst2[5] = MAX(0, MIN(255, g));  
                         dst2[6] = MAX(0, MIN(255, b));  
                         dst2[7] = 0;  
                         y_src2++;  
   
                         dst += 8;  
                         dst2 += 8;  
                 }  
   
                 dst += dst_dif;  
                 dst2 += dst_dif;  
   
                 y_src += y_dif;  
                 y_src2 += y_dif;  
   
                 u_src += uv_stride;  
                 v_src += uv_stride;  
         }  
 }  
   
   
   
 /*      yuv 4:2:0 planar -> yuv planar */  
   
 void  
 yv12_to_yuv_c(uint8_t * dst,  
                           int dst_stride,  
                           uint8_t * y_src,  
                           uint8_t * u_src,  
                           uint8_t * v_src,  
                           int y_stride,  
                           int uv_stride,  
                           int width,  
                           int height)  
 {  
         uint32_t dst_stride2 = dst_stride >> 1;  
         uint32_t width2 = width >> 1;  
         uint32_t y;  
   
         if (height < 0) {  
                 height = -height;  
                 y_src += (height - 1) * y_stride;  
                 u_src += (height / 2 - 1) * uv_stride;  
                 v_src += (height / 2 - 1) * uv_stride;  
                 y_stride = -y_stride;  
                 uv_stride = -uv_stride;  
484          }          }
485    
486          for (y = height; y; y--) {          for (y = height; y; y--) {
487                  memcpy(dst, y_src, width);                  memcpy(y_dst, y_src, width);
488                  dst += dst_stride;                  y_src += y_src_stride;
489                  y_src += y_stride;                  y_dst += y_dst_stride;
490          }          }
491    
492          for (y = height >> 1; y; y--) {          for (y = height2; y; y--) {
493                  memcpy(dst, u_src, width2);                  memcpy(u_dst, u_src, width2);
494                  dst += dst_stride2;                  u_src += uv_src_stride;
495                  u_src += uv_stride;                  u_dst += uv_dst_stride;
496          }          }
497    
498          for (y = height >> 1; y; y--) {          for (y = height2; y; y--) {
499                  memcpy(dst, v_src, width2);                  memcpy(v_dst, v_src, width2);
500                  dst += dst_stride2;                  v_src += uv_src_stride;
501                  v_src += uv_stride;                  v_dst += uv_dst_stride;
502          }          }
503  }  }
504    
505    
506    
507    /* initialize rgb lookup tables */
 /* yuv 4:2:0 planar -> yuyv (yuv2) packed */  
   
 void  
 yv12_to_yuyv_c(uint8_t * dst,  
                            int dst_stride,  
                            uint8_t * y_src,  
                            uint8_t * u_src,  
                            uint8_t * v_src,  
                            int y_stride,  
                            int uv_stride,  
                            int width,  
                            int height)  
 {  
         const uint32_t dst_dif = 2 * (dst_stride - width);  
         uint32_t x, y;  
   
         if (height < 0) {  
                 height = -height;  
                 y_src += (height - 1) * y_stride;  
                 u_src += (height / 2 - 1) * uv_stride;  
                 v_src += (height / 2 - 1) * uv_stride;  
                 y_stride = -y_stride;  
                 uv_stride = -uv_stride;  
         }  
   
         for (y = 0; y < (uint32_t) height; y++) {  
                 for (x = 0; x < (uint32_t) width / 2; x++) {  
                         dst[0] = y_src[2 * x];  
                         dst[1] = u_src[x];  
                         dst[2] = y_src[2 * x + 1];  
                         dst[3] = v_src[x];  
                         dst += 4;  
                 }  
                 dst += dst_dif;  
                 y_src += y_stride;  
                 if (y & 1) {  
                         u_src += uv_stride;  
                         v_src += uv_stride;  
                 }  
         }  
 }  
   
   
   
 /* yuv 4:2:0 planar -> uyvy packed */  
   
 void  
 yv12_to_uyvy_c(uint8_t * dst,  
                            int dst_stride,  
                            uint8_t * y_src,  
                            uint8_t * u_src,  
                            uint8_t * v_src,  
                            int y_stride,  
                            int uv_stride,  
                            int width,  
                            int height)  
 {  
         const uint32_t dst_dif = 2 * (dst_stride - width);  
         uint32_t x, y;  
   
         if (height < 0) {  
                 height = -height;  
                 y_src += (height - 1) * y_stride;  
                 u_src += (height / 2 - 1) * uv_stride;  
                 v_src += (height / 2 - 1) * uv_stride;  
                 y_stride = -y_stride;  
                 uv_stride = -uv_stride;  
         }  
   
         for (y = 0; y < (uint32_t) height; y++) {  
                 for (x = 0; x < (uint32_t) width / 2; x++) {  
                         dst[0] = u_src[x];  
                         dst[1] = y_src[2 * x];  
                         dst[2] = v_src[x];  
                         dst[3] = y_src[2 * x + 1];  
                         dst += 4;  
                 }  
                 dst += dst_dif;  
                 y_src += y_stride;  
                 if (y & 1) {  
                         u_src += uv_stride;  
                         v_src += uv_stride;  
                 }  
         }  
 }  
   
   
 /*      user yuv planar -> yuv 4:2:0 planar  
   
         NOTE: does not flip */  
508    
509  void  void
510  user_to_yuv_c(uint8_t * y_out,  colorspace_init(void)
                           uint8_t * u_out,  
                           uint8_t * v_out,  
                           int stride,  
                           DEC_PICTURE * picture,  
                           int width,  
                           int height)  
511  {  {
512          uint32_t stride2 = stride >> 1;          int32_t i;
         uint32_t width2 = width >> 1;  
         uint32_t y;  
         uint8_t *src;  
   
         src = picture->y;  
         for (y = height; y; y--) {  
                 memcpy(y_out, src, width);  
                 src += picture->stride_y;  
                 y_out += stride;  
         }  
   
         src = picture->u;  
         for (y = height >> 1; y; y--) {  
                 memcpy(u_out, src, width2);  
                 src += picture->stride_uv;  
                 u_out += stride2;  
         }  
513    
514          src = picture->v;          for (i = 0; i < 256; i++) {
515          for (y = height >> 1; y; y--) {                  RGB_Y_tab[i] = FIX_OUT(RGB_Y_OUT) * (i - Y_ADD_OUT);
516                  memcpy(v_out, src, width2);                  B_U_tab[i] = FIX_OUT(B_U_OUT) * (i - U_ADD_OUT);
517                  src += picture->stride_uv;                  G_U_tab[i] = FIX_OUT(G_U_OUT) * (i - U_ADD_OUT);
518                  v_out += stride2;                  G_V_tab[i] = FIX_OUT(G_V_OUT) * (i - V_ADD_OUT);
519                    R_V_tab[i] = FIX_OUT(R_V_OUT) * (i - V_ADD_OUT);
520          }          }
521  }  }

Legend:
Removed from v.433  
changed lines
  Added in v.1382

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4