[svn] / trunk / xvidcore / src / bitstream / x86_asm / cbp_mmx.asm Repository:
ViewVC logotype

Annotation of /trunk/xvidcore/src/bitstream/x86_asm/cbp_mmx.asm

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1629 - (view) (download)

1 : edgomez 1382 ;/****************************************************************************
2 : Isibaar 3 ; *
3 : edgomez 1382 ; * XVID MPEG-4 VIDEO CODEC
4 :     ; * - MMX CBP computation -
5 : Isibaar 3 ; *
6 : Skal 1629 ; * Copyright (C) 2005 Carlo Bramini <carlo.bramix@libero.it>
7 :     ; * 2001-2003 Peter Ross <pross@xvid.org>
8 : edgomez 1382 ; * 2002-2003 Pascal Massimino <skal@planet-d.net>
9 : Isibaar 3 ; *
10 : edgomez 1382 ; * This program is free software ; you can redistribute it and/or modify
11 :     ; * it under the terms of the GNU General Public License as published by
12 :     ; * the Free Software Foundation ; either version 2 of the License, or
13 :     ; * (at your option) any later version.
14 : Isibaar 3 ; *
15 : edgomez 1382 ; * This program is distributed in the hope that it will be useful,
16 :     ; * but WITHOUT ANY WARRANTY ; without even the implied warranty of
17 :     ; * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
18 :     ; * GNU General Public License for more details.
19 : Isibaar 3 ; *
20 : edgomez 1382 ; * You should have received a copy of the GNU General Public License
21 :     ; * along with this program ; if not, write to the Free Software
22 :     ; * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
23 : Isibaar 3 ; *
24 : Skal 1629 ; * $Id: cbp_mmx.asm,v 1.13 2005-08-05 20:49:23 Skal Exp $
25 : Isibaar 3 ; *
26 : edgomez 1382 ; ***************************************************************************/
27 : Isibaar 3
28 : edgomez 1382 BITS 32
29 : edgomez 851
30 : edgomez 1382 ;=============================================================================
31 :     ; Macros
32 :     ;=============================================================================
33 : Isibaar 3
34 :     %macro cglobal 1
35 : Isibaar 262 %ifdef PREFIX
36 : edgomez 1535 %ifdef MARK_FUNCS
37 : edgomez 1540 global _%1:function %1.endfunc-%1
38 :     %define %1 _%1:function %1.endfunc-%1
39 : edgomez 1535 %else
40 :     global _%1
41 :     %define %1 _%1
42 :     %endif
43 : Isibaar 262 %else
44 : edgomez 1535 %ifdef MARK_FUNCS
45 : edgomez 1540 global %1:function %1.endfunc-%1
46 : edgomez 1535 %else
47 :     global %1
48 :     %endif
49 : Isibaar 262 %endif
50 : Isibaar 3 %endmacro
51 :    
52 : edgomez 1382 ;=============================================================================
53 :     ; Local data
54 :     ;=============================================================================
55 : Isibaar 3
56 : edgomez 1382 %ifdef FORMAT_COFF
57 : edgomez 1519 SECTION .rodata
58 : edgomez 1382 %else
59 : edgomez 1519 SECTION .rodata align=16
60 : edgomez 1382 %endif
61 : Isibaar 3
62 : edgomez 1382 ALIGN 16
63 : Isibaar 3
64 : Skal 1629 mult_mask:
65 :     db 0x10,0x20,0x04,0x08,0x01,0x02,0x00,0x00
66 : edgomez 1382 ignore_dc:
67 : Skal 1629 dw 0, -1, -1, -1
68 : edgomez 1382
69 :     ;=============================================================================
70 :     ; Code
71 :     ;=============================================================================
72 :    
73 :     SECTION .text
74 :    
75 : Isibaar 262 cglobal calc_cbp_mmx
76 : Isibaar 3
77 : edgomez 1382 ;-----------------------------------------------------------------------------
78 : Isibaar 3 ; uint32_t calc_cbp_mmx(const int16_t coeff[6][64]);
79 : edgomez 1382 ;-----------------------------------------------------------------------------
80 : Isibaar 3
81 : Skal 1629 %macro MAKE_LOAD 1
82 :     por mm0, [eax-128*1+%1*8]
83 :     por mm1, [eax+128*0+%1*8]
84 :     por mm2, [eax+128*1+%1*8]
85 :     por mm3, [eax+128*2+%1*8]
86 :     por mm4, [eax+128*3+%1*8]
87 :     por mm5, [eax+128*4+%1*8]
88 :     %endmacro
89 :    
90 : edgomez 1382 ALIGN 16
91 : Isibaar 262 calc_cbp_mmx:
92 : Skal 1629 mov eax, [esp + 4] ; coeff
93 : Isibaar 3
94 : edgomez 1382 movq mm7, [ignore_dc]
95 : Skal 1629 pxor mm6, mm6 ; used only for comparing
96 :     movq mm0, [eax+128*0]
97 :     movq mm1, [eax+128*1]
98 :     movq mm2, [eax+128*2]
99 :     movq mm3, [eax+128*3]
100 :     movq mm4, [eax+128*4]
101 :     movq mm5, [eax+128*5]
102 :     add eax, 8+128
103 : edgomez 1382 pand mm0, mm7
104 : Skal 1629 pand mm1, mm7
105 :     pand mm2, mm7
106 :     pand mm3, mm7
107 :     pand mm4, mm7
108 :     pand mm5, mm7
109 : Isibaar 3
110 : Skal 1629 MAKE_LOAD 0
111 :     MAKE_LOAD 1
112 :     MAKE_LOAD 2
113 :     MAKE_LOAD 3
114 :     MAKE_LOAD 4
115 :     MAKE_LOAD 5
116 :     MAKE_LOAD 6
117 :     MAKE_LOAD 7
118 :     MAKE_LOAD 8
119 :     MAKE_LOAD 9
120 :     MAKE_LOAD 10
121 :     MAKE_LOAD 11
122 :     MAKE_LOAD 12
123 :     MAKE_LOAD 13
124 :     MAKE_LOAD 14
125 : Isibaar 3
126 : Skal 1629 movq mm7, [mult_mask]
127 :     packssdw mm0, mm1
128 :     packssdw mm2, mm3
129 :     packssdw mm4, mm5
130 :     packssdw mm0, mm2
131 :     packssdw mm4, mm6
132 :     pcmpgtw mm0, mm6
133 :     pcmpgtw mm4, mm6
134 :     psrlw mm0, 15
135 :     psrlw mm4, 15
136 :     packuswb mm0, mm4
137 :     pmaddwd mm0, mm7
138 : Isibaar 3
139 : edgomez 1382 movq mm1, mm0
140 :     psrlq mm1, 32
141 : Skal 1629 paddusb mm0, mm1
142 : Isibaar 3
143 : Skal 1629 movd eax, mm0
144 :     shr eax, 8
145 :     and eax, 0x3F
146 : edgomez 1382 ret
147 : edgomez 1540 .endfunc
148 :    

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4