Diff of /trunk/xvidcore/src/image/x86_asm/interpolate8x8_mmx.asm

-revision 1794, Fri Nov 14 15:43:28 2008 UTC
+revision 1795, Wed Nov 26 01:04:34 2008 UTC
 Line 4
  ; *  - mmx 8x8 block-based halfpel interpolation -
  ; *
  ; *  Copyright(C) 2001 Peter Ross <pross@xvid.org>
- ; *               2002 Michael Militzer <isibaar@xvid.org>
+ ; *               2002-2008 Michael Militzer <michael@xvid.org>
  ; *
  ; *  This program is free software ; you can redistribute it and/or modify
  ; *  it under the terms of the GNU General Public License as published by
 Line 22
  ; *
  ; ****************************************************************************/
- BITS 32
+ %include "nasm.inc"
- %macro cglobal 1
-         %ifdef PREFIX
-                 %ifdef MARK_FUNCS
-                         global _%1:function %1.endfunc-%1
-                         %define %1 _%1:function %1.endfunc-%1
-                         %define ENDFUNC .endfunc
-                 %else
-                         global _%1
-                         %define %1 _%1
-                         %define ENDFUNC
-                 %endif
-         %else
-                 %ifdef MARK_FUNCS
-                         global %1:function %1.endfunc-%1
-                         %define ENDFUNC .endfunc
-                 %else
-                         global %1
-                         %define ENDFUNC
-                 %endif
-         %endif
- %endmacro
  ;=============================================================================
  ; Read only data
  ;=============================================================================
- %ifdef FORMAT_COFF
+ DATA
- SECTION .rodata
- %else
- SECTION .rodata align=16
- %endif
  ;-----------------------------------------------------------------------------
  ; (16 - r) rounding table
  ;-----------------------------------------------------------------------------
- ALIGN 16
+ ALIGN SECTION_ALIGN
  rounding_lowpass_mmx:
          times 4 dw 16
          times 4 dw 15
-Line 103
+Line 77
  ; Code
  ;=============================================================================
- SECTION .text
+ SECTION .rotext align=SECTION_ALIGN
  cglobal interpolate8x8_halfpel_h_mmx
  cglobal interpolate8x8_halfpel_v_mmx
-Line 148
+Line 122
  ;-----------------------------------------------------------------------------
  %macro COPY_H_MMX 0
-   movq mm0, [esi]
+   movq mm0, [TMP0]
-   movq mm2, [esi + 1]
+   movq mm2, [TMP0 + 1]
    movq mm1, mm0
    movq mm3, mm2
-Line 159
+Line 133
    CALC_AVG mm0, mm1, mm2, mm3, mm7, mm6
    packuswb mm0, mm1
-   movq [edi], mm0           ; [dst] = mm01
+   movq [_EAX], mm0           ; [dst] = mm01
-   add esi, edx              ; src += stride
+   add TMP0, TMP1              ; src += stride
-   add edi, edx              ; dst += stride
+   add _EAX, TMP1              ; dst += stride
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_halfpel_h_mmx:
-   push esi
+   mov _EAX, prm4       ; rounding
-   push edi
+   lea TMP0, [rounding1_mmx]
-   mov eax, [esp + 8 + 16]       ; rounding
+   movq mm7, [TMP0 + _EAX * 8]
-   movq mm7, [rounding1_mmx + eax * 8]
+   mov _EAX, prm1        ; dst
+   mov TMP0, prm2        ; src
-   mov edi, [esp + 8 + 4]        ; dst
+   mov TMP1, prm3        ; stride
-   mov esi, [esp + 8 + 8]        ; src
-   mov edx, [esp + 8 + 12]       ; stride
    pxor mm6, mm6                 ; zero
-Line 189
+Line 161
    COPY_H_MMX
    COPY_H_MMX
-   pop edi
-   pop esi
    ret
  ENDFUNC
-Line 206
+Line 175
  ;-----------------------------------------------------------------------------
  %macro COPY_V_MMX 0
-   movq mm0, [esi]
+   movq mm0, [TMP0]
-   movq mm2, [esi + edx]
+   movq mm2, [TMP0 + TMP1]
    movq mm1, mm0
    movq mm3, mm2
-Line 217
+Line 186
    CALC_AVG mm0, mm1, mm2, mm3, mm7, mm6
    packuswb mm0, mm1
-   movq [edi], mm0       ; [dst] = mm01
+   movq [_EAX], mm0      ; [dst] = mm01
-   add esi, edx          ; src += stride
+   add TMP0, TMP1        ; src += stride
-   add edi, edx          ; dst += stride
+   add _EAX, TMP1        ; dst += stride
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_halfpel_v_mmx:
-   push esi
+   mov _EAX, prm4       ; rounding
-   push edi
+   lea TMP0, [rounding1_mmx]
+   movq mm7, [TMP0 + _EAX * 8]
-   mov eax, [esp + 8 + 16]       ; rounding
+   mov _EAX, prm1       ; dst
-   movq mm7, [rounding1_mmx + eax * 8]
+   mov TMP0, prm2       ; src
+   mov TMP1, prm3       ; stride
-   mov edi, [esp + 8 + 4]        ; dst
-   mov esi, [esp + 8 + 8]        ; src
-   mov edx, [esp + 8 + 12]       ; stride
    pxor mm6, mm6                 ; zero
-Line 249
+Line 215
    COPY_V_MMX
    COPY_V_MMX
-   pop edi
-   pop esi
    ret
  ENDFUNC
-Line 268
+Line 231
  %macro COPY_HV_MMX 0
      ; current row
-   movq mm0, [esi]
+   movq mm0, [TMP0]
-   movq mm2, [esi + 1]
+   movq mm2, [TMP0 + 1]
    movq mm1, mm0
    movq mm3, mm2
-Line 283
+Line 246
    paddusw mm1, mm3
      ; next row
-   movq mm4, [esi + edx]
+   movq mm4, [TMP0 + TMP1]
-   movq mm2, [esi + edx + 1]
+   movq mm2, [TMP0 + TMP1 + 1]
    movq mm5, mm4
    movq mm3, mm2
-Line 307
+Line 270
    psrlw mm1, 2
    packuswb mm0, mm1
-   movq [edi], mm0           ; [dst] = mm01
+   movq [_EAX], mm0           ; [dst] = mm01
-   add esi, edx              ; src += stride
+   add TMP0, TMP1             ; src += stride
-   add edi, edx              ; dst += stride
+   add _EAX, TMP1             ; dst += stride
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_halfpel_hv_mmx:
-   push esi
+   mov _EAX, prm4    ; rounding
-   push edi
+   lea TMP0, [rounding2_mmx]
+   movq mm7, [TMP0 + _EAX * 8]
-   mov eax, [esp + 8 + 16]   ; rounding
+   mov _EAX, prm1    ; dst
+   mov TMP0, prm2    ; src
-   movq mm7, [rounding2_mmx + eax * 8]
-   mov edi, [esp + 8 + 4]    ; dst
-   mov esi, [esp + 8 + 8]    ; src
-   mov eax, 8
    pxor mm6, mm6             ; zero
-   mov edx, [esp + 8 + 12]   ; stride
+   mov TMP1, prm3    ; stride
    COPY_HV_MMX
    COPY_HV_MMX
-Line 341
+Line 299
    COPY_HV_MMX
    COPY_HV_MMX
-   pop edi
-   pop esi
    ret
  ENDFUNC
-Line 356
+Line 311
  ;
  ;-----------------------------------------------------------------------------
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x4_halfpel_h_mmx:
-   push esi
+   mov _EAX, prm4        ; rounding
-   push edi
+   lea TMP0, [rounding1_mmx]
-   mov eax, [esp + 8 + 16]       ; rounding
+   movq mm7, [TMP0 + _EAX * 8]
-   movq mm7, [rounding1_mmx + eax * 8]
+   mov _EAX, prm1        ; dst
+   mov TMP0, prm2        ; src
-   mov edi, [esp + 8 + 4]        ; dst
+   mov TMP1, prm3        ; stride
-   mov esi, [esp + 8 + 8]        ; src
-   mov edx, [esp + 8 + 12]       ; stride
    pxor mm6, mm6                 ; zero
-Line 376
+Line 329
    COPY_H_MMX
    COPY_H_MMX
-   pop edi
-   pop esi
    ret
  ENDFUNC
-Line 392
+Line 342
  ;
  ;-----------------------------------------------------------------------------
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x4_halfpel_v_mmx:
-   push esi
+   mov _EAX, prm4       ; rounding
-   push edi
+   lea TMP0, [rounding1_mmx]
+   movq mm7, [TMP0 + _EAX * 8]
-   mov eax, [esp + 8 + 16]       ; rounding
+   mov _EAX, prm1       ; dst
-   movq mm7, [rounding1_mmx + eax * 8]
+   mov TMP0, prm2       ; src
+   mov TMP1, prm3       ; stride
-   mov edi, [esp + 8 + 4]        ; dst
-   mov esi, [esp + 8 + 8]        ; src
-   mov edx, [esp + 8 + 12]       ; stride
    pxor mm6, mm6                 ; zero
-Line 414
+Line 361
    COPY_V_MMX
    COPY_V_MMX
-   pop edi
-   pop esi
    ret
  ENDFUNC
-Line 431
+Line 375
  ;
  ;-----------------------------------------------------------------------------
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x4_halfpel_hv_mmx:
-   push esi
+   mov _EAX, prm4    ; rounding
-   push edi
+   lea TMP0, [rounding2_mmx]
+   movq mm7, [TMP0 + _EAX * 8]
-   mov eax, [esp + 8 + 16]   ; rounding
-   movq mm7, [rounding2_mmx + eax * 8]
+   mov _EAX, prm1    ; dst
+   mov TMP0, prm2    ; src
-   mov edi, [esp + 8 + 4]    ; dst
-   mov esi, [esp + 8 + 8]    ; src
-   mov eax, 8
    pxor mm6, mm6             ; zero
-   mov edx, [esp + 8 + 12]   ; stride
+   mov TMP1, prm3    ; stride
    COPY_HV_MMX
    COPY_HV_MMX
    COPY_HV_MMX
    COPY_HV_MMX
-   pop edi
-   pop esi
    ret
  ENDFUNC
-Line 473
+Line 409
  ;-----------------------------------------------------------------------------
  %macro AVG2_MMX_RND0 0
-   movq mm0, [eax]           ; src1 -> mm0
+   movq mm0, [_EAX]           ; src1 -> mm0
-   movq mm1, [ebx]           ; src2 -> mm1
+   movq mm1, [_EBX]           ; src2 -> mm1
-   movq mm4, [eax+edx]
+   movq mm4, [_EAX+TMP1]
-   movq mm5, [ebx+edx]
+   movq mm5, [_EBX+TMP1]
    movq mm2, mm0             ; src1 -> mm2
    movq mm3, mm1             ; src2 -> mm3
-Line 512
+Line 448
    paddb mm4, mm5
    paddb mm4, mm3
-   lea eax, [eax+2*edx]
+   lea _EAX, [_EAX+2*TMP1]
-   lea ebx, [ebx+2*edx]
+   lea _EBX, [_EBX+2*TMP1]
-   movq [ecx], mm0           ; (src1 + src2 + 1) / 2 -> dst
+   movq [TMP0], mm0           ; (src1 + src2 + 1) / 2 -> dst
-   movq [ecx+edx], mm4
+   movq [TMP0+TMP1], mm4
  %endmacro
  %macro AVG2_MMX_RND1 0
-   movq mm0, [eax]           ; src1 -> mm0
+   movq mm0, [_EAX]           ; src1 -> mm0
-   movq mm1, [ebx]           ; src2 -> mm1
+   movq mm1, [_EBX]           ; src2 -> mm1
-   movq mm4, [eax+edx]
+   movq mm4, [_EAX+TMP1]
-   movq mm5, [ebx+edx]
+   movq mm5, [_EBX+TMP1]
    movq mm2, mm0             ; src1 -> mm2
    movq mm3, mm1             ; src2 -> mm3
-Line 559
+Line 495
    paddb mm4, mm5
    paddb mm4, mm3
-   lea eax, [eax+2*edx]
+   lea _EAX, [_EAX+2*TMP1]
-   lea ebx, [ebx+2*edx]
+   lea _EBX, [_EBX+2*TMP1]
-   movq [ecx], mm0           ; (src1 + src2 + 1) / 2 -> dst
+   movq [TMP0], mm0           ; (src1 + src2 + 1) / 2 -> dst
-   movq [ecx+edx], mm4
+   movq [TMP0+TMP1], mm4
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_avg2_mmx:
-   push ebx
+   mov _EAX, prm5   ; rounding
+   test _EAX, _EAX
-   mov eax, [esp + 4 + 20]   ; rounding
-   test eax, eax
    jnz near .rounding1
-   mov eax, [esp + 4 + 24]   ; height -> eax
+   mov _EAX, prm6   ; height -> _EAX
-   sub eax, 8
+   sub _EAX, 8
-   test eax, eax
+   test _EAX, _EAX
-   mov ecx, [esp + 4 + 4]    ; dst -> edi
+   mov TMP0, prm1   ; dst -> edi
-   mov eax, [esp + 4 + 8]    ; src1 -> esi
+   mov _EAX, prm2   ; src1 -> esi
-   mov ebx, [esp + 4 + 12]   ; src2 -> eax
+   mov TMP1, prm4   ; stride -> TMP1
-   mov edx, [esp + 4 + 16]   ; stride -> edx
+   push _EBX
+ %ifdef ARCH_IS_X86_64
+   mov _EBX, prm3
+ %else
+   mov _EBX, [esp + 4 + 12]   ; src2 -> eax
+ %endif
    movq mm7, [mmx_one]
    jz near .start0
    AVG2_MMX_RND0
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
  .start0:
    AVG2_MMX_RND0
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
    AVG2_MMX_RND0
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
    AVG2_MMX_RND0
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
    AVG2_MMX_RND0
-   pop ebx
+   pop _EBX
    ret
  .rounding1:
-   mov eax, [esp + 4 + 24]       ; height -> eax
+   mov _EAX, prm6        ; height -> _EAX
-   sub eax, 8
+   sub _EAX, 8
-   test eax, eax
+   test _EAX, _EAX
-   mov ecx, [esp + 4 + 4]        ; dst -> edi
+   mov TMP0, prm1        ; dst -> edi
-   mov eax, [esp + 4 + 8]        ; src1 -> esi
+   mov _EAX, prm2        ; src1 -> esi
-   mov ebx, [esp + 4 + 12]       ; src2 -> eax
+   mov TMP1, prm4        ; stride -> TMP1
-   mov edx, [esp + 4 + 16]       ; stride -> edx
+   push _EBX
+ %ifdef ARCH_IS_X86_64
+   mov _EBX, prm3
+ %else
+   mov _EBX, [esp + 4 + 12]   ; src2 -> eax
+ %endif
    movq mm7, [mmx_one]
    jz near .start1
    AVG2_MMX_RND1
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
  .start1:
    AVG2_MMX_RND1
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
    AVG2_MMX_RND1
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
    AVG2_MMX_RND1
-   lea ecx, [ecx+2*edx]
+   lea TMP0, [TMP0+2*TMP1]
    AVG2_MMX_RND1
-   pop ebx
+   pop _EBX
    ret
  ENDFUNC
-Line 650
+Line 596
  ;-----------------------------------------------------------------------------
  %macro AVG4_MMX_RND0 0
-   movq mm0, [eax]           ; src1 -> mm0
+   movq mm0, [_EAX]           ; src1 -> mm0
-   movq mm1, [ebx]           ; src2 -> mm1
+   movq mm1, [_EBX]           ; src2 -> mm1
    movq mm2, mm0
    movq mm3, mm1
-Line 665
+Line 611
    psrlq mm0, 2
    psrlq mm1, 2
-   lea eax, [eax+edx]
+   lea _EAX, [_EAX+TMP1]
-   lea ebx, [ebx+edx]
+   lea _EBX, [_EBX+TMP1]
    paddb mm0, mm1
    paddb mm2, mm3
-   movq mm4, [esi]           ; src3 -> mm0
+   movq mm4, [_ESI]           ; src3 -> mm0
-   movq mm5, [edi]           ; src4 -> mm1
+   movq mm5, [_EDI]           ; src4 -> mm1
    movq mm1, mm4
    movq mm3, mm5
-Line 698
+Line 644
    psrlq mm2, 2
    paddb mm0, mm2
-   lea esi, [esi+edx]
+   lea _ESI, [_ESI+TMP1]
-   lea edi, [edi+edx]
+   lea _EDI, [_EDI+TMP1]
-   movq [ecx], mm0           ; (src1 + src2 + src3 + src4 + 2) / 4 -> dst
+   movq [TMP0], mm0           ; (src1 + src2 + src3 + src4 + 2) / 4 -> dst
  %endmacro
  %macro AVG4_MMX_RND1 0
-   movq mm0, [eax]           ; src1 -> mm0
+   movq mm0, [_EAX]           ; src1 -> mm0
-   movq mm1, [ebx]           ; src2 -> mm1
+   movq mm1, [_EBX]           ; src2 -> mm1
    movq mm2, mm0
    movq mm3, mm1
-Line 720
+Line 666
    psrlq mm0, 2
    psrlq mm1, 2
-   lea eax,[eax+edx]
+   lea _EAX,[_EAX+TMP1]
-   lea ebx,[ebx+edx]
+   lea _EBX,[_EBX+TMP1]
    paddb mm0, mm1
    paddb mm2, mm3
-   movq mm4, [esi]           ; src3 -> mm0
+   movq mm4, [_ESI]           ; src3 -> mm0
-   movq mm5, [edi]           ; src4 -> mm1
+   movq mm5, [_EDI]           ; src4 -> mm1
    movq mm1, mm4
    movq mm3, mm5
-Line 753
+Line 699
    psrlq mm2, 2
    paddb mm0, mm2
-   lea esi,[esi+edx]
+   lea _ESI,[_ESI+TMP1]
-   lea edi,[edi+edx]
+   lea _EDI,[_EDI+TMP1]
-   movq [ecx], mm0           ; (src1 + src2 + src3 + src4 + 2) / 4 -> dst
+   movq [TMP0], mm0           ; (src1 + src2 + src3 + src4 + 2) / 4 -> dst
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_avg4_mmx:
-   push ebx
+   mov _EAX, prm7      ; rounding
-   push edi
+   test _EAX, _EAX
-   push esi
+   mov TMP0, prm1      ; dst -> edi
-   mov eax, [esp + 12 + 28]      ; rounding
+   mov _EAX, prm5      ; src4 -> edi
+   mov TMP1, prm6      ; stride -> TMP1
-   test eax, eax
-   mov ecx, [esp + 12 + 4]       ; dst -> edi
+   push _EBX
-   mov eax, [esp + 12 + 8]       ; src1 -> esi
+   push _EDI
-   mov ebx, [esp + 12 + 12]      ; src2 -> eax
+   push _ESI
-   mov esi, [esp + 12 + 16]      ; src3 -> esi
-   mov edi, [esp + 12 + 20]      ; src4 -> edi
+   mov _EDI, _EAX
-   mov edx, [esp + 12 + 24]      ; stride -> edx
+ %ifdef ARCH_IS_X86_64
+   mov _EAX, prm2
+   mov _EBX, prm3
+   mov _ESI, prm4
+ %else
+   mov _EAX, [esp + 12 +  8]      ; src1 -> esi
+   mov _EBX, [esp + 12 + 12]      ; src2 -> _EAX
+   mov _ESI, [esp + 12 + 16]      ; src3 -> esi
+ %endif
    movq mm7, [mmx_one]
    jnz near .rounding1
    AVG4_MMX_RND0
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND0
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND0
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND0
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND0
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND0
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND0
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND0
-   pop esi
+   pop _ESI
-   pop edi
+   pop _EDI
-   pop ebx
+   pop _EBX
    ret
  .rounding1:
    AVG4_MMX_RND1
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND1
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND1
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND1
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND1
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND1
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND1
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    AVG4_MMX_RND1
-   pop esi
+   pop _ESI
-   pop edi
+   pop _EDI
-   pop ebx
+   pop _EBX
    ret
  ENDFUNC
-Line 836
+Line 791
  ;-----------------------------------------------------------------------------
  %macro LOWPASS_6TAP_H_MMX 0
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm2, [eax+1]
+   movq mm2, [_EAX+1]
    movq mm1, mm0
    movq mm3, mm2
-Line 854
+Line 809
    psllw mm0, 2
    psllw mm1, 2
-   movq mm2, [eax-1]
+   movq mm2, [_EAX-1]
-   movq mm4, [eax+2]
+   movq mm4, [_EAX+2]
    movq mm3, mm2
    movq mm5, mm4
-Line 875
+Line 830
    pmullw mm0, [mmx_five]
    pmullw mm1, [mmx_five]
-   movq mm2, [eax-2]
+   movq mm2, [_EAX-2]
-   movq mm4, [eax+3]
+   movq mm4, [_EAX+3]
    movq mm3, mm2
    movq mm5, mm4
-Line 899
+Line 854
    psraw mm0, 5
    psraw mm1, 5
-   lea eax, [eax+edx]
+   lea _EAX, [_EAX+TMP1]
    packuswb mm0, mm1
-   movq [ecx], mm0
+   movq [TMP0], mm0
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_6tap_lowpass_h_mmx:
-   mov eax, [esp + 16]           ; rounding
+   mov _EAX, prm4           ; rounding
-   movq mm6, [rounding_lowpass_mmx + eax * 8]
+   lea TMP0, [rounding_lowpass_mmx]
+   movq mm6, [TMP0 + _EAX * 8]
-   mov ecx, [esp + 4]            ; dst -> edi
+   mov TMP0, prm1           ; dst -> edi
-   mov eax, [esp + 8]            ; src -> esi
+   mov _EAX, prm2           ; src -> esi
-   mov edx, [esp + 12]           ; stride -> edx
+   mov TMP1, prm3           ; stride -> edx
    pxor mm7, mm7
    LOWPASS_6TAP_H_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_H_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_H_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_H_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_H_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_H_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_H_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_H_MMX
    ret
-Line 946
+Line 902
  ;-----------------------------------------------------------------------------
  %macro LOWPASS_6TAP_V_MMX 0
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm2, [eax+edx]
+   movq mm2, [_EAX+TMP1]
    movq mm1, mm0
    movq mm3, mm2
-Line 964
+Line 920
    psllw mm0, 2
    psllw mm1, 2
-   movq mm4, [eax+2*edx]
+   movq mm4, [_EAX+2*TMP1]
-   sub eax, ebx
+   sub _EAX, _EBX
-   movq mm2, [eax+2*edx]
+   movq mm2, [_EAX+2*TMP1]
    movq mm3, mm2
    movq mm5, mm4
-Line 986
+Line 942
    pmullw mm0, [mmx_five]
    pmullw mm1, [mmx_five]
-   movq mm2, [eax+edx]
+   movq mm2, [_EAX+TMP1]
-   movq mm4, [eax+2*ebx]
+   movq mm4, [_EAX+2*_EBX]
    movq mm3, mm2
    movq mm5, mm4
-Line 1010
+Line 966
    psraw mm0, 5
    psraw mm1, 5
-   lea eax, [eax+4*edx]
+   lea _EAX, [_EAX+4*TMP1]
    packuswb mm0, mm1
-   movq [ecx], mm0
+   movq [TMP0], mm0
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_6tap_lowpass_v_mmx:
-   push ebx
+   mov _EAX, prm4           ; rounding
-   mov eax, [esp + 4 + 16]           ; rounding
+   lea TMP0, [rounding_lowpass_mmx]
+   movq mm6, [TMP0 + _EAX * 8]
-   movq mm6, [rounding_lowpass_mmx + eax * 8]
+   mov TMP0, prm1           ; dst -> edi
+   mov _EAX, prm2           ; src -> esi
+   mov TMP1, prm3           ; stride -> edx
-   mov ecx, [esp + 4 + 4]            ; dst -> edi
+   push _EBX
-   mov eax, [esp + 4 + 8]            ; src -> esi
-   mov edx, [esp + 4 + 12]           ; stride -> edx
-   mov ebx, edx
+   mov _EBX, TMP1
-   shl ebx, 1
+   shl _EBX, 1
-   add ebx, edx
+   add _EBX, TMP1
    pxor mm7, mm7
    LOWPASS_6TAP_V_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_V_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_V_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_V_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_V_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_V_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_V_MMX
-   lea ecx, [ecx+edx]
+   lea TMP0, [TMP0+TMP1]
    LOWPASS_6TAP_V_MMX
-   pop ebx
+   pop _EBX
    ret
  ENDFUNC
-Line 1063
+Line 1020
  ;===========================================================================
  %macro PROLOG0 0
-   mov ecx, [esp+ 4] ; Dst
+   mov TMP0, prm1 ; Dst
-   mov eax, [esp+ 8] ; Src
+   mov _EAX, prm2 ; Src
-   mov edx, [esp+12] ; BpS
+   mov TMP1, prm3 ; BpS
  %endmacro
  %macro PROLOG 2   ; %1: Rounder, %2 load Dst-Rounder
-Line 1133
+Line 1090
  ;===========================================================================
  %macro ADD_FF_MMX 1
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm2, [ecx]
+   movq mm2, [TMP0]
    movq mm1, mm0
    movq mm3, mm2
  %if (%1!=0)
-   lea eax,[eax+%1*edx]
+   lea _EAX,[_EAX+%1*TMP1]
  %endif
    MIX
    paddusw mm0, mm5  ; rounder
-Line 1147
+Line 1104
    psrlw mm1, 1
    packuswb mm0, mm1
-   movq [ecx], mm0
+   movq [TMP0], mm0
  %if (%1!=0)
-   lea ecx,[ecx+%1*edx]
+   lea TMP0,[TMP0+%1*TMP1]
  %endif
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_halfpel_add_mmx:
    PROLOG rounding1_mmx, 1
    ADD_FF_MMX 1
-Line 1178
+Line 1135
  ;===========================================================================
  %macro ADD_FH_MMX 0
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm2, [eax+1]
+   movq mm2, [_EAX+1]
    movq mm1, mm0
    movq mm3, mm2
-   lea eax,[eax+edx]
+   lea _EAX,[_EAX+TMP1]
    MIX
-   movq mm2, [ecx]   ; prepare mix with Dst[0]
+   movq mm2, [TMP0]   ; prepare mix with Dst[0]
    MIX_DST
-   movq [ecx], mm0
+   movq [TMP0], mm0
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_halfpel_h_add_mmx:
    PROLOG rounding1_mmx, 1
    ADD_FH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_FH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_FH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_FH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_FH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_FH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_FH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_FH_MMX
    ret
  ENDFUNC
-Line 1224
+Line 1181
  ;===========================================================================
  %macro ADD_HF_MMX 0
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm2, [eax+edx]
+   movq mm2, [_EAX+TMP1]
    movq mm1, mm0
    movq mm3, mm2
-   lea eax,[eax+edx]
+   lea _EAX,[_EAX+TMP1]
    MIX
-   movq mm2, [ecx]   ; prepare mix with Dst[0]
+   movq mm2, [TMP0]   ; prepare mix with Dst[0]
    MIX_DST
-   movq [ecx], mm0
+   movq [TMP0], mm0
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_halfpel_v_add_mmx:
    PROLOG rounding1_mmx, 1
    ADD_HF_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HF_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HF_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HF_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HF_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HF_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HF_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HF_MMX
    ret
  ENDFUNC
-Line 1282
+Line 1239
  ;===========================================================================
  %macro ADD_HH_MMX 0
-   lea eax,[eax+edx]
+   lea _EAX,[_EAX+TMP1]
      ; transfert prev line to mm0/mm1
    movq mm0, mm2
    movq mm1, mm3
      ; load new line in mm2/mm3
-   movq mm2, [eax]
+   movq mm2, [_EAX]
-   movq mm4, [eax+1]
+   movq mm4, [_EAX+1]
    movq mm3, mm2
    movq mm5, mm4
-Line 1307
+Line 1264
    paddusw mm0, mm2
    paddusw mm1, mm3
-   movq mm4, [ecx]   ; prepare mix with Dst[0]
+   movq mm4, [TMP0]   ; prepare mix with Dst[0]
    movq mm5, mm4
    paddusw mm0, mm7  ; finish mixing current line
-Line 1330
+Line 1287
    packuswb mm0, mm1
-   movq [ecx], mm0
+   movq [TMP0], mm0
  %endmacro
- ALIGN 16
+ ALIGN SECTION_ALIGN
  interpolate8x8_halfpel_hv_add_mmx:
    PROLOG rounding2_mmx, 0    ; mm5 is busy. Don't load dst-rounder
      ; preprocess first line
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm2, [eax+1]
+   movq mm2, [_EAX+1]
    movq mm1, mm0
    movq mm3, mm2
-Line 1353
+Line 1310
     ; Input: mm2/mm3 contains the value (Src[0]+Src[1]) of previous line
    ADD_HH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HH_MMX
-   lea ecx,[ecx+edx]
+   lea TMP0,[TMP0+TMP1]
    ADD_HH_MMX
    ret

 Legend:



Removed from v.1794
 


changed lines


 
Added in v.1795
 Legend:



Removed from v.1794
 


changed lines


 
Added in v.1795
-Removed from v.1794
+Added in v.1795

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4