[svn] / trunk / xvidcore / examples / xvid_bench.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/examples/xvid_bench.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1614, Tue May 17 15:40:11 2005 UTC revision 1794, Fri Nov 14 15:43:28 2008 UTC
# Line 19  Line 19 
19   *  along with this program; if not, write to the Free Software   *  along with this program; if not, write to the Free Software
20   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22   * $Id: xvid_bench.c,v 1.17 2005-05-17 15:40:11 Skal Exp $   * $Id: xvid_bench.c,v 1.36 2008-11-14 15:43:27 Isibaar Exp $
23   *   *
24   ****************************************************************************/   ****************************************************************************/
25    
# Line 58  Line 58 
58  #include "utils/timer.h"  #include "utils/timer.h"
59  #include "quant/quant_matrix.c"  #include "quant/quant_matrix.c"
60  #include "bitstream/cbp.h"  #include "bitstream/cbp.h"
61    #include "bitstream/bitstream.h"
62    
63  #include <math.h>  #include <math.h>
64    
# Line 112  Line 113 
113          unsigned int cpu;          unsigned int cpu;
114  } CPU;  } CPU;
115    
116  CPU cpu_list[] =  CPU cpu_list[] = {
117  { { "PLAINC", 0 }          { "PLAINC ", 0 },
118  #ifdef ARCH_IS_IA32  #ifdef ARCH_IS_IA32
119    , { "MMX   ", XVID_CPU_MMX }          { "MMX    ", XVID_CPU_MMX },
120    , { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }          { "MMXEXT ", XVID_CPU_MMXEXT | XVID_CPU_MMX },
121    , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }          { "SSE2   ", XVID_CPU_SSE2 | XVID_CPU_MMX },
122    , { "3DNOW ", XVID_CPU_3DNOW }          { "SSE3   ", XVID_CPU_SSE3 | XVID_CPU_SSE2 | XVID_CPU_MMX },
123    , { "3DNOWE", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT }          { "SSE41  ", XVID_CPU_SSE41| XVID_CPU_SSE3 | XVID_CPU_SSE2 | XVID_CPU_MMX },
124        { "3DNOW  ", XVID_CPU_3DNOW },
125            { "3DNOWE ", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT },
126  #endif  #endif
127  #ifdef ARCH_IS_PPC  #ifdef ARCH_IS_PPC
128    , { "ALTIVEC", XVID_CPU_ALTIVEC }          { "ALTIVEC", XVID_CPU_ALTIVEC },
129  #endif  #endif
130  #ifdef ARCH_IS_X86_64  #ifdef ARCH_IS_X86_64
131    , { "X86_64", XVID_CPU_ASM}          { "X86_64 ", XVID_CPU_ASM},
132  #endif  #endif
133  //, { "IA64  ", XVID_CPU_IA64 }  #ifdef ARCH_IS_IA64
134  //, { "TSC   ", XVID_CPU_TSC }  //      { "IA64   ", XVID_CPU_IA64 },
   , { 0, 0 } };  
   
 CPU  cpu_short_list[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
 //, { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }  
 #endif  
 //, { "IA64  ", XVID_CPU_IA64 }  
   , { 0, 0 } };  
   
 CPU cpu_short_list2[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
   , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }  
135  #endif  #endif
136    , { 0, 0 } };  //      { "TSC    ", XVID_CPU_TSC },
137            { 0, 0 }
138    };
139    
140    
141  int init_cpu(CPU *cpu)  int init_cpu(CPU *cpu)
# Line 274  Line 263 
263          return crc;          return crc;
264  }  }
265    
266    void byte_swap(uint8_t *mem, int len, int element_size) {
267    #ifdef ARCH_IS_BIG_ENDIAN
268            int i;
269    
270            if(element_size == 1) {
271                    /* No need to swap */
272            } else if(element_size == 2) {
273                    uint8_t temp[2];
274    
275                    for(i=0; i < (len/2); i++ ) {
276                            temp[0] = mem[0];
277                            temp[1] = mem[1];
278                            mem[0] = temp[1];
279                            mem[1] = temp[0];
280    
281                            mem += 2;
282                    }
283            } else if(element_size == 4) {
284                    uint8_t temp[4];
285    
286                    for(i=0; i < (len/4); i++ ) {
287                            temp[0] = mem[0];
288                            temp[1] = mem[1];
289                            temp[2] = mem[2];
290                            temp[3] = mem[3];
291                            mem[0] = temp[3];
292                            mem[1] = temp[2];
293                            mem[2] = temp[1];
294                            mem[3] = temp[0];
295    
296                            mem += 4;
297                    }
298            } else {
299                    printf("ERROR: byte_swap unsupported element_size(%u)\n", element_size);
300            }
301    #endif
302    }
303    
304  /*********************************************************************  /*********************************************************************
305   * test DCT   * test DCT
306   *********************************************************************/   *********************************************************************/
# Line 494  Line 521 
521                             (iCrc!=8107)?"| ERROR": "" );                             (iCrc!=8107)?"| ERROR": "" );
522  #endif  #endif
523    
524        /* New functions for field prediction by CK 1.10.2005 */
525    #pragma NEW8X4
526                    TEST_MB(interpolate8x4_halfpel_h, 0);
527                    printf("%s - interpfield-h -round0 %.3f usec       crc32=0x%08x %s\n",
528                               cpu->name, t, iCrc,
529                               (iCrc!=0x9538d6df)?"| ERROR": "" );
530    
531                    TEST_MB(interpolate8x4_halfpel_h, 1);
532                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
533                               cpu->name, t, iCrc,
534                               (iCrc!=0xde5f1db4)?"| ERROR": "" );
535    
536    
537                    TEST_MB(interpolate8x4_halfpel_v, 0);
538                    printf("%s - interpfield- v-round0 %.3f usec       crc32=0x%08x %s\n",
539                               cpu->name, t, iCrc,
540                               (iCrc!=0xea5a69ef)?"| ERROR": "" );
541    
542                    TEST_MB(interpolate8x4_halfpel_v, 1);
543                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
544                               cpu->name, t, iCrc,
545                               (iCrc!=0x4f10ec0f)?"| ERROR": "" );
546    
547    
548                    TEST_MB(interpolate8x4_halfpel_hv, 0);
549                    printf("%s - interpfield-hv-round0 %.3f usec       crc32=0x%08x %s\n",
550                               cpu->name, t, iCrc,
551                               (iCrc!=0xf97ee367)?"| ERROR": "" );
552    
553                    TEST_MB(interpolate8x4_halfpel_hv, 1);
554                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
555                               cpu->name, t, iCrc,
556                               (iCrc!=0xb6a9f581)?"| ERROR": "" );
557    /* End of 8x4 functions */
558    
559                  printf( " --- \n" );                  printf( " --- \n" );
560          }          }
561  }  }
562    
563    #undef ENTER
564    #undef LEAVE
565    #undef TEST_MB
566    #undef TEST_MB2
567    
568  /*********************************************************************  /*********************************************************************
569   * test transfer   * test transfer
570   *********************************************************************/   *********************************************************************/
# Line 527  Line 594 
594  }                                         \  }                                         \
595  emms();                                   \  emms();                                   \
596  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
597  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
598    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
599    
600  #define TEST_TRANSFER(FUNC, DST, SRC)         \  #define TEST_TRANSFER(FUNC, DST, SRC)         \
601  TEST_TRANSFER_BEGIN(DST);                 \  TEST_TRANSFER_BEGIN(DST);                 \
# Line 553  Line 621 
621  }                                         \  }                                         \
622  emms();                                   \  emms();                                   \
623  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
624  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
625    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
626    
627  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \
628  TEST_TRANSFER2_BEGIN(DST,SRC);            \  TEST_TRANSFER2_BEGIN(DST,SRC);            \
# Line 570  Line 639 
639          const int nb_tests = 4000*speed_ref;          const int nb_tests = 4000*speed_ref;
640          int i;          int i;
641          CPU *cpu;          CPU *cpu;
642          uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];  //      uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];
643          int16_t Src16[8*32], Dst16[8*32];  //      int16_t Src16[8*32], Dst16[8*32];
644      DECLARE_ALIGNED_MATRIX(Src8, 8, 32, uint8_t, CACHE_LINE);
645      DECLARE_ALIGNED_MATRIX(Dst8, 8, 32, uint8_t, CACHE_LINE);
646      DECLARE_ALIGNED_MATRIX(Ref1, 8, 32, uint8_t, CACHE_LINE);
647      DECLARE_ALIGNED_MATRIX(Ref2, 8, 32, uint8_t, CACHE_LINE);
648      DECLARE_ALIGNED_MATRIX(Src16, 8, 32, uint16_t, CACHE_LINE);
649      DECLARE_ALIGNED_MATRIX(Dst16, 8, 32, uint16_t, CACHE_LINE);
650    
651          printf( "\n ===  test transfer ===\n" );          printf( "\n ===  test transfer ===\n" );
652    
# Line 593  Line 668 
668                                  cpu->name, t, s,                                  cpu->name, t, s,
669                                  (s!=0xee7ccbb4)?"| ERROR": "");                                  (s!=0xee7ccbb4)?"| ERROR": "");
670    
671        /* New functions for field prediction by CK 1.10.2005 */
672    #pragma NEW8X4
673                    TEST_TRANSFER(transfer8x4_copy, Dst8, Src8);
674                    printf("%s - 8to4      %.3f usec       crc32=0x%08x %s\n",
675                               cpu->name, t, s,
676                               (s!=0xbb9c3db5)?"| ERROR": "");
677    /* End of new functions */
678    
679                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);
680                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",
681                             cpu->name, t, s,                             cpu->name, t, s,
# Line 606  Line 689 
689                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);
690                  {                  {
691                          int s1, s2;                          int s1, s2;
692                          s1 = calc_crc((uint8_t*)Dst16, sizeof(Dst16), CRC32_INITIAL);                          s1 = calc_crc((uint8_t*)Dst16, 8*32*sizeof(Dst16[0]), CRC32_INITIAL);
693                          s2 = calc_crc((uint8_t*)Src8, sizeof(Src8), CRC32_INITIAL);                          s2 = calc_crc((uint8_t*)Src8, 8*32*sizeof(Src8[0]), CRC32_INITIAL);
694                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",
695                                     cpu->name, t, s1, s2,                                     cpu->name, t, s1, s2,
696                                     (s1!=0xa1e07163)?"| ERROR1": "",                                     (s1!=0xa1e07163)?"| ERROR1": "",
# Line 636  Line 719 
719    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
720          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
721            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \
722          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
723            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
724    }                                         \    }                                         \
725    emms();                                   \    emms();                                   \
726  }                                           \  }                                           \
# Line 651  Line 735 
735    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
736          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
737            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \
738          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
739            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
740    }                                         \    }                                         \
741    emms();                                   \    emms();                                   \
742  }                                           \  }                                           \
# Line 871  Line 956 
956   * test non-zero AC counting   * test non-zero AC counting
957   *********************************************************************/   *********************************************************************/
958    
959  #define TEST_CBP(FUNC, SRC)               \  #define TEST_CBP(FUNC, SRC, NB)           \
960  t = gettime_usec();                       \  t = gettime_usec();                       \
961  emms();                                   \  emms();                                   \
962  for(tst=0; tst<nb_tests; ++tst) {         \  for(tst=0; tst<NB; ++tst) {         \
963    cbp = (FUNC)((SRC));                    \    cbp = (FUNC)((SRC));                    \
964  }                                         \  }                                         \
965  emms();                                   \  emms();                                   \
# Line 883  Line 968 
968  void test_cbp()  void test_cbp()
969  {  {
970          const int nb_tests = 10000*speed_ref;          const int nb_tests = 10000*speed_ref;
971          int i;          int i, n, m;
972          CPU *cpu;          CPU *cpu;
973          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);
974          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);
975          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);
976          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);
977      DECLARE_ALIGNED_MATRIX(Src5, 6, 64, int16_t, 16);
978    
979          printf( "\n =====  test cbp =====\n" );          printf( "\n =====  test cbp =====\n" );
980    
# Line 897  Line 983 
983                  Src2[i] = (i<3*64);               /* half-full */                  Src2[i] = (i<3*64);               /* half-full */
984                  Src3[i] = ((i+32)>3*64);                  Src3[i] = ((i+32)>3*64);
985                  Src4[i] = (i==(3*64+2) || i==(5*64+9));                  Src4[i] = (i==(3*64+2) || i==(5*64+9));
986        Src5[i] = ieee_rand(0,1) ? -1 : 1;  /* +/- test */
987          }          }
988    
989          for(cpu = cpu_list; cpu->name!=0; ++cpu)          for(cpu = cpu_list; cpu->name!=0; ++cpu)
# Line 907  Line 994 
994                  if (!init_cpu(cpu))                  if (!init_cpu(cpu))
995                          continue;                          continue;
996    
997                  TEST_CBP(calc_cbp, Src1);                  TEST_CBP(calc_cbp, Src1, nb_tests);
998                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x %s\n",
999                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");
1000                  TEST_CBP(calc_cbp, Src2);                  TEST_CBP(calc_cbp, Src2, nb_tests);
1001                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x %s\n",
1002                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");
1003                  TEST_CBP(calc_cbp, Src3);                  TEST_CBP(calc_cbp, Src3, nb_tests);
1004                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x %s\n",
1005                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );
1006                  TEST_CBP(calc_cbp, Src4);                  TEST_CBP(calc_cbp, Src4, nb_tests);
1007                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1008                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );
1009                    TEST_CBP(calc_cbp, Src5, nb_tests);
1010                    printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1011                               cpu->name, t, cbp, (cbp!=0x3f)?"| ERROR": "" );
1012                  printf( " --- \n" );                  printf( " --- \n" );
1013          }          }
1014    
1015            for(cpu = cpu_list; cpu->name!=0; ++cpu)  /* bench suggested by Carlo (carlo dot bramix at libero dot it) */
1016            {
1017                    double t;
1018                    int tst, cbp, err;
1019    
1020                    if (!init_cpu(cpu))
1021                            continue;
1022    
1023        err = 0;
1024        for(n=0; n<6; ++n)
1025        {
1026          for(m=0; m<64; ++m)
1027          {
1028            for(i=0; i<6*64; ++i)
1029              Src1[i] = (i== (m + n*64));
1030    
1031            TEST_CBP(calc_cbp, Src1, 1);
1032            if (cbp!= (((m!=0)<<(5-n))))
1033            {
1034              printf( "%s -   calc_cbp#5: ERROR at pos %d / %d!\n", cpu->name, n, m);
1035              err = 1;
1036              break;
1037            }
1038          }
1039        }
1040        if (!err)
1041          printf( " %s -    calc_cbp#5 : OK\n", cpu->name );
1042    
1043            }
1044  }  }
1045    
1046  /*********************************************************************  /*********************************************************************
# Line 1383  Line 1503 
1503                  xframe.bitstream = buf + pos;                  xframe.bitstream = buf + pos;
1504                  xframe.length = buf_size - pos;                  xframe.length = buf_size - pos;
1505                  xframe.output.plane[0] = (uint8_t*)(((size_t)yuv_out + 15) & ~15);                  xframe.output.plane[0] = (uint8_t*)(((size_t)yuv_out + 15) & ~15);
1506                  xframe.output.plane[1] = xframe.output.plane[0] + bps*height;                  xframe.output.plane[1] = (uint8_t*)xframe.output.plane[0] + bps*height;
1507                  xframe.output.plane[2] = xframe.output.plane[1] + bps/2;                  xframe.output.plane[2] = (uint8_t*)xframe.output.plane[1] + bps/2;
1508                  xframe.output.stride[0] = bps;                  xframe.output.stride[0] = bps;
1509                  xframe.output.stride[1] = bps;                  xframe.output.stride[1] = bps;
1510                  xframe.output.stride[2] = bps;                  xframe.output.stride[2] = bps;
# Line 1402  Line 1522 
1522                  nb++;                  nb++;
1523    
1524      for(y=0; y<height/2; ++y) {      for(y=0; y<height/2; ++y) {
1525                    chksum = calc_crc(xframe.output.plane[0] + (2*y+0)*bps, width, chksum);                    chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+0)*bps, width, chksum);
1526                          chksum = calc_crc(xframe.output.plane[0] + (2*y+1)*bps, width, chksum);                          chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+1)*bps, width, chksum);
1527                          chksum = calc_crc(xframe.output.plane[1] + y*bps, width/2, chksum);                          chksum = calc_crc((uint8_t*)xframe.output.plane[1] + y*bps, width/2, chksum);
1528                          chksum = calc_crc(xframe.output.plane[2] + y*bps, width/2, chksum);                          chksum = calc_crc((uint8_t*)xframe.output.plane[2] + y*bps, width/2, chksum);
1529                  }                  }
1530                  if (pos==buf_size)                  if (pos==buf_size)
1531                          break;                          break;
# Line 1590  Line 1710 
1710  }  }
1711    
1712  /*********************************************************************  /*********************************************************************
1713     * test some YUV func
1714     *********************************************************************/
1715    
1716    #define ENTER \
1717    for(i=0; i<(int)sizeof(Dst0); ++i) Dst0[0][i] = 0;   \
1718    t = gettime_usec();                   \
1719    emms();
1720    
1721    #define LEAVE \
1722    emms();                             \
1723    t = (gettime_usec() - t) / nb_tests;  \
1724            iCrc = calc_crc((uint8_t*)Dst0, sizeof(Dst0), CRC32_INITIAL)
1725    
1726    #define TEST_YUYV(FUNC, S)                \
1727    ENTER                               \
1728    for(tst=0; tst<nb_tests; ++tst) (FUNC)(Dst0[0], S*WIDTH, Src0[0], Src0[1], Src0[2], WIDTH, WIDTH/2, WIDTH, HEIGHT, 0); \
1729    LEAVE
1730    
1731    #define WIDTH 128
1732    #define HEIGHT 32
1733    void test_yuv()
1734    {
1735            const int nb_tests = 200*speed_ref;
1736            CPU *cpu;
1737            uint8_t Src0[3][WIDTH*HEIGHT];
1738            uint8_t Dst0[4][WIDTH*HEIGHT];
1739            int i, j;
1740            double t;
1741            int tst, iCrc;
1742    
1743            colorspace_init();
1744            ieee_reseed(1);
1745            for(i=0; i<(int)sizeof(Src0); ++i) Src0[0][i] = ieee_rand(0,255);
1746            for(i=0; i<(int)sizeof(Dst0); ++i) Dst0[0][i] = 0x5a;
1747    
1748            printf( "\n ===  test YUV ===\n" );
1749    
1750            init_cpu(&cpu_list[0]);
1751            TEST_YUYV(yv12_to_yuyv_c, 4);
1752            printf(" yv12_to_yuyv_c %.3f usec       crc32=0x%08x %s\n",
1753                       t, iCrc, (iCrc!=0xeb1a0b0a)?"| ERROR": "" );
1754            TEST_YUYV(yv12_to_uyvy_c, 4);
1755            printf(" yv12_to_uyvy_c %.3f usec       crc32=0x%08x %s\n",
1756                       t, iCrc, (iCrc!=0x6e82f55b)?"| ERROR": "" );
1757    
1758    #ifdef ARCH_IS_IA32
1759            init_cpu(&cpu_list[1]);
1760            TEST_YUYV(yv12_to_yuyv_mmx, 4);
1761            printf(" yv12_to_yuyv_mmx %.3f usec       crc32=0x%08x %s\n",
1762                    t, iCrc, (iCrc!=0xeb1a0b0a)?"| ERROR": "" );
1763    
1764            TEST_YUYV(yv12_to_uyvy_mmx, 4);
1765            printf(" yv12_to_uyvy_mmx %.3f usec       crc32=0x%08x %s\n",
1766                    t, iCrc, (iCrc!=0x6e82f55b)?"| ERROR": "" );
1767    #endif
1768    
1769    #ifdef ARCH_IS_PPC
1770            init_cpu(&cpu_list[1]);
1771            TEST_YUYV(yv12_to_yuyv_altivec_c, 4);
1772            printf(" yv12_to_yuyv_altivec_c %.3f usec       crc32=0x%08x %s\n",
1773                    t, iCrc, (iCrc!=0xeb1a0b0a)?"| ERROR": "" );
1774    
1775            TEST_YUYV(yv12_to_uyvy_altivec_c, 4);
1776            printf(" yv12_to_uyvy_altivec_c %.3f usec       crc32=0x%08x %s\n",
1777                    t, iCrc, (iCrc!=0x6e82f55b)?"| ERROR": "" );
1778    #endif
1779            printf( " --- \n" );
1780    }
1781    
1782    #define TEST_YV2(FUNC, WITH_UV, WITH_FLIP)        \
1783    ENTER                               \
1784    for(tst=0; tst<nb_tests; ++tst) (FUNC)(Dst0[0], Dst0[1], Dst0[2], WIDTH, WIDTH, \
1785            Src0[0], (WITH_UV) ? Src0[1] : 0, (WITH_UV) ? Src0[2] : 0,  WIDTH, WIDTH, \
1786            WIDTH-2, HEIGHT-2, WITH_FLIP); \
1787    LEAVE
1788    
1789    #define PRINT_NxN(DATA,W,H,STR)   {   \
1790            int i,j; \
1791            for(j=0; j<(H); ++j) { \
1792                    for(i=0; i<(W); ++i) printf( "0x%.2x ", (DATA)[i+j*(STR)] );\
1793                    printf("\n"); \
1794            } \
1795            printf("---\n"); \
1796    }
1797    
1798    static const int yv12_CRCs[2][2] = {
1799            {0x5cab7cf0,0xdab46541}
1800    ,       {0xe8bae865,0x1faf77b7}
1801    };
1802    
1803    void test_yuv2()
1804    {
1805            const int nb_tests = 800*speed_ref;
1806            CPU *cpu;
1807            uint8_t Src0[3][WIDTH*HEIGHT];
1808            uint8_t Dst0[3][WIDTH*HEIGHT];
1809            int with_uv, with_flip;
1810            int i, j;
1811            double t;
1812            int tst, iCrc;
1813    
1814            colorspace_init();
1815            ieee_reseed(1);
1816            for(i=0; i<(int)sizeof(Src0); ++i) Src0[0][i] = ieee_rand(0,255);
1817    
1818            printf( "\n ===  test YV2 ===\n" );
1819            for(with_flip=0; with_flip<=1; ++with_flip) {
1820                    for(with_uv=0; with_uv<=1; ++with_uv) {
1821                            init_cpu(&cpu_list[0]);
1822                            TEST_YV2(yv12_to_yv12_c, with_uv, with_flip);
1823                            printf(" yv12_to_yv12_c   %.3f usec      \tcrc32=0x%08x %s\n",
1824                                    t, iCrc, (iCrc!=yv12_CRCs[with_flip][with_uv])?"| ERROR": "" );
1825                            /* if (!with_uv) PRINT_NxN(Dst0[1], WIDTH/2, HEIGHT/2, WIDTH ); */
1826    
1827    #ifdef ARCH_IS_IA32
1828                            init_cpu(&cpu_list[1]);
1829                            TEST_YV2(yv12_to_yv12_mmx, with_uv, with_flip);
1830                            printf(" yv12_to_yv12_mmx %.3f usec     \tcrc32=0x%08x %s\n",
1831                                    t, iCrc, (iCrc!=yv12_CRCs[with_flip][with_uv])?"| ERROR": "" );
1832                            /* if (!with_uv) PRINT_NxN(Dst0[1], WIDTH/2, HEIGHT/2, WIDTH ); */
1833    
1834                            TEST_YV2(yv12_to_yv12_xmm, with_uv, with_flip);
1835                            printf(" yv12_to_yv12_xmm %.3f usec     \tcrc32=0x%08x %s\n",
1836                                    t, iCrc, (iCrc!=yv12_CRCs[with_flip][with_uv])?"| ERROR": "" );
1837    #endif
1838                    }
1839    
1840                    printf( " --- \n" );
1841            }
1842            printf( " ===== \n" );
1843    }
1844    
1845    #undef WIDTH
1846    #undef HEIGHT
1847    #undef ENTER
1848    #undef LEAVE
1849    
1850    /*********************************************************************/
1851    
1852    static uint32_t __inline log2bin_v1(uint32_t value)
1853    {
1854      int n = 0;
1855      while (value) {
1856        value >>= 1;
1857        n++;
1858      }
1859      return n;
1860    }
1861    
1862    static const uint8_t log2_tab_16[16] =  { 0, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4 };
1863    
1864    static uint32_t __inline log2bin_v2(uint32_t value)
1865    {
1866      int n = 0;
1867      if (value & 0xffff0000) {
1868        value >>= 16;
1869        n += 16;
1870      }
1871      if (value & 0xff00) {
1872        value >>= 8;
1873        n += 8;
1874      }
1875      if (value & 0xf0) {
1876        value >>= 4;
1877        n += 4;
1878      }
1879     return n + log2_tab_16[value];
1880    }
1881    
1882    void test_log2bin()
1883    {
1884            const int nb_tests = 3000*speed_ref;
1885      int n, crc1=0, crc2=0;
1886      uint32_t s, s0;
1887      double t1, t2;
1888    
1889      t1 = gettime_usec();
1890      s0 = (int)(t1*31.241);
1891      for(s=s0, n=0; n<nb_tests; ++n, s=(s*12363+31)&0x7fffffff)
1892        crc1 += log2bin_v1(s);
1893      t1 = (gettime_usec()-t1) / nb_tests;
1894    
1895      t2 = gettime_usec();
1896      for(s=s0, n=0; n<nb_tests; ++n, s=(s*12363+31)&0x7fffffff)
1897        crc2 += log2bin_v2(s);
1898      t2 = (gettime_usec() - t2) / nb_tests;
1899    
1900      printf( "log2bin_v1: %.3f sec  crc=%d\n", t1, crc1 );
1901      printf( "log2bin_v2: %.3f sec  crc=%d\n", t2, crc2 );
1902      if (crc1!=crc2) printf( " CRC ERROR !\n" );
1903    }
1904    
1905    /*********************************************************************/
1906    
1907    static void __inline old_gcd(int *num, int *den)
1908    {
1909     int i = *num;
1910      while (i > 1) {
1911        if (*num % i == 0 && *den % i == 0) {
1912          *num /= i;
1913          *den /= i;
1914          i = *num;
1915          continue;
1916        }
1917        i--;
1918      }
1919    }
1920    
1921    static uint32_t gcd(int num, int den)
1922    {
1923      int tmp;
1924      while( (tmp=num%den) ) { num = den; den = tmp; }
1925      return den;
1926    }
1927    static void __inline new_gcd(int *num, int *den)
1928    {
1929      const int div = gcd(*num, *den);
1930      if (num) {
1931        *num /= div;
1932        *den /= div;
1933      }
1934    }
1935    
1936    void test_gcd()
1937    {
1938      const int nb_tests = 10*speed_ref;
1939      int i;
1940      uint32_t crc1=0, crc2=0;
1941      uint32_t n0, n, d0, d;
1942      double t1, t2;
1943    
1944      t1 = gettime_usec();
1945      n0 = 0xfffff & (int)(t1*31.241);
1946      d0 = 0xfffff & (int)( ((n0*4123)%17) | 1 );
1947      for(n=n0, d=d0, i=0; i<nb_tests; ++i) {
1948        old_gcd(&n, &d);
1949        crc1 = (((crc1>>4)^d) + ((crc1<<2)^n) ) & 0xffffff;
1950        n = d;
1951        d = (d*12363+31) & 0xffff;
1952        d |= !d;
1953      }
1954      t1 = (gettime_usec()-t1) / nb_tests;
1955    
1956      t2 = gettime_usec();
1957      for(n=n0, d=d0, i=0; i<nb_tests; ++i) {
1958        new_gcd(&n, &d);
1959        crc2 = (((crc2>>4)^d) + ((crc2<<2)^n) ) & 0xffffff;
1960        n = d;
1961        d = (d*12363+31) & 0xffff;
1962        d |= !d;
1963      }
1964      t2 = (gettime_usec() - t2) / nb_tests;
1965    
1966      printf( "old_gcd: %.3f sec  crc=%d\n", t1, crc1 );
1967      printf( "new_gcd: %.3f sec  crc=%d\n", t2, crc2 );
1968      if (crc1!=crc2) printf( " CRC ERROR !\n" );
1969    }
1970    
1971    /*********************************************************************
1972     * test compiler
1973     *********************************************************************/
1974    
1975    void test_compiler() {
1976      int nb_err = 0;
1977      int32_t v;
1978      if (sizeof(uint16_t)<2) {
1979        printf( "ERROR: sizeof(uint16_t)<2 !!\n" );
1980        nb_err++;
1981      }
1982      if (sizeof(int16_t)<2) {
1983        printf( "ERROR: sizeof(int16_t)<2 !!\n" );
1984        nb_err++;
1985      }
1986      if (sizeof(uint8_t)!=1) {
1987        printf( "ERROR: sizeof(uint8_t)!=1 !!\n" );
1988        nb_err++;
1989      }
1990      if (sizeof(int8_t)!=1) {
1991        printf( "ERROR: sizeof(int8_t)!=1 !!\n" );
1992        nb_err++;
1993      }
1994      if (sizeof(uint32_t)<4) {
1995        printf( "ERROR: sizeof(uint32_t)<4 !!\n" );
1996        nb_err++;
1997      }
1998      if (sizeof(int32_t)<4) {
1999        printf( "ERROR: sizeof(int32_t)<4 !!\n" );
2000        nb_err++;
2001      }
2002             /* yes, i know, this test is silly. But better be safe than sorry. :) */
2003      for(v=1000; v>=0; v--) {
2004        if ( (v>>2) != v/4)
2005          nb_err++;
2006      }
2007      for(v=-1000; v!=-1; v++) {
2008        if ( (v>>2) != (v/4)-!!(v%4))
2009          nb_err++;
2010      }
2011      if (nb_err!=0) {
2012        printf( "ERROR! please post your platform/compiler specs to xvid-devel@xvid.org !\n" );
2013      }
2014    }
2015    
2016    /*********************************************************************
2017     * test SSIM functions
2018     *********************************************************************/
2019    
2020    typedef int (*lumfunc)(uint8_t* ptr, int stride);
2021    typedef void (*csfunc)(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2022    
2023    extern int lum_8x8_c(uint8_t* ptr, int stride);
2024    extern int lum_8x8_mmx(uint8_t* ptr, int stride);
2025    extern int lum_2x8_c(uint8_t* ptr, int stride);
2026    extern void consim_c(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2027    extern void consim_mmx(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2028    extern void consim_sse2(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2029    
2030    void test_SSIM()
2031    {
2032            const int nb_tests = 3000*speed_ref;
2033            int tst;
2034            CPU *cpu;
2035            int i;
2036            int devs[3];
2037            long lumo, lumc;
2038            DECLARE_ALIGNED_MATRIX(Ref1, 16, 16, uint8_t, 16);
2039            DECLARE_ALIGNED_MATRIX(Ref2, 16, 16, uint8_t, 16);
2040            lumfunc lum8x8;
2041            lumfunc lum2x8;
2042            csfunc  csim;
2043    
2044            ieee_reseed(1);
2045            printf( "\n ======  test SSIM ======\n" );
2046            for(i=0; i<16*16;++i) {
2047                    long v1, v2;
2048                    v1 = ieee_rand(-256, 511);
2049                    v2 = ieee_rand(-256, 511);
2050                    Ref1[i] = (v1<0) ? 0 : (v1>255) ? 255 : v1;
2051                    Ref2[i] = (v2<0) ? 0 : (v2>255) ? 255 : v2;
2052            }
2053            lumc = ieee_rand(0, 255);
2054            lumo = ieee_rand(0, 255);
2055    
2056            for(cpu = cpu_list; cpu->name!=0; ++cpu)
2057            {
2058                    double t;
2059                    int m;
2060                    if (!init_cpu(cpu))
2061                            continue;
2062                    lum8x8 = lum_8x8_c;
2063                    lum2x8 = lum_2x8_c;
2064                    csim   = consim_c;
2065    #ifdef ARCH_IS_IA32
2066                    if (cpu->cpu & XVID_CPU_MMX){
2067                            lum8x8 = lum_8x8_mmx;
2068                            csim = consim_mmx;
2069                    }
2070                    if (cpu->cpu & XVID_CPU_MMX){
2071                            csim = consim_sse2;
2072                    }
2073    #endif
2074                    t = gettime_usec();
2075                    emms();
2076                    for(tst=0; tst<nb_tests; ++tst) m = lum8x8(Ref1, 16);
2077                    emms();
2078                    t = (gettime_usec() - t) / nb_tests;
2079                    printf("%s - ssim-lum8x8    %.3f usec       m=%d %s\n",
2080                               cpu->name, t, m,
2081                               (m!=8230)?"| ERROR": "" );
2082    
2083                    t = gettime_usec();
2084                    emms();
2085                    for(tst=0; tst<nb_tests; ++tst) m = lum2x8(Ref1+8, 16);
2086                    emms();
2087                    t = (gettime_usec() - t) / nb_tests;
2088                    printf("%s - ssim-lum2x8    %.3f usec       m=%d %s\n",
2089                               cpu->name, t, m,
2090                               (m!=681)?"| ERROR": "" );
2091    
2092                    t = gettime_usec();
2093                    emms();
2094                    for(tst=0; tst<nb_tests; ++tst) csim(Ref1, Ref2, 16, lumo, lumc, devs+0, devs+1, devs+2);
2095                    emms();
2096                    t = (gettime_usec() - t) / nb_tests;
2097                    printf("%s - ssim-consim    %.3f usec       devs=[0x%x 0x%x 0x%x] %s\n",
2098                               cpu->name, t, devs[0], devs[1], devs[2],
2099                               (devs[0]!=0x1bdf0f || devs[1]!=0x137258 ||  devs[2]!=0xcdb13)?"| ERROR": "" );
2100                    printf( " --- \n" );
2101            }
2102    }
2103    
2104    /*********************************************************************
2105     * test bitstream functions
2106     *********************************************************************/
2107    
2108    #define BIT_BUF_SIZE 2000
2109    
2110    static void test_bits()
2111    {
2112      const int nb_tests = 50*speed_ref;
2113      int tst;
2114      uint32_t Crc;
2115      uint8_t Buf[BIT_BUF_SIZE];
2116      uint32_t Extracted[BIT_BUF_SIZE*8]; /* worst case: bits read 1 by 1 */
2117      int Lens[BIT_BUF_SIZE*8];
2118      double t1;
2119    
2120    
2121      printf( "\n ===  test bitstream ===\n" );
2122      ieee_reseed(1);
2123      Crc = 0;
2124    
2125      t1 = gettime_usec();
2126      for(tst=0; tst<nb_tests; ++tst) {
2127            Bitstream bs;
2128            int m, m2, l, l2;
2129    
2130            for(l=0; l<BIT_BUF_SIZE; ++l)
2131                    Buf[l] = (uint8_t)ieee_rand(0,255);
2132    
2133            l = BIT_BUF_SIZE - ieee_rand(1,BIT_BUF_SIZE/10);
2134            BitstreamInit(&bs, (void*)(Buf+BIT_BUF_SIZE-l), l);
2135    
2136    
2137            BitstreamReset(&bs);
2138            for(l2=l*8, m=0; l2>0; m++) {
2139                    const int b = ieee_rand(1,32);
2140                    Lens[m] = b;
2141                    l2 -= b;
2142                    if (l2<0) break;
2143                    Extracted[m] = BitstreamShowBits(&bs, b);
2144                    BitstreamSkip(&bs, b);
2145    //              printf( "<= %d: %d 0x%x\n", m, b, Extracted[m]);
2146            }
2147    
2148            BitstreamReset(&bs);
2149            for(m2=0; m2<m; ++m2) {
2150                    const int b = Lens[m2];
2151                    const uint32_t v = BitstreamGetBits(&bs, b);
2152                    Crc |= (v!=Extracted[m2]);
2153    //              printf( "=> %d: %d 0x%x %c\n", m2, b, v, " *"[Crc]);
2154            }
2155      }
2156      t1 = (gettime_usec() - t1) / nb_tests;
2157      printf(" test_bits   %.3f usec   %s\n", t1, (Crc!=0)?"| ERROR": "" );
2158    }
2159    
2160    /*********************************************************************
2161   * main   * main
2162   *********************************************************************/   *********************************************************************/
2163    
# Line 1613  Line 2181 
2181            else if (!strcmp(argv[c], "-c"))      cpu_mask = 0 /* PLAIN_C */ | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-c"))      cpu_mask = 0 /* PLAIN_C */ | XVID_CPU_FORCE;
2182            else if (!strcmp(argv[c], "-mmx"))    cpu_mask = XVID_CPU_MMX    | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-mmx"))    cpu_mask = XVID_CPU_MMX    | XVID_CPU_FORCE;
2183            else if (!strcmp(argv[c], "-mmxext")) cpu_mask = XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-mmxext")) cpu_mask = XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2184            else if (!strcmp(argv[c], "-sse2"))   cpu_mask = XVID_CPU_SSE2   | XVID_CPU_MMX | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-sse2"))   cpu_mask = XVID_CPU_SSE2   | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2185              else if (!strcmp(argv[c], "-sse3"))   cpu_mask = XVID_CPU_SSE3   | XVID_CPU_SSE2 | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2186              else if (!strcmp(argv[c], "-sse4"))   cpu_mask = XVID_CPU_SSE41  | XVID_CPU_SSE3 | XVID_CPU_SSE2 | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2187            else if (!strcmp(argv[c], "-3dnow"))  cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-3dnow"))  cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_FORCE;
2188            else if (!strcmp(argv[c], "-3dnowe")) cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_3DNOWEXT | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-3dnowe")) cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_3DNOWEXT | XVID_CPU_FORCE;
2189            else if (!strcmp(argv[c], "-altivec")) cpu_mask = XVID_CPU_ALTIVEC | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-altivec")) cpu_mask = XVID_CPU_ALTIVEC | XVID_CPU_FORCE;
# Line 1655  Line 2225 
2225          if (what==0 || what==5) test_quant();          if (what==0 || what==5) test_quant();
2226          if (what==0 || what==6) test_cbp();          if (what==0 || what==6) test_cbp();
2227          if (what==0 || what==10) test_sse();          if (what==0 || what==10) test_sse();
2228            if (what==0 || what==11) test_log2bin();
2229            if (what==0 || what==12) test_gcd();
2230            if (what==0 || what==13) test_compiler();
2231            if (what==0 || what==14) test_yuv();
2232            if (what==0 || what==15) test_SSIM();
2233            if (what==0 || what==16) test_yuv2();
2234            if (what==0 || what==17) test_bits();
2235    
2236          if (what==7) {          if (what==7) {
2237                  test_IEEE1180_compliance(-256, 255, 1);                  test_IEEE1180_compliance(-256, 255, 1);
# Line 1695  Line 2272 
2272          return 0;          return 0;
2273  }  }
2274    
2275  /*********************************************************************  /*********************************************************************/
  * 'Reference' output (except for timing) on an Athlon XP 2200+  
  *********************************************************************/  
   
 /* as of 2002-01-07, there's a problem with MMX mpeg4-quantization */  
 /* as of 2003-11-30, the problem is still here */  
   
 /*********************************************************************  
   
   
  ===== test fdct/idct =====  
 PLAINC -  2.867 usec       PSNR=13.291  MSE=3.000  
 MMX    -  -0.211 usec       PSNR=9.611  MSE=7.000  
 MMXEXT -  -0.256 usec       PSNR=9.611  MSE=7.000  
 3DNOW  -  2.855 usec       PSNR=13.291  MSE=3.000  
 3DNOWE -  1.429 usec       PSNR=13.291  MSE=3.000  
   
  ===  test block motion ===  
 PLAINC - interp- h-round0 0.538 usec       crc32=0x115381ba  
 PLAINC -           round1 0.527 usec       crc32=0x2b1f528f  
 PLAINC - interp- v-round0 0.554 usec       crc32=0x423cdcc7  
 PLAINC -           round1 0.551 usec       crc32=0x42202efe  
 PLAINC - interp-hv-round0 1.041 usec       crc32=0xd198d387  
 PLAINC -           round1 1.038 usec       crc32=0x9ecfd921  
  ---  
 MMX    - interp- h-round0 0.051 usec       crc32=0x115381ba  
 MMX    -           round1 0.053 usec       crc32=0x2b1f528f  
 MMX    - interp- v-round0 0.048 usec       crc32=0x423cdcc7  
 MMX    -           round1 0.048 usec       crc32=0x42202efe  
 MMX    - interp-hv-round0 0.074 usec       crc32=0xd198d387  
 MMX    -           round1 0.073 usec       crc32=0x9ecfd921  
  ---  
 MMXEXT - interp- h-round0 0.020 usec       crc32=0x115381ba  
 MMXEXT -           round1 0.025 usec       crc32=0x2b1f528f  
 MMXEXT - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 MMXEXT -           round1 0.024 usec       crc32=0x42202efe  
 MMXEXT - interp-hv-round0 0.037 usec       crc32=0xd198d387  
 MMXEXT -           round1 0.037 usec       crc32=0x9ecfd921  
  ---  
 3DNOW  - interp- h-round0 0.020 usec       crc32=0x115381ba  
 3DNOW  -           round1 0.029 usec       crc32=0x2b1f528f  
 3DNOW  - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 3DNOW  -           round1 0.024 usec       crc32=0x42202efe  
 3DNOW  - interp-hv-round0 0.038 usec       crc32=0xd198d387  
 3DNOW  -           round1 0.039 usec       crc32=0x9ecfd921  
  ---  
 3DNOWE - interp- h-round0 0.020 usec       crc32=0x115381ba  
 3DNOWE -           round1 0.024 usec       crc32=0x2b1f528f  
 3DNOWE - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 3DNOWE -           round1 0.021 usec       crc32=0x42202efe  
 3DNOWE - interp-hv-round0 0.037 usec       crc32=0xd198d387  
 3DNOWE -           round1 0.036 usec       crc32=0x9ecfd921  
  ---  
   
  ======  test SAD ======  
 PLAINC - sad8    0.505 usec       sad=3776  
 PLAINC - sad16   1.941 usec       sad=27214  
 PLAINC - sad16bi 4.925 usec       sad=26274  
 PLAINC - dev16   4.254 usec       sad=3344  
  ---  
 MMX    - sad8    0.036 usec       sad=3776  
 MMX    - sad16   0.107 usec       sad=27214  
 MMX    - sad16bi 0.259 usec       sad=26274  
 MMX    - dev16   0.187 usec       sad=3344  
  ---  
 MMXEXT - sad8    0.016 usec       sad=3776  
 MMXEXT - sad16   0.050 usec       sad=27214  
 MMXEXT - sad16bi 0.060 usec       sad=26274  
 MMXEXT - dev16   0.086 usec       sad=3344  
  ---  
 3DNOW  - sad8    0.506 usec       sad=3776  
 3DNOW  - sad16   1.954 usec       sad=27214  
 3DNOW  - sad16bi 0.119 usec       sad=26274  
 3DNOW  - dev16   4.252 usec       sad=3344  
  ---  
 3DNOWE - sad8    0.017 usec       sad=3776  
 3DNOWE - sad16   0.038 usec       sad=27214  
 3DNOWE - sad16bi 0.052 usec       sad=26274  
 3DNOWE - dev16   0.067 usec       sad=3344  
  ---  
   
  ===  test transfer ===  
 PLAINC - 8to16     0.603 usec       crc32=0x115814bb  
 PLAINC - 16to8     1.077 usec       crc32=0xee7ccbb4  
 PLAINC - 8to8      0.679 usec       crc32=0xd37b3295  
 PLAINC - 16to8add  1.341 usec       crc32=0xdd817bf4  
 PLAINC - 8to16sub  1.566 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 PLAINC - 8to16sub2 2.206 usec       crc32=0x99b6c4c7  
  ---  
 MMX    - 8to16     -0.025 usec       crc32=0x115814bb  
 MMX    - 16to8     -0.049 usec       crc32=0xee7ccbb4  
 MMX    - 8to8      0.014 usec       crc32=0xd37b3295  
 MMX    - 16to8add  0.011 usec       crc32=0xdd817bf4  
 MMX    - 8to16sub  0.108 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 MMX    - 8to16sub2 0.164 usec       crc32=0x99b6c4c7  
  ---  
 MMXEXT - 8to16     -0.054 usec       crc32=0x115814bb  
 MMXEXT - 16to8     0.010 usec       crc32=0xee7ccbb4  
 MMXEXT - 8to8      0.015 usec       crc32=0xd37b3295  
 MMXEXT - 16to8add  0.008 usec       crc32=0xdd817bf4  
 MMXEXT - 8to16sub  0.263 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 MMXEXT - 8to16sub2 0.178 usec       crc32=0x99b6c4c7  
  ---  
 3DNOW  - 8to16     0.666 usec       crc32=0x115814bb  
 3DNOW  - 16to8     1.078 usec       crc32=0xee7ccbb4  
 3DNOW  - 8to8      0.665 usec       crc32=0xd37b3295  
 3DNOW  - 16to8add  1.365 usec       crc32=0xdd817bf4  
 3DNOW  - 8to16sub  1.356 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 3DNOW  - 8to16sub2 2.098 usec       crc32=0x99b6c4c7  
  ---  
 3DNOWE - 8to16     -0.024 usec       crc32=0x115814bb  
 3DNOWE - 16to8     0.010 usec       crc32=0xee7ccbb4  
 3DNOWE - 8to8      0.014 usec       crc32=0xd37b3295  
 3DNOWE - 16to8add  0.016 usec       crc32=0xdd817bf4  
 3DNOWE - 8to16sub  -0.000 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 3DNOWE - 8to16sub2 -0.031 usec       crc32=0x99b6c4c7  
  ---  
   
  =====  test quant =====  
 PLAINC -   quant_mpeg_intra 98.631 usec       crc32=0xfd6a21a4  
 PLAINC -   quant_mpeg_inter 104.876 usec       crc32=0xf6de7757  
 PLAINC - dequant_mpeg_intra 50.285 usec       crc32=0x2def7bc7  
 PLAINC - dequant_mpeg_inter 58.316 usec       crc32=0xd878c722  
 PLAINC -   quant_h263_intra 33.803 usec       crc32=0x2eba9d43  
 PLAINC -   quant_h263_inter 45.411 usec       crc32=0xbd315a7e  
 PLAINC - dequant_h263_intra 39.302 usec       crc32=0x9841212a  
 PLAINC - dequant_h263_inter 44.124 usec       crc32=0xe7df8fba  
  ---  
 MMX    -   quant_mpeg_intra 4.273 usec       crc32=0xdacabdb6 | ERROR  
 MMX    -   quant_mpeg_inter 3.576 usec       crc32=0x72883ab6 | ERROR  
 MMX    - dequant_mpeg_intra 3.793 usec       crc32=0x2def7bc7  
 MMX    - dequant_mpeg_inter 4.808 usec       crc32=0xd878c722  
 MMX    -   quant_h263_intra 2.881 usec       crc32=0x2eba9d43  
 MMX    -   quant_h263_inter 2.550 usec       crc32=0xbd315a7e  
 MMX    - dequant_h263_intra 2.974 usec       crc32=0x9841212a  
 MMX    - dequant_h263_inter 2.906 usec       crc32=0xe7df8fba  
  ---  
 MMXEXT -   quant_mpeg_intra 4.221 usec       crc32=0xfd6a21a4  
 MMXEXT -   quant_mpeg_inter 4.339 usec       crc32=0xf6de7757  
 MMXEXT - dequant_mpeg_intra 3.802 usec       crc32=0x2def7bc7  
 MMXEXT - dequant_mpeg_inter 4.821 usec       crc32=0xd878c722  
 MMXEXT -   quant_h263_intra 2.884 usec       crc32=0x2eba9d43  
 MMXEXT -   quant_h263_inter 2.554 usec       crc32=0xbd315a7e  
 MMXEXT - dequant_h263_intra 2.728 usec       crc32=0x9841212a  
 MMXEXT - dequant_h263_inter 2.611 usec       crc32=0xe7df8fba  
  ---  
 3DNOW  -   quant_mpeg_intra 98.512 usec       crc32=0xfd6a21a4  
 3DNOW  -   quant_mpeg_inter 104.873 usec       crc32=0xf6de7757  
 3DNOW  - dequant_mpeg_intra 50.219 usec       crc32=0x2def7bc7  
 3DNOW  - dequant_mpeg_inter 58.254 usec       crc32=0xd878c722  
 3DNOW  -   quant_h263_intra 33.778 usec       crc32=0x2eba9d43  
 3DNOW  -   quant_h263_inter 41.998 usec       crc32=0xbd315a7e  
 3DNOW  - dequant_h263_intra 39.344 usec       crc32=0x9841212a  
 3DNOW  - dequant_h263_inter 43.607 usec       crc32=0xe7df8fba  
  ---  
 3DNOWE -   quant_mpeg_intra 98.490 usec       crc32=0xfd6a21a4  
 3DNOWE -   quant_mpeg_inter 104.889 usec       crc32=0xf6de7757  
 3DNOWE - dequant_mpeg_intra 3.277 usec       crc32=0x2def7bc7  
 3DNOWE - dequant_mpeg_inter 4.485 usec       crc32=0xd878c722  
 3DNOWE -   quant_h263_intra 1.882 usec       crc32=0x2eba9d43  
 3DNOWE -   quant_h263_inter 2.246 usec       crc32=0xbd315a7e  
 3DNOWE - dequant_h263_intra 3.457 usec       crc32=0x9841212a  
 3DNOWE - dequant_h263_inter 3.275 usec       crc32=0xe7df8fba  
  ---  
   
  =====  test cbp =====  
 PLAINC -   calc_cbp#1 0.168 usec       cbp=0x15  
 PLAINC -   calc_cbp#2 0.168 usec       cbp=0x38  
 PLAINC -   calc_cbp#3 0.157 usec       cbp=0x0f  
 PLAINC -   calc_cbp#4 0.235 usec       cbp=0x05  
  ---  
 MMX    -   calc_cbp#1 0.070 usec       cbp=0x15  
 MMX    -   calc_cbp#2 0.062 usec       cbp=0x38  
 MMX    -   calc_cbp#3 0.062 usec       cbp=0x0f  
 MMX    -   calc_cbp#4 0.061 usec       cbp=0x05  
  ---  
 MMXEXT -   calc_cbp#1 0.062 usec       cbp=0x15  
 MMXEXT -   calc_cbp#2 0.061 usec       cbp=0x38  
 MMXEXT -   calc_cbp#3 0.061 usec       cbp=0x0f  
 MMXEXT -   calc_cbp#4 0.061 usec       cbp=0x05  
  ---  
 3DNOW  -   calc_cbp#1 0.168 usec       cbp=0x15  
 3DNOW  -   calc_cbp#2 0.168 usec       cbp=0x38  
 3DNOW  -   calc_cbp#3 0.157 usec       cbp=0x0f  
 3DNOW  -   calc_cbp#4 0.238 usec       cbp=0x05  
  ---  
 3DNOWE -   calc_cbp#1 0.049 usec       cbp=0x15  
 3DNOWE -   calc_cbp#2 0.049 usec       cbp=0x38  
 3DNOWE -   calc_cbp#3 0.049 usec       cbp=0x0f  
 3DNOWE -   calc_cbp#4 0.049 usec       cbp=0x05  
  ---  
   
   
 NB: If a function isn't optimised for a specific set of intructions,  
     a C function is used instead. So don't panic if some functions  
     may appear to be slow.  
   
 NB: MMX mpeg4 quantization is known to have very small errors (+/-1 magnitude)  
     for 1 or 2 coefficients a block. This is mainly caused by the fact the unit  
     test goes far behind the usual limits of real encoding. Please do not report  
     this error to the developers  
   
 *********************************************************************/  

Legend:
Removed from v.1614  
changed lines
  Added in v.1794

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4