[svn] / trunk / xvidcore / examples / xvid_bench.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/examples/xvid_bench.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1613, Mon Apr 18 08:31:42 2005 UTC revision 1731, Wed Oct 11 14:55:28 2006 UTC
# Line 19  Line 19 
19   *  along with this program; if not, write to the Free Software   *  along with this program; if not, write to the Free Software
20   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22   * $Id: xvid_bench.c,v 1.16 2005-04-18 08:31:42 Skal Exp $   * $Id: xvid_bench.c,v 1.29 2006-10-11 14:55:28 Skal Exp $
23   *   *
24   ****************************************************************************/   ****************************************************************************/
25    
# Line 65  Line 65 
65  #define M_PI            3.14159265358979323846  #define M_PI            3.14159265358979323846
66  #endif  #endif
67    
68  const int speed_ref = 100;  /* on slow machines, decrease this value */  int speed_ref = 100;  /* on slow machines, decrease this value */
69    int verbose = 0;
70    unsigned int cpu_mask;
71    
72  /*********************************************************************  /*********************************************************************
73   * misc   * misc
# Line 110  Line 112 
112          unsigned int cpu;          unsigned int cpu;
113  } CPU;  } CPU;
114    
115  CPU cpu_list[] =  CPU cpu_list[] = {
116  { { "PLAINC", 0 }          { "PLAINC ", 0 },
117  #ifdef ARCH_IS_IA32  #ifdef ARCH_IS_IA32
118    , { "MMX   ", XVID_CPU_MMX }          { "MMX    ", XVID_CPU_MMX },
119    , { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }          { "MMXEXT ", XVID_CPU_MMXEXT | XVID_CPU_MMX },
120    , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }          { "SSE2   ", XVID_CPU_SSE2 | XVID_CPU_MMX },
121    , { "3DNOW ", XVID_CPU_3DNOW }          { "3DNOW  ", XVID_CPU_3DNOW },
122    , { "3DNOWE", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT }          { "3DNOWE ", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT },
123  #endif  #endif
124  #ifdef ARCH_IS_PPC  #ifdef ARCH_IS_PPC
125    , { "ALTIVEC", XVID_CPU_ALTIVEC }          { "ALTIVEC", XVID_CPU_ALTIVEC },
126  #endif  #endif
127  #ifdef ARCH_IS_X86_64  #ifdef ARCH_IS_X86_64
128    , { "X86_64", XVID_CPU_ASM}          { "X86_64 ", XVID_CPU_ASM},
129  #endif  #endif
130  //, { "IA64  ", XVID_CPU_IA64 }  #ifdef ARCH_IS_IA64
131  //, { "TSC   ", XVID_CPU_TSC }  //      { "IA64   ", XVID_CPU_IA64 },
   , { 0, 0 } };  
   
 CPU  cpu_short_list[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
 //, { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }  
132  #endif  #endif
133  //, { "IA64  ", XVID_CPU_IA64 }  //      { "TSC    ", XVID_CPU_TSC },
134    , { 0, 0 } };          { 0, 0 }
135    };
 CPU cpu_short_list2[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
   , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }  
 #endif  
   , { 0, 0 } };  
136    
137    
138  int init_cpu(CPU *cpu)  int init_cpu(CPU *cpu)
# Line 257  Line 245 
245  };  };
246    
247  uint32_t  uint32_t
248  calc_crc(uint8_t *mem, int len, uint32_t initial)  calc_crc(uint8_t *mem, int len, uint32_t crc)
249  {  {
   
         register unsigned int crc;  
   
         crc = initial;  
   
250          while( len >= 8) {          while( len >= 8) {
251                  DO8(mem, crc);                  DO8(mem, crc);
252                  len -= 8;                  len -= 8;
# Line 274  Line 257 
257                  len--;                  len--;
258          }          }
259    
260          return(crc);          return crc;
261    }
262    
263    void byte_swap(uint8_t *mem, int len, int element_size) {
264    #ifdef ARCH_IS_BIG_ENDIAN
265            int i;
266    
267            if(element_size == 1) {
268                    /* No need to swap */
269            } else if(element_size == 2) {
270                    uint8_t temp[2];
271    
272                    for(i=0; i < (len/2); i++ ) {
273                            temp[0] = mem[0];
274                            temp[1] = mem[1];
275                            mem[0] = temp[1];
276                            mem[1] = temp[0];
277    
278                            mem += 2;
279                    }
280            } else if(element_size == 4) {
281                    uint8_t temp[4];
282    
283                    for(i=0; i < (len/4); i++ ) {
284                            temp[0] = mem[0];
285                            temp[1] = mem[1];
286                            temp[2] = mem[2];
287                            temp[3] = mem[3];
288                            mem[0] = temp[3];
289                            mem[1] = temp[2];
290                            mem[2] = temp[1];
291                            mem[3] = temp[0];
292    
293                            mem += 4;
294                    }
295            } else {
296                    printf("ERROR: byte_swap unsupported element_size(%u)\n", element_size);
297            }
298    #endif
299  }  }
300    
301  /*********************************************************************  /*********************************************************************
# Line 498  Line 518 
518                             (iCrc!=8107)?"| ERROR": "" );                             (iCrc!=8107)?"| ERROR": "" );
519  #endif  #endif
520    
521        /* New functions for field prediction by CK 1.10.2005 */
522    #pragma NEW8X4
523                    TEST_MB(interpolate8x4_halfpel_h, 0);
524                    printf("%s - interpfield-h -round0 %.3f usec       crc32=0x%08x %s\n",
525                               cpu->name, t, iCrc,
526                               (iCrc!=0x9538d6df)?"| ERROR": "" );
527    
528                    TEST_MB(interpolate8x4_halfpel_h, 1);
529                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
530                               cpu->name, t, iCrc,
531                               (iCrc!=0xde5f1db4)?"| ERROR": "" );
532    
533    
534                    TEST_MB(interpolate8x4_halfpel_v, 0);
535                    printf("%s - interpfield- v-round0 %.3f usec       crc32=0x%08x %s\n",
536                               cpu->name, t, iCrc,
537                               (iCrc!=0xea5a69ef)?"| ERROR": "" );
538    
539                    TEST_MB(interpolate8x4_halfpel_v, 1);
540                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
541                               cpu->name, t, iCrc,
542                               (iCrc!=0x4f10ec0f)?"| ERROR": "" );
543    
544    
545                    TEST_MB(interpolate8x4_halfpel_hv, 0);
546                    printf("%s - interpfield-hv-round0 %.3f usec       crc32=0x%08x %s\n",
547                               cpu->name, t, iCrc,
548                               (iCrc!=0xf97ee367)?"| ERROR": "" );
549    
550                    TEST_MB(interpolate8x4_halfpel_hv, 1);
551                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
552                               cpu->name, t, iCrc,
553                               (iCrc!=0xb6a9f581)?"| ERROR": "" );
554    /* End of 8x4 functions */
555    
556                  printf( " --- \n" );                  printf( " --- \n" );
557          }          }
558  }  }
559    
560    #undef ENTER
561    #undef LEAVE
562    #undef TEST_MB
563    #undef TEST_MB2
564    
565  /*********************************************************************  /*********************************************************************
566   * test transfer   * test transfer
567   *********************************************************************/   *********************************************************************/
# Line 531  Line 591 
591  }                                         \  }                                         \
592  emms();                                   \  emms();                                   \
593  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
594  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
595    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
596    
597  #define TEST_TRANSFER(FUNC, DST, SRC)         \  #define TEST_TRANSFER(FUNC, DST, SRC)         \
598  TEST_TRANSFER_BEGIN(DST);                 \  TEST_TRANSFER_BEGIN(DST);                 \
# Line 557  Line 618 
618  }                                         \  }                                         \
619  emms();                                   \  emms();                                   \
620  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
621  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
622    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
623    
624  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \
625  TEST_TRANSFER2_BEGIN(DST,SRC);            \  TEST_TRANSFER2_BEGIN(DST,SRC);            \
# Line 574  Line 636 
636          const int nb_tests = 4000*speed_ref;          const int nb_tests = 4000*speed_ref;
637          int i;          int i;
638          CPU *cpu;          CPU *cpu;
639          uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];  //      uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];
640          int16_t Src16[8*32], Dst16[8*32];  //      int16_t Src16[8*32], Dst16[8*32];
641      DECLARE_ALIGNED_MATRIX(Src8, 8, 32, uint8_t, CACHE_LINE);
642      DECLARE_ALIGNED_MATRIX(Dst8, 8, 32, uint8_t, CACHE_LINE);
643      DECLARE_ALIGNED_MATRIX(Ref1, 8, 32, uint8_t, CACHE_LINE);
644      DECLARE_ALIGNED_MATRIX(Ref2, 8, 32, uint8_t, CACHE_LINE);
645      DECLARE_ALIGNED_MATRIX(Src16, 8, 32, uint16_t, CACHE_LINE);
646      DECLARE_ALIGNED_MATRIX(Dst16, 8, 32, uint16_t, CACHE_LINE);
647    
648          printf( "\n ===  test transfer ===\n" );          printf( "\n ===  test transfer ===\n" );
649    
# Line 597  Line 665 
665                                  cpu->name, t, s,                                  cpu->name, t, s,
666                                  (s!=0xee7ccbb4)?"| ERROR": "");                                  (s!=0xee7ccbb4)?"| ERROR": "");
667    
668        /* New functions for field prediction by CK 1.10.2005 */
669    #pragma NEW8X4
670                    TEST_TRANSFER(transfer8x4_copy, Dst8, Src8);
671                    printf("%s - 8to4      %.3f usec       crc32=0x%08x %s\n",
672                               cpu->name, t, s,
673                               (s!=0xbb9c3db5)?"| ERROR": "");
674    /* End of new functions */
675    
676                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);
677                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",
678                             cpu->name, t, s,                             cpu->name, t, s,
# Line 610  Line 686 
686                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);
687                  {                  {
688                          int s1, s2;                          int s1, s2;
689                          s1 = calc_crc((uint8_t*)Dst16, sizeof(Dst16), CRC32_INITIAL);                          s1 = calc_crc((uint8_t*)Dst16, 8*32*sizeof(Dst16[0]), CRC32_INITIAL);
690                          s2 = calc_crc((uint8_t*)Src8, sizeof(Src8), CRC32_INITIAL);                          s2 = calc_crc((uint8_t*)Src8, 8*32*sizeof(Src8[0]), CRC32_INITIAL);
691                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",
692                                     cpu->name, t, s1, s2,                                     cpu->name, t, s1, s2,
693                                     (s1!=0xa1e07163)?"| ERROR1": "",                                     (s1!=0xa1e07163)?"| ERROR1": "",
# Line 640  Line 716 
716    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
717          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
718            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \
719          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
720            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
721    }                                         \    }                                         \
722    emms();                                   \    emms();                                   \
723  }                                           \  }                                           \
# Line 655  Line 732 
732    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
733          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
734            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \
735          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
736            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
737    }                                         \    }                                         \
738    emms();                                   \    emms();                                   \
739  }                                           \  }                                           \
# Line 875  Line 953 
953   * test non-zero AC counting   * test non-zero AC counting
954   *********************************************************************/   *********************************************************************/
955    
956  #define TEST_CBP(FUNC, SRC)               \  #define TEST_CBP(FUNC, SRC, NB)           \
957  t = gettime_usec();                       \  t = gettime_usec();                       \
958  emms();                                   \  emms();                                   \
959  for(tst=0; tst<nb_tests; ++tst) {         \  for(tst=0; tst<NB; ++tst) {         \
960    cbp = (FUNC)((SRC));                    \    cbp = (FUNC)((SRC));                    \
961  }                                         \  }                                         \
962  emms();                                   \  emms();                                   \
# Line 887  Line 965 
965  void test_cbp()  void test_cbp()
966  {  {
967          const int nb_tests = 10000*speed_ref;          const int nb_tests = 10000*speed_ref;
968          int i;          int i, n, m;
969          CPU *cpu;          CPU *cpu;
970          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);
971          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);
972          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);
973          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);
974      DECLARE_ALIGNED_MATRIX(Src5, 6, 64, int16_t, 16);
975    
976          printf( "\n =====  test cbp =====\n" );          printf( "\n =====  test cbp =====\n" );
977    
# Line 901  Line 980 
980                  Src2[i] = (i<3*64);               /* half-full */                  Src2[i] = (i<3*64);               /* half-full */
981                  Src3[i] = ((i+32)>3*64);                  Src3[i] = ((i+32)>3*64);
982                  Src4[i] = (i==(3*64+2) || i==(5*64+9));                  Src4[i] = (i==(3*64+2) || i==(5*64+9));
983        Src5[i] = ieee_rand(0,1) ? -1 : 1;  /* +/- test */
984          }          }
985    
986          for(cpu = cpu_list; cpu->name!=0; ++cpu)          for(cpu = cpu_list; cpu->name!=0; ++cpu)
# Line 911  Line 991 
991                  if (!init_cpu(cpu))                  if (!init_cpu(cpu))
992                          continue;                          continue;
993    
994                  TEST_CBP(calc_cbp, Src1);                  TEST_CBP(calc_cbp, Src1, nb_tests);
995                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x %s\n",
996                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");
997                  TEST_CBP(calc_cbp, Src2);                  TEST_CBP(calc_cbp, Src2, nb_tests);
998                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x %s\n",
999                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");
1000                  TEST_CBP(calc_cbp, Src3);                  TEST_CBP(calc_cbp, Src3, nb_tests);
1001                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x %s\n",
1002                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );
1003                  TEST_CBP(calc_cbp, Src4);                  TEST_CBP(calc_cbp, Src4, nb_tests);
1004                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1005                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );
1006                    TEST_CBP(calc_cbp, Src5, nb_tests);
1007                    printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1008                               cpu->name, t, cbp, (cbp!=0x3f)?"| ERROR": "" );
1009                  printf( " --- \n" );                  printf( " --- \n" );
1010          }          }
1011    
1012            for(cpu = cpu_list; cpu->name!=0; ++cpu)  /* bench suggested by Carlo (carlo dot bramix at libero dot it) */
1013            {
1014                    double t;
1015                    int tst, cbp, err;
1016    
1017                    if (!init_cpu(cpu))
1018                            continue;
1019    
1020        err = 0;
1021        for(n=0; n<6; ++n)
1022        {
1023          for(m=0; m<64; ++m)
1024          {
1025            for(i=0; i<6*64; ++i)
1026              Src1[i] = (i== (m + n*64));
1027    
1028            TEST_CBP(calc_cbp, Src1, 1);
1029            if (cbp!= (((m!=0)<<(5-n))))
1030            {
1031              printf( "%s -   calc_cbp#5: ERROR at pos %d / %d!\n", cpu->name, n, m);
1032              err = 1;
1033              break;
1034            }
1035          }
1036        }
1037        if (!err)
1038          printf( " %s -    calc_cbp#5 : OK\n", cpu->name );
1039    
1040            }
1041  }  }
1042    
1043  /*********************************************************************  /*********************************************************************
# Line 1318  Line 1431 
1431   * measure raw decoding speed   * measure raw decoding speed
1432   *********************************************************************/   *********************************************************************/
1433    
1434  void test_dec(const char *name, int width, int height, int with_chksum)  void test_dec(const char *name, int width, int height, int ref_chksum)
1435  {  {
1436          FILE *f = 0;          FILE *f = 0;
1437          void *dechandle = 0;          void *dechandle = 0;
# Line 1329  Line 1442 
1442          double t = 0.;          double t = 0.;
1443          int nb = 0;          int nb = 0;
1444          uint8_t *buf = 0;          uint8_t *buf = 0;
1445          uint8_t *rgb_out = 0;          uint8_t *yuv_out = 0;
1446          int buf_size, pos;          int buf_size, pos;
1447          uint32_t chksum = 0;          uint32_t chksum = 0;
1448            int bps = (width+31) & ~31;
1449    
1450          memset(&xinit, 0, sizeof(xinit));          memset(&xinit, 0, sizeof(xinit));
1451          xinit.cpu_flags = XVID_CPU_MMX | XVID_CPU_FORCE;          xinit.cpu_flags = cpu_mask;
1452          xinit.version = XVID_VERSION;          xinit.version = XVID_VERSION;
1453          xvid_global(NULL, 0, &xinit, NULL);          xvid_global(NULL, 0, &xinit, NULL);
1454    
# Line 1344  Line 1458 
1458          xparam.version = XVID_VERSION;          xparam.version = XVID_VERSION;
1459          xerr = xvid_decore(NULL, XVID_DEC_CREATE, &xparam, NULL);          xerr = xvid_decore(NULL, XVID_DEC_CREATE, &xparam, NULL);
1460          if (xerr==XVID_ERR_FAIL) {          if (xerr==XVID_ERR_FAIL) {
1461                  printf("can't init decoder (err=%d)\n", xerr);                  printf("ERROR: can't init decoder (err=%d)\n", xerr);
1462                  return;                  return;
1463          }          }
1464          dechandle = xparam.handle;          dechandle = xparam.handle;
# Line 1352  Line 1466 
1466    
1467          f = fopen(name, "rb");          f = fopen(name, "rb");
1468          if (f==0) {          if (f==0) {
1469                  printf( "can't open file '%s'\n", name);                  printf( "ERROR: can't open file '%s'\n", name);
1470                  return;                  return;
1471          }          }
1472          fseek(f, 0, SEEK_END);          fseek(f, 0, SEEK_END);
1473          buf_size = ftell(f);          buf_size = ftell(f);
1474          fseek(f, 0, SEEK_SET);          fseek(f, 0, SEEK_SET);
1475          if (buf_size<=0) {          if (buf_size<=0) {
1476                  printf("error while stating file\n");                  printf("ERROR: error while stating file\n");
1477                  goto End;                  goto End;
1478          }          }
         else printf( "Input size: %d\n", buf_size);  
1479    
1480          buf = malloc(buf_size); /* should be enuf' */          buf = malloc(buf_size);
1481          rgb_out = calloc(4, width*height);  /* <-room for _RGB24 */          yuv_out = calloc(1, bps*height*3/2 + 15);
1482          if (buf==0 || rgb_out==0) {          if (buf==0 || yuv_out==0) {
1483                  printf( "malloc failed!\n" );                  printf( "ERROR: malloc failed!\n" );
1484                  goto End;                  goto End;
1485          }          }
1486    
1487          if (fread(buf, buf_size, 1, f)!=1) {          if (fread(buf, buf_size, 1, f)!=1) {
1488                  printf( "file-read failed\n" );                  printf( "ERROR: file-read failed\n" );
1489                  goto End;                  goto End;
1490          }          }
1491    
# Line 1380  Line 1493 
1493          pos = 0;          pos = 0;
1494          t = -gettime_usec();          t = -gettime_usec();
1495          while(1) {          while(1) {
1496              int y;
1497    
1498                  memset(&xframe, 0, sizeof(xframe));                  memset(&xframe, 0, sizeof(xframe));
1499                  xframe.version = XVID_VERSION;                  xframe.version = XVID_VERSION;
1500                  xframe.bitstream = buf + pos;                  xframe.bitstream = buf + pos;
1501                  xframe.length = buf_size - pos;                  xframe.length = buf_size - pos;
1502                  xframe.output.plane[0] = rgb_out;                  xframe.output.plane[0] = (uint8_t*)(((size_t)yuv_out + 15) & ~15);
1503                  xframe.output.stride[0] = width;                  xframe.output.plane[1] = (uint8_t*)xframe.output.plane[0] + bps*height;
1504                  xframe.output.csp = XVID_CSP_BGR;                  xframe.output.plane[2] = (uint8_t*)xframe.output.plane[1] + bps/2;
1505                    xframe.output.stride[0] = bps;
1506                    xframe.output.stride[1] = bps;
1507                    xframe.output.stride[2] = bps;
1508                    xframe.output.csp = XVID_CSP_I420;
1509                  xerr = xvid_decore(dechandle, XVID_DEC_DECODE, &xframe, 0);                  xerr = xvid_decore(dechandle, XVID_DEC_DECODE, &xframe, 0);
1510                    if (xerr<0) {
1511                            printf("ERROR: decoding failed for frame #%d (err=%d)!\n", nb, xerr);
1512                            break;
1513                    }
1514                    else if (xerr==0)
1515                      break;
1516        else if (verbose>0) printf("#%d %d\n", nb, xerr );
1517    
1518                    pos += xerr;
1519                  nb++;                  nb++;
1520                  pos += xframe.length;  
1521                  if (with_chksum) {      for(y=0; y<height/2; ++y) {
1522                          int k = width*height;                    chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+0)*bps, width, chksum);
1523                          uint32_t *ptr = (uint32_t *)rgb_out;                          chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+1)*bps, width, chksum);
1524                          while(k-->0) chksum += *ptr++;                          chksum = calc_crc((uint8_t*)xframe.output.plane[1] + y*bps, width/2, chksum);
1525                            chksum = calc_crc((uint8_t*)xframe.output.plane[2] + y*bps, width/2, chksum);
1526                  }                  }
1527                  if (pos==buf_size)                  if (pos==buf_size)
1528                          break;                          break;
                 if (xerr==XVID_ERR_FAIL) {  
                         printf("decoding failed for frame #%d (err=%d)!\n", nb, xerr);  
                         break;  
                 }  
1529          }          }
1530          t += gettime_usec();          t += gettime_usec();
1531            if (ref_chksum==0) {
1532          if (t>0.)          if (t>0.)
1533                  printf( "%d frames decoded in %.3f s -> %.1f FPS\n", nb, t*1.e-6f, (float)(nb*1.e6f/t) );                    printf( "%d frames decoded in %.3f s -> %.1f FPS   Checksum:0x%.8x\n", nb, t*1.e-6f, (float)(nb*1.e6f/t), chksum );
1534          if (with_chksum)    }
1535                  printf("checksum: 0x%.8x\n", chksum);    else {
1536                    printf("FPS:%.1f Checksum: 0x%.8x Expected:0x%.8x | %s\n",
1537                      t>0. ? (float)(nb*1.e6f/t) : 0.f, chksum, ref_chksum, (chksum==ref_chksum) ? "OK" : "ERROR");
1538      }
1539    
1540   End:   End:
1541          if (rgb_out!=0) free(rgb_out);          if (yuv_out!=0) free(yuv_out);
1542          if (buf!=0) free(buf);          if (buf!=0) free(buf);
1543          if (dechandle!=0) {          if (dechandle!=0) {
1544                  xerr= xvid_decore(dechandle, XVID_DEC_DESTROY, NULL, NULL);                  xerr= xvid_decore(dechandle, XVID_DEC_DESTROY, NULL, NULL);
1545                  if (xerr==XVID_ERR_FAIL)                  if (xerr==XVID_ERR_FAIL)
1546                          printf("destroy-decoder failed (err=%d)!\n", xerr);                          printf("ERROR: destroy-decoder failed (err=%d)!\n", xerr);
1547          }          }
1548          if (f!=0) fclose(f);          if (f!=0) fclose(f);
1549  }  }
# Line 1578  Line 1707 
1707  }  }
1708    
1709  /*********************************************************************  /*********************************************************************
1710     * test some YUV func
1711     *********************************************************************/
1712    
1713    #define ENTER \
1714    for(i=0; i<(int)sizeof(Dst0); ++i) Dst0[0][i] = 0;   \
1715    t = gettime_usec();                   \
1716    emms();
1717    
1718    #define LEAVE \
1719    emms();                             \
1720    t = (gettime_usec() - t) / nb_tests;  \
1721            iCrc = calc_crc((uint8_t*)Dst0, sizeof(Dst0), CRC32_INITIAL)
1722    
1723    #define TEST_YUYV(FUNC, S)                \
1724    ENTER                               \
1725    for(tst=0; tst<nb_tests; ++tst) (FUNC)(Dst0[0], S*WIDTH, Src0[0], Src0[1], Src0[2], WIDTH, WIDTH/2, WIDTH, HEIGHT, 0); \
1726    LEAVE
1727    
1728    #define WIDTH 64
1729    #define HEIGHT 64
1730    void test_yuv()
1731    {
1732            const int nb_tests = 200*speed_ref;
1733            CPU *cpu;
1734            uint8_t Src0[3][WIDTH*HEIGHT];
1735            uint8_t Dst0[4][WIDTH*HEIGHT];
1736            int i, j;
1737            double t;
1738            int tst, iCrc;
1739    
1740            colorspace_init();
1741            ieee_reseed(1);
1742            for(i=0; i<(int)sizeof(Src0); ++i) Src0[0][i] = ieee_rand(0,255);
1743    
1744            printf( "\n ===  test YUV ===\n" );
1745    
1746            init_cpu(&cpu_list[0]);
1747            TEST_YUYV(yv12_to_yuyv_c, 4);
1748            printf(" yv12_to_yuyv_c %.3f usec       crc32=0x%08x %s\n",
1749                       t, iCrc, (iCrc!=0xeb1a0b0a)?"| ERROR": "" );
1750            TEST_YUYV(yv12_to_uyvy_c, 4);
1751            printf(" yv12_to_uyvy_c %.3f usec       crc32=0x%08x %s\n",
1752                       t, iCrc, (iCrc!=0x6e82f55b)?"| ERROR": "" );
1753    
1754    #ifdef ARCH_IS_IA32
1755            init_cpu(&cpu_list[1]);
1756            TEST_YUYV(yv12_to_yuyv_mmx, 4);
1757            printf(" yv12_to_yuyv_mmx %.3f usec       crc32=0x%08x %s\n",
1758                    t, iCrc, (iCrc!=0xeb1a0b0a)?"| ERROR": "" );
1759    
1760            TEST_YUYV(yv12_to_uyvy_mmx, 4);
1761            printf(" yv12_to_uyvy_mmx %.3f usec       crc32=0x%08x %s\n",
1762                    t, iCrc, (iCrc!=0x6e82f55b)?"| ERROR": "" );
1763    #endif
1764    
1765    #ifdef ARCH_IS_PPC
1766            init_cpu(&cpu_list[1]);
1767            TEST_YUYV(yv12_to_yuyv_altivec_c, 4);
1768            printf(" yv12_to_yuyv_altivec_c %.3f usec       crc32=0x%08x %s\n",
1769                    t, iCrc, (iCrc!=0xeb1a0b0a)?"| ERROR": "" );
1770    
1771            TEST_YUYV(yv12_to_uyvy_altivec_c, 4);
1772            printf(" yv12_to_uyvy_altivec_c %.3f usec       crc32=0x%08x %s\n",
1773                    t, iCrc, (iCrc!=0x6e82f55b)?"| ERROR": "" );
1774    #endif
1775            printf( " --- \n" );
1776    }
1777    #undef WIDTH
1778    #undef HEIGHT
1779    #undef ENTER
1780    #undef LEAVE
1781    
1782    /*********************************************************************/
1783    
1784    static uint32_t __inline log2bin_v1(uint32_t value)
1785    {
1786      int n = 0;
1787      while (value) {
1788        value >>= 1;
1789        n++;
1790      }
1791      return n;
1792    }
1793    
1794    static const uint8_t log2_tab_16[16] =  { 0, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4 };
1795    
1796    static uint32_t __inline log2bin_v2(uint32_t value)
1797    {
1798      int n = 0;
1799      if (value & 0xffff0000) {
1800        value >>= 16;
1801        n += 16;
1802      }
1803      if (value & 0xff00) {
1804        value >>= 8;
1805        n += 8;
1806      }
1807      if (value & 0xf0) {
1808        value >>= 4;
1809        n += 4;
1810      }
1811     return n + log2_tab_16[value];
1812    }
1813    
1814    void test_log2bin()
1815    {
1816            const int nb_tests = 3000*speed_ref;
1817      int n, crc1=0, crc2=0;
1818      uint32_t s, s0;
1819      double t1, t2;
1820    
1821      t1 = gettime_usec();
1822      s0 = (int)(t1*31.241);
1823      for(s=s0, n=0; n<nb_tests; ++n, s=(s*12363+31)&0x7fffffff)
1824        crc1 += log2bin_v1(s);
1825      t1 = (gettime_usec()-t1) / nb_tests;
1826    
1827      t2 = gettime_usec();
1828      for(s=s0, n=0; n<nb_tests; ++n, s=(s*12363+31)&0x7fffffff)
1829        crc2 += log2bin_v2(s);
1830      t2 = (gettime_usec() - t2) / nb_tests;
1831    
1832      printf( "log2bin_v1: %.3f sec  crc=%d\n", t1, crc1 );
1833      printf( "log2bin_v2: %.3f sec  crc=%d\n", t2, crc2 );
1834      if (crc1!=crc2) printf( " CRC ERROR !\n" );
1835    }
1836    
1837    /*********************************************************************/
1838    
1839    static void __inline old_gcd(int *num, int *den)
1840    {
1841     int i = *num;
1842      while (i > 1) {
1843        if (*num % i == 0 && *den % i == 0) {
1844          *num /= i;
1845          *den /= i;
1846          i = *num;
1847          continue;
1848        }
1849        i--;
1850      }
1851    }
1852    
1853    static uint32_t gcd(int num, int den)
1854    {
1855      int tmp;
1856      while( (tmp=num%den) ) { num = den; den = tmp; }
1857      return den;
1858    }
1859    static void __inline new_gcd(int *num, int *den)
1860    {
1861      const int div = gcd(*num, *den);
1862      if (num) {
1863        *num /= div;
1864        *den /= div;
1865      }
1866    }
1867    
1868    void test_gcd()
1869    {
1870            const int nb_tests = 10*speed_ref;
1871      int i;
1872      uint32_t crc1=0, crc2=0;
1873      uint32_t n0, n, d0, d;
1874      double t1, t2;
1875    
1876      t1 = gettime_usec();
1877      n0 = 0xfffff & (int)(t1*31.241);
1878      d0 = 0xfffff & (int)( ((n0*4123)%17) | 1 );
1879      for(n=n0, d=d0, i=0; i<nb_tests; ++i) {
1880        old_gcd(&n, &d);
1881        crc1 = (((crc1>>4)^d) + ((crc1<<2)^n) ) & 0xffffff;
1882        n = d;
1883        d = (d*12363+31) & 0xffff;
1884        d |= !d;
1885      }
1886      t1 = (gettime_usec()-t1) / nb_tests;
1887    
1888      t2 = gettime_usec();
1889      for(n=n0, d=d0, i=0; i<nb_tests; ++i) {
1890        new_gcd(&n, &d);
1891        crc2 = (((crc2>>4)^d) + ((crc2<<2)^n) ) & 0xffffff;
1892        n = d;
1893        d = (d*12363+31) & 0xffff;
1894        d |= !d;
1895      }
1896      t2 = (gettime_usec() - t2) / nb_tests;
1897    
1898      printf( "old_gcd: %.3f sec  crc=%d\n", t1, crc1 );
1899      printf( "new_gcd: %.3f sec  crc=%d\n", t2, crc2 );
1900      if (crc1!=crc2) printf( " CRC ERROR !\n" );
1901    }
1902    
1903    /*********************************************************************
1904     * test compiler
1905     *********************************************************************/
1906    
1907    void test_compiler() {
1908      int nb_err = 0;
1909      int32_t v;
1910      if (sizeof(uint16_t)<2) {
1911        printf( "ERROR: sizeof(uint16_t)<2 !!\n" );
1912        nb_err++;
1913      }
1914      if (sizeof(int16_t)<2) {
1915        printf( "ERROR: sizeof(int16_t)<2 !!\n" );
1916        nb_err++;
1917      }
1918      if (sizeof(uint8_t)!=1) {
1919        printf( "ERROR: sizeof(uint8_t)!=1 !!\n" );
1920        nb_err++;
1921      }
1922      if (sizeof(int8_t)!=1) {
1923        printf( "ERROR: sizeof(int8_t)!=1 !!\n" );
1924        nb_err++;
1925      }
1926      if (sizeof(uint32_t)<4) {
1927        printf( "ERROR: sizeof(uint32_t)<4 !!\n" );
1928        nb_err++;
1929      }
1930      if (sizeof(int32_t)<4) {
1931        printf( "ERROR: sizeof(int32_t)<4 !!\n" );
1932        nb_err++;
1933      }
1934             /* yes, i know, this test is silly. But better be safe than sorry. :) */
1935      for(v=1000; v>=0; v--) {
1936        if ( (v>>2) != v/4)
1937          nb_err++;
1938      }
1939      for(v=-1000; v!=-1; v++) {
1940        if ( (v>>2) != (v/4)-!!(v%4))
1941          nb_err++;
1942      }
1943      if (nb_err!=0) {
1944        printf( "ERROR! please post your platform/compiler specs to xvid-devel@xvid.org !\n" );
1945      }
1946    }
1947    /*********************************************************************
1948     * test SSIM functions
1949     *********************************************************************/
1950    
1951    typedef int (*lumfunc)(uint8_t* ptr, int stride);
1952    typedef void (*csfunc)(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
1953    
1954    extern int lum_8x8_c(uint8_t* ptr, int stride);
1955    extern int lum_8x8_mmx(uint8_t* ptr, int stride);
1956    extern int lum_2x8_c(uint8_t* ptr, int stride);
1957    extern void iconsim_c(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
1958    extern void consim_mmx(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
1959    extern void consim_sse2(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
1960    
1961    void test_SSIM()
1962    {
1963            const int nb_tests = 3000*speed_ref;
1964            int tst;
1965            CPU *cpu;
1966            int i;
1967            int devs[3];
1968            long lumo, lumc;
1969            DECLARE_ALIGNED_MATRIX(Ref1, 16, 16, uint8_t, 16);
1970            DECLARE_ALIGNED_MATRIX(Ref2, 16, 16, uint8_t, 16);
1971            lumfunc lum8x8;
1972            lumfunc lum2x8;
1973            csfunc  csim;
1974    
1975            ieee_reseed(1);
1976            printf( "\n ======  test SSIM ======\n" );
1977            for(i=0; i<16*16;++i) {
1978                    long v1, v2;
1979                    v1 = ieee_rand(-256, 511);
1980                    v2 = ieee_rand(-256, 511);
1981                    Ref1[i] = (v1<0) ? 0 : (v1>255) ? 255 : v1;
1982                    Ref2[i] = (v2<0) ? 0 : (v2>255) ? 255 : v2;
1983            }
1984            lumc = ieee_rand(0, 255);
1985            lumo = ieee_rand(0, 255);
1986    
1987            for(cpu = cpu_list; cpu->name!=0; ++cpu)
1988            {
1989                    double t;
1990                    int m;
1991                    if (!init_cpu(cpu))
1992                            continue;
1993                    lum8x8 = lum_8x8_c;
1994                    lum2x8 = lum_2x8_c;
1995                    csim   = iconsim_c;
1996                    if (cpu->cpu & XVID_CPU_MMX){
1997                            lum8x8 = lum_8x8_mmx;
1998                            csim = consim_mmx;
1999                    }
2000                    if (cpu->cpu & XVID_CPU_MMX){
2001                            csim = consim_sse2;
2002                    }
2003    
2004                    t = gettime_usec();
2005                    emms();
2006                    for(tst=0; tst<nb_tests; ++tst) m = lum8x8(Ref1, 16);
2007                    emms();
2008                    t = (gettime_usec() - t) / nb_tests;
2009                    printf("%s - ssim-lum8x8    %.3f usec       m=%d %s\n",
2010                               cpu->name, t, m,
2011                               (m!=8230)?"| ERROR": "" );
2012    
2013                    t = gettime_usec();
2014                    emms();
2015                    for(tst=0; tst<nb_tests; ++tst) m = lum2x8(Ref1, 16);
2016                    emms();
2017                    t = (gettime_usec() - t) / nb_tests;
2018                    printf("%s - ssim-lum2x8    %.3f usec       m=%d %s\n",
2019                               cpu->name, t, m,
2020                               (m!=-841)?"| ERROR": "" );
2021    
2022                    t = gettime_usec();
2023                    emms();
2024                    for(tst=0; tst<nb_tests; ++tst) csim(Ref1, Ref2, 16, lumo, lumc, devs+0, devs+1, devs+2);
2025                    emms();
2026                    t = (gettime_usec() - t) / nb_tests;
2027                    printf("%s - ssim-lum2x8    %.3f usec       devs=[0x%x 0x%x 0x%x] %s\n",
2028                               cpu->name, t, devs[0], devs[1], devs[2],
2029                               (devs[0]!=0xeba80 || devs[1]!=0x1053e7 ||  devs[2]!=0x51215)?"| ERROR": "" );
2030    
2031                    printf( " --- \n" );
2032            }
2033    }
2034    
2035    /*********************************************************************
2036   * main   * main
2037   *********************************************************************/   *********************************************************************/
2038    
2039  int main(int argc, char *argv[])  static void arg_missing(const char *opt)
2040    {
2041      printf( "missing argument after option '%s'\n", opt);
2042      exit(-1);
2043    }
2044    
2045    int main(int argc, const char *argv[])
2046  {  {
2047          int what = 0;          int c, what = 0;
2048          if (argc>1) what = atoi(argv[1]);          int width, height;
2049            uint32_t chksum = 0;
2050      const char * test_bitstream = 0;
2051    
2052            cpu_mask = 0;  // default => will use autodectect
2053            for(c=1; c<argc; ++c)
2054            {
2055              if (!strcmp(argv[c], "-v")) verbose++;
2056              else if (!strcmp(argv[c], "-c"))      cpu_mask = 0 /* PLAIN_C */ | XVID_CPU_FORCE;
2057              else if (!strcmp(argv[c], "-mmx"))    cpu_mask = XVID_CPU_MMX    | XVID_CPU_FORCE;
2058              else if (!strcmp(argv[c], "-mmxext")) cpu_mask = XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2059              else if (!strcmp(argv[c], "-sse2"))   cpu_mask = XVID_CPU_SSE2   | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2060              else if (!strcmp(argv[c], "-3dnow"))  cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_FORCE;
2061              else if (!strcmp(argv[c], "-3dnowe")) cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_3DNOWEXT | XVID_CPU_FORCE;
2062              else if (!strcmp(argv[c], "-altivec")) cpu_mask = XVID_CPU_ALTIVEC | XVID_CPU_FORCE;
2063              else if (!strcmp(argv[c], "-spd")) {
2064          if (++c==argc) arg_missing( argv[argc-1] );
2065          speed_ref = atoi(argv[c]);
2066        }
2067              else if (argv[c][0]!='-') {
2068                what = atoi(argv[c]);
2069                if (what==9) {
2070                  if (c+4>argc) {
2071                    printf("usage: %s %d bitstream width height (checksum)\n", argv[0], what);
2072                    exit(-1);
2073            }
2074            test_bitstream = argv[++c];
2075                  width  = atoi(argv[++c]);
2076                  height = atoi(argv[++c]);
2077                  if (c+1<argc && argv[c+1][0]!='-') {
2078                    if (sscanf(argv[c+1], "0x%x", &chksum)!=1) {
2079                      printf( "can't read checksum value.\n" );
2080                      exit(-1);
2081              }
2082              else c++;
2083            }
2084    //        printf( "[%s] %dx%d (0x%.8x)\n", test_bitstream, width, height, chksum);
2085          }
2086        }
2087        else {
2088          printf( "unrecognized option '%s'\n", argv[c]);
2089          exit(-1);
2090        }
2091      }
2092    
2093    
2094          if (what==0 || what==1) test_dct();          if (what==0 || what==1) test_dct();
2095          if (what==0 || what==2) test_mb();          if (what==0 || what==2) test_mb();
2096          if (what==0 || what==3) test_sad();          if (what==0 || what==3) test_sad();
# Line 1592  Line 2098 
2098          if (what==0 || what==5) test_quant();          if (what==0 || what==5) test_quant();
2099          if (what==0 || what==6) test_cbp();          if (what==0 || what==6) test_cbp();
2100          if (what==0 || what==10) test_sse();          if (what==0 || what==10) test_sse();
2101            if (what==0 || what==11) test_log2bin();
2102            if (what==0 || what==12) test_gcd();
2103            if (what==0 || what==13) test_compiler();
2104            if (what==0 || what==14) test_yuv();
2105            if (what==0 || what==15) test_SSIM();
2106    
2107    
2108          if (what==7) {          if (what==7) {
2109                  test_IEEE1180_compliance(-256, 255, 1);                  test_IEEE1180_compliance(-256, 255, 1);
# Line 1603  Line 2115 
2115          }          }
2116          if (what==8) test_dct_saturation(-256, 255);          if (what==8) test_dct_saturation(-256, 255);
2117    
2118          if (what==9) {          if (test_bitstream)
2119                  int width, height;            test_dec(test_bitstream, width, height, chksum);
                 if (argc<5) {  
                         printf("usage: %s %d [bitstream] [width] [height]\n", argv[0], what);  
                         return 1;  
                 }  
                 width = atoi(argv[3]);  
                 height = atoi(argv[4]);  
                 test_dec(argv[2], width, height, (argc>5));  
         }  
   
2120          if (what==-1) {          if (what==-1) {
2121                  test_dct_precision_diffs();                  test_dct_precision_diffs();
2122                  test_bugs1();                  test_bugs1();
# Line 1641  Line 2144 
2144          return 0;          return 0;
2145  }  }
2146    
2147  /*********************************************************************  /*********************************************************************/
  * 'Reference' output (except for timing) on an Athlon XP 2200+  
  *********************************************************************/  
   
 /* as of 2002-01-07, there's a problem with MMX mpeg4-quantization */  
 /* as of 2003-11-30, the problem is still here */  
   
 /*********************************************************************  
   
   
  ===== test fdct/idct =====  
 PLAINC -  2.867 usec       PSNR=13.291  MSE=3.000  
 MMX    -  -0.211 usec       PSNR=9.611  MSE=7.000  
 MMXEXT -  -0.256 usec       PSNR=9.611  MSE=7.000  
 3DNOW  -  2.855 usec       PSNR=13.291  MSE=3.000  
 3DNOWE -  1.429 usec       PSNR=13.291  MSE=3.000  
   
  ===  test block motion ===  
 PLAINC - interp- h-round0 0.538 usec       crc32=0x115381ba  
 PLAINC -           round1 0.527 usec       crc32=0x2b1f528f  
 PLAINC - interp- v-round0 0.554 usec       crc32=0x423cdcc7  
 PLAINC -           round1 0.551 usec       crc32=0x42202efe  
 PLAINC - interp-hv-round0 1.041 usec       crc32=0xd198d387  
 PLAINC -           round1 1.038 usec       crc32=0x9ecfd921  
  ---  
 MMX    - interp- h-round0 0.051 usec       crc32=0x115381ba  
 MMX    -           round1 0.053 usec       crc32=0x2b1f528f  
 MMX    - interp- v-round0 0.048 usec       crc32=0x423cdcc7  
 MMX    -           round1 0.048 usec       crc32=0x42202efe  
 MMX    - interp-hv-round0 0.074 usec       crc32=0xd198d387  
 MMX    -           round1 0.073 usec       crc32=0x9ecfd921  
  ---  
 MMXEXT - interp- h-round0 0.020 usec       crc32=0x115381ba  
 MMXEXT -           round1 0.025 usec       crc32=0x2b1f528f  
 MMXEXT - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 MMXEXT -           round1 0.024 usec       crc32=0x42202efe  
 MMXEXT - interp-hv-round0 0.037 usec       crc32=0xd198d387  
 MMXEXT -           round1 0.037 usec       crc32=0x9ecfd921  
  ---  
 3DNOW  - interp- h-round0 0.020 usec       crc32=0x115381ba  
 3DNOW  -           round1 0.029 usec       crc32=0x2b1f528f  
 3DNOW  - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 3DNOW  -           round1 0.024 usec       crc32=0x42202efe  
 3DNOW  - interp-hv-round0 0.038 usec       crc32=0xd198d387  
 3DNOW  -           round1 0.039 usec       crc32=0x9ecfd921  
  ---  
 3DNOWE - interp- h-round0 0.020 usec       crc32=0x115381ba  
 3DNOWE -           round1 0.024 usec       crc32=0x2b1f528f  
 3DNOWE - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 3DNOWE -           round1 0.021 usec       crc32=0x42202efe  
 3DNOWE - interp-hv-round0 0.037 usec       crc32=0xd198d387  
 3DNOWE -           round1 0.036 usec       crc32=0x9ecfd921  
  ---  
   
  ======  test SAD ======  
 PLAINC - sad8    0.505 usec       sad=3776  
 PLAINC - sad16   1.941 usec       sad=27214  
 PLAINC - sad16bi 4.925 usec       sad=26274  
 PLAINC - dev16   4.254 usec       sad=3344  
  ---  
 MMX    - sad8    0.036 usec       sad=3776  
 MMX    - sad16   0.107 usec       sad=27214  
 MMX    - sad16bi 0.259 usec       sad=26274  
 MMX    - dev16   0.187 usec       sad=3344  
  ---  
 MMXEXT - sad8    0.016 usec       sad=3776  
 MMXEXT - sad16   0.050 usec       sad=27214  
 MMXEXT - sad16bi 0.060 usec       sad=26274  
 MMXEXT - dev16   0.086 usec       sad=3344  
  ---  
 3DNOW  - sad8    0.506 usec       sad=3776  
 3DNOW  - sad16   1.954 usec       sad=27214  
 3DNOW  - sad16bi 0.119 usec       sad=26274  
 3DNOW  - dev16   4.252 usec       sad=3344  
  ---  
 3DNOWE - sad8    0.017 usec       sad=3776  
 3DNOWE - sad16   0.038 usec       sad=27214  
 3DNOWE - sad16bi 0.052 usec       sad=26274  
 3DNOWE - dev16   0.067 usec       sad=3344  
  ---  
   
  ===  test transfer ===  
 PLAINC - 8to16     0.603 usec       crc32=0x115814bb  
 PLAINC - 16to8     1.077 usec       crc32=0xee7ccbb4  
 PLAINC - 8to8      0.679 usec       crc32=0xd37b3295  
 PLAINC - 16to8add  1.341 usec       crc32=0xdd817bf4  
 PLAINC - 8to16sub  1.566 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 PLAINC - 8to16sub2 2.206 usec       crc32=0x99b6c4c7  
  ---  
 MMX    - 8to16     -0.025 usec       crc32=0x115814bb  
 MMX    - 16to8     -0.049 usec       crc32=0xee7ccbb4  
 MMX    - 8to8      0.014 usec       crc32=0xd37b3295  
 MMX    - 16to8add  0.011 usec       crc32=0xdd817bf4  
 MMX    - 8to16sub  0.108 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 MMX    - 8to16sub2 0.164 usec       crc32=0x99b6c4c7  
  ---  
 MMXEXT - 8to16     -0.054 usec       crc32=0x115814bb  
 MMXEXT - 16to8     0.010 usec       crc32=0xee7ccbb4  
 MMXEXT - 8to8      0.015 usec       crc32=0xd37b3295  
 MMXEXT - 16to8add  0.008 usec       crc32=0xdd817bf4  
 MMXEXT - 8to16sub  0.263 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 MMXEXT - 8to16sub2 0.178 usec       crc32=0x99b6c4c7  
  ---  
 3DNOW  - 8to16     0.666 usec       crc32=0x115814bb  
 3DNOW  - 16to8     1.078 usec       crc32=0xee7ccbb4  
 3DNOW  - 8to8      0.665 usec       crc32=0xd37b3295  
 3DNOW  - 16to8add  1.365 usec       crc32=0xdd817bf4  
 3DNOW  - 8to16sub  1.356 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 3DNOW  - 8to16sub2 2.098 usec       crc32=0x99b6c4c7  
  ---  
 3DNOWE - 8to16     -0.024 usec       crc32=0x115814bb  
 3DNOWE - 16to8     0.010 usec       crc32=0xee7ccbb4  
 3DNOWE - 8to8      0.014 usec       crc32=0xd37b3295  
 3DNOWE - 16to8add  0.016 usec       crc32=0xdd817bf4  
 3DNOWE - 8to16sub  -0.000 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 3DNOWE - 8to16sub2 -0.031 usec       crc32=0x99b6c4c7  
  ---  
   
  =====  test quant =====  
 PLAINC -   quant_mpeg_intra 98.631 usec       crc32=0xfd6a21a4  
 PLAINC -   quant_mpeg_inter 104.876 usec       crc32=0xf6de7757  
 PLAINC - dequant_mpeg_intra 50.285 usec       crc32=0x2def7bc7  
 PLAINC - dequant_mpeg_inter 58.316 usec       crc32=0xd878c722  
 PLAINC -   quant_h263_intra 33.803 usec       crc32=0x2eba9d43  
 PLAINC -   quant_h263_inter 45.411 usec       crc32=0xbd315a7e  
 PLAINC - dequant_h263_intra 39.302 usec       crc32=0x9841212a  
 PLAINC - dequant_h263_inter 44.124 usec       crc32=0xe7df8fba  
  ---  
 MMX    -   quant_mpeg_intra 4.273 usec       crc32=0xdacabdb6 | ERROR  
 MMX    -   quant_mpeg_inter 3.576 usec       crc32=0x72883ab6 | ERROR  
 MMX    - dequant_mpeg_intra 3.793 usec       crc32=0x2def7bc7  
 MMX    - dequant_mpeg_inter 4.808 usec       crc32=0xd878c722  
 MMX    -   quant_h263_intra 2.881 usec       crc32=0x2eba9d43  
 MMX    -   quant_h263_inter 2.550 usec       crc32=0xbd315a7e  
 MMX    - dequant_h263_intra 2.974 usec       crc32=0x9841212a  
 MMX    - dequant_h263_inter 2.906 usec       crc32=0xe7df8fba  
  ---  
 MMXEXT -   quant_mpeg_intra 4.221 usec       crc32=0xfd6a21a4  
 MMXEXT -   quant_mpeg_inter 4.339 usec       crc32=0xf6de7757  
 MMXEXT - dequant_mpeg_intra 3.802 usec       crc32=0x2def7bc7  
 MMXEXT - dequant_mpeg_inter 4.821 usec       crc32=0xd878c722  
 MMXEXT -   quant_h263_intra 2.884 usec       crc32=0x2eba9d43  
 MMXEXT -   quant_h263_inter 2.554 usec       crc32=0xbd315a7e  
 MMXEXT - dequant_h263_intra 2.728 usec       crc32=0x9841212a  
 MMXEXT - dequant_h263_inter 2.611 usec       crc32=0xe7df8fba  
  ---  
 3DNOW  -   quant_mpeg_intra 98.512 usec       crc32=0xfd6a21a4  
 3DNOW  -   quant_mpeg_inter 104.873 usec       crc32=0xf6de7757  
 3DNOW  - dequant_mpeg_intra 50.219 usec       crc32=0x2def7bc7  
 3DNOW  - dequant_mpeg_inter 58.254 usec       crc32=0xd878c722  
 3DNOW  -   quant_h263_intra 33.778 usec       crc32=0x2eba9d43  
 3DNOW  -   quant_h263_inter 41.998 usec       crc32=0xbd315a7e  
 3DNOW  - dequant_h263_intra 39.344 usec       crc32=0x9841212a  
 3DNOW  - dequant_h263_inter 43.607 usec       crc32=0xe7df8fba  
  ---  
 3DNOWE -   quant_mpeg_intra 98.490 usec       crc32=0xfd6a21a4  
 3DNOWE -   quant_mpeg_inter 104.889 usec       crc32=0xf6de7757  
 3DNOWE - dequant_mpeg_intra 3.277 usec       crc32=0x2def7bc7  
 3DNOWE - dequant_mpeg_inter 4.485 usec       crc32=0xd878c722  
 3DNOWE -   quant_h263_intra 1.882 usec       crc32=0x2eba9d43  
 3DNOWE -   quant_h263_inter 2.246 usec       crc32=0xbd315a7e  
 3DNOWE - dequant_h263_intra 3.457 usec       crc32=0x9841212a  
 3DNOWE - dequant_h263_inter 3.275 usec       crc32=0xe7df8fba  
  ---  
   
  =====  test cbp =====  
 PLAINC -   calc_cbp#1 0.168 usec       cbp=0x15  
 PLAINC -   calc_cbp#2 0.168 usec       cbp=0x38  
 PLAINC -   calc_cbp#3 0.157 usec       cbp=0x0f  
 PLAINC -   calc_cbp#4 0.235 usec       cbp=0x05  
  ---  
 MMX    -   calc_cbp#1 0.070 usec       cbp=0x15  
 MMX    -   calc_cbp#2 0.062 usec       cbp=0x38  
 MMX    -   calc_cbp#3 0.062 usec       cbp=0x0f  
 MMX    -   calc_cbp#4 0.061 usec       cbp=0x05  
  ---  
 MMXEXT -   calc_cbp#1 0.062 usec       cbp=0x15  
 MMXEXT -   calc_cbp#2 0.061 usec       cbp=0x38  
 MMXEXT -   calc_cbp#3 0.061 usec       cbp=0x0f  
 MMXEXT -   calc_cbp#4 0.061 usec       cbp=0x05  
  ---  
 3DNOW  -   calc_cbp#1 0.168 usec       cbp=0x15  
 3DNOW  -   calc_cbp#2 0.168 usec       cbp=0x38  
 3DNOW  -   calc_cbp#3 0.157 usec       cbp=0x0f  
 3DNOW  -   calc_cbp#4 0.238 usec       cbp=0x05  
  ---  
 3DNOWE -   calc_cbp#1 0.049 usec       cbp=0x15  
 3DNOWE -   calc_cbp#2 0.049 usec       cbp=0x38  
 3DNOWE -   calc_cbp#3 0.049 usec       cbp=0x0f  
 3DNOWE -   calc_cbp#4 0.049 usec       cbp=0x05  
  ---  
   
   
 NB: If a function isn't optimised for a specific set of intructions,  
     a C function is used instead. So don't panic if some functions  
     may appear to be slow.  
   
 NB: MMX mpeg4 quantization is known to have very small errors (+/-1 magnitude)  
     for 1 or 2 coefficients a block. This is mainly caused by the fact the unit  
     test goes far behind the usual limits of real encoding. Please do not report  
     this error to the developers  
   
 *********************************************************************/  

Legend:
Removed from v.1613  
changed lines
  Added in v.1731

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4