[svn] / trunk / xvidcore / examples / xvid_bench.c Repository:
ViewVC logotype

Diff of /trunk/xvidcore/examples/xvid_bench.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1618, Mon May 23 12:06:02 2005 UTC revision 1988, Wed May 18 09:10:05 2011 UTC
# Line 19  Line 19 
19   *  along with this program; if not, write to the Free Software   *  along with this program; if not, write to the Free Software
20   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
21   *   *
22   * $Id: xvid_bench.c,v 1.20 2005-05-23 12:06:02 Skal Exp $   * $Id$
23   *   *
24   ****************************************************************************/   ****************************************************************************/
25    
# Line 47  Line 47 
47  #include "xvid.h"  #include "xvid.h"
48    
49  // inner guts  // inner guts
50    #include "portab.h"
51  #include "dct/idct.h"  #include "dct/idct.h"
52  #include "dct/fdct.h"  #include "dct/fdct.h"
53  #include "image/colorspace.h"  #include "image/colorspace.h"
# Line 58  Line 59 
59  #include "utils/timer.h"  #include "utils/timer.h"
60  #include "quant/quant_matrix.c"  #include "quant/quant_matrix.c"
61  #include "bitstream/cbp.h"  #include "bitstream/cbp.h"
62    #include "bitstream/bitstream.h"
63    
64  #include <math.h>  #include <math.h>
65    
# Line 112  Line 114 
114          unsigned int cpu;          unsigned int cpu;
115  } CPU;  } CPU;
116    
117  CPU cpu_list[] =  CPU cpu_list[] = {
118  { { "PLAINC", 0 }          { "PLAINC ", 0 },
119  #ifdef ARCH_IS_IA32  #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
120    , { "MMX   ", XVID_CPU_MMX }          { "MMX    ", XVID_CPU_MMX },
121    , { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }          { "MMXEXT ", XVID_CPU_MMXEXT | XVID_CPU_MMX },
122    , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }          { "SSE2   ", XVID_CPU_SSE2 | XVID_CPU_MMX },
123    , { "3DNOW ", XVID_CPU_3DNOW }          { "SSE3   ", XVID_CPU_SSE3 | XVID_CPU_SSE2 | XVID_CPU_MMX },
124    , { "3DNOWE", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT }          { "SSE41  ", XVID_CPU_SSE41| XVID_CPU_SSE3 | XVID_CPU_SSE2 | XVID_CPU_MMX },
125            { "3DNOW  ", XVID_CPU_3DNOW },
126            { "3DNOWE ", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT },
127  #endif  #endif
128  #ifdef ARCH_IS_PPC  #ifdef ARCH_IS_PPC
129    , { "ALTIVEC", XVID_CPU_ALTIVEC }          { "ALTIVEC", XVID_CPU_ALTIVEC },
130  #endif  #endif
131  #ifdef ARCH_IS_X86_64  #ifdef ARCH_IS_IA64
132    , { "X86_64", XVID_CPU_ASM}  //      { "IA64   ", XVID_CPU_IA64 },
133  #endif  #endif
134  //, { "IA64  ", XVID_CPU_IA64 }  //      { "TSC    ", XVID_CPU_TSC },
135  //, { "TSC   ", XVID_CPU_TSC }          { 0, 0 }
136    , { 0, 0 } };  };
   
 CPU  cpu_short_list[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
 //, { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }  
 #endif  
 //, { "IA64  ", XVID_CPU_IA64 }  
   , { 0, 0 } };  
   
 CPU cpu_short_list2[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
   , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }  
 #endif  
   , { 0, 0 } };  
137    
138    
139  int init_cpu(CPU *cpu)  int init_cpu(CPU *cpu)
# Line 274  Line 261 
261          return crc;          return crc;
262  }  }
263    
264    void byte_swap(uint8_t *mem, int len, int element_size) {
265    #ifdef ARCH_IS_BIG_ENDIAN
266            int i;
267    
268            if(element_size == 1) {
269                    /* No need to swap */
270            } else if(element_size == 2) {
271                    uint8_t temp[2];
272    
273                    for(i=0; i < (len/2); i++ ) {
274                            temp[0] = mem[0];
275                            temp[1] = mem[1];
276                            mem[0] = temp[1];
277                            mem[1] = temp[0];
278    
279                            mem += 2;
280                    }
281            } else if(element_size == 4) {
282                    uint8_t temp[4];
283    
284                    for(i=0; i < (len/4); i++ ) {
285                            temp[0] = mem[0];
286                            temp[1] = mem[1];
287                            temp[2] = mem[2];
288                            temp[3] = mem[3];
289                            mem[0] = temp[3];
290                            mem[1] = temp[2];
291                            mem[2] = temp[1];
292                            mem[3] = temp[0];
293    
294                            mem += 4;
295                    }
296            } else {
297                    printf("ERROR: byte_swap unsupported element_size(%u)\n", element_size);
298            }
299    #endif
300    }
301    
302  /*********************************************************************  /*********************************************************************
303   * test DCT   * test DCT
304   *********************************************************************/   *********************************************************************/
# Line 389  Line 414 
414    
415                  t = gettime_usec();                  t = gettime_usec();
416                  emms();                  emms();
417                    for(tst=0; tst<nb_tests; ++tst) s = sad8bi(Cur, Ref1, Ref2, 8);
418                    emms();
419                    t = (gettime_usec() - t) / nb_tests;
420                    printf( "%s - sad8bi %.3f usec       sad=%d %s\n",
421                                    cpu->name, t, s,
422                                    (s!=4002)?"| ERROR": "" );
423    
424                    t = gettime_usec();
425                    emms();
426                  for(tst=0; tst<nb_tests; ++tst) s = dev16(Cur, 16);                  for(tst=0; tst<nb_tests; ++tst) s = dev16(Cur, 16);
427                  emms();                  emms();
428                  t = (gettime_usec() - t) / nb_tests;                  t = (gettime_usec() - t) / nb_tests;
# Line 494  Line 528 
528                             (iCrc!=8107)?"| ERROR": "" );                             (iCrc!=8107)?"| ERROR": "" );
529  #endif  #endif
530    
531        /* New functions for field prediction by CK 1.10.2005 */
532    #pragma NEW8X4
533                    TEST_MB(interpolate8x4_halfpel_h, 0);
534                    printf("%s - interpfield-h -round0 %.3f usec       crc32=0x%08x %s\n",
535                               cpu->name, t, iCrc,
536                               (iCrc!=0x9538d6df)?"| ERROR": "" );
537    
538                    TEST_MB(interpolate8x4_halfpel_h, 1);
539                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
540                               cpu->name, t, iCrc,
541                               (iCrc!=0xde5f1db4)?"| ERROR": "" );
542    
543    
544                    TEST_MB(interpolate8x4_halfpel_v, 0);
545                    printf("%s - interpfield- v-round0 %.3f usec       crc32=0x%08x %s\n",
546                               cpu->name, t, iCrc,
547                               (iCrc!=0xea5a69ef)?"| ERROR": "" );
548    
549                    TEST_MB(interpolate8x4_halfpel_v, 1);
550                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
551                               cpu->name, t, iCrc,
552                               (iCrc!=0x4f10ec0f)?"| ERROR": "" );
553    
554    
555                    TEST_MB(interpolate8x4_halfpel_hv, 0);
556                    printf("%s - interpfield-hv-round0 %.3f usec       crc32=0x%08x %s\n",
557                               cpu->name, t, iCrc,
558                               (iCrc!=0xf97ee367)?"| ERROR": "" );
559    
560                    TEST_MB(interpolate8x4_halfpel_hv, 1);
561                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
562                               cpu->name, t, iCrc,
563                               (iCrc!=0xb6a9f581)?"| ERROR": "" );
564    /* End of 8x4 functions */
565    
566                  printf( " --- \n" );                  printf( " --- \n" );
567          }          }
568  }  }
569    
570    #undef ENTER
571    #undef LEAVE
572    #undef TEST_MB
573    #undef TEST_MB2
574    
575  /*********************************************************************  /*********************************************************************
576   * test transfer   * test transfer
577   *********************************************************************/   *********************************************************************/
# Line 527  Line 601 
601  }                                         \  }                                         \
602  emms();                                   \  emms();                                   \
603  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
604  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
605    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
606    
607  #define TEST_TRANSFER(FUNC, DST, SRC)         \  #define TEST_TRANSFER(FUNC, DST, SRC)         \
608  TEST_TRANSFER_BEGIN(DST);                 \  TEST_TRANSFER_BEGIN(DST);                 \
# Line 553  Line 628 
628  }                                         \  }                                         \
629  emms();                                   \  emms();                                   \
630  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
631  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
632    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
633    
634  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \
635  TEST_TRANSFER2_BEGIN(DST,SRC);            \  TEST_TRANSFER2_BEGIN(DST,SRC);            \
# Line 570  Line 646 
646          const int nb_tests = 4000*speed_ref;          const int nb_tests = 4000*speed_ref;
647          int i;          int i;
648          CPU *cpu;          CPU *cpu;
649          uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];  //      uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];
650          int16_t Src16[8*32], Dst16[8*32];  //      int16_t Src16[8*32], Dst16[8*32];
651      DECLARE_ALIGNED_MATRIX(Src8, 8, 32, uint8_t, CACHE_LINE);
652      DECLARE_ALIGNED_MATRIX(Dst8, 8, 32, uint8_t, CACHE_LINE);
653      DECLARE_ALIGNED_MATRIX(Ref1, 8, 32, uint8_t, CACHE_LINE);
654      DECLARE_ALIGNED_MATRIX(Ref2, 8, 32, uint8_t, CACHE_LINE);
655      DECLARE_ALIGNED_MATRIX(Src16, 8, 32, uint16_t, CACHE_LINE);
656      DECLARE_ALIGNED_MATRIX(Dst16, 8, 32, uint16_t, CACHE_LINE);
657    
658          printf( "\n ===  test transfer ===\n" );          printf( "\n ===  test transfer ===\n" );
659    
# Line 593  Line 675 
675                                  cpu->name, t, s,                                  cpu->name, t, s,
676                                  (s!=0xee7ccbb4)?"| ERROR": "");                                  (s!=0xee7ccbb4)?"| ERROR": "");
677    
678        /* New functions for field prediction by CK 1.10.2005 */
679    #pragma NEW8X4
680                    TEST_TRANSFER(transfer8x4_copy, Dst8, Src8);
681                    printf("%s - 8to4      %.3f usec       crc32=0x%08x %s\n",
682                               cpu->name, t, s,
683                               (s!=0xbb9c3db5)?"| ERROR": "");
684    /* End of new functions */
685    
686                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);
687                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",
688                             cpu->name, t, s,                             cpu->name, t, s,
# Line 606  Line 696 
696                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);
697                  {                  {
698                          int s1, s2;                          int s1, s2;
699                          s1 = calc_crc((uint8_t*)Dst16, sizeof(Dst16), CRC32_INITIAL);                          s1 = calc_crc((uint8_t*)Dst16, 8*32*sizeof(Dst16[0]), CRC32_INITIAL);
700                          s2 = calc_crc((uint8_t*)Src8, sizeof(Src8), CRC32_INITIAL);                          s2 = calc_crc((uint8_t*)Src8, 8*32*sizeof(Src8[0]), CRC32_INITIAL);
701                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",
702                                     cpu->name, t, s1, s2,                                     cpu->name, t, s1, s2,
703                                     (s1!=0xa1e07163)?"| ERROR1": "",                                     (s1!=0xa1e07163)?"| ERROR1": "",
# Line 636  Line 726 
726    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
727          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
728            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \
729          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
730            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
731    }                                         \    }                                         \
732    emms();                                   \    emms();                                   \
733  }                                           \  }                                           \
# Line 649  Line 740 
740    set_intra_matrix( mpeg_quant_matrices, Quant );                \    set_intra_matrix( mpeg_quant_matrices, Quant );                \
741    emms();                                   \    emms();                                   \
742    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
743            init_intra_matrix( mpeg_quant_matrices, q ); \
744          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
745            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \
746          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
747            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
748    }                                         \    }                                         \
749    emms();                                   \    emms();                                   \
750  }                                           \  }                                           \
751  t = (gettime_usec()-t-overhead)/nb_tests/qm  t = (gettime_usec()-t-overhead)/nb_tests/qm
752    
753  #define TEST_INTRA(REFFUNC, NEWFUNC, RANGE)              \  #define TEST_INTRA(REFFUNC, NEWFUNC, RANGE)              \
754  { int i,q,s;\  { int32_t i,q,s;\
755          DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16); \          DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16); \
756    DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16); \    DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16); \
757    DECLARE_ALIGNED_MATRIX(Dst2,8, 8, int16_t, 16); \    DECLARE_ALIGNED_MATRIX(Dst2,8, 8, int16_t, 16); \
# Line 690  Line 783 
783    
784  void test_quant()  void test_quant()
785  {  {
786          const int nb_tests = 1*speed_ref;          const int32_t nb_tests = 1*speed_ref;
787          const int max_Q = 31;          const int32_t max_Q = 31;
788          DECLARE_ALIGNED_MATRIX(mpeg_quant_matrices, 8, 64, uint16_t, 16);          DECLARE_ALIGNED_MATRIX(mpeg_quant_matrices, 8, 64, uint16_t, 16);
789    
790          int i, qm;          int32_t i, qm;
791          CPU *cpu;          CPU *cpu;
792          DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16);
793          DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16);
# Line 713  Line 806 
806          for(cpu = cpu_list; cpu->name!=0; ++cpu)          for(cpu = cpu_list; cpu->name!=0; ++cpu)
807          {          {
808                  double t, overhead;                  double t, overhead;
809                  int tst, q;                  int32_t tst, q;
810                  uint32_t s;                  uint32_t s;
811    
812                  if (!init_cpu(cpu))                  if (!init_cpu(cpu))
# Line 737  Line 830 
830                  TEST_QUANT2(quant_mpeg_intra, Dst, Src);                  TEST_QUANT2(quant_mpeg_intra, Dst, Src);
831                  printf("%s -   quant_mpeg_intra %.3f usec       crc32=0x%08x %s\n",                  printf("%s -   quant_mpeg_intra %.3f usec       crc32=0x%08x %s\n",
832                             cpu->name, t, s,                             cpu->name, t, s,
833                             (s!=0xfd6a21a4)? "| ERROR": "");                             (s!=0x3b999af6)? "| ERROR": "");
834    
835                  TEST_QUANT(quant_mpeg_inter, Dst, Src);                  TEST_QUANT(quant_mpeg_inter, Dst, Src);
836                  printf("%s -   quant_mpeg_inter %.3f usec       crc32=0x%08x %s\n",                  printf("%s -   quant_mpeg_inter %.3f usec       crc32=0x%08x %s\n",
# Line 871  Line 964 
964   * test non-zero AC counting   * test non-zero AC counting
965   *********************************************************************/   *********************************************************************/
966    
967  #define TEST_CBP(FUNC, SRC)               \  #define TEST_CBP(FUNC, SRC, NB)           \
968  t = gettime_usec();                       \  t = gettime_usec();                       \
969  emms();                                   \  emms();                                   \
970  for(tst=0; tst<nb_tests; ++tst) {         \  for(tst=0; tst<NB; ++tst) {         \
971    cbp = (FUNC)((SRC));                    \    cbp = (FUNC)((SRC));                    \
972  }                                         \  }                                         \
973  emms();                                   \  emms();                                   \
# Line 883  Line 976 
976  void test_cbp()  void test_cbp()
977  {  {
978          const int nb_tests = 10000*speed_ref;          const int nb_tests = 10000*speed_ref;
979          int i;          int i, n, m;
980          CPU *cpu;          CPU *cpu;
981          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);
982          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);
983          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);
984          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);
985      DECLARE_ALIGNED_MATRIX(Src5, 6, 64, int16_t, 16);
986    
987          printf( "\n =====  test cbp =====\n" );          printf( "\n =====  test cbp =====\n" );
988    
# Line 897  Line 991 
991                  Src2[i] = (i<3*64);               /* half-full */                  Src2[i] = (i<3*64);               /* half-full */
992                  Src3[i] = ((i+32)>3*64);                  Src3[i] = ((i+32)>3*64);
993                  Src4[i] = (i==(3*64+2) || i==(5*64+9));                  Src4[i] = (i==(3*64+2) || i==(5*64+9));
994        Src5[i] = ieee_rand(0,1) ? -1 : 1;  /* +/- test */
995          }          }
996    
997          for(cpu = cpu_list; cpu->name!=0; ++cpu)          for(cpu = cpu_list; cpu->name!=0; ++cpu)
# Line 907  Line 1002 
1002                  if (!init_cpu(cpu))                  if (!init_cpu(cpu))
1003                          continue;                          continue;
1004    
1005                  TEST_CBP(calc_cbp, Src1);                  TEST_CBP(calc_cbp, Src1, nb_tests);
1006                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x %s\n",
1007                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");
1008                  TEST_CBP(calc_cbp, Src2);                  TEST_CBP(calc_cbp, Src2, nb_tests);
1009                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x %s\n",
1010                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");
1011                  TEST_CBP(calc_cbp, Src3);                  TEST_CBP(calc_cbp, Src3, nb_tests);
1012                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x %s\n",
1013                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );
1014                  TEST_CBP(calc_cbp, Src4);                  TEST_CBP(calc_cbp, Src4, nb_tests);
1015                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1016                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );
1017                    TEST_CBP(calc_cbp, Src5, nb_tests);
1018                    printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1019                               cpu->name, t, cbp, (cbp!=0x3f)?"| ERROR": "" );
1020                  printf( " --- \n" );                  printf( " --- \n" );
1021          }          }
1022    
1023            for(cpu = cpu_list; cpu->name!=0; ++cpu)  /* bench suggested by Carlo (carlo dot bramix at libero dot it) */
1024            {
1025                    double t;
1026                    int tst, cbp, err;
1027    
1028                    if (!init_cpu(cpu))
1029                            continue;
1030    
1031        err = 0;
1032        for(n=0; n<6; ++n)
1033        {
1034          for(m=0; m<64; ++m)
1035          {
1036            for(i=0; i<6*64; ++i)
1037              Src1[i] = (i== (m + n*64));
1038    
1039            TEST_CBP(calc_cbp, Src1, 1);
1040            if (cbp!= (((m!=0)<<(5-n))))
1041            {
1042              printf( "%s -   calc_cbp#5: ERROR at pos %d / %d!\n", cpu->name, n, m);
1043              err = 1;
1044              break;
1045            }
1046          }
1047        }
1048        if (!err)
1049          printf( " %s -    calc_cbp#5 : OK\n", cpu->name );
1050    
1051            }
1052  }  }
1053    
1054  /*********************************************************************  /*********************************************************************
# Line 1383  Line 1511 
1511                  xframe.bitstream = buf + pos;                  xframe.bitstream = buf + pos;
1512                  xframe.length = buf_size - pos;                  xframe.length = buf_size - pos;
1513                  xframe.output.plane[0] = (uint8_t*)(((size_t)yuv_out + 15) & ~15);                  xframe.output.plane[0] = (uint8_t*)(((size_t)yuv_out + 15) & ~15);
1514                  xframe.output.plane[1] = xframe.output.plane[0] + bps*height;                  xframe.output.plane[1] = (uint8_t*)xframe.output.plane[0] + bps*height;
1515                  xframe.output.plane[2] = xframe.output.plane[1] + bps/2;                  xframe.output.plane[2] = (uint8_t*)xframe.output.plane[1] + bps/2;
1516                  xframe.output.stride[0] = bps;                  xframe.output.stride[0] = bps;
1517                  xframe.output.stride[1] = bps;                  xframe.output.stride[1] = bps;
1518                  xframe.output.stride[2] = bps;                  xframe.output.stride[2] = bps;
# Line 1402  Line 1530 
1530                  nb++;                  nb++;
1531    
1532      for(y=0; y<height/2; ++y) {      for(y=0; y<height/2; ++y) {
1533                    chksum = calc_crc(xframe.output.plane[0] + (2*y+0)*bps, width, chksum);                    chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+0)*bps, width, chksum);
1534                          chksum = calc_crc(xframe.output.plane[0] + (2*y+1)*bps, width, chksum);                          chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+1)*bps, width, chksum);
1535                          chksum = calc_crc(xframe.output.plane[1] + y*bps, width/2, chksum);                          chksum = calc_crc((uint8_t*)xframe.output.plane[1] + y*bps, width/2, chksum);
1536                          chksum = calc_crc(xframe.output.plane[2] + y*bps, width/2, chksum);                          chksum = calc_crc((uint8_t*)xframe.output.plane[2] + y*bps, width/2, chksum);
1537                  }                  }
1538                  if (pos==buf_size)                  if (pos==buf_size)
1539                          break;                          break;
# Line 1588  Line 1716 
1716          }          }
1717  #endif  #endif
1718  }  }
1719    
1720    /*********************************************************************
1721     * test some YUV func
1722     *********************************************************************/
1723    
1724    #define ENTER \
1725    for(i=0; i<(int)sizeof(Dst0); ++i) Dst0[0][i] = 0;   \
1726    t = gettime_usec();                   \
1727    emms();
1728    
1729    #define LEAVE \
1730    emms();                             \
1731    t = (gettime_usec() - t) / nb_tests;  \
1732            iCrc = calc_crc((uint8_t*)Dst0, sizeof(Dst0), CRC32_INITIAL)
1733    
1734    #define TEST_YUYV(FUNC, S, FLIP)                \
1735    ENTER                               \
1736    for(tst=0; tst<nb_tests; ++tst) (FUNC)(Dst0[0], S*WIDTH, Src0[0], Src0[1], Src0[2], WIDTH, WIDTH/2, WIDTH, HEIGHT, (FLIP)); \
1737    LEAVE
1738    
1739    static const int yuv_CRCs[6][2] = {
1740            {0x0f4fb96b,0x780b6a68}
1741    ,       {0xa986b289,0x65e49b76}
1742    ,       {0x7f19c152,0xd539b86e}
1743    ,       {0x0f4fb96b,0x780b6a68}
1744    ,       {0xa986b289,0x65e49b76}
1745    ,       {0x36ab8b57,0x1cd92fee}
1746    };
1747    
1748    #define WIDTH 128
1749    #define HEIGHT 32
1750    void test_yuv()
1751    {
1752            const int nb_tests = 200*speed_ref;
1753            CPU *cpu;
1754            uint8_t Src0[3][WIDTH*HEIGHT];
1755            uint8_t Dst0[4][WIDTH*HEIGHT];
1756            int i, j, with_flip;
1757            double t;
1758            int tst, iCrc;
1759    
1760            colorspace_init();
1761            ieee_reseed(1);
1762            for(i=0; i<(int)sizeof(Src0); ++i) Src0[0][i] = ieee_rand(0,255);
1763            for(i=0; i<(int)sizeof(Dst0); ++i) Dst0[0][i] = 0x5a;
1764    
1765            printf( "\n ===  test YUV ===\n" );
1766    
1767            for(with_flip=0; with_flip<=1; ++with_flip) {
1768    
1769                    init_cpu(&cpu_list[0]);
1770                    TEST_YUYV(yv12_to_yuyv_c, 4, with_flip);
1771                    printf(" yv12_to_yuyv_c %.3f usec       crc32=0x%08x %s\n",
1772                               t, iCrc, (iCrc!=yuv_CRCs[0][with_flip])?"| ERROR": "" );
1773                    TEST_YUYV(yv12_to_uyvy_c, 4, with_flip);
1774                    printf(" yv12_to_uyvy_c %.3f usec       crc32=0x%08x %s\n",
1775                            t, iCrc, (iCrc!=yuv_CRCs[1][with_flip])?"| ERROR": "" );
1776    
1777                    TEST_YUYV(yv12_to_bgra_c, 4, with_flip);
1778                    printf(" yv12_to_bgra_c %.3f usec       crc32=0x%08x %s\n",
1779                            t, iCrc, (iCrc!=yuv_CRCs[2][with_flip])?"| ERROR": "" );
1780    
1781    #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
1782                    init_cpu(&cpu_list[1]);
1783                    TEST_YUYV(yv12_to_yuyv_mmx, 4, with_flip);
1784                    printf(" yv12_to_yuyv_mmx %.3f usec       crc32=0x%08x %s\n",
1785                            t, iCrc, (iCrc!=yuv_CRCs[3][with_flip])?"| ERROR": "" );
1786    
1787                    TEST_YUYV(yv12_to_uyvy_mmx, 4, with_flip);
1788                    printf(" yv12_to_uyvy_mmx %.3f usec       crc32=0x%08x %s\n",
1789                            t, iCrc, (iCrc!=yuv_CRCs[4][with_flip])?"| ERROR": "" );
1790    
1791                    TEST_YUYV(yv12_to_bgra_mmx, 4, with_flip);
1792                    printf(" yv12_to_bgra_mmx %.3f usec       crc32=0x%08x %s\n",
1793                            t, iCrc, (iCrc!=yuv_CRCs[5][with_flip])?"| ERROR": "" );
1794    
1795    #endif
1796    
1797    #ifdef ARCH_IS_PPC
1798                    init_cpu(&cpu_list[1]);
1799                    TEST_YUYV(yv12_to_yuyv_altivec_c, 4, with_flip);
1800                    printf(" yv12_to_yuyv_altivec_c %.3f usec       crc32=0x%08x %s\n",
1801                            t, iCrc, (iCrc!=yuv_CRCs[3][with_flip])?"| ERROR": "" );
1802    
1803                    TEST_YUYV(yv12_to_uyvy_altivec_c, 4, with_flip);
1804                    printf(" yv12_to_uyvy_altivec_c %.3f usec       crc32=0x%08x %s\n",
1805                            t, iCrc, (iCrc!=yuv_CRCs[4][with_flip])?"| ERROR": "" );
1806    
1807                    TEST_YUYV(yv12_to_bgra_altivec_c, 4, with_flip);
1808                    printf(" yv12_to_bgra_altivec_c %.3f usec       crc32=0x%08x %s\n",
1809                            t, iCrc, (iCrc!=yuv_CRCs[5][with_flip])?"| ERROR": "" );
1810    #endif
1811            }
1812            printf( " --- \n" );
1813    }
1814    
1815    #define TEST_YV2(FUNC, WITH_UV, WITH_FLIP)        \
1816    ENTER                               \
1817    for(tst=0; tst<nb_tests; ++tst) (FUNC)(Dst0[0], Dst0[1], Dst0[2], WIDTH, WIDTH, \
1818            Src0[0], (WITH_UV) ? Src0[1] : 0, (WITH_UV) ? Src0[2] : 0,  WIDTH, WIDTH, \
1819            WIDTH-2, HEIGHT-2, WITH_FLIP); \
1820    LEAVE
1821    
1822    #define PRINT_NxN(DATA,W,H,STR)   {   \
1823            int i,j; \
1824            for(j=0; j<(H); ++j) { \
1825                    for(i=0; i<(W); ++i) printf( "0x%.2x ", (DATA)[i+j*(STR)] );\
1826                    printf("\n"); \
1827            } \
1828            printf("---\n"); \
1829    }
1830    
1831    static const int yv12_CRCs[2][2] = {
1832            {0x5cab7cf0,0xdab46541}
1833    ,       {0xe8bae865,0x1faf77b7}
1834    };
1835    
1836    void test_yuv2()
1837    {
1838            const int nb_tests = 800*speed_ref;
1839            CPU *cpu;
1840            uint8_t Src0[3][WIDTH*HEIGHT];
1841            uint8_t Dst0[3][WIDTH*HEIGHT];
1842            int with_uv, with_flip;
1843            int i, j;
1844            double t;
1845            int tst, iCrc;
1846    
1847            colorspace_init();
1848            ieee_reseed(1);
1849            for(i=0; i<(int)sizeof(Src0); ++i) Src0[0][i] = ieee_rand(0,255);
1850    
1851            printf( "\n ===  test YV2 ===\n" );
1852            for(with_flip=0; with_flip<=1; ++with_flip) {
1853                    for(with_uv=0; with_uv<=1; ++with_uv) {
1854                            init_cpu(&cpu_list[0]);
1855                            TEST_YV2(yv12_to_yv12_c, with_uv, with_flip);
1856                            printf(" yv12_to_yv12_c   %.3f usec      \tcrc32=0x%08x %s\n",
1857                                    t, iCrc, (iCrc!=yv12_CRCs[with_flip][with_uv])?"| ERROR": "" );
1858                            /* if (!with_uv) PRINT_NxN(Dst0[1], WIDTH/2, HEIGHT/2, WIDTH ); */
1859    
1860    #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
1861                            init_cpu(&cpu_list[1]);
1862                            TEST_YV2(yv12_to_yv12_mmx, with_uv, with_flip);
1863                            printf(" yv12_to_yv12_mmx %.3f usec     \tcrc32=0x%08x %s\n",
1864                                    t, iCrc, (iCrc!=yv12_CRCs[with_flip][with_uv])?"| ERROR": "" );
1865                            /* if (!with_uv) PRINT_NxN(Dst0[1], WIDTH/2, HEIGHT/2, WIDTH ); */
1866    
1867                            TEST_YV2(yv12_to_yv12_xmm, with_uv, with_flip);
1868                            printf(" yv12_to_yv12_xmm %.3f usec     \tcrc32=0x%08x %s\n",
1869                                    t, iCrc, (iCrc!=yv12_CRCs[with_flip][with_uv])?"| ERROR": "" );
1870    #endif
1871                    }
1872    
1873                    printf( " --- \n" );
1874            }
1875            printf( " ===== \n" );
1876    }
1877    
1878    #undef WIDTH
1879    #undef HEIGHT
1880    #undef ENTER
1881    #undef LEAVE
1882    
1883  /*********************************************************************/  /*********************************************************************/
1884    
1885  static uint32_t __inline log2bin_v1(uint32_t value)  static uint32_t __inline log2bin_v1(uint32_t value)
# Line 1710  Line 2002 
2002  }  }
2003    
2004  /*********************************************************************  /*********************************************************************
2005     * test compiler
2006     *********************************************************************/
2007    
2008    void test_compiler() {
2009      int nb_err = 0;
2010      int32_t v;
2011      if (sizeof(uint16_t)<2) {
2012        printf( "ERROR: sizeof(uint16_t)<2 !!\n" );
2013        nb_err++;
2014      }
2015      if (sizeof(int16_t)<2) {
2016        printf( "ERROR: sizeof(int16_t)<2 !!\n" );
2017        nb_err++;
2018      }
2019      if (sizeof(uint8_t)!=1) {
2020        printf( "ERROR: sizeof(uint8_t)!=1 !!\n" );
2021        nb_err++;
2022      }
2023      if (sizeof(int8_t)!=1) {
2024        printf( "ERROR: sizeof(int8_t)!=1 !!\n" );
2025        nb_err++;
2026      }
2027      if (sizeof(uint32_t)<4) {
2028        printf( "ERROR: sizeof(uint32_t)<4 !!\n" );
2029        nb_err++;
2030      }
2031      if (sizeof(int32_t)<4) {
2032        printf( "ERROR: sizeof(int32_t)<4 !!\n" );
2033        nb_err++;
2034      }
2035             /* yes, i know, this test is silly. But better be safe than sorry. :) */
2036      for(v=1000; v>=0; v--) {
2037        if ( (v>>2) != v/4)
2038          nb_err++;
2039      }
2040      for(v=-1000; v!=-1; v++) {
2041        if ( (v>>2) != (v/4)-!!(v%4))
2042          nb_err++;
2043      }
2044      if (nb_err!=0) {
2045        printf( "ERROR! please post your platform/compiler specs to xvid-devel@xvid.org !\n" );
2046      }
2047    }
2048    
2049    /*********************************************************************
2050     * test SSIM functions
2051     *********************************************************************/
2052    
2053    typedef int (*lumfunc)(uint8_t* ptr, int stride);
2054    typedef void (*csfunc)(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2055    
2056    extern int lum_8x8_c(uint8_t* ptr, int stride);
2057    extern int lum_8x8_mmx(uint8_t* ptr, int stride);
2058    extern int lum_2x8_c(uint8_t* ptr, int stride);
2059    extern void consim_c(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2060    extern void consim_mmx(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2061    extern void consim_sse2(uint8_t* ptro, uint8_t* ptrc, int stride, int lumo, int lumc, int* pdevo, int* pdevc, int* pcorr);
2062    
2063    void test_SSIM()
2064    {
2065            const int nb_tests = 3000*speed_ref;
2066            int tst;
2067            CPU *cpu;
2068            int i;
2069            int devs[3];
2070            long lumo, lumc;
2071            DECLARE_ALIGNED_MATRIX(Ref1, 16, 16, uint8_t, 16);
2072            DECLARE_ALIGNED_MATRIX(Ref2, 16, 16, uint8_t, 16);
2073            lumfunc lum8x8;
2074            lumfunc lum2x8;
2075            csfunc  csim;
2076    
2077            ieee_reseed(1);
2078            printf( "\n ======  test SSIM ======\n" );
2079            for(i=0; i<16*16;++i) {
2080                    long v1, v2;
2081                    v1 = ieee_rand(-256, 511);
2082                    v2 = ieee_rand(-256, 511);
2083                    Ref1[i] = (v1<0) ? 0 : (v1>255) ? 255 : v1;
2084                    Ref2[i] = (v2<0) ? 0 : (v2>255) ? 255 : v2;
2085            }
2086            lumc = ieee_rand(0, 255);
2087            lumo = ieee_rand(0, 255);
2088    
2089            for(cpu = cpu_list; cpu->name!=0; ++cpu)
2090            {
2091                    double t;
2092                    int m;
2093                    if (!init_cpu(cpu))
2094                            continue;
2095                    lum8x8 = lum_8x8_c;
2096                    lum2x8 = lum_2x8_c;
2097                    csim   = consim_c;
2098    #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
2099                    if (cpu->cpu & XVID_CPU_MMX){
2100                            lum8x8 = lum_8x8_mmx;
2101                            csim = consim_mmx;
2102                    }
2103                    if (cpu->cpu & XVID_CPU_MMX){
2104                            csim = consim_sse2;
2105                    }
2106    #endif
2107                    t = gettime_usec();
2108                    emms();
2109                    for(tst=0; tst<nb_tests; ++tst) m = lum8x8(Ref1, 16);
2110                    emms();
2111                    t = (gettime_usec() - t) / nb_tests;
2112                    printf("%s - ssim-lum8x8    %.3f usec       m=%d %s\n",
2113                               cpu->name, t, m,
2114                               (m!=8230)?"| ERROR": "" );
2115    
2116                    t = gettime_usec();
2117                    emms();
2118                    for(tst=0; tst<nb_tests; ++tst) m = lum2x8(Ref1+8, 16);
2119                    emms();
2120                    t = (gettime_usec() - t) / nb_tests;
2121                    printf("%s - ssim-lum2x8    %.3f usec       m=%d %s\n",
2122                               cpu->name, t, m,
2123                               (m!=681)?"| ERROR": "" );
2124    
2125                    t = gettime_usec();
2126                    emms();
2127                    for(tst=0; tst<nb_tests; ++tst) csim(Ref1, Ref2, 16, lumo, lumc, devs+0, devs+1, devs+2);
2128                    emms();
2129                    t = (gettime_usec() - t) / nb_tests;
2130                    printf("%s - ssim-consim    %.3f usec       devs=[0x%x 0x%x 0x%x] %s\n",
2131                               cpu->name, t, devs[0], devs[1], devs[2],
2132                               (devs[0]!=0x1bdf0f || devs[1]!=0x137258 ||  devs[2]!=0xcdb13)?"| ERROR": "" );
2133                    printf( " --- \n" );
2134            }
2135    }
2136    
2137    /*********************************************************************
2138     * test bitstream functions
2139     *********************************************************************/
2140    
2141    #define BIT_BUF_SIZE 2000
2142    
2143    static void test_bits()
2144    {
2145      const int nb_tests = 50*speed_ref;
2146      int tst;
2147      uint32_t Crc;
2148      uint8_t Buf[BIT_BUF_SIZE];
2149      uint32_t Extracted[BIT_BUF_SIZE*8]; /* worst case: bits read 1 by 1 */
2150      int Lens[BIT_BUF_SIZE*8];
2151      double t1;
2152    
2153    
2154      printf( "\n ===  test bitstream ===\n" );
2155      ieee_reseed(1);
2156      Crc = 0;
2157    
2158      t1 = gettime_usec();
2159      for(tst=0; tst<nb_tests; ++tst) {
2160            Bitstream bs;
2161            int m, m2, l, l2;
2162    
2163            for(l=0; l<BIT_BUF_SIZE; ++l)
2164                    Buf[l] = (uint8_t)ieee_rand(0,255);
2165    
2166            l = BIT_BUF_SIZE - ieee_rand(1,BIT_BUF_SIZE/10);
2167            BitstreamInit(&bs, (void*)(Buf+BIT_BUF_SIZE-l), l);
2168    
2169    
2170            BitstreamReset(&bs);
2171            for(l2=l*8, m=0; l2>0; m++) {
2172                    const int b = ieee_rand(1,32);
2173                    Lens[m] = b;
2174                    l2 -= b;
2175                    if (l2<0) break;
2176                    Extracted[m] = BitstreamShowBits(&bs, b);
2177                    BitstreamSkip(&bs, b);
2178    //              printf( "<= %d: %d 0x%x\n", m, b, Extracted[m]);
2179            }
2180    
2181            BitstreamReset(&bs);
2182            for(m2=0; m2<m; ++m2) {
2183                    const int b = Lens[m2];
2184                    const uint32_t v = BitstreamGetBits(&bs, b);
2185                    Crc |= (v!=Extracted[m2]);
2186    //              printf( "=> %d: %d 0x%x %c\n", m2, b, v, " *"[Crc]);
2187            }
2188      }
2189      t1 = (gettime_usec() - t1) / nb_tests;
2190      printf(" test_bits   %.3f usec   %s\n", t1, (Crc!=0)?"| ERROR": "" );
2191    }
2192    
2193    /*********************************************************************
2194   * main   * main
2195   *********************************************************************/   *********************************************************************/
2196    
# Line 1725  Line 2206 
2206          int width, height;          int width, height;
2207          uint32_t chksum = 0;          uint32_t chksum = 0;
2208    const char * test_bitstream = 0;    const char * test_bitstream = 0;
2209    #if defined(WIN32) && defined(ARCH_IS_X86_64)
2210            DECLARE_ALIGNED_MATRIX(xmm_save, 2, 4, uint64_t, 16);
2211            // assumes xmm6 and xmm7 won't be falsely preserved by C code
2212            for(c=0;c<4;c++)
2213                    xmm_save[c] = read_counter();
2214            prime_xmm(xmm_save);
2215    #endif
2216    
2217          cpu_mask = 0;  // default => will use autodectect          cpu_mask = 0;  // default => will use autodectect
2218          for(c=1; c<argc; ++c)          for(c=1; c<argc; ++c)
# Line 1734  Line 2222 
2222            else if (!strcmp(argv[c], "-mmx"))    cpu_mask = XVID_CPU_MMX    | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-mmx"))    cpu_mask = XVID_CPU_MMX    | XVID_CPU_FORCE;
2223            else if (!strcmp(argv[c], "-mmxext")) cpu_mask = XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-mmxext")) cpu_mask = XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2224            else if (!strcmp(argv[c], "-sse2"))   cpu_mask = XVID_CPU_SSE2   | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-sse2"))   cpu_mask = XVID_CPU_SSE2   | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2225              else if (!strcmp(argv[c], "-sse3"))   cpu_mask = XVID_CPU_SSE3   | XVID_CPU_SSE2 | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2226              else if (!strcmp(argv[c], "-sse4"))   cpu_mask = XVID_CPU_SSE41  | XVID_CPU_SSE3 | XVID_CPU_SSE2 | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
2227            else if (!strcmp(argv[c], "-3dnow"))  cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-3dnow"))  cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_FORCE;
2228            else if (!strcmp(argv[c], "-3dnowe")) cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_3DNOWEXT | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-3dnowe")) cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_3DNOWEXT | XVID_CPU_FORCE;
2229            else if (!strcmp(argv[c], "-altivec")) cpu_mask = XVID_CPU_ALTIVEC | XVID_CPU_FORCE;            else if (!strcmp(argv[c], "-altivec")) cpu_mask = XVID_CPU_ALTIVEC | XVID_CPU_FORCE;
# Line 1777  Line 2267 
2267          if (what==0 || what==10) test_sse();          if (what==0 || what==10) test_sse();
2268          if (what==0 || what==11) test_log2bin();          if (what==0 || what==11) test_log2bin();
2269          if (what==0 || what==12) test_gcd();          if (what==0 || what==12) test_gcd();
2270            if (what==0 || what==13) test_compiler();
2271            if (what==0 || what==14) test_yuv();
2272            if (what==0 || what==15) test_SSIM();
2273            if (what==0 || what==16) test_yuv2();
2274            if (what==0 || what==17) test_bits();
2275    
2276          if (what==7) {          if (what==7) {
2277                  test_IEEE1180_compliance(-256, 255, 1);                  test_IEEE1180_compliance(-256, 255, 1);
# Line 1798  Line 2292 
2292          if (what==-2)          if (what==-2)
2293                  test_quant_bug();                  test_quant_bug();
2294    
2295    #if defined(WIN32) && defined(ARCH_IS_X86_64)
2296            get_xmm(xmm_save+4);
2297            if (memcmp(xmm_save, xmm_save+4, 4*sizeof(int64_t))) {
2298                    printf("\nWIN64 ERROR: XMM6 and XMM7 contents not preserved!\n"
2299                           "        XMM6                             XMM7\n"
2300                           "Before: %.16I64X%.16I64X %.16I64X%.16I64X\n"
2301                           "After:  %.16I64X%.16I64X %.16I64X%.16I64X",
2302                            xmm_save[0],xmm_save[1],xmm_save[2],xmm_save[3],
2303                            xmm_save[4],xmm_save[5],xmm_save[6],xmm_save[7]);
2304            } else {
2305                    printf("\nWIN64: XMM6 and XMM7 contents preserved correctly.\n");
2306            }
2307    #endif
2308    
2309          if ((what >= 0 && what <= 6) || what == 10) {          if ((what >= 0 && what <= 6) || what == 10) {
2310                  printf("\n\n"                  printf("\n\n"
2311                             "NB: If a function isn't optimised for a specific set of intructions,\n"                             "NB: If a function isn't optimised for a specific set of intructions,\n"
# Line 1805  Line 2313 
2313                             "    may appear to be slow.\n");                             "    may appear to be slow.\n");
2314          }          }
2315    
2316  #ifdef ARCH_IS_IA32  #if defined(ARCH_IS_IA32) || defined(ARCH_IS_X86_64)
2317          if (what == 0 || what == 5) {          if (what == 0 || what == 5) {
2318                  printf("\n"                  printf("\n"
2319                             "NB: MMX mpeg4 quantization is known to have very small errors (+/-1 magnitude)\n"                             "NB: MMX mpeg4 quantization is known to have very small errors (+/-1 magnitude)\n"

Legend:
Removed from v.1618  
changed lines
  Added in v.1988

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4