[svn] / trunk / xvidcore / src / utils / ia64_asm / mem_transfer_ia64.s Repository:
ViewVC logotype

Annotation of /trunk/xvidcore/src/utils/ia64_asm/mem_transfer_ia64.s

Parent Directory Parent Directory | Revision Log Revision Log


Revision 205 - (view) (download)

1 : ia64p 205 .file "mem_transfer.c"
2 :     .pred.safe_across_calls p1-p5,p16-p63
3 :     .common transfer_8to16copy#,8,8
4 :     .text
5 :     .align 16
6 :     .global transfer_8to16copy_ia64#
7 :     .proc transfer_8to16copy_ia64#
8 :     transfer_8to16copy_ia64:
9 :     .prologue
10 :     .save ar.lc, r2
11 :     mov r2 = ar.lc
12 :     .body
13 :     addl r14 = 7, r0
14 :     mov r21 = r0
15 :     mov r20 = r0
16 :     ;;
17 :     mov ar.lc = r14
18 :     ;;
19 :     .L101:
20 :     addl r19 = 1, r0
21 :     zxt4 r14 = r21
22 :     dep.z r15 = r20, 1, 32
23 :     ;;
24 :     add r16 = r21, r19
25 :     add r14 = r33, r14
26 :     add r17 = r20, r19
27 :     ;;
28 :     ld1 r18 = [r14]
29 :     add r15 = r15, r32
30 :     zxt4 r16 = r16
31 :     ;;
32 :     st2 [r15] = r18
33 :     addl r19 = 2, r0
34 :     add r16 = r33, r16
35 :     dep.z r17 = r17, 1, 32
36 :     ;;
37 :     ld1 r15 = [r16]
38 :     add r14 = r21, r19
39 :     add r18 = r20, r19
40 :     add r17 = r17, r32
41 :     ;;
42 :     zxt4 r14 = r14
43 :     st2 [r17] = r15
44 :     addl r19 = 3, r0
45 :     ;;
46 :     add r14 = r33, r14
47 :     add r15 = r21, r19
48 :     dep.z r18 = r18, 1, 32
49 :     ;;
50 :     ld1 r17 = [r14]
51 :     add r16 = r20, r19
52 :     add r18 = r18, r32
53 :     zxt4 r15 = r15
54 :     ;;
55 :     st2 [r18] = r17
56 :     addl r19 = 4, r0
57 :     add r15 = r33, r15
58 :     dep.z r16 = r16, 1, 32
59 :     ;;
60 :     ld1 r18 = [r15]
61 :     add r14 = r21, r19
62 :     add r17 = r20, r19
63 :     add r16 = r16, r32
64 :     ;;
65 :     zxt4 r14 = r14
66 :     st2 [r16] = r18
67 :     addl r19 = 5, r0
68 :     ;;
69 :     add r14 = r33, r14
70 :     add r15 = r21, r19
71 :     add r16 = r20, r19
72 :     dep.z r17 = r17, 1, 32
73 :     ;;
74 :     ld1 r18 = [r14]
75 :     addl r19 = 6, r0
76 :     add r17 = r17, r32
77 :     zxt4 r15 = r15
78 :     ;;
79 :     st2 [r17] = r18
80 :     add r14 = r21, r19
81 :     add r15 = r33, r15
82 :     dep.z r16 = r16, 1, 32
83 :     add r17 = r20, r19
84 :     ;;
85 :     ld1 r18 = [r15]
86 :     add r16 = r16, r32
87 :     zxt4 r14 = r14
88 :     ;;
89 :     st2 [r16] = r18
90 :     addl r19 = 7, r0
91 :     add r14 = r33, r14
92 :     ;;
93 :     ld1 r15 = [r14]
94 :     add r16 = r21, r19
95 :     dep.z r17 = r17, 1, 32
96 :     add r14 = r20, r19
97 :     ;;
98 :     add r17 = r17, r32
99 :     zxt4 r16 = r16
100 :     ;;
101 :     st2 [r17] = r15
102 :     dep.z r14 = r14, 1, 32
103 :     add r16 = r33, r16
104 :     ;;
105 :     add r14 = r14, r32
106 :     ld1 r15 = [r16]
107 :     add r21 = r21, r34
108 :     ;;
109 :     st2 [r14] = r15
110 :     adds r20 = 8, r20
111 :     br.cloop.sptk.few .L101
112 :     ;;
113 :     mov ar.lc = r2
114 :     br.ret.sptk.many b0
115 :     .endp transfer_8to16copy_ia64#
116 :     .common transfer_16to8copy#,8,8
117 :     .align 16
118 :     .global transfer_16to8copy_ia64#
119 :     .proc transfer_16to8copy_ia64#
120 :     transfer_16to8copy_ia64:
121 :     .prologue
122 :     .body
123 :     mov r22 = r0
124 :     addl r21 = 255, r0
125 :     mov r20 = r0
126 :     mov r19 = r0
127 :     .L25:
128 :     mov r18 = r0
129 :     ;;
130 :     .L29:
131 :     add r14 = r19, r18
132 :     ;;
133 :     dep.z r14 = r14, 1, 32
134 :     ;;
135 :     add r14 = r14, r33
136 :     ;;
137 :     ld2 r15 = [r14]
138 :     ;;
139 :     sxt2 r15 = r15
140 :     ;;
141 :     mov r16 = r15
142 :     ;;
143 :     cmp4.le p6, p7 = r0, r16
144 :     ;;
145 :     (p7) mov r16 = r0
146 :     (p7) br.cond.dpnt .L106
147 :     ;;
148 :     cmp4.ge p6, p7 = r21, r16
149 :     ;;
150 :     (p7) addl r16 = 255, r0
151 :     .L106:
152 :     add r14 = r20, r18
153 :     adds r17 = 1, r18
154 :     ;;
155 :     zxt4 r14 = r14
156 :     add r15 = r19, r17
157 :     ;;
158 :     add r14 = r32, r14
159 :     dep.z r15 = r15, 1, 32
160 :     ;;
161 :     st1 [r14] = r16
162 :     add r15 = r15, r33
163 :     ;;
164 :     ld2 r14 = [r15]
165 :     ;;
166 :     sxt2 r14 = r14
167 :     ;;
168 :     mov r16 = r14
169 :     ;;
170 :     cmp4.le p6, p7 = r0, r16
171 :     ;;
172 :     (p7) mov r16 = r0
173 :     (p7) br.cond.dpnt .L110
174 :     ;;
175 :     cmp4.ge p6, p7 = r21, r16
176 :     ;;
177 :     (p7) addl r16 = 255, r0
178 :     .L110:
179 :     add r14 = r20, r17
180 :     adds r17 = 2, r18
181 :     ;;
182 :     zxt4 r14 = r14
183 :     add r15 = r19, r17
184 :     ;;
185 :     add r14 = r32, r14
186 :     dep.z r15 = r15, 1, 32
187 :     ;;
188 :     st1 [r14] = r16
189 :     add r15 = r15, r33
190 :     ;;
191 :     ld2 r14 = [r15]
192 :     ;;
193 :     sxt2 r14 = r14
194 :     ;;
195 :     mov r16 = r14
196 :     ;;
197 :     cmp4.le p6, p7 = r0, r16
198 :     ;;
199 :     (p7) mov r16 = r0
200 :     (p7) br.cond.dpnt .L114
201 :     ;;
202 :     cmp4.ge p6, p7 = r21, r16
203 :     ;;
204 :     (p7) addl r16 = 255, r0
205 :     .L114:
206 :     add r14 = r20, r17
207 :     adds r17 = 3, r18
208 :     ;;
209 :     zxt4 r14 = r14
210 :     add r15 = r19, r17
211 :     ;;
212 :     add r14 = r32, r14
213 :     dep.z r15 = r15, 1, 32
214 :     ;;
215 :     st1 [r14] = r16
216 :     add r15 = r15, r33
217 :     ;;
218 :     ld2 r14 = [r15]
219 :     ;;
220 :     sxt2 r14 = r14
221 :     ;;
222 :     mov r15 = r14
223 :     ;;
224 :     cmp4.le p6, p7 = r0, r15
225 :     ;;
226 :     (p7) mov r15 = r0
227 :     (p7) br.cond.dpnt .L118
228 :     ;;
229 :     cmp4.ge p6, p7 = r21, r15
230 :     ;;
231 :     (p7) addl r15 = 255, r0
232 :     .L118:
233 :     add r14 = r20, r17
234 :     adds r18 = 4, r18
235 :     ;;
236 :     zxt4 r14 = r14
237 :     cmp4.geu p6, p7 = 7, r18
238 :     ;;
239 :     add r14 = r32, r14
240 :     ;;
241 :     st1 [r14] = r15
242 :     (p6) br.cond.dptk .L29
243 :     adds r22 = 1, r22
244 :     add r20 = r20, r34
245 :     adds r19 = 8, r19
246 :     ;;
247 :     cmp4.geu p6, p7 = 7, r22
248 :     (p6) br.cond.dptk .L25
249 :     br.ret.sptk.many b0
250 :     .endp transfer_16to8copy_ia64#
251 :     .common transfer_8to16sub#,8,8
252 :     .align 16
253 :     .global transfer_8to16sub_ia64#
254 :     .proc transfer_8to16sub_ia64#
255 :     transfer_8to16sub_ia64:
256 :     .prologue
257 :     .body
258 :     mov r25 = r0
259 :     mov r24 = r0
260 :     mov r23 = r0
261 :     .L39:
262 :     mov r22 = r0
263 :     ;;
264 :     .L43:
265 :     add r15 = r23, r22
266 :     adds r20 = 1, r22
267 :     add r16 = r24, r22
268 :     ;;
269 :     zxt4 r15 = r15
270 :     add r18 = r23, r20
271 :     dep.z r16 = r16, 1, 32
272 :     ;;
273 :     add r19 = r34, r15
274 :     zxt4 r18 = r18
275 :     add r16 = r16, r32
276 :     add r15 = r33, r15
277 :     ;;
278 :     ld1 r14 = [r19]
279 :     add r21 = r34, r18
280 :     ld1 r17 = [r15]
281 :     adds r19 = 2, r22
282 :     add r18 = r33, r18
283 :     ;;
284 :     st1 [r15] = r14
285 :     sub r17 = r17, r14
286 :     add r20 = r24, r20
287 :     ;;
288 :     st2 [r16] = r17
289 :     dep.z r20 = r20, 1, 32
290 :     ld1 r14 = [r21]
291 :     ld1 r15 = [r18]
292 :     add r16 = r23, r19
293 :     ;;
294 :     st1 [r18] = r14
295 :     sub r15 = r15, r14
296 :     zxt4 r16 = r16
297 :     add r20 = r20, r32
298 :     ;;
299 :     add r18 = r34, r16
300 :     adds r17 = 3, r22
301 :     st2 [r20] = r15
302 :     add r16 = r33, r16
303 :     add r19 = r24, r19
304 :     ;;
305 :     ld1 r14 = [r18]
306 :     add r15 = r23, r17
307 :     dep.z r19 = r19, 1, 32
308 :     ld1 r18 = [r16]
309 :     ;;
310 :     zxt4 r15 = r15
311 :     add r19 = r19, r32
312 :     st1 [r16] = r14
313 :     sub r18 = r18, r14
314 :     ;;
315 :     add r20 = r34, r15
316 :     st2 [r19] = r18
317 :     add r15 = r33, r15
318 :     add r17 = r24, r17
319 :     ;;
320 :     ld1 r14 = [r20]
321 :     ld1 r16 = [r15]
322 :     dep.z r17 = r17, 1, 32
323 :     ;;
324 :     add r17 = r17, r32
325 :     adds r22 = 4, r22
326 :     st1 [r15] = r14
327 :     sub r16 = r16, r14
328 :     ;;
329 :     cmp4.geu p6, p7 = 7, r22
330 :     st2 [r17] = r16
331 :     (p6) br.cond.dptk .L43
332 :     adds r25 = 1, r25
333 :     adds r24 = 8, r24
334 :     add r23 = r23, r35
335 :     ;;
336 :     cmp4.geu p6, p7 = 7, r25
337 :     (p6) br.cond.dptk .L39
338 :     br.ret.sptk.many b0
339 :     .endp transfer_8to16sub_ia64#
340 :     .common transfer_8to16sub2#,8,8
341 :     .align 16
342 :     .global transfer_8to16sub2_ia64#
343 :     .proc transfer_8to16sub2_ia64#
344 :     transfer_8to16sub2_ia64:
345 :     .prologue
346 :     .save ar.lc, r2
347 :     mov r2 = ar.lc
348 :     .body
349 :     mov r28 = r0
350 :     addl r27 = 255, r0
351 :     mov r26 = r0
352 :     mov r25 = r0
353 :     .L50:
354 :     addl r14 = 3, r0
355 :     mov r21 = r0
356 :     ;;
357 :     mov ar.lc = r14
358 :     ;;
359 :     .L138:
360 :     add r14 = r26, r21
361 :     add r17 = r25, r21
362 :     adds r19 = 1, r21
363 :     ;;
364 :     zxt4 r17 = r17
365 :     dep.z r14 = r14, 1, 32
366 :     add r18 = r25, r19
367 :     ;;
368 :     add r15 = r34, r17
369 :     add r23 = r14, r32
370 :     add r20 = r35, r17
371 :     ;;
372 :     ld1 r14 = [r15]
373 :     ld1 r16 = [r20]
374 :     add r17 = r33, r17
375 :     ;;
376 :     add r14 = r14, r16
377 :     ld1 r15 = [r17]
378 :     zxt4 r18 = r18
379 :     ;;
380 :     adds r14 = 1, r14
381 :     add r24 = r35, r18
382 :     add r22 = r34, r18
383 :     ;;
384 :     shr.u r14 = r14, 1
385 :     add r19 = r26, r19
386 :     add r16 = r33, r18
387 :     ;;
388 :     cmp4.ge p6, p7 = r27, r14
389 :     dep.z r19 = r19, 1, 32
390 :     adds r21 = 2, r21
391 :     ;;
392 :     (p7) addl r14 = 255, r0
393 :     add r19 = r19, r32
394 :     ;;
395 :     sub r14 = r15, r14
396 :     ;;
397 :     st2 [r23] = r14
398 :     ld1 r14 = [r24]
399 :     ld1 r15 = [r22]
400 :     ld1 r16 = [r16]
401 :     ;;
402 :     add r15 = r15, r14
403 :     ;;
404 :     adds r15 = 1, r15
405 :     ;;
406 :     shr.u r14 = r15, 1
407 :     ;;
408 :     cmp4.ge p6, p7 = r27, r14
409 :     ;;
410 :     (p7) addl r14 = 255, r0
411 :     ;;
412 :     sub r14 = r16, r14
413 :     ;;
414 :     st2 [r19] = r14
415 :     br.cloop.sptk.few .L138
416 :     adds r28 = 1, r28
417 :     adds r26 = 8, r26
418 :     add r25 = r25, r36
419 :     ;;
420 :     cmp4.geu p6, p7 = 7, r28
421 :     (p6) br.cond.dptk .L50
422 :     mov ar.lc = r2
423 :     br.ret.sptk.many b0
424 :     .endp transfer_8to16sub2_ia64#
425 :     .common transfer_16to8add#,8,8
426 :     .align 16
427 :     .global transfer_16to8add_ia64#
428 :     .proc transfer_16to8add_ia64#
429 :     transfer_16to8add_ia64:
430 :     .prologue
431 :     .save ar.lc, r2
432 :     mov r2 = ar.lc
433 :     .body
434 :     mov r26 = r0
435 :     addl r25 = 255, r0
436 :     mov r24 = r0
437 :     mov r21 = r0
438 :     .L62:
439 :     addl r14 = 3, r0
440 :     mov r20 = r0
441 :     ;;
442 :     mov ar.lc = r14
443 :     ;;
444 :     .L149:
445 :     adds r17 = 1, r20
446 :     add r14 = r21, r20
447 :     add r15 = r24, r20
448 :     ;;
449 :     zxt4 r14 = r14
450 :     add r18 = r21, r17
451 :     dep.z r15 = r15, 1, 32
452 :     ;;
453 :     add r23 = r32, r14
454 :     zxt4 r18 = r18
455 :     add r15 = r15, r33
456 :     ;;
457 :     mov r16 = r23
458 :     add r22 = r32, r18
459 :     ld2 r14 = [r15]
460 :     ;;
461 :     ld1 r18 = [r16]
462 :     add r19 = r24, r17
463 :     adds r20 = 2, r20
464 :     ;;
465 :     add r14 = r14, r18
466 :     dep.z r19 = r19, 1, 32
467 :     mov r16 = r22
468 :     ;;
469 :     sxt2 r14 = r14
470 :     add r19 = r19, r33
471 :     ;;
472 :     cmp4.le p6, p7 = r0, r14
473 :     cmp4.ge p8, p9 = r25, r14
474 :     ;;
475 :     (p7) mov r14 = r0
476 :     (p7) br.cond.dpnt .L143
477 :     ;;
478 :     (p9) addl r14 = 255, r0
479 :     ;;
480 :     .L143:
481 :     st1 [r23] = r14
482 :     ld1 r14 = [r22]
483 :     ld2 r15 = [r19]
484 :     ;;
485 :     add r15 = r15, r14
486 :     ;;
487 :     sxt2 r15 = r15
488 :     ;;
489 :     cmp4.le p6, p7 = r0, r15
490 :     cmp4.ge p8, p9 = r25, r15
491 :     ;;
492 :     (p7) mov r15 = r0
493 :     (p7) br.cond.dpnt .L147
494 :     ;;
495 :     (p9) addl r15 = 255, r0
496 :     ;;
497 :     .L147:
498 :     st1 [r16] = r15
499 :     br.cloop.sptk.few .L149
500 :     adds r26 = 1, r26
501 :     adds r24 = 8, r24
502 :     add r21 = r21, r34
503 :     ;;
504 :     cmp4.geu p6, p7 = 7, r26
505 :     (p6) br.cond.dptk .L62
506 :     mov ar.lc = r2
507 :     br.ret.sptk.many b0
508 :     .endp transfer_16to8add_ia64#
509 :     .common transfer8x8_copy#,8,8
510 :     .align 16
511 :     .global transfer8x8_copy_ia64#
512 :     .proc transfer8x8_copy_ia64#
513 :     transfer8x8_copy_ia64:
514 :     .prologue
515 :     .save ar.lc, r2
516 :     mov r2 = ar.lc
517 :     .body
518 :     addl r14 = 7, r0
519 :     mov r21 = r0
520 :     ;;
521 :     mov ar.lc = r14
522 :     ;;
523 :     .L168:
524 :     zxt4 r14 = r21
525 :     adds r15 = 1, r21
526 :     adds r18 = 2, r21
527 :     ;;
528 :     add r16 = r33, r14
529 :     zxt4 r15 = r15
530 :     zxt4 r18 = r18
531 :     ;;
532 :     ld1 r17 = [r16]
533 :     add r14 = r32, r14
534 :     add r19 = r33, r15
535 :     ;;
536 :     st1 [r14] = r17
537 :     add r15 = r32, r15
538 :     add r20 = r33, r18
539 :     ld1 r16 = [r19]
540 :     adds r14 = 3, r21
541 :     add r18 = r32, r18
542 :     ;;
543 :     st1 [r15] = r16
544 :     zxt4 r14 = r14
545 :     adds r17 = 4, r21
546 :     ld1 r15 = [r20]
547 :     ;;
548 :     add r19 = r33, r14
549 :     zxt4 r17 = r17
550 :     st1 [r18] = r15
551 :     add r14 = r32, r14
552 :     ;;
553 :     add r20 = r33, r17
554 :     ld1 r15 = [r19]
555 :     adds r16 = 5, r21
556 :     add r17 = r32, r17
557 :     ;;
558 :     st1 [r14] = r15
559 :     zxt4 r16 = r16
560 :     adds r18 = 6, r21
561 :     ld1 r14 = [r20]
562 :     ;;
563 :     add r19 = r33, r16
564 :     zxt4 r18 = r18
565 :     st1 [r17] = r14
566 :     add r16 = r32, r16
567 :     ;;
568 :     add r20 = r33, r18
569 :     ld1 r14 = [r19]
570 :     adds r15 = 7, r21
571 :     add r18 = r32, r18
572 :     ;;
573 :     st1 [r16] = r14
574 :     zxt4 r15 = r15
575 :     add r21 = r21, r34
576 :     ld1 r16 = [r20]
577 :     ;;
578 :     add r17 = r33, r15
579 :     st1 [r18] = r16
580 :     add r15 = r32, r15
581 :     ;;
582 :     ld1 r14 = [r17]
583 :     ;;
584 :     st1 [r15] = r14
585 :     br.cloop.sptk.few .L168
586 :     ;;
587 :     mov ar.lc = r2
588 :     br.ret.sptk.many b0
589 :     .endp transfer8x8_copy_ia64#
590 :     .ident "GCC: (GNU) 2.96 20000731 (Red Hat Linux 7.1 2.96-85)"

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4