• Home
  • Raw
  • Download

Lines Matching refs:A0

700 my @A0=("%r10","%r11");
760 mov %rax,$A0[0] # a[1]*a[0]
762 mov %rdx,$A0[1]
763 mov $A0[0],-24($tptr,$i) # t[1]
765 xor $A0[0],$A0[0]
767 add %rax,$A0[1]
769 adc %rdx,$A0[0]
770 mov $A0[1],-16($tptr,$i) # t[2]
781 xor $A0[1],$A0[1]
782 add $A1[0],$A0[0]
784 adc \$0,$A0[1]
786 add %rax,$A0[0] # a[3]*a[0]+a[2]*a[1]+t[3]
788 adc %rdx,$A0[1]
789 mov $A0[0],-8($tptr,$j) # t[3]
801 xor $A0[0],$A0[0]
802 add $A1[1],$A0[1]
803 adc \$0,$A0[0]
805 add %rax,$A0[1] # a[4]*a[0]+a[3]*a[1]+t[4]
807 adc %rdx,$A0[0]
808 mov $A0[1],($tptr,$j) # t[4]
818 xor $A0[1],$A0[1]
819 add $A1[0],$A0[0]
820 adc \$0,$A0[1]
822 add %rax,$A0[0] # a[5]*a[2]+a[4]*a[3]+t[5]
824 adc %rdx,$A0[1]
825 mov $A0[0],8($tptr,$j) # t[5]
834 xor $A0[0],$A0[0]
835 add $A1[1],$A0[1]
836 adc \$0,$A0[0]
838 add %rax,$A0[1] # a[6]*a[2]+a[5]*a[3]+t[6]
840 adc %rdx,$A0[0]
841 mov $A0[1],16($tptr,$j) # t[6]
851 xor $A0[1],$A0[1]
852 add $A1[0],$A0[0]
854 adc \$0,$A0[1]
856 add %rax,$A0[0] # a[7]*a[4]+a[6]*a[5]+t[6]
858 adc %rdx,$A0[1]
859 mov $A0[0],-8($tptr,$j) # t[7]
865 add $A0[1],$A1[1]
885 mov -24($tptr,$i),$A0[0] # t[1]
886 xor $A0[1],$A0[1]
888 add %rax,$A0[0] # a[1]*a[0]+t[1]
890 adc %rdx,$A0[1]
891 mov $A0[0],-24($tptr,$i) # t[1]
893 xor $A0[0],$A0[0]
894 add -16($tptr,$i),$A0[1] # a[2]*a[0]+t[2]
895 adc \$0,$A0[0]
897 add %rax,$A0[1]
899 adc %rdx,$A0[0]
900 mov $A0[1],-16($tptr,$i) # t[2]
915 xor $A0[1],$A0[1]
916 add $A1[0],$A0[0]
917 adc \$0,$A0[1]
919 add %rax,$A0[0] # a[3]*a[0]+a[2]*a[1]+t[3]
921 adc %rdx,$A0[1]
922 mov $A0[0],8($tptr,$j) # t[3]
938 xor $A0[0],$A0[0]
939 add $A1[1],$A0[1]
940 adc \$0,$A0[0]
942 add %rax,$A0[1] # a[4]*a[0]+a[3]*a[1]+t[4]
944 adc %rdx,$A0[0]
945 mov $A0[1],($tptr,$j) # t[4]
956 xor $A0[1],$A0[1]
957 add $A1[0],$A0[0]
959 adc \$0,$A0[1]
961 add %rax,$A0[0] # a[5]*a[2]+a[4]*a[3]+t[5]
963 adc %rdx,$A0[1]
964 mov $A0[0],-8($tptr,$j) # t[5], "preloaded t[1]" below
970 add $A0[1],$A1[1]
990 xor $A0[1],$A0[1]
992 add %rax,$A0[0] # a[1]*a[0]+t[1], preloaded t[1]
994 adc %rdx,$A0[1]
995 mov $A0[0],-24($tptr) # t[1]
997 xor $A0[0],$A0[0]
998 add $A1[1],$A0[1] # a[2]*a[0]+t[2], preloaded t[2]
999 adc \$0,$A0[0]
1001 add %rax,$A0[1]
1003 adc %rdx,$A0[0]
1004 mov $A0[1],-16($tptr) # t[2]
1012 xor $A0[1],$A0[1]
1013 add $A1[0],$A0[0]
1015 adc \$0,$A0[1]
1017 add %rax,$A0[0] # a[3]*a[0]+a[2]*a[1]+t[3]
1019 adc %rdx,$A0[1]
1020 mov $A0[0],-8($tptr) # t[3]
1023 add $A0[1],$A1[1]
1052 xor $A0[0],$A0[0] # t[0]
1053 mov -24($tptr,$i,2),$A0[1] # t[1]
1055 lea ($shift,$A0[0],2),$S[0] # t[2*i]<<1 | shift
1056 shr \$63,$A0[0]
1057 lea ($j,$A0[1],2),$S[1] # t[2*i+1]<<1 |
1058 shr \$63,$A0[1]
1059 or $A0[0],$S[1] # | t[2*i]>>63
1060 mov -16($tptr,$i,2),$A0[0] # t[2*i+2] # prefetch
1061 mov $A0[1],$shift # shift=t[2*i+1]>>63
1064 mov -8($tptr,$i,2),$A0[1] # t[2*i+2+1] # prefetch
1070 lea ($shift,$A0[0],2),$S[2] # t[2*i]<<1 | shift
1073 shr \$63,$A0[0]
1074 lea ($j,$A0[1],2),$S[3] # t[2*i+1]<<1 |
1075 shr \$63,$A0[1]
1076 or $A0[0],$S[3] # | t[2*i]>>63
1077 mov 0($tptr,$i,2),$A0[0] # t[2*i+2] # prefetch
1078 mov $A0[1],$shift # shift=t[2*i+1]>>63
1081 mov 8($tptr,$i,2),$A0[1] # t[2*i+2+1] # prefetch
1093 lea ($shift,$A0[0],2),$S[0] # t[2*i]<<1 | shift
1094 shr \$63,$A0[0]
1095 lea ($j,$A0[1],2),$S[1] # t[2*i+1]<<1 |
1096 shr \$63,$A0[1]
1097 or $A0[0],$S[1] # | t[2*i]>>63
1098 mov -16($tptr,$i,2),$A0[0] # t[2*i+2] # prefetch
1099 mov $A0[1],$shift # shift=t[2*i+1]>>63
1102 mov -8($tptr,$i,2),$A0[1] # t[2*i+2+1] # prefetch
1108 lea ($shift,$A0[0],2),$S[2] # t[2*i]<<1 | shift
1111 shr \$63,$A0[0]
1112 lea ($j,$A0[1],2),$S[3] # t[2*i+1]<<1 |
1113 shr \$63,$A0[1]
1114 or $A0[0],$S[3] # | t[2*i]>>63
1115 mov 0($tptr,$i,2),$A0[0] # t[2*i+2] # prefetch
1116 mov $A0[1],$shift # shift=t[2*i+1]>>63
1119 mov 8($tptr,$i,2),$A0[1] # t[2*i+2+1] # prefetch
1125 lea ($shift,$A0[0],2),$S[0] # t[2*i]<<1 | shift
1128 shr \$63,$A0[0]
1129 lea ($j,$A0[1],2),$S[1] # t[2*i+1]<<1 |
1130 shr \$63,$A0[1]
1131 or $A0[0],$S[1] # | t[2*i]>>63
1132 mov 16($tptr,$i,2),$A0[0] # t[2*i+2] # prefetch
1133 mov $A0[1],$shift # shift=t[2*i+1]>>63
1136 mov 24($tptr,$i,2),$A0[1] # t[2*i+2+1] # prefetch
1142 lea ($shift,$A0[0],2),$S[2] # t[2*i]<<1 | shift
1145 shr \$63,$A0[0]
1146 lea ($j,$A0[1],2),$S[3] # t[2*i+1]<<1 |
1147 shr \$63,$A0[1]
1148 or $A0[0],$S[3] # | t[2*i]>>63
1149 mov 32($tptr,$i,2),$A0[0] # t[2*i+2] # prefetch
1150 mov $A0[1],$shift # shift=t[2*i+1]>>63
1153 mov 40($tptr,$i,2),$A0[1] # t[2*i+2+1] # prefetch
1163 lea ($shift,$A0[0],2),$S[0] # t[2*i]<<1 | shift
1164 shr \$63,$A0[0]
1165 lea ($j,$A0[1],2),$S[1] # t[2*i+1]<<1 |
1166 shr \$63,$A0[1]
1167 or $A0[0],$S[1] # | t[2*i]>>63
1168 mov -16($tptr),$A0[0] # t[2*i+2] # prefetch
1169 mov $A0[1],$shift # shift=t[2*i+1]>>63
1172 mov -8($tptr),$A0[1] # t[2*i+2+1] # prefetch
1178 lea ($shift,$A0[0],2),$S[2] # t[2*i]<<1|shift
1181 shr \$63,$A0[0]
1182 lea ($j,$A0[1],2),$S[3] # t[2*i+1]<<1 |
1183 shr \$63,$A0[1]
1184 or $A0[0],$S[3] # | t[2*i]>>63
1206 mov 64(%rsp),$A0[0] # t[0] # modsched #
1216 imulq $A0[0],$m0 # m0=t[0]*n0 # modsched #
1222 xor $A0[1],$A0[1]
1224 add %rax,$A0[0] # n[0]*m0+t[0]
1226 adc %rdx,$A0[1]
1229 xor $A0[0],$A0[0]
1230 add 8($tptr,$j),$A0[1]
1231 adc \$0,$A0[0]
1233 add %rax,$A0[1] # n[1]*m0+t[1]
1235 adc %rdx,$A0[0]
1237 imulq $A0[1],$m1
1241 add $A0[1],$A1[0]
1249 xor $A0[1],$A0[1]
1250 add 16($tptr,$j),$A0[0]
1251 adc \$0,$A0[1]
1253 add %rax,$A0[0] # n[2]*m0+t[2]
1255 adc %rdx,$A0[1]
1259 add $A0[0],$A1[1]
1267 xor $A0[0],$A0[0]
1268 add 24($tptr,$j),$A0[1]
1270 adc \$0,$A0[0]
1272 add %rax,$A0[1] # n[3]*m0+t[3]
1274 adc %rdx,$A0[0]
1281 add $A0[1],$A1[0]
1289 xor $A0[1],$A0[1]
1290 add ($tptr,$j),$A0[0]
1291 adc \$0,$A0[1]
1293 add %rax,$A0[0] # n[4]*m0+t[4]
1295 adc %rdx,$A0[1]
1299 add $A0[0],$A1[1]
1307 xor $A0[0],$A0[0]
1308 add 8($tptr,$j),$A0[1]
1309 adc \$0,$A0[0]
1311 add %rax,$A0[1] # n[5]*m0+t[5]
1313 adc %rdx,$A0[0]
1318 add $A0[1],$A1[0]
1326 xor $A0[1],$A0[1]
1327 add 16($tptr,$j),$A0[0]
1328 adc \$0,$A0[1]
1330 add %rax,$A0[0] # n[6]*m0+t[6]
1332 adc %rdx,$A0[1]
1336 add $A0[0],$A1[1]
1344 xor $A0[0],$A0[0]
1345 add 24($tptr,$j),$A0[1]
1347 adc \$0,$A0[0]
1349 add %rax,$A0[1] # n[7]*m0+t[7]
1351 adc %rdx,$A0[0]
1359 add $A0[1],$A1[0]
1367 xor $A0[1],$A0[1]
1368 add ($tptr),$A0[0] # +t[8]
1369 adc \$0,$A0[1]
1371 add $topbit,$A0[0]
1372 adc \$0,$A0[1]
1377 add $A0[0],$A1[1]
1378 mov 16($tptr,$j),$A0[0] # t[0] # modsched #
1389 add $A0[1],$A1[0]