• Home
  • Raw
  • Download

Lines Matching refs:AVX512F

2 …ple=x86_64-unknown-unknown -mattr=+avx512f | FileCheck %s --check-prefix=AVX --check-prefix=AVX512F
104 ; AVX512F-LABEL: test_div7_32i16:
105 ; AVX512F: # %bb.0:
106 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm1 = [9363,9363,9363,9363,9363,9363,9363,9363,9363,9363,9363,…
107 ; AVX512F-NEXT: vpmulhuw %ymm1, %ymm0, %ymm2
108 ; AVX512F-NEXT: vpsubw %ymm2, %ymm0, %ymm3
109 ; AVX512F-NEXT: vpsrlw $1, %ymm3, %ymm3
110 ; AVX512F-NEXT: vpaddw %ymm2, %ymm3, %ymm2
111 ; AVX512F-NEXT: vpsrlw $2, %ymm2, %ymm2
112 ; AVX512F-NEXT: vextracti64x4 $1, %zmm0, %ymm0
113 ; AVX512F-NEXT: vpmulhuw %ymm1, %ymm0, %ymm1
114 ; AVX512F-NEXT: vpsubw %ymm1, %ymm0, %ymm0
115 ; AVX512F-NEXT: vpsrlw $1, %ymm0, %ymm0
116 ; AVX512F-NEXT: vpaddw %ymm1, %ymm0, %ymm0
117 ; AVX512F-NEXT: vpsrlw $2, %ymm0, %ymm0
118 ; AVX512F-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
119 ; AVX512F-NEXT: retq
134 ; AVX512F-LABEL: test_div7_64i8:
135 ; AVX512F: # %bb.0:
136 ; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
137 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm2 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm…
138 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm3 = [37,37,37,37,37,37,37,37,37,37,37,37,37,37,37,37]
139 ; AVX512F-NEXT: vpmullw %ymm3, %ymm2, %ymm2
140 ; AVX512F-NEXT: vpsrlw $8, %ymm2, %ymm2
141 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm4 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[…
142 ; AVX512F-NEXT: vpmullw %ymm3, %ymm4, %ymm4
143 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
144 ; AVX512F-NEXT: vpackuswb %ymm2, %ymm4, %ymm2
145 ; AVX512F-NEXT: vpsubb %ymm2, %ymm0, %ymm4
146 ; AVX512F-NEXT: vpsrlw $1, %ymm4, %ymm4
147 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm5 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127…
148 ; AVX512F-NEXT: vpand %ymm5, %ymm4, %ymm4
149 ; AVX512F-NEXT: vpaddb %ymm2, %ymm4, %ymm2
150 ; AVX512F-NEXT: vpsrlw $2, %ymm2, %ymm2
151 ; AVX512F-NEXT: vextracti64x4 $1, %zmm0, %ymm0
152 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm4 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm…
153 ; AVX512F-NEXT: vpmullw %ymm3, %ymm4, %ymm4
154 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
155 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[…
156 ; AVX512F-NEXT: vpmullw %ymm3, %ymm1, %ymm1
157 ; AVX512F-NEXT: vpsrlw $8, %ymm1, %ymm1
158 ; AVX512F-NEXT: vpackuswb %ymm4, %ymm1, %ymm1
159 ; AVX512F-NEXT: vpsubb %ymm1, %ymm0, %ymm0
160 ; AVX512F-NEXT: vpsrlw $1, %ymm0, %ymm0
161 ; AVX512F-NEXT: vpand %ymm5, %ymm0, %ymm0
162 ; AVX512F-NEXT: vpaddb %ymm1, %ymm0, %ymm0
163 ; AVX512F-NEXT: vpsrlw $2, %ymm0, %ymm0
164 ; AVX512F-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
165 ; AVX512F-NEXT: vpandq {{.*}}(%rip), %zmm0, %zmm0
166 ; AVX512F-NEXT: retq
195 ; AVX512F-LABEL: test_divconstant_64i8:
196 ; AVX512F: # %bb.0:
197 ; AVX512F-NEXT: vextracti64x4 $1, %zmm0, %ymm2
198 ; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
199 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm2[8],ymm1[8],ymm2[9],ymm1[9],ymm2[10],ymm1[10],ymm…
200 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm3, %ymm3
201 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
202 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm3, %ymm3
203 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
204 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm4 = ymm2[0],ymm1[0],ymm2[1],ymm1[1],ymm2[2],ymm1[2],ymm2[…
205 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
206 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
207 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
208 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
209 ; AVX512F-NEXT: vpackuswb %ymm3, %ymm4, %ymm3
210 ; AVX512F-NEXT: vpsubb %ymm3, %ymm2, %ymm2
211 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm4 = ymm2[8],ymm1[8],ymm2[9],ymm1[9],ymm2[10],ymm1[10],ymm…
212 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
213 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
214 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm2 = ymm2[0],ymm1[0],ymm2[1],ymm1[1],ymm2[2],ymm1[2],ymm2[…
215 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm2, %ymm2
216 ; AVX512F-NEXT: vpsrlw $8, %ymm2, %ymm2
217 ; AVX512F-NEXT: vpackuswb %ymm4, %ymm2, %ymm2
218 ; AVX512F-NEXT: vpaddb %ymm3, %ymm2, %ymm2
219 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm2[8],ymm1[8],ymm2[9],ymm1[9],ymm2[10],ymm1[10],ymm…
220 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm3, %ymm3
221 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
222 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm2 = ymm2[0],ymm1[0],ymm2[1],ymm1[1],ymm2[2],ymm1[2],ymm2[…
223 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm2, %ymm2
224 ; AVX512F-NEXT: vpsrlw $8, %ymm2, %ymm2
225 ; AVX512F-NEXT: vpackuswb %ymm3, %ymm2, %ymm2
226 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm…
227 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm3, %ymm3
228 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
229 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm3, %ymm3
230 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
231 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm4 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[…
232 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
233 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
234 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
235 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
236 ; AVX512F-NEXT: vpackuswb %ymm3, %ymm4, %ymm3
237 ; AVX512F-NEXT: vpsubb %ymm3, %ymm0, %ymm0
238 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm4 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm…
239 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
240 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
241 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[…
242 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm0, %ymm0
243 ; AVX512F-NEXT: vpsrlw $8, %ymm0, %ymm0
244 ; AVX512F-NEXT: vpackuswb %ymm4, %ymm0, %ymm0
245 ; AVX512F-NEXT: vpaddb %ymm3, %ymm0, %ymm0
246 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm…
247 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm3, %ymm3
248 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
249 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[…
250 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm0, %ymm0
251 ; AVX512F-NEXT: vpsrlw $8, %ymm0, %ymm0
252 ; AVX512F-NEXT: vpackuswb %ymm3, %ymm0, %ymm0
253 ; AVX512F-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
254 ; AVX512F-NEXT: retq
431 ; AVX512F-LABEL: test_rem7_32i16:
432 ; AVX512F: # %bb.0:
433 ; AVX512F-NEXT: vextracti64x4 $1, %zmm0, %ymm1
434 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [9363,9363,9363,9363,9363,9363,9363,9363,9363,9363,9363,…
435 ; AVX512F-NEXT: vpmulhuw %ymm2, %ymm1, %ymm3
436 ; AVX512F-NEXT: vpsubw %ymm3, %ymm1, %ymm4
437 ; AVX512F-NEXT: vpsrlw $1, %ymm4, %ymm4
438 ; AVX512F-NEXT: vpaddw %ymm3, %ymm4, %ymm3
439 ; AVX512F-NEXT: vpsrlw $2, %ymm3, %ymm3
440 ; AVX512F-NEXT: vpsllw $3, %ymm3, %ymm4
441 ; AVX512F-NEXT: vpsubw %ymm4, %ymm3, %ymm3
442 ; AVX512F-NEXT: vpaddw %ymm3, %ymm1, %ymm1
443 ; AVX512F-NEXT: vpmulhuw %ymm2, %ymm0, %ymm2
444 ; AVX512F-NEXT: vpsubw %ymm2, %ymm0, %ymm3
445 ; AVX512F-NEXT: vpsrlw $1, %ymm3, %ymm3
446 ; AVX512F-NEXT: vpaddw %ymm2, %ymm3, %ymm2
447 ; AVX512F-NEXT: vpsrlw $2, %ymm2, %ymm2
448 ; AVX512F-NEXT: vpsllw $3, %ymm2, %ymm3
449 ; AVX512F-NEXT: vpsubw %ymm3, %ymm2, %ymm2
450 ; AVX512F-NEXT: vpaddw %ymm2, %ymm0, %ymm0
451 ; AVX512F-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
452 ; AVX512F-NEXT: retq
469 ; AVX512F-LABEL: test_rem7_64i8:
470 ; AVX512F: # %bb.0:
471 ; AVX512F-NEXT: vextracti64x4 $1, %zmm0, %ymm1
472 ; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
473 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm1[8],ymm2[8],ymm1[9],ymm2[9],ymm1[10],ymm2[10],ymm…
474 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm4 = [37,37,37,37,37,37,37,37,37,37,37,37,37,37,37,37]
475 ; AVX512F-NEXT: vpmullw %ymm4, %ymm3, %ymm3
476 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
477 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm5 = ymm1[0],ymm2[0],ymm1[1],ymm2[1],ymm1[2],ymm2[2],ymm1[…
478 ; AVX512F-NEXT: vpmullw %ymm4, %ymm5, %ymm5
479 ; AVX512F-NEXT: vpsrlw $8, %ymm5, %ymm5
480 ; AVX512F-NEXT: vpackuswb %ymm3, %ymm5, %ymm3
481 ; AVX512F-NEXT: vpsubb %ymm3, %ymm1, %ymm5
482 ; AVX512F-NEXT: vpsrlw $1, %ymm5, %ymm5
483 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm6 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127…
484 ; AVX512F-NEXT: vpand %ymm6, %ymm5, %ymm5
485 ; AVX512F-NEXT: vpaddb %ymm3, %ymm5, %ymm3
486 ; AVX512F-NEXT: vpsrlw $2, %ymm3, %ymm3
487 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm5 = [63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,6…
488 ; AVX512F-NEXT: vpand %ymm5, %ymm3, %ymm3
489 ; AVX512F-NEXT: vpsllw $3, %ymm3, %ymm7
490 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm8 = [248,248,248,248,248,248,248,248,248,248,248,248,248,248…
491 ; AVX512F-NEXT: vpand %ymm7, %ymm8, %ymm7
492 ; AVX512F-NEXT: vpsubb %ymm7, %ymm3, %ymm3
493 ; AVX512F-NEXT: vpaddb %ymm3, %ymm1, %ymm1
494 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm0[8],ymm2[8],ymm0[9],ymm2[9],ymm0[10],ymm2[10],ymm…
495 ; AVX512F-NEXT: vpmullw %ymm4, %ymm3, %ymm3
496 ; AVX512F-NEXT: vpsrlw $8, %ymm3, %ymm3
497 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm2 = ymm0[0],ymm2[0],ymm0[1],ymm2[1],ymm0[2],ymm2[2],ymm0[…
498 ; AVX512F-NEXT: vpmullw %ymm4, %ymm2, %ymm2
499 ; AVX512F-NEXT: vpsrlw $8, %ymm2, %ymm2
500 ; AVX512F-NEXT: vpackuswb %ymm3, %ymm2, %ymm2
501 ; AVX512F-NEXT: vpsubb %ymm2, %ymm0, %ymm3
502 ; AVX512F-NEXT: vpsrlw $1, %ymm3, %ymm3
503 ; AVX512F-NEXT: vpand %ymm6, %ymm3, %ymm3
504 ; AVX512F-NEXT: vpaddb %ymm2, %ymm3, %ymm2
505 ; AVX512F-NEXT: vpsrlw $2, %ymm2, %ymm2
506 ; AVX512F-NEXT: vpand %ymm5, %ymm2, %ymm2
507 ; AVX512F-NEXT: vpsllw $3, %ymm2, %ymm3
508 ; AVX512F-NEXT: vpand %ymm3, %ymm8, %ymm3
509 ; AVX512F-NEXT: vpsubb %ymm3, %ymm2, %ymm2
510 ; AVX512F-NEXT: vpaddb %ymm2, %ymm0, %ymm0
511 ; AVX512F-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
512 ; AVX512F-NEXT: retq
545 ; AVX512F-LABEL: test_remconstant_64i8:
546 ; AVX512F: # %bb.0:
547 ; AVX512F-NEXT: vextracti64x4 $1, %zmm0, %ymm3
548 ; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
549 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm2 = ymm3[8],ymm1[8],ymm3[9],ymm1[9],ymm3[10],ymm1[10],ymm…
550 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm2, %ymm2
551 ; AVX512F-NEXT: vpsrlw $8, %ymm2, %ymm2
552 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm2, %ymm2
553 ; AVX512F-NEXT: vpsrlw $8, %ymm2, %ymm2
554 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm4 = ymm3[0],ymm1[0],ymm3[1],ymm1[1],ymm3[2],ymm1[2],ymm3[…
555 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
556 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
557 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
558 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
559 ; AVX512F-NEXT: vpackuswb %ymm2, %ymm4, %ymm2
560 ; AVX512F-NEXT: vpsubb %ymm2, %ymm3, %ymm4
561 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm5 = ymm4[8],ymm1[8],ymm4[9],ymm1[9],ymm4[10],ymm1[10],ymm…
562 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm5, %ymm5
563 ; AVX512F-NEXT: vpsrlw $8, %ymm5, %ymm5
564 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm4 = ymm4[0],ymm1[0],ymm4[1],ymm1[1],ymm4[2],ymm1[2],ymm4[…
565 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
566 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
567 ; AVX512F-NEXT: vpackuswb %ymm5, %ymm4, %ymm4
568 ; AVX512F-NEXT: vpaddb %ymm2, %ymm4, %ymm4
569 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm2 = ymm4[8],ymm1[8],ymm4[9],ymm1[9],ymm4[10],ymm1[10],ymm…
570 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm2, %ymm2
571 ; AVX512F-NEXT: vpsrlw $8, %ymm2, %ymm2
572 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm2, %ymm5
573 ; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255…
574 ; AVX512F-NEXT: vpand %ymm2, %ymm5, %ymm5
575 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm4 = ymm4[0],ymm1[0],ymm4[1],ymm1[1],ymm4[2],ymm1[2],ymm4[…
576 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
577 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
578 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
579 ; AVX512F-NEXT: vpand %ymm2, %ymm4, %ymm4
580 ; AVX512F-NEXT: vpackuswb %ymm5, %ymm4, %ymm4
581 ; AVX512F-NEXT: vpsubb %ymm4, %ymm3, %ymm3
582 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm4 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm…
583 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
584 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
585 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm4, %ymm4
586 ; AVX512F-NEXT: vpsrlw $8, %ymm4, %ymm4
587 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm5 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[…
588 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm5, %ymm5
589 ; AVX512F-NEXT: vpsrlw $8, %ymm5, %ymm5
590 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm5, %ymm5
591 ; AVX512F-NEXT: vpsrlw $8, %ymm5, %ymm5
592 ; AVX512F-NEXT: vpackuswb %ymm4, %ymm5, %ymm4
593 ; AVX512F-NEXT: vpsubb %ymm4, %ymm0, %ymm5
594 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm6 = ymm5[8],ymm1[8],ymm5[9],ymm1[9],ymm5[10],ymm1[10],ymm…
595 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm6, %ymm6
596 ; AVX512F-NEXT: vpsrlw $8, %ymm6, %ymm6
597 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm5 = ymm5[0],ymm1[0],ymm5[1],ymm1[1],ymm5[2],ymm1[2],ymm5[…
598 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm5, %ymm5
599 ; AVX512F-NEXT: vpsrlw $8, %ymm5, %ymm5
600 ; AVX512F-NEXT: vpackuswb %ymm6, %ymm5, %ymm5
601 ; AVX512F-NEXT: vpaddb %ymm4, %ymm5, %ymm4
602 ; AVX512F-NEXT: vpunpckhbw {{.*#+}} ymm5 = ymm4[8],ymm1[8],ymm4[9],ymm1[9],ymm4[10],ymm1[10],ymm…
603 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm5, %ymm5
604 ; AVX512F-NEXT: vpsrlw $8, %ymm5, %ymm5
605 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm5, %ymm5
606 ; AVX512F-NEXT: vpand %ymm2, %ymm5, %ymm5
607 ; AVX512F-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm4[0],ymm1[0],ymm4[1],ymm1[1],ymm4[2],ymm1[2],ymm4[…
608 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm1, %ymm1
609 ; AVX512F-NEXT: vpsrlw $8, %ymm1, %ymm1
610 ; AVX512F-NEXT: vpmullw {{.*}}(%rip), %ymm1, %ymm1
611 ; AVX512F-NEXT: vpand %ymm2, %ymm1, %ymm1
612 ; AVX512F-NEXT: vpackuswb %ymm5, %ymm1, %ymm1
613 ; AVX512F-NEXT: vpsubb %ymm1, %ymm0, %ymm0
614 ; AVX512F-NEXT: vinserti64x4 $1, %ymm3, %zmm0, %zmm0
615 ; AVX512F-NEXT: retq