• Home
  • Raw
  • Download

Lines Matching refs:vpinsrb

2250 ; AVX-NEXT:    vpinsrb $1, 1(%rdi), %xmm1, %xmm1
2256 ; AVX-NEXT: vpinsrb $2, 2(%rdi), %xmm1, %xmm1
2262 ; AVX-NEXT: vpinsrb $3, 3(%rdi), %xmm1, %xmm1
2268 ; AVX-NEXT: vpinsrb $4, 4(%rdi), %xmm1, %xmm1
2274 ; AVX-NEXT: vpinsrb $5, 5(%rdi), %xmm1, %xmm1
2280 ; AVX-NEXT: vpinsrb $6, 6(%rdi), %xmm1, %xmm1
2286 ; AVX-NEXT: vpinsrb $7, 7(%rdi), %xmm1, %xmm1
2292 ; AVX-NEXT: vpinsrb $8, 8(%rdi), %xmm1, %xmm1
2298 ; AVX-NEXT: vpinsrb $9, 9(%rdi), %xmm1, %xmm1
2304 ; AVX-NEXT: vpinsrb $10, 10(%rdi), %xmm1, %xmm1
2310 ; AVX-NEXT: vpinsrb $11, 11(%rdi), %xmm1, %xmm1
2316 ; AVX-NEXT: vpinsrb $12, 12(%rdi), %xmm1, %xmm1
2322 ; AVX-NEXT: vpinsrb $13, 13(%rdi), %xmm1, %xmm1
2328 ; AVX-NEXT: vpinsrb $14, 14(%rdi), %xmm1, %xmm1
2334 ; AVX-NEXT: vpinsrb $15, 15(%rdi), %xmm1, %xmm1
2362 ; AVX512F-NEXT: vpinsrb $1, 1(%rdi), %xmm0, %xmm0
2370 ; AVX512F-NEXT: vpinsrb $2, 2(%rdi), %xmm0, %xmm0
2378 ; AVX512F-NEXT: vpinsrb $3, 3(%rdi), %xmm0, %xmm0
2386 ; AVX512F-NEXT: vpinsrb $4, 4(%rdi), %xmm0, %xmm0
2394 ; AVX512F-NEXT: vpinsrb $5, 5(%rdi), %xmm0, %xmm0
2402 ; AVX512F-NEXT: vpinsrb $6, 6(%rdi), %xmm0, %xmm0
2410 ; AVX512F-NEXT: vpinsrb $7, 7(%rdi), %xmm0, %xmm0
2418 ; AVX512F-NEXT: vpinsrb $8, 8(%rdi), %xmm0, %xmm0
2426 ; AVX512F-NEXT: vpinsrb $9, 9(%rdi), %xmm0, %xmm0
2434 ; AVX512F-NEXT: vpinsrb $10, 10(%rdi), %xmm0, %xmm0
2442 ; AVX512F-NEXT: vpinsrb $11, 11(%rdi), %xmm0, %xmm0
2450 ; AVX512F-NEXT: vpinsrb $12, 12(%rdi), %xmm0, %xmm0
2458 ; AVX512F-NEXT: vpinsrb $13, 13(%rdi), %xmm0, %xmm0
2466 ; AVX512F-NEXT: vpinsrb $14, 14(%rdi), %xmm0, %xmm0
2474 ; AVX512F-NEXT: vpinsrb $15, 15(%rdi), %xmm0, %xmm0
2508 ; AVX1-NEXT: vpinsrb $1, 1(%rdi), %xmm1, %xmm2
2515 ; AVX1-NEXT: vpinsrb $2, 2(%rdi), %xmm1, %xmm2
2522 ; AVX1-NEXT: vpinsrb $3, 3(%rdi), %xmm1, %xmm2
2529 ; AVX1-NEXT: vpinsrb $4, 4(%rdi), %xmm1, %xmm2
2536 ; AVX1-NEXT: vpinsrb $5, 5(%rdi), %xmm1, %xmm2
2543 ; AVX1-NEXT: vpinsrb $6, 6(%rdi), %xmm1, %xmm2
2550 ; AVX1-NEXT: vpinsrb $7, 7(%rdi), %xmm1, %xmm2
2557 ; AVX1-NEXT: vpinsrb $8, 8(%rdi), %xmm1, %xmm2
2564 ; AVX1-NEXT: vpinsrb $9, 9(%rdi), %xmm1, %xmm2
2571 ; AVX1-NEXT: vpinsrb $10, 10(%rdi), %xmm1, %xmm2
2578 ; AVX1-NEXT: vpinsrb $11, 11(%rdi), %xmm1, %xmm2
2585 ; AVX1-NEXT: vpinsrb $12, 12(%rdi), %xmm1, %xmm2
2592 ; AVX1-NEXT: vpinsrb $13, 13(%rdi), %xmm1, %xmm2
2599 ; AVX1-NEXT: vpinsrb $14, 14(%rdi), %xmm1, %xmm2
2606 ; AVX1-NEXT: vpinsrb $15, 15(%rdi), %xmm1, %xmm2
2615 ; AVX1-NEXT: vpinsrb $0, 16(%rdi), %xmm3, %xmm3
2623 ; AVX1-NEXT: vpinsrb $1, 17(%rdi), %xmm3, %xmm3
2631 ; AVX1-NEXT: vpinsrb $2, 18(%rdi), %xmm3, %xmm3
2639 ; AVX1-NEXT: vpinsrb $3, 19(%rdi), %xmm3, %xmm3
2647 ; AVX1-NEXT: vpinsrb $4, 20(%rdi), %xmm3, %xmm3
2655 ; AVX1-NEXT: vpinsrb $5, 21(%rdi), %xmm3, %xmm3
2663 ; AVX1-NEXT: vpinsrb $6, 22(%rdi), %xmm3, %xmm3
2671 ; AVX1-NEXT: vpinsrb $7, 23(%rdi), %xmm3, %xmm3
2679 ; AVX1-NEXT: vpinsrb $8, 24(%rdi), %xmm3, %xmm3
2687 ; AVX1-NEXT: vpinsrb $9, 25(%rdi), %xmm3, %xmm3
2695 ; AVX1-NEXT: vpinsrb $10, 26(%rdi), %xmm3, %xmm3
2703 ; AVX1-NEXT: vpinsrb $11, 27(%rdi), %xmm3, %xmm3
2711 ; AVX1-NEXT: vpinsrb $12, 28(%rdi), %xmm3, %xmm3
2719 ; AVX1-NEXT: vpinsrb $13, 29(%rdi), %xmm3, %xmm3
2727 ; AVX1-NEXT: vpinsrb $14, 30(%rdi), %xmm3, %xmm3
2735 ; AVX1-NEXT: vpinsrb $15, 31(%rdi), %xmm3, %xmm3
2764 ; AVX2-NEXT: vpinsrb $1, 1(%rdi), %xmm1, %xmm2
2771 ; AVX2-NEXT: vpinsrb $2, 2(%rdi), %xmm1, %xmm2
2778 ; AVX2-NEXT: vpinsrb $3, 3(%rdi), %xmm1, %xmm2
2785 ; AVX2-NEXT: vpinsrb $4, 4(%rdi), %xmm1, %xmm2
2792 ; AVX2-NEXT: vpinsrb $5, 5(%rdi), %xmm1, %xmm2
2799 ; AVX2-NEXT: vpinsrb $6, 6(%rdi), %xmm1, %xmm2
2806 ; AVX2-NEXT: vpinsrb $7, 7(%rdi), %xmm1, %xmm2
2813 ; AVX2-NEXT: vpinsrb $8, 8(%rdi), %xmm1, %xmm2
2820 ; AVX2-NEXT: vpinsrb $9, 9(%rdi), %xmm1, %xmm2
2827 ; AVX2-NEXT: vpinsrb $10, 10(%rdi), %xmm1, %xmm2
2834 ; AVX2-NEXT: vpinsrb $11, 11(%rdi), %xmm1, %xmm2
2841 ; AVX2-NEXT: vpinsrb $12, 12(%rdi), %xmm1, %xmm2
2848 ; AVX2-NEXT: vpinsrb $13, 13(%rdi), %xmm1, %xmm2
2855 ; AVX2-NEXT: vpinsrb $14, 14(%rdi), %xmm1, %xmm2
2862 ; AVX2-NEXT: vpinsrb $15, 15(%rdi), %xmm1, %xmm2
2871 ; AVX2-NEXT: vpinsrb $0, 16(%rdi), %xmm3, %xmm3
2879 ; AVX2-NEXT: vpinsrb $1, 17(%rdi), %xmm3, %xmm3
2887 ; AVX2-NEXT: vpinsrb $2, 18(%rdi), %xmm3, %xmm3
2895 ; AVX2-NEXT: vpinsrb $3, 19(%rdi), %xmm3, %xmm3
2903 ; AVX2-NEXT: vpinsrb $4, 20(%rdi), %xmm3, %xmm3
2911 ; AVX2-NEXT: vpinsrb $5, 21(%rdi), %xmm3, %xmm3
2919 ; AVX2-NEXT: vpinsrb $6, 22(%rdi), %xmm3, %xmm3
2927 ; AVX2-NEXT: vpinsrb $7, 23(%rdi), %xmm3, %xmm3
2935 ; AVX2-NEXT: vpinsrb $8, 24(%rdi), %xmm3, %xmm3
2943 ; AVX2-NEXT: vpinsrb $9, 25(%rdi), %xmm3, %xmm3
2951 ; AVX2-NEXT: vpinsrb $10, 26(%rdi), %xmm3, %xmm3
2959 ; AVX2-NEXT: vpinsrb $11, 27(%rdi), %xmm3, %xmm3
2967 ; AVX2-NEXT: vpinsrb $12, 28(%rdi), %xmm3, %xmm3
2975 ; AVX2-NEXT: vpinsrb $13, 29(%rdi), %xmm3, %xmm3
2983 ; AVX2-NEXT: vpinsrb $14, 30(%rdi), %xmm3, %xmm3
2991 ; AVX2-NEXT: vpinsrb $15, 31(%rdi), %xmm2, %xmm2
3015 ; AVX512F-NEXT: vpinsrb $1, 1(%rdi), %xmm1, %xmm2
3022 ; AVX512F-NEXT: vpinsrb $2, 2(%rdi), %xmm1, %xmm2
3029 ; AVX512F-NEXT: vpinsrb $3, 3(%rdi), %xmm1, %xmm2
3036 ; AVX512F-NEXT: vpinsrb $4, 4(%rdi), %xmm1, %xmm2
3043 ; AVX512F-NEXT: vpinsrb $5, 5(%rdi), %xmm1, %xmm2
3050 ; AVX512F-NEXT: vpinsrb $6, 6(%rdi), %xmm1, %xmm2
3057 ; AVX512F-NEXT: vpinsrb $7, 7(%rdi), %xmm1, %xmm2
3064 ; AVX512F-NEXT: vpinsrb $8, 8(%rdi), %xmm1, %xmm2
3071 ; AVX512F-NEXT: vpinsrb $9, 9(%rdi), %xmm1, %xmm2
3078 ; AVX512F-NEXT: vpinsrb $10, 10(%rdi), %xmm1, %xmm2
3085 ; AVX512F-NEXT: vpinsrb $11, 11(%rdi), %xmm1, %xmm2
3092 ; AVX512F-NEXT: vpinsrb $12, 12(%rdi), %xmm1, %xmm2
3099 ; AVX512F-NEXT: vpinsrb $13, 13(%rdi), %xmm1, %xmm2
3106 ; AVX512F-NEXT: vpinsrb $14, 14(%rdi), %xmm1, %xmm2
3113 ; AVX512F-NEXT: vpinsrb $15, 15(%rdi), %xmm1, %xmm2
3122 ; AVX512F-NEXT: vpinsrb $0, 16(%rdi), %xmm3, %xmm3
3130 ; AVX512F-NEXT: vpinsrb $1, 17(%rdi), %xmm3, %xmm3
3138 ; AVX512F-NEXT: vpinsrb $2, 18(%rdi), %xmm3, %xmm3
3146 ; AVX512F-NEXT: vpinsrb $3, 19(%rdi), %xmm3, %xmm3
3154 ; AVX512F-NEXT: vpinsrb $4, 20(%rdi), %xmm3, %xmm3
3162 ; AVX512F-NEXT: vpinsrb $5, 21(%rdi), %xmm3, %xmm3
3170 ; AVX512F-NEXT: vpinsrb $6, 22(%rdi), %xmm3, %xmm3
3178 ; AVX512F-NEXT: vpinsrb $7, 23(%rdi), %xmm3, %xmm3
3186 ; AVX512F-NEXT: vpinsrb $8, 24(%rdi), %xmm3, %xmm3
3194 ; AVX512F-NEXT: vpinsrb $9, 25(%rdi), %xmm3, %xmm3
3202 ; AVX512F-NEXT: vpinsrb $10, 26(%rdi), %xmm3, %xmm3
3210 ; AVX512F-NEXT: vpinsrb $11, 27(%rdi), %xmm3, %xmm3
3218 ; AVX512F-NEXT: vpinsrb $12, 28(%rdi), %xmm3, %xmm3
3226 ; AVX512F-NEXT: vpinsrb $13, 29(%rdi), %xmm3, %xmm3
3234 ; AVX512F-NEXT: vpinsrb $14, 30(%rdi), %xmm3, %xmm3
3242 ; AVX512F-NEXT: vpinsrb $15, 31(%rdi), %xmm2, %xmm2
3310 ; AVX1-NEXT: vpinsrb $1, 1(%rax), %xmm9, %xmm3
3316 ; AVX1-NEXT: vpinsrb $2, 2(%rax), %xmm9, %xmm3
3322 ; AVX1-NEXT: vpinsrb $3, 3(%rax), %xmm9, %xmm3
3328 ; AVX1-NEXT: vpinsrb $4, 4(%rax), %xmm9, %xmm3
3335 ; AVX1-NEXT: vpinsrb $5, 5(%rax), %xmm9, %xmm3
3342 ; AVX1-NEXT: vpinsrb $6, 6(%rax), %xmm9, %xmm3
3349 ; AVX1-NEXT: vpinsrb $7, 7(%rax), %xmm9, %xmm3
3356 ; AVX1-NEXT: vpinsrb $8, 8(%rax), %xmm9, %xmm3
3363 ; AVX1-NEXT: vpinsrb $9, 9(%rax), %xmm9, %xmm3
3370 ; AVX1-NEXT: vpinsrb $10, 10(%rax), %xmm9, %xmm3
3377 ; AVX1-NEXT: vpinsrb $11, 11(%rax), %xmm9, %xmm3
3384 ; AVX1-NEXT: vpinsrb $12, 12(%rax), %xmm9, %xmm3
3390 ; AVX1-NEXT: vpinsrb $13, 13(%rax), %xmm9, %xmm3
3396 ; AVX1-NEXT: vpinsrb $14, 14(%rax), %xmm9, %xmm3
3402 ; AVX1-NEXT: vpinsrb $15, 15(%rax), %xmm9, %xmm3
3409 ; AVX1-NEXT: vpinsrb $0, 16(%rax), %xmm3, %xmm3
3416 ; AVX1-NEXT: vpinsrb $1, 17(%rax), %xmm3, %xmm3
3423 ; AVX1-NEXT: vpinsrb $2, 18(%rax), %xmm3, %xmm3
3430 ; AVX1-NEXT: vpinsrb $3, 19(%rax), %xmm3, %xmm3
3437 ; AVX1-NEXT: vpinsrb $4, 20(%rax), %xmm3, %xmm3
3444 ; AVX1-NEXT: vpinsrb $5, 21(%rax), %xmm3, %xmm3
3451 ; AVX1-NEXT: vpinsrb $6, 22(%rax), %xmm3, %xmm3
3458 ; AVX1-NEXT: vpinsrb $7, 23(%rax), %xmm3, %xmm3
3465 ; AVX1-NEXT: vpinsrb $8, 24(%rax), %xmm3, %xmm3
3472 ; AVX1-NEXT: vpinsrb $9, 25(%rax), %xmm3, %xmm3
3479 ; AVX1-NEXT: vpinsrb $10, 26(%rax), %xmm3, %xmm3
3486 ; AVX1-NEXT: vpinsrb $11, 27(%rax), %xmm3, %xmm3
3493 ; AVX1-NEXT: vpinsrb $12, 28(%rax), %xmm3, %xmm3
3500 ; AVX1-NEXT: vpinsrb $13, 29(%rax), %xmm3, %xmm3
3507 ; AVX1-NEXT: vpinsrb $14, 30(%rax), %xmm3, %xmm3
3514 ; AVX1-NEXT: vpinsrb $15, 31(%rax), %xmm3, %xmm3
3520 ; AVX1-NEXT: vpinsrb $0, 32(%rax), %xmm0, %xmm3
3526 ; AVX1-NEXT: vpinsrb $1, 33(%rax), %xmm3, %xmm4
3532 ; AVX1-NEXT: vpinsrb $2, 34(%rax), %xmm3, %xmm4
3538 ; AVX1-NEXT: vpinsrb $3, 35(%rax), %xmm3, %xmm4
3544 ; AVX1-NEXT: vpinsrb $4, 36(%rax), %xmm3, %xmm4
3550 ; AVX1-NEXT: vpinsrb $5, 37(%rax), %xmm3, %xmm4
3556 ; AVX1-NEXT: vpinsrb $6, 38(%rax), %xmm3, %xmm4
3562 ; AVX1-NEXT: vpinsrb $7, 39(%rax), %xmm3, %xmm4
3568 ; AVX1-NEXT: vpinsrb $8, 40(%rax), %xmm3, %xmm4
3574 ; AVX1-NEXT: vpinsrb $9, 41(%rax), %xmm3, %xmm4
3580 ; AVX1-NEXT: vpinsrb $10, 42(%rax), %xmm3, %xmm4
3586 ; AVX1-NEXT: vpinsrb $11, 43(%rax), %xmm3, %xmm4
3592 ; AVX1-NEXT: vpinsrb $12, 44(%rax), %xmm3, %xmm4
3598 ; AVX1-NEXT: vpinsrb $13, 45(%rax), %xmm3, %xmm4
3604 ; AVX1-NEXT: vpinsrb $14, 46(%rax), %xmm3, %xmm4
3610 ; AVX1-NEXT: vpinsrb $15, 47(%rax), %xmm3, %xmm4
3617 ; AVX1-NEXT: vpinsrb $0, 48(%rax), %xmm4, %xmm4
3624 ; AVX1-NEXT: vpinsrb $1, 49(%rax), %xmm4, %xmm4
3631 ; AVX1-NEXT: vpinsrb $2, 50(%rax), %xmm4, %xmm4
3638 ; AVX1-NEXT: vpinsrb $3, 51(%rax), %xmm4, %xmm4
3645 ; AVX1-NEXT: vpinsrb $4, 52(%rax), %xmm4, %xmm4
3652 ; AVX1-NEXT: vpinsrb $5, 53(%rax), %xmm4, %xmm4
3659 ; AVX1-NEXT: vpinsrb $6, 54(%rax), %xmm4, %xmm4
3666 ; AVX1-NEXT: vpinsrb $7, 55(%rax), %xmm4, %xmm4
3673 ; AVX1-NEXT: vpinsrb $8, 56(%rax), %xmm4, %xmm4
3680 ; AVX1-NEXT: vpinsrb $9, 57(%rax), %xmm4, %xmm4
3687 ; AVX1-NEXT: vpinsrb $10, 58(%rax), %xmm4, %xmm4
3694 ; AVX1-NEXT: vpinsrb $11, 59(%rax), %xmm4, %xmm4
3701 ; AVX1-NEXT: vpinsrb $12, 60(%rax), %xmm4, %xmm4
3708 ; AVX1-NEXT: vpinsrb $13, 61(%rax), %xmm4, %xmm4
3715 ; AVX1-NEXT: vpinsrb $14, 62(%rax), %xmm4, %xmm4
3727 ; AVX1-NEXT: vpinsrb $15, 63(%rax), %xmm4, %xmm4
3802 ; AVX1-NEXT: vpinsrb $1, %ebp, %xmm4, %xmm4
3805 ; AVX1-NEXT: vpinsrb $2, %ebp, %xmm4, %xmm4
3808 ; AVX1-NEXT: vpinsrb $3, %ebp, %xmm4, %xmm4
3811 ; AVX1-NEXT: vpinsrb $4, %ebp, %xmm4, %xmm4
3814 ; AVX1-NEXT: vpinsrb $5, %ebp, %xmm4, %xmm4
3815 ; AVX1-NEXT: vpinsrb $6, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3816 ; AVX1-NEXT: vpinsrb $7, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3817 ; AVX1-NEXT: vpinsrb $8, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3818 ; AVX1-NEXT: vpinsrb $9, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3819 ; AVX1-NEXT: vpinsrb $10, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3820 ; AVX1-NEXT: vpinsrb $11, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3821 ; AVX1-NEXT: vpinsrb $12, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3822 ; AVX1-NEXT: vpinsrb $13, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3823 ; AVX1-NEXT: vpinsrb $14, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3824 ; AVX1-NEXT: vpinsrb $15, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
3827 ; AVX1-NEXT: vpinsrb $1, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3828 ; AVX1-NEXT: vpinsrb $2, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3829 ; AVX1-NEXT: vpinsrb $3, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3830 ; AVX1-NEXT: vpinsrb $4, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3831 ; AVX1-NEXT: vpinsrb $5, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3832 ; AVX1-NEXT: vpinsrb $6, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3833 ; AVX1-NEXT: vpinsrb $7, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3834 ; AVX1-NEXT: vpinsrb $8, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3835 ; AVX1-NEXT: vpinsrb $9, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3836 ; AVX1-NEXT: vpinsrb $10, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3837 ; AVX1-NEXT: vpinsrb $11, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3838 ; AVX1-NEXT: vpinsrb $12, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3839 ; AVX1-NEXT: vpinsrb $13, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3840 ; AVX1-NEXT: vpinsrb $14, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
3841 ; AVX1-NEXT: vpinsrb $15, -{{[0-9]+}}(%rsp), %xmm5, %xmm8 ## 4-byte Folded Reload
3844 ; AVX1-NEXT: vpinsrb $1, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
3845 ; AVX1-NEXT: vpinsrb $2, %r12d, %xmm6, %xmm6
3846 ; AVX1-NEXT: vpinsrb $3, %r15d, %xmm6, %xmm6
3847 ; AVX1-NEXT: vpinsrb $4, %r14d, %xmm6, %xmm6
3848 ; AVX1-NEXT: vpinsrb $5, %r11d, %xmm6, %xmm6
3849 ; AVX1-NEXT: vpinsrb $6, %r8d, %xmm6, %xmm6
3850 ; AVX1-NEXT: vpinsrb $7, %edx, %xmm6, %xmm6
3851 ; AVX1-NEXT: vpinsrb $8, %eax, %xmm6, %xmm6
3854 ; AVX1-NEXT: vpinsrb $9, %ecx, %xmm6, %xmm6
3857 ; AVX1-NEXT: vpinsrb $10, %esi, %xmm6, %xmm6
3860 ; AVX1-NEXT: vpinsrb $11, %r9d, %xmm6, %xmm6
3863 ; AVX1-NEXT: vpinsrb $12, %r10d, %xmm6, %xmm6
3866 ; AVX1-NEXT: vpinsrb $13, %ebx, %xmm6, %xmm6
3869 ; AVX1-NEXT: vpinsrb $14, %r13d, %xmm6, %xmm6
3872 ; AVX1-NEXT: vpinsrb $15, %r14d, %xmm6, %xmm10
3878 ; AVX1-NEXT: vpinsrb $1, %r11d, %xmm7, %xmm7
3879 ; AVX1-NEXT: vpinsrb $2, %r15d, %xmm7, %xmm7
3880 ; AVX1-NEXT: vpinsrb $3, %r12d, %xmm7, %xmm7
3881 ; AVX1-NEXT: vpinsrb $4, %r8d, %xmm7, %xmm7
3882 ; AVX1-NEXT: vpinsrb $5, %ecx, %xmm7, %xmm7
3883 ; AVX1-NEXT: vpinsrb $6, %r9d, %xmm7, %xmm7
3884 ; AVX1-NEXT: vpinsrb $7, %esi, %xmm7, %xmm7
3885 ; AVX1-NEXT: vpinsrb $8, %r10d, %xmm7, %xmm7
3886 ; AVX1-NEXT: vpinsrb $9, %eax, %xmm7, %xmm7
3887 ; AVX1-NEXT: vpinsrb $10, %r13d, %xmm7, %xmm7
3888 ; AVX1-NEXT: vpinsrb $11, %edx, %xmm7, %xmm7
3889 ; AVX1-NEXT: vpinsrb $12, %r14d, %xmm7, %xmm7
3890 ; AVX1-NEXT: vpinsrb $13, %ebx, %xmm7, %xmm7
3891 ; AVX1-NEXT: vpinsrb $14, %edi, %xmm7, %xmm7
3892 ; AVX1-NEXT: vpinsrb $15, %ebp, %xmm7, %xmm7
3970 ; AVX2-NEXT: vpinsrb $1, 1(%rax), %xmm2, %xmm3
3976 ; AVX2-NEXT: vpinsrb $2, 2(%rax), %xmm2, %xmm3
3982 ; AVX2-NEXT: vpinsrb $3, 3(%rax), %xmm2, %xmm3
3988 ; AVX2-NEXT: vpinsrb $4, 4(%rax), %xmm2, %xmm3
3995 ; AVX2-NEXT: vpinsrb $5, 5(%rax), %xmm2, %xmm3
4002 ; AVX2-NEXT: vpinsrb $6, 6(%rax), %xmm2, %xmm3
4008 ; AVX2-NEXT: vpinsrb $7, 7(%rax), %xmm2, %xmm3
4014 ; AVX2-NEXT: vpinsrb $8, 8(%rax), %xmm2, %xmm3
4020 ; AVX2-NEXT: vpinsrb $9, 9(%rax), %xmm2, %xmm3
4026 ; AVX2-NEXT: vpinsrb $10, 10(%rax), %xmm2, %xmm3
4033 ; AVX2-NEXT: vpinsrb $11, 11(%rax), %xmm2, %xmm3
4040 ; AVX2-NEXT: vpinsrb $12, 12(%rax), %xmm2, %xmm3
4047 ; AVX2-NEXT: vpinsrb $13, 13(%rax), %xmm2, %xmm3
4053 ; AVX2-NEXT: vpinsrb $14, 14(%rax), %xmm2, %xmm3
4060 ; AVX2-NEXT: vpinsrb $15, 15(%rax), %xmm2, %xmm3
4068 ; AVX2-NEXT: vpinsrb $0, 16(%rax), %xmm3, %xmm3
4076 ; AVX2-NEXT: vpinsrb $1, 17(%rax), %xmm3, %xmm3
4083 ; AVX2-NEXT: vpinsrb $2, 18(%rax), %xmm3, %xmm3
4090 ; AVX2-NEXT: vpinsrb $3, 19(%rax), %xmm3, %xmm3
4097 ; AVX2-NEXT: vpinsrb $4, 20(%rax), %xmm3, %xmm3
4104 ; AVX2-NEXT: vpinsrb $5, 21(%rax), %xmm3, %xmm3
4111 ; AVX2-NEXT: vpinsrb $6, 22(%rax), %xmm3, %xmm3
4118 ; AVX2-NEXT: vpinsrb $7, 23(%rax), %xmm3, %xmm3
4125 ; AVX2-NEXT: vpinsrb $8, 24(%rax), %xmm3, %xmm3
4132 ; AVX2-NEXT: vpinsrb $9, 25(%rax), %xmm3, %xmm3
4139 ; AVX2-NEXT: vpinsrb $10, 26(%rax), %xmm3, %xmm3
4146 ; AVX2-NEXT: vpinsrb $11, 27(%rax), %xmm3, %xmm3
4153 ; AVX2-NEXT: vpinsrb $12, 28(%rax), %xmm3, %xmm3
4160 ; AVX2-NEXT: vpinsrb $13, 29(%rax), %xmm3, %xmm3
4167 ; AVX2-NEXT: vpinsrb $14, 30(%rax), %xmm3, %xmm3
4174 ; AVX2-NEXT: vpinsrb $15, 31(%rax), %xmm3, %xmm3
4180 ; AVX2-NEXT: vpinsrb $0, 32(%rax), %xmm0, %xmm3
4186 ; AVX2-NEXT: vpinsrb $1, 33(%rax), %xmm3, %xmm4
4192 ; AVX2-NEXT: vpinsrb $2, 34(%rax), %xmm3, %xmm4
4198 ; AVX2-NEXT: vpinsrb $3, 35(%rax), %xmm3, %xmm4
4204 ; AVX2-NEXT: vpinsrb $4, 36(%rax), %xmm3, %xmm4
4210 ; AVX2-NEXT: vpinsrb $5, 37(%rax), %xmm3, %xmm4
4216 ; AVX2-NEXT: vpinsrb $6, 38(%rax), %xmm3, %xmm4
4222 ; AVX2-NEXT: vpinsrb $7, 39(%rax), %xmm3, %xmm4
4228 ; AVX2-NEXT: vpinsrb $8, 40(%rax), %xmm3, %xmm4
4234 ; AVX2-NEXT: vpinsrb $9, 41(%rax), %xmm3, %xmm4
4240 ; AVX2-NEXT: vpinsrb $10, 42(%rax), %xmm3, %xmm4
4246 ; AVX2-NEXT: vpinsrb $11, 43(%rax), %xmm3, %xmm4
4252 ; AVX2-NEXT: vpinsrb $12, 44(%rax), %xmm3, %xmm4
4258 ; AVX2-NEXT: vpinsrb $13, 45(%rax), %xmm3, %xmm4
4264 ; AVX2-NEXT: vpinsrb $14, 46(%rax), %xmm3, %xmm4
4270 ; AVX2-NEXT: vpinsrb $15, 47(%rax), %xmm3, %xmm4
4277 ; AVX2-NEXT: vpinsrb $0, 48(%rax), %xmm4, %xmm4
4284 ; AVX2-NEXT: vpinsrb $1, 49(%rax), %xmm4, %xmm4
4291 ; AVX2-NEXT: vpinsrb $2, 50(%rax), %xmm4, %xmm4
4298 ; AVX2-NEXT: vpinsrb $3, 51(%rax), %xmm4, %xmm4
4305 ; AVX2-NEXT: vpinsrb $4, 52(%rax), %xmm4, %xmm4
4312 ; AVX2-NEXT: vpinsrb $5, 53(%rax), %xmm4, %xmm4
4319 ; AVX2-NEXT: vpinsrb $6, 54(%rax), %xmm4, %xmm4
4326 ; AVX2-NEXT: vpinsrb $7, 55(%rax), %xmm4, %xmm4
4333 ; AVX2-NEXT: vpinsrb $8, 56(%rax), %xmm4, %xmm4
4340 ; AVX2-NEXT: vpinsrb $9, 57(%rax), %xmm4, %xmm4
4347 ; AVX2-NEXT: vpinsrb $10, 58(%rax), %xmm4, %xmm4
4354 ; AVX2-NEXT: vpinsrb $11, 59(%rax), %xmm4, %xmm4
4361 ; AVX2-NEXT: vpinsrb $12, 60(%rax), %xmm4, %xmm4
4368 ; AVX2-NEXT: vpinsrb $13, 61(%rax), %xmm4, %xmm4
4379 ; AVX2-NEXT: vpinsrb $14, 62(%rax), %xmm4, %xmm4
4392 ; AVX2-NEXT: vpinsrb $15, 63(%rdi), %xmm4, %xmm4
4467 ; AVX2-NEXT: vpinsrb $1, %ebp, %xmm4, %xmm4
4470 ; AVX2-NEXT: vpinsrb $2, %ebp, %xmm4, %xmm4
4473 ; AVX2-NEXT: vpinsrb $3, %ebp, %xmm4, %xmm4
4476 ; AVX2-NEXT: vpinsrb $4, %ebp, %xmm4, %xmm4
4479 ; AVX2-NEXT: vpinsrb $5, %ebp, %xmm4, %xmm4
4480 ; AVX2-NEXT: vpinsrb $6, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4481 ; AVX2-NEXT: vpinsrb $7, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4482 ; AVX2-NEXT: vpinsrb $8, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4483 ; AVX2-NEXT: vpinsrb $9, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4484 ; AVX2-NEXT: vpinsrb $10, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4485 ; AVX2-NEXT: vpinsrb $11, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4486 ; AVX2-NEXT: vpinsrb $12, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4487 ; AVX2-NEXT: vpinsrb $13, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4488 ; AVX2-NEXT: vpinsrb $14, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4489 ; AVX2-NEXT: vpinsrb $15, -{{[0-9]+}}(%rsp), %xmm4, %xmm4 ## 4-byte Folded Reload
4492 ; AVX2-NEXT: vpinsrb $1, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4493 ; AVX2-NEXT: vpinsrb $2, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4494 ; AVX2-NEXT: vpinsrb $3, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4495 ; AVX2-NEXT: vpinsrb $4, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4496 ; AVX2-NEXT: vpinsrb $5, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4497 ; AVX2-NEXT: vpinsrb $6, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4498 ; AVX2-NEXT: vpinsrb $7, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4499 ; AVX2-NEXT: vpinsrb $8, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4500 ; AVX2-NEXT: vpinsrb $9, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4501 ; AVX2-NEXT: vpinsrb $10, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4502 ; AVX2-NEXT: vpinsrb $11, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4503 ; AVX2-NEXT: vpinsrb $12, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4504 ; AVX2-NEXT: vpinsrb $13, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4505 ; AVX2-NEXT: vpinsrb $14, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4506 ; AVX2-NEXT: vpinsrb $15, -{{[0-9]+}}(%rsp), %xmm5, %xmm5 ## 4-byte Folded Reload
4508 ; AVX2-NEXT: vpinsrb $1, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
4509 ; AVX2-NEXT: vpinsrb $2, %r15d, %xmm6, %xmm6
4510 ; AVX2-NEXT: vpinsrb $3, %r14d, %xmm6, %xmm6
4511 ; AVX2-NEXT: vpinsrb $4, %ebx, %xmm6, %xmm6
4512 ; AVX2-NEXT: vpinsrb $5, %r11d, %xmm6, %xmm6
4513 ; AVX2-NEXT: vpinsrb $6, %r9d, %xmm6, %xmm6
4514 ; AVX2-NEXT: vpinsrb $7, %esi, %xmm6, %xmm6
4515 ; AVX2-NEXT: vpinsrb $8, %eax, %xmm6, %xmm6
4518 ; AVX2-NEXT: vpinsrb $9, %ecx, %xmm6, %xmm6
4521 ; AVX2-NEXT: vpinsrb $10, %edx, %xmm6, %xmm6
4524 ; AVX2-NEXT: vpinsrb $11, %r8d, %xmm6, %xmm6
4527 ; AVX2-NEXT: vpinsrb $12, %r10d, %xmm6, %xmm6
4530 ; AVX2-NEXT: vpinsrb $13, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
4533 ; AVX2-NEXT: vpinsrb $14, %eax, %xmm6, %xmm6
4536 ; AVX2-NEXT: vpinsrb $15, %r15d, %xmm6, %xmm6
4542 ; AVX2-NEXT: vpinsrb $1, %r9d, %xmm7, %xmm7
4543 ; AVX2-NEXT: vpinsrb $2, %r11d, %xmm7, %xmm7
4544 ; AVX2-NEXT: vpinsrb $3, %r14d, %xmm7, %xmm7
4545 ; AVX2-NEXT: vpinsrb $4, %r13d, %xmm7, %xmm7
4546 ; AVX2-NEXT: vpinsrb $5, %ecx, %xmm7, %xmm7
4547 ; AVX2-NEXT: vpinsrb $6, %r8d, %xmm7, %xmm7
4548 ; AVX2-NEXT: vpinsrb $7, %ebx, %xmm7, %xmm7
4549 ; AVX2-NEXT: vpinsrb $8, %r10d, %xmm7, %xmm7
4550 ; AVX2-NEXT: vpinsrb $9, %ebp, %xmm7, %xmm7
4551 ; AVX2-NEXT: vpinsrb $10, %eax, %xmm7, %xmm7
4552 ; AVX2-NEXT: vpinsrb $11, %edi, %xmm7, %xmm7
4553 ; AVX2-NEXT: vpinsrb $12, %r15d, %xmm7, %xmm7
4554 ; AVX2-NEXT: vpinsrb $13, %esi, %xmm7, %xmm7
4555 ; AVX2-NEXT: vpinsrb $14, %r12d, %xmm7, %xmm7
4556 ; AVX2-NEXT: vpinsrb $15, %edx, %xmm7, %xmm7
4630 ; AVX512F-NEXT: vpinsrb $1, 1(%rdi), %xmm0, %xmm6
4640 ; AVX512F-NEXT: vpinsrb $2, 2(%rdi), %xmm0, %xmm6
4650 ; AVX512F-NEXT: vpinsrb $3, 3(%rdi), %xmm0, %xmm6
4660 ; AVX512F-NEXT: vpinsrb $4, 4(%rdi), %xmm0, %xmm6
4670 ; AVX512F-NEXT: vpinsrb $5, 5(%rdi), %xmm0, %xmm6
4680 ; AVX512F-NEXT: vpinsrb $6, 6(%rdi), %xmm0, %xmm6
4690 ; AVX512F-NEXT: vpinsrb $7, 7(%rdi), %xmm0, %xmm6
4700 ; AVX512F-NEXT: vpinsrb $8, 8(%rdi), %xmm0, %xmm6
4710 ; AVX512F-NEXT: vpinsrb $9, 9(%rdi), %xmm0, %xmm6
4720 ; AVX512F-NEXT: vpinsrb $10, 10(%rdi), %xmm0, %xmm6
4730 ; AVX512F-NEXT: vpinsrb $11, 11(%rdi), %xmm0, %xmm6
4740 ; AVX512F-NEXT: vpinsrb $12, 12(%rdi), %xmm0, %xmm6
4751 ; AVX512F-NEXT: vpinsrb $13, 13(%rdi), %xmm0, %xmm6
4762 ; AVX512F-NEXT: vpinsrb $14, 14(%rdi), %xmm0, %xmm6
4773 ; AVX512F-NEXT: vpinsrb $15, 15(%rdi), %xmm0, %xmm1
4784 ; AVX512F-NEXT: vpinsrb $0, 16(%rdi), %xmm1, %xmm1
4795 ; AVX512F-NEXT: vpinsrb $1, 17(%rdi), %xmm1, %xmm1
4806 ; AVX512F-NEXT: vpinsrb $2, 18(%rdi), %xmm1, %xmm1
4817 ; AVX512F-NEXT: vpinsrb $3, 19(%rdi), %xmm1, %xmm1
4828 ; AVX512F-NEXT: vpinsrb $4, 20(%rdi), %xmm1, %xmm1
4839 ; AVX512F-NEXT: vpinsrb $5, 21(%rdi), %xmm1, %xmm1
4850 ; AVX512F-NEXT: vpinsrb $6, 22(%rdi), %xmm1, %xmm1
4861 ; AVX512F-NEXT: vpinsrb $7, 23(%rdi), %xmm1, %xmm1
4872 ; AVX512F-NEXT: vpinsrb $8, 24(%rdi), %xmm1, %xmm1
4883 ; AVX512F-NEXT: vpinsrb $9, 25(%rdi), %xmm1, %xmm1
4894 ; AVX512F-NEXT: vpinsrb $10, 26(%rdi), %xmm1, %xmm1
4905 ; AVX512F-NEXT: vpinsrb $11, 27(%rdi), %xmm1, %xmm1
4916 ; AVX512F-NEXT: vpinsrb $12, 28(%rdi), %xmm1, %xmm1
4928 ; AVX512F-NEXT: vpinsrb $13, 29(%rdi), %xmm2, %xmm2
4940 ; AVX512F-NEXT: vpinsrb $14, 30(%rdi), %xmm2, %xmm2
4952 ; AVX512F-NEXT: vpinsrb $15, 31(%rdi), %xmm1, %xmm1
4962 ; AVX512F-NEXT: vpinsrb $0, 32(%rdi), %xmm0, %xmm1
4972 ; AVX512F-NEXT: vpinsrb $1, 33(%rdi), %xmm1, %xmm2
4982 ; AVX512F-NEXT: vpinsrb $2, 34(%rdi), %xmm1, %xmm2
4992 ; AVX512F-NEXT: vpinsrb $3, 35(%rdi), %xmm1, %xmm2
5002 ; AVX512F-NEXT: vpinsrb $4, 36(%rdi), %xmm1, %xmm2
5012 ; AVX512F-NEXT: vpinsrb $5, 37(%rdi), %xmm1, %xmm2
5022 ; AVX512F-NEXT: vpinsrb $6, 38(%rdi), %xmm1, %xmm2
5032 ; AVX512F-NEXT: vpinsrb $7, 39(%rdi), %xmm1, %xmm2
5042 ; AVX512F-NEXT: vpinsrb $8, 40(%rdi), %xmm1, %xmm2
5052 ; AVX512F-NEXT: vpinsrb $9, 41(%rdi), %xmm1, %xmm2
5062 ; AVX512F-NEXT: vpinsrb $10, 42(%rdi), %xmm1, %xmm2
5072 ; AVX512F-NEXT: vpinsrb $11, 43(%rdi), %xmm1, %xmm2
5082 ; AVX512F-NEXT: vpinsrb $12, 44(%rdi), %xmm1, %xmm2
5093 ; AVX512F-NEXT: vpinsrb $13, 45(%rdi), %xmm1, %xmm3
5104 ; AVX512F-NEXT: vpinsrb $14, 46(%rdi), %xmm1, %xmm3
5115 ; AVX512F-NEXT: vpinsrb $15, 47(%rdi), %xmm1, %xmm2
5126 ; AVX512F-NEXT: vpinsrb $0, 48(%rdi), %xmm2, %xmm2
5137 ; AVX512F-NEXT: vpinsrb $1, 49(%rdi), %xmm2, %xmm2
5148 ; AVX512F-NEXT: vpinsrb $2, 50(%rdi), %xmm2, %xmm2
5159 ; AVX512F-NEXT: vpinsrb $3, 51(%rdi), %xmm2, %xmm2
5170 ; AVX512F-NEXT: vpinsrb $4, 52(%rdi), %xmm2, %xmm2
5181 ; AVX512F-NEXT: vpinsrb $5, 53(%rdi), %xmm2, %xmm2
5192 ; AVX512F-NEXT: vpinsrb $6, 54(%rdi), %xmm2, %xmm2
5203 ; AVX512F-NEXT: vpinsrb $7, 55(%rdi), %xmm2, %xmm2
5214 ; AVX512F-NEXT: vpinsrb $8, 56(%rdi), %xmm2, %xmm2
5224 ; AVX512F-NEXT: vpinsrb $9, 57(%rdi), %xmm2, %xmm2
5234 ; AVX512F-NEXT: vpinsrb $10, 58(%rdi), %xmm2, %xmm2
5244 ; AVX512F-NEXT: vpinsrb $11, 59(%rdi), %xmm2, %xmm2
5254 ; AVX512F-NEXT: vpinsrb $12, 60(%rdi), %xmm2, %xmm2
5264 ; AVX512F-NEXT: vpinsrb $13, 61(%rdi), %xmm2, %xmm2
5274 ; AVX512F-NEXT: vpinsrb $14, 62(%rdi), %xmm2, %xmm2
5284 ; AVX512F-NEXT: vpinsrb $15, 63(%rdi), %xmm2, %xmm2
5437 ; AVX512F-NEXT: vpinsrb $1, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5438 ; AVX512F-NEXT: vpinsrb $2, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5439 ; AVX512F-NEXT: vpinsrb $3, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5440 ; AVX512F-NEXT: vpinsrb $4, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5441 ; AVX512F-NEXT: vpinsrb $5, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5442 ; AVX512F-NEXT: vpinsrb $6, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5443 ; AVX512F-NEXT: vpinsrb $7, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5444 ; AVX512F-NEXT: vpinsrb $8, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5445 ; AVX512F-NEXT: vpinsrb $9, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5446 ; AVX512F-NEXT: vpinsrb $10, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5447 ; AVX512F-NEXT: vpinsrb $11, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5448 ; AVX512F-NEXT: vpinsrb $12, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5449 ; AVX512F-NEXT: vpinsrb $13, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5450 ; AVX512F-NEXT: vpinsrb $14, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5451 ; AVX512F-NEXT: vpinsrb $15, -{{[0-9]+}}(%rsp), %xmm2, %xmm2 ## 4-byte Folded Reload
5454 ; AVX512F-NEXT: vpinsrb $1, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5455 ; AVX512F-NEXT: vpinsrb $2, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5456 ; AVX512F-NEXT: vpinsrb $3, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5457 ; AVX512F-NEXT: vpinsrb $4, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5458 ; AVX512F-NEXT: vpinsrb $5, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5459 ; AVX512F-NEXT: vpinsrb $6, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5460 ; AVX512F-NEXT: vpinsrb $7, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5461 ; AVX512F-NEXT: vpinsrb $8, {{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5462 ; AVX512F-NEXT: vpinsrb $9, (%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5463 ; AVX512F-NEXT: vpinsrb $10, -{{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5464 ; AVX512F-NEXT: vpinsrb $11, -{{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5465 ; AVX512F-NEXT: vpinsrb $12, -{{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5466 ; AVX512F-NEXT: vpinsrb $13, -{{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5467 ; AVX512F-NEXT: vpinsrb $14, -{{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5468 ; AVX512F-NEXT: vpinsrb $15, -{{[0-9]+}}(%rsp), %xmm3, %xmm3 ## 4-byte Folded Reload
5471 ; AVX512F-NEXT: vpinsrb $1, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5472 ; AVX512F-NEXT: vpinsrb $2, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5473 ; AVX512F-NEXT: vpinsrb $3, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5474 ; AVX512F-NEXT: vpinsrb $4, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5475 ; AVX512F-NEXT: vpinsrb $5, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5476 ; AVX512F-NEXT: vpinsrb $6, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5477 ; AVX512F-NEXT: vpinsrb $7, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5478 ; AVX512F-NEXT: vpinsrb $8, -{{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5479 ; AVX512F-NEXT: vpinsrb $9, {{[0-9]+}}(%rsp), %xmm6, %xmm6 ## 4-byte Folded Reload
5482 ; AVX512F-NEXT: vpinsrb $10, %r12d, %xmm6, %xmm6
5485 ; AVX512F-NEXT: vpinsrb $11, %r15d, %xmm6, %xmm6
5488 ; AVX512F-NEXT: vpinsrb $12, %r14d, %xmm6, %xmm6
5491 ; AVX512F-NEXT: vpinsrb $13, %ebx, %xmm6, %xmm6
5494 ; AVX512F-NEXT: vpinsrb $14, %r11d, %xmm6, %xmm6
5497 ; AVX512F-NEXT: vpinsrb $15, %r10d, %xmm6, %xmm6
5508 ; AVX512F-NEXT: vpinsrb $1, -{{[0-9]+}}(%rsp), %xmm7, %xmm2 ## 4-byte Folded Reload
5509 ; AVX512F-NEXT: vpinsrb $2, %r9d, %xmm2, %xmm2
5510 ; AVX512F-NEXT: vpinsrb $3, %edi, %xmm2, %xmm2
5511 ; AVX512F-NEXT: vpinsrb $4, %esi, %xmm2, %xmm2
5512 ; AVX512F-NEXT: vpinsrb $5, %edx, %xmm2, %xmm2
5513 ; AVX512F-NEXT: vpinsrb $6, %ecx, %xmm2, %xmm2
5514 ; AVX512F-NEXT: vpinsrb $7, %eax, %xmm2, %xmm2
5515 ; AVX512F-NEXT: vpinsrb $8, %r13d, %xmm2, %xmm2
5516 ; AVX512F-NEXT: vpinsrb $9, %r12d, %xmm2, %xmm2
5517 ; AVX512F-NEXT: vpinsrb $10, %r15d, %xmm2, %xmm2
5518 ; AVX512F-NEXT: vpinsrb $11, %r14d, %xmm2, %xmm2
5519 ; AVX512F-NEXT: vpinsrb $12, %ebx, %xmm2, %xmm2
5520 ; AVX512F-NEXT: vpinsrb $13, %r11d, %xmm2, %xmm2
5521 ; AVX512F-NEXT: vpinsrb $14, %r10d, %xmm2, %xmm2
5522 ; AVX512F-NEXT: vpinsrb $15, %r8d, %xmm2, %xmm2