• Home
  • Raw
  • Download

Lines Matching refs:SSE42

3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42
5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42
22 ; X86-SSE42-LABEL: convert_v2i16_to_v2f32:
23 ; X86-SSE42: # BB#0: # %entry
24 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
25 ; X86-SSE42-NEXT: psllq $48, %xmm0
26 ; X86-SSE42-NEXT: psrad $16, %xmm0
27 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
28 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
29 ; X86-SSE42-NEXT: extractps $1, %xmm0, 4(%eax)
30 ; X86-SSE42-NEXT: movss %xmm0, (%eax)
31 ; X86-SSE42-NEXT: retl
86 ; X86-SSE42-LABEL: convert_v3i8_to_v3f32:
87 ; X86-SSE42: # BB#0: # %entry
88 ; X86-SSE42-NEXT: pushl %eax
89 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
90 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %ecx
91 ; X86-SSE42-NEXT: movzbl 2(%ecx), %edx
92 ; X86-SSE42-NEXT: movzwl (%ecx), %ecx
93 ; X86-SSE42-NEXT: movd %ecx, %xmm0
94 ; X86-SSE42-NEXT: pmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2]…
95 ; X86-SSE42-NEXT: pinsrd $2, %edx, %xmm0
96 ; X86-SSE42-NEXT: pslld $24, %xmm0
97 ; X86-SSE42-NEXT: psrad $24, %xmm0
98 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
99 ; X86-SSE42-NEXT: extractps $2, %xmm0, 8(%eax)
100 ; X86-SSE42-NEXT: extractps $1, %xmm0, 4(%eax)
101 ; X86-SSE42-NEXT: movss %xmm0, (%eax)
102 ; X86-SSE42-NEXT: popl %eax
103 ; X86-SSE42-NEXT: retl
130 ; X64-SSE42-LABEL: convert_v3i8_to_v3f32:
131 ; X64-SSE42: # BB#0: # %entry
132 ; X64-SSE42-NEXT: movzbl 2(%rsi), %eax
133 ; X64-SSE42-NEXT: movzwl (%rsi), %ecx
134 ; X64-SSE42-NEXT: movd %rcx, %xmm0
135 ; X64-SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
136 ; X64-SSE42-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
137 ; X64-SSE42-NEXT: pmovzxbd {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2]…
138 ; X64-SSE42-NEXT: pinsrd $2, %eax, %xmm0
139 ; X64-SSE42-NEXT: pslld $24, %xmm0
140 ; X64-SSE42-NEXT: psrad $24, %xmm0
141 ; X64-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
142 ; X64-SSE42-NEXT: extractps $2, %xmm0, 8(%rdi)
143 ; X64-SSE42-NEXT: movlps %xmm0, (%rdi)
144 ; X64-SSE42-NEXT: retq