• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1; RUN: llc < %s -march=r600 -mcpu=redwood | FileCheck %s --check-prefix=R600-CHECK --check-prefix=FUNC
2; RUN: llc < %s -march=r600 -mcpu=SI -verify-machineinstrs | FileCheck %s --check-prefix=SI-CHECK --check-prefix=FUNC
3
4; FUNC-LABEL: @fadd_f32
5; R600-CHECK: ADD {{\** *}}T{{[0-9]+\.[XYZW]}}, KC0[2].Z, KC0[2].W
6; SI-CHECK: V_ADD_F32
7define void @fadd_f32(float addrspace(1)* %out, float %a, float %b) {
8entry:
9   %0 = fadd float %a, %b
10   store float %0, float addrspace(1)* %out
11   ret void
12}
13
14; FUNC-LABEL: @fadd_v2f32
15; R600-CHECK-DAG: ADD {{\** *}}T{{[0-9]\.[XYZW]}}, KC0[3].X, KC0[3].Z
16; R600-CHECK-DAG: ADD {{\** *}}T{{[0-9]\.[XYZW]}}, KC0[2].W, KC0[3].Y
17; SI-CHECK: V_ADD_F32
18; SI-CHECK: V_ADD_F32
19define void @fadd_v2f32(<2 x float> addrspace(1)* %out, <2 x float> %a, <2 x float> %b) {
20entry:
21  %0 = fadd <2 x float> %a, %b
22  store <2 x float> %0, <2 x float> addrspace(1)* %out
23  ret void
24}
25
26; FUNC-LABEL: @fadd_v4f32
27; R600-CHECK: ADD {{\** *}}T{{[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
28; R600-CHECK: ADD {{\** *}}T{{[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
29; R600-CHECK: ADD {{\** *}}T{{[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
30; R600-CHECK: ADD {{\** *}}T{{[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
31; SI-CHECK: V_ADD_F32
32; SI-CHECK: V_ADD_F32
33; SI-CHECK: V_ADD_F32
34; SI-CHECK: V_ADD_F32
35define void @fadd_v4f32(<4 x float> addrspace(1)* %out, <4 x float> addrspace(1)* %in) {
36  %b_ptr = getelementptr <4 x float> addrspace(1)* %in, i32 1
37  %a = load <4 x float> addrspace(1) * %in
38  %b = load <4 x float> addrspace(1) * %b_ptr
39  %result = fadd <4 x float> %a, %b
40  store <4 x float> %result, <4 x float> addrspace(1)* %out
41  ret void
42}
43
44; FUNC-LABEL: @fadd_v8f32
45; R600-CHECK: ADD
46; R600-CHECK: ADD
47; R600-CHECK: ADD
48; R600-CHECK: ADD
49; R600-CHECK: ADD
50; R600-CHECK: ADD
51; R600-CHECK: ADD
52; R600-CHECK: ADD
53; SI-CHECK: V_ADD_F32
54; SI-CHECK: V_ADD_F32
55; SI-CHECK: V_ADD_F32
56; SI-CHECK: V_ADD_F32
57; SI-CHECK: V_ADD_F32
58; SI-CHECK: V_ADD_F32
59; SI-CHECK: V_ADD_F32
60; SI-CHECK: V_ADD_F32
61define void @fadd_v8f32(<8 x float> addrspace(1)* %out, <8 x float> %a, <8 x float> %b) {
62entry:
63  %0 = fadd <8 x float> %a, %b
64  store <8 x float> %0, <8 x float> addrspace(1)* %out
65  ret void
66}
67