• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1; RUN: opt < %s -S -instcombine > %t
2; RUN: grep "= getelementptr" %t | count 20
3; RUN: grep "= phi" %t | count 13
4
5; Don't push the geps through these phis, because they would require
6; two phis each, which burdens the loop with high register pressure.
7
8define void @foo(float* %Ar, float* %Ai, i64 %As, float* %Cr, float* %Ci, i64 %Cs, i64 %n) nounwind {
9entry:
10  %0 = getelementptr inbounds float* %Ar, i64 0   ; <float*> [#uses=1]
11  %1 = getelementptr inbounds float* %Ai, i64 0   ; <float*> [#uses=1]
12  %2 = mul i64 %n, %As                            ; <i64> [#uses=1]
13  %3 = getelementptr inbounds float* %Ar, i64 %2  ; <float*> [#uses=1]
14  %4 = mul i64 %n, %As                            ; <i64> [#uses=1]
15  %5 = getelementptr inbounds float* %Ai, i64 %4  ; <float*> [#uses=1]
16  %6 = mul i64 %n, 2                              ; <i64> [#uses=1]
17  %7 = mul i64 %6, %As                            ; <i64> [#uses=1]
18  %8 = getelementptr inbounds float* %Ar, i64 %7  ; <float*> [#uses=1]
19  %9 = mul i64 %n, 2                              ; <i64> [#uses=1]
20  %10 = mul i64 %9, %As                           ; <i64> [#uses=1]
21  %11 = getelementptr inbounds float* %Ai, i64 %10 ; <float*> [#uses=1]
22  %12 = getelementptr inbounds float* %Cr, i64 0  ; <float*> [#uses=1]
23  %13 = getelementptr inbounds float* %Ci, i64 0  ; <float*> [#uses=1]
24  %14 = mul i64 %n, %Cs                           ; <i64> [#uses=1]
25  %15 = getelementptr inbounds float* %Cr, i64 %14 ; <float*> [#uses=1]
26  %16 = mul i64 %n, %Cs                           ; <i64> [#uses=1]
27  %17 = getelementptr inbounds float* %Ci, i64 %16 ; <float*> [#uses=1]
28  %18 = mul i64 %n, 2                             ; <i64> [#uses=1]
29  %19 = mul i64 %18, %Cs                          ; <i64> [#uses=1]
30  %20 = getelementptr inbounds float* %Cr, i64 %19 ; <float*> [#uses=1]
31  %21 = mul i64 %n, 2                             ; <i64> [#uses=1]
32  %22 = mul i64 %21, %Cs                          ; <i64> [#uses=1]
33  %23 = getelementptr inbounds float* %Ci, i64 %22 ; <float*> [#uses=1]
34  br label %bb13
35
36bb:                                               ; preds = %bb13
37  %24 = load float* %A0r.0, align 4               ; <float> [#uses=1]
38  %25 = load float* %A0i.0, align 4               ; <float> [#uses=1]
39  %26 = load float* %A1r.0, align 4               ; <float> [#uses=2]
40  %27 = load float* %A1i.0, align 4               ; <float> [#uses=2]
41  %28 = load float* %A2r.0, align 4               ; <float> [#uses=2]
42  %29 = load float* %A2i.0, align 4               ; <float> [#uses=2]
43  %30 = fadd float %26, %28                       ; <float> [#uses=2]
44  %31 = fadd float %27, %29                       ; <float> [#uses=2]
45  %32 = fsub float %26, %28                       ; <float> [#uses=1]
46  %33 = fsub float %27, %29                       ; <float> [#uses=1]
47  %34 = fadd float %24, %30                       ; <float> [#uses=2]
48  %35 = fadd float %25, %31                       ; <float> [#uses=2]
49  %36 = fmul float %30, -1.500000e+00             ; <float> [#uses=1]
50  %37 = fmul float %31, -1.500000e+00             ; <float> [#uses=1]
51  %38 = fadd float %34, %36                       ; <float> [#uses=2]
52  %39 = fadd float %35, %37                       ; <float> [#uses=2]
53  %40 = fmul float %32, 0x3FEBB67AE0000000        ; <float> [#uses=2]
54  %41 = fmul float %33, 0x3FEBB67AE0000000        ; <float> [#uses=2]
55  %42 = fadd float %38, %41                       ; <float> [#uses=1]
56  %43 = fsub float %39, %40                       ; <float> [#uses=1]
57  %44 = fsub float %38, %41                       ; <float> [#uses=1]
58  %45 = fadd float %39, %40                       ; <float> [#uses=1]
59  store float %34, float* %C0r.0, align 4
60  store float %35, float* %C0i.0, align 4
61  store float %42, float* %C1r.0, align 4
62  store float %43, float* %C1i.0, align 4
63  store float %44, float* %C2r.0, align 4
64  store float %45, float* %C2i.0, align 4
65  %46 = getelementptr inbounds float* %A0r.0, i64 %As ; <float*> [#uses=1]
66  %47 = getelementptr inbounds float* %A0i.0, i64 %As ; <float*> [#uses=1]
67  %48 = getelementptr inbounds float* %A1r.0, i64 %As ; <float*> [#uses=1]
68  %49 = getelementptr inbounds float* %A1i.0, i64 %As ; <float*> [#uses=1]
69  %50 = getelementptr inbounds float* %A2r.0, i64 %As ; <float*> [#uses=1]
70  %51 = getelementptr inbounds float* %A2i.0, i64 %As ; <float*> [#uses=1]
71  %52 = getelementptr inbounds float* %C0r.0, i64 %Cs ; <float*> [#uses=1]
72  %53 = getelementptr inbounds float* %C0i.0, i64 %Cs ; <float*> [#uses=1]
73  %54 = getelementptr inbounds float* %C1r.0, i64 %Cs ; <float*> [#uses=1]
74  %55 = getelementptr inbounds float* %C1i.0, i64 %Cs ; <float*> [#uses=1]
75  %56 = getelementptr inbounds float* %C2r.0, i64 %Cs ; <float*> [#uses=1]
76  %57 = getelementptr inbounds float* %C2i.0, i64 %Cs ; <float*> [#uses=1]
77  %58 = add nsw i64 %i.0, 1                       ; <i64> [#uses=1]
78  br label %bb13
79
80bb13:                                             ; preds = %bb, %entry
81  %i.0 = phi i64 [ 0, %entry ], [ %58, %bb ]      ; <i64> [#uses=2]
82  %C2i.0 = phi float* [ %23, %entry ], [ %57, %bb ] ; <float*> [#uses=2]
83  %C2r.0 = phi float* [ %20, %entry ], [ %56, %bb ] ; <float*> [#uses=2]
84  %C1i.0 = phi float* [ %17, %entry ], [ %55, %bb ] ; <float*> [#uses=2]
85  %C1r.0 = phi float* [ %15, %entry ], [ %54, %bb ] ; <float*> [#uses=2]
86  %C0i.0 = phi float* [ %13, %entry ], [ %53, %bb ] ; <float*> [#uses=2]
87  %C0r.0 = phi float* [ %12, %entry ], [ %52, %bb ] ; <float*> [#uses=2]
88  %A2i.0 = phi float* [ %11, %entry ], [ %51, %bb ] ; <float*> [#uses=2]
89  %A2r.0 = phi float* [ %8, %entry ], [ %50, %bb ] ; <float*> [#uses=2]
90  %A1i.0 = phi float* [ %5, %entry ], [ %49, %bb ] ; <float*> [#uses=2]
91  %A1r.0 = phi float* [ %3, %entry ], [ %48, %bb ] ; <float*> [#uses=2]
92  %A0i.0 = phi float* [ %1, %entry ], [ %47, %bb ] ; <float*> [#uses=2]
93  %A0r.0 = phi float* [ %0, %entry ], [ %46, %bb ] ; <float*> [#uses=2]
94  %59 = icmp slt i64 %i.0, %n                     ; <i1> [#uses=1]
95  br i1 %59, label %bb, label %bb14
96
97bb14:                                             ; preds = %bb13
98  br label %return
99
100return:                                           ; preds = %bb14
101  ret void
102}
103