• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1# This file is generated from a similarly-named Perl script in the BoringSSL
2# source tree. Do not edit by hand.
3
4#if defined(__has_feature)
5#if __has_feature(memory_sanitizer) && !defined(OPENSSL_NO_ASM)
6#define OPENSSL_NO_ASM
7#endif
8#endif
9
10#if defined(__x86_64__) && !defined(OPENSSL_NO_ASM)
11#if defined(BORINGSSL_PREFIX)
12#include <boringssl_prefix_symbols_asm.h>
13#endif
14.text
15
16.type	_aesni_ctr32_ghash_6x,@function
17.align	32
18_aesni_ctr32_ghash_6x:
19.cfi_startproc
20	vmovdqu	32(%r11),%xmm2
21	subq	$6,%rdx
22	vpxor	%xmm4,%xmm4,%xmm4
23	vmovdqu	0-128(%rcx),%xmm15
24	vpaddb	%xmm2,%xmm1,%xmm10
25	vpaddb	%xmm2,%xmm10,%xmm11
26	vpaddb	%xmm2,%xmm11,%xmm12
27	vpaddb	%xmm2,%xmm12,%xmm13
28	vpaddb	%xmm2,%xmm13,%xmm14
29	vpxor	%xmm15,%xmm1,%xmm9
30	vmovdqu	%xmm4,16+8(%rsp)
31	jmp	.Loop6x
32
33.align	32
34.Loop6x:
35	addl	$100663296,%ebx
36	jc	.Lhandle_ctr32
37	vmovdqu	0-32(%r9),%xmm3
38	vpaddb	%xmm2,%xmm14,%xmm1
39	vpxor	%xmm15,%xmm10,%xmm10
40	vpxor	%xmm15,%xmm11,%xmm11
41
42.Lresume_ctr32:
43	vmovdqu	%xmm1,(%r8)
44	vpclmulqdq	$0x10,%xmm3,%xmm7,%xmm5
45	vpxor	%xmm15,%xmm12,%xmm12
46	vmovups	16-128(%rcx),%xmm2
47	vpclmulqdq	$0x01,%xmm3,%xmm7,%xmm6
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65	xorq	%r12,%r12
66	cmpq	%r14,%r15
67
68	vaesenc	%xmm2,%xmm9,%xmm9
69	vmovdqu	48+8(%rsp),%xmm0
70	vpxor	%xmm15,%xmm13,%xmm13
71	vpclmulqdq	$0x00,%xmm3,%xmm7,%xmm1
72	vaesenc	%xmm2,%xmm10,%xmm10
73	vpxor	%xmm15,%xmm14,%xmm14
74	setnc	%r12b
75	vpclmulqdq	$0x11,%xmm3,%xmm7,%xmm7
76	vaesenc	%xmm2,%xmm11,%xmm11
77	vmovdqu	16-32(%r9),%xmm3
78	negq	%r12
79	vaesenc	%xmm2,%xmm12,%xmm12
80	vpxor	%xmm5,%xmm6,%xmm6
81	vpclmulqdq	$0x00,%xmm3,%xmm0,%xmm5
82	vpxor	%xmm4,%xmm8,%xmm8
83	vaesenc	%xmm2,%xmm13,%xmm13
84	vpxor	%xmm5,%xmm1,%xmm4
85	andq	$0x60,%r12
86	vmovups	32-128(%rcx),%xmm15
87	vpclmulqdq	$0x10,%xmm3,%xmm0,%xmm1
88	vaesenc	%xmm2,%xmm14,%xmm14
89
90	vpclmulqdq	$0x01,%xmm3,%xmm0,%xmm2
91	leaq	(%r14,%r12,1),%r14
92	vaesenc	%xmm15,%xmm9,%xmm9
93	vpxor	16+8(%rsp),%xmm8,%xmm8
94	vpclmulqdq	$0x11,%xmm3,%xmm0,%xmm3
95	vmovdqu	64+8(%rsp),%xmm0
96	vaesenc	%xmm15,%xmm10,%xmm10
97	movbeq	88(%r14),%r13
98	vaesenc	%xmm15,%xmm11,%xmm11
99	movbeq	80(%r14),%r12
100	vaesenc	%xmm15,%xmm12,%xmm12
101	movq	%r13,32+8(%rsp)
102	vaesenc	%xmm15,%xmm13,%xmm13
103	movq	%r12,40+8(%rsp)
104	vmovdqu	48-32(%r9),%xmm5
105	vaesenc	%xmm15,%xmm14,%xmm14
106
107	vmovups	48-128(%rcx),%xmm15
108	vpxor	%xmm1,%xmm6,%xmm6
109	vpclmulqdq	$0x00,%xmm5,%xmm0,%xmm1
110	vaesenc	%xmm15,%xmm9,%xmm9
111	vpxor	%xmm2,%xmm6,%xmm6
112	vpclmulqdq	$0x10,%xmm5,%xmm0,%xmm2
113	vaesenc	%xmm15,%xmm10,%xmm10
114	vpxor	%xmm3,%xmm7,%xmm7
115	vpclmulqdq	$0x01,%xmm5,%xmm0,%xmm3
116	vaesenc	%xmm15,%xmm11,%xmm11
117	vpclmulqdq	$0x11,%xmm5,%xmm0,%xmm5
118	vmovdqu	80+8(%rsp),%xmm0
119	vaesenc	%xmm15,%xmm12,%xmm12
120	vaesenc	%xmm15,%xmm13,%xmm13
121	vpxor	%xmm1,%xmm4,%xmm4
122	vmovdqu	64-32(%r9),%xmm1
123	vaesenc	%xmm15,%xmm14,%xmm14
124
125	vmovups	64-128(%rcx),%xmm15
126	vpxor	%xmm2,%xmm6,%xmm6
127	vpclmulqdq	$0x00,%xmm1,%xmm0,%xmm2
128	vaesenc	%xmm15,%xmm9,%xmm9
129	vpxor	%xmm3,%xmm6,%xmm6
130	vpclmulqdq	$0x10,%xmm1,%xmm0,%xmm3
131	vaesenc	%xmm15,%xmm10,%xmm10
132	movbeq	72(%r14),%r13
133	vpxor	%xmm5,%xmm7,%xmm7
134	vpclmulqdq	$0x01,%xmm1,%xmm0,%xmm5
135	vaesenc	%xmm15,%xmm11,%xmm11
136	movbeq	64(%r14),%r12
137	vpclmulqdq	$0x11,%xmm1,%xmm0,%xmm1
138	vmovdqu	96+8(%rsp),%xmm0
139	vaesenc	%xmm15,%xmm12,%xmm12
140	movq	%r13,48+8(%rsp)
141	vaesenc	%xmm15,%xmm13,%xmm13
142	movq	%r12,56+8(%rsp)
143	vpxor	%xmm2,%xmm4,%xmm4
144	vmovdqu	96-32(%r9),%xmm2
145	vaesenc	%xmm15,%xmm14,%xmm14
146
147	vmovups	80-128(%rcx),%xmm15
148	vpxor	%xmm3,%xmm6,%xmm6
149	vpclmulqdq	$0x00,%xmm2,%xmm0,%xmm3
150	vaesenc	%xmm15,%xmm9,%xmm9
151	vpxor	%xmm5,%xmm6,%xmm6
152	vpclmulqdq	$0x10,%xmm2,%xmm0,%xmm5
153	vaesenc	%xmm15,%xmm10,%xmm10
154	movbeq	56(%r14),%r13
155	vpxor	%xmm1,%xmm7,%xmm7
156	vpclmulqdq	$0x01,%xmm2,%xmm0,%xmm1
157	vpxor	112+8(%rsp),%xmm8,%xmm8
158	vaesenc	%xmm15,%xmm11,%xmm11
159	movbeq	48(%r14),%r12
160	vpclmulqdq	$0x11,%xmm2,%xmm0,%xmm2
161	vaesenc	%xmm15,%xmm12,%xmm12
162	movq	%r13,64+8(%rsp)
163	vaesenc	%xmm15,%xmm13,%xmm13
164	movq	%r12,72+8(%rsp)
165	vpxor	%xmm3,%xmm4,%xmm4
166	vmovdqu	112-32(%r9),%xmm3
167	vaesenc	%xmm15,%xmm14,%xmm14
168
169	vmovups	96-128(%rcx),%xmm15
170	vpxor	%xmm5,%xmm6,%xmm6
171	vpclmulqdq	$0x10,%xmm3,%xmm8,%xmm5
172	vaesenc	%xmm15,%xmm9,%xmm9
173	vpxor	%xmm1,%xmm6,%xmm6
174	vpclmulqdq	$0x01,%xmm3,%xmm8,%xmm1
175	vaesenc	%xmm15,%xmm10,%xmm10
176	movbeq	40(%r14),%r13
177	vpxor	%xmm2,%xmm7,%xmm7
178	vpclmulqdq	$0x00,%xmm3,%xmm8,%xmm2
179	vaesenc	%xmm15,%xmm11,%xmm11
180	movbeq	32(%r14),%r12
181	vpclmulqdq	$0x11,%xmm3,%xmm8,%xmm8
182	vaesenc	%xmm15,%xmm12,%xmm12
183	movq	%r13,80+8(%rsp)
184	vaesenc	%xmm15,%xmm13,%xmm13
185	movq	%r12,88+8(%rsp)
186	vpxor	%xmm5,%xmm6,%xmm6
187	vaesenc	%xmm15,%xmm14,%xmm14
188	vpxor	%xmm1,%xmm6,%xmm6
189
190	vmovups	112-128(%rcx),%xmm15
191	vpslldq	$8,%xmm6,%xmm5
192	vpxor	%xmm2,%xmm4,%xmm4
193	vmovdqu	16(%r11),%xmm3
194
195	vaesenc	%xmm15,%xmm9,%xmm9
196	vpxor	%xmm8,%xmm7,%xmm7
197	vaesenc	%xmm15,%xmm10,%xmm10
198	vpxor	%xmm5,%xmm4,%xmm4
199	movbeq	24(%r14),%r13
200	vaesenc	%xmm15,%xmm11,%xmm11
201	movbeq	16(%r14),%r12
202	vpalignr	$8,%xmm4,%xmm4,%xmm0
203	vpclmulqdq	$0x10,%xmm3,%xmm4,%xmm4
204	movq	%r13,96+8(%rsp)
205	vaesenc	%xmm15,%xmm12,%xmm12
206	movq	%r12,104+8(%rsp)
207	vaesenc	%xmm15,%xmm13,%xmm13
208	vmovups	128-128(%rcx),%xmm1
209	vaesenc	%xmm15,%xmm14,%xmm14
210
211	vaesenc	%xmm1,%xmm9,%xmm9
212	vmovups	144-128(%rcx),%xmm15
213	vaesenc	%xmm1,%xmm10,%xmm10
214	vpsrldq	$8,%xmm6,%xmm6
215	vaesenc	%xmm1,%xmm11,%xmm11
216	vpxor	%xmm6,%xmm7,%xmm7
217	vaesenc	%xmm1,%xmm12,%xmm12
218	vpxor	%xmm0,%xmm4,%xmm4
219	movbeq	8(%r14),%r13
220	vaesenc	%xmm1,%xmm13,%xmm13
221	movbeq	0(%r14),%r12
222	vaesenc	%xmm1,%xmm14,%xmm14
223	vmovups	160-128(%rcx),%xmm1
224	cmpl	$11,%ebp
225	jb	.Lenc_tail
226
227	vaesenc	%xmm15,%xmm9,%xmm9
228	vaesenc	%xmm15,%xmm10,%xmm10
229	vaesenc	%xmm15,%xmm11,%xmm11
230	vaesenc	%xmm15,%xmm12,%xmm12
231	vaesenc	%xmm15,%xmm13,%xmm13
232	vaesenc	%xmm15,%xmm14,%xmm14
233
234	vaesenc	%xmm1,%xmm9,%xmm9
235	vaesenc	%xmm1,%xmm10,%xmm10
236	vaesenc	%xmm1,%xmm11,%xmm11
237	vaesenc	%xmm1,%xmm12,%xmm12
238	vaesenc	%xmm1,%xmm13,%xmm13
239	vmovups	176-128(%rcx),%xmm15
240	vaesenc	%xmm1,%xmm14,%xmm14
241	vmovups	192-128(%rcx),%xmm1
242	je	.Lenc_tail
243
244	vaesenc	%xmm15,%xmm9,%xmm9
245	vaesenc	%xmm15,%xmm10,%xmm10
246	vaesenc	%xmm15,%xmm11,%xmm11
247	vaesenc	%xmm15,%xmm12,%xmm12
248	vaesenc	%xmm15,%xmm13,%xmm13
249	vaesenc	%xmm15,%xmm14,%xmm14
250
251	vaesenc	%xmm1,%xmm9,%xmm9
252	vaesenc	%xmm1,%xmm10,%xmm10
253	vaesenc	%xmm1,%xmm11,%xmm11
254	vaesenc	%xmm1,%xmm12,%xmm12
255	vaesenc	%xmm1,%xmm13,%xmm13
256	vmovups	208-128(%rcx),%xmm15
257	vaesenc	%xmm1,%xmm14,%xmm14
258	vmovups	224-128(%rcx),%xmm1
259	jmp	.Lenc_tail
260
261.align	32
262.Lhandle_ctr32:
263	vmovdqu	(%r11),%xmm0
264	vpshufb	%xmm0,%xmm1,%xmm6
265	vmovdqu	48(%r11),%xmm5
266	vpaddd	64(%r11),%xmm6,%xmm10
267	vpaddd	%xmm5,%xmm6,%xmm11
268	vmovdqu	0-32(%r9),%xmm3
269	vpaddd	%xmm5,%xmm10,%xmm12
270	vpshufb	%xmm0,%xmm10,%xmm10
271	vpaddd	%xmm5,%xmm11,%xmm13
272	vpshufb	%xmm0,%xmm11,%xmm11
273	vpxor	%xmm15,%xmm10,%xmm10
274	vpaddd	%xmm5,%xmm12,%xmm14
275	vpshufb	%xmm0,%xmm12,%xmm12
276	vpxor	%xmm15,%xmm11,%xmm11
277	vpaddd	%xmm5,%xmm13,%xmm1
278	vpshufb	%xmm0,%xmm13,%xmm13
279	vpshufb	%xmm0,%xmm14,%xmm14
280	vpshufb	%xmm0,%xmm1,%xmm1
281	jmp	.Lresume_ctr32
282
283.align	32
284.Lenc_tail:
285	vaesenc	%xmm15,%xmm9,%xmm9
286	vmovdqu	%xmm7,16+8(%rsp)
287	vpalignr	$8,%xmm4,%xmm4,%xmm8
288	vaesenc	%xmm15,%xmm10,%xmm10
289	vpclmulqdq	$0x10,%xmm3,%xmm4,%xmm4
290	vpxor	0(%rdi),%xmm1,%xmm2
291	vaesenc	%xmm15,%xmm11,%xmm11
292	vpxor	16(%rdi),%xmm1,%xmm0
293	vaesenc	%xmm15,%xmm12,%xmm12
294	vpxor	32(%rdi),%xmm1,%xmm5
295	vaesenc	%xmm15,%xmm13,%xmm13
296	vpxor	48(%rdi),%xmm1,%xmm6
297	vaesenc	%xmm15,%xmm14,%xmm14
298	vpxor	64(%rdi),%xmm1,%xmm7
299	vpxor	80(%rdi),%xmm1,%xmm3
300	vmovdqu	(%r8),%xmm1
301
302	vaesenclast	%xmm2,%xmm9,%xmm9
303	vmovdqu	32(%r11),%xmm2
304	vaesenclast	%xmm0,%xmm10,%xmm10
305	vpaddb	%xmm2,%xmm1,%xmm0
306	movq	%r13,112+8(%rsp)
307	leaq	96(%rdi),%rdi
308	vaesenclast	%xmm5,%xmm11,%xmm11
309	vpaddb	%xmm2,%xmm0,%xmm5
310	movq	%r12,120+8(%rsp)
311	leaq	96(%rsi),%rsi
312	vmovdqu	0-128(%rcx),%xmm15
313	vaesenclast	%xmm6,%xmm12,%xmm12
314	vpaddb	%xmm2,%xmm5,%xmm6
315	vaesenclast	%xmm7,%xmm13,%xmm13
316	vpaddb	%xmm2,%xmm6,%xmm7
317	vaesenclast	%xmm3,%xmm14,%xmm14
318	vpaddb	%xmm2,%xmm7,%xmm3
319
320	addq	$0x60,%r10
321	subq	$0x6,%rdx
322	jc	.L6x_done
323
324	vmovups	%xmm9,-96(%rsi)
325	vpxor	%xmm15,%xmm1,%xmm9
326	vmovups	%xmm10,-80(%rsi)
327	vmovdqa	%xmm0,%xmm10
328	vmovups	%xmm11,-64(%rsi)
329	vmovdqa	%xmm5,%xmm11
330	vmovups	%xmm12,-48(%rsi)
331	vmovdqa	%xmm6,%xmm12
332	vmovups	%xmm13,-32(%rsi)
333	vmovdqa	%xmm7,%xmm13
334	vmovups	%xmm14,-16(%rsi)
335	vmovdqa	%xmm3,%xmm14
336	vmovdqu	32+8(%rsp),%xmm7
337	jmp	.Loop6x
338
339.L6x_done:
340	vpxor	16+8(%rsp),%xmm8,%xmm8
341	vpxor	%xmm4,%xmm8,%xmm8
342
343	.byte	0xf3,0xc3
344.cfi_endproc
345.size	_aesni_ctr32_ghash_6x,.-_aesni_ctr32_ghash_6x
346.globl	aesni_gcm_decrypt
347.hidden aesni_gcm_decrypt
348.type	aesni_gcm_decrypt,@function
349.align	32
350aesni_gcm_decrypt:
351.cfi_startproc
352	xorq	%r10,%r10
353
354
355
356	cmpq	$0x60,%rdx
357	jb	.Lgcm_dec_abort
358
359	leaq	(%rsp),%rax
360.cfi_def_cfa_register	%rax
361	pushq	%rbx
362.cfi_offset	%rbx,-16
363	pushq	%rbp
364.cfi_offset	%rbp,-24
365	pushq	%r12
366.cfi_offset	%r12,-32
367	pushq	%r13
368.cfi_offset	%r13,-40
369	pushq	%r14
370.cfi_offset	%r14,-48
371	pushq	%r15
372.cfi_offset	%r15,-56
373	vzeroupper
374
375	vmovdqu	(%r8),%xmm1
376	addq	$-128,%rsp
377	movl	12(%r8),%ebx
378	leaq	.Lbswap_mask(%rip),%r11
379	leaq	-128(%rcx),%r14
380	movq	$0xf80,%r15
381	vmovdqu	(%r9),%xmm8
382	andq	$-128,%rsp
383	vmovdqu	(%r11),%xmm0
384	leaq	128(%rcx),%rcx
385	leaq	32+32(%r9),%r9
386	movl	240-128(%rcx),%ebp
387	vpshufb	%xmm0,%xmm8,%xmm8
388
389	andq	%r15,%r14
390	andq	%rsp,%r15
391	subq	%r14,%r15
392	jc	.Ldec_no_key_aliasing
393	cmpq	$768,%r15
394	jnc	.Ldec_no_key_aliasing
395	subq	%r15,%rsp
396.Ldec_no_key_aliasing:
397
398	vmovdqu	80(%rdi),%xmm7
399	leaq	(%rdi),%r14
400	vmovdqu	64(%rdi),%xmm4
401
402
403
404
405
406
407
408	leaq	-192(%rdi,%rdx,1),%r15
409
410	vmovdqu	48(%rdi),%xmm5
411	shrq	$4,%rdx
412	xorq	%r10,%r10
413	vmovdqu	32(%rdi),%xmm6
414	vpshufb	%xmm0,%xmm7,%xmm7
415	vmovdqu	16(%rdi),%xmm2
416	vpshufb	%xmm0,%xmm4,%xmm4
417	vmovdqu	(%rdi),%xmm3
418	vpshufb	%xmm0,%xmm5,%xmm5
419	vmovdqu	%xmm4,48(%rsp)
420	vpshufb	%xmm0,%xmm6,%xmm6
421	vmovdqu	%xmm5,64(%rsp)
422	vpshufb	%xmm0,%xmm2,%xmm2
423	vmovdqu	%xmm6,80(%rsp)
424	vpshufb	%xmm0,%xmm3,%xmm3
425	vmovdqu	%xmm2,96(%rsp)
426	vmovdqu	%xmm3,112(%rsp)
427
428	call	_aesni_ctr32_ghash_6x
429
430	vmovups	%xmm9,-96(%rsi)
431	vmovups	%xmm10,-80(%rsi)
432	vmovups	%xmm11,-64(%rsi)
433	vmovups	%xmm12,-48(%rsi)
434	vmovups	%xmm13,-32(%rsi)
435	vmovups	%xmm14,-16(%rsi)
436
437	vpshufb	(%r11),%xmm8,%xmm8
438	vmovdqu	%xmm8,-64(%r9)
439
440	vzeroupper
441	movq	-48(%rax),%r15
442.cfi_restore	%r15
443	movq	-40(%rax),%r14
444.cfi_restore	%r14
445	movq	-32(%rax),%r13
446.cfi_restore	%r13
447	movq	-24(%rax),%r12
448.cfi_restore	%r12
449	movq	-16(%rax),%rbp
450.cfi_restore	%rbp
451	movq	-8(%rax),%rbx
452.cfi_restore	%rbx
453	leaq	(%rax),%rsp
454.cfi_def_cfa_register	%rsp
455.Lgcm_dec_abort:
456	movq	%r10,%rax
457	.byte	0xf3,0xc3
458.cfi_endproc
459.size	aesni_gcm_decrypt,.-aesni_gcm_decrypt
460.type	_aesni_ctr32_6x,@function
461.align	32
462_aesni_ctr32_6x:
463.cfi_startproc
464	vmovdqu	0-128(%rcx),%xmm4
465	vmovdqu	32(%r11),%xmm2
466	leaq	-1(%rbp),%r13
467	vmovups	16-128(%rcx),%xmm15
468	leaq	32-128(%rcx),%r12
469	vpxor	%xmm4,%xmm1,%xmm9
470	addl	$100663296,%ebx
471	jc	.Lhandle_ctr32_2
472	vpaddb	%xmm2,%xmm1,%xmm10
473	vpaddb	%xmm2,%xmm10,%xmm11
474	vpxor	%xmm4,%xmm10,%xmm10
475	vpaddb	%xmm2,%xmm11,%xmm12
476	vpxor	%xmm4,%xmm11,%xmm11
477	vpaddb	%xmm2,%xmm12,%xmm13
478	vpxor	%xmm4,%xmm12,%xmm12
479	vpaddb	%xmm2,%xmm13,%xmm14
480	vpxor	%xmm4,%xmm13,%xmm13
481	vpaddb	%xmm2,%xmm14,%xmm1
482	vpxor	%xmm4,%xmm14,%xmm14
483	jmp	.Loop_ctr32
484
485.align	16
486.Loop_ctr32:
487	vaesenc	%xmm15,%xmm9,%xmm9
488	vaesenc	%xmm15,%xmm10,%xmm10
489	vaesenc	%xmm15,%xmm11,%xmm11
490	vaesenc	%xmm15,%xmm12,%xmm12
491	vaesenc	%xmm15,%xmm13,%xmm13
492	vaesenc	%xmm15,%xmm14,%xmm14
493	vmovups	(%r12),%xmm15
494	leaq	16(%r12),%r12
495	decl	%r13d
496	jnz	.Loop_ctr32
497
498	vmovdqu	(%r12),%xmm3
499	vaesenc	%xmm15,%xmm9,%xmm9
500	vpxor	0(%rdi),%xmm3,%xmm4
501	vaesenc	%xmm15,%xmm10,%xmm10
502	vpxor	16(%rdi),%xmm3,%xmm5
503	vaesenc	%xmm15,%xmm11,%xmm11
504	vpxor	32(%rdi),%xmm3,%xmm6
505	vaesenc	%xmm15,%xmm12,%xmm12
506	vpxor	48(%rdi),%xmm3,%xmm8
507	vaesenc	%xmm15,%xmm13,%xmm13
508	vpxor	64(%rdi),%xmm3,%xmm2
509	vaesenc	%xmm15,%xmm14,%xmm14
510	vpxor	80(%rdi),%xmm3,%xmm3
511	leaq	96(%rdi),%rdi
512
513	vaesenclast	%xmm4,%xmm9,%xmm9
514	vaesenclast	%xmm5,%xmm10,%xmm10
515	vaesenclast	%xmm6,%xmm11,%xmm11
516	vaesenclast	%xmm8,%xmm12,%xmm12
517	vaesenclast	%xmm2,%xmm13,%xmm13
518	vaesenclast	%xmm3,%xmm14,%xmm14
519	vmovups	%xmm9,0(%rsi)
520	vmovups	%xmm10,16(%rsi)
521	vmovups	%xmm11,32(%rsi)
522	vmovups	%xmm12,48(%rsi)
523	vmovups	%xmm13,64(%rsi)
524	vmovups	%xmm14,80(%rsi)
525	leaq	96(%rsi),%rsi
526
527	.byte	0xf3,0xc3
528.align	32
529.Lhandle_ctr32_2:
530	vpshufb	%xmm0,%xmm1,%xmm6
531	vmovdqu	48(%r11),%xmm5
532	vpaddd	64(%r11),%xmm6,%xmm10
533	vpaddd	%xmm5,%xmm6,%xmm11
534	vpaddd	%xmm5,%xmm10,%xmm12
535	vpshufb	%xmm0,%xmm10,%xmm10
536	vpaddd	%xmm5,%xmm11,%xmm13
537	vpshufb	%xmm0,%xmm11,%xmm11
538	vpxor	%xmm4,%xmm10,%xmm10
539	vpaddd	%xmm5,%xmm12,%xmm14
540	vpshufb	%xmm0,%xmm12,%xmm12
541	vpxor	%xmm4,%xmm11,%xmm11
542	vpaddd	%xmm5,%xmm13,%xmm1
543	vpshufb	%xmm0,%xmm13,%xmm13
544	vpxor	%xmm4,%xmm12,%xmm12
545	vpshufb	%xmm0,%xmm14,%xmm14
546	vpxor	%xmm4,%xmm13,%xmm13
547	vpshufb	%xmm0,%xmm1,%xmm1
548	vpxor	%xmm4,%xmm14,%xmm14
549	jmp	.Loop_ctr32
550.cfi_endproc
551.size	_aesni_ctr32_6x,.-_aesni_ctr32_6x
552
553.globl	aesni_gcm_encrypt
554.hidden aesni_gcm_encrypt
555.type	aesni_gcm_encrypt,@function
556.align	32
557aesni_gcm_encrypt:
558.cfi_startproc
559#ifdef BORINGSSL_DISPATCH_TEST
560.extern	BORINGSSL_function_hit
561.hidden BORINGSSL_function_hit
562	movb	$1,BORINGSSL_function_hit+2(%rip)
563#endif
564	xorq	%r10,%r10
565
566
567
568
569	cmpq	$288,%rdx
570	jb	.Lgcm_enc_abort
571
572	leaq	(%rsp),%rax
573.cfi_def_cfa_register	%rax
574	pushq	%rbx
575.cfi_offset	%rbx,-16
576	pushq	%rbp
577.cfi_offset	%rbp,-24
578	pushq	%r12
579.cfi_offset	%r12,-32
580	pushq	%r13
581.cfi_offset	%r13,-40
582	pushq	%r14
583.cfi_offset	%r14,-48
584	pushq	%r15
585.cfi_offset	%r15,-56
586	vzeroupper
587
588	vmovdqu	(%r8),%xmm1
589	addq	$-128,%rsp
590	movl	12(%r8),%ebx
591	leaq	.Lbswap_mask(%rip),%r11
592	leaq	-128(%rcx),%r14
593	movq	$0xf80,%r15
594	leaq	128(%rcx),%rcx
595	vmovdqu	(%r11),%xmm0
596	andq	$-128,%rsp
597	movl	240-128(%rcx),%ebp
598
599	andq	%r15,%r14
600	andq	%rsp,%r15
601	subq	%r14,%r15
602	jc	.Lenc_no_key_aliasing
603	cmpq	$768,%r15
604	jnc	.Lenc_no_key_aliasing
605	subq	%r15,%rsp
606.Lenc_no_key_aliasing:
607
608	leaq	(%rsi),%r14
609
610
611
612
613
614
615
616
617	leaq	-192(%rsi,%rdx,1),%r15
618
619	shrq	$4,%rdx
620
621	call	_aesni_ctr32_6x
622	vpshufb	%xmm0,%xmm9,%xmm8
623	vpshufb	%xmm0,%xmm10,%xmm2
624	vmovdqu	%xmm8,112(%rsp)
625	vpshufb	%xmm0,%xmm11,%xmm4
626	vmovdqu	%xmm2,96(%rsp)
627	vpshufb	%xmm0,%xmm12,%xmm5
628	vmovdqu	%xmm4,80(%rsp)
629	vpshufb	%xmm0,%xmm13,%xmm6
630	vmovdqu	%xmm5,64(%rsp)
631	vpshufb	%xmm0,%xmm14,%xmm7
632	vmovdqu	%xmm6,48(%rsp)
633
634	call	_aesni_ctr32_6x
635
636	vmovdqu	(%r9),%xmm8
637	leaq	32+32(%r9),%r9
638	subq	$12,%rdx
639	movq	$192,%r10
640	vpshufb	%xmm0,%xmm8,%xmm8
641
642	call	_aesni_ctr32_ghash_6x
643	vmovdqu	32(%rsp),%xmm7
644	vmovdqu	(%r11),%xmm0
645	vmovdqu	0-32(%r9),%xmm3
646	vpunpckhqdq	%xmm7,%xmm7,%xmm1
647	vmovdqu	32-32(%r9),%xmm15
648	vmovups	%xmm9,-96(%rsi)
649	vpshufb	%xmm0,%xmm9,%xmm9
650	vpxor	%xmm7,%xmm1,%xmm1
651	vmovups	%xmm10,-80(%rsi)
652	vpshufb	%xmm0,%xmm10,%xmm10
653	vmovups	%xmm11,-64(%rsi)
654	vpshufb	%xmm0,%xmm11,%xmm11
655	vmovups	%xmm12,-48(%rsi)
656	vpshufb	%xmm0,%xmm12,%xmm12
657	vmovups	%xmm13,-32(%rsi)
658	vpshufb	%xmm0,%xmm13,%xmm13
659	vmovups	%xmm14,-16(%rsi)
660	vpshufb	%xmm0,%xmm14,%xmm14
661	vmovdqu	%xmm9,16(%rsp)
662	vmovdqu	48(%rsp),%xmm6
663	vmovdqu	16-32(%r9),%xmm0
664	vpunpckhqdq	%xmm6,%xmm6,%xmm2
665	vpclmulqdq	$0x00,%xmm3,%xmm7,%xmm5
666	vpxor	%xmm6,%xmm2,%xmm2
667	vpclmulqdq	$0x11,%xmm3,%xmm7,%xmm7
668	vpclmulqdq	$0x00,%xmm15,%xmm1,%xmm1
669
670	vmovdqu	64(%rsp),%xmm9
671	vpclmulqdq	$0x00,%xmm0,%xmm6,%xmm4
672	vmovdqu	48-32(%r9),%xmm3
673	vpxor	%xmm5,%xmm4,%xmm4
674	vpunpckhqdq	%xmm9,%xmm9,%xmm5
675	vpclmulqdq	$0x11,%xmm0,%xmm6,%xmm6
676	vpxor	%xmm9,%xmm5,%xmm5
677	vpxor	%xmm7,%xmm6,%xmm6
678	vpclmulqdq	$0x10,%xmm15,%xmm2,%xmm2
679	vmovdqu	80-32(%r9),%xmm15
680	vpxor	%xmm1,%xmm2,%xmm2
681
682	vmovdqu	80(%rsp),%xmm1
683	vpclmulqdq	$0x00,%xmm3,%xmm9,%xmm7
684	vmovdqu	64-32(%r9),%xmm0
685	vpxor	%xmm4,%xmm7,%xmm7
686	vpunpckhqdq	%xmm1,%xmm1,%xmm4
687	vpclmulqdq	$0x11,%xmm3,%xmm9,%xmm9
688	vpxor	%xmm1,%xmm4,%xmm4
689	vpxor	%xmm6,%xmm9,%xmm9
690	vpclmulqdq	$0x00,%xmm15,%xmm5,%xmm5
691	vpxor	%xmm2,%xmm5,%xmm5
692
693	vmovdqu	96(%rsp),%xmm2
694	vpclmulqdq	$0x00,%xmm0,%xmm1,%xmm6
695	vmovdqu	96-32(%r9),%xmm3
696	vpxor	%xmm7,%xmm6,%xmm6
697	vpunpckhqdq	%xmm2,%xmm2,%xmm7
698	vpclmulqdq	$0x11,%xmm0,%xmm1,%xmm1
699	vpxor	%xmm2,%xmm7,%xmm7
700	vpxor	%xmm9,%xmm1,%xmm1
701	vpclmulqdq	$0x10,%xmm15,%xmm4,%xmm4
702	vmovdqu	128-32(%r9),%xmm15
703	vpxor	%xmm5,%xmm4,%xmm4
704
705	vpxor	112(%rsp),%xmm8,%xmm8
706	vpclmulqdq	$0x00,%xmm3,%xmm2,%xmm5
707	vmovdqu	112-32(%r9),%xmm0
708	vpunpckhqdq	%xmm8,%xmm8,%xmm9
709	vpxor	%xmm6,%xmm5,%xmm5
710	vpclmulqdq	$0x11,%xmm3,%xmm2,%xmm2
711	vpxor	%xmm8,%xmm9,%xmm9
712	vpxor	%xmm1,%xmm2,%xmm2
713	vpclmulqdq	$0x00,%xmm15,%xmm7,%xmm7
714	vpxor	%xmm4,%xmm7,%xmm4
715
716	vpclmulqdq	$0x00,%xmm0,%xmm8,%xmm6
717	vmovdqu	0-32(%r9),%xmm3
718	vpunpckhqdq	%xmm14,%xmm14,%xmm1
719	vpclmulqdq	$0x11,%xmm0,%xmm8,%xmm8
720	vpxor	%xmm14,%xmm1,%xmm1
721	vpxor	%xmm5,%xmm6,%xmm5
722	vpclmulqdq	$0x10,%xmm15,%xmm9,%xmm9
723	vmovdqu	32-32(%r9),%xmm15
724	vpxor	%xmm2,%xmm8,%xmm7
725	vpxor	%xmm4,%xmm9,%xmm6
726
727	vmovdqu	16-32(%r9),%xmm0
728	vpxor	%xmm5,%xmm7,%xmm9
729	vpclmulqdq	$0x00,%xmm3,%xmm14,%xmm4
730	vpxor	%xmm9,%xmm6,%xmm6
731	vpunpckhqdq	%xmm13,%xmm13,%xmm2
732	vpclmulqdq	$0x11,%xmm3,%xmm14,%xmm14
733	vpxor	%xmm13,%xmm2,%xmm2
734	vpslldq	$8,%xmm6,%xmm9
735	vpclmulqdq	$0x00,%xmm15,%xmm1,%xmm1
736	vpxor	%xmm9,%xmm5,%xmm8
737	vpsrldq	$8,%xmm6,%xmm6
738	vpxor	%xmm6,%xmm7,%xmm7
739
740	vpclmulqdq	$0x00,%xmm0,%xmm13,%xmm5
741	vmovdqu	48-32(%r9),%xmm3
742	vpxor	%xmm4,%xmm5,%xmm5
743	vpunpckhqdq	%xmm12,%xmm12,%xmm9
744	vpclmulqdq	$0x11,%xmm0,%xmm13,%xmm13
745	vpxor	%xmm12,%xmm9,%xmm9
746	vpxor	%xmm14,%xmm13,%xmm13
747	vpalignr	$8,%xmm8,%xmm8,%xmm14
748	vpclmulqdq	$0x10,%xmm15,%xmm2,%xmm2
749	vmovdqu	80-32(%r9),%xmm15
750	vpxor	%xmm1,%xmm2,%xmm2
751
752	vpclmulqdq	$0x00,%xmm3,%xmm12,%xmm4
753	vmovdqu	64-32(%r9),%xmm0
754	vpxor	%xmm5,%xmm4,%xmm4
755	vpunpckhqdq	%xmm11,%xmm11,%xmm1
756	vpclmulqdq	$0x11,%xmm3,%xmm12,%xmm12
757	vpxor	%xmm11,%xmm1,%xmm1
758	vpxor	%xmm13,%xmm12,%xmm12
759	vxorps	16(%rsp),%xmm7,%xmm7
760	vpclmulqdq	$0x00,%xmm15,%xmm9,%xmm9
761	vpxor	%xmm2,%xmm9,%xmm9
762
763	vpclmulqdq	$0x10,16(%r11),%xmm8,%xmm8
764	vxorps	%xmm14,%xmm8,%xmm8
765
766	vpclmulqdq	$0x00,%xmm0,%xmm11,%xmm5
767	vmovdqu	96-32(%r9),%xmm3
768	vpxor	%xmm4,%xmm5,%xmm5
769	vpunpckhqdq	%xmm10,%xmm10,%xmm2
770	vpclmulqdq	$0x11,%xmm0,%xmm11,%xmm11
771	vpxor	%xmm10,%xmm2,%xmm2
772	vpalignr	$8,%xmm8,%xmm8,%xmm14
773	vpxor	%xmm12,%xmm11,%xmm11
774	vpclmulqdq	$0x10,%xmm15,%xmm1,%xmm1
775	vmovdqu	128-32(%r9),%xmm15
776	vpxor	%xmm9,%xmm1,%xmm1
777
778	vxorps	%xmm7,%xmm14,%xmm14
779	vpclmulqdq	$0x10,16(%r11),%xmm8,%xmm8
780	vxorps	%xmm14,%xmm8,%xmm8
781
782	vpclmulqdq	$0x00,%xmm3,%xmm10,%xmm4
783	vmovdqu	112-32(%r9),%xmm0
784	vpxor	%xmm5,%xmm4,%xmm4
785	vpunpckhqdq	%xmm8,%xmm8,%xmm9
786	vpclmulqdq	$0x11,%xmm3,%xmm10,%xmm10
787	vpxor	%xmm8,%xmm9,%xmm9
788	vpxor	%xmm11,%xmm10,%xmm10
789	vpclmulqdq	$0x00,%xmm15,%xmm2,%xmm2
790	vpxor	%xmm1,%xmm2,%xmm2
791
792	vpclmulqdq	$0x00,%xmm0,%xmm8,%xmm5
793	vpclmulqdq	$0x11,%xmm0,%xmm8,%xmm7
794	vpxor	%xmm4,%xmm5,%xmm5
795	vpclmulqdq	$0x10,%xmm15,%xmm9,%xmm6
796	vpxor	%xmm10,%xmm7,%xmm7
797	vpxor	%xmm2,%xmm6,%xmm6
798
799	vpxor	%xmm5,%xmm7,%xmm4
800	vpxor	%xmm4,%xmm6,%xmm6
801	vpslldq	$8,%xmm6,%xmm1
802	vmovdqu	16(%r11),%xmm3
803	vpsrldq	$8,%xmm6,%xmm6
804	vpxor	%xmm1,%xmm5,%xmm8
805	vpxor	%xmm6,%xmm7,%xmm7
806
807	vpalignr	$8,%xmm8,%xmm8,%xmm2
808	vpclmulqdq	$0x10,%xmm3,%xmm8,%xmm8
809	vpxor	%xmm2,%xmm8,%xmm8
810
811	vpalignr	$8,%xmm8,%xmm8,%xmm2
812	vpclmulqdq	$0x10,%xmm3,%xmm8,%xmm8
813	vpxor	%xmm7,%xmm2,%xmm2
814	vpxor	%xmm2,%xmm8,%xmm8
815	vpshufb	(%r11),%xmm8,%xmm8
816	vmovdqu	%xmm8,-64(%r9)
817
818	vzeroupper
819	movq	-48(%rax),%r15
820.cfi_restore	%r15
821	movq	-40(%rax),%r14
822.cfi_restore	%r14
823	movq	-32(%rax),%r13
824.cfi_restore	%r13
825	movq	-24(%rax),%r12
826.cfi_restore	%r12
827	movq	-16(%rax),%rbp
828.cfi_restore	%rbp
829	movq	-8(%rax),%rbx
830.cfi_restore	%rbx
831	leaq	(%rax),%rsp
832.cfi_def_cfa_register	%rsp
833.Lgcm_enc_abort:
834	movq	%r10,%rax
835	.byte	0xf3,0xc3
836.cfi_endproc
837.size	aesni_gcm_encrypt,.-aesni_gcm_encrypt
838.align	64
839.Lbswap_mask:
840.byte	15,14,13,12,11,10,9,8,7,6,5,4,3,2,1,0
841.Lpoly:
842.byte	0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0xc2
843.Lone_msb:
844.byte	0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1
845.Ltwo_lsb:
846.byte	2,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
847.Lone_lsb:
848.byte	1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
849.byte	65,69,83,45,78,73,32,71,67,77,32,109,111,100,117,108,101,32,102,111,114,32,120,56,54,95,54,52,44,32,67,82,89,80,84,79,71,65,77,83,32,98,121,32,60,97,112,112,114,111,64,111,112,101,110,115,115,108,46,111,114,103,62,0
850.align	64
851#endif
852.section	.note.GNU-stack,"",@progbits
853