• Home
  • Raw
  • Download

Lines Matching refs:reg

38     int16x4_t res_16 = vqmovn_s32(input.reg[0]);
40 output.reg[0] = vget_lane_u32(vreinterpret_u32_u8(res_8), 0);
58 vcombine_s16(vqmovn_s32(input.reg[0]), vqmovn_s32(input.reg[1]));
59 output.reg[0] = vqmovun_s16(res_16);
77 vcombine_s16(vqmovn_s32(input.reg[0]), vqmovn_s32(input.reg[1]));
79 vcombine_s16(vqmovn_s32(input.reg[2]), vqmovn_s32(input.reg[3]));
80 output.reg[0] = vqmovun_s16(res_16_0);
81 output.reg[1] = vqmovun_s16(res_16_1);
100 res_16[i] = vcombine_s16(vqmovn_s32(input.reg[2 * i]),
101 vqmovn_s32(input.reg[2 * i + 1]));
104 output.reg[i] = vqmovun_s16(res_16[i]);
115 StoreInt32x4(dst->data(row, col), src.buf.reg[0]);
116 StoreInt32x4(dst->data(row + 4, col), src.buf.reg[1]);
118 *dst->data(row + 0, col) = GetLane<0>(src.buf.reg[0]);
119 *dst->data(row + 1, col) = GetLane<1>(src.buf.reg[0]);
120 *dst->data(row + 2, col) = GetLane<2>(src.buf.reg[0]);
121 *dst->data(row + 3, col) = GetLane<3>(src.buf.reg[0]);
122 *dst->data(row + 4, col) = GetLane<0>(src.buf.reg[1]);
123 *dst->data(row + 5, col) = GetLane<1>(src.buf.reg[1]);
124 *dst->data(row + 6, col) = GetLane<2>(src.buf.reg[1]);
125 *dst->data(row + 7, col) = GetLane<3>(src.buf.reg[1]);
131 const int32x4x2_t t0 = vtrnq_s32(src.buf.reg[0], src.buf.reg[1]);
132 const int32x4x2_t t1 = vtrnq_s32(src.buf.reg[2], src.buf.reg[3]);
134 result.buf.reg[0] =
136 result.buf.reg[1] =
138 result.buf.reg[2] =
140 result.buf.reg[3] =
154 vst1q_s32(dst_ptr + i * stride, block.buf.reg[i]);
167 vst1q_s32(dst_ptr + i * col_stride + 0, src.buf.reg[2 * i + 0]);
168 vst1q_s32(dst_ptr + i * col_stride + 4, src.buf.reg[2 * i + 1]);
173 top.buf.reg[0] = src.buf.reg[0];
174 top.buf.reg[1] = src.buf.reg[2];
175 top.buf.reg[2] = src.buf.reg[4];
176 top.buf.reg[3] = src.buf.reg[6];
179 vst1q_s32(dst_ptr + i * row_stride, transpose_top.buf.reg[i]);
182 bottom.buf.reg[0] = src.buf.reg[1];
183 bottom.buf.reg[1] = src.buf.reg[3];
184 bottom.buf.reg[2] = src.buf.reg[5];
185 bottom.buf.reg[3] = src.buf.reg[7];
188 vst1q_s32(dst_ptr + (i + 4) * row_stride, transpose_bottom.buf.reg[i]);
202 vst1q_s32(dst_ptr + i * col_stride, src.buf.reg[2 * i]);
203 vst1q_s32(dst_ptr + i * col_stride + 4, src.buf.reg[2 * i + 1]);
208 top_left.buf.reg[0] = src.buf.reg[0];
209 top_left.buf.reg[1] = src.buf.reg[2];
210 top_left.buf.reg[2] = src.buf.reg[4];
211 top_left.buf.reg[3] = src.buf.reg[6];
214 vst1q_s32(dst_ptr + i * row_stride, transpose_top_left.buf.reg[i]);
217 bottom_left.buf.reg[0] = src.buf.reg[1];
218 bottom_left.buf.reg[1] = src.buf.reg[3];
219 bottom_left.buf.reg[2] = src.buf.reg[5];
220 bottom_left.buf.reg[3] = src.buf.reg[7];
224 transpose_bottom_left.buf.reg[i]);
227 top_right.buf.reg[0] = src.buf.reg[8];
228 top_right.buf.reg[1] = src.buf.reg[10];
229 top_right.buf.reg[2] = src.buf.reg[12];
230 top_right.buf.reg[3] = src.buf.reg[14];
233 vst1q_s32(dst_ptr + i * row_stride + 4, transpose_top_right.buf.reg[i]);
236 bottom_right.buf.reg[0] = src.buf.reg[9];
237 bottom_right.buf.reg[1] = src.buf.reg[11];
238 bottom_right.buf.reg[2] = src.buf.reg[13];
239 bottom_right.buf.reg[3] = src.buf.reg[15];
243 transpose_bottom_right.buf.reg[i]);
255 vst1q_s32(dst_ptr, src.buf.reg[0]);
258 vst1q_lane_s32(dst_ptr + 0 * row_stride, src.buf.reg[0], 0);
259 vst1q_lane_s32(dst_ptr + 1 * row_stride, src.buf.reg[0], 1);
260 vst1q_lane_s32(dst_ptr + 2 * row_stride, src.buf.reg[0], 2);
261 vst1q_lane_s32(dst_ptr + 3 * row_stride, src.buf.reg[0], 3);
272 vst1q_s32(dst_ptr, src.buf.reg[0]);
275 vst1q_lane_s32(dst_ptr + 0 * col_stride, src.buf.reg[0], 0);
276 vst1q_lane_s32(dst_ptr + 1 * col_stride, src.buf.reg[0], 1);
277 vst1q_lane_s32(dst_ptr + 2 * col_stride, src.buf.reg[0], 2);
278 vst1q_lane_s32(dst_ptr + 3 * col_stride, src.buf.reg[0], 3);
287 const std::uint32_t src_reg = src.buf.reg[0];
299 *dst->data(row, col + i) = (src.buf.reg[0] >> (8 * i));
310 vst1_u8(dst_ptr, src.buf.reg[0]);
313 vst1_lane_u8(dst_ptr + 0 * row_stride, src.buf.reg[0], 0);
314 vst1_lane_u8(dst_ptr + 1 * row_stride, src.buf.reg[0], 1);
315 vst1_lane_u8(dst_ptr + 2 * row_stride, src.buf.reg[0], 2);
316 vst1_lane_u8(dst_ptr + 3 * row_stride, src.buf.reg[0], 3);
317 vst1_lane_u8(dst_ptr + 4 * row_stride, src.buf.reg[0], 4);
318 vst1_lane_u8(dst_ptr + 5 * row_stride, src.buf.reg[0], 5);
319 vst1_lane_u8(dst_ptr + 6 * row_stride, src.buf.reg[0], 6);
320 vst1_lane_u8(dst_ptr + 7 * row_stride, src.buf.reg[0], 7);
334 src.buf.reg[i], 0);
336 src.buf.reg[i], 1);
338 src.buf.reg[i], 2);
340 src.buf.reg[i], 3);
342 src.buf.reg[i], 4);
344 src.buf.reg[i], 5);
346 src.buf.reg[i], 6);
348 src.buf.reg[i], 7);
361 vst1_u8(dst_ptr + i * col_stride, src.buf.reg[i]);
367 vst1_lane_u8(col_ptr + 0 * row_stride, src.buf.reg[i], 0);
368 vst1_lane_u8(col_ptr + 1 * row_stride, src.buf.reg[i], 1);
369 vst1_lane_u8(col_ptr + 2 * row_stride, src.buf.reg[i], 2);
370 vst1_lane_u8(col_ptr + 3 * row_stride, src.buf.reg[i], 3);
371 vst1_lane_u8(col_ptr + 4 * row_stride, src.buf.reg[i], 4);
372 vst1_lane_u8(col_ptr + 5 * row_stride, src.buf.reg[i], 5);
373 vst1_lane_u8(col_ptr + 6 * row_stride, src.buf.reg[i], 6);
374 vst1_lane_u8(col_ptr + 7 * row_stride, src.buf.reg[i], 7);
382 a[0] = vtrn_u8(src.buf.reg[0], src.buf.reg[1]);
383 a[1] = vtrn_u8(src.buf.reg[2], src.buf.reg[3]);
384 a[2] = vtrn_u8(src.buf.reg[4], src.buf.reg[5]);
385 a[3] = vtrn_u8(src.buf.reg[6], src.buf.reg[7]);
405 result.buf.reg[0] = vreinterpret_u8_u32(c[0].val[0]);
406 result.buf.reg[1] = vreinterpret_u8_u32(c[1].val[0]);
407 result.buf.reg[2] = vreinterpret_u8_u32(c[2].val[0]);
408 result.buf.reg[3] = vreinterpret_u8_u32(c[3].val[0]);
409 result.buf.reg[4] = vreinterpret_u8_u32(c[0].val[1]);
410 result.buf.reg[5] = vreinterpret_u8_u32(c[1].val[1]);
411 result.buf.reg[6] = vreinterpret_u8_u32(c[2].val[1]);
412 result.buf.reg[7] = vreinterpret_u8_u32(c[3].val[1]);
425 vst1_u8(dst_ptr + i * stride, block.buf.reg[i]);