arm/tcg/gengvec64.c

*a11efe30SRichard Henderson/*
*a11efe30SRichard Henderson *  AArch64 generic vector expansion
*a11efe30SRichard Henderson *
*a11efe30SRichard Henderson *  Copyright (c) 2013 Alexander Graf <agraf@suse.de>
*a11efe30SRichard Henderson *
*a11efe30SRichard Henderson * This library is free software; you can redistribute it and/or
*a11efe30SRichard Henderson * modify it under the terms of the GNU Lesser General Public
*a11efe30SRichard Henderson * License as published by the Free Software Foundation; either
*a11efe30SRichard Henderson * version 2.1 of the License, or (at your option) any later version.
*a11efe30SRichard Henderson *
*a11efe30SRichard Henderson * This library is distributed in the hope that it will be useful,
*a11efe30SRichard Henderson * but WITHOUT ANY WARRANTY; without even the implied warranty of
*a11efe30SRichard Henderson * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
*a11efe30SRichard Henderson * Lesser General Public License for more details.
*a11efe30SRichard Henderson *
*a11efe30SRichard Henderson * You should have received a copy of the GNU Lesser General Public
*a11efe30SRichard Henderson * License along with this library; if not, see <http://www.gnu.org/licenses/>.
*a11efe30SRichard Henderson */
*a11efe30SRichard Henderson
*a11efe30SRichard Henderson#include "qemu/osdep.h"
*a11efe30SRichard Henderson#include "translate.h"
*a11efe30SRichard Henderson#include "translate-a64.h"
*a11efe30SRichard Henderson
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_rax1_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_rotli_i64(d, m, 1);
*a11efe30SRichard Henderson    tcg_gen_xor_i64(d, d, n);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_rax1_vec(unsigned vece, TCGv_vec d, TCGv_vec n, TCGv_vec m)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_rotli_vec(vece, d, m, 1);
*a11efe30SRichard Henderson    tcg_gen_xor_vec(vece, d, d, n);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonvoid gen_gvec_rax1(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
*a11efe30SRichard Henderson                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    static const TCGOpcode vecop_list[] = { INDEX_op_rotli_vec, 0 };
*a11efe30SRichard Henderson    static const GVecGen3 op = {
*a11efe30SRichard Henderson        .fni8 = gen_rax1_i64,
*a11efe30SRichard Henderson        .fniv = gen_rax1_vec,
*a11efe30SRichard Henderson        .opt_opc = vecop_list,
*a11efe30SRichard Henderson        .fno = gen_helper_crypto_rax1,
*a11efe30SRichard Henderson        .vece = MO_64,
*a11efe30SRichard Henderson    };
*a11efe30SRichard Henderson    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &op);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_xar8_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, int64_t sh)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    TCGv_i64 t = tcg_temp_new_i64();
*a11efe30SRichard Henderson    uint64_t mask = dup_const(MO_8, 0xff >> sh);
*a11efe30SRichard Henderson
*a11efe30SRichard Henderson    tcg_gen_xor_i64(t, n, m);
*a11efe30SRichard Henderson    tcg_gen_shri_i64(d, t, sh);
*a11efe30SRichard Henderson    tcg_gen_shli_i64(t, t, 8 - sh);
*a11efe30SRichard Henderson    tcg_gen_andi_i64(d, d, mask);
*a11efe30SRichard Henderson    tcg_gen_andi_i64(t, t, ~mask);
*a11efe30SRichard Henderson    tcg_gen_or_i64(d, d, t);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_xar16_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, int64_t sh)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    TCGv_i64 t = tcg_temp_new_i64();
*a11efe30SRichard Henderson    uint64_t mask = dup_const(MO_16, 0xffff >> sh);
*a11efe30SRichard Henderson
*a11efe30SRichard Henderson    tcg_gen_xor_i64(t, n, m);
*a11efe30SRichard Henderson    tcg_gen_shri_i64(d, t, sh);
*a11efe30SRichard Henderson    tcg_gen_shli_i64(t, t, 16 - sh);
*a11efe30SRichard Henderson    tcg_gen_andi_i64(d, d, mask);
*a11efe30SRichard Henderson    tcg_gen_andi_i64(t, t, ~mask);
*a11efe30SRichard Henderson    tcg_gen_or_i64(d, d, t);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_xar_i32(TCGv_i32 d, TCGv_i32 n, TCGv_i32 m, int32_t sh)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_xor_i32(d, n, m);
*a11efe30SRichard Henderson    tcg_gen_rotri_i32(d, d, sh);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_xar_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, int64_t sh)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_xor_i64(d, n, m);
*a11efe30SRichard Henderson    tcg_gen_rotri_i64(d, d, sh);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_xar_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
*a11efe30SRichard Henderson                        TCGv_vec m, int64_t sh)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_xor_vec(vece, d, n, m);
*a11efe30SRichard Henderson    tcg_gen_rotri_vec(vece, d, d, sh);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonvoid gen_gvec_xar(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
*a11efe30SRichard Henderson                  uint32_t rm_ofs, int64_t shift,
*a11efe30SRichard Henderson                  uint32_t opr_sz, uint32_t max_sz)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    static const TCGOpcode vecop[] = { INDEX_op_rotli_vec, 0 };
*a11efe30SRichard Henderson    static const GVecGen3i ops[4] = {
*a11efe30SRichard Henderson        { .fni8 = gen_xar8_i64,
*a11efe30SRichard Henderson          .fniv = gen_xar_vec,
*a11efe30SRichard Henderson          .fno = gen_helper_sve2_xar_b,
*a11efe30SRichard Henderson          .opt_opc = vecop,
*a11efe30SRichard Henderson          .vece = MO_8 },
*a11efe30SRichard Henderson        { .fni8 = gen_xar16_i64,
*a11efe30SRichard Henderson          .fniv = gen_xar_vec,
*a11efe30SRichard Henderson          .fno = gen_helper_sve2_xar_h,
*a11efe30SRichard Henderson          .opt_opc = vecop,
*a11efe30SRichard Henderson          .vece = MO_16 },
*a11efe30SRichard Henderson        { .fni4 = gen_xar_i32,
*a11efe30SRichard Henderson          .fniv = gen_xar_vec,
*a11efe30SRichard Henderson          .fno = gen_helper_sve2_xar_s,
*a11efe30SRichard Henderson          .opt_opc = vecop,
*a11efe30SRichard Henderson          .vece = MO_32 },
*a11efe30SRichard Henderson        { .fni8 = gen_xar_i64,
*a11efe30SRichard Henderson          .fniv = gen_xar_vec,
*a11efe30SRichard Henderson          .fno = gen_helper_gvec_xar_d,
*a11efe30SRichard Henderson          .opt_opc = vecop,
*a11efe30SRichard Henderson          .vece = MO_64 }
*a11efe30SRichard Henderson    };
*a11efe30SRichard Henderson    int esize = 8 << vece;
*a11efe30SRichard Henderson
*a11efe30SRichard Henderson    /* The SVE2 range is 1 .. esize; the AdvSIMD range is 0 .. esize-1. */
*a11efe30SRichard Henderson    tcg_debug_assert(shift >= 0);
*a11efe30SRichard Henderson    tcg_debug_assert(shift <= esize);
*a11efe30SRichard Henderson    shift &= esize - 1;
*a11efe30SRichard Henderson
*a11efe30SRichard Henderson    if (shift == 0) {
*a11efe30SRichard Henderson        /* xar with no rotate devolves to xor. */
*a11efe30SRichard Henderson        tcg_gen_gvec_xor(vece, rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz);
*a11efe30SRichard Henderson    } else {
*a11efe30SRichard Henderson        tcg_gen_gvec_3i(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz,
*a11efe30SRichard Henderson                        shift, &ops[vece]);
*a11efe30SRichard Henderson    }
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_eor3_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_xor_i64(d, n, m);
*a11efe30SRichard Henderson    tcg_gen_xor_i64(d, d, k);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_eor3_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
*a11efe30SRichard Henderson                         TCGv_vec m, TCGv_vec k)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_xor_vec(vece, d, n, m);
*a11efe30SRichard Henderson    tcg_gen_xor_vec(vece, d, d, k);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonvoid gen_gvec_eor3(unsigned vece, uint32_t d, uint32_t n, uint32_t m,
*a11efe30SRichard Henderson                   uint32_t a, uint32_t oprsz, uint32_t maxsz)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    static const GVecGen4 op = {
*a11efe30SRichard Henderson        .fni8 = gen_eor3_i64,
*a11efe30SRichard Henderson        .fniv = gen_eor3_vec,
*a11efe30SRichard Henderson        .fno = gen_helper_sve2_eor3,
*a11efe30SRichard Henderson        .vece = MO_64,
*a11efe30SRichard Henderson        .prefer_i64 = TCG_TARGET_REG_BITS == 64,
*a11efe30SRichard Henderson    };
*a11efe30SRichard Henderson    tcg_gen_gvec_4(d, n, m, a, oprsz, maxsz, &op);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_bcax_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_andc_i64(d, m, k);
*a11efe30SRichard Henderson    tcg_gen_xor_i64(d, d, n);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonstatic void gen_bcax_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
*a11efe30SRichard Henderson                         TCGv_vec m, TCGv_vec k)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    tcg_gen_andc_vec(vece, d, m, k);
*a11efe30SRichard Henderson    tcg_gen_xor_vec(vece, d, d, n);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson
*a11efe30SRichard Hendersonvoid gen_gvec_bcax(unsigned vece, uint32_t d, uint32_t n, uint32_t m,
*a11efe30SRichard Henderson                   uint32_t a, uint32_t oprsz, uint32_t maxsz)
*a11efe30SRichard Henderson{
*a11efe30SRichard Henderson    static const GVecGen4 op = {
*a11efe30SRichard Henderson        .fni8 = gen_bcax_i64,
*a11efe30SRichard Henderson        .fniv = gen_bcax_vec,
*a11efe30SRichard Henderson        .fno = gen_helper_sve2_bcax,
*a11efe30SRichard Henderson        .vece = MO_64,
*a11efe30SRichard Henderson        .prefer_i64 = TCG_TARGET_REG_BITS == 64,
*a11efe30SRichard Henderson    };
*a11efe30SRichard Henderson    tcg_gen_gvec_4(d, n, m, a, oprsz, maxsz, &op);
*a11efe30SRichard Henderson}
*a11efe30SRichard Henderson