diff --git a/src/layer/arm/requantize_arm.cpp b/src/layer/arm/requantize_arm.cpp index d610d512b57..041ca2f9eca 100644 --- a/src/layer/arm/requantize_arm.cpp +++ b/src/layer/arm/requantize_arm.cpp @@ -57,11 +57,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _scale_in0 = vld1q_f32((const float*)scale_in_data); _scale_in1 = vld1q_f32((const float*)scale_in_data + 4); } - if (elempack == 4) - { - _scale_in0 = vld1q_f32((const float*)scale_in_data); - _scale_in1 = _scale_in0; - } } #endif // __ARM_NEON @@ -76,11 +71,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _scale_out0 = vld1q_f32((const float*)scale_out_data); _scale_out1 = vld1q_f32((const float*)scale_out_data + 4); } - if (elempack == 4) - { - _scale_out0 = vld1q_f32((const float*)scale_out_data); - _scale_out1 = _scale_out0; - } } #endif // __ARM_NEON @@ -139,11 +129,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _bias0 = vld1q_f32((const float*)bias_data); _bias1 = vld1q_f32((const float*)bias_data + 4); } - if (elempack == 4) - { - _bias0 = vld1q_f32((const float*)bias_data); - _bias1 = _bias0; - } } #endif // __ARM_NEON @@ -224,11 +209,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _scale_in0 = vld1q_f32((const float*)scale_in_data); _scale_in1 = vld1q_f32((const float*)scale_in_data + 4); } - if (elempack == 4) - { - _scale_in0 = vld1q_f32((const float*)scale_in_data); - _scale_in1 = _scale_in0; - } } #endif // __ARM_NEON @@ -243,11 +223,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _scale_out0 = vld1q_f32((const float*)scale_out_data); _scale_out1 = vld1q_f32((const float*)scale_out_data + 4); } - if (elempack == 4) - { - _scale_out0 = vld1q_f32((const float*)scale_out_data); - _scale_out1 = _scale_out0; - } } #endif // __ARM_NEON @@ -307,11 +282,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _bias0 = vld1q_f32((const float*)bias_data); _bias1 = vld1q_f32((const float*)bias_data + 4); } - if (elempack == 4) - { - _bias0 = vld1q_f32((const float*)bias_data); - _bias1 = _bias0; - } } #endif // __ARM_NEON @@ -399,11 +369,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _scale_in0 = vld1q_f32((const float*)scale_in_data); _scale_in1 = vld1q_f32((const float*)scale_in_data + 4); } - if (elempack == 4) - { - _scale_in0 = vld1q_f32((const float*)scale_in_data); - _scale_in1 = _scale_in0; - } } #endif // __ARM_NEON @@ -418,11 +383,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _scale_out0 = vld1q_f32((const float*)scale_out_data); _scale_out1 = vld1q_f32((const float*)scale_out_data + 4); } - if (elempack == 4) - { - _scale_out0 = vld1q_f32((const float*)scale_out_data); - _scale_out1 = _scale_out0; - } } #endif // __ARM_NEON @@ -481,11 +441,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _bias0 = vld1q_f32((const float*)bias_data); _bias1 = vld1q_f32((const float*)bias_data + 4); } - if (elempack == 4) - { - _bias0 = vld1q_f32((const float*)bias_data); - _bias1 = _bias0; - } } #endif // __ARM_NEON diff --git a/src/layer/loongarch/requantize_loongarch.cpp b/src/layer/loongarch/requantize_loongarch.cpp index 0085bf71785..4bc46f7b172 100644 --- a/src/layer/loongarch/requantize_loongarch.cpp +++ b/src/layer/loongarch/requantize_loongarch.cpp @@ -56,11 +56,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _scale_in0 = (__m128)__lsx_vld((const float*)scale_in_data, 0); _scale_in1 = (__m128)__lsx_vld((const float*)scale_in_data + 4, 0); } - if (elempack == 4) - { - _scale_in0 = (__m128)__lsx_vld((const float*)scale_in_data, 0); - _scale_in1 = _scale_in0; - } } #endif // __loongarch_sx @@ -75,11 +70,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _scale_out0 = (__m128)__lsx_vld((const float*)scale_out_data, 0); _scale_out1 = (__m128)__lsx_vld((const float*)scale_out_data + 4, 0); } - if (elempack == 4) - { - _scale_out0 = (__m128)__lsx_vld((const float*)scale_out_data, 0); - _scale_out1 = _scale_out0; - } } #endif // __loongarch_sx @@ -139,11 +129,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _bias0 = (__m128)__lsx_vld((const float*)bias_data, 0); _bias1 = (__m128)__lsx_vld((const float*)bias_data + 4, 0); } - if (elempack == 4) - { - _bias0 = (__m128)__lsx_vld((const float*)bias_data, 0); - _bias1 = _bias0; - } } #endif // __loongarch_sx @@ -216,11 +201,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _scale_in0 = (__m128)__lsx_vld((const float*)scale_in_data, 0); _scale_in1 = (__m128)__lsx_vld((const float*)scale_in_data + 4, 0); } - if (elempack == 4) - { - _scale_in0 = (__m128)__lsx_vld((const float*)scale_in_data, 0); - _scale_in1 = _scale_in0; - } } #endif // __loongarch_sx @@ -235,11 +215,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _scale_out0 = (__m128)__lsx_vld((const float*)scale_out_data, 0); _scale_out1 = (__m128)__lsx_vld((const float*)scale_out_data + 4, 0); } - if (elempack == 4) - { - _scale_out0 = (__m128)__lsx_vld((const float*)scale_out_data, 0); - _scale_out1 = _scale_out0; - } } #endif // __loongarch_sx @@ -300,11 +275,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _bias0 = (__m128)__lsx_vld((const float*)bias_data, 0); _bias1 = (__m128)__lsx_vld((const float*)bias_data + 4, 0); } - if (elempack == 4) - { - _bias0 = (__m128)__lsx_vld((const float*)bias_data, 0); - _bias1 = _bias0; - } } #endif // __loongarch_sx @@ -384,11 +354,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _scale_in0 = (__m128)__lsx_vld((const float*)scale_in_data, 0); _scale_in1 = (__m128)__lsx_vld((const float*)scale_in_data + 4, 0); } - if (elempack == 4) - { - _scale_in0 = (__m128)__lsx_vld((const float*)scale_in_data, 0); - _scale_in1 = _scale_in0; - } } #endif // __loongarch_sx @@ -403,11 +368,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _scale_out0 = (__m128)__lsx_vld((const float*)scale_out_data, 0); _scale_out1 = (__m128)__lsx_vld((const float*)scale_out_data + 4, 0); } - if (elempack == 4) - { - _scale_out0 = (__m128)__lsx_vld((const float*)scale_out_data, 0); - _scale_out1 = _scale_out0; - } } #endif // __loongarch_sx @@ -467,11 +427,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _bias0 = (__m128)__lsx_vld((const float*)bias_data, 0); _bias1 = (__m128)__lsx_vld((const float*)bias_data + 4, 0); } - if (elempack == 4) - { - _bias0 = (__m128)__lsx_vld((const float*)bias_data, 0); - _bias1 = _bias0; - } } #endif // __loongarch_sx diff --git a/src/layer/mips/requantize_mips.cpp b/src/layer/mips/requantize_mips.cpp index 374229fc54b..70b1fd6c551 100644 --- a/src/layer/mips/requantize_mips.cpp +++ b/src/layer/mips/requantize_mips.cpp @@ -56,11 +56,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _scale_in0 = (v4f32)__msa_ld_w((const float*)scale_in_data, 0); _scale_in1 = (v4f32)__msa_ld_w((const float*)scale_in_data + 4, 0); } - if (elempack == 4) - { - _scale_in0 = (v4f32)__msa_ld_w((const float*)scale_in_data, 0); - _scale_in1 = _scale_in0; - } } #endif // __mips_msa @@ -75,11 +70,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _scale_out0 = (v4f32)__msa_ld_w((const float*)scale_out_data, 0); _scale_out1 = (v4f32)__msa_ld_w((const float*)scale_out_data + 4, 0); } - if (elempack == 4) - { - _scale_out0 = (v4f32)__msa_ld_w((const float*)scale_out_data, 0); - _scale_out1 = _scale_out0; - } } #endif // __mips_msa @@ -139,11 +129,6 @@ static void requantize_relu(const int* intptr, signed char* ptr, const Mat& scal _bias0 = (v4f32)__msa_ld_w((const float*)bias_data, 0); _bias1 = (v4f32)__msa_ld_w((const float*)bias_data + 4, 0); } - if (elempack == 4) - { - _bias0 = (v4f32)__msa_ld_w((const float*)bias_data, 0); - _bias1 = _bias0; - } } #endif // __mips_msa @@ -216,11 +201,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _scale_in0 = (v4f32)__msa_ld_w((const float*)scale_in_data, 0); _scale_in1 = (v4f32)__msa_ld_w((const float*)scale_in_data + 4, 0); } - if (elempack == 4) - { - _scale_in0 = (v4f32)__msa_ld_w((const float*)scale_in_data, 0); - _scale_in1 = _scale_in0; - } } #endif // __mips_msa @@ -235,11 +215,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _scale_out0 = (v4f32)__msa_ld_w((const float*)scale_out_data, 0); _scale_out1 = (v4f32)__msa_ld_w((const float*)scale_out_data + 4, 0); } - if (elempack == 4) - { - _scale_out0 = (v4f32)__msa_ld_w((const float*)scale_out_data, 0); - _scale_out1 = _scale_out0; - } } #endif // __mips_msa @@ -300,11 +275,6 @@ static void requantize_leakyrelu(const int* intptr, signed char* ptr, const Mat& _bias0 = (v4f32)__msa_ld_w((const float*)bias_data, 0); _bias1 = (v4f32)__msa_ld_w((const float*)bias_data + 4, 0); } - if (elempack == 4) - { - _bias0 = (v4f32)__msa_ld_w((const float*)bias_data, 0); - _bias1 = _bias0; - } } #endif // __mips_msa @@ -384,11 +354,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _scale_in0 = (v4f32)__msa_ld_w((const float*)scale_in_data, 0); _scale_in1 = (v4f32)__msa_ld_w((const float*)scale_in_data + 4, 0); } - if (elempack == 4) - { - _scale_in0 = (v4f32)__msa_ld_w((const float*)scale_in_data, 0); - _scale_in1 = _scale_in0; - } } #endif // __mips_msa @@ -403,11 +368,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _scale_out0 = (v4f32)__msa_ld_w((const float*)scale_out_data, 0); _scale_out1 = (v4f32)__msa_ld_w((const float*)scale_out_data + 4, 0); } - if (elempack == 4) - { - _scale_out0 = (v4f32)__msa_ld_w((const float*)scale_out_data, 0); - _scale_out1 = _scale_out0; - } } #endif // __mips_msa @@ -467,11 +427,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ _bias0 = (v4f32)__msa_ld_w((const float*)bias_data, 0); _bias1 = (v4f32)__msa_ld_w((const float*)bias_data + 4, 0); } - if (elempack == 4) - { - _bias0 = (v4f32)__msa_ld_w((const float*)bias_data, 0); - _bias1 = _bias0; - } } #endif // __mips_msa diff --git a/src/layer/x86/requantize_x86.cpp b/src/layer/x86/requantize_x86.cpp index 6b64f86967d..8b744958b48 100644 --- a/src/layer/x86/requantize_x86.cpp +++ b/src/layer/x86/requantize_x86.cpp @@ -71,18 +71,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ #else // __AVX__ _scale_in0 = _mm_loadu_ps((const float*)scale_in_data); _scale_in1 = _mm_loadu_ps((const float*)scale_in_data + 4); -#endif // __AVX__ - } - if (elempack == 4) - { - _scale_in0 = _mm_loadu_ps((const float*)scale_in_data); -#if __AVX__ - _scale_in_avx = combine4x2_ps(_scale_in0, _scale_in0); -#if __AVX512F__ - _scale_in_avx512 = combine8x2_ps(_scale_in_avx, _scale_in_avx); -#endif // __AVX512F__ -#else // __AVX__ - _scale_in1 = _scale_in0; #endif // __AVX__ } } @@ -117,18 +105,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ #else // __AVX__ _scale_out0 = _mm_loadu_ps((const float*)scale_out_data); _scale_out1 = _mm_loadu_ps((const float*)scale_out_data + 4); -#endif // __AVX__ - } - if (elempack == 4) - { - _scale_out0 = _mm_loadu_ps((const float*)scale_out_data); -#if __AVX__ - _scale_out_avx = combine4x2_ps(_scale_out0, _scale_out0); -#if __AVX512F__ - _scale_out_avx512 = combine8x2_ps(_scale_out_avx, _scale_out_avx); -#endif // __AVX512F__ -#else // __AVX__ - _scale_out1 = _scale_out0; #endif // __AVX__ } } @@ -239,18 +215,6 @@ static void requantize(const int* intptr, signed char* ptr, const Mat& scale_in_ #else // __AVX__ _bias0 = _mm_loadu_ps((const float*)bias_data); _bias1 = _mm_loadu_ps((const float*)bias_data + 4); -#endif // __AVX__ - } - if (elempack == 4) - { - _bias0 = _mm_loadu_ps((const float*)bias_data); -#if __AVX__ - _bias_avx = combine4x2_ps(_bias0, _bias0); -#if __AVX512F__ - _bias_avx512 = combine8x2_ps(_bias_avx, _bias_avx); -#endif // __AVX512F__ -#else // __AVX__ - _bias1 = _bias0; #endif // __AVX__ } }