@@ -462,9 +462,8 @@ define <8 x double> @load_v8f64_v8i16(<8 x i16> %trigger, <8 x double>* %addr, <
462
462
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
463
463
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm3, %xmm3
464
464
; AVX1-NEXT: vpmovsxwq %xmm3, %xmm5
465
- ; AVX1-NEXT: vpmovsxwd %xmm3, %xmm3
466
- ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[2,3,2,3]
467
- ; AVX1-NEXT: vpmovsxdq %xmm3, %xmm3
465
+ ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[1,1,1,1]
466
+ ; AVX1-NEXT: vpmovsxwq %xmm3, %xmm3
468
467
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
469
468
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm0, %xmm0
470
469
; AVX1-NEXT: vpmovsxwq %xmm0, %xmm4
@@ -482,8 +481,7 @@ define <8 x double> @load_v8f64_v8i16(<8 x i16> %trigger, <8 x double>* %addr, <
482
481
; AVX2-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[2,3,2,3]
483
482
; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
484
483
; AVX2-NEXT: vpcmpeqw %xmm4, %xmm3, %xmm3
485
- ; AVX2-NEXT: vpmovsxwd %xmm3, %xmm3
486
- ; AVX2-NEXT: vpmovsxdq %xmm3, %ymm3
484
+ ; AVX2-NEXT: vpmovsxwq %xmm3, %ymm3
487
485
; AVX2-NEXT: vpcmpeqw %xmm4, %xmm0, %xmm0
488
486
; AVX2-NEXT: vpmovsxwq %xmm0, %ymm0
489
487
; AVX2-NEXT: vmaskmovpd (%rdi), %ymm0, %ymm4
@@ -1782,9 +1780,8 @@ define <8 x i64> @load_v8i64_v8i16(<8 x i16> %trigger, <8 x i64>* %addr, <8 x i6
1782
1780
; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
1783
1781
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm3, %xmm3
1784
1782
; AVX1-NEXT: vpmovsxwq %xmm3, %xmm5
1785
- ; AVX1-NEXT: vpmovsxwd %xmm3, %xmm3
1786
- ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[2,3,2,3]
1787
- ; AVX1-NEXT: vpmovsxdq %xmm3, %xmm3
1783
+ ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[1,1,1,1]
1784
+ ; AVX1-NEXT: vpmovsxwq %xmm3, %xmm3
1788
1785
; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm5, %ymm3
1789
1786
; AVX1-NEXT: vpcmpeqw %xmm4, %xmm0, %xmm0
1790
1787
; AVX1-NEXT: vpmovsxwq %xmm0, %xmm4
@@ -1802,8 +1799,7 @@ define <8 x i64> @load_v8i64_v8i16(<8 x i16> %trigger, <8 x i64>* %addr, <8 x i6
1802
1799
; AVX2-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[2,3,2,3]
1803
1800
; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
1804
1801
; AVX2-NEXT: vpcmpeqw %xmm4, %xmm3, %xmm3
1805
- ; AVX2-NEXT: vpmovsxwd %xmm3, %xmm3
1806
- ; AVX2-NEXT: vpmovsxdq %xmm3, %ymm3
1802
+ ; AVX2-NEXT: vpmovsxwq %xmm3, %ymm3
1807
1803
; AVX2-NEXT: vpcmpeqw %xmm4, %xmm0, %xmm0
1808
1804
; AVX2-NEXT: vpmovsxwq %xmm0, %ymm0
1809
1805
; AVX2-NEXT: vpmaskmovq (%rdi), %ymm0, %ymm4
0 commit comments