sse2 - 前端之家

使用AVX2和SSE2进行位向量运算

我是AVX2和SSE2指令集的新手，我想学习更多有关如何使用此类指令集来加速位向量运算的信息。到

前端之家
2022-08-16 • 问答
为什么AVX2和SSE2的按位OR运算符没有比简单的运算符快？操作员？

我正在尝试使用32位整数对非常长的二进制向量进行按位或运算。在此示例中，我们可以假设 n

前端之家
2022-08-15 • 问答
在WMWare Workstation 15播放器上模拟SSE2可用而AVX2不可用

我想创建一个可以在其中进行设置的虚拟机： <ul> <li>支持SSE2 </li> <li>不支持AVX2 </li> </ul> 我已经

前端之家
2022-08-08 • 问答
BGRA缓冲液到AYUV的最佳转化

我有一个BGRA缓冲区，需要将其转换为AYUV格式。以下功能正常运行，但是效率很低。我知道我可以通过将

前端之家
2022-07-14 • 问答
将XMM寄存器设置为重复字节模式（广播一个恒定字节）

我知道我们可以执行以下操作将字符移动到xmm寄存器： <pre><code>movaps xmm1, xword [.__0x20] align 16 .__0x20 d

前端之家
2022-07-13 • 问答
如何随机播放Vector128 <T>并添加元素，然后正确提取标量值？

我在 C＃中使用<code>Vector128<byte></code>来计算具有16个索引的字节数组中的匹配项。 <

前端之家
2022-07-07 • 问答
Can_mm_store_si128 / _mm_load_si128内部函数可用于实现128位原子类型吗？

如果我想在x64上实现128位原子类型，可以使用<code>_mm_store_si128</code>和<code>_mm_load_si128</code>来避免<code>cmpx

前端之家
2022-07-07 • 问答
如何比较2个XMM寄存器（SSE）并测试是否相等以退出循环？

使用汇编指令后： pcmpeqd xmm2，xmm7 resgister xmm2 = 00000000 00000000 FFFFFFFF 00000000的结果结

前端之家
2022-06-29 • 问答
使用AVX2向左移动（float32数组）并填充零

一段时间以来，我一直在SSE2的C代码中使用以下“技巧”进行单精度浮点运算： <pre class="lang-c prettypr

前端之家
2022-06-28 • 问答
SSE2指令（例如orpd）有什么意义？

<code>orpd</code>指令是“压缩双精度浮点值的按位逻辑或”。这是否与<code>por</code>（“按位逻辑OR”）完

前端之家
2022-06-26 • 问答
测试xmm寄存器中的任何字节是否为0

我目前正在自学SIMD，并且正在编写一个相当简单的String处理子例程。但是，我只能使用SSE2 

前端之家
2022-06-21 • 问答
如何从__m128i复制X字节或位到标准内存

我有一个循环，它通过<code>_mm_add_epi16()</code>将两个数组中的int16加在一起。有一个小数组和一个大数组

前端之家
2022-05-28 • 问答
您将如何优化此矢量化的谐波和？

我正在使用向量化（仅SSE2 max作为SIMD）将一束谐波相加在一起，每个谐波具有不同的相位/幅度。

前端之家
2022-05-23 • 问答
在SSE2上如何签名32位加宽乘法？

在审查WebAssembly SIMD扩展扩展提案时出现了这个问题。要支持较旧的硬件，我们需要支持SSE2，并且3

前端之家
2022-05-22 • 问答
在 SSE2 上进行无符号 64 位比较的最有效方法是什么？

PCMPGTQ 在 SSE2 上不存在，也不适用于无符号整数。我们的目标是为无符号 64 位比较提供向后兼容的解决

前端之家
2022-05-02 • 问答
x86 程序集中的 SSE2 寄存器

我有以下代码： <pre><code>from turtle import Screen, Turtle import random FONT = ('Arial', 18, 'bold') runs=Fa

前端之家
2022-05-02 • 问答
使用 SSE2 内在存储或提取标量 int 结果的更好方法

我想知道在使用 SSE2 时如何有效地加载和存储变量。在此示例中，我想将 <code>pclmulqdq</code> 指令（

前端之家
2022-04-30 • 问答
如何最好地模拟 _mm_slli_si128（128 位位移）的逻辑含义，而不是 _mm_bslli_si128 bslli / bsrli 是相同 asm 指令的新的、更清晰的内部名称

翻阅 intel 内在指南，我看到了这个指令。查看命名模式，含义应该很清楚：“将 128 位寄存器左移固定

前端之家
2022-04-28 • 问答
非 SSE2 CPU 上 SSE2 movq 指令的快速解决方法

我如何将 <code>movq</code> SSE2 指令转换为一个简单的代码片段，然后我可以将其修补到包含的原始 EXE 中？

前端之家
2022-04-27 • 问答
使用函数 _mm_clflush 刷新大型结构的正确方法循环遍历任意大小未对齐结构的每个缓存行

我开始使用 <code>_mm_clflush</code>、<code>_mm_clflushopt</code> 和 <code>_mm_clwb</code> 等函数。现在说，因为

前端之家
2022-04-26 • 问答
_mm_load_si128 以相反的顺序加载数据

我正在编写一个带有 SSE2 内在函数的 C 函数，主要是比较 4 个 32 位整数并检查哪些整数大于零，并以 16

前端之家
2022-04-25 • 问答
_mm_stream_si128 比 _mm_store_si128 慢 2000%

我正在编写一些 C 代码来制作随机数生成器，并使用了以下代码： <pre><code>// header typedef struct { uin

前端之家
2022-04-24 • 问答
如何在只有 SSE2 的 m128i 中的某个索引处设置 int32 值？

是否有可以在 m128i 内设置单个 int32 值的 SSE2 内在函数？例如在已经包含 1,2,3,4 的 m128i 上在索引 1

前端之家
2022-04-21 • 问答