fma - 前端之家

AVX2：计算512个浮点数组的点积

首先，我将是SIMD内部函数的完整入门者。从本质上讲，我有一个支持AVX2内部（<code>Intel(R) Core(TM)

前端之家
2022-08-04 • 问答
将FMA指令用于FFT算法

我有一些C ++代码，随着时间的流逝，它已经变成了一些有用的FFT库，并且使用SSE和AVX指令使其运行得相

前端之家
2022-07-14 • 问答
将融合乘法累加用于双精度有何优势？

我试图通过查看生成的汇编代码来了解使用带有双参数的<em> std :: fma </em>是否有利，我正在使用标志“ -

前端之家
2022-06-23 • 问答
如何在LLVM RISCV后端中启用FMA

是否提供外部选项以在LLVM RISCV后端中生成fma指令？

前端之家
2022-06-08 • 问答
如何执行通过Burt方法（在R中）执行MCA的MFA？

我正在尝试通过<code>FMA()</code>软件包中的<code>FactoMineR</code>运行MFA。我有4组数据，其中三组是分类的，

前端之家
2022-05-28 • 问答
如何在gcc中禁用fma3指令

我需要为64位系统禁用FMA3指令（用于向后兼容问题）。我在Windows环境中使用了<code>_set_FMA3_enable(0)</code>

前端之家
2022-05-23 • 问答
对FMA操作进行更激进的优化

我想构建一个数据类型，该数据类型表示多种（例如<code>N</code>）算术类型，并使用运算符重载提供与算

前端之家
2022-05-19 • 问答
为 Cascade-Lake 处理器编译时 GCC 包含 AVX512 的“融合乘加”指令

根据 <a href="https://gcc.gnu.org/onlinedocs/gcc/x86-Options.html" rel="nofollow noreferrer">gcc's documention</a>，使用“-marc

前端之家
2022-05-03 • 问答
如何在支持 FMA 的 GPU 上优化浮点除法？

当使用 API 为 GPU 编写计算代码时，计算着色器通过 SPIR-V（特别是 Vulkan）转换，我保证浮点除法的 ULP 误

前端之家
2022-05-02 • 问答
从类型“int”分配给类型“__m256d”时不兼容的类型

我正在做一个优化矩阵乘法的项目，我正在尝试使用内在函数。这是我正在使用的一些代码： <

前端之家
2022-05-01 • 问答
没有显式内在函数的 CUDA 半浮点运算

我使用的是 CUDA 11.2，我使用 <code>__half</code> 类型对 16 位浮点值进行运算。我很惊讶 nvcc 编译器在

前端之家
2022-05-01 • 问答
如何在 GPU 上按常数找到除法的魔法乘数？

我正在考虑实现以下计算，其中 <code>divisor</code> 是非零且不是 2 的幂 <pre class="lang-c prettyprint-override">

前端之家
2022-04-28 • 问答