根据 gcc's documention,使用“-march=cascadelake”编译不会启用标志 -AVX512Ifma(如果我理解正确,它会启用对 AVX512 的 fma 指令的支持)。相比之下,例如在使用“-march=cannonlake”和“-march=tigerlake”进行编译时会包含此标志。
然而,根据英特尔的说法,Cascade-Lake 的处理器实际上每个包含 2 个 AVX-512 fma 单元(这是一个 example,据我所知,对于任何 Cascade-Lake 处理器都是如此)。
任何人都可以澄清这种行为吗?我是否误解了 AVX512Ifma 标志的含义?