高通 888 用的全新大核心,也就是 ARM 的新设计超大核,听说 NEON 部分是 4x128bit 。
另外 Apple 的 M1 ,好像也是这个设计模式。(题外,难道就是因为宽度不够 256 所以 M1 不支持 AVX 模拟?)
而现在 x86 和龙芯,都是 2 个设计,Intel 是 2 个全功能 256/512 的 FPU ,龙芯我记得说是 2x256bit 的 FPU 单元。即便是 AMD 的 4 个设计,也是 2+2 并不是 4 个全能。
这两个总宽度一样,但是 4 个 1 和 2 个 2 ,比较起来区别有多少?
是不是因为 ARM 要考虑兼容 128bit 的旧 NEON ,所以没有拓宽,而是增数,从而保证计算单元的性能满载比例?
另外 Apple 的 M1 ,好像也是这个设计模式。(题外,难道就是因为宽度不够 256 所以 M1 不支持 AVX 模拟?)
而现在 x86 和龙芯,都是 2 个设计,Intel 是 2 个全功能 256/512 的 FPU ,龙芯我记得说是 2x256bit 的 FPU 单元。即便是 AMD 的 4 个设计,也是 2+2 并不是 4 个全能。
这两个总宽度一样,但是 4 个 1 和 2 个 2 ,比较起来区别有多少?
是不是因为 ARM 要考虑兼容 128bit 的旧 NEON ,所以没有拓宽,而是增数,从而保证计算单元的性能满载比例?