09月24日漏签0天

nvidia吧关注：147,233贴子：1,194,786

9回复贴，共1页

<<返回nvidia吧

原来安培的FP16性能并不是FP32的双倍

白皮书讲的跟图灵一样，是纯FP32 ALU的2倍性能。。。
所以3070的FP16性能肯定会被2080TI甩开了。。。。

建议再去看白皮书，这一代tensor用的稀疏矩阵，一半的tensor core效能可以达到之前的两倍

dlss2.0用的是tensor core的fp16，cuda core的fp16基本只用于vrs，但是在安培fp32超高的情况下，vrs的提升就很小了。

安培架构的SM的fp16跟fp32是1:1。图灵是2:1；安培fp64跟fp32比是1:64，图灵是1:32。主要是安培的Shading Units直接翻倍，fp32提高明显。今天AMD发布的rx6000，支持光追也有rt core。晶体管数量翻倍，CU直接翻倍，功耗还不错。

不过fp16在图形计算上的取决于游戏开发者跟引擎。一般来说，fp16对于颜色空间sRGB，hdr都够用。3d坐标都是用fp32。ai方面，nv有tensor core。amd只能用fp16。不过amd的fp64好，在挖矿，科学计算，物理模拟会有优势。

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

9回复贴，共1页

<<返回nvidia吧

分享到: