网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
09月24日
漏签
0
天
nvidia吧
关注:
147,233
贴子:
1,194,786
看贴
图片
吧主推荐
视频
游戏
9
回复贴,共
1
页
<<返回nvidia吧
>0< 加载中...
原来安培的FP16性能并不是FP32的双倍
只看楼主
收藏
回复
ft5555
融会贯通
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
白皮书讲的跟图灵一样,是纯FP32 ALU的2倍性能。。。
所以3070的FP16性能肯定会被2080TI甩开了。。。。
切笱且吃鸡
一代宗师
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
建议再去看白皮书,这一代tensor用的稀疏矩阵,一半的tensor core效能可以达到之前的两倍
yzmbslc
不堪一击
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
dlss2.0用的是tensor core的fp16,cuda core的fp16基本只用于vrs,但是在安培fp32超高的情况下,vrs的提升就很小了。
爱问西瓜爱答树
不堪一击
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
安培架构的SM的fp16跟fp32是1:1。图灵是2:1;安培fp64跟fp32比是1:64,图灵是1:32。主要是安培的Shading Units直接翻倍,fp32提高明显。今天AMD发布的rx6000,支持光追也有rt core。晶体管数量翻倍,CU直接翻倍,功耗还不错。
爱问西瓜爱答树
不堪一击
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
不过fp16在图形计算上的取决于游戏开发者跟引擎。一般来说,fp16对于颜色空间sRGB,hdr都够用。3d坐标都是用fp32。ai方面,nv有tensor core。amd只能用fp16。不过amd的fp64好,在挖矿,科学计算,物理模拟会有优势。
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示