amd吧 关注:759,947贴子:17,434,634

安培架构存在缺陷 1/3流处理器就是摆设 我明白3080为什么低能了

只看楼主收藏回复


之前看3080流处理器是2080ti 2倍 但实际性能只好25% 想不通为什么这样低能 看了这个视频就明白了
原来fp32和int32不能并行 跑int32的时候 1/3的fp32就是废的 我这里说不清楚
大家可以去看看视频 b站 BV1QA411E7MP 或者搜索 真香预警!万字文案深度测试RTX3080!
有动画讲解很清楚
看来3080架构缺陷很明显 要被big navi吊打了


1楼2020-09-22 12:42回复
    等等看


    IP属地:四川来自Android客户端2楼2020-09-22 13:06
    回复
      等a卡发布。


      IP属地:重庆来自Android客户端4楼2020-09-22 13:08
      回复
        火星救援


        IP属地:浙江来自Android客户端6楼2020-09-22 13:09
        回复
          不是他这个不是实际情况现在已经披露出来了,就是两组fp32。其中一组是fp32与int32异步通用。所以浮点与整数之间只能二选一。


          IP属地:浙江来自Android客户端8楼2020-09-22 14:02
          回复
            似曾相识的历史,n500流处理器打a1500流处理器


            IP属地:广西来自Android客户端9楼2020-09-22 14:51
            收起回复
              这不算缺陷啊,这是充分利用闲置算力。英伟达肯定是经过一系列测试后发现INT32的工作量并没有那么高,才决定将INT32改成INT32/FP32并存(视频里第8分钟的时候也说了很多INT32单元没工作,看视频认真点)。


              IP属地:湖北来自Android客户端10楼2020-09-22 14:55
              收起回复
                A卡至今都还是浮点整数混用的吧?


                IP属地:浙江来自Android客户端11楼2020-09-22 15:06
                收起回复
                  这应该不算缺陷吧,只是构架还不够完善。当然,或许老黄觉得很完美~


                  IP属地:浙江12楼2020-09-22 15:29
                  回复
                    恰恰相反
                    10系,全都是int32+fp32混合,效能低,fp比int计算复杂
                    20系,int32、fp32分离1比1,int32浪费,有的游戏int32占比很小
                    30系,fp32 + (int32+fp32混合),折中一下,比上面更平衡
                    说30系效率降低,那是没算20系的int32部分
                    假设游戏60% int32计算
                    30系 1+1混合 = 1.25浮点+0.75整数
                    20系 1+1分离 = 1.0浮点+0.75整数
                    假设游戏40% int32计算
                    30系 1+1混合 = 1.425浮点+0.57整数
                    20系 1+1分离 = 1.0浮点+0.4整数
                    如果游戏20% int32计算
                    30系 1+1混合 = 1.67浮点+0.33整数
                    20系 1+1分离 = 1.0浮点+0.2整数


                    IP属地:河南14楼2020-09-22 15:50
                    收起回复
                      之前有两种方案,一个是以可以计算FP32的单元作为一个CUDA,这样算的话RTX3080拥有8704个FP32(CUDA Cores)。还有一种算法就是将能实现完整(INT32+FP32+FP16)混合精度计算的最小单元作为一个CUDA,这样算的话RTX3080是4352 CUDA


                      IP属地:四川来自iPhone客户端17楼2020-09-22 20:27
                      回复
                        结果就是跑FP32性能爆炸,30T的算力;实际游戏就完全不是这么回事


                        IP属地:四川来自iPhone客户端18楼2020-09-22 20:29
                        回复
                          是2080ti25%?


                          IP属地:广东来自iPhone客户端19楼2020-09-22 20:33
                          回复