intel吧 关注:741,037贴子:2,903,908

今晚看了一下a站的测试,探索了一下SPECint2017的多核倍率问题

只看楼主收藏回复

SPECrate2017 int的跑分,多copy非常吃内存带宽。换句话说其实就是在跑内存带宽。但是我印象中桌面端貌似没这么差,于是我连夜验证了一下各子项的倍率。


IP属地:广东1楼2021-10-26 03:01回复
    处理器:AMD Ryzen 7 3700X 锁全核4.1G
    操作系统: Fedora 34
    内存频率:双通道3200 C16
    编译器:gcc11
    编译选项: -g -Ofast -march=znver2 -ljemalloc


    IP属地:广东2楼2021-10-26 03:04
    收起回复


      IP属地:广东3楼2021-10-26 03:04
      回复
        3楼的图里的数字就是多核倍率,Fedora操作系统天天自动更新,有一次更新之后单copy的520就跑不了了,多copy的503和520均报错。只能分析剩下八项的了
        可以见到除了505和523,其他的6项多核倍率全都超过8,最高的一个是541,围棋。SMT效率40%。505和523都是内存瓶颈。
        我的内存比较差。3200 C16,我知道贴吧很多藏龙卧虎,内存3600起步。4266随意超。将就看就好了。
        A站的神奇跑分不是一回两回了。爱上WSL,死不悔改系列


        IP属地:广东4楼2021-10-26 03:10
        收起回复
          补充一下,单copy的503是7.78,520是真的不行。起初以为是文件损坏。重新安装之后也是跑不了。估计gcc脑子抽了不知道更新了啥。能跑的时候是4.48。


          IP属地:广东5楼2021-10-26 03:14
          回复
            SPEC的多核对带宽非常敏感。但SMT可以抵消带宽损失同时桌面系统可以超内存。不在意延迟的话11代可以Gear 2 5000+。现在看来唯一的一个多核倍率有问题的跑分就是Geekbench 5了。


            IP属地:广东6楼2021-10-26 03:23
            回复
              anandtech测12900k目测总分不会高于7.6,5.2G和m1m一个水平


              IP属地:上海7楼2021-10-26 08:16
              回复
                GCC大家都提呗,用clang 不就知道了


                IP属地:广西来自iPhone客户端8楼2021-10-26 08:25
                收起回复
                  这跑分槽点特别多。除了多核倍率,还有11980HK,65瓦比45瓦高8%。仿佛11980HK只要49瓦就满血。而且这次明显受到内存分配器影响,导致对比的问题非常大。不过这点他们自己也提及了。525太明显了。


                  IP属地:广东来自iPhone客户端9楼2021-10-26 10:08
                  回复
                    我就很奇怪,为什么一个SPEC多copy一个跑内存带宽的测试会吃编译选项。我自己实测3700X Clang12和gcc11.1的差距只有4%,clang的perlbench低,x264低,但xalancbmk和xz都高。互有胜负而已。在intel这边,intel官方已经做对比了。


                    IP属地:广东来自Android客户端10楼2021-10-26 16:13
                    收起回复


                      IP属地:广东来自Android客户端11楼2021-10-26 16:34
                      回复
                        晚上又测了一下,Clang 12单copy可以全部跑完,包括gcc11.1挂掉的520。3700X锁4.1G是6.07,去掉520是6.28,和gcc11.1相差4%,和gcc10.2效率相当,Clang 12的多核只有37.8分,远低于gcc11.1,经观察。发现8个核心里有3个掉到了2.2GHz。也就是有6个copy跑在2.2G的核心上。gcc11.1没有这个问题。怀疑是Clang 12的bug。


                        IP属地:广东来自Android客户端12楼2021-10-26 20:06
                        收起回复
                          这么测下来 505和502项目不还是跟M1 max差距巨大么


                          IP属地:内蒙古13楼2021-10-26 21:53
                          收起回复
                            >> 换句话说其实就是在跑内存带宽
                            哪有那么简单的事情,cpu和gpu都不能覆盖延迟


                            IP属地:上海14楼2021-10-27 01:05
                            收起回复
                              这个很好理解啊,即便是icc也没法把Cinebench优化到一个比较高的水平啊。这是3.2G的Xeon Sliver 4210的单核526.blender成绩,跟Cinebench一样基于Embree。顺便说一下,PCMag测试了M1X的blender BMW27。3分18秒。也就那样而已。


                              IP属地:广东来自Android客户端15楼2021-10-27 23:57
                              回复