图拉丁吧 关注:7,240,964贴子:124,539,897
  • 1回复贴,共1

小议intel核心显卡的绣花枕头

取消只看楼主收藏回复

6个vertex shader,1个ROP,根据这样的硬件配置,它着重在于3D多边形的计算,而轻光源特效。
1。intel的CPU先计算好polygon顶点,此时是线框画面
2。然后交给
vertex shader去填色/纹理贴图并显示出渐变的色度幻化
3。最后交给ROP做AA抗锯齿,并且运算烟雾/粒子/阴影特效。
由此,我们可以发现1-2intel可以很好的胜任,最后第3步却拙荆见肘了,原因是配置了很少的ROP。ATI用独立的流处理器分别担当
vertex shader与ROP(或许可灵活分配比例),NV把1个vertex shader+4个ROP固定化设计成一个显示核心。intel的做法类似NV,但却不邦定在一起,并行处理能力最弱,还是DX9时代以前的串行管线的GPU架构,只是vertex shader上改进到DX10的门槛。 intel的运算顶点与光源渲染是独立的,有先后的,所以intel的核显在游戏中上下浮动的最明显,有些游戏polygon数量多,但光源特效少,intel能跑的比较好;如果光源特效一多,就完全不行。即使同一个游戏,不同场景下差异也比ATI/NV要大许多(相同档次的集成IGP比较)。其表现为最低帧数低,平均帧数不稳定。
但intel的核显是对于一些3D测试工具是友好的,因为这些工具只测试到以上说的1-2步骤,由于3步骤对硬件的兼容性要求高,而且不同的显卡在不同架构下测试的分数差异很明显,不具有评分的准确性,比如专业卡重3步骤,但跑步骤3可能分数还不如民用卡,因为专业卡要求精确渲染,不同的处理导致了评分的不公证性。所以这些显示测试软件一般只做到1-2步骤。于是,intel这种核显在跑分上就可以滥竽充数了



1楼2013-01-08 15:07回复
    更正一下,一般vertex shader :ROP = 4:1
    这个是有科学依据的,因为一个最简立体几何图形,就是一个三角锥,有4个顶点。所以同时运算一个4个顶点的最简多边形(polygon)加光影渲染为一个完整流程单元。
    Nvidia有些卡配置成6:1,在某些游戏中构建6面体的时候有很好的表现。多边形充裕。一个6面体可以由4个4面体合成,所以某些时候,通过把4个4面体分成一组运算的方式可以节约很大的运算量。但通用性变差。
    N卡所以说驱动写的好,优化的好。而A卡通用性更强,资源分配灵活,D3D下利用率高。N卡走的OPGL标准,A卡完全遵循D3D标准
    


    13楼2013-01-08 20:52
    收起回复