本帖最后由 牵着蜗牛流浪 于 2011-7-24 20:44 编辑
关于显卡的性能参数,有许多硬件检测软件可以对显卡的硬件信息进行详细的检测,比如:Everest,GPU-Z,GPU-Shark等。这里我们以玩家最常用的GPU-Z软件来作为本文解析显卡性能参数的示例软件。
GTX590的GPU-Z截图
首先我们对GPU-Z这款软件的界面进行一个大致分区的解读,从上至下共8个分区,其中每个分区的具体含义是:
①显卡名称部分: 名称/Name:此处显示的是显卡的名称,也就是显卡型号。 ②显示芯片型号部分: 核心代号/GPU:此处显示GPU芯片的代号,如上图所示的:GF110、Antilles等。
修订版本/Revision:此处显示GPU芯片的步进制程编号。
制造工艺/Technology:此处显示GPU芯片的制程工艺,如55nm、40nm等。
核心面积/Die Size:此处显示GPU芯片的核心尺寸。 ③显卡的硬件信息部分: BIOS版本/BIOS Version:此处显示显卡BIOS的版本号。
设备ID/Device ID:此处显示设备的ID码。
制造厂商/Subvendor:此处显示该显卡OEM制造厂商的名称。 ④显示芯片参数部分: 光栅操作单元/ROPs:此处显示GPU拥有的ROP光栅操作处理单元的数量。
总线接口/Bus Interface:此处显示显卡和主板北桥芯片之间的总线接口类型以及接口速度。
着色单元/Shaders:此处显示GPU拥有的着色器的数量。
DirectX版本/DirectX Support:此处显示GPU所支持的DirectX版本。
像素填充率/Pixel Fillrate:此处显示GPU的像素填充率。
纹理填充率/Texture Fillrate:此处显示GPU的纹理填充率。 ⑤显存信息部分: 显存类型/Memory Type:此处显示显卡所采用的显存类型,如:GDDR3、GDDR5等。
显存位宽/Bus Width:此处显示GPU与显存之间连接的带宽。
显存容量/Memory Size:此处显示显卡板载的物理显存容量。
显存带宽/Bandwidth:此处显示GPU-Z与显存之间的数据传输速度。 ⑥驱动部分: 驱动程序版本/Driver Version:此处为系统内当前使用的显卡驱动的版本号。 ⑦显卡频率部分: 核心频率/GPU Clock:显示GPU当前的运行频率。
内存/Memory:显示显存当前的运行频率。
Shader/Shader:显示着色单元当前的运行频率。
默认核心频率/Default Clock:显示GPU默认的运行频率。
(默认)内存/Memory:显示显存默认的运行频率。
(默认)Shader/Shader:显示着色单元默认的运行频率。 ⑧交火和运算能力部分: NVIDIASLI或ATICrossfire:显示是否开启SLI或者Crossfire多显卡交火。
运算能力:显示是否具备OpenCL、CUDA、PhysX和DirectCompute 5.0运算能力。
下面我们就重点为大将对显卡的性能参数做一个详尽的讲解,最后终结出哪些性能参数最能影响的显卡性能,以及我们消费者在实际购买显卡时应该从哪方面去思考,以及怎么依靠显卡性能参数来对显卡进行大致的判断和比较。我们希望菜鸟读完本文能够对显卡有个大致的“轮廓”,老鸟读完本文能够对显卡的核心性能参数有个更深入的认识。
显卡名称、芯片型号以及硬件信息
消费者在购买显卡的时候首先应该明确的就是我该购买的显卡的型号(名称)是什么,也就是GPU-Z中的Name所示的参数信息,例如本例中的“GTX590”。
显卡GPU-Z截图中关于显卡名称、芯片型号和硬件信息的部分
而通过显卡芯片型号的解读,我们又可以对显卡核心GPU的信息作进一步的了解。从GPU这一项我们能够得知显卡核心的GPU研发代号。GPU的代号一般来说往往是与显卡型号名称相对应,举例来说:
GF110 对应:NVIDIAGeForce GTX590
GF100 对应: NVIDIA GeForceGTX480 Antilles 对应:Radeon HD 6990
RV870 对应:Radeon HD 5970
当然也有一个GPU代号对应多个显卡型号名称的,而这些往往是JS忽悠小白的地方。例如:
基于GF104核心的显卡同时有NVIDIA GeForce GTX 460 (768MB)、NVIDIA GeForce GTX 460 (1024MB)和NVIDIA GeForce GTX 460SE共三款产品,如果消费者对这些显卡不大熟悉的话,很容量被商家所误导而购买被“换型”的显卡产品。
同型号的三款GTX460的不同区别
从上面的对比图中我们可以很清楚的看到768MB和1024MB版的GTX460主要在显存容量和显存带宽上有很大区别,而GTX460SE的区别主要在于CUDA处理器缩减至了288个。
有同一GPU代号对应多款显卡型号,自然也有同个显卡型号对应多个GPU代号,如:RadeonHD5670。
HD5670的两种版本
从上图我们可以看到两者的区别主要在于核心GPU、流处理器数量以及核心面积,虽然同为HD5670,但是640SP的HD5670性能已经几乎接近HD5750的程度。
通过上面的总结得知,我们玩家在选购显卡的时候一定要弄明白自己所要购买的显卡型号和显卡GPU核心代号具体是什么,购买的时候最好当场对显卡进行简单的上机测试,用GPU-Z等相关测试软件看下显卡的硬件信息是否有异常情况,这样玩家就可以尽可能的降低上当受骗的几率。
显卡芯片参数解析:悟透ROPs
这一部分是我们所要重点解读的内容,因为不少初玩显卡的朋友或者老玩家对这些性能参数的都不是特别清晰,下面就让我们来一起进行详尽的解读。
显卡芯片参数部分
首先一个重要的概念就是ROPs(Raster Operations Units),即光栅化处理单元,表示显示GPU拥有的ROP光栅操作处理单元的数量。通常来说:3D图形处理可以分成四个主要步骤,几何处理、设置、纹理和光栅处理,而ROPs就是处理光栅单元。那么光栅化处理单元的多少对显卡性能有哪些影响了?
ROPs架构图
ROPs(光栅化处理单元)主要负责游戏中的光线和反射运算,兼顾AA、高分辨率、烟雾、火焰等效果。游戏里的AA(抗锯齿)和光影效果越厉害,对ROPs(光栅化处理单元)的性能要求也就越高,否则就可能导致游戏帧数急剧下降.比如同样是某个游戏的最高画质效果,8个光栅单元的显卡可能只能跑25帧.而16个光栅单元的显卡则可以稳定在35帧以上。举一个例子:GTX550Ti和HD6790前者是24个ROPs单元,后者是16个ROPs单元,虽然在大部分测试项目中,HD6790都是领先GTX550Ti的,但是在高AA(抗锯齿)负载的情况下,HD6790的弱点即刻暴露出来,16个ROPs单元显得有点力不从心。从FarCry 2中也印证出了这一点:游戏中4xAA设置下HD 6790的落后幅度为4%左右,而开启8xAA后性能落后幅度则扩大至15-17%之多。(关于GTX550Ti和HD6790的ROPs数目,详见于此)
需要注意的是,AMD显卡和NVIDIA显卡在ROPs的设计上是有区别的,N卡的ROPs单元和流处理器是“捆绑”的,即置于SIMD之内,所以倘若消减N卡的流处理数量,其ROPs单元也随之消减;而A卡则不一样,其ROPs单元和流处理器单元是没有关联的。
传统管线架构
第二个重要的概念:Shaders。传统管线架构:以往显卡由顶点渲染管线和像素渲染管线组成,生成图像的过程都是先由顶点渲染管线中的Vertex Shader(顶点着色器)生成基础的几何图形骨架(由三角形构成),然后再由像素渲染管线中的Pixel Shader(像素着色器)进行填色,最后才是像素渲染管线中的纹理单元进行贴图。而当新的统一渲染架构提出之后,顶点着色器和像素着色器被合二为一,成为流处理器(Shaders),它将同时负责顶点着色和像素着色,避免了负载不均衡的情况发生。最先提出统一渲染架构的是微软的DirectX 10。
步入DX10时代,shader单元数量成为衡量显卡级别的重要参数之一
需要说明的是,N卡和A卡的所采取的核心架构是不一样的,N卡采用的是MIMD架构。多指令流多数据流(MultipleInstructionStreamMultipleDataStream,简称MIMD),它使用多个控制器来异步地控制多个处理器,从而实现空间上的并行性,所以N卡是一个发射器;A卡采用的是SIMD架构设计,即Single Instruction Multiple Data(单指令流多数据流),A卡是将4个简单指令+1个复杂指令打包,再用一个发射器发出。所以A/N两者不能进行流处理器数量的简单对比。
|