我们一起来识别显卡的性能和参数

*牵着蜗牛流浪* *发表于 2011-07-24 20:31:17* · 发表于 2011-07-24 20:31:17

本帖最后由牵着蜗牛流浪于 2011-7-24 20:44 编辑

关于显卡的性能参数，有许多硬件检测软件可以对显卡的硬件信息进行详细的检测，比如：Everest，GPU-Z，GPU-Shark等。这里我们以玩家最常用的GPU-Z软件来作为本文解析显卡性能参数的示例软件。

GTX590的GPU-Z截图

首先我们对GPU-Z这款软件的界面进行一个大致分区的解读，从上至下共8个分区，其中每个分区的具体含义是：

　　①显卡名称部分：　　名称/Name：此处显示的是显卡的名称，也就是显卡型号。

　　②显示芯片型号部分：　　核心代号/GPU：此处显示GPU芯片的代号，如上图所示的：GF110、Antilles等。
　　修订版本/Revision：此处显示GPU芯片的步进制程编号。
　　制造工艺/Technology：此处显示GPU芯片的制程工艺，如55nm、40nm等。
　　核心面积/Die Size：此处显示GPU芯片的核心尺寸。

　　③显卡的硬件信息部分：　　BIOS版本/BIOS Version：此处显示显卡BIOS的版本号。
　　设备ID/Device ID：此处显示设备的ID码。
　　制造厂商/Subvendor：此处显示该显卡OEM制造厂商的名称。

　　④显示芯片参数部分：　　光栅操作单元/ROPs：此处显示GPU拥有的ROP光栅操作处理单元的数量。
　　总线接口/Bus Interface：此处显示显卡和主板北桥芯片之间的总线接口类型以及接口速度。
　　着色单元/Shaders：此处显示GPU拥有的着色器的数量。
　　DirectX版本/DirectX Support：此处显示GPU所支持的DirectX版本。
　　像素填充率/Pixel Fillrate：此处显示GPU的像素填充率。
　　纹理填充率/Texture Fillrate：此处显示GPU的纹理填充率。

　　⑤显存信息部分：　　显存类型/Memory Type：此处显示显卡所采用的显存类型，如：GDDR3、GDDR5等。
　　显存位宽/Bus Width：此处显示GPU与显存之间连接的带宽。
　　显存容量/Memory Size：此处显示显卡板载的物理显存容量。
　　显存带宽/Bandwidth：此处显示GPU-Z与显存之间的数据传输速度。

　　⑥驱动部分：　　驱动程序版本/Driver Version：此处为系统内当前使用的显卡驱动的版本号。

　　⑦显卡频率部分：　　核心频率/GPU Clock：显示GPU当前的运行频率。
　　内存/Memory：显示显存当前的运行频率。
　　Shader/Shader：显示着色单元当前的运行频率。
　　默认核心频率/Default Clock：显示GPU默认的运行频率。
　　（默认）内存/Memory：显示显存默认的运行频率。
　　（默认）Shader/Shader：显示着色单元默认的运行频率。

　　⑧交火和运算能力部分： NVIDIASLI或ATICrossfire：显示是否开启SLI或者Crossfire多显卡交火。

运算能力：显示是否具备OpenCL、CUDA、PhysX和DirectCompute 5.0运算能力。

下面我们就重点为大将对显卡的性能参数做一个详尽的讲解，最后终结出哪些性能参数最能影响的显卡性能，以及我们消费者在实际购买显卡时应该从哪方面去思考，以及怎么依靠显卡性能参数来对显卡进行大致的判断和比较。我们希望菜鸟读完本文能够对显卡有个大致的“轮廓”，老鸟读完本文能够对显卡的核心性能参数有个更深入的认识。

显卡名称、芯片型号以及硬件信息

消费者在购买显卡的时候首先应该明确的就是我该购买的显卡的型号（名称）是什么，也就是GPU-Z中的Name所示的参数信息，例如本例中的“GTX590”。

显卡GPU-Z截图中关于显卡名称、芯片型号和硬件信息的部分

而通过显卡芯片型号的解读，我们又可以对显卡核心GPU的信息作进一步的了解。从GPU这一项我们能够得知显卡核心的GPU研发代号。GPU的代号一般来说往往是与显卡型号名称相对应，举例来说：

GF110 对应：NVIDIAGeForce GTX590
GF100 对应： NVIDIA GeForceGTX480

Antilles 对应：Radeon HD 6990
RV870 对应：Radeon HD 5970

当然也有一个GPU代号对应多个显卡型号名称的，而这些往往是JS忽悠小白的地方。例如：

基于GF104核心的显卡同时有NVIDIA GeForce GTX 460 （768MB）、NVIDIA GeForce GTX 460 （1024MB）和NVIDIA GeForce GTX 460SE共三款产品，如果消费者对这些显卡不大熟悉的话，很容量被商家所误导而购买被“换型”的显卡产品。

同型号的三款GTX460的不同区别

从上面的对比图中我们可以很清楚的看到768MB和1024MB版的GTX460主要在显存容量和显存带宽上有很大区别，而GTX460SE的区别主要在于CUDA处理器缩减至了288个。

有同一GPU代号对应多款显卡型号，自然也有同个显卡型号对应多个GPU代号，如：RadeonHD5670。

HD5670的两种版本

从上图我们可以看到两者的区别主要在于核心GPU、流处理器数量以及核心面积，虽然同为HD5670，但是640SP的HD5670性能已经几乎接近HD5750的程度。

通过上面的总结得知，我们玩家在选购显卡的时候一定要弄明白自己所要购买的显卡型号和显卡GPU核心代号具体是什么，购买的时候最好当场对显卡进行简单的上机测试，用GPU-Z等相关测试软件看下显卡的硬件信息是否有异常情况，这样玩家就可以尽可能的降低上当受骗的几率。

显卡芯片参数解析：悟透ROPs

这一部分是我们所要重点解读的内容，因为不少初玩显卡的朋友或者老玩家对这些性能参数的都不是特别清晰，下面就让我们来一起进行详尽的解读。

显卡芯片参数部分

首先一个重要的概念就是ROPs（Raster Operations Units），即光栅化处理单元，表示显示GPU拥有的ROP光栅操作处理单元的数量。通常来说：3D图形处理可以分成四个主要步骤，几何处理、设置、纹理和光栅处理，而ROPs就是处理光栅单元。那么光栅化处理单元的多少对显卡性能有哪些影响了？

ROPs架构图

ROPs(光栅化处理单元)主要负责游戏中的光线和反射运算,兼顾AA、高分辨率、烟雾、火焰等效果。游戏里的AA(抗锯齿)和光影效果越厉害,对ROPs(光栅化处理单元)的性能要求也就越高,否则就可能导致游戏帧数急剧下降.比如同样是某个游戏的最高画质效果,8个光栅单元的显卡可能只能跑25帧.而16个光栅单元的显卡则可以稳定在35帧以上。举一个例子：GTX550Ti和HD6790前者是24个ROPs单元，后者是16个ROPs单元，虽然在大部分测试项目中，HD6790都是领先GTX550Ti的，但是在高AA（抗锯齿）负载的情况下，HD6790的弱点即刻暴露出来，16个ROPs单元显得有点力不从心。从FarCry 2中也印证出了这一点：游戏中4xAA设置下HD 6790的落后幅度为4%左右，而开启8xAA后性能落后幅度则扩大至15-17%之多。（关于GTX550Ti和HD6790的ROPs数目，详见于此）

需要注意的是,AMD显卡和NVIDIA显卡在ROPs的设计上是有区别的，N卡的ROPs单元和流处理器是“捆绑”的，即置于SIMD之内，所以倘若消减N卡的流处理数量，其ROPs单元也随之消减；而A卡则不一样，其ROPs单元和流处理器单元是没有关联的。

传统管线架构

第二个重要的概念：Shaders。传统管线架构：以往显卡由顶点渲染管线和像素渲染管线组成，生成图像的过程都是先由顶点渲染管线中的Vertex Shader（顶点着色器）生成基础的几何图形骨架（由三角形构成），然后再由像素渲染管线中的Pixel Shader（像素着色器）进行填色，最后才是像素渲染管线中的纹理单元进行贴图。而当新的统一渲染架构提出之后，顶点着色器和像素着色器被合二为一，成为流处理器（Shaders），它将同时负责顶点着色和像素着色，避免了负载不均衡的情况发生。最先提出统一渲染架构的是微软的DirectX 10。

步入DX10时代，shader单元数量成为衡量显卡级别的重要参数之一

需要说明的是，N卡和A卡的所采取的核心架构是不一样的，N卡采用的是MIMD架构。多指令流多数据流（MultipleInstructionStreamMultipleDataStream，简称MIMD），它使用多个控制器来异步地控制多个处理器，从而实现空间上的并行性，所以N卡是一个发射器；A卡采用的是SIMD架构设计,即Single Instruction Multiple Data（单指令流多数据流），A卡是将4个简单指令+1个复杂指令打包，再用一个发射器发出。所以A/N两者不能进行流处理器数量的简单对比。

*rmhs* *发表于 2011-08-25 02:43:10* · 发表于 2011-08-25 02:43:10

文章很详细，楼主辛苦了。

*tiger8818* *发表于 2011-08-04 09:52:29* · 发表于 2011-08-04 09:52:29

又上了一课，谢谢楼主分享！

*fyter* *发表于 2011-07-24 22:09:04* · 发表于 2011-07-24 22:09:04

有点长，但是认真看完了，不错。

②號 *发表于 2011-07-24 21:32:27* · 发表于 2011-07-24 21:32:27

很好的基础知识，谢谢分享。

发表于 2011-07-24 20:31:47

最后我们要解析的是像素填充率（Pixel Fillrate）和纹理填充率（Texture Fillrate）。

像素填充率是指图形处理单元在每秒内所渲染的像素数量，单位是GPixel/S（每秒十亿纹理）
像素填充率＝核心频率×光栅单元数目/1000

纹理填充速率是指在多边形每个面上填充的颜色的纹理，单位是GPixel/S（每秒十亿像素）
纹理填充率＝核心频率×纹理单元数目/1000

这两个参数的值在GPU-Z中自然是越大则越能表明显卡所能处理的能力越强悍。并且核心频率是像素填充率（Pixel Fillrate）和纹理填充率（Texture Fillrate）的计算因数，显然显卡核心频率越高，这两个值越大。而其中的光栅单元数目即ROPs的值，ROPs的值越大，像素填充率也就越大。

显存参数别忘了“位宽兄弟”

显存的作用，说通俗点，其实和我们机器内部所使用的内存的作用是几乎相同的。卖场里的销售人员也经常对显存这个“卖点”来进行相关“炒作”，当然不少“小白”也因此上当受骗。下面显卡帝就来为初级玩家进行相关解析。

GPU-Z截图关于显存的部分

Memory Type(显存类型)，现如今，最新的主流高端级显卡都采用的是GDDR5的显存颗粒，之前主流的GDDR3显存颗粒也正式退役至二线，而GDDR4显存颗粒仅仅是个过渡型产品，市售的显卡所见不多。GDDR5相对于GDDR3的核心优势在于显存带宽大幅度提升。

显存带宽（Bandwidth）＝（显存位宽 ×显存工作频率）/ 8

从上面的计算公司我们可以清楚的看到，由于GDDR5显存颗粒具备两条数据总线，所以虽然采用的是和GDDR3同样的8位预取机制，但显存的工作频率可以到达GDDR3的两倍。最为典型的一个例子就是：采用GDDR5显存的GT240显卡要比采用GDDR3显存的GT240显卡性能领先16%左右，所以凭借强大的带宽优势，GDDR5在同位宽的情况下可以全面超越GDDR3。

Bus Width（位宽）往往是玩家最容易忽视的一个概念。显存位宽是显存在一个时钟周期内所能传送数据的位数，位数越大则瞬间所能传输的数据量越大。可以说显存位宽对显卡性能的影响相比显存容量而言要大不少。

显卡对阵图

显卡显存位宽的权重到底有多大了，我们从上面这张显卡对阵图中来一起找找答案。从大部分媒体的测试结果来分析，我们给上述显卡在性能上进行一个简单的排序。

HD6850>HD6790>GTX550Ti>HD5770

我们重点关注下HD6790和GTX550Ti这两款显卡，虽然说GTX550Ti在核心频率和ROPs数量上均高于HD6790，但是在大部分的测试项目中为何又败下阵来了？首先HD6790采用的HD6850的缩减核心架构这一点自然不用说，其二就在显存位宽上，GTX550Ti仅为192Bit位的显存位宽，所以显存带宽的处理能力仅为98.4GB/S，而HD6790则采用的是256Bit的显存位宽，显存带宽处理能力达到了134.4GB/S，相比GTX550Ti提升36.58%。而为什么GTX550Ti相比HD5770来说，又能够将HD5770全面压制了，其实道理也是一样的。从显存带宽（Bandwidth）＝（显存位宽 ×显存工作频率）/ 8 这个公式我们也可以看到当都采用GDDR5显存颗粒的时候，显存位宽就成为了影响性能的关键瓶颈。

最后我们需要提醒玩家注意的是显存容量（Memory Size）这个最经典的“骗局”，就是利用A卡的Hyper Memory（HM）或N卡的Turbo Cache(TC)的动态共享系统内存技术来谎称显卡的显存容量，想必这样的招数在进过前些年的“洗礼”之后，现在的不少消费者也逐渐对这样的雕虫小技都能够很快的精准识别。

显卡频率:核心频率>显存频率

显卡的频率，我们主要关注的是核心频率和显存频率。两者相比较而言，核心频率对显卡性能的影响权重较大。所以我们玩家在超频的时候先提升的核心频率，再才是显存频率。为什么说核心频率的重要性更大一些了？打个比方，核心频率就相当于个人自身能力，而显存频率好比外在条件，而一个人的成功往往取决于个人能力而外在条件仅在一定程度上对其有影响，简而言之：一个是内因而另一个是外因。

GPU-Z中关于显卡频率部分的截图

需要说明的是由于核心架构的设计不同，N卡的GPU核心频率和Shader频率呈现2倍的关系，而A卡的GPU核心频率和Shader频率是一致的。

显存频率是指默认情况下，该显存在显卡上工作时的频率，以MHz(兆赫兹)为单位。

GDDR5显存颗粒

关于GDDR5显存频率，由于以往GDDR1/2/3/4和DDR1/2/3的数据总线都是采用的DDR技术(通过差分时钟在上升沿和下降沿各传输一次数据)，官方标称的频率X2就是数据传输率，也就是通常我们所说的等效频率。而GDDR5则不同，它有两条数据总线，相当于Rambus的QDR技术，所以官方标称频率X4才是数据传输率。比如GTX590官方显存频率是854MHz，而大家习惯称之为3416MHz。

现在我们已经知道了显卡频率的对显卡性能的影响，有个问题我们需要提出来讨论一下：显卡频率是不是越高越好？

从旗舰显卡的频率设定来看，它们的核心频率设定都不是特别高，而且前段时间也爆出：AMD对HD6990因超频而致使显卡损坏的显卡用户不予质保，同时也有国外媒体在测试GTX590显卡的时候所出现的“烧毁”显卡的现象。由此可见，高频设定的高端显卡由于GPU核心温度的极高无比而致使显卡烧毁这样的一种玩卡方式确实有些不大妥当。毕竟玩家还是自己的显卡能够稳定运行。当然，在中端显卡上我们也可以看到风冷情况下高频设定的显卡，例如新近推出的GTX550Ti，1G核心频率设定的显卡产品也有一些。高频显卡的意义何在，从另一个角度去分析：不妨作为一种检测显卡品质的方法，因为能够在高频下运行的显卡需要很好的做工和强劲的显卡散热器做支持。其实我们玩家在大部分情况下应用的也就是显卡的默认频率设定，所以高频设定的显卡，我们也很担心其寿命的长短。故而我们并不推荐玩家刻意的追求极致高频，除非你是一个狂热的超频玩家。

驱动、交火和其他运算能力

显卡的性能的表现在有些程度上与显卡驱动存在着一定的关系，因为GPU厂商会对显卡做针对性的优化。所以我们推荐玩家选择最新版的WHQL版驱动来体验你的显卡。

驱动、交火和运算能力

SLI和Crossfire技术提供了多卡互联的技术解决方案。关于什么样的显卡组建多卡互联系统会显得更具性价比了？个人建议采用中断显卡组建系统会显的更划算一些，当然资金充裕的话，采用中高端显卡来组建多卡互联系统也可以，如果采用低端的显卡来组建交火的话，这样就不大太划算，因为可能低端显卡组建的平台性能优势才仅仅相当于中端卡的能力，而价格却已经超过了单块中端显卡的价钱。

SLI速力技术平台

Crossfire交叉火力技术平台

最后我们来看看Computing计算能力这一项，OpenCL(全称Open Computing Language，开放运算语言)、CUDA(通用并行计算架构)、PhysX(物理加速)和DirectCompute 5.0（是一种用于GPU通用计算的应用程序接口）。

AMDHD6990的相关截图

对比A卡，N卡在Computing这项的表现上显得更加出色，N卡全部支持四项运算能力，而A卡仅支持一项DirectCompute 5.0。倘若玩家对借助CUDA技术实现高清转码或者玩的游戏需要PhysX物理加速技术的支持，那么玩家可以考虑购买N卡，因为这些正是N卡所强势的地方。

总结：“显卡性能参数排排坐”

进过了前面详细的介绍与分析，我们对显卡的主要性能参数有了一个相对全面的认识和了解。玩家在购买显卡的时候，可能对这么多性能参数“有点晕”，所以我们有必要对这些显卡性能参数的权重进行一个高低顺序的排序。下面是笔者所总结的一个相对简洁的显卡性能排序：

①显卡核心和制程

显卡核心是关键，核心不行其他再好都是浮云，核心先进那么显卡的性能自然会提升一个很大的档次；制程越先进，显卡的发热量和功耗越低。

②流处理器和ROPs

流处理器数量上的增加或缩减对显卡的性能影响可谓是立竿见影，所以GPU厂商也常常利用这一方法来对显卡产品进行市场细分。ROPs数量的多数影响在游戏画面中的AA(抗锯齿)和光影特效等方面。

③核心频率和显存频率

核心频率影响的是像素填充速率和纹理填充率，而显存频率影响的是显存带宽，两者同时都作为影响因子，所以参数值越大，自然显卡性能越强悍。不过过高的频率设定对显卡自身有一定影响，合理的频率设定是我们所要选择的显卡。

④像素填充速率和纹理填充率

像素填充率＝核心频率×光栅单元数目/1000
纹理填充率＝核心频率×纹理单元数目/1000

⑤显存位宽和显存带宽

显存带宽＝工作频率×显存位宽/8（显存带宽 =显存位宽×显存频率/8/1024）
显存位宽越大，那么瞬间所能传输的数据量越大。显存带宽的作用好比桥梁一样，为显示核心和显存提供了一条交换数据的通道。

⑥显存大小和其他参数

显存太小的话会导致在游戏过程中有帧数不稳定的显示。

以上排序作为玩家在购买显卡时分析性价比的几个方面，当然顺序并非完全固定，具体还得需要考虑到玩家自身对显卡的详细要求。但是有一点是肯定的，知道这些决定显卡性能的参数，我们玩家在购买显卡或与人谈论显卡的时候会显得更加专业，让JS从此惧怕小白，这就是显卡帝为您写下此文的最终目的。

[硬件相关] 我们一起来识别显卡的性能和参数

本帖子中包含更多资源

评分

评分