NVIDIA中场新贵:Geforce 9600 GT
● Geforce 9系终登场
● Geforce 9600 GT简述
作为全新系列的先锋型号,Geforce 9600 GT延承了NVIDIA的“6”档次产品基本定位:性能和成本兼顾的主流型显卡、可灵活配置以应付较宽价格区段。但这款产品又存在一些突破。
在3D加速架构和外围功能上,Geforce 9600 GT继承了Geforce 8系末期几款产品(G92 GPU)的技术,设计思路和实现都基本相同,仅在细微处又少许调整。
笔者将在本文内尽可能全面的为您展开关于Geforce 9600 GT产品的信息,为满足众多读者对产品性能的热切期望,此次还特别的把3D性能测试章节提前。不过接下来还是有必要在性能测试前做一些GPU 3D特性分析的铺垫.
64流处理器G94:新技术小步快跑
● Geforce 9600 GT 规格对比
下表是Geforce 9600 GT和Geforce 8800 GT / GS及Geforce 8600 GTS的规格对比。上市之初的Geforce 9600 GT产品定位即在Geforce 8800 GT和Geforce 8600 GTS之间,取代数量稀少并已停止供应的Geforce 8800 GS。
Geforce 9600 GT 及 系 列 显 卡 规 格 表 | ||||
|
Geforce 8800 GT | Geforce 8800 GS | Geforce 9600 GT | Geforce 8600 GTS |
核心代号 | G92 - 270 | G94 | G84 - 400 | |
制造工艺 | 65nm | 80nm | ||
核心晶体管数目 | 7.54亿 | -- | 2.89亿 | |
|
DirectX 10 | |||
着色器数量 (标量通用着色器) |
112 | 96 | 64 | 32 |
纹理拾取单元数量 | 56 | 48 | 32 | 8 |
光栅处理器数量 | 16 | 12 | 16 | 8 |
核心频率 | 600MHz | 600MHz | 650MHz | 675MHz |
着色器频率 | 1500MHz | 1500MHz | 1625MHz | 1460MHz |
|
1800MHz | 1800MHz | 1800MHz | 2000MHz |
内存位宽 | 256bit | 192bit | 256bit | 128bit |
内存类型 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
内存容量 | 512MB | 768MB | 512MB | 256MB |
|
PureVideo HD | PureVideo HD | PureVideo HD | PureVideo HD |
产品定价 | 2000元 | 1500元 | 1500元 | 900元 |
从枯燥的数字看去,Geforce 9600 GT拥有和Geforce 8800 GT相当的内存带宽而超过Geforce 8800 GS,但GPU的纸面计算能力较Geforce 8800 GT和Geforce 8800 GS都来得弱。
和自家上代“6”档型号Geforce 8600 GTS相比,Geforce 9600 GT的内存带宽和GPU计算能力都有约100%的提升,在微架构改良的帮助下,整体3D性能无疑会大幅攀升。
● 加入全新压缩技术的G94 GPU
Geforce 9600 GT配置的GPU产品研发代号为G94。和G8X系列GPU相比,G94的最大变化是改进了制造工艺,它由台积电使用65nm工艺制造,和去年末的G92 GPU工艺相同。NVIDIA没有提供G94的晶体管数量信息,但这款GPU显然经过了新的设计,核心部分旋转45度于封装基板,面积也比G92小,但它仍旧能和G92共用相同的PCB,pin-to-pin兼容。
G94在3D加速功能支持和硬件体系结构方面和G80如出一辙,也是由超级仲裁机构GigaThread支持的海量通用标量着色器群构成3D计算的基础。其64个流处理器以4个16单元小组配置。这个GPU继续使用着色器频率与核心频率的异步设计,比例固定在约2.5:1。G94的内存控制器为256bit,支持256MB/512MB/1GB的本地内存容量,可以运行在PCI Express 2,0 x16上,3D API版本支持到DirectX 10。
G94在3D加速细节方面的提升是全新的压缩技术,G94的ROP较G92进一步改良,以提升纹理填充率。这是在G92相对G80倍增纹理拾取单元之后的再次微调,G92 GPU的3D游戏能力也因此会空前的富有效率。
NVIDIA方面给出的新压缩技术提升幅度如上图,G92可以比同硬件规模的G80快3%-18%,以下是笔者使用3DMark 06在1280分辨率下做的底层性能测试数据:
3DMark 06 底 层 性 能 测 试 - 1280 | |||
显卡型号 | Geforce 8800 GT 600/1500/1800 |
Geforce 8800 GS 600/1500/1800 |
Geforce 9600 GT 650/1625/1800 |
Fill Rate -Single - Texturing (MTexels/s) |
4843 | 3638 | 5330 |
Fill Rate -Multi - Texturing (MTexels/s) |
25036 | 21423 | 15443 |
Pixel Shader (FPS) |
447 | 386 | 319 |
Vertex Shader - Simple (MVercites/s) |
235 | 234 | 255 |
Vertex Shader - Complex (MVercites/s) |
149 | 146 | 133 |
Shader Particles (SM3.0) (FPS) |
94 | 82 | 98 |
Perlin Noise (SM3.0) (FPS) |
145 | 125 | 97 |
可以看到,G94的单纹理填充率相当突出,同时在简单的顶点着色环境和SM3.0粒子物理系统中占据优势。这可能使Geforce 9600 GT在那些非重度复杂着色操作游戏中有较好表现。
G94的多媒体相关部分笔者将在后文介绍,以下我们将首先进入3D性能测试。
对比的显卡选型、驱动和测试方向
● 测试产品选型
需要指出的是,在产品定位上,Geforce 9600 GT对应Geforce 8600 GTS和Radeon HD 3850,在目前的价格对位上,Geforce 9600 GT和Geforce 8800 GS相当,接近Radeon HD 3870。
测试使用的产品均为AMD/NVIDIA的官方样板,符合标准设计,并以默认频完成测试。
● 驱动程序
驱动识别的NVIDIA Geforce 9600 GT 512MB
● 测试内容
>>Geforce 9600 GT
>>Geforce 9600 GT在DirectX 9合成测试软件和最新游戏中的速度;
>>Geforce 9600 GT在4倍MSAA+16倍AF设定下的游戏速度比较;
测试主要为DirectX 10游戏应用,因此所有操作在32位Windows Vista操作系统内进行。在绝对性能测试里,除Crysis外,我们将选用1600*1200、1920*1200两个个分辨率进行,以可以覆盖市场主流:19至27英寸宽屏LCD的标准分辨率。其中DirectX 10应用重点是标准设定下的速度,DirectX 9应用重点是AA+AF下的速度。
测试平台的硬件、软件系统说明
● 测试系统的硬件环境
系 统 硬 件 环 境
Intel Core 2 Quad QX9770
( 四核 / 400MHz*8 / 每2核6MB共享L2缓存 )
内存模组
Apacer DDR3-1600 1GB *2
( 运行在1333MHz_9-9-9 )
主板
ASUS Blitz Extreme
( P35 Express / PCB版本1.02G / BIOS版本1005 )
显示卡
NVIDIA Geforce 8800 GT
( G92 / 512MB / 核心:600MHz / 内存:1800MHz )
NVIDIA Geforce 8800 GS
( G92 / 768MB / 核心:600MHz / 内存:1800MHz )
NVIDIA Geforce 9600 GT
( G94 / 512MB / 核心:650MHz / 内存:1800MHz )
NVIDIA Geforce 8600 GTS
( G84 / 256MB / 核心:600MHz / 内存:1800MHz )
AMD Radeon HD 3850
( RV670 / 256MB / 核心:670MHz / 内存:1650MHz )
AMD Radeon HD 3870
( RV670 / 512MB / 核心:775MHz / 内存:2250MHz )
硬盘
Seagate Barracuda 7200.10 ST3320620AS
( 320GB / 7200RPM / 16M缓存 / 50GB NTFS系统分区 )
电源供应器
Topwer TOP-900W
( ATX12V 2.0 / 900W )
显示器
DELL 3007WFP
( 30英寸LCD / 2560*1600分辨率 )
● 测试系统的软件环境
操 作 系 统 及 驱 动
操作系统
Microsoft Windows Vista Ultimate 32bit
( 英文版 )
显卡驱动
ATI Catalyst for Radeon HD
( Beta / 版本号8.1.23a )
NVIDIA Forceware for Geforce
( Beta / 版本号174.12 )
( WHQL / 版本号169.25 )
桌面环境
2560*1600_32bit@60Hz
测试内容包括D3D合成测试软件3DMark 06、4款最新DirectX 9 3D游戏和7款DirectX 10游戏。合成测试软件3DMark用总分衡量性能,3D游戏用平均fps来衡量性能,两者都是越高越好。
性 能 测 试 软 件
3D合成测试软件
3DMark 06
( Futuremark / 版本号1.1.0 )
DX9级3D游戏
Call of Duty 4 Modern Warfare
( Activision / 版本号1.0 )
Half-Life 2 Episode 2
( Valve / 版本号1.0.0.0 )
Need for Speed ProStreet
( EA / 版本号1.0 )
Time Shift DEMO
( Sierra / 版本号1.0 )
DX10级3D游戏
BioShock
( 2KGames / 版本号1.0 )
Company of Heroes
( Relic / 版本号1.7.1 )
Call of Juarez Benchmark
( Ubi / 版本号1.0 )
Crysis DEMO
( Crytek / 版本号1.0.0.1 )
Gears of War
( Microsoft / 版本号1.0 )
PT Boats Knights of the Seat Benchmark
( Akella / 版本号1.0 )
World In Conflict
( Massive / 版本号1.0 )
测 试 辅 助 软 件
速度记录软件
Fraps
( beepa / 版本号2.9.2 )
DX9测试:3DMark 06和游戏COD 4
● 3DMark 06
● Call of Duty 4 Modern Warfare
经典战争游戏续作Call of Duty 4 Modern Warfare由原一、二代制作公司Infinity Ward重新操刀,背景跳出二次世界大战战场,将前线拉至近现代中东地区的战争中。该游戏3D引擎执行效率很高,在实现接近DirectX 10级别火焰烟雾等环境特效的基础上,保证了游戏速度,是不折不扣的第一人称射击游戏重量级作品。
>>游戏类型:DirectX9 第一人称射击游戏
>>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:可设置的全部最高
>>
DX9游戏:Half-Life2 EP2和NFS11
● Half-Life 2 Episode 2
本游戏是Valve 2006年Half-Life2 Episode 1的续集,带来了最新故事情节和更优秀的画面表现,但游戏仍然使用Source引擎,提升的画面品质来自于更为复杂的纹理和少量新增特效,对系统负载不大,整体速度较高。
>>
>>测试方式:白天室外/室内场景,开始场景一段游戏的自行录像回放
>>画质设定:可设置的全部最高
>>AA、AF设定:AA和AF均在游戏中开启
● Need for Speed ProStreet
最新发布的极品飞车第十一部作品Need for Speed ProStreet一经发布就迅速抢过PC竞速类游戏的No.1人气。ProStreet画面风格返回三代的明亮清爽,画面质量有一定程度的改进,但对PC系统的要求并没有大幅度提高。
>>游戏类型:DirectX9 竞速类游戏
>>测试方式:同一弯道竞速场景,人为操作跑完3次取平均值,Fraps计速
>>画质设定:全部最高
DX9游戏:TimeShif及DX9测试总结
● Time Shift
Time Shift一年多以前就曾出现过一个PC版试玩DEMO,但是开发商方面的变化让它持续跳票。Time Shif的最新试玩DEMO不久前被放出,采用了自家研发的Saber3D引擎。从游戏画面来看相比去年的DEMO简直是天壤之别,一跃成为一流水平的第一人称射击游戏。
>>
>>测试方式:黑夜室外场景,沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高
>>
● DX9应用性能总结
Geforce 9600 GT的DirectX 9部分测试成绩大幅度超过Geforce 8600 GTS,整体优于Geforce 8800 GS和Radeon HD 3850,并在部分项目中有赶超Radeon HD 3870的机会。在和Geforce 8800 GT的比较中,Geforce 9600 GT约能提供前者80%以上的DX9速度。
可以看到,Geforce 9600 GT和Radeon HD 3850 / 3870相比,开启AA+AF后速度下降的幅度较小,有更好的高画质游戏实用性。
DX10游戏:BioShock和COH ver1.7
● BioShock
>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高
● Company of Heroes
>>游戏类型:DirectX10 即时战略游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的剧情过场回放
>>画质设定:全部最高
DX10游戏:Call of Juarez和Crysis
● Call of Juarez
>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:游戏自带性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高
● Crysis
>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高
DX10游戏:Gears of War和PTBoats
● Gears of War
在Xbox 360上独占了数月之久,直到Halo 3发布之前仍霸占着Xbox Live联机游戏榜首的Gears Of War终于出品了PC版!PC版比Xbox版本增添了6个新的单人战役章节,和多人游戏模式,但出色的游戏体验和宏大的场景设计以及精细的3D建模、出色的渲染效果都被全部保留。
>>
>>测试方式:室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高
>>
● PT Boats Knights of the Seat
PT Boats Knights of The Sea游戏由Akella开发,它们曾经制作过Sea Dogs、Pirates of The Carribean等作品。这是一款即时战略游戏,游戏不但支持DirectX10,还支持AGEIA PhysX物理处理卡,游戏画面表现相对平庸,但对系统要求不低。
>>游戏类型:DirectX10 即时战略游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
>>画质设定:全部最高
DX10:World In Conflict和总结
● World In Conflict
>>游戏类型:DirectX10 即时战略游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
>>画质设定:全部最高
>>AA、AF设定:AA和AF均在游戏中开启
● DX10应用性能总结
比较而言,内存容量劣势的Geforce 8600 GTS和Radeon HD 3850无可避免的在某些内存容量敏感型测试中速度急剧下降,而内存带宽劣势的Geforce 8800 GS的在重负载的DX10下的综合表现也被Geforce 9600 GT拉开距离。
DX10:World In Conflict和总结
● World In Conflict
>>游戏类型:DirectX10 即时战略游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
>>画质设定:全部最高
>>AA、AF设定:AA和AF均在游戏中开启
● DX10应用性能总结
比较而言,内存容量劣势的Geforce 8600 GTS和Radeon HD 3850无可避免的在某些内存容量敏感型测试中速度急剧下降,而内存带宽劣势的Geforce 8800 GS的在重负载的DX10下的综合表现也被Geforce 9600 GT拉开距离。
G94的多媒体改进和高清回放测试
● 多媒体相关配置
和Geforce 8800 GT相比,Geforce 9600 GT的多媒体相关配置改变很少,可视的变化一是PureVideo HD技术内的动态对比度增强和蓝绿色及肤色增强,二是DVI-HDMI输出接口成为标配。
关于VP2/H.264 BSP的能力,本站之前已经多次阐述,这里不再重复。
● PureVideo HD的动态增强
● HDMI输出成为标配
DVI-HDMI附件是Geforce 9600 GT显卡的标配
这种方案和Radeon HD系列异曲同工,后者在GPU中直接集成了数字音频逻辑,而Geforce 9600 GT的GPU没有,但可以把PC系统的板载/独立声卡输出的数字音频信号输出到显卡,通过HDMI转接输出,两者在最种应用模式上没有区别。
● 高清视频加速能力验证
这里使用CyberLink PowerDVD 7.3直接播放.ts格式的视频文件来进行测试。H.264编码为1080p X-Man 3电影,选用的片段峰值码率超过44Mbps;VC-1编码的1080p Aeon Flux电影,选用的片段峰值码率超过33Mbps。
H.264 1080p视频播放:Geforce 9600 GT系统
VC-1 1080p视频播放:Geforce 9600 GT系统
VC-1 1080p视频播放:Geforce 8800 GT系统
以上截图包含了实时码率信息、CPU占用率信息和显卡信息。在CPU占用率对比上,Geforce 9600 GT和我们之前测试过的Geforce 8600 GT完全大相当,VC-1解码平均CPU占用不超过10%(顶级4核CPU),H.264解码平均CPU占用不超过5%。
至此,关于Geforce 9600 GT硬件配置和所有性能相关的内容已经介绍完毕,如果读者您还不是急切到现在就跑去电脑城购买它,那么不妨接着阅读本文,接下来将是Geforce 9600 GT样卡的硬件构成分析、非官方样板分析、Geforce 9600 GT产品总结和品牌产品介绍,相信这些内容都会对采购起到指导作用。
GF9600GT产品剖析:官方样卡配置
NVIDIA Geforce 9600 GT 512MB 官方样卡
Geforce 9600 GT仍然为双DVI+色差/S端子的输出接口组合,两个DVI均为Dual-Link规格,可支持2560*1600分辨率的数字信号输出。Geforce 9600 GT的TDP约95W,这个功耗超过PCI Express 1.0 x16槽能提供的75W电力额度,因此设计了外部电路输入接口,为标准6pin型。
● 内存芯片和HDCP Key ROM
Geforce 9600 GT搭载1.0ns的GDDR3内存芯片,芯片额定频率为2000MHz(DDR),制造商也可以使用速度更快的内存芯片以进一步提升频率,官方样板上的内存芯片来自SAMSUNG。
GF9600GT产品剖析:公版与非公版
● 不惜工本的P545 PCB
和P393对比起来,能够看到这两款GPU pin-to-pin,PCB设计思路类似产品的差别。事实上P545对于Geforce 9600 GT显卡来讲成本过于高昂,NVIDIA鼓励下游制造商自行设计8层、6层PCB的Geforce 9600 GT显卡来有效降低成本,因此我们在第一时间就收到了多款非公版PCB的Geforce 9600 GT,以下我们一睹为快。
● 形态各异的非公版Geforce 9600 GT PCB
我们拿到的这些不同于官方样板设计的PCB其实并非全部目的于简化产品成本,事实上有部分产品甚至直接使用早先的Geforce 8800 GT非公版PCB直接制造而成,而真正体现厂商控制成本能力的精简型Geforce 9600 GT还需要一段时间才能大量出现。
全文总结:令人生畏的新秀9600GT
● 全能而均衡的胜利
● 反击田忌赛马的信心之作
Geforce 9600 GT也许是NVIDIA针对AMD错位竞争策略的直接反击,下定决心把512MB/256bit规格的强悍规划型号至“6”档系列,这意味着它会在08年下半年降价至07年下半年Geforce 8600 GTS的位置,即千元以内,真正成为性价比无可匹敌的NVIDIA显卡,而AMD方面如果想要再次以高性能产品降价针对Geforce 9600 GT,相信高昂的产品成本会让其并不舒服。
● 面向未来 具体产品更关键
如前文PCB部分的分析所言,Geforce 9600 GT还存在的弱点是上市初期10层PCB公版设计+豪华用料下的较高价格,这款9系先锋真正走入千家万户还需要在下游制造商的努力下自降下身价。
显卡品牌商对于Geforce 9600 GT产品还是相当具有信心,在正式发布前,我们就收到了将近20款样品以供测试,其中不乏一切就绪的零售型最终型号。
首 批 Geforce 9600 GT 显 卡 规 格 明 细 |
|||||
品牌 | 类型 | 核心频率 (MHz) |
着色器频率 (MHz) |
(MB) |
内存频率 (MHz) |
翔升(ASL) | 非公版 | 700 | 1750 | 512 | 2200 |
华硕(ASUS) | 完全公版 | 600 | 1625 | 512 | 1800 |
七彩虹(Colorful) | 完全公版 | 600 | 1625 | 512 | 1800 |
非公版 | 600 | 1625 | 512 | 1800 | |
精英(ECS) | 公版+改良散热 | 680 | 1725 | 512 | 1850 |
影驰(Galaxy) | 非公版 | 720 | 1800 | 512 | 2000 |
映众(Inno3D) | 完全公版 | 600 | 1625 | 512 | 1800 |
丽台(Leadtek) | 完全公版 | 600 | 1625 | 512 | 1800 |
铭鑫(Macy) | 完全公版 | 600 | 1625 | 512 | 1800 |
铭瑄(MAXSUN) | 非公版 | 600 | 1625 | 512 | 1800 |
微星(MSI) | 公版+改良散热 | 750 | 1875 | 512 | 2000 |
小影霸(Paradise) | 完全公版 | 600 | 1625 | 512 | 1800 |
NVIDIA | 完全公版 | 600 | 1625 | 512 | 1800 |
旌宇(Sparkle) | 公版+改良散热 | 600 | 1500 | 512 | 1800 |
太阳花(Taiyanfa) | 完全公版 | 600 | 1625 | 512 | 1800 |
讯景(XFX) | 完全公版 | 700 | 1750 | 512 | 2000 |
盈通(Yeston) | 完全公版 | 600 | 1625 | 512 | 1800 |
索泰(Zotac) | 非公版 | 700 | 1700 | 512 | 2000 |
相信08年的显卡市场随着Geforce 9600 GT的问世会迅速升温,DX10级别的3D应用成本已经越来越低。NVIDIA方面要作的是保证GPU品质的稳定和产量的供应,并使用更为灵活的策略,给品牌厂商更自由的空间。
17款品牌产品展示:全NVIDIA公版
● 讯景
● 小影霸
● 映众
● 盈通
● 华硕
● 太阳花
● 丽台
● 铭鑫
17款品牌产品展示:公版改良散热
● 精英
● 微星
● 旌宇
17款品牌产品展示:全非公版设计
● 索泰
● 翔升
回复Comments
作者:
{commentrecontent}