随着2017年VR游戏和头显的普及,VR Ready显卡市场需求量骤升,极大地刺激了上游芯片厂商的研发以及下游厂商的铺货。回顾过去的一年,Nvidia不仅优化了原先的开普勒架构,还一次次刷新单卡计算排行榜;AMD虽然依旧屈居第二,不过还是推出了RX 580和RX 570救场。乘此辞旧迎新之际,让我们一起来回顾一下过去一年中VR Ready显卡的发展,同时展望下一代的VR显卡。
GTX 1060、GTX 1070和GTX 1080是2016年下半年到2017年上半年Nvidia在消费级市场上推出的VR-Ready级显卡。GTX 1060定位VR入门级,GTX 1070定位进阶VR级,而GTX 1080则定位高端VR体验。虽然从字面上看GTX 1060定位VR入门级,不过在性能上已经超过前代GTX 970,性能直逼GTX 980。
GTX1060全新的GP-106核心拥有两组GPC,每组有5个SMs(2×64个),共1280个CUDA处理器,刚好是GTX1080的一半。单精度浮点运算是4.4TFlops,相比GTX960的2.3T已经提升了近一倍,因此理论上性能应该可以翻倍。6个内存控制器,6×32-bit的显存位宽共组成192-bit位宽,帕斯卡时代的6系卡回归192bit也是相当喜闻乐见的。
GTX1060显存升级到6GB,已经比GTX980的4G都更高,对于VR应用来说,大显存相当有必要。流处理器数方面,GTX1070比GTX1080少了640个,1/4也就是一组的量,而GTX1060也是比GTX1070少了640个,剩1280了,但也比同定位的GTX960要多;显存位宽终于回归到192bit,位宽缩得太多一直是GTX960被喷的点。GTX1060基础频率也很高,1.5GHz比GTX960足足高了50%,加速频率也达到了1.7GHz。GTX1060纹理单元和ROPs比GTX1070略为缩减,但减的都不是太多,这样换来的是更低的功耗,仅120W,6PIN供电完全够用!
面对英伟达的强势入侵,AMD却迟迟没有做出回应,尤其是高端缺乏对应产品,只有Polaris北极星系列在中低端打拼。直到2017年7月30日,AMD才发布了三款Radeon Vega架构显卡。
三款产品分别为RX Vega 64水冷版、RX Vega 64、RX Vega 56,苏妈的Vega系列将对飙老黄的GTX 1080/1070,其中Vega 56表现尤其抢眼,各方面表现力压GTX 1070,给后者造成了很大压力。
Radeon RX VEGA 64采用14nm FinFET “VEGA 10”核心,集成了125亿个晶体管,核心面积为486平方毫米。相比28nm工艺的上代大核心Fiji,VEGA 10的核心晶体管规模多了整整40%,面积却缩小了18%。
基于全新VEGA架构的VEGA 10 XTX芯片共有4096个流处理器,运算单元数量为64个,TMUs总数量为256个,ROPs数量为64个,两个带宽为1024-bit的双通道显存控制器组成了总量为2048-bit的显存控制单元,大小为8GB。
Radeon RX VEGA 56同样采用14nm FinFET “VEGA 10”核心,基于全新VEGA架构的Vega 10 XT芯片共有3584个流处理器,运算单元数量为56个,TMUs总数量为144个,ROPs数量为32个,两个带宽为1024-bit的双通道显存控制器组成了总量为2048-bit的显存控制单元,大小为8GB。
Radeon RX VEGA 64水冷版的默认核心频率达到了1406MHz,Boost频率高达1677MHz,有效频率更是可以达到1750MHz,这个频率是AMD显卡史上的最高频率。RX VEGA 64显存带宽为484 GB/s,默认Pixel Fillrate能力达到了98.9Gpiexls/S,默认Texture Fillrate能力为395.8Gtexels/S;RX Vega 56显存带宽为410 GB/s,默认Pixel Fillrate能力达到了94Gpiexls/S,默认Texture Fillrate能力为330Gtexels/S。
凭借高频和庞大的运算规模,RX VEGA 64最高拥有13.7 TFLOPS的超高单精度浮点运算能力,照比上代R9 Fury X提升了59.3%,提升幅度相当惊人,是目前单芯显卡中单精度浮点运算性能最强的。
Vega显卡虽然规格够高,让A饭期待了一年多,但实际表现不尽如人意,现在就连基本的供货都保证不了,HBM2依然是个痛。在这样的情况下,Nvidia于秋季推出了GTX 1070 Ti。早前说它是用来对付AMD的RX Vega 56显卡的,但NVIDIA并没有什么必要出新品来对付Vega 56,市面上各种非公版GTX 1070显卡就足够了。
GTX 1070 Ti显卡的规格明显比GTX 1070显卡高,实际上它更接近于GTX 1080,这三款显卡都是基于16nm Pascal架构的GP104核心的,GTX 1080是完整版2560个CUDA核心,20组SM单元,GTX 1070 Ti是2432个CUDA核心,只砍了1组SM单元,CUDA数量明显比1920个CUDA核心的GTX 1070高,所以这一次的阉割程度非常小。由于GTX 1070 Ti在性能上非常接近GTX 1080,为了保证自家产品线,官方限制了GTX 1070 Ti的超频,市面上出售的GTX 1070 Ti均为公版。
在顶级显卡方面依旧更迭不息,从Titan X到Titan Xp再到Titan V,Nvidia在高端计算方面一时风头无二。虽然它严格来说是个半专业卡,不会大量上市,不像GTX系列那样适合玩游戏,但毕竟代表着NVIDIA的顶级设计水准。
Titan V基于最高规格的GV100核心,集成211亿个晶体管,拥有5120个CUDA核心、640个Tensor核心、320个纹理单元,核心频率1200-1455MHz,单精度浮点性能15TFlops,同时搭配3072-bit 12GB BHM2显存,等效频率1.7GHz,带宽653GB/s,热设计功耗250W(8+6针供电)。
TITAN V采用12nm工艺的Volta核心打造,12GB HBM2显存,5120流处理器,Tensor Cores为640。峰值浮点性能(特指深度学习)为110TFlops,是TITAN Xp(12T)的9倍。TITAN V要比GTX 1080Ti提升至少27%,它是一款比发烧级还发烧的显卡。不过尽管如此,TITAN V仍然不是一款适合游戏玩家的显卡。
高端显卡象征了厂商在业界的顶级设计水平,虽然不会在短期内应用到民用级VR显卡领域,不过象征着今后的主流发展方向。在2018年里,Nvidia还将推出能耗比更高的GTX 2000系显卡,让更多轻薄笔记本拥有VR-Ready级的计算性能。对于玩家来说,今后VR-Ready或将成为每一款显卡的标配。
责任编辑:吴一波
为您推荐
英伟达为Mac Pro 带来Quadro K5000 显卡,支持 4K,性能是 Quadro 4000 的两倍
在今天的IBC上英伟达宣布将为MacPro平台推出基于开普勒架构的QuadroK5000显卡。这款产品计划在「今年晚些时候」上市,售价为2,249美元(约人民币14,270元)。QuadroK5000的性能是Quadro4000的两倍,它支持4K显示,可以通过两个DVI-DL和两个DisplayPort1.2连接器为4个显示器输出画面,其显存则达到了4GB。另外每台MacPro可以安装两块QuadroK5000同时使用。