NVIDIA从2012年GeForce GTX 680的Kepler GK104架构核心开始,到2013年GeForce GTX 780的Kepler GK110-300,再到2014年GeForce GTX 980的Maxwell GM204,虽然每代产品都是基于28nm的制造工艺,但这似乎并没有阻碍每代产品的性能取得十分可观的提升。正如大家所见,NVIDIA的每一代显卡产品在GPU核心架构上的精进,是显卡性能的提升令人刮目相看的一大重要因素!
近日,NVIDIA发布了又一款足以掀起PC业界浪潮的跨时代旗舰级显卡产品——GTX 1080。随着GeForce GTX1080的推出,NVIDIA的GPU制造工艺正式迈入了16nm的新纪元;革命性的Pascal GP104架构GPU,也将其中的2560个CUDA流处理器单元的运行频率定格在了史无前例的1607MHz;GeForce GTX 1080首次采用具有无损显存压缩技术的GDDR5X显存子系统,显存压缩架构的改进及高达10Gbps的显存频率,极大地提升了Pascal GP104可以使用的有效显存带宽。
NVIDIA此次显卡新品的发布除了GeForce GTX 1080在硬件上的更新换代以外,同时配套推出了一系列能够提升玩家在游戏和娱乐过程中的体验的图形处理技术和驱动应用程序。优化后的NVIDIA SLI技术以及更加科学的GPU BOOST 3.0加速引擎,都可以让玩家通过自己对GeForce GTX 1080的挖掘得到更大的性能提升;其中Simultaneous Multi-Projection多画面同步投射技术,以更加优化的算法引擎,在占用更少GPU资源的同时能够带给玩家更为流畅的VR视觉体验;NVIDIA还带来了新鲜的Ansel截图功能,在游戏中使用Ansel截图功能后游戏世界就会定格,然后玩家可以以任何自己想要的角度进行精彩瞬间的抓取,让游戏截图和分享变得其乐无穷!这些新的图形处理技术在虚拟现实VR游戏领域尤其堪用。
相比已经在逼真的游戏画面及炫丽的电影特效中势如破竹的3D图形技术,NVIDIA的GPU加速计算也在人工智能、深度学习、自主驾驶以及其他一些需要大量计算的应用领域中崭露头角。在DirectX12新一代的Vulkan图形开发程序到来之际,基于Pascal核心架构的GeForce GTX 1080对于新兴的虚拟现实设备、游戏、应用程序以及高技术门槛的4K、5K和HDR显示规格的发展会起到怎样的作用呢?让我们回归到技术和成绩本身,去一探NVIDIA GeForce GTX 1080的奥义吧!
Pascal GP104核心架构解析
NVIDIA在经历了四年基于28nm FinFET制造工艺的核心架构以后,基于Pascal GP104的GeForce GTX 1080首次迎来了16nm FinFET制造工艺升级。更高精度的“光刻”工艺允许GPU在单位面积的芯片上集成更多数量的晶体管,在同样的核心架构中,更加庞大的核心规模就意味着更强大的处理性能。所以16nm FinFET制造工艺能够给NVIDIA新显卡带来的能效提升是可以预见的,但是一直在超越自己的NVIDIA会满足于科技进步的必然结果吗?答案是否定的。革命性的Pascal GP104核心,不但让GeForce GTX 1080成为了有史以来性能最强的显卡,同时也让GeForce GTX 1080成为了前无古人的最先进的显卡产品之一!
GTX 1080是新一代的显卡王者
基于16nm FinFET制造工艺的Pascal GP104核心打造GTX 1080,是NVIDIA GeForce GTX 1000系列首款显卡。拜Pascal核心架构所赐,作为一款旗舰级显卡产品的GTX 1080,其180W的TDP、单8pin的供电规模并没有成为性能大幅超越上一代旗舰GTX 980的瓶颈,如此高能效的GP104核心架构实在令人刮目相看!
GTX 1080的GP104核心内建4组GPC和8个显存控制器,每个GPC包含5个SM,1个SM中集成了128个CUDA单元、8个纹理单元、256KB的二级缓存、96KB的共享储存空间以及48KB的一级缓存。
SM流式多处理器能够高度协调其中的CUDA核心以及其他功能元件的工作,这20个SM会参与到几乎所有GPU执行的所有命令中。GeForce GTX 1080拥有8个位宽为32bit的显存控制器,每一个显存控制器配有八个ROP单元和256 KB二级缓存。所以,完整GTX 1080的GP104核心共有2560个CUDA单元、256bit显存位宽、64个ROP、160个TMU以及2MB二级缓存。
GP104的核心晶体管数量为7.2b,核心面积为314mm2,远远小于麦克斯韦家族的GM200,甚至比GM204还要小不少。得益于16nm FinFET工艺的应用,每平方毫米的晶体管数量达到了22.9m,远远高于GM200。这也是GP104能耗比如此高效的主要原因之一。此外,CUDA数量2560个,ROPs数量64个,TMUs数量160个,都介于GTX 980、GTX 980 Ti之间。
NVIDIA将GPU开发工作的重点放在了设计Pascal核心架构的每一个细节中。Pascal之所有能够成为有史以来能效最高的GPU,原因不仅仅是16nm FinFET带来的制造工艺精进,更得益于持续提高的核心效率。NVIDIA工程团队的一大精力投入重点是GPU核心运行频率,橡木桶定律那样,GPU核心运行频率是由数以百万计的设计电路中速度最慢的那一路径决定的,所以这一最慢路径的优化对于GPU核心运行频率的提高是至关重要的。经过NVIDIA工程团队在这一领域的不断钻研,GeForce GTX 1080的核心运行频率要比GTX 980高出40%之多!单靠16nm FinFET的制造工艺,是不能够带来如此高比例的核心频率提升的。