【IT之家评测室】索泰 GEFORCE RTX 5090 D 32GB SOLID OC 显卡评测:DLSS 4 再塑游戏体验新赛道
随着新年的到来,RTX 50系列显卡在去年底发布后已经逐渐进入市场,但由于产能的限制,抢购首批显卡仍具有一定难度。IT之家将在未来几期中,陆续为大家分享RTX 50系列显卡的初步评测,今天我们将重点介绍索泰的高端显卡——GEFORCE RTX 5090 D 32GB SOLID OC,稍作预告,引发大家的期待。
近年来,索泰在显卡的外观设计方面表现得更为大胆,尤其在高端旗舰产品中,配备了双BIOS以实现更激进的性能调度。本次评测将使用一组旗舰级测试平台来检验其性能,具体配置如下:
一、外观设计
索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡采用了创意性的装甲设计,结合刚毅的线条和大量的栅条装饰,构成一种独特的工业风格。
看似无序的斜切线条,实际上创造了内部对称与整齐的效果。黑金色的环刃风扇在光线的照射下,展现出更加出众的质感。低饱和度的灰色金属装甲通过栅条设计,营造富有层次感和工业美感。
全新的环刃风扇设计增加了环形的倒流罩,优化了扇叶的形状以及结构的稳定性,降低了风噪,同时显著提升了风量和风压,从而提升了散热效果。
索泰 GEFORCE RTX 5090 D 32GB SOLID OC的大小为329.7mm x 137.8mm x 67.8mm(不含挡片),重量约为2.3kg。
显卡的背板同样展现了工业风的设计美学,配有大面积斜切孔和不规则镂空设计,让背板在艺术表现上更加独特。
透过镂空孔可以看到厚实的散热格栅,搭配巨型VC均热板及镀镍热管,通过设计贯穿散热结构,使风流可穿越鳍片,实现全面的散热效果。
显卡两侧配有紧密的散热装甲,并在靠近背板的一侧添加了金色铝合金加强条。顶部侧面分别有镂空的ZOTAC GAMING标志和索泰LOGO,可双彩RGB灯效,多彩的视觉效果在开机时更为显著。
中间位置设有两个开孔,内置了幻光同步接口、双BIOS开关以及16pin供电接口。使用附带线材连接至主板ARGB端口,可以轻松控制显卡灯光。双BIOS开关则提供两种风扇运行模式:加速模式和静音模式,兼顾性能和静音表现。
在I/O接口方面,索泰 GEFORCE RTX 5090 D 32GB SOLID OC 提供了3个DP2.1b接口及1个HDMI接口,中间抵挡板印有白色的索泰Logo。
包装内包括一条16pin转4*8pin的供电转接线、专属白色灯光幻光接口线、一条可拆卸的铝合金显卡支撑架以及一张彩色卡通形象卡片。
二、架构解析
NVIDIA GeForce RTX 5090 D使用了最新的Blackwell架构,官方网站上明确标示其为 "专为游戏玩家与创作者打造的胜利平台",这代表了其游戏和AI性能的巨大提升。英伟达表示,现代对画质的追求已经远超摩尔定律所提供的计算能力,因此引入神经网络渲染显得尤为必要。
基于神经网络渲染,Blackwell架构中的多个流处理单元(SM)增强了处理吞吐量,并与Tensor Core进行了紧密的整合,提升神经网络着色器的性能。
为了满足下一代DLSS多帧生成的帧率稳定性需求,Blackwell架构引入了基于硬件的Flip Metering,将帧率逻辑迁移至显示引擎,使GPU能够更精确地管理显示时间。同时,显示引擎的像素处理能力提高了两倍,以支持更高的分辨率与刷新率,从而释放DLSS 4的性能潜力。
在第五代Tensor Core中新增对FP4浮点运算精度的支持,FP4作为一种较低的量化方式,与数据压缩相似,显著减少模型推理数据存储的大小,并提高计算效率。相比FP16,FP4显著降低了显存使用,而GPU性能却提升了两倍。在生成式AI应用中,GeForce RTX 5090 D的FP4图像生成速度是RTX 4090 D上FP16的三倍,显存消耗则减少一半。
在RT Core方面,优化了光线、路径与三角形相交的检测效率,使得在复杂几何形状下的光线追踪性能表现更为卓越。在新一代Blackwell架构下,光线、路径与三角形相交的检测效率是上一代的两倍,而使用RT Core的Turing架构的效率则提高了八倍,通过增强压缩进一步减少内存占用,相比上代显存使用率减少了25%,光线追踪效果也得到了前所未有的提升。
除了在技术上的突破,Blackwell架构的GPU还配备了GDDR7显存。GDDR7采用的是PAM3信号编码相较于GDDR6和GDDR6X有所不同。PAM3在每两个周期的数据传输中达到3位,带宽进一步提升,速度达到30Gbps,并且更节能。
通过PCIe 5.0和DisplayPort 2.1b UHBR20,Blackwell框架实现了增强,单通道支持20Gbps带宽,从而支持高达8K 165Hz的显示效果。Blackwell架构GPU集成了第九代NVENC,支持H.264/H.2654:2:2编码时的8位和10位视频输出。
具体而言,索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡基于最新一代GB202核心及TSMC 4N制程工艺,配置21760个CUDA核心、680个Tensor核心、170个光追核心、680个纹理单元、176个ROP单元,相比RTX 4090的核心规模基本相当,但解锁了完整的GPC单元,自内单元内的SM和TPC组数量也随之增加。
默认情况下,索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡的GPU频率范围为2017MHz - 2317MHz。显存升级为512-bit 32GB GDDR7,带宽达到了1792GB/s。TBP功耗为600W,相较于上代RTX 4090增加了150W。
三、理论跑分
接下来进入理论测试阶段,索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡高端定位,自带双BIOS切换及超频能力,因此在测试前将介绍索泰官方更新的FireStorm超频应用,此应用允许用户实时查看显卡状态,进行性能调节及BIOS切换。
进入FireStorm主页,整体采用黑金色调,默认展示性能标签页,顶部显示显卡关键信息,下方可调节显卡、显存频率、电压与功耗等指标。在实际性能测试中,核心频率与BOOST频率已被设置到最高。
在风扇标签页中,提供自动与手动风扇调节模式,用户亦可通过曲线模式对风扇速率曲线进行更精细的调控。右侧有提及的双BIOS切换开关,切换时出现提示窗口,告知用户当前模式与切换状态,确认模式切换需重启系统方可生效。
此外,FireStorm应用还提供更全面的显卡信息展示及灯效控制,设置标签中允许用户进行界面个性化。具体功能建议在购买索泰500系列显卡后自行体验,目前IT之家获得的版本为5.0.0.001C,官网正式版可能存在版号差异。
先进行烤机测试,单烤甜甜圈20分钟,显卡核心温度保持在75.9℃附近,显卡频率2595MHz,功耗稳定在575W左右,与公版保持一致。
在3DMark Time Spy DX12测试中,索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡得分为49004分,相比GeForce RTX 4090公版的34725分,提升幅度达到41.1%,差距明显。
在3DMark Time Spy Extreme DX12测试中,显卡得分为26112分,而GeForce RTX 4090公版得分为19924分,提升幅度达到31%。
在3DMark Portal Royal实时光追测试中,索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡综合得分为36239,而GeForce RTX 4090公版得分为25080,提升幅度高达44.5%。
从上面的测试可以看出,索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡相较于上一代RTX 4090 D有着显著提升,理论性能增幅在30%-45%左右,足以表明其图形性能的迅猛进化。
四、游戏实测
尽管NVIDIA声称首批支持DLSS 4的游戏数量高达75款,但目前能顺利开启DLSS 4选项的游戏仍非常有限,因而我们继续测试主流游戏中的DLSS 3与帧生成表现,同时以《赛博朋克:2077》和《心灵杀手 2》为例,具体分析DLSS 4技术在实战中的效果。
1、《CS2》
在版本更新之后显著提高性能要求的《CS2》中,索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡以4K分辨率和高画质模式下,达到了430帧的平均帧数,1%低帧数为188帧。
而在2K分辨率和高画质设置下,表现更是优异,平均帧数达到634帧,1%低帧数提升至240帧,可以轻松应对4K和2K高刷屏需求。
2、《无限暖暖》
在《无限暖暖》这款优化出色的端游中,对硬件资源需求极大,完全不逊色于3A大作。
在4K分辨率、极致画质及TAA抗锯齿下,游戏平均帧数为168帧,1%低帧数124帧;
在4K分辨率、极致画质以及DLSS抗锯齿下,游戏平均帧数为165帧,1%低帧数128帧;
在2K分辨率、极致画质与上采样抗锯齿下,游戏平均帧数为231帧,1%低帧数161帧;
在2K分辨率、极致画质与DLSS抗锯齿下,游戏平均帧数为190帧,1%低帧数148帧;
无论是2K还是4K分辨率下,1%低帧数均超过120帧,RTX 4090 D在4K分辨率下则仅保持约100帧的平均表现,提升明显。
3、《古墓丽影:暗影》
借助《古墓丽影:暗影》这款光栅游戏,可以检验索泰 GEFORCE RTX 5090 D 32GB SOLID OC显卡的光栅性能。
在4K分辨率与最高画质下,游戏平均帧数达到244帧;
在2K分辨率和极致画质下,游戏平均帧数为373帧;
与前代RTX 4090相比,在4K和2K分辨率下,游戏平均帧数分别提升了35.8%和46%。
4、《极限竞速:地平线 5》
《极限竞速:地平线 5》在优化上表现出色:
在4K分辨率与极端画质下,游戏平均帧数为205帧,1%低帧数102帧;
在2K分辨率与极端画质下,游戏平均帧数为253帧,1%低帧数105帧;
与前代RTX 4090相比,4K和2K分辨率下的平均帧数分别提升了28%和38%。
5、《孤岛惊魂 6》
支持DLSS 3的光追游戏《孤岛惊魂 6》对GPU性能和CPU单核性能均有较高要求,通过实测:
在4K分辨率与极高画质下,游戏平均帧数为190帧,1%低帧数80帧;
在4K分辨率与极高画质开启光追与DLSS质量下,游戏平均帧数为166帧,1%低帧数77帧;
相较于前一代RTX 4090,4K默认和光追下游戏平均帧数提升分别为47.1%和47.3%,可见效果显著。
在2K分辨率与极高画质下,游戏平均帧数达到255帧,1%低帧数128帧;
在4K分辨率、极高画质、开启光追及DLSS质量下,游戏平均帧数为209帧,1%低帧数105帧;
与前代RTX 4090相比,4K默认和光追下的平均帧数提升分别为42.6%及53%。
6、《黑神话:悟空》
作为“众生平等”的代表作品,《黑神话:悟空》对光线追踪与DLSS技术支持深入,造成其在高分辨率下的高硬件要求。在4K分辨率、超高画质下,强如RTX 5090 D也仅能保持30帧,我们直接观察DLSS与帧生成的表现。
在4K分辨率、影视级画质、50%超采样分辨率下,游戏平均帧数为101帧;
在4K分辨率、影视级画质、50%超采样分辨率、高全景光追与帧生成下,游戏平均帧数为133帧;
不开启光追选项时,4K分辨率与影视级画质运行,而帧数超过百帧,开启高等级全景光追和帧生成后,帧数超过130,带来电竞级体验。
在2K分辨率、影视级画质与50%超采样分辨率下,游戏平均帧数为116帧;
在2K分辨率、影视级画质、50%超采样分辨率、光追和帧生成下,游戏平均帧数为178帧;
从上可见,2K分辨率下不开光追时改善幅度有限,而开启光追与帧生成后,帧数则大幅增长超过40帧,实属不小。
五、DLSS 4 游戏体验
目前,RTX 40系列已支持的DLSS 3技术实践效果已经相当强劲,而DLSS 4在DLSS 3基础上进一步提升帧生成性能,使用全新的多帧生成技术,与第五代Tensor Core强大性能结合,通过AI为每帧最多生成3个额外帧,极大提升游戏的FPS水平。
DLSS 4结合全套DLSS技术,如光线重建、超分辨率及DLAA功能,最多可达传统图像渲染的8倍帧率。有了DLSS 4技术,使用RTX 5090 D的玩家可轻松享受4K 240 FPS全景光追的完美性能体验。
多帧生成技术与NVIDIA Reflex低延迟技术相结合,保持较低的游戏延迟,确保游戏的操作响应不受太大影响。毕竟,GPU在为每帧进行计算时,涉及到超分辨率、光线重建和多帧生成多重环节,延迟增加不可避免。然而,GeForce RTX 50系列的第五代Tensor Core在AI处理性能上提升约2.5倍,这也意味着游戏的延迟变化能够得到较好控制,针对这一点,我们将在后续的游戏案例中体验。
Blackwell显示引擎中的DLSS 4技术至关重要,增强了其像素处理能力,以满足更高分辨率和刷新率对DLSS 4技术的要求,提升了最高1倍的像素处理能力。
DLSS 4的重大升级还包括模型架构的飞跃,DLSS光线重建、超分辨率与DLAA特征均受到实时Transformer模型驱动,提升生成像素的质量,结合自注意力机制,能够更准确认识场景关系,从而使生成的像素更稳健,减少伪影,丰富运动细节和提升边缘平滑度。
官方表示,目前已推出的超过75款支持DLSS多帧生成技术的游戏和应用均可在GeForce RTX 50系列GPU上享受DLSS技术升级,许多知名3A大作也将在50系列显卡正式发布不久后推出DLSS 4体验,包括《心灵杀手 2》、《夺宝奇兵:古老之圈》、《黑神话:悟空》、《星球大战:亡命之徒》及《寂静岭2:重制版》等热门作品。
IT之家选取了现阶段品质与支持DLSS 4表现最佳的游戏《赛博朋克:2077》与《心灵杀手 2》进行详细测试,下面我们先从《赛博朋克:2077》的表现来看。
在4K分辨率和超级光追设置下,游戏平均帧数为60帧;
在4K分辨率和超速光追设置下,游戏平均帧数为33帧;
在未使用DLSS技术的情况下,这款游戏在4K分辨率和光追画质下,对于硬件的压力非常大,5090 D显卡基本维持在60帧,开启路径光追时帧数直接减半。
如果不启用光追和DLSS,采用4K分辨率与超级画质时则能达到约116帧的平均表现。
接着查看多帧生成选项,打开后出现DLSS Multi Frame Generation的生成倍率选择,选项为2x、3x和4x。
通过最高的4K分辨率与路径光追设置,选择DLSS性能档,依次切换2x、3x与4x的多帧生成选项后,游戏的平均帧数得到显著提升,2x时为164帧,较不开光追与DLSS的4K+超级画质提升将近50帧,3x多帧生成突破200帧,4x多帧生成则达到292帧,实际表现相当骇人。
从性能角度看来,DLSS 4技术相较于传统光栅性能提升的思路,极具前瞻性,通过借助AI与插帧技术,为光追游戏提供了飞跃性能的提升,收益尤为显著。
当然,插帧占用的延迟不可避免,因此我们对比了开启与关闭多帧生成的延迟表现。
在关闭多帧生成时,同一场景下设置4K超级画质的延迟为15ms,4K超级光追延迟为18ms。
而在开启超速光追画质后,2x、3x与4x多帧生成延迟分别是21ms、24ms和27ms。
显然,多帧生成会导致一定的延迟增加,不过对于《赛博朋克:2077》这款游戏而言,实际影响并不明显。启用多帧生成后,各档位间延迟增幅为3ms,总体延迟保持在30ms以内,游戏过程中即使是射击与对战中的体验也没有延迟滞后感觉。
下面是《心灵杀手 2》的表现。在4K分辨率和原生最高画质下,游戏平均帧数为74帧,此时延迟仅为36ms。
而开启光追后,游戏平均帧数马上降至较低水平:
4K分辨率、原生最高画质与光追下,平均帧数仅40帧,1%低帧数37帧;
4K分辨率、原生最高画质与路径光追下,帧数降至28帧,1%低帧数25帧;
与此同时,开启光追后游戏的平均延迟大幅上升,先前的36ms提升至65ms及92ms,尽管帧数达到了30帧的流畅线,游戏体验依旧不够舒适。DLSS 4技术能带来改善吗?
启用多帧生成后,游戏表现立刻逆转。2x、3x与4x多帧生成下的平均帧数分别为132帧、186帧与249帧,虽然不如《赛博朋克:2077》的近300帧那么夸张,但性能提升明显。
至于游戏的平均延迟,在开启多帧生成后相较于4K及路径光追下减少了一半,仅为45ms,2x、3x与4x多帧生成的增幅也维持一致,均为3ms的递增,得益于NVIDIA Reflex的低延迟特点。考虑到《心灵杀手 2》刚刚适配DLSS 4,当前延迟表现尚可,期待日后能进一步优化。
同时,最新的NVIDIA Reflex 2技术可以进一步降低游戏的延迟,提升操作体验与响应速度。在过去的四年里,NVIDIA Reflex已在超过100款游戏中被集成,提供了50%的延迟减小效果。新的Reflex 2将通过引入Reflex Frame Warp技术,将鼠标输入及时同步至渲染帧,从而实时刷新与控制游戏渲染,旨在实现定制化的低延迟体验。
NVIDIA Reflex 2未来将不仅适用于主流竞技游戏,还包括动作类游戏如《无畏契约》等。期待该技术能够在开启DLSS 4之后,赋予更为出色的低延迟表现。
那么,多帧生成是否会影响画质?也就是画面是否会显得更模糊?为了验证这一点我们在《心灵杀手 2》中对同一场景的三种不同画质设置进行了截图,分别为:
4K原生画质与路径光追;
4K最高画质+DLSS性能档(1080P渲染)+4x帧生成;
4K最高画质+DLAA(4K渲染)+4x帧生成;
我们借助NVIDIA ICAT工具进行比较,三者在不放大的情况下是几乎无法分辨出差别,因此挑选了三处细节进行放大比对。
首先是警员手臂衣服上的FBI标志,对比发现,左侧与右侧分别是DLAA(4K渲染)和原生4K画质,中间为DLSS性能(1080P渲染),放大后发现中间的FB字样略显模糊,但左右两者基本看不出清晰度上有显著差异。
同样在警员卷发及其旁边的树叶上也可发现中间画面稍微模糊,左右图像却难以发现差别。
也就是说,在物理渲染分辨率上存在固有鸿沟,DLSS技术确实无法尽数弥补画质差距,但如保持与原生画质相同分辨率(即开启DLAA),画面清晰度和细节几乎无异,另外我们这种对比分辨率低的情况下的相互比较有些过于苛刻,正常游戏情况下,无论是DLSS性能档(1080P渲染)还是DLAA(4K渲染)都不会出现明显的糊图或锯齿问题。因此,对于关注画质的用户,建议直接采用DLAA模式。
六、总结
作为继任RTX 4090 D的新一代卡皇,索泰GEFORCE RTX 5090 D 32GB SOLID OC不仅成功完成了自己的使命,同时依赖DLSS 4技术开创了全新的游戏性能领域,在画质及延迟影响非常小的情况下,带来了倍数级的性能提升,显而易见的技带来了演进体验。DLSS 4技术的成功更为未来显卡性能的升级指明了方向,在关键帧渲染上,过渡帧将通过AI补帧进行填充,以此呈现最佳性能效果;光追游戏的开发也将得到更好的支持与优化。
索泰GEFORCE RTX 5090 D 32GB SOLID OC显卡设计采用传统的黑金配色,配上刚硬的装饰线条与RGB LOGO灯光,不仅传达了高端质感,也满足了玩家个性需求。这种设计思路着实不错。同时,这款显卡的双BIOS设计使得玩家可以任选运行噪音模式,兼顾性能与静音环境,这一举措值得称赞,毕竟将自由选择权交给玩家才是买卖双方该有的互动态度。
广告声明:此文中所包含的对外链接(包括但不限于超链接、二维码、密码等形式)所提供的信息,仅为方便读者选择,具体情况请以官网信息为准。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。