截止目前,《黑神话:悟空》在Steam平台的销量已经达到了1900万份,全网销量保守预估已超2000万分。作为国产第一款走向世界,极限跨圈的3A游戏,着实令人兴奋。并且由于游戏内很多物品和景色均采用实地取景,甚至吸引了不少鉴宝博主的游玩和点评。
关于黑神话的成功不必多说,而首批持观望态度的玩家,现在也正打算升级自己的配置,来体验真正影视级的画面,下面就让我们来一起看下耕升GeForce RTX 4070 SUPER 踏雪 OC 定制版显卡。
耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在外包装上采用了黑神话天命人主题,即便是踏雪系列标志性的纯白色调,这次也改为了黑色。
下面来看显卡本体,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡的正面已就位纯白色调,仍然保持了踏雪系列的风格。整体尺寸约为315×122×40mm(不含挡板),占用2槽空间,作为一款中高端产品来说,它的厚度控制的比较出色。
散热方面,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡整体采用了“风雪”散热模组。主动散热的风扇部分,采用优化后的3个92mm炫风之刃风扇,经改良后提升风流量,并减低声噪,有效加强散热,纤巧的体积更可大大减低对机箱空间的要求。而在扇叶外侧,还新增了特殊构造风扇罩,大幅提高气流稳定性并能降低噪音。而风扇中央的扇标设计,则是熟悉的“雪花标”。
内部散热上,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡采用大面积紧密散热鳍片,高效铜板搭配4跟6mm复合式热导管,并且热导管加入了镀镍设计,进一步加强抗氧化能力。
耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡的背板采用了定制外观,以天命人为主要视觉,神态表情刻画颇为细腻,也彰显了游戏内角色和游戏外玩家,重走西游的决心。
散热方面,背板采用了穿透式散热系统设计,右方进一步加大积镂空间,配合散热器上第三组风扇的风流直接穿透散热鳍片以及镂空的PCB设计,令显卡温度进一步下降。
视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。从侧面可以看出耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相当轻薄。
耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡侧面可以看到16pin供电接口,它的TDP功耗为220W,建议电源600W及以上。
本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了的760亿个晶体管,而在RTX 30系显卡中为280亿个。
与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。
本次发布的RTX 4070 SUPER共有7168个CUDA核心,提供了35.5-TFLOPS算力;56个第三代Ada RT Core拥有82.1 RT-TFLOPS;224个第四代Tensor Core可提供568 Tensor-TFLOPS(AI TOPS)。
RTX 4070 SUPER的L2 Cache容量为48MB,带宽为504 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性,我们以两张图来简单说明L2缓存的作用。
在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。然而由于L1缓存需要离内核非常近,不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。
如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张RTX 4070 SUPER更接近于RTX 4070 Ti,但功耗相比RTX 4070只提升了20W。
首先介绍一下测试平台,为了保障耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡的性能发挥,我们的平台采用了上代旗舰i9-13900K。
下面还是来看看本次评测的显卡参数,目前最新的GPU-Z为2.60版本,参数识别较为详细。
耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡拥有7168个CUDA,Boost频率为2550MHz,较公版的2475MHz提升较大。
显存方面,12GB GDDR6X显存,位宽为192bit,显存带宽504 GB/s,光栅单元和纹理单元为80和224。
既然是黑神话悟空的定制版显卡,那么就先来测试一下这款由虚幻5引擎制作的游戏。另外《黑神话:悟空》支持DLSS以及FSR,并且均可开启帧生成,但是DLSS可以搭配全景光线追踪提供更逼真丝滑的游戏体验,所以我们本次DLSS测试,均在开启帧生成下记录帧数。
测试分别在2K及4K分辨率下进行,虽然RTX 4070 SUPER这张显卡定位2K高帧率的3A游戏,不过可以看到,在DLSS超级性能模式下,这张耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡也有着82帧的流畅水准。不过想要在打斗中享受电竞级帧率体验,还是建议在2K分辨率下。
另外目前《黑神话:悟空》在设置上还有几点需要注意,就是超采样清晰度和分辨率。
《黑神话:悟空》没有提供直接的档位,而是滑块拖数字来改变档位。经过我们实测,在同一档位中,DLSS的缩放比例是相同的,所以得到的帧数也完全相同。大家只看“质量”或“性能”档位即可。
还有就是分辨率调节,《黑神话:悟空》目前没有全屏独占,只有窗口化全屏,所以在游戏内设置低分辨率,而桌面仍然用高分辨率的话,帧数提升并不明显。
经过实测,我们发现两端同步调节分辨率,相比只降低游戏分辨率,帧数差距非常大。
虽然大部分游戏大家都没有将分辨率玩的情况,但《黑神话:悟空》采用的虚幻5引擎,非常耗费配置,如果玩家想通过降低分辨率来获得流畅的帧数,还需特别注意。
光线追踪对比
《黑神话:悟空》在模型上,采用了虚幻5引擎的Nanite虚拟微多边形几何体系统,它消除了LOD的繁琐任务,可以扫描并导入极高精细程度的模型。并且,这不会影响性能,仍然可以获得实时帧速率。因此,在游戏中我们可以看到大量高精度模型,而其中很多都是直接扫描自实地。
下面直接看效果对比。
在开启光追后,上图充分展示了“多重反射光线追踪间接照明”,自然色彩的光线能够在整个世界中反弹两次,创造更真实的间接照明和遮蔽效果。在河边的树林中,关闭光追的情况下,场景非常暗,而经过间接照明,能提供更准确的场景和物体光照,符合自然规律,使每个场景的沉浸感拉满。
《黑神话:悟空》最能体现光追效果的地方还是在水中,除了之前大家比较熟悉的光线追踪反射,这次游戏中还加入了“光线追踪焦散”。
当足量的光线从特定表面的反弹出来时,照亮一些物体的表面区域,使其亮度高于场景中的均值。上图最能说明这一点,其中水面上的涟漪显示在水下附近物体的表面上。这样一来,游戏中的水体再也不会像以前一样,如同镜子般光亮, 而是有了更真实的水体效果。
DLSS 效果对比
本次《黑神话:悟空》中,超分辨率采样也是大家关注的焦点之一,毕竟以目前显卡的性能来说,即便是RTX 4090,要想在4K分辨率下开启光线追踪跑原生影视级画质,也是无法流畅运行的。
上面我们提到过《黑神话:悟空》采用了Nanite虚拟微多边形几何体系统,可以导入极高精细程度的模型。所以DLSS在“猜想”上,也有了更多凭据。
而《黑神话:悟空》也是目前我见过游戏中,DLSS效果最好的。可以看到,由于有复杂模型作为支撑,即便是在超级性能模式中,场景中所有的景物,包括主角的衣服,都和原生画质几乎毫无区别,但帧数相比原生画质,足足提升了200%还多。所以如果你感觉帧数不够,大可以将超采样清晰度降低一些,来获得稳定的高帧率。
全局光照 效果对比
除了光线追踪和DLSS,《黑神话:悟空》还有一个画质选项有较多争议,就是全局光照。有的玩家说要开到最高,有的说最低才更真实。
下面我们就来实际对比一下,从图中能明显看到,在全局光照低的画面中,亮的地方更亮,暗的地方又难以视物。而在全局光照超级中,画面整体更加平衡,即使暗的地方,也保有更多细节。
所以经过几组对比,大家很明显能发现“全局光照”这个概念,重点就在全局二字。
举个简单的例子,在完全漆黑的房间中,有一束手电光。在没有全局光照的情况下,我们只能看到这一束光所照的范围。而有全局光照的加持,我们能借助这一束手电光的反射来看到整个房间的全貌。
并且经过实测,全局光照档位的高低,对帧数完全没有影响,所以大家在设定画面时,建议把全局光照开到最高。
本次耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡主要对比它的上下型号,RTX 4070 Ti以及RTX 4070。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在FS测试中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070,其中FS提升16%;FSE提升16%;FUS提升21%,综合提升18%。对比RTX 4070 Ti,综合成绩相差3%左右。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相较RTX 4070的提升分别为:TS提升14%;TSE提升14%,综合约为14%。对比RTX 4070 Ti,综合成绩相差8%左右。
PortRoyal是3DMARK中专门针对光追性能的测试项,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相较RTX 4070的提升约为14%。对比RTX 4070 Ti,相差8%左右。
下面我们再来看看3DMARK中新增的一些具体应用场景的测试。
Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。
耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡对比RTX 4070,提升为16%。
在DLSS 3的理论测试中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在2K分辨率下DLSS开关相比RTX 4070的提升为16%/22%;4K分辨率,提升约为15%/22%。
从整体的理论测试成绩来看,传统的FS/TS/PR三项测试,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070综合提升约为16%左右;相比RTX 4070 Ti的差距在6%左右。
由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。
在《极限竞速:地平线5》中,其中耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070提升明显,1080p达到12%,2K分辨率提升14%;4K分辨率提升17%,综合提升14%。
在《刺客信条:幻景》中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070的提升分别为:1080p提升8%;2K提升10%;4K提升15%,综合提升11%。
在《无主之地3》中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070的提升分别为:1080p提升21%;2K提升17%;4K分辨率提升16%,综合提升18%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。
性能方面,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070的提升分别为:1080p提升20%;2K提升24%;4K提升29%,综合提升24%。
在“游戏测试标杆”的《赛博朋克2077》中,耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在超级画质下,2K分辨率百帧完全没有问题的;在光追超级画质下2K流畅运行同样没有问题;而作为次世代光追体验的超速模式中,2K分辨率下只有52帧。
不过上面我们的测试均为DLSS 2模式,尚未开启DLSS 3,下面在DLSS 3的专项测试中,能够看到帧数上的飞跃。
从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
另外《赛博朋克2077》更新了DLSS 3.5,支持光线重建技术。在上面的测试图中不难发现,光线重建能够更加精准的计算出反射部分的效果,接近于亮面金属表面的反射中,未开启RTX能够看出画质明显的区别,不再赘述。重点在于DLSS 3.5的开关效果,除了广告牌上所显示的内容更清晰外,放大后能够看到远处电线以及工业区建筑的细节外观。
随着NVIDIA DLSS、NVIDIA Reflex以及先进的光线追踪技术的普及速度不断加快,现在已有超过600款RTX游戏和应用,为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。
在DLSS 3的测试中,首先来看《赛博朋克2077》的,我们同样会将DLSS 3与DLSS 2的结果进行比对。
本次我们分别对《赛博朋克2077》,在三档画质下进行了DLSS 3的帧数测试,所有档位均开启DLSS质量记录帧数。
可以看到在2K分辨率下,在是光追超速模式,开启DLSS 3后耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡能达到81帧的成绩,已经是流畅运行标准。
另外DLSS 3技术主要针对于CPU瓶颈的游戏,所以也能够看到在越低的分辨率,帧数提升越大,其中光追超速的1080p分辨率能够达到51%左右的提升。
《星空》仍在持续更新,在加入了DLSS 3后,整体来看效果非常好,即便在4K分辨率下也能够达到87帧的流畅水准。
其中1080p分辨率下DLSS 3相比DLSS 2提升达到62%;2K分辨率提升50%;4K分辨率提升43%。
《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡也有较明显的体现。在3种分辨率中,开启DLSS 3相比DLSS 2的提升分别为40%/29%/12%。
V-Ray
在生产力工具上,我们测试了最新版本的V-Ray渲染器,选择使用GPU渲染的CUDA测试和RTX测试,成绩如图。
Blender
Blender是一款专业的三维渲染软件,目前推出了固定的benchmark跑分软件,省去了安装软件下载素材的麻烦。软件会自动渲染测试monster/junkshop/classroom共三个场景。
耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡得分分别为3074/1498/1590分,平均2054分。
AI时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力,不过目前NVIDIA推出了全新的TensorRT插件。可以充分调用Tensor算力,下面我们来测试一下耕升GeForce RTX 4070 SUPER 踏雪 黑神话悟空联名款显卡在这方面的性能表现。
我们的测试使用UL Procyon进行,在最新的测试项目中,SD1.5可分为INT8(8位整数)和FP16(半精度浮点)运算。
可明显看到,采用INT8的运算时间更快,不过这并不意味着INT8在性能上更具优势。
这里简单说明一下,INT8是使用更低精度的整数表示数据的一种方式,用于进一步减小模型的存储空间和加快计算速度。使用INT8可以在一定程度上降低模型的计算复杂度,特别适用于部署在资源有限的设备上,如移动设备、嵌入式设备等。
FP16则是一种占用存储空间较小的浮点数表示方法,用于在深度学习模型中减少模型参数和中间结果的存储需求,从而节省内存空间并提高计算效率。
不过在测试中并没有包含FP32的单精度浮点运算,其实在深度学习模型中,完整的逻辑应当包含在内,下面也简单进行介绍。
FP32是常见的浮点数表示方式,提供了更高的数值精度,适用于大多数深度学习模型的训练和推理过程。FP32 的精度比FP16高,但会占用更多的存储空间和计算资源。
所以从运算精度上来说:FP32 > FP16 > INT8;而从内存占用上来说是:INT8
上图测试结果为模型更复杂的SDXL,可以看到测试总时间为261.141s。
另外,UL Procyon的AIGC测试同样使用了StableDiffusion进行批量生成,相较我们手动生成图片,结论更为精准。
目前RTX 视频超分辨率(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。
RTX 视频超分辨率是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启RTX 视频超分辨率不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。
(点击放大查看原图)
在下面这幅图的对比中,可以明显看到开启RTX 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。
不过需要注意的是,RTX 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2K以上,则基本很难看出区别。
这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
在最新的Furmark中,已经集成了相当多的功能,甚至还有benchmark跑分,不再是单纯的拷机软件。
耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡通过1小时左右的拷机测试,温度在66℃左右,热点温度在78℃左右。
RTX 40 SUPER系列显卡在整体定位相信大家早已了解,而RTX 4070 SUPER这个型号个人认为是目前3A游戏玩家首选。
综合来看,RTX 4070 SUPER相比RTX 4070提升在15-20%左右,与RTX 4070 Ti的差距在5%左右,提升是巨大的,基本已经追到了RTX 4070 Ti的级别。
虽然RTX 4070 SUPER它定位2K分辨率的高帧光追游戏,但不管是日常网游、独立游戏,或是传统3A游戏,在4K分辨率下都能够达到流畅甚至电竞级水准。
本次耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡其实收藏意义更大,作为国产第一款采用虚幻5引擎的3A游戏。不仅走向世界,更创造了多项纪录,甚至传奇游戏制作人小岛秀夫,都在《黑神话:悟空》销量破1000万分的时候转发了图片,表示肯定。
这对于中国游戏玩家和中国单机游戏行业来说,必定是载入史册的一年。相信时隔多年后,当你关闭电源后,看到机箱中静静“躺着”的天命人,依然能记得当初的那份感动。
而经过《黑神话:悟空》这道“大餐”,目前越来越多优秀的国产3A游戏正在涌现出来,也让玩家充满期待。
目前耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在各大电商中均有售卖,感兴趣玩家不妨前去了解一下。
(9000450)
相关教程
2023-06-06
2023-05-11
2023-04-13
2024-09-13
2024-08-27
2023-05-16
2023-05-18
2023-04-12
2023-06-07
2024-11-18
2024-11-18
2024-11-16
2024-11-16
2024-11-15
2024-11-14