5月18日,NVIDIA对外发布了其最新GeForceRTX40的中端游戏显卡——GeForceRTX4060系列,此系列显卡包括了5月23日正式解禁的NVIDIAGeForceRTX4060Ti8G,以及两款均在7月才正式解禁的NVIDIAGeForceRTX4060Ti16GB与NVIDIAGeForceRTX4060。
NVIDIAGeForceRTX4060Ti8G,零售报价3,199
NVIDIAGeForceRTX4060Ti16GB,零售报价3,899
NVIDIAGeForceRTX4060,零售报价2,399
规格讲解
作为全新的中端游戏显卡,NVIDIAGeForceRTX4060Ti8G采用了NVIDIA最新AdaLovelace架构核心,是目前NVIDIA最强劲的游戏显卡架构,也是近年来NVIDIA推出的每瓦性能比最为出色的架构之一。
于是我们可以看到NVIDIAGeForceRTX4060Ti8G显卡身上看到采用的AD106核心,此是继AD102、AD103,以及AD104核心后的第四款AdaLovelace架构核心。AD106的核心面积更为小巧仅为190mm?,比上代RTX30系列最小的GA107(200mm?)更小巧些。
而小巧的核心并不代表AD106核心的性能弱,得益于TSMC4nm工艺技术的发展与优秀AdaLovelace架构,AD106核心有着相当不错的规格。一个完整规格的AD106核心包括了3个GPC(图形处理集群)、18个TPC(纹理处理集群)、36个SM(流式多处理器)、?个带有4个32Bit显存控制器的128Bit显存位宽,以及1个NVENC和2个NVDEC。
GeForce_RTX_4060_Ti_Diagram
NVIDIAGeForceRTX4060Ti8G显卡经过一轮操作之后,最终只是削减了一组TPC,与一个NVDEC,看起来还是相当不错的,起码那个大大的L2缓存子系统没有进行削减。
显卡规格参数对比,点击上图可放大
GPUBlockDiagrams图或者有些朋友是看不懂的,这里我们详细地为大家进行规格对比与规格。此次推出的NVIDIAGeForceRTX4060Ti8G显卡核心频率为2310MHz、Boost频率为2535MHz;显存规格为8GB/128Bit的18GbpsGDDR6显存;其TGP功耗仅为160W,FE公版为12VHPWR接口,而AIC的非公版大部分采用的是8Pin辅助供电接口。
不过从纸面的规格上来看,NVIDIAGeForceRTX4060Ti8G显卡是比上代RTX3060Ti显卡要弱些的,至于之后其性能表现最终会是怎么样,我们就得通过一系列的性能测试才知道了。
32MBL2大缓存
在测试前我们有必要来再讲一下RTX40系列显卡中的L2大缓存,毕竟直到现在有比较多的玩家还是比较担心RTX40系列显卡显存位宽上的这个问题?最典型的例子就是,NVIDIAGeForceRTX4060系列显卡仅为128Bit显存位宽,而上代的同定位NVIDIAGeForceRTX3060系列显卡显存位宽分别为192Bit与256Bit,从带宽上来看的确是差别有些大,于是NVIDIA给我们详细地讲解了为何AdaLovelace架构会是这样的显存规格。
完整的AD102核心
首先我们从之前的GPUBlockDiagrams图,以及NVIDIA官方AdaLovelace架构白皮书上可以了解到:包括最新的AD106核心,AdaLovelace架构的每个核心每个SM单元内部构成是一致的,核心之间的区别在于不同的核心模块构成。
而每个SM单元中都配上了一个128KB的L1缓存,一个GPC集群中最可以容纳12个L1缓存,其次每个核心中配备上了更大的、更高速的L2缓存,这样可以最大限度地降低访问延迟。
按照NVIDIA的说话,过往的GeForceGPU由于L2缓存比较小,导致的性能与效率的相对较低。具体表现就是GPU在缓存系统交互数据的时候,较少的L2缓存会出现较多的L2“缓存未命中”(“M”标识),这样会导致大量的未命中数据需要跑到VRAM显存缓存中才能处理,这效率看着的确有点低效,也会让显存容量占用较高。
而AdaLovelace架构采用更大的L2缓存容量后,可以实现提升更高的L2“缓存命中”(“H”标识),GPU只出现小概率从VRAM显存上获取数据。
当然NVIDIA这里还给出了一个比较有意思的测试是:一块是具备32MBL2缓存的RTX4060Ti,与一块特殊的仅使用2MBL2的RTX4060Ti测试版显卡进行测试(模拟上一代显卡128位GPU的L2缓存大小)。*PS,实现不应该是模拟4MBL2缓存的吗?
结果自然是32MBL2缓存的RTX4060Ti肯定是厉害的,在各种游戏与组合基准测试中,相比仅使用2MBL2的RTX4060Ti测试版显卡平均降低的50%的显存总线流量。而这样的50%的流量减少,NVIDIA官方比较有意思的定义为可以让GPU能够更有效地使用其显存带宽,效率提升可达近2倍。于是大家可以看到RTX4060Ti的288GB/s峰值显存带宽被等于让AmpereGPU的554GB/秒峰值显存带宽。
当然这里NVIDIA有一点是偷换了概念,从显存规格上来看,RTX4060Ti最大显存带宽仍是288GB/s,这个是一样没变的。只不过在AdaLovelace架构32MBL2大缓存加持下,RTX40显卡有着更低的显存占用,以及低延迟的数据访问。
另外在笔者认为,RTX40显卡这样的显存规格,与AMD的MCD设计走着不一样的路子,但最终更多的是出于成本&效率的均衡考虑。毕竟主流的16GbMonoDie显存颗粒单颗容量就达到2GB,4颗显存即可实现8GB显存版本RTX4060Ti,而8颗即组成了7月将要发布的RTX4060Ti16GB。
详细的讲解,各位朋友可以直接到NVIDIA官方网址上查看到:
ADeeperLookAtVRAMOnGeForceRTX40SeriesGraphicsCards【英文原版https://m.nvidia.com/en-us/geforce/news/rtx-40-series-vram-video-memory-explained/】
深入了解GeForceRTX40系列显卡上的显存【中文原版https://m.nvidia.cn/geforce/news/rtx-40-series-vram-video-memory-explained/】
NVIDIAGeForceRTX4060Ti8GFE
此次NVIDIAGeForceRTX4060Ti8G,我们仍是推行拿到了NVIDIA特定的NVIDIAGeForceRTX4060Ti8GFE显卡【下述简称“RTX4060Ti8GFE”】。而AIC非公显卡,只能是24号才能让大家见面了。
RTX4060Ti8GFE采用了RTX40系列FE公版的同款外观设计,同款的产品包装,设计和保护都相当好。
只不过RTX4060Ti8GFE金属框架不再是采用低调的黑化处理,而是采用更突出的亮边处理,整块的色调也显得更亮。
当然经典的反向风扇设计仍是得到保留。
朋友们来看,如果不是RTX4060Ti8GFE显卡设计更亮一些,真的很难区别出RTX4060Ti8GFE与RTX4070FE两块显卡,甚至其两块卡的重量基本一样。
混合在一起你们能区别出哪块是哪块吗?省流开奖,从左往右分别是:GeForceRTX2070SUPER、GeForceRTX3060TiFE、GeForceRTX3070FE、GeForceRTX4060TiFE、GeForceRTX4070FE、GeForceRTX3080TiFE、GeForceRTX4080FE,以及GeForceRTX4090FE。
至于各位朋友认为RTX20,RTX30还是RTX40更好些看,那就真的各花入各眼。
RTX4060Ti8GFE显卡采用了双风扇、双槽,短卡的设计,其长宽分别为244mm与98mm,可以兼容大部分的机箱,尤其是ITX小机箱也能安装上。
当然笔者认为RTX40背面是更好看了,有着大大的产品LOGO,与背部反向风扇,横装在机箱中,辨识度很高。
两侧是散热鳍片排热位置
RTX4060Ti8GFE显卡顶部是12VHPWR16Pin辅助供电接口,而根据我们了解大部分的AIC非公显卡直接使用上单8Pin的设计,毕竟TDP最高也仅为180W,常用的单8Pin接口更受玩家们欢迎。
FE显卡附送了一条单8Pin转12VHPWR转换线,提升电源接口兼容性。
RTX4060Ti8GFE显卡输出接口也是较为主流的DP1.4*3+HDMI2.1接口,按照目前显示器分辨率与刷新率发展来看,完全满足需求。
NVIDIAGeForceRTX4060Ti8GFE拆解
RTX4060Ti8GFE显卡的拆解方式与RTX4070FE显卡一样,输出接口位置有一小孔,硬物直插后,背部金属装饰板就会弹起来。
弹起来之后就可以轻松把装饰板给拆掉,无损
拆一块FE显卡需要用到三种不同规格的刀头
而里面的金属背板侧是通过6颗螺丝给固定,拆掉即可
FE公版最吸引人的就是那做工相当细致的金属框架
拆完之后的全家桶
FE显卡的散热为深度定制款,VRM供电部分都配上辅助散热模块与导热垫
包括显存与另外一些供电散热也有进行辅助散热,而据外媒测试表明,供电辅助散热是都得配上的,不然显卡会出现过热掉频的情况。
核心为纯铜底座
大面积的散热鳍片模块,既是颜值担当,也是实力的散热效能担当。
RTX4060Ti8GFE显卡PCB很小巧,而由于核心面积与4颗显存占用就那些位置,看着有点空。
但是供电部分仍是比较可以的,4+1+1+1相供电设计,完全能够满足TDP仅为160W的RTX4060Ti8GFE显卡供电需求。
AD106-350核心是真小巧,不过比较搞笑的是,RTX4060Ti8GFE显卡与RTX4070FE显卡两块公版用的似乎都是测试核心,没有正式的核心编码印在GPU表面上。
1相辅助供电设计。
高品质的12VHPWER供电接口
背面也显得相当的干净,此PCB背面来看,这板型是没背部显存安放的位置了,那RTX4060Ti16GFE估计会用改良款的PCB板型。
核心主控芯片MP2898,猜测这是一个最大可控制8相供电控制芯片。
UPIuP55650Q控制芯片,辅助显存供电控制
RTX4060Ti8GFE显卡PCB板型:180-1G141
拆解这就完成了,我们这就装回去。
测试平台介绍
测试平台方面,我们仍然是采用INTEL桌面级最为顶尖的处理器i9-13900KS,主板配上的是ROGMAXIMUSZ790HERO,而内存方面我们这里仅采用了DDR5-6000C32的条子,下次一批首发评测我们将使用更大容量更高性能的DDR5内存条。
而为确认DLSS3功能的正确合作,我们在测试前把BIOS恢复默认设置,同样在BIOS中开启了ResizeBAR(ResizableBAR)功能。
显示器方面自然是评测室专用的电竞神器——爱攻&保时捷联名PD32M4K144电竞显示器,并且在NVIDIA控制面板中把G-SYNC兼容模式给打开,在WIN11系统中把图形回速技术给打开。
最后的驱动方面,我们采用的是NVIDIA-PRESS上提供的测试版本531.93_gameready_win11_win10-dch_64bit_international,同时打开GPU-Z确认参测显卡的正确参数。
理论性能测试
性能测试方面,我们先来看一下日常跑分最常用的3DMARK。与上代RTX3060Ti相比,RTX4060Ti8GB提升最为明显的是SpeedWay与PortRoyal这两项着重光线追踪性能的测试项目分别是达到了11%与22%,常规的FireStrike与TimeSpy多项测试中均约有10%性能提升。当然随着分辨率与画质的提升,两者之间的性能差距是越小的,这也是为何NVIDIA定位此款显卡为1080p分辨率下高帧显卡的原因之一。
而相比同架构的老大RTX4070FE显卡,RTX4060Ti8GB还是有不小的差距的,主要是因为核心规格的差别与显存位宽上的限制。
游戏性能测试
作为一款定位于1080p高帧数的游戏显卡,RTX4060Ti8GB游戏性能还真不错,大部分的游戏帧数都能达到100FPS以上,部分要求较低的游戏甚至是达到了150FPS以上。而相比上代RTX3060Ti显卡,RTX4060Ti8GB在大多数的3A游戏中有着更高的流畅度,约有115%的性能领先;尤其是支持DLSS技术的游戏上领先幅度更大。
再来看一个2K分辨率的游戏表现,RTX4060Ti8GB在2K游戏性能表现同样很不错,在开启DLSS技术之后,大部分的游戏运行相当的流畅。甚至一些对光线追踪技术要求较高的游戏,也能基本上在高画质、高光线追踪设定上以60FPS游戏度运行,这已经比上代同档次的显卡要领先119%。
当然与大哥RTX4070是有一定的差距,具体的表现与3DMARK理论性能的差距基本是一致,这里我们就不多说了,大家可以详细看看图表。
DLSS3游戏性能测试
在测试DLSS3显卡的游戏性能之前,我们还是来看一下3DMARK测试里的DLSS理论性能表现。1080p这里我们就没有做测试了我们直接用的2K和4K分辨率。在DLSS3理论性能表现上,RTX4060Ti8G确实还不错,2K理论性能跑到96FPS,而4K分辨率也能达到了60FPS,也意味着RTX4060Ti有一定的2K,或者是4K游戏的能力。
DLSS3技术是RTX40系列显卡专有的特色功能,在我们之前的多个首发中大家也都了解到,开启这功能后,对游戏流畅度是有显著的提升。
相比RTX3060Ti显卡开启DLSS2功能,在DLSS3功能之后的RTX4060Ti8G游戏流畅度得到了巨大的提升,基本所有在3A流大任均能在超高画质+高光线追踪实现120FPS+,性能领先幅度达到了152%。
平面内容创作性能测试
常用的内容创作性能测试,我们这里选用的是PCMARK10、ULProcyon,以及PugetBench全家桶的测试程序。
从测试结果来看,PS\LR这两种平面处理,RTX4060Ti8G与RTX3060Ti显卡表现基本是一致的。最大的提升就在于PR与达芬奇的视频处理能力上,分别是13%与15%性能的提升。这对于游戏玩家来说是个好事,既能满足游戏需求,同时还能剪个片什么的。
三维专业创作性能测试
三维专业内容,是ADA架构的RTX40系列显卡的天下,这也意味着,若学习三维建模这种专业应用,那RTX40系列显卡绝对是同档次显卡的最佳选择。我们先来看看具体的性能表现:RTX4060Ti8G在Blender与V-RAY表现上都较为出色,领先上代产品约122%;而专业领域测试的OctaneBench与SPECviewperf2020上均有18%与11%的性能提升。
AV1性能测试
AV1作为近年来开源免费的视频编码格式已经被广大的视频平台与上游厂商所接受,而作为中端的RTX4060Ti8G显卡也同样配备上第八代的NVENC,集成了对AV1视频格式的编码解码。刚才我们在视频测试中已经说了,RTX4060Ti8G其实拿来剪片也是没问题的,这里我们输出AV格式的视频同样是没有问题,只是耗时会比RTX4070要久一些,不过AV18K能力却比RTX4070要快上那么一点。至于H.265格式的视频输出,RTX4060Ti8G要比RTX3060Ti视频处理能力要快不少呢。
显卡AI性能测试
显卡的AI性能方面,我们同样采用了RTX4070FE当时的那套测试工具和方法,包括达芬奇的MAGICMASK、ON1ResizeAI,以及近期较火的图形化AI工具StableDiffusion Automatic1111进行测试。
AIACCELERATEDMAGICMASK与ON1ResizeAI中,RTX4060Ti8G的性能表现都是可圈可点的,在处理时间上都要比RTX3060Ti快上一些,甚至是接近RTX4070FE显卡了。而AI性能方面,同一个模块与命令行,RTX4060Ti8G的算力是也不错,每分钟能出6.15张图;比RTX3060Ti的每分钟5.47张图,还是快是一些。当然啦,RTX4060Ti8G在跑AI的时候,显存占用就已经达到7596MB,也快把8GB显存给占满在,而老黄很了解大家,7月份就正式推出16GB版本的RTX4060Ti显卡。
GeForceRTX4060Ti8GVSR性能测试
光有游戏版的DLSS还不够,现在看视频也能用DLSS,低分辨率的视频摇身一变就可提升分辨率,就问你刺不刺激!NVIDIA在上次的RTX4070之际带来了RTXVideoSuperResolution视频超分辨率技术(RTXVSR),通过AI技术即可提高浏览器内的视频的分辨率,展现前所未有的显示效果。
今天我们也用RTX4060Ti8G测试这项划时代的RTXVSR技术。使用相当简单,在RTX30系和RTX40系的NVIDIA控制面板中找到视频图像设置,手动开启RTXVideoenhancement即可启用RTXVSR技术,其中分为1-4档调节,数字越大质量越好。
实测环节,可以看到在开启RTXVSR技术之后,原视频里的人物线条由原本的模糊不清变得十分清晰锐利,甚至部分细节已经超越原生1080P了,并且低画质的视频也有不少噪点,在开启VSR4档后,噪点几乎消失。
除此之外,由于是AI智能提升分辨率的缘故,字体在原生的480P视频中有些发虚,甚至字体边缘可以看到毛边,不过有了VSR的加持后,字体锐利可见,完全不输原生1080P的效果,不得不说VSR确实有点东西。
这里我们也给大家准备了对比视频,从视频里就可以看到VSR的效果之明显,最高级别的VSR4跟原生480P相比就是一眼的区别,在开启RTXVSR技术后,部分图像质量有了显著提高,不仅锯齿和噪点几乎全部消失,颜色过渡也更为平滑,目前VSR能有这种表现堪称惊艳。
左:原生480P中:VSR4档右:原生1080P
当然你除了在浏览器能够使用这项功能外,本地浏览器也能享受黑科技的魅力,VLC是目前首个支持RTXVSR技术的本地播放器,且能够支持多种视频格式播放,你硬盘里的老视频也能拥有清晰画质了!
我们将本地的360P画质视频进行RTXVSR4档渲染,从画面上看,开启了VSR技术后,右侧的渲染视频确实比左侧原生的视频要清晰许多,并且肉眼可见噪点的减少,观感上要明显好于原生的360P视频。
如果你想知道本地VSR的效果,这里也有视频可以看到二者的差距,确实能够明显看出有VSR的加持后,不少细节重新清晰可见,对一些低分辨率视频确实有提升。
左:本地原生360P右:VSR-4档
有玩家可能担心功耗的问题,这里我们也进行了实测,在VSR开启最高档4档的情况下,RTX4060Ti8G的功耗仅有30W左右,显卡利用率也远没有网络上传的那么高。
本地播放视频开启VSR后,功耗也相当之低,并且还能带来更好的画质,因此笔者还是建议平时可以开启该功能使用。
总的来说,RTX4060Ti8G上的RTXVSR技术将为玩家和视频观看者带来革命性的新体验!无论是性能上还是技术上的创新,都称得上是流媒体时代的革命!
温度与功耗对比测试
又来到大家喜欢的温度与功耗测试环节,三块测试显卡均为NVIDIA提供的FE,FoundersEdition,也就是我们常说的公版显卡。RTX4060Ti8GFE烤机的最大BPD功耗为159.7W,刚好控制在TGP160W以内,而PCIe功耗仅为17.2W,主要供电来自辅助供电的12VHPWR上,达到了142.5W。而最让人高兴的是RTX4060Ti8GFE烤机30分钟后的满载温度仅为63.1度,显存满载温度也仅为73.7,可以说是较为低温的表现。
我们再来拿一个较为详细的功耗测试进行对比,利用HWINFO64,以及FrameView软件进行显卡的功耗监控,得到上面三块不同显卡的功耗表现。RTX4060Ti8GFE功耗控制真心的不错,大部分情况下就控制在了160W以下,甚至一些LR与AE测试仅为几十W。相比上代的RTX3060Ti显卡动不动就是200W的功耗来说,RTX4060Ti8GFE可以说是有着超出色的功耗控制表现。
总结:1080p高帧数游戏利器
128Bit显存是否配得上RTX4060Ti8G这显卡,其实NVIDIA交给了我们答案。尤其是技术层面的,32MB大容量的L2缓存可以减少GPU交互数据之间带来的延迟,增加显存的利用率。虽然对于规格按来说有些不甘,但不可否认的是128Bit显存的确会在成本控制、效率,以及性能方面达到理好的平衡。
再来说说RTX4060Ti8G这显卡的性能,通杀1080p分辨率下绝大多数游戏都不是问题,相比上代显卡RTX3060Ti提升15%~20%的性能提升看着不多,甚至被说挤牙膏。但是当你玩上DLSS3游戏后,你就会知道RTX4060Ti8G真正意义上的性能提升就在于这里,领先RTX3060Ti约152%的性能已经很了不起。尤其最大TDP功耗仅为160W,仅为RTX3060Ti的80%功耗,性能提升却这么多,相当不错了。
再来说说流行的AI性能,RTX4060Ti8G显卡的AI能力还不可以的,每分钟能输出6.15张图,在我们之前做的多款显卡AI性能测试中已经不错的位置,十分接近RTX3070的表现。当然8GB显存也有一定的限制性,完成512px分辨率的图片是没有问题的,但想更高更复杂的模型,那8GB也明显不太足够,未来的16GB相信会是个不错的选择。
最后说说购买方面,NVIDIAGeForceRTX4060Ti8G零售报价3,199起,部分AIC非公产品会比这个贵上几百。618急着装机,对4K游戏要求不高的用户,NVIDIAGeForceRTX4060Ti8G会是不错的选择,能玩高帧数玩游戏,能做视频,能做AI,温度&功耗控制也出色,的确是逢6必火的节奏。
首测回顾:
2K100FPS+光追显卡,NVIDIAGeForceRTX4070FE首发评测
//diy.pconline.com.cn/1605/16052004.html
比上代旗舰RTX3090Ti还猛,NVIDIARTX4070Ti首发评测
//diy.pconline.com.cn/1576/15765825.html
ADA架构第二发炮弹,NVIDIAGeForceRTX4080FE公版首发评测
//diy.pconline.com.cn/1560/15608164.html
NVIDIAGeForceRTX4090FE首发评测:大杯的体积,超大杯的性能
//diy.pconline.com.cn/1548/15485084.html
横评回顾:
15张N卡AI绘图大横评!哪张才是赛博画图之王?
https://pconline.pcvideo.com.cn/video-31904.html
猛男踩坑指南第三期,有了DLSS3后低U高显也能爽玩游戏吗?
https://pconline.pcvideo.com.cn/video-31830.html
PC硬件杂谈:NVIDIARTX30系列显卡内容创作性能测试
//diy.pconline.com.cn/1524/15247006.html
相关教程
2023-05-25
2023-05-25
2023-05-18
2023-04-12
2023-05-18
2023-05-26
2024-11-18
2024-11-18
2024-11-16
2024-11-16
2024-11-15
2024-11-14