炫彩战斧RTX 4090显卡首测:开启4K光学追求新时代!

自图灵架构(即GeForce RTX20系列)开始,英伟达显卡正式进入RTX实时光线追踪和DLSS深度学习超采样技术时代。回想当初,质疑声一片,追光效果一般,DLSS损坏画质,支持的游戏屈指可数。随后的日子里,NVIDIA潜心修炼内功,Ampere安培架构(GeForce RTX 30系列)的强劲表现让很多质疑者变成了支持者。

这一年,一个名为阿达·洛芙莱斯的新架构——全球首位女性程序员——正式亮相,GeForce RTX 40系列显卡时代正式到来。先进的台积电4N NVIDIA定制技术,全新全景光线追踪和新一代DLSS 3技术...再次在游戏质量和流畅度上有了质的飞跃。

GeForce RTX 40系列显卡有三款:GeForce RTX 4090/GeForce RTX 4080(16GB版本)/GeForce RTX 4080(12GB版本)。今天我们拿到了炫彩战斧GeForce RTX 4090豪华显卡,有了它我们可以带你详细了解新一代显卡的具体性能。

英伟达阿达·洛芙莱斯架构分析:

1,内部架构:GPC规模猛增。

多彩战斧GeForce RTX 4090豪华显卡使用的是AD102-300的核心,不是完整版。完整的AD102内核包含12个图形处理集群(GPC),从7 in安培飙升至12。仅此一点就能带来强大的性能提升。此外,它还包括72个纹理处理集群(TPC)、144流多处理器(SM)和12个32位视频内存接口(* * * 384位)。

上图为SM单位。AD102中的每个SM单元包含四个处理模块,每个处理模块包含1个64KB寄存器文件、1个L0指令缓存、1个调度单元、4个加载/存储单元和1个特殊功能单元(SFU)。还包含16 CUDA core专用于FP32,16 CUDA core可以在FP32和INT32之间切换,所以* * *算32个CUDA。当然还有1第三代RT核,4个第四代张量核,4个纹理单元,256KB寄存器文件,128KB L1***+0 * *共享缓存可以根据需求配置。

2、第三代RT核心:带来全景光线追踪。

多彩战斧GeForce RTX 4090豪华显卡从第二代RT Core升级到第三代。从两代对比来看,第三代RT核心架构增加了透明微贴图(OMM)引擎和位移微网格(DMM)引擎。此外,L2缓存已经升级,拥有98304KB L2缓存,比Ampere高16倍。这些都使得光线追踪性能获得巨大的收益。

3.着色器执行重新排序:提高光线跟踪的效率。

在接近真实场景的实时光线追踪中,多样化的环境变化意味着原本应该重要的处理工作量会越来越少。相反,反色、间接光照、半透明效果的二次折射等计算会占用大量着色器资源,使着色器忙于无意义的二次反射、漫反射等场景,导致效率降低。如果不解决,GPU要有序有规律的执行,效率会非常低。

因此,多彩战斧GeForce RTX 4090豪华显卡引入了着色器执行重新排序(SER)功能,使着色器能够更智能地安排每个任务的重要性,从而大大提高渲染效率。SER可以将光线追踪的性能提升高达3倍,整体游戏性能提升高达25%。

4、第四代TensorCore: AI计算效率翻倍

多彩战斧GeForce RTX 4090豪华显卡从第三代Tensor Core升级到第四代。新一代张量核的FP16、BF16、TF32、INT8、INT4相比上一代性能提升了两倍以上,AI计算性能大幅提升。

5.新DLSS 3:真实帧率收割机

DLSS 3绝对是多彩战斧GeForce RTX 4090豪华显卡最抢眼的技术。DLSS 3包括全新的帧生成技术,DLSS 2超分辨率技术和英伟达反射技术。

DLSS的本质是通过深度学习算法将单帧的低分辨率提高到高分辨率,大大提高了游戏的帧率。但这还不够。在《DLSS 3》上,将光流加速器与DLSS相结合,构建了更立体的分析方法:光流加速器生成光流场、游戏运动矢量、深度等数据,DLSS将新渲染的帧与上一帧进行对比,综合考虑运动矢量和光流场信息,了解场景变化,从而生成全新的高质量帧。简单理解,AI生成的帧不需要占用太多的GPU资源,由AI计算。

借助光流加速器,DLSS 3实现了无需GPU渲染重建高分辨率的方法,大大减少了GPU渲染的部分。以两帧为例,DLSS 3将承担第一帧的3/4工作和第二帧的全部工作。其实GPU只需要完成1/8的渲染,这样就节省了大量的计算资源。

DLSS 3不是传统意义上的单一技术。事实上,它是软件和硬件的协作集合。软件层面,DLSS 3采用AI超分辨率生成,AI生成帧,并增加了对NVIDIA Reflex的支持。在硬件层面,DLSS 3需要运行在第四代张量核上,使用改进的光流加速器帮助DLSS 3测量像素级场景。最后,云中的NVIDIA超级计算机正在寻找提高高质量图像的方法。以上六种软硬件的结合,最终实现了DLSS 3的高品质性能。

目前超过35款游戏和应用支持DLSS 3,包括冰霜引擎、Unity、虚幻引擎4 &;5等游戏开发引擎,以及《赛博朋克2077》《逆水行舟》《微软飞行模拟器》《瘟疫传说:安魂曲》等热门游戏大作,未来支持《DLSS 3》的游戏会越来越多。

RTX 4090显卡规格:

GeForce RTX4090显卡采用台积电4N英伟达定制工艺,由台积电5N改进而来。在不增加AD102核心面积的情况下,晶体管数量出现了爆炸式增长,从283亿个增加到763亿个。在流处理器方面,GeForce RTX 4090达到了16384,比GeForce RTX 3090 Ti高出34%。同时,第四代张量核心和第三代RT核心的数量相比GeForce RTX 3090 Ti有了很大的增加。

GeForce RTX4090显卡的核心Boost频率达到2520MHz,远高于GeForce RTX 3090 Ti的1860MHz。如果是AIC厂商调音的话,会轻松超过2.52G..显存来自美光定制的GDDR6X,全系24GB,显存带宽超过1TB/s峰值。

功耗方面,GeForce RTX4090与GeForce RTX 3090 Ti一致,均为450W,超出了很多人的预期,也证明了阿达·洛芙莱斯架构GPU能耗比的巨大飞跃。

至于价格,GeForce RTX 4090官方建议零售价为12999元,比GeForce RTX 3090 Ti便宜2000元。当然12999只是公版指导价,非公版显卡价格更贵。

战斧GeForce RTX 4090豪华版规格:

▲七彩战斧GeForce RTX 4090豪华版的GPU-Z信息

GeForce RTX 4090豪华版炫彩战斧设定的Boost频率为2565MHz,比公版的2520MHz高出45MHz。功耗设定为450W,峰值功耗在480W,功耗也是一致的,理论性能与公版一致。如果搭配旗舰机型CPU,建议1000W以上电源更安全。

推出多彩战斧GeForce RTX 4090豪华显卡;

产品外包装印有战斧,右下角标注产品型号GEFORCE RTX 4090。

整体设计为黑红色,金属外观,磨砂后很有质感。菱形的三角形元素起到点缀的作用,也显示出力量感。

与老款战斧不同,豪华版战斧拥有全新的造型,硬朗而富有肌肉感。又酷又壮!

由于性能的增强,电源和散热也要加强,GeForce RTX 4090的体积再次增大。炫彩战斧GeForce RTX 4090豪华版长817.50000001px,宽377.5px,厚167.75px,比之前的20系显卡大了差不多一圈。

要合理占用三个PCIe插槽,对机箱兼容性的要求并不低。

全金属背板设计,尾部也是镂空的,方便空气对流,利于通风散热。

炫彩战斧GeForce RTX 4090豪华显卡采用axe散热器,正面设计三个98mm大风扇,实现更强的风压和更大的进风量。

战斧散热器内置2根6mm和4根8mm镀镍热管,大面积液冷蒸汽室和散热片,在高负载场景下快速散热,保证显卡性能稳定。

电源接口是全新的PCIe 5.0电源接口,16 PIN (12+4Pin)。12pin为电源端口,4pin负责信号传输。单个端口可以承载600W的功耗。

使用ATX3.0标准电源只需要一根电源线,看起来比过去的三个8-8Pin口简单很多。

如果没有使用新的ATX3.0电源,并且没有16Pin电源端口,则显卡附带一根跳线,三根8针到16Pin与旧电源兼容。

侧面隐藏的LOGO RGB信仰灯可以通过新的iGame Center软件设置。

不同的灯光效果让机箱内部更加丰富多彩。

在接口上,提供了一个HDMI2.1和三个DP1.4a。HDMI2.1接口可支持8K@60Hz视频输出。

顺便说一句,一个有趣的“玩物”被送去测试,一起被送去测试的还有色彩缤纷的战斧GeForce RTX 4090豪华显卡,以及这个与奇数积木合称的iGame奇奇主机。

这款好玩的主机由主机、主板、内存、显卡组装而成。喜欢DIY硬件的朋友也可以用它体验一下装机的乐趣,或者新手朋友可以先试试DIY电脑工艺。如果你对这个积木感兴趣,可以在微信小程序上搜索“七彩官方旗舰店”购买编辑同款。

新的iGame Center软件:

专门针对炫彩显卡的集成控制软件IGame Center同步更新至最新版本,整个软件进行了深度优化,不仅界面更加清晰,功能也更加丰富。

配备丰富多彩的RGB硬件,你可以控制这里的全局照明。有不同的照明模式,灯光的速度、亮度、方向也可以调节。

除了灯光效果同步,显卡的灯光模式可以单独调节,可玩性还是蛮高的。

灯光控制的另一栏是超频控制,可以调节显卡的核心频率、内存频率、电压、温度和功耗。

在监控日志中,可以控制液晶屏的各种显示功能,但战斧系列没有配备液晶屏。

玩家俱乐部新增iGame Center软件,增加玩家粘性。

测试平台介绍:

测试平台如上。CPU采用i9-12900K,搭配Z690 D5主板,内存为DDR5-6000高频,16GBx2双通道。

如果没有4K旗舰电竞显示器,你怎么能测试像GeForce RTX 4090这样的性能怪兽呢?我们测试的是:爱工PD32M保时捷联名电竞显示器,堪称“旗舰中的旗舰”。

配备31.5英寸Mini LED背光技术面板,3456颗Mini LED背光珠,多达1152个独立光控分区。峰值亮度高达1600尼特,通过DisplayHDR 1400专业认证;97% DCI-P3,99% AdobeRGB,100% sRGB色域覆盖广,显示107亿种色彩。以DELTAE < 2的专业色彩标准,色彩表现在电竞显示器中属于“天花板”级别,可以更好的展现游戏中的光影效果。电竞方面,PD32M支持144Hz的高刷新率和1ms的快速灰阶响应时间,可以提供好玩的游戏体验。4K超高清分辨率,特效全开,为显卡担当。

七彩战斧的GeForce RTX 4090豪华显卡峰值功耗为480W,而i9-12900K满载功耗接近260W,光学显卡+CPU功耗为740W。考虑到40%的冗余功耗,我们采用航嘉新MVP P1200 ATX3.0电源,保证在一些高负载下正常工作。

基准性能测试:

采用3DMark作为显卡的基准测试软件,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra(对应DX11+1080P、2K、4K分辨率)。Time Spy和Time Spy Extreme(对应DX12 2K和4K分辨率)。和皇家港光线追踪性能。

▲多彩战斧GeForce RTX 4090豪华显卡Time Spy得分36384分。

▲七彩战斧GeForce RTX 4090豪华显卡时光间谍至尊得分19292分。

▲多彩战斧GeForce RTX 4090豪华显卡Fire Strike得分77359分。

▲多彩战斧GeForce RTX 4090豪华显卡Fire Strike Extreme得分45734分。

▲多彩战斧GeForce RTX 4090豪华显卡Fire Strike Ultra得分24866分。

▲多彩战斧GeForce RTX 4090豪华显卡Port Royal得分25669分。

在基准测试方面,相比RTX 3090 Ti,战斧GeForce RTX 4090豪华版的性能提升可以用“夸张”来形容。时间间谍性能提升68%;时光间谍极致性能提升73%;火力打击性能提升55%;火击极限性能提升76%;Fire Strike Ultra性能提升82%;光学跟踪性能提高了78%。最近怎么样?你对这张新卡的性能提升满意吗?

4K光栅化游戏的性能测试:

传统光栅化游戏的分辨率为3840x2160。考虑到显卡的定位,不测试2K和1080P的分辨率。画质设置为最高,关闭垂直同步功能,关闭DLSS支持,所有测试的游戏都是自己的基准输出。

我们* * *测试了六款流行的3A大作,战斧GeForce RTX 4090豪华显卡可以在4K分辨率和最高画质设置下非常流畅地运行,不牺牲画质和特效,也不需要DLSS辅助。

渣优化的赛博朋克2077跑出了76帧,显卡杀手fistful dollars 2跑出了121帧,古墓丽影跑出了夸张的184帧,4K分辨率。毫不夸张地说,4K的最高品质在战斧GeForce RTX 4090豪华版面前只能算是一次“入门”挑战。

相比GeForce RTX 3090 Ti,赛博朋克2077,拳头美元2,极限竞速:地平线5,刺客信条奥德赛,古墓丽影影,孤岛惊魂5分别增长46%,46%,73%,54%,73%,30%。

DLSS 3游戏测量:

我们先来看看战斧GeForce RTX 4090豪华版在DLSS 3开启和关闭的情况下游戏质量是如何变化的。

瘟疫传说:安魂曲dlss3off vs dlss3o

“冷水”dlss3off与dlss3o

Unity引擎dlss3off与dlss3o

我们截取了一些支持DLSS 3游戏的现场场景,比如《瘟疫传说:安魂曲》、《逆水行舟》。通过对比我们可以看到,DLSS 3开启后,画质不但没有受损,反而有所增强,尤其是光影效果更加逼真。

开放DLSS 3后,游戏帧数急剧增加。《瘟疫安魂曲》和《赛博朋克2077》的帧率分别提高了2.35倍和3.27倍。就连特别吃CPU资源的微软飞行模拟器也翻了2.15倍。

在画质不损失反而增强的前提下,给游戏玩家带来如此巨大的游戏性能提升,无疑是一种幸福的存在。未来有了DLSS 3加持,4K+轻追+最高特效将流畅无比。

DLSS 3游戏的最新更新:

●超级人物:抢先版将于10 6月12 6月13:00发售,支持DLSS 3。

● Loopmancer将于6月65438+10月65438+2月发布更新版本,支持DLSS 3。

●“正义‘福云阁’”:全新的图文展示将于6月5438+10月65438+3月发布,支持DLSS 3。

●微软飞行模拟器:测试版将于6月5438+10月65438+7月面向Xbox Insider计划成员发布,支持DLSS 3。

●瘟疫传说:安魂曲:将于65438年6月+65438年10月+8月上映,支持DLSS 3。

实时光线追踪游戏测试:

RTX光线追踪测试,同样4K分辨率,画质设置最高,光线追踪效果设置最高,不开启DLSS选项,因此接受最苛刻的硬件测试。

在追光游戏的测试部分,即使不开启DLSS,除了赛博朋克2077,其他四款游戏战斧GeForce RTX 4090豪华版都能流畅运行60帧以上。

光追效果非常明显的《控制》,可以140帧的超高帧率播放4K光追。《光明记忆:无限》和《古墓丽影》都超过了100帧。战斧GeForce RTX 4090豪华显卡真正带我们进入4K光学追求的时代。与GeForce RTX 3090 Ti相比,追光游戏性能提升约70%。

创建应用程序测试:

因为测试时间的原因,并且考虑到GeForce RTX 4090刚刚推出,专业的创意应用软件还有待优化,我们只测试了目前比较流行的专业3D渲染软件Blender,用固定的基准进行测试,测试了怪兽/废品店/教室三个场景。

战斧GeForce RTX 4090豪华版在怪物/废品店/教室场景中的得分分别为6331,2806,2911,平均4050分。相比之下,它领先GeForce RTX 3090 Ti 80%以上。可以看出,在创作领域,战斧GeForceRTX 4090豪华版也比GeForce RTX 3090Ti更胜一筹,帮助创作者节省了大量渲染时间。

功耗和温度测试:

在温度和功耗测试中,使用Furmark软件测试显卡满载10分钟,使用GPU-Z软件监测显卡的温度和功耗性能。

满载10分钟后,GPU的核心温度只有70℃。要知道这可是旗舰显卡,性能怪兽。这样的温度表现,绝对处于优秀水平。

如果功耗平均接近450W,基本和GeForce RTX 3090 Ti持平。不过峰值耗电更猛。如果搭配新旗舰CPU,比如i9-12900K,i9-13900K,建议至少1000W电源起步,850W的压力还是蛮大的。

总结:

在GeForce RTX 30系列显卡性能实现大跃进之后,很多人担心GeForce RTX 40系列显卡无法超越前辈。在测试了TOAX GeForce RTX 4090豪华版之后,我们的担心显然是多余的。基于阿达·洛芙莱斯GPU架构,设计AD102-300核心的RTX 4090再次实现了性能飞跃,真正将游戏带入了4K轻追时代。曾几何时,4K游戏遥不可及,现在4K+光追求最高特效,玩起来流畅。可能2-3年前,很多人想都不敢想。

这次英伟达还带来了DLSS 3,这是真正的黑科技。打开DLSS 3后,就像打开了性能释放的钥匙,打开又关闭,性能提升非常非常显著,真正实现了从性能叠加到品质的转变。未来会有越来越多的游戏加入DLSS 3,n卡玩家会是最幸福的。

战斧GeForce RTX 4090豪华版虽然整体功耗不低,但加热控制还是不错的。而这个功耗也是频率大幅提升的结果,带来了强劲的性能提升,我认为是值得的。

最后,我会把产品的销售信息发给你。炫彩战斧GeForce RTX 4090豪华版、iGame GeForce RTX 4090 Vulcan OC、iGame GeForce RTX 4090 Neptune OC将于6月5438+10月12日晚9点在JD.COM、天猫、Tik Tok、Aauto faster等电商平台及全国经销零售渠道开售,售价为12999-65449。