索尼承諾將“增加PS5主機(jī)供應(yīng)”
2023-01-31
更新時(shí)間:2022-10-12 12:12:37作者:智慧百科
隨著2022年9月15日以太坊主網(wǎng)升級(jí)至2.0,由工作量證明(POW)正式轉(zhuǎn)為權(quán)益證明(POS),標(biāo)志著自2020年開始,持續(xù)將近兩年的顯卡挖礦熱潮正式告一段落。這段本應(yīng)該是GeForce RTX 30系顯卡大顯身手的時(shí)間,卻因?yàn)榈V工們大包大攬的收購(gòu),使價(jià)格漲到令游戲玩家們難以承受的地步,嚴(yán)重時(shí)甚至一卡難求。如今塵埃落定,RTX 30系顯卡紛紛跌破首發(fā)價(jià)格,屬于它們的時(shí)代卻一去不返——因?yàn)橥婕覀冃男哪钅?,翹首以盼的GeForce RTX 40系顯卡現(xiàn)在正式登場(chǎng)了。
NVIDIA自2018年推出基于Turing架構(gòu)的GeForce RTX 20系顯卡開始,在PC游戲、專業(yè)圖形應(yīng)用和深度學(xué)習(xí)方面取得重大進(jìn)展。它通過(guò)芯片設(shè)計(jì)的革新,用傳統(tǒng)的光柵化+光線追蹤+人工智能優(yōu)化的方式,首次實(shí)現(xiàn)了“實(shí)時(shí)光線追蹤”——將這一原本只能用于CG制作的擬真圖形技術(shù),應(yīng)用在需要實(shí)時(shí)渲染的游戲中,并獲得可觀的流暢度。
兩年后NVIDIA再接再厲,Ampere架構(gòu)融合了更強(qiáng)大的RT單元和Tensor單元,以及一種新穎的SM結(jié)構(gòu),提供兩倍的FP32性能,可視作得到了兩倍的CUDA單元。再結(jié)合趨于完善的DLSS2.0,使其幀數(shù)表現(xiàn)最高可達(dá)到Turing的兩倍。RTX 3070的性能即可與Turing旗艦RTX 2080Ti媲美,如果不是因?yàn)橥诘V的原因,它本應(yīng)成就一段佳話。
長(zhǎng)江后浪推前浪,如今我們不必再為Ampere感到惋惜,更強(qiáng)的GPU已經(jīng)到來(lái),且不僅僅是芯片制程的進(jìn)步和計(jì)算單元的擴(kuò)充,還伴隨著新技術(shù)的加入和舊技術(shù)的完善。全新的GeForce RTX 40系GPU以數(shù)學(xué)家Ada Loverace命名(簡(jiǎn)稱Ada架構(gòu)),升級(jí)的RT單元和Tensor單元讓游戲能夠以較快的速度全面采用光線追蹤做實(shí)時(shí)渲染,之前那樣采用光柵化+光追的渲染方式不再是必須的,為游戲開發(fā)者創(chuàng)造了更廣闊的揮灑空間。
一周之前,游民星空硬件評(píng)測(cè)室收到了NVIDIA GeForce RTX 4090 FE版顯卡,本文我們將為玩家闡述它的規(guī)格參數(shù),考察新功能特性,最后獻(xiàn)上游戲?qū)崪y(cè)對(duì)比。
關(guān)于這款新旗艦,需要玩家先了解這四個(gè)方面的重點(diǎn):
1.革新的架構(gòu)規(guī)格
2.Ada架構(gòu)的光追單元和光追性能
3.著色器指令重新排序
4.DLSS3
革新的架構(gòu)規(guī)格
還是老規(guī)矩,我們先從架構(gòu)規(guī)格說(shuō)起,這也是大多數(shù)玩家最關(guān)心的部分。
像往常一樣,NVIDIA Ada架構(gòu)的旗艦游戲芯片代號(hào)為AD102,采用臺(tái)積電為NVIDIA定制的TSMC 4N工藝,據(jù)說(shuō)制程為 4nm,集成了763億晶體管,是上代GA102的2.7倍,但核心面積卻縮小了,將控制基本控制在上代旗艦的范圍內(nèi),功耗性能比也成倍提升。
完整的AD102由12個(gè)GPC構(gòu)成,每個(gè)GPC包含6個(gè)TPC,共72個(gè)TPC。每個(gè)TPC又有兩組SM,一共有144個(gè)SM。顯存控制器內(nèi)建12個(gè)32bit端口,顯存位寬一共384bit。
完整的AD102核心
AD102的GPC
Ada總體上延續(xù)了上一代Ampere的結(jié)構(gòu)設(shè)計(jì),從SM到GPC,各個(gè)組成單位的規(guī)格基本一致。
每個(gè)SM里包含64個(gè)FP32單元和64個(gè)FP32/INT32單元,可視作共有128個(gè)FP32單元。32位浮點(diǎn)運(yùn)算是進(jìn)行著色渲染時(shí)的主要?jiǎng)幼鳎碈UDA的主要功能,因而每個(gè)SM算128個(gè)CUDA,完整的AD102共有18432個(gè)CUDA(流處理器)。
紋理單元、RT單元、Tensor單元這些配置數(shù)量也都跟上一代SM相同,每個(gè)SM分別有4個(gè)紋理單元、1個(gè)RT單元、4個(gè)Tensor單元。完整的AD102共有576個(gè)紋理單元、144個(gè)RT單元、576個(gè)Tensor單元。
每個(gè)GPC配置兩組ROPs,每組8個(gè),完整的AD102共有192個(gè)ROPs。
AD102的SM簇
第一個(gè)重點(diǎn)來(lái)了,RTX 4090并非采用滿血的AD102芯片,而是關(guān)閉了8組TPC,下圖可以看到,相應(yīng)的CUDA、紋理單元、RT、Tensor以及ROPs都有所減少。
RTX 4090的AD102-300芯片實(shí)物特寫
RTX 4090的GPU規(guī)格構(gòu)成AD102-300
RTX 4090具體規(guī)格如下表:
簡(jiǎn)單一算就可得知,RTX 4090的AD102-300滿血度大約為88%左右,這要比RTX 3090小得多,后者只關(guān)了一組TPC,滿血度達(dá)到97%。憑借制程提升一倍的TSMC 4N工藝,RTX 4090的基礎(chǔ)核心頻率就突破了2000MHz,boost更是高達(dá)2520MHz。這還是FE版本的設(shè)定,AIC的非公版應(yīng)該還有一定的提升空間。
競(jìng)爭(zhēng)對(duì)手AMD的尚不能匹敵GeForce 30系,NVIDIA十分游刃有余,為未來(lái)可能存在的更高階旗艦(RTX 4090Ti、TITAN?)留下很大的想象空間??梢钥隙ǖ氖牵男阅芴嵘粫?huì)像RTX 3090Ti比3090那樣聊勝于無(wú)。
另有一種說(shuō)法是NVIDIA原本將RTX 4090的TGP設(shè)定為600W,或許考慮到風(fēng)冷難以承受,會(huì)極大增加AIC的設(shè)計(jì)難度,故而保留在上代門檻450W以內(nèi)。這樣但凡能支持RTX 3090Ti的PC,可以不顧慮電源直接使用RTX 4090。
顯存方面,RTX 4090采用的型號(hào)、頻率、位寬與RTX 3090Ti完全一樣。
Ada架構(gòu)光追性能與RT單元的提升
要知曉Ada架構(gòu)光追性能的提升,要從RT單元的升級(jí)講起。
傳統(tǒng)的SM簇中流處理器并非不能進(jìn)行光追計(jì)算,但是會(huì)消耗大量的算力資源,阻礙頂點(diǎn)著色、紋理填充等傳統(tǒng)計(jì)算工作,拖慢即時(shí)幀的生成。光追計(jì)算的主要工作,其實(shí)就是層次包圍體積的計(jì)算,簡(jiǎn)稱BVH,它是一種碰撞檢測(cè)算法,用于模擬光的軌跡。
Turing和Ampere架構(gòu)中,RT單元能夠?qū)VH交由矩形相交引擎加速,而光線三角形相交則由三角形相交引擎加速。有這個(gè)RT單元專司其職,使流處理器能夠不受干擾的進(jìn)行它的常規(guī)工作,保障了幀生成的速度。
在Ada架構(gòu)的第三代光追單元中,除了上述兩個(gè)引擎以外,新增加了“不透明度微遮蓋引擎”(OME)和“微網(wǎng)格位移引擎”(DM-ME)。
這兩個(gè)引擎將光追計(jì)算中常遇到的操作做進(jìn)一步的分工處理,提高整體的效率。如下圖所示,OME引擎能夠以區(qū)塊劃分哪些像素是遮擋光線的,哪些應(yīng)該半遮擋的,哪些是透明的。將其分區(qū)塊統(tǒng)一處理,不像原來(lái)那樣需要逐個(gè)掃描識(shí)別,節(jié)省了著色器的資源。
而DM-ME則相當(dāng)于在光追中應(yīng)用的曲面細(xì)分,它通過(guò)BVH構(gòu)建碰撞體積的模型,在以往的第二代RT核心計(jì)算中需要頂點(diǎn)幾何渲染的介入加上BVH構(gòu)建出最終成型的光線碰撞路徑。
而在Ada架構(gòu)的第三代RT核心中,有了DM-ME引擎,可以通過(guò)矢量位移的固定算法根據(jù)單一BVH自動(dòng)生成最終的光線碰撞模型,從而進(jìn)一步節(jié)省了資源,提高了光追的效率。
著色器執(zhí)行重排序
早期的RT單元不足以確保光追的高幀速率,是因?yàn)镽T工作負(fù)載可能受到許多因素的限制。特別是在執(zhí)行多重反彈、隨機(jī)路徑跟蹤算法或評(píng)估復(fù)雜材質(zhì)時(shí)。
典型分歧有兩種形式:執(zhí)行分歧——即不同的線程在著色器內(nèi)執(zhí)行不同的著色器或代碼路徑;數(shù)據(jù)分歧——即線程訪問(wèn)難以合并或緩存的內(nèi)存資源。在許多光線跟蹤場(chǎng)景中,這兩種發(fā)散都會(huì)自然發(fā)生。
Ada架構(gòu)的一項(xiàng)新技術(shù),旨在通過(guò)解決發(fā)散問(wèn)題來(lái)提高RT單元執(zhí)行的效率,稱之為著色器執(zhí)行重新排序(SER),這是一種新的調(diào)度系統(tǒng),可以動(dòng)態(tài)重新排序著色工作,以獲得更好的執(zhí)行和數(shù)據(jù)位置。
簡(jiǎn)單的來(lái)說(shuō),我們可以理解為光追計(jì)算中,同一幀畫面有許多長(zhǎng)度不同的指令,交給各個(gè)著色器來(lái)執(zhí)行。這些指令運(yùn)行速度必然有快慢之分,而一幀畫面的生成必須等到該畫面所需的指令執(zhí)行完,這時(shí)候如果如果能夠?qū)⑺鼈儼凑账钑r(shí)間統(tǒng)籌安排起來(lái),提到著色器的利用率,避免相互等待的情況,盡量令其同步執(zhí)行完畢,那么將顯著提升幀生成的效率。
Ada架構(gòu)最大的重頭戲:DLSS3與光流加速
在過(guò)去四年中,NVIDIA應(yīng)用深度學(xué)習(xí)研究團(tuán)隊(duì)一直在開發(fā)一種幀生成技術(shù),該技術(shù)將光流估計(jì)與DLSS相結(jié)合,以改善游戲體驗(yàn)。在現(xiàn)有幀之間插入精確的合成幀可以提高幀速率,并提供更流暢的游戲體驗(yàn)。
光流估計(jì)通常用于計(jì)算機(jī)視覺應(yīng)用,以測(cè)量連續(xù)渲染的圖形幀或視頻幀之間像素的視運(yùn)動(dòng)方向和大小。在3D圖形和視頻領(lǐng)域,典型的用例包括減少增強(qiáng)和虛擬現(xiàn)實(shí)中的延遲、提高視頻播放的平滑度、提高視頻壓縮效率以及實(shí)現(xiàn)攝像機(jī)穩(wěn)定。深度學(xué)習(xí)的用途通常包括汽車和機(jī)器人導(dǎo)航、視頻分析。
與DLSS2相比Ada架構(gòu)中的Tenors可以提供FP8的四分之一精度計(jì)算,為光流計(jì)算提供了硬件基礎(chǔ),在具體游戲應(yīng)用中,該功能稱之為Frame Generation。在支持DLSS3的游戲中,以后我們可以??吹竭@個(gè)子選項(xiàng),你可以將它簡(jiǎn)單理解為“補(bǔ)幀”。
事實(shí)上補(bǔ)幀技術(shù)并不新鮮,它早就應(yīng)用在各個(gè)圖像、視頻制作領(lǐng)域,但是當(dāng)運(yùn)用到即時(shí)渲染的游戲中時(shí),它會(huì)遇到一些光影邏輯的問(wèn)題。
比如上圖,畫面中的各個(gè)建模的動(dòng)量不同,游戲引擎的矢量和實(shí)際畫面運(yùn)動(dòng)的矢量并不完全一致——人物、摩托車和影子的矢量很小,而路面和街景在運(yùn)動(dòng)。
這時(shí)候就需要將游戲引擎中的矢量,與光影運(yùn)動(dòng)的矢量結(jié)合在一起,計(jì)算出最精確的像素位移,從而才能準(zhǔn)確預(yù)測(cè)到下一幀畫面各像素應(yīng)該在的位置。后面這部分工作就必須由Ada架構(gòu)的光流加速功能來(lái)完成。
DLSS原本的超級(jí)分辨率技術(shù)能以1080p的初始渲染量結(jié)合矢量、時(shí)間等多維度采樣,由AI判斷生成一個(gè)幾乎看不出失真的4K分辨率畫面。在DLSS3中,通過(guò)光流加速推斷下一幀生成的目標(biāo)畫面,這樣意味著只需一次1080p的實(shí)際渲染,可產(chǎn)生2個(gè)4K幀,實(shí)際渲染像素量只有顯示數(shù)量的八分之一。
通過(guò)這項(xiàng)技術(shù),Ada架構(gòu)可以極大節(jié)省傳統(tǒng)CUDA算力,在應(yīng)對(duì)高分辨率實(shí)時(shí)渲染的游戲時(shí)變得更加游刃有余。DLSS3由于Frame Generation的加入,它的理論幀數(shù)性能能達(dá)到原先DLSS2的雙倍。這意味著GeForce 40系顯卡能毫無(wú)壓力的以4K分辨率高畫質(zhì)運(yùn)行所有支持DLSS3的游戲,同時(shí)8K也進(jìn)入了流暢體驗(yàn)的范疇。
另方面,DLSS3實(shí)際上是將光學(xué)多幀生成技術(shù)(插幀技術(shù))、超級(jí)分辨率(DLSS 2的關(guān)鍵創(chuàng)新)和NVIDIA Reflex這三項(xiàng)整合在了一起。開發(fā)者只需整合DLSS 3,即可默認(rèn)支持DLSS 2。加上Ada架構(gòu)在CUDA計(jì)算規(guī)模和光追性能本身的提升,理論幀率提升能達(dá)到4倍之多,這在顯卡發(fā)展歷史上都是極為罕見的,使全景光線追蹤游戲成為現(xiàn)實(shí),并使玩家有機(jī)會(huì)享受全模擬仿真世界。
DLSS 3得到了許多全球領(lǐng)先的游戲開發(fā)者和游戲引擎的支持,過(guò)35款游戲和應(yīng)用宣布即將支持該技術(shù),首批游戲和應(yīng)用將于10月推出。
GeForce RTX 4090 FE版實(shí)物鑒賞
GeForce RTX 4090 FE的外觀結(jié)構(gòu)沿用GeForce RTX 30系的設(shè)計(jì)風(fēng)格,外形尺寸與GeForce RTX 3090基本一致。正反安裝了兩枚11.5cm直徑的軸流式風(fēng)扇,葉尖封環(huán),提高風(fēng)壓的同時(shí)降低切風(fēng)噪音,該風(fēng)扇一經(jīng)亮相便引領(lǐng)了業(yè)界設(shè)計(jì)風(fēng)潮,但對(duì)動(dòng)平衡和品控要求不低。
RTX 4090 FE版的PCB繼續(xù)沿用上一代的燕尾設(shè)計(jì),將后部形成巨大的通透空間,使風(fēng)扇氣流能夠充分穿越散熱鰭片,帶走熱量。FE版的PCB采用20+3相供電設(shè)計(jì),可以看到核心與顯存供電都還留有擴(kuò)容的空間,或許是為未來(lái)更高階的型號(hào)流出余量。
散熱器本體特寫
GeForce RTX 4090 GPU-Z截圖
測(cè)試平臺(tái)軟硬件配置介紹
關(guān)于Ada架構(gòu)與RTX 4090顯卡的技術(shù)介紹到此完結(jié),下面進(jìn)入實(shí)測(cè)環(huán)節(jié)。本次測(cè)試采用當(dāng)前游戲性能第一梯隊(duì)的Intel Core i9 12900KS處理器與Z690主板組成消費(fèi)級(jí)旗艦平臺(tái),期待能充分展現(xiàn)RTX 4090顯卡的性能。
除了RTX 4090之外,我們還按慣例加入了NVIDIA Ampere GPU顯卡RTX 3090Ti與RTX 3090用作對(duì)比。后兩者一個(gè)是上代旗艦,另一個(gè)是與RTX 4090型號(hào)對(duì)應(yīng)的準(zhǔn)旗艦,以便對(duì)RTX 4090的性能地位獲得清晰的認(rèn)知。
測(cè)試平臺(tái)軟硬件配置如下:
首先我們將通過(guò)支持DLSS3的3DMARK Beta內(nèi)測(cè)版檢驗(yàn)這項(xiàng)技術(shù)的理論數(shù)據(jù)表現(xiàn)。同時(shí)我們還獲得了《賽博2077》、《F1 22》、《逆水寒》、《瘟疫傳說(shuō)》這四款游戲的DLSS3內(nèi)測(cè)資格,可以在游戲正式更新出DLSS3功能之前,搶先用GeForce RTX 4090顯卡測(cè)試光流加速補(bǔ)幀的效能。
需要注意的是,盡管DLSS3向下兼容DLSS2,但可能是因?yàn)閾屜葴y(cè)試版的緣故,經(jīng)過(guò)嘗試發(fā)現(xiàn)以上四款游戲?qū)eForce 30系顯卡的DLSS支持存在一些異常,故我們只用它們對(duì)GeForce RTX 4090顯卡做DLSS3不同設(shè)置的性能考察。測(cè)試結(jié)果不代表游戲正式版的支持效果,僅供參考。
測(cè)試使用的主板是由微星提供的MEG Z690 ACE,這是一款準(zhǔn)旗艦型號(hào),擁有強(qiáng)悍的CPU供電系統(tǒng)與豐富的I/O接口功能。雙2.5G有線網(wǎng)卡,無(wú)限網(wǎng)卡支持WIFI6E,支持雷電4標(biāo)準(zhǔn)的雙Type-C接口,并分出兩個(gè)MiniDP。
測(cè)試用顯示器使用32寸的微星MPG321UR-QD,標(biāo)準(zhǔn)分辨率4K,最大刷新率144Hz并且支持G-SYNC Compatible,它的三種接口DP1.4a、HDMI2.1和USB Type-C均支持4K 144Hz,是一款性價(jià)比較為出眾的4K游戲顯示器。
CPU散熱器采用NZXT的Z73 360mm液冷,確保CPU不會(huì)過(guò)熱導(dǎo)致性能下降。
NZXT C1000 Gold電源,額定功率1000W,80plus金牌標(biāo)準(zhǔn),可有力支撐12900K處理器與RTX 4090顯卡發(fā)揮最佳性能。
3DMARK DLSS2/3對(duì)比測(cè)試
內(nèi)部測(cè)試板的3DMARK首先支持DLSS3,我們可以先用它小試牛刀。
DLSS2 4K分辨率Performance測(cè)試,DLSS開啟下幀率138.26fps
DLSS3 4K分辨率Performance測(cè)試,DLSS開啟下幀率172.7fps
4K分辨率下,DLSS3幀率性能提升了25%,而且?guī)瑪?shù)來(lái)到170fps以上,甚至可以合理懷疑是CPU限制了幀數(shù)進(jìn)一步提高。
DLSS3 8K分辨率Performance測(cè)試,DLSS開啟下幀率41.2fps
DLSS3 8K分辨率Performance測(cè)試,DLSS開啟下幀率68.25fps
8K分辨率下,性能瓶頸主要集中在了顯卡上,DLSS3性能提升十分驚艷,超過(guò)了60%,而且平均幀率接近70fps。要知道這是在Performance模式下,而非默認(rèn)的Ultra Performance,畫質(zhì)得到了相當(dāng)程度的保障。意味著Ada架構(gòu)旗艦GeForce RTX 4090顯卡憑借DLSS3可使8K分辨率下的玩游戲進(jìn)入流暢享受的范疇。
《逆水寒》DLSS3對(duì)比測(cè)試
無(wú)論2K還是4K分辨率,性能提升可以用“劇烈”來(lái)形容,從原來(lái)幾乎不能玩變成絲滑暢爽。
2K分辨率DLSS3關(guān)閉
2K分辨率DLSS開啟性能模式
4K分辨率DLSS3關(guān)閉
4K分辨率DLSS3開啟性能模式
再看看看大家關(guān)心的游戲畫質(zhì)呢,即使開到性能模式,和DLSS關(guān)閉幾乎沒有區(qū)別,甚至銳度還略有提升,DLSS3真乃神器。
《瘟疫傳說(shuō):安魂曲》DLSS3對(duì)比測(cè)試
《瘟疫傳說(shuō):安魂曲》打開DLSS3后性能也是爆炸式的提升,僅質(zhì)量模式就幾乎達(dá)到兩倍。
《F1 22》DLSS3對(duì)比測(cè)試
2K分辨率下本身幀率已經(jīng)很高,DLSS3質(zhì)量模式提升明顯,但性能模式進(jìn)步不大,可能建模速率已到CPU性能上限,4K測(cè)試似乎佐證了這一點(diǎn)。
4K分辨率TAA
4K分辨率DLSS3性能,畫質(zhì)幾乎沒有損失
《賽博朋克2077》DLSS3對(duì)比測(cè)試
《賽博朋克2077》開啟DLSS3模式后替身也十分顯著,不過(guò)4K分辨率下開啟性能模式未能達(dá)到NVIDIA官方說(shuō)明中的100fps以上。但可以肯定的是這個(gè)游戲的DLSS3功能還屬于內(nèi)部測(cè)試階段,畫面設(shè)置和游戲機(jī)能還存在不穩(wěn)定因素??赡苄枰鹊紻LSS3版本正式更新后才能見識(shí)到其真正威力。
4K分辨率DLSS關(guān)閉
4K分辨率DLSS3開啟性能模式
如果不標(biāo)注,上面兩副截圖你能分得出來(lái)嗎?
3DMARK基準(zhǔn)測(cè)試對(duì)比
由于參與測(cè)試的三款顯卡性能高企,為了充分凸出顯卡性能差別,本次對(duì)比只測(cè)試3DMARK中的4K項(xiàng)目和光追項(xiàng)目。
DX11與DX12的測(cè)試得分,RTX 4090幾乎是RTX 3090的兩倍了,如果再算上DLSS3插幀技術(shù)的理論提升,看來(lái)所謂4倍在某種意義上是成立的。
光追性能測(cè)試,尤其是應(yīng)用程序接口DirectX的直接性能表現(xiàn),RTX 4090的幀率超過(guò)了上一代旗艦的兩倍。注意這跟DLSS沒有關(guān)系,純粹是光追計(jì)算速率的提高。
常規(guī)游戲?qū)Ρ龋骸哆吘场?/strong>
常規(guī)游戲?qū)Ρ龋骸兜罔F:離去》
常規(guī)游戲?qū)Ρ龋骸豆拍果愑埃喊涤啊?/strong>
常規(guī)游戲?qū)Ρ龋骸豆饷饔洃洠簾o(wú)限》
常規(guī)游戲?qū)Ρ龋骸稓⑹?》
常規(guī)游戲?qū)Ρ龋骸渡耠E》
散熱與功耗測(cè)試
所有有關(guān)性能的測(cè)試均告一段落,毫無(wú)疑問(wèn),Ada架構(gòu)GeForce RTX 4090顯卡無(wú)與倫比的表現(xiàn)帶給我們巨大沖擊,最后我們來(lái)看看在如此強(qiáng)悍的性能下散熱與功耗又做的如何。本次測(cè)試顯卡為Founder‘s Edition,而玩家們未來(lái)實(shí)際購(gòu)買的顯卡大絕多數(shù)都是AIC產(chǎn)品,散熱是AIC顯卡最大的非同質(zhì)化元素,故以下測(cè)試結(jié)果僅供參考?!?/p>
桌面待機(jī)狀態(tài)
自RTX 30系開始,NVIDIA也在FE版顯卡中引入了風(fēng)扇溫控啟停這一非常人性化的設(shè)計(jì),可以極大降低平時(shí)噪音,成倍提升顯卡風(fēng)扇壽命,還能明顯減緩灰塵積累的速度。GeForce RTX 4090 FE顯卡自然也沿襲了這一功能。
可以看到在TSMC 4N制程加持下,RTX 4090輕載狀態(tài)功耗與發(fā)熱控制十分出色,在風(fēng)扇完全停止時(shí)GPU溫度竟然低于40℃(室溫22℃)。此時(shí)全板功耗顯示只有9W,與溫度完全對(duì)得上。不過(guò)GPU-Z里并沒有顯示顯存溫度,暫時(shí)不知是軟件識(shí)別未完善還是取消了顯存溫度傳感器。
輕載狀態(tài)下風(fēng)扇停止
Furmark滿載測(cè)試20分鐘,GPU溫度71℃,風(fēng)扇轉(zhuǎn)速1500rpm左右
從FE版的滿載測(cè)試可以看出,RTX 4090的溫度控制比RTX 3090Ti要更好一點(diǎn),風(fēng)扇轉(zhuǎn)速恰好處于1500rpm這個(gè)人耳噪音識(shí)別的臨界點(diǎn),不會(huì)感覺到不適。此時(shí)GPU-Z顯示全板功耗在450W左右,與NVIDIA官方數(shù)據(jù)TGP相符。
Frumark滿載時(shí)全平臺(tái)功耗536W
考慮Furmark測(cè)試時(shí)CPU通常只有單核滿載,功耗主要來(lái)自顯卡,按照上圖測(cè)試結(jié)果再往上放出300W的空間,一個(gè)800W的電源可以確保穩(wěn)定支撐一臺(tái)安裝了RTX 4090顯卡的PC,NVIDIA官方建議也是如此。
結(jié)語(yǔ):
曾經(jīng)許多GeForce GTX 10系顯卡玩家希望繞過(guò)光追體驗(yàn)不夠完善的20系,直接入手30系,結(jié)果命運(yùn)給大家開了一個(gè)玩笑,盡管30系本身表現(xiàn)不俗,但它卻“缺席”了,如今Steam調(diào)查玩家手中保有量最大的顯卡竟依然是GTX 1060。
因?yàn)閷?duì)“礦卡”的忌憚,RTX 40系顯卡提前進(jìn)入玩家們期待的視野,經(jīng)過(guò)近兩年的煎熬之后,攜DLSS3這柄利劍而來(lái)的GeForce RTX 4090用令人震撼的表現(xiàn)向玩家證明等待是值得的。TSMC 4N制程的Ada架構(gòu)和進(jìn)一步改進(jìn)的RT單元將其擴(kuò)充出雙倍于上一代的能量,DLSS3錦上添花,利用光流計(jì)算動(dòng)態(tài)插幀這一天才構(gòu)想是其理論上憑空生成雙倍的幀率,也難怪NVIDIA官方會(huì)大膽宣稱Ada將具有四倍于Ampere的性能。
我們有理由相信,在GeForce RTX 40系這一代產(chǎn)品中,性能再也不是4K分辨率游戲的壁壘,本次常規(guī)游戲測(cè)試中我們保守的選擇了DLSS質(zhì)量模式,而且還未更新到DLSS3,許多游戲已經(jīng)在4K下達(dá)到100fps以上的暢爽程度。NVIDIA AI算法的不斷進(jìn)步讓畫質(zhì)損失越來(lái)越小,事實(shí)上DLSS性能跟質(zhì)量模式的畫質(zhì)已經(jīng)幾乎看不出區(qū)別,或許以后我們的測(cè)試中將改變DLSS級(jí)別標(biāo)準(zhǔn),為用戶充分展示DLSS 3帶來(lái)的超凡體驗(yàn)。
最后值得一提的是,NVIDIA將限量推出GeForce RTX 4090 FE版,官方指導(dǎo)價(jià)12999元,于北京時(shí)間10月12日晚9點(diǎn)在京東首發(fā)上市,旨在為鐘愛FE版設(shè)計(jì)的發(fā)燒級(jí)玩家?guī)?lái)無(wú)與倫比的體驗(yàn)。屆時(shí)玩家可以選購(gòu)來(lái)自NVIDIA FE版和來(lái)自頂級(jí)顯卡供應(yīng)商的RTX 4090 GPU標(biāo)頻版和超頻版。