丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給任然
發(fā)送

0

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

本文作者: 任然 2018-09-28 20:50
導(dǎo)語(yǔ):近日,NVIDIA終于揭開了全新Turing架構(gòu)細(xì)節(jié)的面紗

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

雷鋒網(wǎng)消息,自NVIDIA的Turing架構(gòu)問(wèn)世已經(jīng)過(guò)去了一個(gè)多月時(shí)間,GeForce RTX 20系列的發(fā)布以及實(shí)時(shí)光線跟蹤技術(shù)的推出,讓NVIDIA將使用多年的“GeForce GTX”更名為“GeForce RTX“,并徹底改變了游戲顯卡。實(shí)時(shí)光線跟蹤、RT Core、Tensor核心、AI功能(即DLSS)、光線跟蹤API,所有這些都匯集在一起,為游戲開發(fā)和GeForce顯卡的未來(lái)發(fā)展指明了新方向。

與過(guò)去推出的產(chǎn)品大不相同,NVIDIA已將其最新顯卡的介紹內(nèi)容分為兩部分:架構(gòu)和性能。近日,NVIDIA終于揭開了全新Turing架構(gòu)細(xì)節(jié)的面紗,雖然一些有趣的方面尚未得到官方解釋,還有一些環(huán)節(jié)需要與客觀數(shù)據(jù)一起深入研究,但也讓我們有機(jī)會(huì)深入了解那項(xiàng)為GeForce RTX冠名的技術(shù):光線追蹤。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

雖然使用Turing的實(shí)時(shí)光線追蹤功能需要借助DirectX的光線追蹤(DXR)API、NVIDIA的OptiX引擎或未發(fā)布的Vulkan光線追蹤擴(kuò)展,而用于游戲的DXR還沒(méi)有發(fā)布給終端用戶,但鑒于NVIDIA傳統(tǒng)上具有開發(fā)人員和中間件(例如GameWorks)的強(qiáng)大生態(tài)系統(tǒng),他們希望利用高端游戲來(lái)激發(fā)消費(fèi)者對(duì)混合渲染(光柵化+光線跟蹤)的支持。

正如之前所說(shuō),NVIDIA正在通過(guò)混合渲染來(lái)努力推動(dòng)消費(fèi)級(jí)GPU實(shí)現(xiàn)脫胎換骨的轉(zhuǎn)變。而使NVIDIA邁出這一步的背后原因,除開“實(shí)時(shí)光線追蹤是計(jì)算機(jī)圖形學(xué)的圣杯”這一點(diǎn)之外,還有很多超越了圖形純粹主義的其他潛在動(dòng)機(jī)。

光線追蹤第一課:what&why

由于NVIDIA用于光線追蹤的RT Core是Turing架構(gòu)的兩項(xiàng)技術(shù)基石之一,因此在我們深入了解Turing架構(gòu)之前,最好先討論清楚什么是光線追蹤,以及為什么NVIDIA會(huì)在其上投入如此多的芯片資源。

簡(jiǎn)而言之,光線追蹤是一種渲染方式,可模擬光在現(xiàn)實(shí)世界中的表現(xiàn)(反射、折射等)。實(shí)現(xiàn)它的最大問(wèn)題在于它近乎于無(wú)底洞一樣夸張的性能的需求,如果使用最原始的方法來(lái)嘗試計(jì)算場(chǎng)景中每個(gè)光源發(fā)出的所有光線,將會(huì)在場(chǎng)景中追蹤到無(wú)窮無(wú)盡的光線。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

多年以來(lái),算法工程師們?yōu)楣饩€追蹤開發(fā)了許多優(yōu)化措施,其中最重要的是把“光照”這一簡(jiǎn)單的概念顛倒過(guò)來(lái),不是從光源開始追蹤光線,而是從屏幕、從觀測(cè)者的視點(diǎn)逆向追蹤光線,這樣便可以只計(jì)算實(shí)際到達(dá)屏幕的光線,大幅縮減所需的計(jì)算量。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

然而即便使用了包括此法在內(nèi)的許多優(yōu)化方式,光線追蹤對(duì)性能的需求依然高的驚人。除了最基本、最粗糙的光線追蹤之外,其他任何情況都依然超出了實(shí)時(shí)渲染的范圍。這些優(yōu)化技術(shù)僅僅是讓光線追蹤可以在計(jì)算機(jī)上以相對(duì)“合理”的時(shí)間完成,當(dāng)然這個(gè)“合理”是以小時(shí)或天來(lái)衡量的,這要取決于場(chǎng)景的復(fù)雜程度以及你所期望達(dá)到的渲染效果。實(shí)際上到目前為止,光線追蹤一直被主要是3D動(dòng)畫電影等“離線”場(chǎng)景。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

光柵化渲染的是是非非

光線追蹤的高成本意味著它還不能用于實(shí)時(shí)圖像渲染,因此計(jì)算機(jī)行業(yè)從一開始便使用了一種名為光柵化的渲染方法。

雖然名字沾一個(gè)“光”字,但整個(gè)光柵化渲染中其實(shí)根本沒(méi)有“光線”的概念。光柵化(Rasterization)指的是3D幾何轉(zhuǎn)換為2D像素的過(guò)程,所有的畫面特效都只是針對(duì)一個(gè)個(gè)像素的操作。

當(dāng)游戲開始渲染一幀畫面時(shí),首先由CPU生成游戲場(chǎng)景中所有物體的頂點(diǎn),然后把所有頂點(diǎn)的坐標(biāo)信息發(fā)送給GPU內(nèi)的幾何單元。幾何單元以屏幕位置為基準(zhǔn)構(gòu)建出可視空間,將這些頂點(diǎn)按照坐標(biāo)安置到空間中,緊接著將頂點(diǎn)連接成線框,構(gòu)造出物體的輪廓,然后在表面覆蓋上一層帶有帶光照信息的底層紋理作為蒙皮。到這一步,我們的游戲畫面便初具幾何形態(tài)。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

接下來(lái)便是整個(gè)光柵化渲染流程的核心:光柵化,GPU內(nèi)的光柵化單元(Rasterizer)依照線透視關(guān)系,將整個(gè)可視空間從三維立體形態(tài)壓成一張二維平面。之后流處理器再根據(jù)場(chǎng)景中物體之間的幾何位置關(guān)系,通過(guò)各種渲染算法,確定哪些像素亮&有多亮,哪些像素暗&有多暗,哪些像素是高光,哪些像素是陰影。

在流處理器忙著計(jì)算像素信息的同時(shí),GPU內(nèi)的紋理單元也開始將預(yù)設(shè)的“整張”紋理材質(zhì)剪裁成畫面所需的形狀。最后,流處理器和紋理單元分別把計(jì)算好的像素信息和剪裁好的紋理材質(zhì)遞交給處于GPU后端的ROPs,ROPs將二者混合填充為最終畫面并輸出。除此之外,游戲中霧化、景深、動(dòng)態(tài)模糊和抗鋸齒等后處理特效,也是由ROPs完成的。

看到這里應(yīng)該明白,我們看到的每一幀游戲畫面,都是GPU畫給你的一張3D立體畫而已。3D立體畫看起來(lái)真不真實(shí),取決于繪畫者的水平如何;而光柵化渲染出來(lái)的畫面真不真實(shí),取決于渲染算法是否先進(jìn)和完善。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

混合渲染,光線追蹤回歸

光柵化的簡(jiǎn)單和快速?zèng)Q定了其對(duì)現(xiàn)實(shí)世界中畫面的模擬是有限的,這也導(dǎo)致了光柵化普遍存在光照、反射和陰影不自然等缺陷。如果光柵化是如此不準(zhǔn)確,游戲如何進(jìn)一步提高其圖像質(zhì)量?

當(dāng)然可以繼續(xù)這么走下去,光柵化解決這些問(wèn)題并非不可能,只是所需要的計(jì)算性能將會(huì)高速膨脹。就像撒一個(gè)謊要用十個(gè)謊來(lái)圓一樣,某些情況下想用光柵化渲染生成逼真的畫面,甚至比光線追蹤的自然過(guò)程更復(fù)雜。

換句話說(shuō),與其在光柵化這種本質(zhì)是視覺(jué)欺騙的渲染方式上消耗這么多性能,何不把這些努力投入另一種可以準(zhǔn)確渲染虛擬世界的技術(shù)上?

2018年,整個(gè)計(jì)算機(jī)行業(yè)都在思考這一問(wèn)題。而對(duì)于NVIDIA來(lái)說(shuō),前進(jìn)的道路不再是純粹的光柵化,而是混合渲染:將光柵化與光線追蹤相結(jié)合,其想法是在有意義的地方使用光線跟蹤——用于照明、陰影和其他所有涉及光的相互作用的內(nèi)容,然后使用傳統(tǒng)的光柵化來(lái)處理其他一切,這也正是Turing架構(gòu)的核心思想所在。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

這意味著開發(fā)人員可以兩全其美,根據(jù)需求平衡光柵化的高性能和光線追蹤的高質(zhì)量,而無(wú)需立即從光柵化跳轉(zhuǎn)到光線追蹤并失去前者的所有性能優(yōu)勢(shì)。到目前為止,NVIDIA及其合作伙伴所展示的案例都是很容易實(shí)現(xiàn)的,比如精確的實(shí)時(shí)反射和更好的全局光照,但顯而易見混合渲染可以擴(kuò)展到任何與光照相關(guān)操作。

然而,NVIDIA、微軟和其他公司也不得不為其從零開始建立一個(gè)生態(tài)系統(tǒng),他們不僅要向開發(fā)人員推銷光線追蹤的優(yōu)點(diǎn),而且還要教開發(fā)人員如何以有效的方式實(shí)現(xiàn)它。

不過(guò)我們現(xiàn)在依舊可以可以先來(lái)討論一下光線追蹤,看看NVIDIA如何通過(guò)構(gòu)建專用硬件單元,將實(shí)時(shí)光線追蹤變?yōu)楝F(xiàn)實(shí)。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

邊界體積層次結(jié)構(gòu)

可以說(shuō),NVIDIA在Turing上下了很大的賭注,傳統(tǒng)的GPU架構(gòu)可以高速處理光柵化渲染,但并不擅長(zhǎng)光線追蹤這項(xiàng)任務(wù)。因此NVIDIA必須為光線追蹤增設(shè)專用硬件單元,而這些額外的晶體管和電力消耗卻對(duì)傳統(tǒng)的光柵化渲染沒(méi)有直接的助益。

這部分專用硬件單元很大程度上將被用于解決光線追蹤的最基本問(wèn)題:判定光線與物體的相交情況。這個(gè)問(wèn)題最常見的解決方案是將三角形存儲(chǔ)在一個(gè)非常適合光線追蹤的數(shù)據(jù)結(jié)構(gòu)中,這種數(shù)據(jù)結(jié)構(gòu)稱為BVH(邊界體積層次結(jié)構(gòu))。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

從概念上講,BVH相對(duì)簡(jiǎn)單,它并不是檢測(cè)每個(gè)多邊形以判斷是否與光線相交,而是檢測(cè)場(chǎng)景的一部分以查看是否與光線相交。如果場(chǎng)景某部分與光線相交,則將其細(xì)分為較小的部分并再次檢測(cè),依次繼續(xù)下去直至單個(gè)多邊形,此時(shí)光線檢測(cè)得到解決。

對(duì)于計(jì)算機(jī)科學(xué)家來(lái)說(shuō),這聽起來(lái)很像二元搜索的應(yīng)用,而且確實(shí)如此。每次檢測(cè)都允許丟棄大量選項(xiàng)(在光線追蹤中為多邊形)作為可能的答案,便可以在很短的時(shí)間內(nèi)到達(dá)正確的多邊形。BVH反過(guò)來(lái)又存儲(chǔ)在本質(zhì)上是樹數(shù)據(jù)結(jié)構(gòu)的東西中,每次細(xì)分(邊界框)都存儲(chǔ)為其父邊界框的子節(jié)點(diǎn)。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

現(xiàn)在BVH的問(wèn)題是,雖然它從根本上減少了所需判斷的光線相交量,但這些針對(duì)的都是單獨(dú)一條光線,當(dāng)每個(gè)像素都需要多條光線經(jīng)過(guò)時(shí),每條光線都需要進(jìn)行大量檢測(cè),它的計(jì)算量依然不低。這也是為什么使用專門的光線追蹤單元進(jìn)行硬件加速如此重要的原因。

繼承Volta精神的Turing架構(gòu)

我們來(lái)看看這次的Turing架構(gòu),新的Turing SM看起來(lái)與上一代的Pascal SM非常不同,但了解Volta架構(gòu)的人肯定能注意到Turing SM與Volta SM是非常相似的。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

與Volta一樣,Turing SM被劃分為4個(gè)子核(或處理塊),每個(gè)子核具有單個(gè)warp調(diào)度器和調(diào)度單元,而Pascal的2個(gè)分區(qū)設(shè)置是每個(gè)子核的warp調(diào)度器具有兩個(gè)相對(duì)的調(diào)度端口。

從廣義上講,這樣的變化意味著Volta和Turing失去了在一個(gè)時(shí)鐘周期內(nèi)從線程發(fā)出第二條非依賴指令的能力。Turing可能與Volta在兩個(gè)周期內(nèi)執(zhí)行指令相同,但調(diào)度程序可以在每個(gè)周期發(fā)出獨(dú)立指令,因此Turing最終可以通過(guò)這種方式維護(hù)雙向指令級(jí)并行(ILP),同時(shí)仍然具有兩倍于Pascal的調(diào)度程序數(shù)量。

正如我們?cè)赩olta中看到的那樣,這些變化與新的調(diào)度/執(zhí)行模型緊密相連,而Turing也有獨(dú)立的線程調(diào)度模型。與Pascal不同的是,Volta和Turing都有每個(gè)線程的調(diào)度資源,有一個(gè)程序計(jì)數(shù)器和每個(gè)線程的堆棧來(lái)跟蹤線程的狀態(tài),以及一個(gè)收斂?jī)?yōu)化器來(lái)智能的將活動(dòng)的同warp線程分組到SIMT單元中。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

就CUDA和ALU(算術(shù)邏輯單元)而言,Turing子核具有16個(gè)INT32單元,16個(gè)FP32單元和2個(gè)Tensor單元,與Volta子核的設(shè)置相同。使用像Volta這樣的拆分INT/FP數(shù)據(jù)路徑模型,Turing還可以同時(shí)執(zhí)行FP和INT指令,而這與RT Core密切相關(guān)。Turing與Volta的不同之處在于Turing沒(méi)有FP64單元,其FP64的吞吐量只有FP32的1/32。

雖然這些細(xì)節(jié)可能更偏向于技術(shù)方面,但Volta的這種設(shè)計(jì)似乎是為了最大化Tensor Core的性能,而最大限度的減少了破壞性并行性或與其他計(jì)算工作負(fù)載的協(xié)調(diào)。對(duì)于Turing的第二代Tensor Core和RT Core來(lái)說(shuō)情況也是如此,其中4個(gè)獨(dú)立調(diào)度的子核和粒度線程處理對(duì)于在混合游戲?qū)蚬ぷ髫?fù)載下實(shí)現(xiàn)最高性能非常有用。

在內(nèi)存方面,Turing的每個(gè)子核都有一個(gè)類似Volta的L0指令緩存,具有相同大小的64 KB寄存器文件。在Volta中,這對(duì)于減少Tensor Core的延遲很重要,而在Turing中這可能同樣有利于RT Core。Turing SM每個(gè)子核也有4個(gè)加載/存儲(chǔ)單元,低于Volta中的8個(gè),但仍然保持4個(gè)紋理單元。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

新的L1數(shù)據(jù)高速緩存和共享內(nèi)存(SMEM)進(jìn)一步向上擴(kuò)展,它已被改進(jìn)并統(tǒng)一為單個(gè)可分區(qū)內(nèi)存塊,這是Volta的另一項(xiàng)創(chuàng)新。對(duì)于Turing來(lái)說(shuō),這看起來(lái)是一個(gè)組合的96 KB L1/SMEM,傳統(tǒng)圖形工作負(fù)載分為64KB專用圖形著色器RAM和32 KB紋理高速緩存和寄存器文件溢出區(qū)域。同時(shí),計(jì)算工作負(fù)載可以將L1/SMEM劃分最多64 KB作為L(zhǎng)1,其余32 KB作為SMEM,反之亦然(Volta的SMEM最高可配置為96 KB)。

RT Core:混合渲染和實(shí)時(shí)光線跟蹤

在Turing上,光線追蹤并不能完全取代傳統(tǒng)的光柵化渲染,而是作為“混合渲染”的一部分而存在,而且“實(shí)時(shí)”也只能在每個(gè)像素只通過(guò)少量光線并輔以大量降噪的情況下實(shí)現(xiàn)。

出于性能原因,現(xiàn)階段開發(fā)人員將有意識(shí)和有針對(duì)性的利用光線追蹤來(lái)實(shí)現(xiàn)光柵化無(wú)法實(shí)現(xiàn)的部分逼真效果,例如全局照明、環(huán)境光遮蔽、陰影、反射和折射等。光線追蹤同樣也可以限于場(chǎng)景中的特定對(duì)象,并且使用光柵化和z緩沖代替主光線投射,而僅對(duì)次光線進(jìn)行光線跟蹤。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

憑借光線追蹤在計(jì)算機(jī)圖形領(lǐng)域的重要性,NVIDIA Research相當(dāng)長(zhǎng)一段時(shí)間內(nèi)一直在研究各種BVH實(shí)現(xiàn),以及探索光線跟蹤加速的架構(gòu)問(wèn)題。不過(guò)NVIDIA并未透露有關(guān)RT Core或其BVH實(shí)現(xiàn)的許多細(xì)節(jié)。

RT Core與Tensor Core不同,Tensor Core更像是與FP和INT核心一起的FMA陣列,而RT Core更像是典型的卸載IP塊。與子核中的紋理單元非常相似,RT Core的指令被路由到子核之外,在從SM接收到光線探測(cè)器后,RT核心繼續(xù)自主遍歷BVH并執(zhí)行光線相交檢測(cè)。

這種類型的“遍歷和交叉”固定函數(shù)光線追蹤加速器是一個(gè)眾所周知的概念,多年來(lái)已經(jīng)有很多實(shí)現(xiàn),因?yàn)楸闅v和交叉檢測(cè)是計(jì)算密集程度最高的兩種任務(wù)。相比之下,在著色器中遍歷BVH將需要每條光線投射數(shù)千個(gè)指令槽,所有這些都用于檢測(cè)BVH中的邊界框交叉點(diǎn)。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

RT Core還處理一些內(nèi)存操作的分組和調(diào)度,以最大化跨多個(gè)光線的內(nèi)存吞吐量。與許多其他工作負(fù)載一樣,內(nèi)存帶寬是光線追蹤的一個(gè)常見瓶頸,也是NVIDIA Research多篇論文討論的焦點(diǎn)。考慮到光線追蹤會(huì)產(chǎn)生非常不規(guī)則和隨機(jī)的內(nèi)存訪問(wèn),SIP塊中可能還有一些內(nèi)存和光線緩沖區(qū)。

Tensor Cores:將深度學(xué)習(xí)推理用于游戲渲染

盡管Tensor Cores是Volta的典型特征,但此番Turing上搭載的第二代Tensor Core卻是青出于藍(lán)。

第二代Tensor Core的主要變化是增加了用于推理的INT8和INT4精度模式,通過(guò)新的硬件數(shù)據(jù)路徑啟用,并執(zhí)行點(diǎn)積累積為INT32積。INT8模式的運(yùn)算速度是FP16的兩倍,或每個(gè)時(shí)鐘2048次整數(shù)運(yùn)算;INT4模式的運(yùn)算速度是FP16速率的四倍,或每個(gè)時(shí)鐘4096次整數(shù)運(yùn)算。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

第二代Tensor Core仍然具有FP16模式,并且能夠支持純FP16模式而沒(méi)有FP32累加器。雖然CUDA 10還沒(méi)有出來(lái),但增強(qiáng)的WMMA操作應(yīng)該能夠解釋任何其他差異,例如操作數(shù)的額外可接受矩陣大小。

GeForce RTX和Turing所帶來(lái)的不僅是RTX這一全新品牌命名,還有將Turing的所有功能歸為一體的NVIDIA RTX平臺(tái),包括:

NVIDIA RTX平臺(tái):包含所有Turing功能的通用平臺(tái),包括高級(jí)著色器

NVIDIA RTX光線追蹤技術(shù):RTX平臺(tái)下光線追蹤技術(shù)的名稱

GameWorks Raytracing:光線追蹤降噪模塊的GameWorks SDK

GeForce RTX:使用NVIDIA RTX實(shí)時(shí)光線追蹤與游戲相關(guān)的品牌

GeForce RTX:顯卡品牌

NGX在技術(shù)上隸屬于RTX平臺(tái),其最具代表性的是DLSS(深度學(xué)習(xí)超級(jí)采樣)技術(shù)。DLSS使用專為游戲而設(shè)的DNN(深度神經(jīng)網(wǎng)絡(luò)),使用超高質(zhì)量的64倍超級(jí)采樣圖像或真實(shí)畫面進(jìn)行訓(xùn)練,進(jìn)而通過(guò)Tensor Core來(lái)推斷高質(zhì)量的抗鋸齒結(jié)果。標(biāo)準(zhǔn)模式下,DLSS以較低的輸入樣本推斷出高倍抗鋸齒的結(jié)果,在目標(biāo)分辨率上可達(dá)到與TAA相似的效果。

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

由于涉及深度學(xué)習(xí),NVIDIA正在將純粹的計(jì)算/專業(yè)功能推向消費(fèi)者領(lǐng)域。在Turing上,Tensor Core可以加速DLSS等特性,也可以加速某些基于AI的降噪器,以清理和校正實(shí)時(shí)光線追蹤渲染的畫面。

雷鋒網(wǎng)小結(jié)

Turing架構(gòu)和Geforce RTX的發(fā)布,標(biāo)志著計(jì)算機(jī)圖形學(xué)在消費(fèi)級(jí)市場(chǎng)上開始從虛假的視覺(jué)欺騙向著真實(shí)的追光逐影發(fā)展。到目前為止,業(yè)界對(duì)它們的贊譽(yù)也一直是毫不吝惜。

雖然Turing架構(gòu)增設(shè)了專用的光線追蹤單元RT Core,并輔以Tensor Core來(lái)進(jìn)行AI降噪,但在冷靜客觀的思考下,根據(jù)雷鋒網(wǎng)的了解,在1080P分辨率下,光線追蹤具備基本可用性的入門門檻是每幀畫面包含1億條光線,如果以60fps為標(biāo)準(zhǔn),就需要GPU達(dá)到每秒至少能處理60億條光線的計(jì)算能力。

回過(guò)頭來(lái)看剛剛發(fā)布的Geforce RTX 2080Ti/2080/2070三款顯卡,它們的光線追蹤性能分別是每秒處理100億/80億/60億條光線,并且NVIDIA似乎表示未來(lái)更低的Geforce RTX/GTX 2060等顯卡將不再支持光線追蹤。

不知這是不是巧合,Geforce RTX 2070的光線追蹤性能剛剛好壓在了上面所述具備基本可用性的入門門檻上,這樣來(lái)看,更低端的顯卡不支持光線追蹤也是情有可原。

此外,也許是目前的光線追蹤算法過(guò)于追求簡(jiǎn)化,對(duì)光影關(guān)系的還原仍有可能出現(xiàn)錯(cuò)誤。例如在NVIDIA用戰(zhàn)地V這款游戲演示RTX效果時(shí),汽車對(duì)于火光的反射便出現(xiàn)了一處錯(cuò)誤,紅框處的車燈罩是背對(duì)著車后的火光的,從角度上來(lái)看完全不應(yīng)該有火光的反射:

NVIDIA Turing架構(gòu)解析:追光逐影,成敗未定

且根據(jù)最近流出的性能測(cè)試來(lái)看,即便是最高端的Geforce RTX 2080Ti在開啟光線追蹤后,也僅能在1080P下將幀數(shù)維持45fps左右,顯然還要大幅低于理論性能。種種情況表明,現(xiàn)階段的光線追蹤依然徘徊在“有可用性”的門檻邊緣,Turing和Geforce RTX顯卡是否已經(jīng)邁過(guò)了這一腳,真的還不好說(shuō)……

via:Anandtech

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:

編輯

觀點(diǎn)離經(jīng)叛道的骨灰級(jí)硬件愛(ài)好者
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)