跨越藩籬,超越極限:最新加速引擎技術(shù)掃描
Win 7引入全新2D加速引擎
1. 2D引擎加強(qiáng)文字顯示
在大家常用的文字、圖像領(lǐng)域,一些2D加速引擎被廣泛應(yīng)用。眾所周知,在實(shí)際應(yīng)用中,液晶顯示器會(huì)因顯示分辨率不能實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)而出現(xiàn)字體發(fā)虛的問(wèn)題,因此在Windows XP/Vista中,微軟引進(jìn)了ClearType技術(shù),讓字體像素邊緣的RGB各個(gè)次像素都發(fā)光,通過(guò)增強(qiáng)桌面字體邊緣的平滑度來(lái)使字體更清晰。而在Windows 7中,微軟繼續(xù)對(duì)ClearType進(jìn)行了改進(jìn),它通過(guò)引入基于ClearType字體渲染的新型API(應(yīng)用程序編程接口),特別加強(qiáng)了GPU在文字顯示中的作用。
提到ClearType就不得不說(shuō)WDDM(Windows圖形驅(qū)動(dòng)標(biāo)準(zhǔn))。以往的字體顯示基本不需要顯卡參與,而在新系統(tǒng)中這種局限正被改變。當(dāng)然,要想讓操作系統(tǒng)能顯示出Aero效果或更好地實(shí)現(xiàn)ClearType,就需要借助GPU,而此時(shí)顯卡驅(qū)動(dòng)支持WDDM是必需的。由于Windows 7和Vista都是能直接利用GPU的操作系統(tǒng),其桌面顯示以及渲染可在操作系統(tǒng)和GPU間通過(guò)WDDM來(lái)協(xié)調(diào)并直接交互——如果顯卡性能強(qiáng)勁,那么應(yīng)用程序會(huì)有比較出色的視覺(jué)效果;如果顯卡性能一般,那么WDDM就會(huì)自動(dòng)調(diào)低應(yīng)用程序的顯示效果。
由于Vista在市場(chǎng)里的失勢(shì),Vista里的WDDM 1.0也并沒(méi)有在實(shí)際應(yīng)用中獲得很大反響。而Windows 7里的新版WDDM 1.1相比老版帶來(lái)了更好的穩(wěn)定性和性能,可為用戶提供更好的Direct2D硬件加速,以及二維幾何圖形、位圖、文字抗鋸齒等應(yīng)用,并讓GPU的多任務(wù)處理在Windows中成為可能。
2. 硬件加速實(shí)現(xiàn)抗鋸齒
通過(guò)Windows 7中集成的API,GDI(圖形設(shè)備接口)將直接在顯卡的顯存中進(jìn)行渲染,這將極大地降低系統(tǒng)內(nèi)存的消耗并讓圖形呈現(xiàn)速度加快。同時(shí),為了強(qiáng)化2D效果,Windows 7還帶來(lái)了新的API——Direct2D和DirectWrite。
Direct2D是即時(shí)渲染2D圖形的硬件加速API,它建立在DX10.1的MSAA多重采樣抗鋸齒技術(shù)基礎(chǔ)上,它在二維幾何圖形和文本方面有著較高的性能和質(zhì)量,而且Direct2D還可在GDI和Direct3D之間進(jìn)行互操作。
DirectWrite是一種新的文本渲染系統(tǒng),用于在D3D/D2D目標(biāo)上渲染ClearType文本,配合Direct2D利用GPU進(jìn)行加速。它增加了子像素渲染、子像素加X(jué)軸方向/Y軸方向抗鋸齒渲染兩種渲染模式,而傳統(tǒng)GDI的渲染就只有X軸方向抗鋸齒渲染。DirectWrite可提供更高質(zhì)量的文本呈現(xiàn),具有獨(dú)立分辨率的字體輪廓,可更好地提升桌面2D圖像的渲染效果,帶來(lái)硬件加速文字顯示和抗鋸齒效果。
DirectX 11的3D加速引擎
1. DX 11處處優(yōu)化 GPU
Windows 7最大的特點(diǎn)之一還在于引入了新一代的API——DirectX 11。它除了集成有Direct2D、DirectWrite之外,還有DXGI(DirectX圖形基礎(chǔ)構(gòu)造),用于管理設(shè)備和GPU資源以及提供DirectX和GDI之間的交互性。同時(shí)還整合了用于渲染3D圖形的Direct3D 10/10.1和Direct3D 11,后者更新,支持下一代GPU。
通過(guò)DirectX 11中的Compute Shader(計(jì)算著色器)將使GPU具有更好的并行處理能力。特別是在擁有多個(gè)GPU的系統(tǒng)中,DirectX 11中的Multi-Threading多線程技術(shù),可在API底層對(duì)多個(gè)GPU進(jìn)行優(yōu)化,減少對(duì)驅(qū)動(dòng)和游戲渲染模式的依賴,也有助于提升多個(gè)GPU并聯(lián)的工作效率,降低驅(qū)動(dòng)開發(fā)難度及性能損失。而在渲染效率方面,TessellATIon(鑲嵌化技術(shù))讓程序員只需要簡(jiǎn)單勾繪一個(gè)輪廓,便能自動(dòng)對(duì)其進(jìn)行貼圖拆嵌,可大大提高渲染速度以及開發(fā)效率。
2. 統(tǒng)一通用計(jì)算標(biāo)準(zhǔn)
在DirectX 11中,最重要的還是Compute Shader,它是一種包含線程間數(shù)據(jù)通信、隨機(jī)訪問(wèn)和流式I/O操作單元等組件的3D圖形加速引擎,能加快和簡(jiǎn)化圖像后期處理。眾所周知,Intel、AMD、NVIDIA、IBM等廠家紛紛推出了自己的通用并行計(jì)算平臺(tái)或理論,如NVIDIA的CUDA、AMD的GPGPU、Stream等,為此展開了激烈的競(jìng)爭(zhēng)。但是這種標(biāo)準(zhǔn)林立的情況無(wú)疑將加大程序或程序員適應(yīng)不同廠家硬件的難度,增大軟件開發(fā)的工作量。為此,在使用更廣泛的DirectX圖形領(lǐng)域,Compute Shader的面世將改變這種亂戰(zhàn)局面。
程序員可以直接將GPU作為并行處理器加以利用,將復(fù)雜的數(shù)據(jù)結(jié)構(gòu)交給Compute Shader后,就能直接運(yùn)行各種通用算法。GPU不僅具有3D渲染能力,也具有其他的加速運(yùn)算能力,這就是我們說(shuō)的GPGPU概念和物理加速運(yùn)算,而且多線程處理技術(shù)使游戲更好地利用了系統(tǒng)的多個(gè)核心。為此,程序員可通過(guò)Compute Shader加速引擎來(lái)實(shí)現(xiàn)像素渲染引擎無(wú)法實(shí)現(xiàn)的高級(jí)特效,如A-Buffer緩存取樣技術(shù),可以很大程度增加抗鋸齒以及無(wú)規(guī)則透明度的性能。還可以帶來(lái)更先進(jìn)的Deferred Shading(延遲著色)技術(shù)、卷積運(yùn)算、FFT(快速傅里葉轉(zhuǎn)換)以及區(qū)域求和表算法。
3. Compute Shader增強(qiáng)GPU應(yīng)用
Windows 7內(nèi)置的GPU加速功能基于DirectX 11中的Compute Shader通用計(jì)算技術(shù),在一段海洋Demo中,實(shí)時(shí)計(jì)算大規(guī)模波浪動(dòng)態(tài)效果需要龐大的計(jì)算量,如果用傳統(tǒng)的模擬算法來(lái)實(shí)現(xiàn)這一效果,渲染速度將難以讓人接受。而使用Computer Shader技術(shù),API將能借助GPU強(qiáng)大的浮點(diǎn)計(jì)算能力進(jìn)行加速計(jì)算,便能輕易完成大量的FFT轉(zhuǎn)換,極大地提高波浪生成速度以及畫面質(zhì)量。據(jù)測(cè)試表明,借助Compute Shader,DirectX 11可以提供最多三倍于DirectX 10.1的加速性能,特別是在基于屏幕空間的環(huán)境光遮蔽(SSAO)中,它可以使用更少的工作流程來(lái)處理大量數(shù)據(jù)流,并減輕紋理單元讀取數(shù)據(jù)的工作壓力。