有史以來第一次超越 NVIDIA

值得注意的是,對 DirectX 9.0 的支援也使得 ATI 有史以來第一次成功在產品功能上超越 NVIDIA),從歷史的角度上來看其實這點還蠻有趣的,在 DirectX 8 時期是由 NVIDIA 搶快推出了支援 DirectX 8 的 GeForce3,不過後來卻因為太早推出而被微軟的 DirectX 8.1 扇了一巴掌,但這次卻是由 ATI 搶快了,而且有著截然不同的結果 (其實主要原因在於 DirectX 9 沒改架構,卻讓 Shader Model 真正進入成熟階段,而且市面上支援 Shader Model 的遊戲也漸漸增加了)

新的覆晶封裝方式

第二個主要改進則是封裝方式的改變,儘管 Radeon R300 仍然基於與前代相同的 150 奈米製造工藝生產,但卻首次使用新的覆晶球狀陣列封裝 (FC-BGA) 來製造 GPU 晶片 (其實也不算新啦,FC 技術早在 1960 年代就被 IBM 發明出來了,只是沒有用在個人電腦上) 而不是使用一般常見的 BGA 封裝方式。

acx8855

傳統上使用的 BGA 封裝方式 (上圖) 是採用導線架 (Lead Frame) 來將晶片本身的接點與基板連接 (這種方式稱之為「打線接合 (Wire Bonding)」),因此實質上晶片電路本身是面向電路板的,因此面對散熱器的部分實質上是晶片的外殼,而且只是「背面」,顯然這種作法散熱效率不會太好。

akt8855

而 Radeon R300 所使用的覆晶球狀陣列封裝 (FC-BGA) 則是直接在晶片本體上做出金屬接點,並將整個晶片翻面之後,運用熱風回流焊等技術直接焊接到電路基板上,因此晶片本身是得以和散熱器接觸的,這使得 Radeon R300 的散熱問題變得容易解決許多 (基本上當今的 GPU 與 CPU 都是使用類似的方式封裝的),也使得 R300 能夠拉高時脈,在性能上有很明顯的幫助。

搭上 Shader Model 2.0 的強化之後這兩個因素更讓 ATI 得以再次從 NVIDIA 手中奪回性能王者的王位 (同時也因為當時顯得極為強大,遠勝過 NVIDIA 同期產品 50% ~ 100% 的反鋸齒 (AA) 計算性能,使得反鋸齒技術得以漸漸普及)

幾乎全面翻倍的架構設計

axe8066

而第三個主要改進則是在架構上的配置參數有很大的不同,我們知道在上一代的 R200 當中 ATI 放棄了三重紋理貼圖設計,並將材質對應單元 (TMUs) 的數量改為 2 的倍數以提高雙重紋理貼圖 (較常見的情況) 利用 TMU 的效率,在 R300 當中也是維持了這樣的想法,但是數量上又再次提高了不少。

ksx8565

R300 系列的核心最多能搭載 8 組像素渲染器、4 組頂點渲染器、4 組著色輸出單元 (ROP),這些都是 R200 的兩倍 (僅有 TMU 數量維持不變,因此像素渲染器對材質對應單元的比例變成 1:1,但得益於 loopback 設計的強化,對性能沒有造成太多負面影響),因此在性能上又帶來了更大幅度的提升,也使得 ATI 可以透過刪減這些單元配置的方式來細分出更多不同版本的晶片以滿足不同階層市場的需要。

記憶體架構與第三代 HyperZ 技術

msm6655

最後一項改進則是記憶體頻道寬度的大幅提升,Radeon R300 是全世界第一款支援 256 位元寬度 DDR 記憶體通道的顯示晶片 (由四組 64-bit 記憶體控制器所組成,至於為什麼這樣設計其實是有原因的,因為「每次傳送的資料未必足以塞滿 256-bit」,如果在這種情況下單一的 256-bit 記憶體控制器就會有很多地方被浪費掉,若分成四組就不會有這個問題,因為沒用到的記憶體控制器可以去做其他事情),使其顯示記憶體的理論資料傳輸率直接翻了一倍來到了 20 GB/s 之譜,但 ATI 對顯示記憶體的努力卻不僅止於此,第三代的 Hyper-Z 更可以大幅節省記憶體頻寬的利用,使得 Radeon R300 有著非常充裕的記憶體頻寬來發揮其性能。

axe8655

以上四大改進使得 Radeon R300 得以成為歷代 ATI 顯示晶片當中市場生命周期最長的一代,從 2002 年夏天作為新一代旗艦顯示晶片開始,歷經 2003 年的風光與 2004 年的延續,直到 2005 年還能在經過簡化之後作為低階市場的主力產品,甚至在 2006 年 Windows Vista 推出前夕都還能在許多品牌電腦當中見到基於 R300 核心衍伸版本的身影,不過也因為如此,R300 系列是有史以來衍伸版本最多,也是截至 2006 年為止更名最多次的一代。