搶先導入 GDDR5 支援

關於 RV770 還有一項很重要的改變是加入對 GDDR5 記憶體的支援,實際上這不只是噱頭,也是不得不做的改進。我們剛剛提到 RV770 捨棄了環狀記憶體通道設計與超寬的記憶體頻寬設定 (只剩下 256-bit 了),因此 RV770 在與 RV670 使用相同類型記憶體的狀況下會發生很嚴重的悲劇-記憶體頻寬大幅衰退導致晶片性能無法發輝。

axc8071

其實這樣的改變並不難理解,當年 R500 靠著環狀記憶體通道與 Ring Stop 大幅提升了理論記憶體頻寬,在 RV770 當中拿掉了這項設計並改回傳統的 Crossbar 設計自然就被打回原形了,但是這對 RV770 來說是一項很大的問題,當時只有還不成熟的 GDDR5 記憶體得以解決這樣的難題, 因此 AMD 下了一次豪賭,幸好在 GDDR4 悲劇之後,功耗更低、時脈與密度卻更高的 GDDR5 最後獲得了巨大的成功。

svc8746

RV770 核心

由於 R700 系列核心當中並沒有設計大核心 (R700),因此 R700 架構中最為完整的核心就是 RV770 了,包含了 9.6 億個電晶體,與 R600 的 7.2 億來說僅有小幅的成長 (主要的增長來自於大幅增加的 SPU 與 SIMD Array 及材質單元,但在記憶體介面的部分使用的電晶體有大幅度的減少),但由於製程從 80 奈米提高為 55 奈米,因此 RV770 的晶片面積與成本相較於 R600 來說都有了明顯的下降。

sxe8065

RV770 主要面向的是中高階市場,也就是大名鼎鼎的 Radeon HD 4800 系列 (這代當時在追求性價比的玩家市場維持了好一陣子的熱門地位),可分為較高規格的 HD 4870 (這數字相信對買過 AMD 顯示卡的人來說都不陌生)、HD 4850、HD 4830、HD 4810 四款,其中 HD 4870 的運作時脈為 750/900 MHz (搭配 GDDR5 記憶體),HD 4850 則稍降為 625/993 MHz (搭配 GDDR3 或 GDDR4 記憶體),這兩款都具備完整的 800 個 SPU。

scd5011

至於較低價的 HD 4830 與 HD 4810 則是在隔年才追加的型號,前者的 SPU 數量下降為 640 個 (少了兩排),連帶使得材質單元也跟著少了兩組,運作時脈設定在 575/900 MHz,可支援 GDDR3 或 GDDR4 記憶體;後者則是進一步將渲染輸出單元 (ROP) 與記憶體頻寬的部分砍半,時脈設定則略高一些 (625/900 MHz),可以支援 GDDR5 記憶體。

gcs8071

值得注意的是在隔年 AMD 推出了一款稱為 HD 4730 的中階產品,使用的也是這款 RV770 核心,規格上與 HD 4810 很類似,時脈設定為 700-750 / 900 MHz。

scm6585

就結果論而言 AMD 在 Radeon HD 4800 系列這一世代獲得了極大的成功,發表當下就迫使 NVIDIA 瞬間大幅下調 GeForce GTX 200 系列產品的售價 (當時 HD 4870 上市的售價為 299 美元,NVIDIA 的 GTX 260 硬是貴上 100 美元,但在性能上卻沒多少優勢可言)。

高階市場的空缺-延續單卡雙晶片策略

因為 R700 這一世代放棄了追逐 NVIDIA 大核心的策略,因此 R700 架構下並沒有真正大規模的核心出現,最強的核心就是 RV770 了,但 AMD 也不可能就這樣完全放棄頂級玩家市場,因此與 RV600 系相仿,AMD 推出了基於兩顆 RV770 核心的雙晶片顯示卡-HD 4870 X2 與 HD 4850 X2。

scs6052

從 PCB 的規畫可以看到其實 HD 4870 X2 與 HD 4850 X2 的組成模式跟上一世代的 HD 3870 X2、HD 3850 X2 很類似,同樣都是使用單卡雙晶片,並且由中央的 PLX 橋接晶片負責串起這兩顆 GPU,而在規格的部分則是完全照搬原本 HD 4870 與 HD 4850 的設定,沒有像上一代出現雙晶片版本反而比單晶片版本高的情況。

sxe8017

從 HD 4870 X2 與 HD 4850 X2 上我們可以很容易觀察到傳統大核心策略與 AMD 的雙晶片策略有甚麼樣的優缺點與得失,舉例來說採用雙晶片的優點有下面這些:

  • 小核心相對於大核心而言可以大幅降低開發的困難度 (NVIDIA 也說過造大核心很難)
  • 相對於大核心來說小核心的良率提高容易很多
  • 開發難度下降意味著準時上市的機率提高 (AMD 應該受夠延期了)
  • 良率提高意味著生產成本的降低 (兩顆 RV770 的生產成本很可能還不及一顆 GT200)

但是這樣做法的缺點其實也很明顯 (這可能是 NVIDIA 繼續堅守大核心戰略的考量):

  • CrossFire 與 SLI 等多顯示卡技術都未必能夠在所有遊戲發揮作用了,甚至在某些時候性能比單卡還差,儘管對於單卡雙晶片來說距離較短因此延遲的狀況好很多,但要讓兩顆 GPU 能後相輔相成仍然是很大的挑戰,未必會比設計大核心簡單。
  • 單卡雙晶片意味著龐大的供電需求,供電模組方面的成本也會因此提高。
  • 單卡雙晶片電路設計複雜,可靠度也可能會是個問題。