在上篇談了第一代與第二代 GCN 架構與相關的產品之後,接下來在本篇當中我打算接著把第三代與第四代 GCN 架構的各項改進一併寫完,如同先前曾經提過的,AMD 在 Graphics Core Next 架構發展完畢之後接下來直到現今最新的 Vega 架構 (即第五代 GCN 架構,但由於本篇連載規劃的時候 Vega 還沒有誕生,因此目前預計只會先撰寫前四個世代的介紹) 都是從第一代 GCN 架構衍伸與優化而來,因此在主體結構的部分大致上都是相同的。

第三代 GCN (Volcanic Islands 火山島)

  • 推出日期:2014 年 09 月
  • 所屬系列編成:RX 200 系列、RX 300 系列、RX 400 系列、RX 500 系列
  • API 支援:DirectX 12.0、OpenGL 4.5、OpenCL、Vulkan
  • Shader Model 支援:SM 6.0

在第二代 GCN 架構推出將近一年半之後,AMD 發佈了 GCN 架構的第二次改版,即當時被媒體稱為 GCN 1.2 架構的 Volcanic Islands (後來被 AMD 追認為第三代 GCN 架構),與第二代 GCN 架構的情況相似,基本上第三代 GCN 架構並沒有帶來甚麼根本上的變革。

將第二代 GCN 架構的改進引入高階市場

前面提過第二代 GCN 架構在第一代 GCN 架構的基礎上加入針對前端元件的配置使指令吞吐量提高、CrossFire 改走 XDMA、架構規劃中新增 Shader Engine 階層、強化版 PowerTune 動態超頻技術等改進,然而在第二代 GCN 架構當中僅有推出針對頂級旗艦市場的 Hawaii 與針對主流市場的 Bonaire 兩款,而原先第一代 GCN 架構當中擔綱高階市場的 Tahiti 則未有後繼,導致某些特性在高階的 R9 280、R9 280X 上未被支援,卻出現在較為低階的 R9 260 上的尷尬情況,因此在第三代 GCN 架構推出時,第一件做到的事情就是將這些特性引入到高階市場。

不過除了將 Hawaii 當中引入的四組 Geometry Processor 與 Rasterizer 規劃引入到 Tahiti 的後繼者之外,實際上 AMD 在第三代 GCN 架構中也有進行一些優化 (例如改進頂點重複使用效率與工作分派效率等) 以更進一步的提升在處理幾何圖形與曲面細分時的性能,因此在曲面細分方面的性能有時第三代 GCN 高階產品是可以贏過定位於頂級市場的 Hawaii 的。

色彩差異壓縮技術

在第三代 GCN 架構當中 AMD 還針對渲染輸出單元的部分進行了一些改進,透過引入新的色彩差異壓縮技術使得 Volcanic Islands 在處理畫面時所需要的記憶體頻寬得以大幅降低 (在第三代 GCN 架構中記憶體控制器的數量有所減少,但根據 AMD 的說法實際上在性能上是成長的),根據 AMD 官方的說法,此項色彩壓縮技術可以提高將近 40% 的記憶體頻寬利用效率。

影像解碼、編碼能力強化

在第三代 GCN 架構當中 AMD 還引入了新的影像解碼、編碼單元 (AMD 在此之前實際上已經很久沒有碰過 Unified Video Decoder 這塊了),在此次更新之後 AMD 才終於追上 Intel 與 NVIDIA 的腳步,得以提供針對 4K H.264 FPS60 影片的硬體解碼支援,總算補上了 AMD GPU 無法完整支援 4K 硬體解碼的缺憾。

指令集架構小幅更新

此外,與第二代 GCN 架構的情況相似,第三代 GCN 架構也在指令集架構中有所改進,主要是加入了半精度浮點運算與 16 位元整數運算相關的指令以強化在較低密度的 GPU 運算與影像處理時的省電效果 (不過實際上在個人電腦中使用到這類運算的機會並不多,一般來說遊戲所需的運算都以單精度浮點、32 位元整數為主,至於半精度與 16 位元整數運算則多見於行動裝置、SoC 設備上),並且增加了一些用於在 SIMD 通道之間分享資料用的資料平行處理指令。

Tonga 核心

與第二代 GCN 架構的情況相同,採用第三代 GCN 架構的核心也只有兩款,分別是面向高階市場準備接替 Tahiti 的 Tonga 與變得更大、更強、更複雜,主要是為了接替 Hawaii 的 Fiji,如同前面所提過的,基本上基於第三代 GCN 架構的 Tonga 核心就像是把 Hawaii 縮減到 Tahiti 的規模再加上一點優化之後得到的結果。

這點從 Tonga 的架構圖上應該也可以很容易看出來,乍看之下其實就只是 Shader Engine 變得比較短、記憶體控制器少了很多組的 Hawaii (這就是 AMD 為什麼要在第三代 GCN 架構當中加入新的色彩壓縮技術的原因)。

至於在產品的部分,基於 Tonga 核心的產品其實很少,而且僅見於 RX 200 系列與 RX 300 系列之中,最初出現在 2014 年 09 月發佈的 R9 285 (定位上接替 R9 280,性能與 R9 280X 依據項目互有優劣,採用 Tonga Pro 核心,包含 28 組 CU、1,792 個 SP、提供 256-bit GDDR5 記憶體支援,時脈為 918 MHz)。

隨後 AMD 又在次年將 R9 285 改名為 R9 380 推出,而完整版的 Tonga XT 核心則是要等到次年 11 月 AMD 才推出 R9 380X (採用 Tonga XT 核心,包含 32 組 CU、2,048 個 SP、提供 256-bit GDDR5 記憶體支援,時脈為 970 MHz) 才出現,而且僅此一款。