以第一代 GCN 架構產品來說,每組 CU 當中至多包含了四組 SIMD Array 向量運算單元 (每組 SIMD Array 中有 16 個 ALU,因此每組 CU 包含了 64 個 ALU)、四組純量運算單元、排程器、分支單元、快取、材質單元、共用資料暫存區 (64 KB) 向量暫存器 (4 組,各 64 KB) 與純量暫存器 (8 KB)。
Table of Contents
記憶體階層架構調整 (全域資料共享 GDU)
與 NVIDIA 的 Fermi 架構相似,AMD 在設計 Graphics Core Next 架構的時候為了因應通用運算需求的提升因此針對記憶體階層架構進行了一系列的調整,可以說是 AMD 歷來對其 GPU 記憶體階層架構進行最大變革的一次 (實際上很大程度也是為了 AMD 當時的 FUSION 戰略-即後來的 APU 而如此為之)。
除了在 CU 當中配有 8 KB 的純量暫存器、64 KB 的本地資料共享記憶體、16 KB 的 L1 可讀寫快取 (以往 Terascale 當中對 L1 快取只能進行讀取而不能寫入) 之外,每組 SIMD Vector 都提供了 64 KB 的向量暫存器。
至於 L2 快取的部分則是與記憶體控制器成對配置,每組記憶體控制器都對應了 64 位元頻寬的匯流排與 64 KB 或 128 KB 的 L2 快取記憶體,而全部的 L2 快取記憶體 (均為 write-back) 為共享關聯因此所有 CU 都能夠在 L2 快取當中取得相同的資料,可以有效降低 CU 與顯示記憶體索取資料的過程中所需付出的時間代價。
然而在 GCN 架構的記憶體階層體系當中最大的特性或許是透過 IOMMU 虛擬化技術得以將顯示記憶體轉化為 x86 架構虛擬記憶體,讓處理器得以與 GPU 更快速的交換資料,有效提供在通用運算方面的資訊吞吐量。
通用運算功能加強
除此之外 GCN 架構當中還針對通用運算用途加入了一系列改進,例如從以往僅能提供錯誤偵測的 EDC 支援提升到提供對 ECC 錯誤更正的完整支援 (顯示記憶體與各階快取均支援 ECC)、納入雙精度福點運算運算的支援能力等。
第一代 GCN (Southern Islands 南方群島)
- 推出日期:2012 年 01 月
- 所屬系列編成:Radeon HD 7000 系列、HD 8000 系列、RX 200 系列、RX 300 系列、RX 400 系列、RX 500 系列
- API 支援:DirectX 11.1、OpenGL 4.5、OpenCL、Mantle
- Shader Model 支援:SM 5.0
第一款支援 DirectX 11.1 的 GPU
在 Southern Islands 這一世代,AMD 再次超前 NVIDIA 推出了世界上第一款支援 Direct3D 11.1 的 GPU (NVIDIA 直到 Kepler 推出才提供 Direct3D 11.1 的支援,而且被 AMD 踢爆 Kepler 並無法完整支援 Direct3D 11.1 的所有特色),然而 AMD 這次並沒有再次如同 DirectX 11 當時般取得太大的優勢,主要的原因有三:
- DirectX 11.1 相較於 DirectX 11 而言改進有限
相較於 DirectX 11 來說 DirectX 11.1 只引入了十多項非常細微的改進,除了納入原生的 3D 立體影像 API (以往絕大多數廠商會用其他方式實作)、延遲渲染貼圖 (TBDR,主要用於行動裝置與低功率裝置)、目標獨立光柵化 (TIR,是 DirectX 11.1 唯一需要硬體支援的功能)、納入對雙精度浮點運算的完整支援之外並沒有太多顯著的特色。 - 搭配 DirectX 11.1 的 Windows 8 並不成功
眾所皆知當年 Windows 8 並不是一款成功的作業系統,因此軟體層面上支援 DirectX 11.1 的電腦數量根本不多。 - 基於 DirectX 11.1 的遊戲甚少
考慮到 NVIDIA 的 GPU 並不支援 DirectX 11.1,搭配 DirectX 11.1 的 Windows 8 也不成功,能夠享受 DirectX 11.1 改進的用戶相當有限的情況下,許多遊戲廠商根本也不願意在遊戲當中導入 DirectX 11.1 提供的新技術。
第一款支援 PCI Express 3.0 的 GPU
同時 Southern Islands 系列也是世界上第一款支援 PCI Express 3.0 介面的 GPU,相較於 PCI Express 2.0 來說 PCI Express 3.0 的頻寬由 5 GT/s 提升為 8 GT/s,由於 Southern Islands 推出的時間點正好與 Intel 發佈支援 PCI Express 3.0 的 Sandy Bridge-E 平台之時間相近,因此在市場上成為唯一支援 PCI Express 3.0 的選擇。
在當時由於遊戲用途的頻寬需求並不吃緊,基本上 PCI Express 2.0 介面提供的傳輸速率就已經足敷使用,加上初期只在 HEDT 高階平台上出現,因此 PCI Express 3.0 在個人市場的推動速度並不快,但在通用運算領域由於 GPU 會經常需要與 CPU 交換資料,因此 PCI Express 3.0 所帶來的額外頻寬就能發揮效用了。
第一款採用 28 奈米製造工藝的 GPU
同時 Southern Islands 也是世界上第一款使用台積電 28 奈米製造工藝的 GPU (NVIDIA Kepler 也採用了相同的製程),台積電在進入 28 奈米製程時代時首次使用了 High-K Metal Gate 技術與 Gate-Last 技術 (Intel 則是在 45 奈米製造工藝上引入這兩項特性),比起上次轉入 40 奈米製程的時候遭遇了許多額外的困難。
不過幸運的是 AMD 在這一世代中並沒有遭遇類似 HD 4770 時遇到的悲慘情況,反而製程改進所帶來的益處在 Southern Islands 此一世代上相當明顯的展現,即便電晶體數量大幅飆升也沒有影響此代 GPU 的時脈設定,甚至反而還獲得了優異的超頻能力、5% 上下的面積縮減與 5% 左右的預設時脈提升。
第一款支援 Mantle API 的 GPU
Mantle 是由 AMD 與 DICE 合作提出的一款 3D 圖形 API,主要是作為 DirectX 與 OpenGL 的補充並且針對 GCN 架構特別優化因而可以更充分發揮 GCN 架構 GPU 的性能,當初原先希望透過 AMD 掌握各家遊戲機繪圖晶片供應商地位的優勢來推動,但最終 AMD 在 2015 年宣佈放棄 Mantle API 並建議開發者轉用 Vulkan、DirectX 12 等 API。
部分儲存材質 Partially Resident Textures (PRT)
在第一代 GCN 架構當中還引入了一項稱為 Partially Resident Textures (PRT) 的超大材質處理技術,這項技術的概念源自於 id software 所發展的 Megatexture 技術 (Megatexture 是以 OpenGL 3.2 API 軟體實作,而 PRT 則是硬體實作),主要是允許 GPU 可以只將大型的材質貼圖分割為數個部分 (tiles),在應用程式不會需要所有材質貼圖時,只把會使用到或相關聯的材質貼圖載入到記憶體中,其餘部分則是略過或只載入較低解析度的版本 (NVIDIA 也有類似技術,稱為 UltraShadow)。
除此之外 Southern Islands 所包含的 PRT 技術還運用了先前曾經提到 GCN 架構可以運用 x86 虛擬記憶體功能將顯示記憶體對應到系統的記憶體分頁當中,因此在處理大型材質貼圖的時候可以不必經過相對而言慢上許多的系統記憶體,而是可以直接對應到較快的顯示記憶體上。
HDMI 1.4a 支援
而在輸出部分 Southern Islands 系列則加入了對 HDMI 1.4a 標準的支援,因此得以支援 4K 顯示輸出與高達 120 Hz 的 3D 顯示器輸出功能。
PowerTune 動態超頻技術
在 Southern Islands 當中 AMD 與前代產品同樣引入了 PowerTune 的動態超頻技術,透過即時監控 GPU 耗電與 TDP 進行動態電壓、時脈調控來允許 GPU 在需要強大性能的時候暫時以高於預設時脈的速度運作。