而第二款採用 GK110 核心的顯示卡則是 2013 年 05 月推出的 GTX 780 (這是 GeForce 700 系列的第一款產品,可能是 NVIDIA 發現 Maxwell 大核心無法如期推出所以決定在 GeForce 700 系列繼續使用 Kepler 架構為主吧,所以隨後 GTX TITAN 也被重新分類放到 GeForce 700 系列了),在 GTX 780 (863 MHz / 6008 MHz) 上所搭載的 GK110 核心是經過進一步刪減的版本,只具備 12 組 SMX (即 2,304 個 CUDA Core) 與 192 組 TMU,GK110 本來應該具備的額外雙精度浮點運算單元也被去除 (因此 GTX 780 的雙精度性能與 GK104 產品一樣是單精度的 1/24),值得注意的是 GTX 780 是歷代以 80 結尾的顯示卡當中唯一一款與 TITAN 系列共用核心的產品,之後基本上都要到 80 Ti 結尾的產品才有機會與 TITAN 共用核心。
而在同年 11 月 NVIDIA 又進一步推出定位比 GTX 780 還要高一階的 GTX 780 Ti (876 MHz / 7000 MHz),最特別的是 GTX 780 Ti 是第一款使用完整版 GK110 核心的產品,包含了完整的 15 組 SMX、2,880 個 CUDA Core (當然浮點運算單元也跟 GTX 780 一樣被省略了),由於時脈設定高於 GTX TITAN,在遊戲方面的性能甚至可以超過 GTX TITAN 讓當時的產品布局變得有些尷尬。
雖然 GTX TITAN 在雙精度方面的表現當時沒有任何 GPU 可以與之匹敵,但是自家價格最高昂的個人電腦顯示產品在性能排行上卻只能排第二總是一件讓人尷尬的事情,因此 NVIDIA 並沒有讓 GTX 780 Ti 稱王太久,在 2014 年 02 月 (也就是 GTX TITAN 上市一年後) 又推出了 GTX TITAN Black 昇級版。
這回 GTX TITAN Black 所搭配的 GK110 真的就是完整版本了,包含 15 組 SMX 而且在雙精度浮點運算單元的部分也沒有刪減,因此在浮點運算方面 GTX TITAN Black 的性能是遠比 GTX 780 與 GTX 780 Ti 要來得優異的,由於時脈設定也一舉提升到 889 MHz / 7000 MHz,因此 GTX TITAN Black 毫無疑問搶回了性能王者的寶座。
實際上單就外觀上要分辨 GTX TITAN 與 GTX TITAN Black 其實並不是一件容易的事情,在外型設計上其實只有 TITAN 字樣的顏色不同而已,除此之外幾乎是採用完全相同的設計,儘管在傳聞階段的時候 GTX TITAN Black 曾經謠傳會以全黑化的外觀設計上市,但最後並沒有付諸實現。
最後要談的則是 Kepler 架構下的最後一款高階顯示卡,同時也是 TITAN 家族迄今為止唯一一款雙晶片產品-GTX TITAN Z,由兩枚完整的 GK110 核心所組成,足足包含了 5,760個 CUDA Core (由 30 組 SMX 所組成),雖然運作時脈比起 GTX TITAN 還要略低一些 (705 MHz / 7000 MHz),但憑藉著雙倍的運算規模使其穩坐 NVIDIA 最強顯示卡位置好一陣子,價格方面也是極其驚人的 2,999 美金,就算是下一世代的 TITAN 也無法與之匹敵。
Table of Contents
Kepler 半代更新
- 推出日期:2014 年 11 月 (GK210 Tesla)
- 所屬系列編成:GeForce 600 系列、GeForce 700 系列
- API 支援:DirectX 11.0、OpenGL 4.5、OpenCL 1.2、Vulkan 1.0
- Shader Model 支援:SM 5.0
實際上 Kepler 架構還真的有半代更新產品推出 (也就是 GK2xx 系列核心),不過整個家族當中最後只有兩款推出 (畢竟第二代 Maxwell 架構的產品當時都已經上市了) 且其中的大核心 GK210 並沒有用於個人電腦顯示卡,而是只在 Tesla 系列當中現身。
Kepler 的半代更新產品變動幅度非常小,因此實際上若想將它們視為同一代也是可以的。
GK210 核心 (僅用於 Tesla)
不過為求完整我還是說明一下 GK210 核心與 GK110 核心之間的主要差異好了,實際上 GK210 只被使用於 Tesla K80 一款產品當中,並且與 TITAN Z 類似,採用了單卡雙晶片的設計。
大致上我們可以將 GK210 視為從 GK110 小幅修改而來的產物,在規格上可見的變化是出現在 Register File Size 的部分由 256 KB 翻倍為 512 KB、L1 快取與共享記憶體的總大小也從 64 KB 翻倍為 128 KB 兩點,之所以這麼修改主要是希望能提升在進行 CUDA 通運運算時的吞吐量 (因此 GK210 的 Compute Capability 等級為 3.7)。
值得注意的是為了功耗與發熱量控制及良率調整 (其實 NVIDIA 為了一款本來就不太可能大量銷售的運算卡特意流片一款新的核心這做法還蠻讓人費解的,畢竟這樣會讓 GK210 的成本很高,而且沒辦法被總量攤提掉) 所以 GK210 的時脈設定相對而言低了很多,並且全面屏蔽了兩組 SMX (因此單個 GK210 核心的 CUDA Core 數量為 2,496 個)。
GK208 核心
最後一款基於 Kepler 架構的核心是 GK208 核心,從代號上我們可以很容易得知這款核心主要是為了擔綱低階入門市場而設計的,實際上 GK208 與前面介紹的 GK107 在布局上完全一模一樣,都是由最高 2 組 SMX (最多具備 384 個 CUDA Core) 與兩組記憶體控制器 (頻寬至多 128-bit) 所組成。
至於 GK208 與 GK107 的具體差別到底在哪裡呢?實際上僅出現在 ROP 與 TMU 的數量配置,在 GK208 上分別被減半為 16 組 TMU 與 8 組 ROP,記憶體控制器也被減半為只剩下一組 (因此頻寬只剩下 64-bit),這樣的縮減使得 NVIDIA 得以進一步壓低 GK208 的核心面積與功耗。
一如往常在低階市場 NVIDIA 的布局一向都非常的混亂,各種核心互相流用、閹割以及換代時改名重出的情況可說是屢見不鮮,因此在這裡我只簡單列出採用 GK208 核心的產品,就不特別一一介紹了。
- GeForce GT 630 (晚期版本) 完整版 GK208 核心 902 MHz / 1800 MHz (DDR3)
- GeForce GT 635 完整版 GK208 核心 967 MHz / 2002 MHz (DDR3) OEM
- GeForce GT 640 (晚期版本) 完整版 GK208 核心 1046 MHz / 50008 MHz (GDDR5)
- GeForce GT 710 (前期版本) 減半版 GK208 核心 823 MHz / 1800 MHz (DDR3)
- GeForce GT 710 (後期版本) 減半版 GK208 核心 954 MHz / 1800 MHz (DDR3)
- GeForce GT 720 減半版 GK208 核心 797 MHz / 1800 MHz (DDR3)
- GeForce GT 720 減半版 GK208 核心 797 MHz / 5000 MHz (GDDR5)
- GeForce GT 730 (前期版本) 完整版 GK208 核心 902 MHz / 1800 MHz (DDR3)
- GeForce GT 730 (後期版本) 完整版 GK208 核心 902 MHz / 5000 MHz (GDDR5)