Hyper-Q 與動態平行化技術

除了前面提及的這些之外,GK110 核心還引入這兩個新特性,其中 Hyper-Q 主要是考慮到伺服器的 CPU 核心數越來越多,因此勢必得讓 GPU 能同時接受多個 CPU 下令以提高執行效率 (否則在等待處理器核心下令的空窗就會讓 GPU 閒著沒事做) 而做的改進,透過 Hyper-Q 能夠讓 GK110 至多同時受理來自 32 個處理器核心的命令。

至於動態平行化技術的主要目的則是讓 GPU 不必再像以前那樣只能被動聽令於處理器下達的平行指令進行作業,而是可以自行動態產生後續的運算核心資源與執行緒分配,以求盡可能省下花在 GPU 與 CPU 不斷來回溝通之間所耗掉的時間。

不過這兩個技術基本上只在 Tesla 運算卡上才能比較明顯見得到其優勢,對於本系列文章主要要談的顯示卡而言其實沒有太多意義,因此在此就不多贅述了。

GK110 核心

談完 GK110 在架構上的一些調整之後接下來讓我們回到 GK110 本身,下面這張圖就是 GK110 的配置圖,相對於 GK104 而言可說是十分的壯觀。

相較於 GK104 最多只由 4 個 GPC、8 組 SMX 組成來說,GK110 的規模足足增加了將近一倍,完整版 GK110 核心包含了高達 5 組 GPC、15 組 SMX,記憶體控制器也從四組增加為六組,因此其中所包含的 CUDA Core 數量可以高達 2,880 個,而暴漲的 CUDA Core 數量與大幅提高的雙精度浮點運算單元數量當然也意味著面積和電晶體數量的大幅提升,實際上 GK110 包含高達 71 億個電晶體,這足足是 GK104 的兩倍之多。

大致上 GK110 的介紹就到這邊,接下來就是產品的部分,其實當年在基於 GK110 的 Tesla 上市之後大家就一直猜測之後肯定會有基於 GK110 核心的 GeForce 顯示卡推出,而在幾個月之後,NVIDIA 終於在 2013 年 02 月給了大家解答,也就是擔綱當今 GeForce 頂級產品地位的 TITAN 家族的第一位成員-GTX TITAN。

之所以會特意取名為 GTX TITAN (837 MHz / 6008 MHz),其實由來並不難理解,因為對於 GK104 而言其實 GK110 應該算是同一世代的產品 (照慣例 Kepler 的半代更新應該叫做 GK2xx,而且 GK110 拖太久導致與下一代 Maxwell 架構之間的時程距離太近),畢竟 GK104 與 GK110 根本就是同一時間進行開發的 (甚至以 Fermi 的慣例來說 GK110 在還叫做 GK100 的時候很有可能其實根本就比 GK104 還早進行開發),所以 GTX TITAN 本來應該被劃分在 GeForce 600 系列當中,作為 GTX 690 推出才是 (BTW,第一張訂價破千美金的 NVIDIA 顯示卡不是 GTX TITAN,其實是 GTX 690)。

不過可能是後來發展不順利所以導致 GK110 沒能在 GK104 之前推出,甚至還要晚上將近一年才達到上市水準,因此後來 GeForce 600 系列的頂級產品就由兩顆 GK104 核心組成 GeForce GTX 690 擔綱了,而 GTX TITAN 本身的性能又比 GTX 690 高出太多,因此也就有為其取一個新名字的必要 (畢竟叫 GTX 695 無法彰顯 TITAN 比 690 強那麼多這點),而當時正好全世界最快的超級電腦就是基於 Tesla K20X 的 TITAN,這就是 GTX TITAN 命名的由來了 (畢竟在 GTX TITAN 上市的時候 GeForce 700 系列還沒推出,所以 GTX TITAN 一開始是被劃分在 GeForce 600 系列裡面的)。

在規格方面 GTX TITAN 本身採用的並不是完整版 GK110 核心,與 Tesla K20X 一樣是經過屏蔽一組 SMX 的版本,因此 CUDA Core 數量為 2,688 個,建議售價與 GTX 690 一樣都是 1,000 美元。