電腦達人養成計畫 5-16:後 DirectX 9.0c 時代的各種轉折

接下來時序來到了 2005 年,在這一年裡面科技業界討論最熱烈的議題大概就是 Windows Longhorn (也就是 Windows Vista) 是否真的能夠順利在 2006 年上市吧?

畢竟照一開始的構想,其實 Vista 本來應該在 2004 年作為 Windows XP 的小幅改版上市 (實質上比較像是後來 Windows 7 這樣以前代系統為基礎小幅修改而來的產品),不過在開發過程中微軟希望加入 Windows Vista 的功能與特性越來越多、越來越複雜,最終進而導致了 2004 年的工程災難與整個計畫被迫得重頭開始的結局。

2005:DirectX 9.0 時代的尾聲

由於 Windows Vista 依舊在難產中,而微軟也早就不打算再給 Windows XP 添加任何功能,因此 2005 年在個人電腦 3D 圖形界其實沒有甚麼大的改變,不過儘管如此,兩家主流 GPU 廠商仍依舊維持了一年一改版的傳統,在這過渡的一年當中各自推出了新一代的產品。

NVIDIA GeForce 7 Series (G70/G71/G72/G73)

發佈時間:2005 年 06 月
API 支援:Direct3D 9.0c、OpenGL 2.1
Shader Model 版本:Vertex Shader 3.0, Pixel Shader 3.0
像素渲染器 (PS):24 組/頂點渲染器 (VS):8 組/材質對應單元 (TMUs):24 組/著色輸出單元 (ROUs):16 組 (G70/G71)
像素渲染器 (PS):12 組/頂點渲染器 (VS):5 組/材質對應單元 (TMUs):12 組/著色輸出單元 (ROUs):8 組 (G73)
像素渲染器 (PS):4 組/頂點渲染器 (VS):3 組/材質對應單元 (TMUs):4 組/著色輸出單元 (ROUs):2 組 (G72)

seg9850

2005 年對 NVIDIA 來說應該是還不錯的一年吧?在去年靠著 GeForce 6 系列收復了一些失土之後,GeForce 7 的推出更是將 ATI 先前一度超車的市場佔有率給逐步收了回來 (雖然主要是 ATI 吃老本吃過頭,真正的同世代產品又一直難產導致的結果)。

由於 DirectX 9.0c 之後的 API 標準遲遲沒能問世,因此在 GeForce 7 這代 NVIDIA 使用了類似 ATI Radeon R400 系的策略,也就是將原有架構延伸、加寬加廣後當成新產品賣,因此在架構上與前作其實沒有太大差異,從上面的架構圖當中第一眼可以看到的就是頂點渲染器再次增加,從前作的六組提高到了八組,除此之外據 NVIDIA 的說法還有加入一些新的優化,像是現在 Vertex Shader 內的浮點運算單元可以在單一周期內跑完 MULTIPLY-ADD 乘加融合運算與多邊形生成的速度加快之類的。

而在 Pixel Shader 的部分也可以很明顯注意到數量有了明顯的增長 (多達 24 組),不過在配置組成上與前作是採取一樣的方式,也就是由四條像素管線組成一組的安排 (雖然在 6 系列時 NVIDIA 官方給的圖並沒有特別畫出這一點),至於 Pixel Shader 本身則同樣也是以前作為基礎優化而來,在處理 MADD 運算的速度提高了一倍 (NVIDIA 官方說他們研究了一堆遊戲發現 MADD 運算很常被用到)。

回到產品本身,GeForce 7 系列的第一款產品代號為 G70 (本來叫 NV47,不過好像是怕被別人嫌改進太少所以乾脆換個名字),由於使用了與前作相同的 110 奈米製程 (從 NV3x 開始,NVIDIA 經過 一次重創之後從此不太敢在新世代產品立刻導入新製程技術),因此晶片的體積非常大 (比當時的 CPU 還要大上不少)。

G70 在上市時被命名為 GeForce 7800 系列,系列當中根據運作時脈高低與閹割掉的像素管線數量而有 GS、GT 與 GTX 三種型號 (這是 NVIDIA 第一次使用 GTX 這名詞)。

系列當中最高階的型號 7800 GTX (上圖) 包含了完整的 24 條像素管線、8 組頂點渲染器與 16 組 ROP,運作時脈設定也最高 (430/1200 MHz),後來還追加了昇級版 7800 GTX (512) 進一步將時脈拉高到 550/1700 MHz,並換上了更強大的散熱風扇 (下圖),

除了最高階的 GTX 之外,系列編成當中還有另外兩款比較平價的型號,分別是屏蔽掉 4 組像素管線與 1 組頂點渲染器的 7800 GT (400/1000 MHz) 與屏蔽了 8 組像素管線與 8 組 ROPs 但仍保有 8 組頂點渲染器的 7800 GS (375/1200 MHz),前者僅有 PCI Express 版本,後者則只有 AGP 版本 (其實仍然是原生 PCI-E + AGP 橋接晶片的結果,只出 AGP 版本是 NVIDIA 的商業考量),此外,G70 核心可以支援一個 Dual-Link DVI 埠。

在 G70 上市幾個月後 NVIDIA 決定開始將 GeForce 7 系列產品往中低階市場延伸,而要作到這件事情的前提自然是得先壓低成本,以半導體產業來說壓低成本最直接的方式就是透過升級製程把晶片作得更小,以讓同樣大小的晶圓能夠切割出更多塊晶片來提高生產效率,因此 NVIDIA 勢必得將 7 系列的產品漸漸移轉到新的 90 奈米製程上,而在過去幾次經驗裡 NVIDIA 學到的教訓是,別直接把完整的大核心弄到新製程上,否則良率拉不起來會沒貨可賣,因此這次 NVIDIA 是從最低階的產品開始測試 90 奈米製程的,也就是後來非常長青且活躍於 OEM 市場好多年的 G72 核心。

G72 核心的組成很簡單,像素管線只剩 4 條,頂點渲染器也只剩 3 組,ROU 更是少到不能再少只有 2 組,記憶體頻寬也閹到只剩下 1/4 (64-bit),並且只能支援 DDR2 記憶體且不提供 Dual-Link DVI 支援,完全就是最低階入門的規格,因此很適合用來當作測試新製程的產品,第一款基於 G72 核心的產品是 7300 GS (550/800 MHz),在上市兩個月後又追加了時脈較低的 7300 LE (7300 GS 降頻版,350/666 MHz) 與又閹割掉一半像素管線,並只留下 2 組頂點渲染器的 7300 SE (350/666 MHz),由於製程提升與架構簡化導致 G72 核心的面積很小,發熱量也不高,因此有很多 7300 系列顯示卡是製作成半高卡的形式,又加上價格低廉 (即便性能不佳),因此被大量使用於小型品牌電腦中,直到 2008 年都還能看到。


在 G72 證實新製程的狀況 OK 之後,NVIDIA 便著手將 7 系列產品線往中階推並將高階的 G70 核心也升級到 90 奈米新製程以降低成本與發熱量,其中在中階市場帶來的新核心就是 G73,這款核心最多可以有 12 條像素管線、5 組頂點渲染器與 8 組 ROP,並且可以搭配 DDR2 或 GDDR3 記憶體,並且可以支援單埠的 Dual-Link DVI 介面,而 G73 實際上就是後來的 7600 系列。

7600 系列的成員有 7600 GT (560/1400 MHz + GDDR3)、7600 GS (400/800 MHz + DDR2) 兩款,不過值得注意的是,後來 7300 系列又多出了個新成員-7300 GT,雖然屬於 7300 系列但實際上是由 G73 閹割而來的,具備了 8 組像素管線與 5 組頂點渲染器,ROP 的數量也還有 4 組,幾乎是同系列次高產品 7300 GS 的兩倍,因此雖然都叫 7300,但實際上這兩款等級是差很多的。

除了前面提過的這堆之外,G72 與 G73 還有三款比較特別的衍伸產品 (這是好聽的說法,其實是出來搗亂讓大家看不懂 NVIDIA 型號規劃以從中獲利用的),其中第一款是 GeForce 7500 LE,乍聽之下好像比 7300 GT 還要強,但實際上這款產品是由 G72 衍伸出來的,加上超低的時脈 (263/550 MHz) 使其實際上性能根本比 7300 LE 還要不如,只比 7300 SE 要好一點,不過 OEM 廠商可是樂於使用這個型號來讓人誤以為是電玩高性能機種。

同樣的情形也發生在 G73 上,這次的型號則是叫做 GeForce 7650 GS,乍聽之下似乎又比 GeForce 7600 GT 要好那麼一點,但實際上他的位置應該是在 7600 GT 與 7600 GS 之間才對,於是 OEM 廠商也就順理成章樂於讓人們誤以為這電腦搭配的顯示卡比 7600 GT 還「高級」了。

除此之外 G73 還曾經推出基於 80 奈米製程製作的版本 (G73-B1),僅用於 7300 GT 一款,規格參數與一般的 7300 GT 完全相同,可以理解為 NVIDIA 拿舊產品測試新製程的舉動。

看過中低階產品之後,讓我們回到高階產品線吧,在 2006 年 NVIDIA 也同樣把 G70 升級到 90 奈米製程了,也就是 G71 核心 (除了製程提升之外還順便把 Dual-Link DVI 埠的數量增加到兩組了,G71 實際上就是後來的 7900 系列)。

7900 系列有 7900 GTX、7900 GT 與後來追加的 7900 GTO 及 7900 GS 四個型號,除了 7900 GS 之外全部都是完整大核心 (也就是包含 24 條像素管線與 8 組頂點渲染器的產品),主要僅有時脈上的不同 (依序為 650/1600 MHz、450/1320 MHz、650/1320 MHz),至於 7900 GS 則是閹割了 4 條像素管線與 1 組頂點渲染器的版本 (450/1320 MHz)。

不過真正有意思的其實是 GeForce 7 系列的真。旗艦型號-7900 GX2 (上圖) 與 7950 GX2,這兩款顯示卡是 NVIDIA 有史以來第一次在單一顯示卡上放置兩個 GPU 晶片 (不過跟 Voodoo 的單 PCB 多晶片不同,NVIDIA 是採用兩張 PCB 疊在一起,類似三明治的作法),除此之外 7900 GX2 這張卡還囊括了 NVIDIA 公司發展史上許多的第一次,像是第一次記憶體頻寬高達 512-bit (因為是完整的兩顆 G71,各自享有自己的記憶體) 與第一次作出這麼「長」的顯示卡 (一般機殼放不下,跟 E-ATX 伺服器主機版差不多長) 等。

要特別提的是,基本上 7950 GX2 (上圖) 與 7900 GX2 的性能並沒有差異,主要是在 PCB Layout 與供電模組的部分進行改良讓顯示卡可以變短一些而已 (兩者的比較如下)

最特別的是這款單卡雙心顯示卡仍然留有 SLI 介面,因此最多可以用上兩張 GX2 來組成 Quad SLI (只需要占用兩個 PCI Express x16 插槽)!

除了前面提到的這些之外,G71 還有另一款衍生型,由於 7950 GX2 的設計很特別因此引起了不少討論,於是 NVIDIA 就趁勢推出了一款稱為 7950 GT 的顯示卡給 OEM 廠商用 (是的,又是一款出來亂的產品),雖然乍看之下 7950 GT 好像比 7900 GTX 還要強,但實際上時脈僅有 550/1400 MHz 的 7950 GT 其實是小輸 7900 GTX 的 (畢竟幾乎是一樣的東西,只有時脈有小差距,因此性能若了大概 2-4% 左右)。

最後一項要提到的 GeForce 7 系列產品則是系列當中最低階的型號-GeForce 7100 GS 實際上並不屬於 7 系列的新架構,而是沿用上一代的 NV44 核心改名而來 (也就是 GeForce 6200 系列使用的核心),因此並不具備任何 GeForce 7 系列新引入的特性。

ATI Radeon R500 (X1000 系列)

發佈時間:2005 年 10 月
API 支援:Direct3D 9.0c、OpenGL 2.0
Shader Model 版本:Vertex Shader 3.0, Pixel Shader 3.0
像素渲染器 (PS):48 組/頂點渲染器 (VS):8 組/材質對應單元 (TMUs):16 組/著色輸出單元 (ROUs):16 組 (R580+/R580)
像素渲染器 (PS):16 組/頂點渲染器 (VS):8 組/材質對應單元 (TMUs):16 組/著色輸出單元 (ROUs):16 組 (R520)
像素渲染器 (PS):36 組/頂點渲染器 (VS):8 組/材質對應單元 (TMUs):12 組/著色輸出單元 (ROUs):12 組 (RV570)
像素渲染器 (PS):24 組/頂點渲染器 (VS):8 組/材質對應單元 (TMUs):8 組/著色輸出單元 (ROUs):8 組 (RV560)
像素渲染器 (PS):12 組/頂點渲染器 (VS):5 組/材質對應單元 (TMUs):4 組/著色輸出單元 (ROUs):4 組 (RV535/RV530)
像素渲染器 (PS):4 組/頂點渲染器 (VS):2 組/材質對應單元 (TMUs):4 組/著色輸出單元 (ROUs):4 組 (RV515/RV516)

在吃老本的 Radeon R400 被 GeForce 6 系列追上之後,ATI 明顯感受到了來自 NVIDIA 的壓力,推出與 NVIDIA 同世代、能夠支援 DirectX 9.0c API 與 Shader Model 5.0 的產品自然而然地成為了 ATI 當下最亟需做到的事情。

其實曾經有過這麼一個說法,Radeon R400 系列其實本來只是 Radeon R300 系列的衍生型,本來 R420 應該只是作為 R380 推出,也就是後來 DirectX 9.0c 產品上市之前墊檔用的權宜之計,真正要作為 R400 推出的是與 GeForce 6 系列同級的產品,不過 ATI 在開發這一世代產品時屢次踢到了鐵板,各種難以解決的問題導致產品不斷延期,又加上 ATI 此時耗費了不少時間在設計用於 Xbox 360 的 Xenos 晶片上,最後本來只作為墊檔產品的 R380 被迫改名為 R420 作為 ATI 在 2004 年的主力產品,同時也種下了後來讓 ATI 再次被 NVIDIA 追過的遠因。

在度過了毫無成長甚至微微走下坡的一年之後,2005 年顯然是決定 ATI 接下來能否再次翻身重現 2003 年 Radeon R300 奇蹟的時刻,不過這次顯然命運之神並沒有眷顧 ATI,甚至實際上還用力賞了 ATI 一巴掌,回首 2005 年,當時 ATI 與 NVIDIA 的時間軸是這樣子運作的:

是的,當年 ATI Radeon R500 從首次宣布上市時間到最後真正上市之間一共差了整整半年,更比對手足足慢了三個月之多,要知道在那個時代個人電腦有很多零件基本上一年就是一個世代了 (特別是顯示卡真的就是一年一改版),這使得本來就已經落後一世代的 ATI 所面臨的情況變得更加雪上加霜許多,後來這也成為 ATI 在 2006 年被 AMD 收購的主因之一,至於為什麼會延期這麼久呢?當年傳出的說法主要有二,分別是台積電的 90 奈米製程不夠成熟導致良率拉不起來與 ATI 的工程師在設計完成送給台積電準備量產之後才發現晶片設計中有一些問題導致只能使用很低的電壓與時脈穩定運作,而解決這問題花了 ATI 將近三個月的時間。

不過如同 GeForce 6 之於 NVIDIA 一般,ATI Radeon R500 基本上也是以作為自家反攻主力武器為目標設計出來的產物,因此在架構上也與前作有著許多相當巨大的改變 (應該說遲來的改變…),其實從架構圖上就可以看出 R500 與 R400、R300 有很大的差異了,不過在開始介紹 R500 之前,讓我們來複習一下 Radeon R400 的架構設計吧。

接下來這張圖就是 Radeon R500 的架構設計了,可以注意到與前作相比有著很多的不同處,首先看到的是頂點渲染器的數量,與 GeForce 7 系列一樣從原先的六組增加到了八組,宏觀上與前作的差異主要在於加入 Vertex Shader 3.0 的支援能力,因此可以支援動態流程控制與更多的暫存器、更長的程式等特性。

更貼近觀察 Radeon R500 的 Vertex Shader 會發現這次 ATI 使用的設計與 NVIDIA 和 ATI 以往慣用的設計很不一樣,ATI 並未採用與 NVIDIA 類似的 FP32 向量浮點運算單元 + FP32 純量浮點運算單元配置,在 Radeon R500 的 Vertex Shader 採用的向量浮點運算單元寬度高達 128-bit (可以拆分為四組 32-bit 向量浮點運算單元使用),最高每個時脈週期可以生成兩個頂點 (透過允許同時執行任意兩個執行由 4 個運算子所組成的向量運算或是由 3 個運算子及一個純量組成的向量純量混和運算達成),理論性能較 NVIDIA 的 4 運算子及一個純量組成向量純量混和運算的做法稍低 (但 Vertex Shader 的性能通常過剩因此不成問題)。

不過 Vertex Shader 對性能的影響終究有限,接下來的才是真正的重頭戲-Pixel Shader,在 R500 的設計當中可以很明顯發現到與以往的繪圖管線設計有很大的不同 (這埋下了之後一個很大的伏筆,2006 年在次世代 GPU 上市之前 ATI 能夠迴光返照短暫搶下 NVIDIA 王冠就是靠這點),那就是 ATI 將 Pixel Shader 原本包含的材質單元、像素著色單元、分支控制全部拆開了!

相信你也注意到 R520 在架構設計上只有 16 條組成 4×4 結構的像素渲染器了吧?相較於 G70 來說可以說是落後甚多,單看架構圖的話十之八九大概會猜測 R520 的性能遠遠不及 G70,但實際情況卻不是如此,G70 與 R520 在絕大多數的測試情況下都是互有勝負的,ATI 是怎麼做到這點的呢?實際上靠的就是圖上很顯眼的 Ultra-Threading Dispatch Processor。

這種設計基本上就是透過將組成原有的繪圖管線拆成各自獨立的部分來使得利用效率可以獲得明顯的成長 (避免產生互等的情況),如同過去我們所知道的,3D 圖形運算實際上是高度可平行化的運算,因此一旦平行性得以提高,對性能來說造成的成長幾乎跟管線數量增加是一樣的。以處理執行分支的過程為例:

在調整為新的獨立設計之後,原本需要等待 14 + 6 個週期才能執行完的分支 A、B 在全面平行化之後最短可以壓縮到只需要 14 個時脈週期就能完成,不過在這邊要特別提到的一點是,ATI 在設計 Radeon R500 時並沒有支援 Shader Model 3.0 當中的 Vertex Texture Fetch (頂點紋理擷取),依照 ATI 的說法,微軟在規範 DirectX 9.0c 的時候是將 VTF 設為選用特性,因此 ATI 使用了另一種稱為 R2VB (Rendering to Vertex Buffer) 的方式來提供類似的功能,原理上是運用 Radeon R500 超寬的 128-bit Vertex ALU 來達到類似的功能,不過實務上 R2VB 需要軟體的支援,但 ATI 在 DirectX 9.0c 這世代本身已經是遲到許久了,因此 Radeon R500 無法支援 VTF 在上市之初曾經引發過一陣爭論。

除了降低分支操作造成的延遲之外,透過 Ultra-Threading Dispatch Processor 進行調控與工作分配可以使像素渲染器本身的利用率得以提高許多,更進一步的帶來性能提升,於是最後造就了 R520 只需要 16 條管線就可以與具備多達 24 條管線的 7800 GT 相競爭,而除了繪圖管線的改進之外,R520 的另一項重大變革則是出現在記憶體控制器上。

是的,你沒有看錯,就是環狀記憶體鏈路技術,如果你還有印象的話可能會聯想到 Intel Sandy Bridge 處理器首次採用環狀內部連線吧?透過內建兩條環狀記憶體匯流排 (雙向各一條,連接了四個端點,每個端點負責兩個記憶體顆粒晶片),並由中央的 Write Crossbar Switch 調控最快路徑,使得 Radeon R500 內部的記憶體資料傳輸通道寬度可以高達 512-bit 之寬!乾淨的佈線也讓時脈提升變得相對容易一些,除此之外內部的快取記憶體也升級為全關聯式,因此在處理記憶體映射的延遲也降低了。

除此之外 ATI 還針對 DirectX 9.0c 的一些弱點進行了改善,像是啟用了 HDR 就無法使用反鋸齒效果 (因為占用了相同的緩衝區的緣故) 之類的問題,在 Radeon R500 上是不會發生的,不過由於這部分不屬於 DirectX 官方規範,又加上佔有另一半市佔率的 NVIDIA 產品並不支援,因此實際上使用的軟體或遊戲屈指可數 (就跟 3Dc 材質壓縮技術一樣,說起來 R500 也內建了升級版的 3Dc+,不過依然乏人問津)。

說了這麼多,讓我們回到產品本身吧。R500 系列第一款上市的產品是面向中高階市場的 R520,在 2005 年 10 月 05 日被命名為 Radeon X1800 系列進入市場,初期有 XT (625/750 MHz) 與 XL (500/500 MHz) 兩個型號,全都具備完整的 16 組像素渲染器與 8 組頂點渲染器,年底追加的 CrossFire 特別版則是運作於 600/700 MHz,後來 ATI 在隔年三月還推出了閹割掉 4 組像素管線的 X1800 GTO (500/495 MHz)。

除了面向中高階市場的 R520 之外,ATI 也同時發佈了針對入門市場設計的 RV515 與針對中低階市場設計的 RV530 兩種核心,前者是 Radeon R500 系列當中結構最簡單的版本,僅具備 4 組像素管線、2 個頂點渲染器、4 組 TMU 與 4 組 ROP,並且只能搭配 DDR2 記憶體,內部的記憶體環狀鏈也只剩下 128-bit 寬度。

RV515 後來被命名為 X1300 系列,一共有無印 (450/250 MHz)、HyperMemory (450/250 MHz,記憶體頻寬減半但可以共享系統記憶體)、Pro (600/400 MHz) 三種型號。

後來在 2007 年 ATI 還曾經將 RV515 轉移到新的 80 奈米製程做測試 (也就是 RV516 核心),並命名為 Radeon X1550 (550/400 MHz),至於 RV530 的部分呢則是具備了至多 12 組像素管線與 5 組頂點渲染器,但 TMU 與 ROP 的數量則與 RV515 相同,記憶體頻寬則只剩下 128-bit,這款晶片後來被命名為 X1600 系列銷售。

Radeon X1600 系列一開始有 X1600 XT (590/780 MHz,搭配 GDDR3 記憶體)、X1600 PRO (500/390 MHz,搭配 DDR2 記憶體) 兩種型號,後來在隔年又推出了 Radeon X1300 XT (500/400 MHz,搭配 DDR2 記憶體) 這個型號以填補入門級與中低階市場之間的空缺。

RV530 後來還有兩個比較特殊的衍生型,首先是同樣採用 RV530 核心的 Radeon X1650,這是一款主要面向 OEM 市場的顯示卡,規格諸元大致上與 X1600 PRO 相似,唯一的差別是記憶體時脈略高 10 MHz,雖然型號的數字較大,但實際上性能上是不及 X1600 XT 的,而另一個特殊衍伸版則是類似於 RV516,RV530 同樣有升級到 80 奈米製程的特別版本推出,稱之為 RV535,並被命名為 X1650 Pro,時脈也隨著製程升級進一步拉高到了 600/700 MHz,並用上了 GDDR3 記憶體。

不過 Radeon R500 這一世代最精彩的其實是在 R520 推出三個月後推出的新頂級產品-R580,前面談過 ATI 在 R500 這一代把 Pixel Shader 拆成數個部分,實際上這麼做的最大好處在此刻才要真正體現。下圖左邊是剛剛看過的 R520,右邊則是 R580 的架構設計:

從架構設計上應該不難看出 ATI 在 R500 使用分離式架構的聰明之處吧?原來 R520 只有 16 條管線的設計只是個幌子,R580 才是真正的完全體,透過將繪圖管線拆分成三個部分,ATI 得以將繪圖管線當中的像素渲染單元與材質貼圖單元的數量完全脫鉤,因此在 R580 當中 ATI 可以直接一口氣將而其中像素渲染單元的數量增加到三倍之多 (之所以沒辦法直接把管線增加三倍是因為放不下與成本、電路複雜度的問題,不過只增加像素渲染單元的話大概只會增加 20% 左右的電晶體數量),而像素渲染單元正好又是影響 GPU 性能的最主要因素之一,這意味著 R580 可以帶來非常恐怖的性能提升!

實際上一開始在 ATI 的規畫當中,R580 的推出時間點應該與 R520 非常接近 (同樣是落在 2005 年中),規劃上是 R580 作為頂級產品而 R520 擔綱中高階市場,這解釋了為什麼 ATI 在 R520 的時候會看起來好像費盡九牛二虎之力卻只端出個跟競爭對手差不多等級的產品的原因,實際上當時 ATI 研發團隊真正的主力目標是 R580,不過不幸的是 R580 也有著與 R520 相似的問題,而且更加複雜更難以解決,因此最終 R580 被延期到了 2006 年才得以面世,雖然成功扭轉 NVIDIA 的領先情勢,但是距離下一世代的 DirectX 10.0 架構大改卻已經只剩下寥寥無幾的時間了,如果 R580 當年得以如期推出,或許 ATI 不會被 AMD 收購,被收購的反而是 NVIDIA 也說不定。

R580 在 2006 年 01 月正式上市,首發型號有 X1900 XTX (650/775 MHz)、X1900 XT (625/725 MHz)、X1900 CrossFire Edition (625/725 MHz,可做 CrossFire 主卡) 三款,全部都具備以當時來說非常驚人的 48 組 Pixel Shader (其他部分則與 R520 規格相同),並在同年年中推出了較為低價的 X1900 GT (575/600 MHz,只具備 36 組 Pixel Shader,TMU 與 ROP 也被削減為 12 組)。

後來在 2006 年下半 ATI 又推出了基於小幅升級版核心 R580+,相較於 R580 來說主要的改進出現在製程與記憶體控制器的部分,基於 80 奈米製造工藝的 R580+ 可以支援更新一代的 GDDR4 記憶體,並且能夠進一步拉高記憶體運作時脈,首批基於 R580+ 的產品一共有 X1950 CrossFire Edition (650/1000 MHz,支援 CrossFire 技術與 GDDR4 記憶體)、X1950 XT (625/900 MHz,搭配 GDDR4 記憶體) 及 X1950 XTX (650/1000 MHz) 三款,這同時也是 ATI 被 AMD 收購之前的最後一批產品。

在與 R580 推出的同時,ATI 也進一步將 R580 的技術下放到中階市場,也就是後來的 RV560 與 RV570 (下圖),這兩款基於 80 奈米製造工藝的核心都使用了類似 R580 的架構,後者主要針對中高階市場推出,具備了 36 組的像素渲染器與 8 組頂點渲染器、12 組 ROP 與 12 組 TMU,前者則比較偏向中低階市場,進一步將像素渲染器削減為 24 組、TMU 與 ROP 均減為 8 組,並且全面採用 GDDR3 記憶體。

其中 RV570 就是後來的 Radeon X1950 GT (500/600 MHz) 與 Radeon X1950 PRO (575/690 MHz),而 RV560 則是後來的 Radeon X1650 GT (400/400 MHz) 與 Radeon X1650 XT (525/700 MHz)。

最後關於 Dual-Link DVI 支援能力的部分呢,較高階的 R520、R580、R580+、RV560、RV570 都可以支援兩組 Dual-Link DVI,而中低階市場的 RV515、RV530、RV535 則只有提供一組。

Exit mobile version