本節將繼續延續上一節的內容,預計要介紹的有 Intel 的 Pentium III 家族、AMD 的 K6-III 與 Athlon 家族三大系列 (嗯,我自己也知道,如果要把 Pentium 4 放在這篇字數絕對會破萬 XD)。

由於篇幅有限,從本篇開始站長基本上不會提行動版的部分,除非是非常具有代表性或自成一線的產品 (例如 Pentium M)。

中古時代後期-個人電腦即將邁入成熟的時代 (下)

K6 家族的尾聲:AMD K6-III

AMD-K6-III

延續過去 K6 與 K6-2 的發展,AMD 在 1999 年 02 月 22 日發佈了 K6 微架構的第三次大幅改版,命名為 K6-III (故意改成 III 而不叫 K6-3 大概是要跟 Pentium III 扯關係吧?儘管官方似乎是說改名是為了凸顯 K6-III 相較於前作有飛躍性的成長……其實運算核心的部份根本沒有改變)

K6-3-dieshot

↑ AMD K6-III die shot

整體而言其實 K6-III 的設計差異大概可以這樣解釋:「整合了 L2 快取的 K6-2」,雖然用說的很簡單,但其實這做起來可困難了,對於生產技術落後於 Intel 的 AMD 來說,硬是要在 0.25 微米製程的 K6-III 中塞入 256 KB 的全速 L2 快取的結局就是生產成本的大幅拉高,良率狂跌與不斷的延期 (其實本來預期是 1998 年底就要出了,這導致 K6-III 在市場上的生命週期被壓得很短),因此在 K6-III 上 AMD 賠了不少錢。

第一場時脈戰爭

其實在同樣頻率的狀況下,K6-III 的表現是很不錯的,可以贏過同時脈的 Pentium II 與早期的 Pentium III,不過由於管線深度淺 (相對於 P6 的管線深度而言,K6 家族的管線深度只有 6 階,也就是只有一半左右),雖然效率良好卻沒辦法拉高運作時脈,直到最後 K6-III 都沒能超過 550 MHz。

按:初期的 Pentium III 與 Pentium II 幾乎是一樣的東西,就算加入了 SSE,在當時也沒表現在效能提升上。

K6-III 曾經短暫推出過 500 MHz 的型號,不過很快就因為發現有燒毀主機板的風險而召回了,而當時 AMD 心裡也有底,K7 架構的 Athlon 即將猛虎出閘,因此也就決定不再繼續嘗試發展高時脈的 K6-III。

因為以上種種原因,加上生產成本高昂, K6-III 在市場上只出現了很短的一段時間,除了初期有在桌上型電腦上使用外,後來就改為只用於筆記型電腦,幾乎可說是「短命的代表」。

第一代產品:Sharptooth (K6-III, K6-3D+)

  • 發佈時間:1999 年 02 月 22 日
  • 運作時脈:400 MHz、450 MHz
  • FSB 時脈:66 / 100 MHz、100 MHz
  • L1 快取大小:64 KB (資料與指令快取各 32 KB)
  • L2 快取大小: 256 KB (全速 On-die)
  • 支援插槽:Super Socket 7
  • 電壓需求:2.2 V、2.4 V
  • 電晶體數:2140 萬枚
  • 製造工藝:0.25 微米 (µm)
  • 指令集:x86-32 + MMX, 3D Now!

amd_k63

↑ AMD K6-III (Sharptooth)

K6-III 真的很少見,就算是在網路上其實站長也有印象當年就很難找得到,當時的品牌電腦大致上就是 K6-2 之後就跳級 Athlon 與 Pentium III 了。

在 Athlon 上市之後基本上 K6-III 注定將成為棄子,由於在目標市場中已經毫無競爭力,加上生產成本卻比 K6-2 高很多,直逼 Athlon 的等級,因此 AMD 就開始逐步降低 K6-III 的產量了。

而在效能大幅提升的 Pentium III Coppermine 推出之後,由於製程轉換導致 Intel 一時之間無法出貨滿足龐大的市場需求,因此有一部分需求便轉向 AMD Athlon,使得 Athlon 一瞬之間大賣供不應求,於是 AMD 就將 K6-III 的生產徹底停止了 (好把產線空出來給當時公司的新金雞母-Athlon)。

K6-III-P

  • 發佈時間:1999 年 05 月 31 日
  • 運作時脈:350 MHz ~ 475 MHz
  • FSB 時脈:66 MHz ~ 100 MHz
  • L1 快取大小:64 KB (資料與指令快取各 32 KB)
  • L2 快取大小: 256 KB (全速 On-die)
  • 支援插槽:Super Socket 7
  • 電壓需求:2.0 V ~ 2.2 V
  • 電晶體數:2140 萬枚
  • 製造工藝:0.25 微米 (µm)
  • 指令集:x86-32 + MMX, 3D Now!

K6-3P

↑ AMD K6-III-P

雖然說是行動版,不過其實與 K6-III (Sharptooth) 沒甚麼差別,只是電壓低了些,順帶一提 K6-III 全家族以當時的標準來說,發熱量是「讓人驚訝的高」,關於命名中的「P」,官方說法是 Performance 的意思。

K6-2+

  • 發佈時間:2000 年 04 月 18 日
  • 運作時脈:450 MHz ~ 570 MHz
  • FSB 時脈:95 MHz ~ 100 MHz
  • L1 快取大小:64 KB (資料與指令快取各 32 KB)
  • L2 快取大小: 128 KB (全速 On-die)
  • 支援插槽:Super Socket 7
  • 電壓需求:2.0 V
  • 電晶體數:2140 萬枚
  • 製造工藝:0.18 微米 (µm)
  • 指令集:x86-32 + MMX, 3D Now!

amd_k62plus

↑ AMD K6-2+

隨著時間過去,Intel 產能起來以後,供不應求的狀況就解除了,此時 AMD 則將空出來的產線拿來生產製造工藝提升至 0.18 微米的 AMD K6-III,同時加入了 PowerNow! 節電技術 (為了更適合用於筆記型電腦),並配合良率問題將 L2 快取大小減半之後命名為 K6-2+ 推出。

K6-III+

  • 發佈時間:2000 年 04 月 18 日
  • 運作時脈:400 MHz ~ 550 MHz
  • FSB 時脈:95 MHz ~ 100 MHz
  • L1 快取大小:64 KB (資料與指令快取各 32 KB)
  • L2 快取大小: 256 KB (全速 On-die)
  • 支援插槽:Super Socket 7
  • 電壓需求:2.0 V (低電壓版為 1.6 V ~ 1.8 V)
  • 電晶體數:2140 萬枚
  • 製造工藝:0.18 微米 (µm)
  • 指令集:x86-32 + MMX, 3D Now!

K6-III+

↑ AMD K6-III+

K6-III+ 基本上與 K6-II+ 幾乎完全相同,唯一的差異是 K6-III+ 的快取為未經縮減的 256 KB。

由於 AMD 當時將宣傳完全砸在新的 Athlon 上,對 K6-III 家族採取冷處理的方針,因此除了愛好者與業界之外幾乎很少人知道有 K6-III 這系列的存在,更別提後來製程升級後重出江湖的事情,雖然 K6-III+ 與 K6-2+ 在市場劃分上都是給筆記型電腦使用,但也有一些 K6-2、K6-III 被拿到 DIY 與桌上型電腦市場上販售,不過由於宣傳很少導致知名度很低,許多人選擇買上一代的 K6-2,而不太會去買價格其實差不多的 K6-2+。

AMD 最風光的時代:AMD Athlon

在經過 K6-III 的失敗之後,AMD 並沒有因此慢下腳步,在 1999 年 06 月 23 日發佈了基於全新 K7 架構的 Athlon 處理器家族,中文命名則為「速龍」,從此展開了 AMD 公司歷史上最輝煌的一段時光。

AMD_Athlon_Processor_Logo

「貴人相助」推了 AMD 很大一把

Athlon 的開發過程中 AMD 可說是獲得了許多「貴人」相助,當時 AMD 與 Motorola 的合作 (Motorola 與 AMD 合作發展 Copper Interconnect 製程) 使其能在 Intel 之前一年將 0.18 微米製造工藝的技術運用在晶圓生產上,這也連帶使得 AMD 有機會讓 Athlon 成為全球第一個達到 1 GHz 的處理器。

COMPAQDEC

除此之外當時正巧 Compaq 收購了 DEC 卻將 DEC 手上幾乎已經快完成的 Alpha 處理器計畫給砍掉,讓 AMD 得以將幾乎整個 DEC 半導體團隊挖到自己公司來,而這支團隊與原本從 NexGen 收購來的 K6 團隊結合之後,就成了 K7 架構的研發團隊。

還沒開始,就已經接近完成

有了 K6 架構與幾近於完成的 Alpha 架構為基礎,讓 AMD 得以很快的完成 K7 架構並將其推出到市場上搶得先機,同時 Alpha EV6 架構與 DDR 技術更讓 Athlon 得以在只有 100 Mhz 外頻的情況下,達到比 Intel 用於 Pentium III 的 GTL+ 匯流排更高的頻寬。

管線深度提升,帶動時脈提升

由於 K6 架構中只有 5 階管線,這造成時脈提升上很大的困難,這也是導致 K6-III 失敗的主要原因之一,因此 Athlon 毫不意外的擁有更深的管線深度 ( 10 階管線),因此在 Athlon 上我們可以看到很明顯的時脈提升,不過由於管線加深,在分支預測命中率上的要求也會更高,而 Athlon 確實做到了。

浮點運算性能大幅強化

Athlon 的浮點性能相比過去的 K6 架構而言有幾乎可以稱為是巨大的提升,一改過去 K6 架構為人詬病浮點運算性能不佳的缺點,Athlon 在超長管線與新的浮點運算單元設計的幫助下,甚至能夠輕鬆贏過 Intel 的 P6 架構與 Pentium III。

同時 AMD 又在 Athlon 上新增了增強版的 3D Now! 指令集 (Enhanced 3D Now!),包含了新的 DSP 指令與一些 Intel 在 SSE 中引入,用於增強 MMX 的指令。

天時、地利、人和三者並進

除了 Athlon 在當時穩坐全世界最快的 x86 處理器之名外 (直到 Pentium 4 之前,Athlon 穩坐這一地位頗長一段時間),當時 Intel 很大程度受到自己在製程發展上的瓶頸與產能、良率方面提升的困難所制肘,如同前面 K6-III 段落說過的,當時 Intel 長期的缺貨造就了 Athlon 極為龐大的需求,甚至讓 AMD 決定提前結束 K6-III 的生產。

第一代產品:Argon (K7)

  • 發佈時間:1999 年 06 月 23 日
  • 運作時脈:500 MHz ~ 700 MHz
  • FSB 時脈:100 MHz (DDR 雙倍頻寬)
  • L1 快取大小:128 KB (資料與指令快取各 64 KB)
  • L2 快取大小: 512 KB (半速)
  • 支援插槽:Slot A (卡匣外型)
  • 電壓需求:1.6 V
  • 電晶體數:2200 萬枚
  • 製造工藝:0.25 微米 (µm)
  • 指令集:x86-32 + MMX, Enhanced 3D Now!

argon-top

↑ AMD Athlon (Argon) 上方視圖

第一代 Athlon 使用了與 Pentium II、Pentium III 初期產品相當類似的卡匣外型,但 Athlon 所使用的 Slot A 與 Intel 的 Slot 1 並不相容,同時 Athlon 的 L1 快取大小可說是相當驚人 (即使是從今天的角度來看也是如此),來到了 128 KB 之多。

argon-front

↑ AMD Athlon (Argon) 正面,拆除保護殼後

而不同於 K6-2 架構中快取與記憶體共用匯流排的設計,儘管 Athlon 初期產品的 L2 快取仍未整合至核心中 (與 Pentium II 類似,快取晶片放在 CPU 電路板的兩側),但卻使用兩條不同的匯流排,因此記憶體與快取都能享有更大的頻寬而不需要彼此分享。

23826811786_629eec0719

↑ AMD Athlon (Argon) Die shot

第 1.5 代產品:Pluto (K75)

  • 發佈時間:1999 年 11 月 29 日
  • 運作時脈:550 MHz ~ 1000 MHz
  • FSB 時脈:100 MHz (DDR 雙倍頻寬)
  • L1 快取大小:128 KB (資料與指令快取各 64 KB)
  • L2 快取大小: 512 KB (根據時脈不同,以時脈的 50% ~ 33% 運作)
  • 支援插槽:Slot A (卡匣外型)
  • 電壓需求:1.6 V ~ 1.8 V
  • 電晶體數:2200 萬枚
  • 製造工藝:0.18 微米 (µm)
  • 指令集:x86-32 + MMX, Enhanced 3D Now!

K75

↑ AMD Athlon (Pluto)

Pluto 基本上就是 Argon 的製程提升版本,除了時脈可以拉得更高之外,沒有太多特別的地方,值得注意的是,AMD 在此時終於突破了 1 GHz 大關,成為全世界第一顆達到 1 GHz 預設時脈的 x86 處理器,比 Intel 還早。

第 2 代產品:Thunderbird

  • 發佈時間:2000 年 06 月 05 日
  • 運作時脈:600 MHz ~ 1400 MHz
  • FSB 時脈:100 MHz ~ 133 MHz (DDR 雙倍頻寬)
  • L1 快取大小:128 KB (資料與指令快取各 64 KB)
  • L2 快取大小: 256 KB (全速,On-die)
  • 支援插槽:Socket A ( 462 針腳 FPGA 封裝)
  • 電壓需求:1.7 V ~ 1.75 V
  • 電晶體數:2200 萬枚
  • 製造工藝:0.18 微米 (µm)
  • 指令集:x86-32 + MMX, Enhanced 3D Now!

tbird1100

↑ AMD Athlon (Thunderbird)

Thunderbird 可說是 Athlon 的一次標誌性的大改版,Thunderbird 捨棄 Slot A 設計,改採大家熟悉的 PGA 封裝,同時將 L2 快取減半至 256 KB 但直接整合入 CPU 核心中,使得 L2 快取得以使用與 CPU 主頻相同的速度執行,同時快取的存取機制也整個重新設計過,因此性能上又比 Pluto 高出一截,強勁的效能使得 Thunderbird 成為 AMD 有史以來最成功的處理器產品。

AMD_Duron

↑ AMD Duron (Spitfire)

同時此時 AMD 也針對 Intel Celeron 主攻的低價市場,推出了 Duron 產品線,第一代的 Duron (代號為 Spitfire) 實際上就是 Thunderbird 的簡化版,L2 快取大小減為 1/4 (也就是 16 KB),時脈則介於 600 MHz ~ 950 MHz。

被 Athlon 甩到顏面無光:Intel Pentium III

Intel 在 1999 年 02 月 26 日釋出了 Pentium III,做為 Pentium II 的後繼基本上在初期 Pentium III 並沒有甚麼明顯的變動,主要是以前代為基礎加上了為因應 AMD 的 3D Now! 而出現的 SSE 指令集 (曾經被稱為 MMX2 與 KNI, Katmai New Instruction)。

Pentium_3_logo

而目前仍為人所記得的 Pentium III 特性,反而是當時引起爭議的 PSN 功能 (Processor Serial Number),其實也不算很特別的功能,就是在每顆 Pentium III 中燒錄該顆處理器的序號而已,不過在隱私上引起了疑慮。

第一代:Katmai (80525)

  • 發佈時間:1999 年 02 月 26 日
  • 運作時脈:450 MHz ~ 600 MHz
  • FSB 時脈:100 MHz ~ 133 MHz
  • TDP:25.3 W ~ 34.5 W
  • L1 快取大小:32 KB (資料與指令快取各 16 KB)
  • L2 快取大小:512 KB (半速,off-die)
  • 支援插槽:Slot 1 (卡匣外型)
  • 電壓需求:2.0 V (600 MHz 型號為 2.05 V)
  • 電晶體數:950 萬枚
  • 製造工藝:0.25 微米 (µm)
  • 指令集:x86-32 + MMX, SSE

Katmai

↑ Intel Pentium III (Katmai)

Katmai 是以 Pentium II 的 Deschutes 核心為基礎發展出來的,主要差異在於新增 SSE 指令集與針對 L1 快取控制器的強化,因此性能上比 Deschutes 來說是有所提升的 (但幅度不大),但受制於 0.25 微米工藝,Katmai 的電晶體數量提升因此受到了不小限制,於是 Intel 在 Katmai 中設計 SSE 時使用了重複使用現有的 64-bit 來實現 SSE 的 128-bit 指令架構,這與 SSE 原始的設計概念有所矛盾,於是當時想針對 SSE 優化的軟體面臨了兩難:到底要依照 Katmai 的折衷設計優化還是要為了未來使用完整 SSE 設計的處理器優化?

Intel_Pentium_III_Katmai

↑ Intel Pentium III (Katmai) 正面,中為 CPU 核心,右二為快取晶片。

Katmai 產品線中型號標示有「B」後綴的型號表示 FSB 的時脈為 133 MHz。

TANNER

↑ Intel Pentium III Xeon (Tanner)

而 Xeon 版本的 Katmai 則被命名為 Tanner,基本上關係類似於過去的 Pentium II 與 Pentium II Xeon,主要是快取加大與加速之後的版本,使用 Slot 2 規格,同時隨著晶片組與主機板的不同,至多可以同時安裝四顆 Tanner。

Pentium_III-die

↑ Intel Pentium III Xeon (Tanner) Die shot

第二代:Coppermine (80526)

  • 發佈時間:1999 年 10 月 25 日
  • 運作時脈:500 MHz ~ 1133 MHz
  • FSB 時脈:100 MHz ~ 133 MHz
  • TDP:13.2 W ~ 33.0 W
  • L1 快取大小:32 KB (資料與指令快取各 16 KB)
  • L2 快取大小:256 KB (全速,on-die)
  • 支援插槽:Socket 370 / Slot 1 (卡匣外型)
  • 電壓需求:1.6 V~ 1.75 V
  • 電晶體數:2800 萬枚
  • 製造工藝:0.18 微米 (µm)
  • 指令集:x86-32 + MMX, SSE

Intel_Pentium_III_Coppermine

↑ Intel Pentium III (Coppermine) Socket 370 封裝

Coppermine 核心是系列中第一個真正具備絕大多數 Pentium III 特性的版本,同時也是 Intel 針對 AMD 陣營的旗艦產品-Athlon 的回應。

intel_pentium3

↑ Intel Pentium III (Coppermine) Die shot

Katmai 與 Pentium II 中受人詬病的管線延遲,在 Coppermine 大幅調整設計之後有了很大的改善 (同時管線深度也由 Pentium Pro 的 14 階降至 10 階),極端狀況下可以提高 30% 的性能,同時受益於製程的提升,Intel 在 Coppermine 時期也開始採用將全速的 256 KB L2 快取整合入處理器核心的做法,因此電晶體數大幅倍增到 2,800 萬。

p3-733_big

↑ Slot 1 版本的 Coppermine,可以很明顯發現快取晶片不見了

同時 Coppermine 也是 Intel 第一個預設時脈突破 1 GHz 的產品,在 2000 年更推出了 1.13 GHz 的版本,但初期有嚴重的產品不穩定問題因此在上市之後不久就召回,直到 2001 年才重新推出改良後的 D0 步進版本。

slot1toppgapic

↑ Slot 1 轉 Socket 370 用轉卡

由於部分型號與 Katmai 重疊,因此部分型號後面新增了「E」後綴以表示為 Coppermine 核心產品,而標示有「B」後綴的型號仍表示 FSB 的時脈為 133 MHz,因此有部分型號被標註為「EB」。

基於與 Celeron Mendocino 相同的理由,隨著快取被整合入核心晶片當中,Intel 決定放棄 Slot 1 插槽,回歸使用 Socket 370 封裝 (但無法直接與 Celeron Mendocino 的主機板混用,需要轉接器)。

Celeron_Coppermine-128_600

↑ Intel Celeron (Coppermine-128)

至於 Celeron 版本的 Coppermine 則命名為 Coppermine-128,此系列經常被稱為「Celeron II」或「Celeron 2」,實際上就是將 L2 快取大小減半之後的 Coppermine,而在 2001 年 800 MHz 版本的 Coppermine-128 上市之前,Coppermine-128 的 FSB 時脈只有 66 MHz,但對效能的影響不大。

Pentium_III_Xeon_Cascades_b

↑ Intel Pentium III Xeon (Cascades)

Xeon 版本的 Coppermine 則被命名為 Cascades,主要差異為快取大小 (最大可達 2 MB) 與沿用 Slot 2 插槽設計,其中 700 MHz 與 900 MHz 型號能支援四處理器配置,其餘則是至多雙處理器配置。

第 2.5 代:Coppermine-T (80533)

  • 發佈時間:2001 年 06 月
  • 運作時脈:800 MHz ~ 1133 MHz
  • FSB 時脈:133 MHz
  • TDP:29.0 W ~ 38.2 W
  • L1 快取大小:32 KB (資料與指令快取各 16 KB)
  • L2 快取大小:256 KB (全速,on-die)
  • 支援插槽:Socket 370 (FC-PGA2)
  • 電壓需求:1.75 V
  • 電晶體數:2800 萬枚
  • 製造工藝:0.18 微米 (µm)
  • 指令集:x86-32 + MMX, SSE

Coppermine-T 是 Coppermine 與 Tualatin 之間交界時期的過渡產品,基本上與 Coppermine 沒有不同,唯一差別是封裝方式改為 FC-PGA2 (最直接的特徵是 FC-PGA2 封裝處理器正面有覆蓋一片金屬均熱片,因此無法直接看到處理器晶片本體。

Coppermine-t

↑ Coppermine-T,從外型上可以很容易發現與 Coppermine 的不同。

在 Coppermine-T 以前的 Pentium III 處理器則是使用 FC-PGA 封裝,值得注意的是,儘管都是 Socket 370,但 FC-PGA 與 FC-PGA2 的主機板並不能混用,若要將 Coppermine-T 用於以往的 Socket 370 主機板,則會需要額外購買轉接器,但支援 FC-PGA2 的主機板則是可以安裝 FC-PGA 封裝之 Coppermine 的。

第 3 代:Tualatin (80530)

  • 發佈時間:2001 年 07 月
  • 運作時脈:1000 MHz ~ 1400 MHz
  • FSB 時脈:133 MHz
  • TDP:29.1 W ~ 32.2 W
  • L1 快取大小:32 KB (資料與指令快取各 16 KB)
  • L2 快取大小:256 KB / 512 KB (全速,on-die)
  • 支援插槽:Socket 370 (FC-PGA2)
  • 電壓需求:1.475 V ~ 1.5 V
  • 電晶體數:2800 萬枚
  • 製造工藝:0.13 微米 (µm)
  • 指令集:x86-32 + MMX, SSE

Intel_Pentium_III_Tualatin

↑ Intel Pentium III (Tualatin)

Tualatin 是 Pentium III 的最後一次更新,一般被認為只是 Intel 用來試驗 0.13 微米製程的產品而已,畢竟當時 Pentium 4  (發佈於 2000 年) 早已佔有大部分的市場,而與過去的 Pentium III 不同,Tualatin 不包含先前曾引起爭議的 PSN (處理器序號) 功能。

tualatin_die

↑ Intel Pentium III-S (Tualatin-512) Die shot,可以看到左半部 512 KB 的 L2 快取佔去大量空間

其實 Tualatin 的時脈還有相當大的發展空間,不過 Intel 擔心會打到自家的 Pentium 4,因此並未發行高於 1.4 GHz 的 Tualatin,而同時間完成的 Tualatin-512 具有 512 KB 大小的 L2 快取,同樣為了避免上打 Pentium 4,因此被額外賦予了同時可以支援 ECC 記憶體與雙處理器配置的能力與相對高昂的價格,作為針對伺服器市場的產品發佈。銷售時則被命名為 Pentium III-S。

Intel Pentium III-S

↑ 外觀差異其實不明顯,但可以看到上面有 Pentium III-S 字樣。

對應 Tualatin 的 Celeron 核心代號則為 Tualatin-256,有些人會稱其為「Celeron-S」或 Tualeron。特性上幾乎與具備 256 KB L2 快取的 Tualatin 相同,但 L2 快取的部分採用延遲較大的版本已降低成本,不過這卻為 Tualatin-256 帶來了十分良好的超頻潛能。

Tualeron_1200

↑ Intel Celeron (Tualatin-256)

呼,終於介紹完中古時代了,下一篇開始就是近代前期,預計會先介紹 Pentium 4、Pentium D 等 Netburst 家族。

電腦達人養成計畫 2-8:中古時代後期 CPU 發展史 (中)」<< PREV

NEXT >>「電腦達人養成計畫 2-10:近代前期 CPU 發展史 (上) Netburst 架構