在經過四節的中古時代 CPU 發展史之後,從現在開始站長將進入近代的 CPU 介紹,從這篇開始出現的處理器應該就是目前絕大多數人都聽過的產品了,不過由於有幾款處理器架構的發展歷史特別曲折離奇,衍伸型特別繁多,加上站長希望能夠使用「略古詳今」的方式來解說歷代的處理器架構,因此近代前期的部分站長打算採用一篇一架構的方式介紹,本篇談的是 Intel 的 Netburst (P68) 架構,至於 AMD 的 K8 架構則會是下一篇的主題。

近代前期 (上) Intel Netburst 架構

Netburst 架構的開發代號為 P68,是 Intel 開發用於接替 P6 架構的全新 x86 架構設計,首款基於 Netburst 架構的處理器核心為 2000 年發佈的 Willamette,最後一款產品則是 2006 年的 Presler,從開始到結束生產前後綿延八年,算是 Intel 長壽的架構之一,開發的耗時也算是 x86 系列處理器中相當長的,陪伴了 Intel 走過一段大起與大落的歷史。

超深管線技術 (Hyper-Pipeline)

超高的管線深度幾乎可以說是 Netburst 架構最鮮明的特色,前代產品 Pentium III 僅有 10 級管線設計,而在 Netburst 的第一代產品 Willamette 核心上,管線深度一舉突破來到了兩倍 (20 級管線設計),而在 Netburst 架構下出現過的最深管線設計則是 Prescott 與 Cedar Mill 所使用的 31 級管線,同時為了避免管線深度增加之後導致的分支命中率下降與分支未命中 (Missing) 時造成的延遲,因此 Netburst 架構中也針對分支預測進行了特別的強化,不過後來證實這些強化終究沒辦法抵銷管線深度過深帶來的缺點。

超深管線設計也是導致 Pentium 4 的時脈可以增加地如此迅速地主要原因,不過後來在實作上情況並不如 Intel 原先預期的順利。

走火入魔的時脈戰爭

從 Pentium III 的中晚期開始 (或許更早),Intel 就有意使用宣傳的方式來「教育」消費者,使消費者認為時脈較高的處理器「理應」表現得比較好、性能比較強,這個情況在進入 Pentium 4 時期的時候變得更加明顯,x86 架構處理器發展史上,Netburst 架構時代是處理器運作時脈年增率最高的時期,到中期 Intel 幾乎已經進入走火入魔的情況,這篇報導就是一個例子,當時的 Intel 信誓旦旦地認為在「一年之內」,Intel 可以將當時運作於 2.4 GHz 的 Pentium 4 (Northwood) 處理器改良為 10 GHz 的 Prescott,至於結局如何就是大家都知道的那樣了。

快速執行引擎 (Rapid Execution Engine)

在 Netburst 架構中,處理器內的算術邏輯單元 (ALU) 會以處理器主頻的兩倍時脈運作,這個技術被命名為 Rapid Execution Engine,目的是緩解 Netburst 架構低落的 IPC (Instructions per cycle, 每周期可執行命令數) 帶來的問題,但 REE 並沒有辦法在任何情況都能抵銷 Netburst 架構低落的 IPC,有時候在執行某些指令時,甚至反而會因 REE 設計而拖慢運作效率。

執行追蹤快取 (Execution Trace Cache)

在 Netburst 架構中,Intel 在 L1 快取新增了執行追蹤快取這項功能,ETC 會將指令解碼之後的 micro-OPs 依照其預測的執行路徑暫存於快取中,而當處理器在執行其他指令時,如果 ETC 內已經有解碼過的結果,就不必重複進行 Fetch 與 Decode 的操作,且當指令被 CPU 從快取中讀取時,就直接可得到正確的執行順序,從而提升效率。

由失敗走向成功,又從成功墜入失敗:Pentium 4 家族

Intel_pentium4_logo_original

Netburst 家族的起頭與代表自然是曾經叱吒風雲將近 5 個年頭的 Pentium 4 與其衍伸系列 (Xeon 與 Celeron),大致上可分為四個時期。

第 1 代產品:Willamette (80528、80531)

  • 發佈時間:2000 年 11 月 20 日
  • 運作時脈:1.3 GHz ~ 2.0 GHz
  • FSB 時脈:100 MHz (QDR 四倍頻寬)
  • TDP:48.9 W ~ 75.3 W
  • L1 快取大小:12 KB ETC + 8 KB 資料快取
  • L2 快取大小:256 KB (全速,on-die)
  • 支援插槽:Socket 423 (80528) / Socket 478 (80531)
  • 電壓需求:1.56 V ~ 1.70 V
  • 電晶體數:4200 萬枚
  • 製造工藝:0.18 微米 (µm)
  • 晶片本體面積:217 mm2
  • 指令集:x86-32 + MMX, SSE, SSE2

Wilamette

↑ Intel Pentium 4 (Willamette) 正面

Willamette 是第一代的 Pentium 4 核心,基本上是一款相當失敗的產品。失敗的主要原因有二,第一是 Willamette 並不算是成熟的產品,性能上表現在初期產品明顯不如預期,甚至在 1.5 GHz ~ 1.6 GHz 時還打不贏自家的 Pentium III,更別提當時已經超越 Pentium III 的 AMD Athlon,整體而言讓許多人大失所望 (因為 Pentium 4 的 CPI 比 Pentium III 還要差,直到 Pentium 4 的運作時脈拉高到 1.7 GHz 以上才足以與 Pentium III 相抗衡,若要與 Thunderbird 抗衡則至少需要 2.0 GHz 以上)。

intel_s423_back

↑ Intel Pentium 4 (Willamette) 背面

除了性能不佳之外,Willamette 在初期僅允許搭配價格相當高昂的 Rambus RDRAM 記憶體使用,而不能使用相對而言便宜但較慢的 SDRAM,因此在市場上並沒有被廣泛接受,這個情況直到推出 Intel 845 Chipset 提供 SDRAM 支援之後,Pentium 4 的銷量才開始飆漲。

willamette-die

↑ Intel Pentium 4 (Willamette) Die shot

在 2001 年 08 月 27 日,Intel 發佈使用 Socket 478 新封裝方式的 Pentium 4 (Willamette),一般而言認為 Socket 478 是為了第二代產品  (Northwood) 準備的。

p4-478vs423

↑ Socket 478 與 Socket 423 比較

同時在 Willamette 上也可以發現 TDP 的數值開始往上飆升,最高已經來到了 75 瓦以上,而對應 Willamette 核心的 Celeron 低價產品則為 Willamette-128,主要差異為 L2 快取容量減半,與 Pentium 4 Willamette 的性能差異頗大,Willamette-128 在測試中的表現甚至不及上一代的 Celeron (Tualatin-256)。

XEON_LOGO_1

同時此時 Intel 也將 Xeon 產品線從 Pentium 品牌中獨立出來,從此自成一個系列,與 Willamette 對應的 Xeon 產品代號為 Forster 與 Forster-MP,前者快取只有 256 KB,遠不及於上一代 Cascades 的 2 MB,因此在市場上並未獲得青睞。後者則比 Forster 再額外新增一個 2 MB 大小的 L3 快取與引入 Hyper-Threading 技術,但 Forster 與 Forster-MP 使用的是 Socket 603 而非 Socket 423。

第 2 代產品:Northwood (80534)

  • 發佈時間:2002 年 01 月 07 日
  • 運作時脈:1.6 GHz ~ 3.4 GHz
  • FSB 時脈:100, 133, 200 MHz (QDR 四倍頻寬,400 ~ 800)
  • TDP:38 W ~ 89 W
  • L1 快取大小:12 KB ETC + 8 KB 資料快取
  • L2 快取大小:512 KB (全速,on-die)
  • 支援插槽:Socket 478
  • 電晶體數:5500 萬枚
  • 製造工藝:0.13 微米 (µm)
  • 晶片本體面積:131 mm2、146 mm2
  • 指令集:x86-32 + MMX, SSE, SSE2

Northwood-die

↑ Intel Pentium 4 (Northwood) Die shot

Northwood 是 Pentium 4 家族中最成功的一代,也是 Pentium 4 紅遍大街小巷的時期,大致上 Northwood 與 Willamette 後期產品的差異並不算太大,主要是製程上的提升 (0.18 微米升級至 0.13 微米) 與快取容量加倍,整體而言 Northwood 的生存年代頗長,衍身型也相當多,本次製程提升對 Pentium 4 來說效果十分顯著,讓時脈的上漲空間增大了非常多也暫時緩解了溫度的不斷飆升。

northwood_size

↑ Willamette 與 Northwood 的晶片本體大小比較

Northwood 主要可依照 FSB 的速度來分為三期:初期使用與 Willamette 相同的 FSB (400 MT/s),後來在 2002 年五月推出 FSB 提高到 133 MHz (533 MT/s)  的型號,並在 2002 年 11 月推出的 3.06 GHz 型號上首次在消費性 Pentium 4 處理器中加入 Hyper-Threading 功能,而後期則始於 2003 年 04 月 14 日 Intel 宣布推出一系列的 Pentium 4 HT 處理器,此系列全面支援 Hyper-Threading,絕大多數型號另將 FSB 提升到 200 MHz (800 MT/s)。

pentium4ht

對應 Northwood 核心的 Xeon 產品代號則為 Prestonia,全系列支援 Hyper-Threading,部分型號使用 Socket 604,其餘則沿用上代的 Socket 603。表現比起前代與 Athlon MP 來說大有成長,同時受益於配合晶片組的強化,擴充能力又比 Pentium III Xeon 與 Athlon MP 好上許多,因此在市場上獲得了相當的成功。

intel_xeon_prestonia_s603_2600_512_400_sl6eq

↑ Intel Xeon (Prestonia)

Prestonia 後來則在 2003 年 03 月被 Gallatin 取代,Gallatin 的主要改進為新增了 1 MB ~ 2 MB 的 L3 快取,MP 版本則支援四處理器配置並將快取加大到 4 MB,全系列均採用 Socket 604。

Socket 604 主機板可以向下相容 Socket 603 的處理器,但 Socket 603 主機板則不能使用 Socket 604 處理器。

intel_celeron_s478_northwood

↑ Intel Celeron (Northwood-128)

對應 Northwood 核心的 Celeron 則是 Northwood-128,基本上是快取縮小為 128 KB,並將 FSB 限定為 400 MHz (QDR,實際外頻為 100 MHz) 的  Northwood。與同代的 Pentium 4 性能差距比起以往來說拉得更大 (主要是 Northwood 的性能變強,而 Northwood-128 卻沒有明顯成長)。

P4EE

在 2003 年 11 月 03 日, Intel 將 Xeon 系列的 Gallatin-2M 核心移植到 LGA775 與 Socket 478 平台上,以 Pentium 4 Extreme Edition 之名銷售 (TDP 92.1 W ~ 110.7 W),高昂的售價與不明顯的效能提升,基本上並不成功,被戲稱為「Extreme Expensive」,不過這卻同時也是 Intel 開始將消費性市場從原本的性能級與入門級再次切割成玩家與極致、一般性能、入門三大階級的開始,這樣的畫分在今天仍然可以看得到,可以說是現今 HEDT 平台規劃的前身。

第 3 代產品:Prescott (80546, 80547)

  • 發佈時間:2004 年 02 月 01 日
  • 運作時脈:2.4 GHz ~ 3.8 GHz
  • FSB 時脈:133, 200 MHz (QDR 四倍頻寬,533 ~ 800)
  • TDP:89 W ~ 115 W
  • L1 快取大小:12 KB ETC + 16 KB 資料快取
  • L2 快取大小:1024 KB (全速,on-die)
  • 支援插槽:Socket 478 (80546) / LGA775 (80547)
  • 電晶體數:1 億 2500 萬枚 / 1 億 6900 萬枚 (Prescott-2M)
  • 製造工藝:90 奈米 (nm)
  • 晶片本體面積:112 mm2 / 135 mm2
  • 指令集:x86-64 (部分型號) + MMX, SSE, SSE2, SSE3

Prescott,或許更多人更熟悉其擁有的「噴火龍」這一稱號,是 Netburst 王朝崩毀的開始,也是 Intel 當時對時脈無量提升的幻想破滅之時。

隨著 Northwood 的時脈提升,運作溫度與 TDP 漸漸再次達到瓶頸,又因為 Intel 自己也相當清楚,當年 Northwood 的巨大成功很大程度上是來自於製程提升與快取的增加,於是當時 Intel 就認為只要繼續提升製程與增加管線深度,就能再繼續拉高時脈,達到 10 GHz 的目標「並不遙遠」(畢竟 Northwood 本質上幾乎就是快取加大與製程提升的 Willamette,而 Northwood 最後的時脈是 Willamette 的 1.7 倍)。

於是我們在 Prescott 核心上我們見識到了在處理器設計上採行「大艦巨砲主義」會是甚麼情況。Prescott 對管線深度再次進行提升,直接將管線加到 31 階,並將 L2 快取再次翻倍來到 1 MB (於是 Prescott 的電晶體數終於破億了),同時搭配製程進入 90 奈米工藝,Intel 期盼在 Northwood 上發生的效果再次出現於 Prescott 上,不過顯然美好的事情並沒有再次發生。

die-shot-prescott

↑ Intel Pentium 4 (Prescott) Die shot

後來 Prescott 的成品,不僅沒有提供多大的時脈提升空間 (最後只到 3.80 GHz 就止步了),甚至同時脈下的運作溫度比起 Northwood 來得高出許多,性能卻在許多測試項目中反而不及 Northwood,完全朝著 Intel 希望的反方向前進了 XD

atx_btx_big

↑ ATX 與 BTX 主機板的比較,BTX 的排列很特別吧?之後站長會再介紹。

而在 Prescott 產品上市後一段時間,其實 Intel 還作了很多種不同的努力來試圖解決 Prescott 的高溫問題,例如越來越厚,越來越豪華的原廠散熱器、BTX 主機板規格 (基本上是徹底的失敗) 以及後來由 Socket 478 轉往 LGA775 規格 (結果沒想到處理器本體的溫度居然不降反增,最後整體溫度下降的原因則幾乎純粹來自於風扇規格與插槽結構的提升)。

LGA775

↑ LGA775 插槽,觸點在主機板上。

不過 Prescott 引入了不少新特性,這也是相當值得關注的地方,例如 x86-64 的支援 (EM64T)、NX bit (資料執行防止保護技術)、SSE3 指令集與虛擬化技術 (VT-x,僅 600 系列極少數型號支援)。

PRES_CPU

↑ LGA775 封裝的 Pentium 4 正面

同時 Prescott 系列也是第一批產品命名上開始使用「型號」取代「時脈」者,以往的 Intel x86 處理器通常都以 3.40E GHz 這樣的格式命名,不過由於 ABCDE 等後綴實在太難記憶,或許又因為 Intel 想淡化時脈在市場上的意義 (2000 – 2003 年這四年內已經讓不少人養成了選擇時脈高的處理器就對了的習慣),因此創造了三位數的型號命名方法,Prescott 被劃分為 500 系列。

L_LGA775_package

↑ LGA775 封裝的 Pentium 4 背面,不再有針腳,而是 775 個金屬點。

後來 Intel 又在 2005 年推出了 L2 快取增加到 2MB 的 Prescott-2M 核心,劃分為 Pentium 4 600 系列,全系列標配 EM64T、EIST 與 NX bit,但本次加倍的快取並沒有帶來明顯的性能提升,另有一款 3.73 GHz,FSB 266 MHz (1066 MT/s) 的產品被命名為 Pentium 4 Extreme Edition 以 999 美金的價格販售。

prescott2m

↑ Intel Pentium 4 (Prescott-2M) Die shot

而對應 Prescott 的 Xeon 版本則是 Nocona,推出於 2004 年 06 月 02 日,全系列支援 EM64T 並配備 1 MB L2 快取,但當時表現仍比 AMD 的 Opteron 還要差,後來在 2005 年 02 月 14 日 Intel 推出小幅改進的 Irwindale,對比 Nocona 而言主要的差異僅有快取增加到 2 MB 與自動降頻節能技術。

Intel_Xeon_3.0_GHz_Nocona

↑ Intel Xeon (Nocona)

至於 Xeon MP 則是有 Cranford 與 Potomac 兩種,這兩種核心基本上架構上相同,後者則是額外內嵌了 8 MB 的 L3 快取,定位較 Cranford 高。

對應 Prescott 的 Celeron 核心是 Prescott-256,上市時以新的標誌與名稱出現,被命名為 Celeron D,由於快取家被提升到了 256 KB,外頻也被拉高到 133 MHz,因此此代的 Celeron 性能是有提升的。

胎死腹中的 Tejas 與 Jayhawk

原先在 Roadmap 上要接替 Prescott 的產品是 Tejas 這款核心,在 Prescott 開發完成之前就已經開始研發,但由於最後計畫被終止因此並沒有太多詳情。

就目前我們所知道的,Tejas 是比 Prescott 更加極端的設計,具有比 Prescott 更深的管線深度、更大的快取、更快的 FSB (1200 MT/s),同時被 Intel 賦予 7 GHz 時脈的期望,而隨著「大艦巨砲主義」發揮到極致的同時,與 Prescott 相似的缺點也就顯得更加鮮明,時脈幾乎沒有辦法向上提升,甚至有傳言大幅提高的溫度使 Tejas 的樣品在實際測試時極為容易燒毀,幾乎沒辦法使用。

除此之外 Tejas 還據稱包含了第二世代的 Hyper-Threading,原先的一對二設計改為一對四 (一個實體核心具有四個邏輯核心),同時 L1 快取也配合有所增加。不過這項技術從來沒有被證實過,也沒有出現在其他 Intel x86 處理器上。

LGA775 的別名又稱為 Socket T,當初就是為了 Tejas 而設計的。而 Xeon 版本的 Tejas 代號則為 Jayhawk,對應的 LGA771 的別名自然就是 Socket J 了。

U241P2T68D28030F898DT20040220082914

↑ Tejas 散熱器樣品

當時也有廠商作出 Tejas 散熱器的樣品,其模樣十分誇張,幾乎已是玩家用的等級,當時甚至還有 Tejas 可能需要隨附水冷套件的消息出現。

第 4 代產品:Cedar Mill (80552)

  • 發佈時間:2006 年 01 月 05 日
  • 運作時脈:3.0 GHz ~ 3.6 GHz
  • FSB 時脈:133, 200 MHz (QDR 四倍頻寬,533 ~ 800)
  • TDP:86 W、65 W (D0 步進)
  • L1 快取大小:12 KB ETC + 16 KB 資料快取
  • L2 快取大小:2 MB (全速,on-die)
  • 支援插槽:LGA775
  • 電晶體數:1 億 8800 萬枚
  • 製造工藝:65 奈米 (nm)
  • 晶片本體面積:81 mm2
  • 指令集:x86-64 + MMX, SSE, SSE2, SSE3

Cedar Mill 是 Pentium 4 的最後一次改版,某種程度上應該與 Pentium III 的 Tualatin 核心相似,是用於試驗 65 奈米製程的產物。基於這款核心的產品並不多見,基本上與 Prescott-2M 相同,僅為 Prescott-2M 的製程改進版,耗電量與發熱量略有改善,而 2006 下半年推出的 D0 步進則更進一步的壓低 TDP 來到 65 W,但全系列的 Cedar Mill 核心都不支援 VT-d 技術。

DIE_CedarMill

↑ Intel Pentium 4 (Cedar Mill) Die shot

此代比較受到關注的反而是其 Celeron 衍伸型 Cedar Mill-512,由於快取再次加倍因此性能上又比 Prescott-256 來得更好。

近乎瘋狂的嘗試:Pentium D 家族

Pentium D 是 Intel 的第一款消費性雙核心 x86 處理器,同樣基於 Netburst 架構,這意味著什麼呢?第一代的 Pentium D 基本上就是把兩顆 Prescott-1M 放在同一片晶片上的結果。

PENTIUMD

如同我們已經知道的,Prescott 素有噴火龍的稱號,那兩顆放在一起豈不是成了超級噴火龍?此時期 Intel 的雙核心處理器由於是由兩個單核心處理器直接拼湊組合而成,因此被戲稱為假雙核、膠水雙核。

第 1 代產品:Smithfield (80551)

  • 發佈時間:2005 年 05 月 01 日
  • 運作時脈:2.66 GHz ~ 3.2 GHz
  • FSB 時脈:133, 200 MHz (QDR 四倍頻寬,533 ~ 800)
  • TDP:95 W、130 W
  • L1 快取大小:12 KB ETC x2 + 16 KB 資料快取 x2
  • L2 快取大小:1 MB x 2 (全速,on-die)
  • 支援插槽:LGA775
  • 電晶體數:2 億 2800 萬枚
  • 製造工藝:90 奈米 (nm)
  • 晶片本體面積:206 mm2
  • 指令集:x86-64 + MMX, SSE, SSE2, SSE3

Smithfield

↑ 移除 IHS 的 Pentium D (Smithfield),可以看到核心是封裝在一起的

第一代的 Pentium D (Smithfield),型號識別為 800 系列,基本上就是兩枚 Prescott-1M 核心組合而成的產物,但不支援虛擬化技術,其中有一個型號被標示為 Pentium Extreme Edition 推出,為唯一支援 Hyper-Threading 的版本,而其中僅 TDP 為 135 W 的 830 與 840 支援 EIST。

smithfield_die_med

↑ Smithfield Die shot

第 2 代產品:Presler (80553)

  • 發佈時間:2006 年 01 月 16 日
  • 運作時脈:2.8 GHz ~ 3.73 GHz
  • FSB 時脈:200, 266 MHz (QDR 四倍頻寬,800 ~ 1066)
  • TDP:95 W、130 W
  • L1 快取大小:12 KB ETC x2 + 16 KB 資料快取 x2
  • L2 快取大小:2 MB x 2 (全速,on-die)
  • 支援插槽:LGA775
  • 電晶體數:3 億 6200 萬枚
  • 製造工藝:65 奈米 (nm)
  • 晶片本體面積:162 mm2
  • 指令集:x86-64 + MMX, SSE, SSE2, SSE3

3d26b232e5

↑ 移除 IHS 之後的 Presler

第二代的 Pentium D (Presler),型號識別則為 900 系列,基本上就是兩枚 Cedar Mill 核心組合而成的產物,絕大多數型號都支援虛擬化技術,其中有二個型號被標示為 Pentium Extreme Edition 955 與 965 推出,為唯二支援 Hyper-Threading 的版本。

e978ce02ce

值得注意的是,Presler 的兩個核心並沒有像 Smithfield 那樣封裝在一起。

結語

不過處理器產業一直以來就是三十年河東,三十年河西的了,這段期間 Intel 的失敗與 AMD 的輝煌,在現在的今日又完全倒了過來,在近代中期的歷史中就能看到 Intel Core 架構的大反攻與後來 AMD 推土機架構家族的失敗,只能說電子產業真的無時無刻都要戰戰兢兢,可能這些大廠隨便一個小小的錯誤決定就是幾億損失的下場。

電腦達人養成計畫 2-9:中古時代後期 CPU 發展史 (下)」<< PREV

NEXT >>「電腦達人養成計畫 2-11:近代前期 CPU 發展史 (下) AMD K7.5、K8 架構

  • ae

    寫得很棒!
    Celeron那邊可能要修正一下,北木核心的賽楊都是100 / 400 頻率,
    一直到Celeron D噴火龍才提升到133/533喔!

    • Andrew Huang

      已修正,感謝回報! :)