除了多餘部分浪費的空間之外,GeForce FX 時代 NVIDIA 最大的問題就是錯估的 DirectX 9.0 的規格設定,但如同本篇最前面所談到的,或許是 NVIDIA 與微軟重修舊好了吧?DirectX 9.0c 當中引入的 Shader Model 3.0 將高精度浮點數的標準提升到了 FP32,而 ATI 所支援的 FP24 則被改稱為「部分精度浮點數 (Partial Precision Float Point Number)」,這種下了之後使 NVIDIA 得以再次超越 ATI 而 ATI 在短期之內難以跟上腳步的種子 (儘管 NV35 是雙 Mini FP32 設計,但並沒有辦法執行全部的 FP32 運算,因此在處理 FP32 的時候仍然是處於弱勢的,但進入 DirectX 9.0c 之後 ATI 基於 FP24 設計的晶片原有的優勢也沒了,讓雙方的差距得以拉近許多),或許也是因此才導致 NVIDIA 得以在 ATI 之前推出完全相容 DirectX 9.0c 標準的 GPU 並從 ATI 手中搶回功能王者與性能王者雙寶座吧?
當然僅僅縮短差距是不足以讓 NVIDIA 收復失土的,於是 NVIDIA 在 NV40 使用的 CineFX 3.0 像素管線引擎當中再次針對浮點運算單元進行了大幅度的翻修,直接一口氣在每組管線當中採用了兩組 FP32 浮點運算單元,因此在浮點運算能力方面相比 NV35 來說又有了爆炸性的成長,同時也解決了過去為了挽救高精度運算能力不足而降低到 FP16 模式時的畫質問題。
而回到顯示卡本身呢,儘管 NV40 晶片內包含的電晶體數量因為各種單元的數量大增而增加了將近一倍 (NV40 包含了高達 2.2 億個電晶體,是 NV35 的 1.7 倍) 且製程並沒有提升 (因此面積高出不少),但出人意料的是,NV40 在溫度表現上卻比 NV30 來得好上許多。而新設計的散熱器也可以做到只需要占用單一擴充卡槽的地步,於是 GeForce FX 系列讓人詬病的主要問題幾乎就都被解決了。
然而除了解決 GeForce FX 當中的問題之外,NV40 還引入了不少新的特性,首先要談的是新的超純量 (Super-scalar) 管線架構。在過去幾代 CPU 當中基本上 Pixel Shader 都是採用一組材質處理器搭配一組渲染處理器的方式設計 (上圖),而在 NV40 當中則採用一組材質處理器搭配兩組渲染處理器的設計 (下圖),而兩組渲染處理器可以在同一時間點上處於不同的運算階段進行處理。
如此設計的好處是,在最極端的狀況下可以對每個週期可以對一個像素進行多達 8 個操作,是原來的兩倍之多,再加上兩倍於前作的像素管線數量,NV40 的像素渲染操作幾乎可以比 NV35 快上四倍。
另一項新特性則是 NVIDIA PureVideo 技術,這項技術主要是透過 GPU 協助進行影片解碼與後續處理來提升影片撥放品質,包含了 MPEG-2、VC-1 與 Windows Media Video 9 硬體解碼能力與 Dolby 環繞音效解碼能力、增強影片銳利度與物件邊緣平整化的功能,並且透過 Bad Edit Correction、High-Quality Scaling 技術來提升編輯影片與縮放影片時的畫面品質。
PureVideo 這項技術在後來將會成為 NVIDIA 所有 GPU 的標準配備,並且隨著時代演進而逐步強化。