この当時、AMDはK6の正確なレイテンシを公開していない。筆者の手元には、1997年にAMDが公開した「AMD-K6 MMX Enhanced Processor x86 Code Optimization」というソフトウェア開発者向けマニュアルがある。しかしFPUのスループットやレイテンシに関しては、「FP add/sub」と「FP mul」が記載されているのみだ。当時ベンチマークテストをした結果で言えば、K6の浮動小数点演算の性能はおおむね、同一周波数のPentium IIの半分といったところだった。
悪いことに、この当時インテルはPentiumに代えて、より高速に動作する「Pentium II」を導入しており、K6はこれとの戦いを余儀なくされていた。整数演算性能に関してはほぼ互角だったが、インテルはPentium世代から「MMX」を導入しており、SIMD演算によってマルチメディア性能を高めるといった対応もしていたので、AMDはこれへの対処も必要だった。
こうした問題にある程度対応したのが、拡張命令の3DNow!である。FPUは最大80bitの浮動小数点演算をサポートする必要があったが、これを真面目に実装して演算を高速化しようとすると、膨大なトランジスターが必要になる。しかし、当時は32bitの単精度浮動小数点演算ができれば十分であり、これならば必要なトランジスター数はぐっと減る。そこでFPUの改善は最小限として、MMXの機能に32bit FPUを組み合わせた3DNow!を実装することで、性能的にPentium IIはもとより、登場したばかりの「Pentium III」にも対抗することが可能となった。
Athlonまでのつなぎを目指したK6-III
当初はPentium II/IIIを上回る性能を発揮するも……
K6-2までは、別に黒歴史でもなんでもない。問題はその先である。当時のAMDのロードマップでは、次世代の「K7」(Athlon)登場にはまだ少々時間がかかる時期にあった。一方でK6-2のままでは、なんとかPentium II/IIIに伍する性能ではあっても、これに勝るのは無理だ。そこで、K6-2に256KBの2次キャッシュを搭載することで、性能を改善するという案が出てきた。これが「Sharptooth」こと「K6-III」である(関連記事)。
当時のPentiumは、CPU側に512KBの2次キャッシュを搭載していたが、これはCPUの半分の速度で動作する「PBSRAM」を「BSB」(Back Side Bus)に接続するものだった。一方のK6は、マザーボード上に512KB~4MB(マザーボードにより異なる)の2次キャッシュを搭載していたが、こちらはFSBでの接続なので、「メモリーよりは高速」という程度にすぎない。そこで、CPUのダイ上にフルスピードで動く256KBの2次キャッシュを実装すれば、Pentium II/IIIを上回る性能が出せるという目論みであった。
実際AMDがK6-IIIを発表した時の資料では、これをうかがわせる数字が出ていたし、実際に製品が出荷されて筆者が試した結果で言えば、この主張はおおむね正しかった。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ