この当時、AMDはK6の正確なレイテンシを公開していない。筆者の手元には、1997年にAMDが公開した「AMD-K6 MMX Enhanced Processor x86 Code Optimization」というソフトウェア開発者向けマニュアルがある。しかしFPUのスループットやレイテンシに関しては、「FP add/sub」と「FP mul」が記載されているのみだ。当時ベンチマークテストをした結果で言えば、K6の浮動小数点演算の性能はおおむね、同一周波数のPentium IIの半分といったところだった。
悪いことに、この当時インテルはPentiumに代えて、より高速に動作する「Pentium II」を導入しており、K6はこれとの戦いを余儀なくされていた。整数演算性能に関してはほぼ互角だったが、インテルはPentium世代から「MMX」を導入しており、SIMD演算によってマルチメディア性能を高めるといった対応もしていたので、AMDはこれへの対処も必要だった。
こうした問題にある程度対応したのが、拡張命令の3DNow!である。FPUは最大80bitの浮動小数点演算をサポートする必要があったが、これを真面目に実装して演算を高速化しようとすると、膨大なトランジスターが必要になる。しかし、当時は32bitの単精度浮動小数点演算ができれば十分であり、これならば必要なトランジスター数はぐっと減る。そこでFPUの改善は最小限として、MMXの機能に32bit FPUを組み合わせた3DNow!を実装することで、性能的にPentium IIはもとより、登場したばかりの「Pentium III」にも対抗することが可能となった。
Athlonまでのつなぎを目指したK6-III
当初はPentium II/IIIを上回る性能を発揮するも……
K6-2までは、別に黒歴史でもなんでもない。問題はその先である。当時のAMDのロードマップでは、次世代の「K7」(Athlon)登場にはまだ少々時間がかかる時期にあった。一方でK6-2のままでは、なんとかPentium II/IIIに伍する性能ではあっても、これに勝るのは無理だ。そこで、K6-2に256KBの2次キャッシュを搭載することで、性能を改善するという案が出てきた。これが「Sharptooth」こと「K6-III」である(関連記事)。
当時のPentiumは、CPU側に512KBの2次キャッシュを搭載していたが、これはCPUの半分の速度で動作する「PBSRAM」を「BSB」(Back Side Bus)に接続するものだった。一方のK6は、マザーボード上に512KB~4MB(マザーボードにより異なる)の2次キャッシュを搭載していたが、こちらはFSBでの接続なので、「メモリーよりは高速」という程度にすぎない。そこで、CPUのダイ上にフルスピードで動く256KBの2次キャッシュを実装すれば、Pentium II/IIIを上回る性能が出せるという目論みであった。
実際AMDがK6-IIIを発表した時の資料では、これをうかがわせる数字が出ていたし、実際に製品が出荷されて筆者が試した結果で言えば、この主張はおおむね正しかった。
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ