自社製K6に見切りを付けてNexGenを買収
前回の最後で触れたように、AMDは1996年に「AMD K5」を投入した。しかし、K5の性能があまり伸びないことは早くからわかっていたが、さりとてその次の「K6」も、開発が難航していた。
そこでAMDは、「Nx586」をリリースして市場の評判もよく、後継製品の「Nx686」を開発中だった米NexGen社を1996年に買収。自社で開発中だったK6を捨てて、Nx686をベースとした製品を改めて「AMD-K6」として発売することにした。
前モデルのNx586は、同一周波数のPentiumを上回る性能を叩き出しており、「Nx686は、ほぼPentium Proに比肩しうる性能を発揮する」と言われていた。Nx686の最初のサンプルは1995年にリリースされており、1996年中旬に出荷を予定していた。ただし、独自パッケージと独自インターフェースを採用していたため、既存のSocket 7との互換性はなかった。K6ではこれらを変更するとともに、キャッシュ周りを若干変更したり※1、と細かいところで手を入れている。
※1 Nx686は命令16KB/データ32KBの1次キャッシュを搭載し、さらに外部2次キャッシュ用コントローラーを内蔵していた。K6は1次キャッシュを命令/データともに32KBとして、さらに合計20KBのプリデコード用キャッシュを搭載した。その代わり、外部2次キャッシュはチップセット任せとなり、コントローラーも省かれた。
K6では製造プロセスも、IBMの0.35μm CMOSからAMDの0.35μm CMOSに変更されている。こうした作業をほぼ1年程度で無事こなし、1997年4月にまず最初のAMD-K6がリリースされた。翌年には、プロセスを0.25μmに微細化した「Little Foot」ベースのAMD-K6が登場。さらに同年3月には、「AMD-K6-2」がリリースされる。
K6は整数演算性能はインテルのP6(Pentium Pro)に比肩しうるものだったが、浮動小数点演算性能はお話にならなかった。これはそもそもNexGenの設計がそうだったからだ。Nx586では浮動小数点演算機能(FPU)をCPUコアに収めきれず、オプションとして別チップの形で「Nx587 FPU」を提供していた。
Nx686ではついにワンチップ化したが、FPUはパイプライン化されておらず、性能はかなり低かった。当時はそれほど浮動小数点演算性能が求められておらず、FPUをフルパイプライン化するとダイサイズがさらに大きくなるため、妥協した形だ。
しかし、マルチメディア演算性能が求められるようになってくると、流石にK6のままでは辛くなってくる。またインテルの「KNI」(のちのSSE)の噂も出てくるようになると、ますます対抗策が必要になってくる。こうした状況に対するAMDの回答が、「3DNow!」を搭載したAMD-K6-2である(関連記事)。
AMD-K6-2では、MMXユニットを拡張するかたちで単精度浮動小数点演算をサポートし、あまり大きくコアに手を入れずに、少なくとも1998年時点で必要十分なマルチメディア関連処理能力を得ることに成功する。これはAMD-K6とAMD-K6-2のトランジスター数を比較すれば明白である(K6は880万個に対して、K6-2は930万個)。
その後、K6-2は0.25μmプロセスのままステッピングを変更し、550MHzまで動作周波数を引き上げることに成功する。AMDとしてはこのあたりで、次の「K7」に製品の軸足を移したいところだったが、さまざまな要因でもうしばらくK6の製品ラインを維持しなければならなかった。とはいえ、インテルはすでにPentium IIIを投入して、順調に性能を上げてきている。
そこでAMD-K6-2にオンチップで256KBの2次キャッシュを搭載したのが、1999年2月に発表された「AMD-K6-III」である。ただ同社にとってこれは、大きなチャレンジとなった。トランジスタ数は2130万個に、ダイサイズは118mm2(K6-2は81mm2)にそれぞれ増えたが、これだけのサイズのダイとなると、まだAMDのプロセスでは歩留まりがかなり低い状況だった。
また、2次キャッシュへのアクセスレイテンシーをかなり低く抑えた設計をしたが、逆にこれがネックになって動作周波数がさっぱり上がらないという問題も出てきた。その後、モバイル向けにプロセスを0.18μm CMOSに微細化した「Mobile AMD-K6-III」では、多少動作周波数は向上した。また、SRAMに欠陥があってもチップ自体は救えるように、2次キャッシュを半分無効化した「Mobile AMD-K6-2+」をラインナップすることで(組み込み向けにもAMD-K6-2+が用意された)、多少歩留まりの改善はできた。
それでもK6-2に比べると、K6-IIIは最後までいろいろと苦労が多い製品であった。もっともその苦労は無駄ではなかったようで、続くK7系は比較的順調に推移することになる。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ