自社製K6に見切りを付けてNexGenを買収
前回の最後で触れたように、AMDは1996年に「AMD K5」を投入した。しかし、K5の性能があまり伸びないことは早くからわかっていたが、さりとてその次の「K6」も、開発が難航していた。
そこでAMDは、「Nx586」をリリースして市場の評判もよく、後継製品の「Nx686」を開発中だった米NexGen社を1996年に買収。自社で開発中だったK6を捨てて、Nx686をベースとした製品を改めて「AMD-K6」として発売することにした。
前モデルのNx586は、同一周波数のPentiumを上回る性能を叩き出しており、「Nx686は、ほぼPentium Proに比肩しうる性能を発揮する」と言われていた。Nx686の最初のサンプルは1995年にリリースされており、1996年中旬に出荷を予定していた。ただし、独自パッケージと独自インターフェースを採用していたため、既存のSocket 7との互換性はなかった。K6ではこれらを変更するとともに、キャッシュ周りを若干変更したり※1、と細かいところで手を入れている。
※1 Nx686は命令16KB/データ32KBの1次キャッシュを搭載し、さらに外部2次キャッシュ用コントローラーを内蔵していた。K6は1次キャッシュを命令/データともに32KBとして、さらに合計20KBのプリデコード用キャッシュを搭載した。その代わり、外部2次キャッシュはチップセット任せとなり、コントローラーも省かれた。
K6では製造プロセスも、IBMの0.35μm CMOSからAMDの0.35μm CMOSに変更されている。こうした作業をほぼ1年程度で無事こなし、1997年4月にまず最初のAMD-K6がリリースされた。翌年には、プロセスを0.25μmに微細化した「Little Foot」ベースのAMD-K6が登場。さらに同年3月には、「AMD-K6-2」がリリースされる。
K6は整数演算性能はインテルのP6(Pentium Pro)に比肩しうるものだったが、浮動小数点演算性能はお話にならなかった。これはそもそもNexGenの設計がそうだったからだ。Nx586では浮動小数点演算機能(FPU)をCPUコアに収めきれず、オプションとして別チップの形で「Nx587 FPU」を提供していた。
Nx686ではついにワンチップ化したが、FPUはパイプライン化されておらず、性能はかなり低かった。当時はそれほど浮動小数点演算性能が求められておらず、FPUをフルパイプライン化するとダイサイズがさらに大きくなるため、妥協した形だ。
しかし、マルチメディア演算性能が求められるようになってくると、流石にK6のままでは辛くなってくる。またインテルの「KNI」(のちのSSE)の噂も出てくるようになると、ますます対抗策が必要になってくる。こうした状況に対するAMDの回答が、「3DNow!」を搭載したAMD-K6-2である(関連記事)。
AMD-K6-2では、MMXユニットを拡張するかたちで単精度浮動小数点演算をサポートし、あまり大きくコアに手を入れずに、少なくとも1998年時点で必要十分なマルチメディア関連処理能力を得ることに成功する。これはAMD-K6とAMD-K6-2のトランジスター数を比較すれば明白である(K6は880万個に対して、K6-2は930万個)。
その後、K6-2は0.25μmプロセスのままステッピングを変更し、550MHzまで動作周波数を引き上げることに成功する。AMDとしてはこのあたりで、次の「K7」に製品の軸足を移したいところだったが、さまざまな要因でもうしばらくK6の製品ラインを維持しなければならなかった。とはいえ、インテルはすでにPentium IIIを投入して、順調に性能を上げてきている。
そこでAMD-K6-2にオンチップで256KBの2次キャッシュを搭載したのが、1999年2月に発表された「AMD-K6-III」である。ただ同社にとってこれは、大きなチャレンジとなった。トランジスタ数は2130万個に、ダイサイズは118mm2(K6-2は81mm2)にそれぞれ増えたが、これだけのサイズのダイとなると、まだAMDのプロセスでは歩留まりがかなり低い状況だった。
また、2次キャッシュへのアクセスレイテンシーをかなり低く抑えた設計をしたが、逆にこれがネックになって動作周波数がさっぱり上がらないという問題も出てきた。その後、モバイル向けにプロセスを0.18μm CMOSに微細化した「Mobile AMD-K6-III」では、多少動作周波数は向上した。また、SRAMに欠陥があってもチップ自体は救えるように、2次キャッシュを半分無効化した「Mobile AMD-K6-2+」をラインナップすることで(組み込み向けにもAMD-K6-2+が用意された)、多少歩留まりの改善はできた。
それでもK6-2に比べると、K6-IIIは最後までいろいろと苦労が多い製品であった。もっともその苦労は無駄ではなかったようで、続くK7系は比較的順調に推移することになる。
この連載の記事
-
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ