もっとも市場を見てみると、「4プロセッサーでは足りず8プロセッサーが必要」という構成はそれほど多くない。これ以前はOpteron 8xxxシリーズで8プロセッサー構成をサポートしてきたAMDだが、現実問題として8プロセッサー構成になると、1枚のボードで収めるのはきわめて困難だった。そのため、ベースボードの上にCPUが4つ搭載されたライザーカードを2枚装着するとか、4プロセッサーボード2枚を独自規格のコネクターで接続するとか、いろいろと無茶な構成の製品がほとんどだった。
ハイエンド向けの場合、どのみち4プロセッサーどころか8プロセッサーでも足らない。結局大規模クラスターを組むという話になるので、4プロセッサーを無理に8プロセッサーにしてもあまりメリットはない。そうであれば、4プロセッサー構成のままでもほとんどデメリットはない、と判断したようだ。むしろ最大構成を4プロセッサーに留めておき、1プロセッサーあたりの処理能力を引き上げたほうが賢明、というのが、AMDの判断であった。
2010年にプラットフォームをSocket C32とSocket G34の2つに切り替えたOpteronであるが、これの第二世代に当たるのが、11月に発表されたOpteron 6200/4200シリーズである。同じBulldozerベースの「Zambezi」こと「AMD FX」は、シングルスレッド性能の低さとそのわりに高い消費電力で、けちょんけちょんにけなされている。だが、もともとAMDは「K7」以来、サーバー市場を志向して重厚なアーキテクチャーを導入し、これをプロセス微細化や内部構成熟成などで消費電力を下げて、デスクトップあるいはモバイルに持ち込むという戦略で一貫していう。今回もその例に違わない。
異なるのは、これまでサーバーに求められるのは「高いIPC」だったのが、昨今は「高いスループット」に変わってきたことだ。このトレンドに対応すべく積極的にアーキテクチャーを変更した結果として、デスクトップ向けには明らかにそぐわない製品になってしまったのは、致し方ないところか。ただこれは、「そこまでしてでもサーバー市場でのシェアが欲しい」という同社の戦略の裏返しとも言える。つまり問題は、このOpteron 6200/4200でどれだけのシェアをこれから獲得できるかに、かかっていると言えよう。
サーバー向け新プラットフォームは
「C2012」と「G2012」
Opteron 6200/4200の話は後でもう一度触れるとして、今後の話をしよう。AMDのロードマップによれば、2012年には既存のSocket C32/G34に代えて、新しいプラットフォームを導入することになっていた。これは「C2012」「G2012」というもので(実際にはG42/G44になるらしいが、C42の誤字の可能性もある)、この世代では次世代Bulldozerである「Piledriver」をベースに、そのまま実装したものが「Opteron 4300」、MCMによるデュアルダイ構成のものが「Opteron 6300」になるらしい。ただしAMDのことなので、このあたりはまだ大分変わる可能性がある。
まずパッケージだが、どうもこの世代からPCI ExpressのコントローラーをCPU側に搭載するため、パッケージの変更が必要になるようだ。HyperTransport Linkは引き続き、CPU同士の接続用に残されるが、チップセットとの接続は「A-Link III」もしくは「A-Link IV」(PCI Express 3.0をベースとした、8GT/秒のx4レーン構成)を想定しているようだ。PCI ExpressをCPU側に搭載する理由は、短期的にはGPGPU用の「FireStream」のようなGPUを高速に接続するためだ。
もっとも、GPUといってもOpteronで画面出力してもしかたないので、もっぱらGPGPU的な使い方になると思われる。このGPGPUも、実際に導入されるのは早くてもその次の世代になりそうである。長期的にはFusionのコンセプトに従って、CPU側にGPUモジュールを搭載する可能性もあり、これとの絡みになるようだ。
Piledriverコアについては前回でも解説したので割愛する。ちなみにメモリーに関しては、「ダイあたり3チャンネルになる」という話もちらっと耳にしたが、正直疑わしい。確かに今のBulldozerのアーキテクチャーだと、2モジュール/4コアでほぼDDR3を1チャンネル使い切る感じになるので、8コアならほぼ2チャンネルで足りる。
だが、これを5モジュール/10コアに増やすとか、さらにその後GPGPUを追加するとなると、もう1チャンネル追加しても不思議ではない。しかし、3チャンネルというメモリー構成が市場であまり評判がよくなかったのは、インテルのNehalemベースの製品(Bloomfield、Core i7-9x0番台)でも明らかである。またダイあたり3チャンネルにすると、Opteron 6000系の方はメモリーが6チャンネル構成になってしまい、パッケージ的に無理があるのでは? と感じる。
この連載の記事
-
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ - この連載の一覧へ