Xeonに対するアドバンテージは
メモリー帯域
――スループットについてお聞きします。現在インテルのハイエンド製品は、6コアに3DIMMチャンネルの構成ですが、次は8コアに4DIMMチャンネル構成となります(編注:Sandy Bridge-Eのこと。インタビュー時点では出荷前だった)。現時点では4DIMMチャンネルを持つOpteron 6200シリーズは、カタログスペック上若干のアドバンテージがありますが、SandyBridge-Eが出てくるとアドバンテージがなくなるように思います。
フリー「それでも若干のアドバンテージがあると、私は考えている。まずインテルの『Xeon E7』シリーズは、DDR3-1333やDDR3-1600をサポートしていない。またメモリーバッファーを間に挟む関係で、遅延が大きくなる。4プロセッサー構成の場合、帯域はBulldozerが倍になる」
――それはわかりますが、遅延に関して彼らは、巨大な3次キャッシュを搭載することで解決しています。
フリー「そうした大容量3次キャッシュは、メモリーアクセスの(遅延に関する)ペナルティーに対応するためのものだと考えている。確かにメモリー容量は彼らの方が大量だが、そうしたメモリー容量を必要とするユーザーはそう多くない」
――かつてあなたとお話したとき、HPC分野などで使う場合には「コアあたり1GB程度のメモリーあれば十分」という話でした。しかし昨今のHPCの状況を考えると、1GBでは不十分で2~4GBが必要に思うのですが?
フリー「コアあたり4GBというのは、現在でも最も高いワークロードに属する数字だ。確かに平均的に2~4GBが必要とされるが、4GBだとすると16コアで64GBになる。我々はソケットあたり最大384GBまでサポートする。これは現在考えられるどんな高いワークロードにも対応できるメモリー量と考えている」
――なるほど。ところで、なぜBulldozerでは「Exclusive Cache」(排他的キャッシュ)の構造を取らなかったのでしょうか?
フリー「それはキャッシュアクセスの最適化を図ったことに起因する」
――かつてのAMDはダイサイズの制限が厳しく、キャッシュの効率を上げるためにExclusive Cacheの構成をとった。ところがBulldozerの場合、かなり大きなダイなのにExclusive構成にしないのが、非常に興味深いのです。
フリー「Bulldozerはそれでも、前世代(Istanbul)と比較して10%ダイサイズが小さい。Bulldozerは315mm2だが、Istanburは346mm2だった」
――10%の削減はExclusive Cacheを捨てるには十分だった?
フリー「ダイサイズを削減できればそのままコストが減るからね」
この連載の記事
-
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 - この連載の一覧へ