Xeonに対するアドバンテージは
メモリー帯域
――スループットについてお聞きします。現在インテルのハイエンド製品は、6コアに3DIMMチャンネルの構成ですが、次は8コアに4DIMMチャンネル構成となります(編注:Sandy Bridge-Eのこと。インタビュー時点では出荷前だった)。現時点では4DIMMチャンネルを持つOpteron 6200シリーズは、カタログスペック上若干のアドバンテージがありますが、SandyBridge-Eが出てくるとアドバンテージがなくなるように思います。
フリー「それでも若干のアドバンテージがあると、私は考えている。まずインテルの『Xeon E7』シリーズは、DDR3-1333やDDR3-1600をサポートしていない。またメモリーバッファーを間に挟む関係で、遅延が大きくなる。4プロセッサー構成の場合、帯域はBulldozerが倍になる」
――それはわかりますが、遅延に関して彼らは、巨大な3次キャッシュを搭載することで解決しています。
フリー「そうした大容量3次キャッシュは、メモリーアクセスの(遅延に関する)ペナルティーに対応するためのものだと考えている。確かにメモリー容量は彼らの方が大量だが、そうしたメモリー容量を必要とするユーザーはそう多くない」
――かつてあなたとお話したとき、HPC分野などで使う場合には「コアあたり1GB程度のメモリーあれば十分」という話でした。しかし昨今のHPCの状況を考えると、1GBでは不十分で2~4GBが必要に思うのですが?
フリー「コアあたり4GBというのは、現在でも最も高いワークロードに属する数字だ。確かに平均的に2~4GBが必要とされるが、4GBだとすると16コアで64GBになる。我々はソケットあたり最大384GBまでサポートする。これは現在考えられるどんな高いワークロードにも対応できるメモリー量と考えている」
――なるほど。ところで、なぜBulldozerでは「Exclusive Cache」(排他的キャッシュ)の構造を取らなかったのでしょうか?
フリー「それはキャッシュアクセスの最適化を図ったことに起因する」
――かつてのAMDはダイサイズの制限が厳しく、キャッシュの効率を上げるためにExclusive Cacheの構成をとった。ところがBulldozerの場合、かなり大きなダイなのにExclusive構成にしないのが、非常に興味深いのです。
フリー「Bulldozerはそれでも、前世代(Istanbul)と比較して10%ダイサイズが小さい。Bulldozerは315mm2だが、Istanburは346mm2だった」
――10%の削減はExclusive Cacheを捨てるには十分だった?
フリー「ダイサイズを削減できればそのままコストが減るからね」

この連載の記事
-
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 -
第841回
PC
Gen1で3倍、Gen2で14倍の帯域幅を実現! Celestial AIのPFLinkがネットワークスイッチを劇的に進化させる -
第840回
PC
Avicena Techが最新MicroLED光チップレット技術を公開! 2027年製品化に向けた新たな光インターコネクト戦略 -
第839回
PC
長距離伝送も安心! 1kmを3dBの損失でクリアするPassageの驚異的な光通信性能 - この連載の一覧へ











