このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第220回

IvyBridge-EPはどのようにして性能を約30%向上させたのか?

2013年09月16日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷

 9月3日のIvyBridge-Eこと「Core i7-4960X」に加え、11日(米国時間)にはXeon向けのIvyBridge-EPが公式に発表になった。そこで今回はIvyBridge-EPについて解説したい。

IvyBridge-EPを搭載したXeon E5-2600 V2シリーズ

10コア製品のダイ写真

3種類ものダイが存在する
IvyBridge-EP

 今回発表された製品は4コアから12コアまでラインナップが広く展開されている。ラインナップ詳細はこちらを見ていただくのが早いが、さすがにこれだけあると、ダイの種類もSandyBridge-Eのように1種類だけだとやや効率が悪い。そこでIvyBridge-EPではコアの種類を3つ用意した。

4コアは6コア製品から2コア無効化、8コア製品は10コア製品から2コア無効化という形で作ることになる

 やはり12コアともなると、6コア/12コアと同じリングバス構成ではややレイテンシーが長くなると判断されたのだろう。ここでわかりにくいのが12コアにおけるLLC(3次キャッシュ)の構成であるが、下図のようになっているそうだ。

IvyBridge-EPの12コアにおけるLLCの構成

 中央の4つのコアは、それぞれ左右に振り分ける形でLLCを搭載している。「Core i7-4960X」を初めとするIvyBridge-Eコア製品は、この6コアのものをそのまま流用する。

SandyBridge-EPとの違いは
DDR3-1866対応かどうか

 プラットフォームそのものは、既存のLGA 2011がそのまま利用される。基本的にはマザーボードのBIOSアップデートだけを行なえばそのまま利用できることになっており、実際IvyBridge-Eベースの「Core i7-4960X」では、既存のX79マザーボードのBIOS アップデートだけでOKとなっている。

チップセットは既存のX79/C600、つまりPatsbnurgがそのまま利用される

 もともとSandyBridge→IvyBridgeそのものがインフラをそのまま使えており、これがSandyBridge-EP→IvyBridge-EPでも継承されたということだ。

 唯一の違いは、従来のSandyBridge-EPでは公式にはDDR3-1600までの対応だったのが、IvyBridge-EPではDDR3-1866に対応したことだろう。メモリーチャネルあたり3DIMMまでというのは最大値であり、DDR3-1866では1枚か2枚に制限されることになるだろう。

 CPUコアそのものはデスクトップ向けのIvyBridgeとまったく同じであり、いくつかの命令拡張などはあるものの、基本的には従来のSandyBridge-Eと変わらない。したがって相違点としては、22nmプロセスによる省電力化と、これによる動作周波数の向上、あとはUncore部分の変更ということになる。

いろいろ相違点が記されているが、これは前世代のSandyBridgeとの差であり、デスクトップ向けのIvyBridgeとの相違点ではない

 まずそのUncore部の1つ目が下の画像だ。12コア製品で3列構成となったほか、DDR3-1866のサポート、それにキャッシュのスヌーピング(キャッシュ間の一貫性を保つ仕組み)の改善が挙げられる。

3列コアの話は、もちろんハイエンドの12コア製品のみ

 このキャッシュのスヌーピング、従来1bitは「変更された/されない」のみで管理していたのを、2bitに拡張してより柔軟な管理ができるようにした。

 またPCI Expressに関しても、PCI Express経由での接続帯域を増やしたり、Xeon Phiを接続する際に帯域拡張/レイテンシー削減を実現した。

PCI Express経由での接続帯域を増やした。サーバー向けということもあり、PCI Expressデバイスのホットスワップもサポートされた

Xeon Phiを接続する際に帯域拡張とレイテンシー削減を行なう。ちなみに対象となるのはXeon Phiのみで、ほかのGPU/GPGPUカードではサポートされない模様

 この帯域拡張/レイテンシ削減はどうやって実現したかというと、動作速度の向上である。PCI Express Gen3の場合、信号速度は8GT/秒となっているが、IvyBridge-EPにXeon Phiを接続する構成に限って、信号速度をこれより高める(どのくらい高めるのかは説明がなかった)ことで性能を改善するというものだ。インテルによれば、これによって今年6月のTOP500で1位の成績を実現できた(関連記事)としている。

これは中国National University of Defense TechnologyのTianhe-2(天河2号)での結果

 メモリーコントローラー周りでは、DDR3-1866のサポートによって性能と、レイテンシーの両面で改善があったとするほか、レイテンシーに関してはいくつかの改善策が取られていることも示された。

同じDDR3-1600を使ったケースでも、IvyBridge-EPはSandyBridge-EPより若干性能改善が見られる

スヌープを改善したほか、Turbo Modeの動作時にQPIの低消費電力モードを中止することでレイテンシーを削減する仕組みが新たに追加された模様

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン