このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第199回

IDFで判明したHaswellのグラフィック性能とオーバークロック

2013年04月22日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷

Haswellのグラフィック性能を考察

 そのHaswellだが、内部アーキテクチャーを説明するセッションの内容は、おおむね昨年秋のIDFで公開されたものとほぼ同じであり、内容はすでに紹介した連載169回連載170回以上の新しい情報はなかった。ただ、GT3のグラフィックに関してのみ、新しい情報が出てきたので説明しよう。

 Haswellは、GPUの構成が3種類あり、それぞれGT1/GT2/GT3と呼ばれている。それぞれの違いは以前連載188回で紹介した通りで、GT1がローエンド、GT3がハイエンドとなるが、このGT3にはeDRAMを搭載するものがあることが明らかにされた。

HaswellのGPU構成。この資料を見る限り「すべてのGT3にeDRAMが搭載される」のではなく、「GT3のいくつかの製品にはeDRAMが搭載される」と判断すべきだろう

 下の画像がGT1/GT2におけるHaswellの構成であるが、GT3では新たにインターフェースが1つ追加になり、さらにeDRAMが別に搭載されることがわかる。情報はこれだけだが、ここからある程度構成を推察できる。

Sandy Bridge以降のCore iシリーズに共通する構成。各々のコアにそれぞれLLCが割り当てられ、これらとSystem Agent、GPUをRing Busで繋ぐ仕組みだ

 まずeDRAMと呼ばれるものの正体だが、これは本来の意味でのeDRAM(Embedded DRAM)ではなく、マルチチップモジュールの形で別チップで搭載されるDRAMと思われる。GDDR5あたりの特注品が搭載されるであろう。本来eDRAMと呼ばれる製品は、既存のCMOSプロセスにDRAMセルを作りこむというもので、国内だと東芝や旧NEC、海外だとIBMなどが得意としていたものである。

 現在も、TSMC(Taiwan Semiconductor Manufacturing Company)などではこのeDRAMを一部のプロセスで提供している。この方式の場合、CPUなどのロジック回路とDRAMが同一のダイで構成され、レイテンシーも少なく便利な反面、eDRAMに結構なダイサイズを食われ、eDRAMがネックになって速度が上げられないなどの欠点もある。

 最大の問題は、DRAM構造がネックになってプロセスの微細化が難しいというもので、少なくとも40nm未満のプロセスでこれを実現した例はない。これはインテルの22nmプロセスでも同様である。したがって、通常のDRAMを別チップの形で接続するほうがリーズナブルだ。特にGT3にeDRAMを持つバージョンと持たないバージョンがあるとすれば、別チップにするほうが製品の作り分けが簡単になるだろう。

 これが通常のDDR3やGDDR5かというと、おそらく違うであろう。理由は2つあり、メモリバス幅はDDR3で最大16bit、GDDR5でも最大32bitでしかなく、これで速度を上げてもそれほど帯域は広くない。できれば64~128bit幅がほしいところだが、そんな標準品は存在しない。だからといって、複数個のDRAMチップを搭載できるほどパッケージは大きくない。

 DDR3にしてもGDDR5にしても、基板上で2~4インチの配線を引き回し、それなりの出力を持つ駆動回路を前提にしているが、マルチチップモジュール方式だと配線は1インチにも満たない。そのため、もっと駆動力を小さくして、その分省電力化を図りたいが、これもまた標準品は存在しない。また、容量は数GBも必要なく、せいぜい128MBあれば十分だから、これもまた標準品では選択しにくい。

 eDRAMの構成はともかく、おもしろいのはこのeDRAMがGPU向けのローカルフレームバッファだけでなく、CPUのキャッシュとしても動作することだ。下の画像をみると、DDRコントローラーと書かれたオレンジの部分が、ベージュ色の部分にも接触しているのがわかる。

Haswellの構成図。ベージュの部分は、Ring BusのI/FとGPUへのI/F、それにeDRAMのI/Fを持つものになると思われる

 この画像を元に、いくつか省略されている部分を筆者の推定で追加したのが下図だ。

筆者が予想するHaswellの構成図

 おそらくメモリーコントローラーはSystem Agentのみならず、Graphics/eDRAMインターフェースにも接続する構造になっているほか、ここからディスプレーへの出力パスも存在していると思われる。もちろんこれはeDRAMがフレームバッファ兼オフチップキャッシュとしても動作するという前提での想定であるが、大きくは外していないはずだ。

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン