このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第192回

中身はAMD製 スペックから紐解くPS4のプロセッサー性能

2013年03月04日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷

CPUとしてJaguarを8コア搭載
問題は物理的スペース

 最後はCPUコアについて解説しよう。Jaguarは連載180回で触れたとおり、現在のBobcatの後継となるコアである。Jaguarの基本的な特徴はBobcatとほぼ同じで、違いはFPUやSIMDエンジンの強化(256bit AVXのサポートなど)に限られる。

Jaguarの内部構造。JaguarとBobcatの違いは、整数演算周りでは若干の命令の最適化、Write Bufferの性能改善、より高速動作を行なうためのパイプラインの改修程度の差でしかない

 昨年8月に開催されたHot Chips 24で、AMDはこのJaguarのフロアプランも公開しており、コアだけ見れば8コアでも25平方mmと非常に小さく収まっている。

左がBobcat、右がJaguarのフロアプラン。Jaguarのコアは、コアと1次キャッシュの合計(2次キャッシュは含まない)で3.1平方mmに過ぎない

Jaguarのコアの詳細。右上が1次命令キャッシュ(L1 Instruction Cache)、左下が1次データキャッシュ(L1 Data Cache)になる

 問題は8コアをどうやって構成するかだ。HotChipsの時点で、AMDはJaguarを4コアまでサポートすることを明らかにしているが、8コアとなると2次インターフェースの規模が大きくなりすぎる。

4コアに対応したSCU(System Control Unit)に2次キャッシュも搭載される。このSCU+CPUコアで、1つのプロセッサーとなる

 PS4の実際のシーンを考えると、8コアすべてを使ってゲームを制御するというよりは、バックグラウンドやOS向けの処理と、ゲームの処理がそれぞれ別のCPUを占用するようになるし、その間でのデータ交換もそれほど多くないと予測される。そうすると、全体の構成は下図のように考えられる。

PS4の構成図

 Jaguarコアとそれを繋ぐ2次キャッシュを1つのプロセッサーとして考えるのであれば、これを2つ搭載する、と考えるほうが順当だ。もちろん2つのCPUクラスター間の2次キャッシュはキャッシュコヒーレンシー(一貫性)が維持されるはずだが、前述のとおり2つのCPUクラスター間でのデータ移動が最小であれば、それほどオーバーヘッドにならない。

 むしろAMDが推進しているHSA(Heterogeneous System Architecture)のような使い方をするのであれば、GPUクラスター側の2次キャッシュとのキャッシュコヒーレンシーの方が大きくなりかねない。なので、CPUクラスターとGPUクラスターの間にキャッシュコヒーレンシーユニットが入り、管理すると考えられる。

 また、存在するかどうかがはっきりわからないので図では破線で示したが、3次キャッシュがあるとすれば、やはりこのキャッシュコヒーレンシーユニットにぶら下がる形になるだろう。その下には4つのGDDRコントローラーとFCHのインターフェースが並ぶと思われる。

動作クロック2GHzは可能
ただし3次キャッシュは……

 残る疑問は、CPUがどのくらいのスピードで動作するのかと、3次キャッシュがあるか否かである。まず前者に関しては、これを判断するための情報がなにもない。もはや勘しかないのだが、ゲームの話を抜きにしても様々なネットワークサービスやブラウザー類が、Jaguarの上だけで動作することを考えると、それなりの動作速度が必要になる。40nmプロセスのBobcatベースであるBrazos 2.0ですら、CPUコアは1.7GHzまで上がっていたことを考えると、2GHzあたりの動作周波数はそれほどの問題ないと考えられる。

各GPUのスペック
GPU シェーダ数 GCN Compute Unit数 動作周波数
(MHz)
単精度演算性能
(TFLOPS)
Radeon HD 7750 512 8 800 0.82
Radeon HD 7770 640 10 1000 1.28
Radeon HD 7850 1024 16 860 1.76
Radeon HD 7870 1280 20 1000 2.56
Radeon HD 7950 1792 28 800 2.87
Radeon HD 7970 2048 32 925 3.79
Radeon HD 7750 512 8 800 0.82

 もう1つの問題が3次キャッシュの有無で、これは性能とダイサイズのトレードオフである。全体の中で一番大きいサイズなのはGPUクラスターで間違いない。Radeon HD 7870は表にもあるとおり20のGCN Compute Unit構成で、212平方mmのダイサイズである。PS4ではこれが18に減ったが、だからといってダイサイズが1割減るわけもないので、おそらく200平方mm程度というところだろう。

 Jaguarのコアは前述のとおり3.1平方mmだが、これには2次キャッシュや2次インターフェースを含まないので、4つのJaguarコアと2MBの2次キャッシュ(この数字は今年のISSCCで発表された)、それに2次インターフェースを合わせたサイズはおおむね30平方mmだろう。これが2つで60平方mm、それにGDDRインターフェースやキャッシュコヒーレンシーユニットを追加したラフなダイサイズは、280~290平方mmとなる。

 この290平方mmという数字は、かなり微妙である。そろそろ冗長性を考えないとまずいサイズだからだ。PS3で採用したCell Broadband Engineが、当初90nmで製造されていた時のダイサイズが235平方mmで、歩留まりを上げるために8つあるSPE(Synergistic Processor Element)の1つを無効にしていたことを考えると、290平方mmのダイサイズも同様の配慮が必要になる。

初期型のPS3に搭載されていた、プロセスルール90nmのCell Broadband Engine

 Radeon HD 7870の場合、下位にRadeon HD 7850があったため、最大4つのGCN Compute Unitを無効にして出荷できるという逃げ方があったが、今回はそういう逃げ道がない。となれば、Radeon HD 7870と同じく20個のGCN Compute Unitにして、うち2つを無効化するといった形で歩留まりを上げるくふうが必要になろうし、そうするとダイサイズはおおむねね300平方mmに達する。

 話を3次キャッシュの有無に戻そう。3次キャッシュなしでもすでに300平方mmに達している状況で、さらにダイサイズを増やす余地があるかといえば、おそらくない。性能を改善するという観点では3次キャッシュを搭載するほうがメリットはあるだろうが、現実問題としてその余地はなさそうだ。

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン