CPUとしてJaguarを8コア搭載
問題は物理的スペース
最後はCPUコアについて解説しよう。Jaguarは連載180回で触れたとおり、現在のBobcatの後継となるコアである。Jaguarの基本的な特徴はBobcatとほぼ同じで、違いはFPUやSIMDエンジンの強化(256bit AVXのサポートなど)に限られる。
昨年8月に開催されたHot Chips 24で、AMDはこのJaguarのフロアプランも公開しており、コアだけ見れば8コアでも25平方mmと非常に小さく収まっている。
問題は8コアをどうやって構成するかだ。HotChipsの時点で、AMDはJaguarを4コアまでサポートすることを明らかにしているが、8コアとなると2次インターフェースの規模が大きくなりすぎる。
PS4の実際のシーンを考えると、8コアすべてを使ってゲームを制御するというよりは、バックグラウンドやOS向けの処理と、ゲームの処理がそれぞれ別のCPUを占用するようになるし、その間でのデータ交換もそれほど多くないと予測される。そうすると、全体の構成は下図のように考えられる。
Jaguarコアとそれを繋ぐ2次キャッシュを1つのプロセッサーとして考えるのであれば、これを2つ搭載する、と考えるほうが順当だ。もちろん2つのCPUクラスター間の2次キャッシュはキャッシュコヒーレンシー(一貫性)が維持されるはずだが、前述のとおり2つのCPUクラスター間でのデータ移動が最小であれば、それほどオーバーヘッドにならない。
むしろAMDが推進しているHSA(Heterogeneous System Architecture)のような使い方をするのであれば、GPUクラスター側の2次キャッシュとのキャッシュコヒーレンシーの方が大きくなりかねない。なので、CPUクラスターとGPUクラスターの間にキャッシュコヒーレンシーユニットが入り、管理すると考えられる。
また、存在するかどうかがはっきりわからないので図では破線で示したが、3次キャッシュがあるとすれば、やはりこのキャッシュコヒーレンシーユニットにぶら下がる形になるだろう。その下には4つのGDDRコントローラーとFCHのインターフェースが並ぶと思われる。
動作クロック2GHzは可能
ただし3次キャッシュは……
残る疑問は、CPUがどのくらいのスピードで動作するのかと、3次キャッシュがあるか否かである。まず前者に関しては、これを判断するための情報がなにもない。もはや勘しかないのだが、ゲームの話を抜きにしても様々なネットワークサービスやブラウザー類が、Jaguarの上だけで動作することを考えると、それなりの動作速度が必要になる。40nmプロセスのBobcatベースであるBrazos 2.0ですら、CPUコアは1.7GHzまで上がっていたことを考えると、2GHzあたりの動作周波数はそれほどの問題ないと考えられる。
各GPUのスペック | ||||
---|---|---|---|---|
GPU | シェーダ数 | GCN Compute Unit数 | 動作周波数 (MHz) |
単精度演算性能 (TFLOPS) |
Radeon HD 7750 | 512 | 8 | 800 | 0.82 |
Radeon HD 7770 | 640 | 10 | 1000 | 1.28 |
Radeon HD 7850 | 1024 | 16 | 860 | 1.76 |
Radeon HD 7870 | 1280 | 20 | 1000 | 2.56 |
Radeon HD 7950 | 1792 | 28 | 800 | 2.87 |
Radeon HD 7970 | 2048 | 32 | 925 | 3.79 |
Radeon HD 7750 | 512 | 8 | 800 | 0.82 |
もう1つの問題が3次キャッシュの有無で、これは性能とダイサイズのトレードオフである。全体の中で一番大きいサイズなのはGPUクラスターで間違いない。Radeon HD 7870は表にもあるとおり20のGCN Compute Unit構成で、212平方mmのダイサイズである。PS4ではこれが18に減ったが、だからといってダイサイズが1割減るわけもないので、おそらく200平方mm程度というところだろう。
Jaguarのコアは前述のとおり3.1平方mmだが、これには2次キャッシュや2次インターフェースを含まないので、4つのJaguarコアと2MBの2次キャッシュ(この数字は今年のISSCCで発表された)、それに2次インターフェースを合わせたサイズはおおむね30平方mmだろう。これが2つで60平方mm、それにGDDRインターフェースやキャッシュコヒーレンシーユニットを追加したラフなダイサイズは、280~290平方mmとなる。
この290平方mmという数字は、かなり微妙である。そろそろ冗長性を考えないとまずいサイズだからだ。PS3で採用したCell Broadband Engineが、当初90nmで製造されていた時のダイサイズが235平方mmで、歩留まりを上げるために8つあるSPE(Synergistic Processor Element)の1つを無効にしていたことを考えると、290平方mmのダイサイズも同様の配慮が必要になる。
Radeon HD 7870の場合、下位にRadeon HD 7850があったため、最大4つのGCN Compute Unitを無効にして出荷できるという逃げ方があったが、今回はそういう逃げ道がない。となれば、Radeon HD 7870と同じく20個のGCN Compute Unitにして、うち2つを無効化するといった形で歩留まりを上げるくふうが必要になろうし、そうするとダイサイズはおおむねね300平方mmに達する。
話を3次キャッシュの有無に戻そう。3次キャッシュなしでもすでに300平方mmに達している状況で、さらにダイサイズを増やす余地があるかといえば、おそらくない。性能を改善するという観点では3次キャッシュを搭載するほうがメリットはあるだろうが、現実問題としてその余地はなさそうだ。
この連載の記事
-
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 - この連載の一覧へ