20コア以上ではメモリー帯域が不足するため
ダイ数が倍になっても性能は倍にはなりにくい
ラインナップはまだわからないが、ローエンドにはおそらく16コアの製品も含まれるだろう。コア数で言えばRyzen Threadripper 1950Xと同等になるが、ダイが4つの分3次キャッシュの容量が倍増するうえ、個々のコアの動作周波数をかなり上げられる計算になるから、明確にRyzen Threadripper 1950Xよりは性能があがると思われる。
ただ20コア以上の製品になると、やや性能バランスが崩れるきらいがある。そもそもZenコアにせよZen+コアにせよ、4コアとDDR4 1chがマッチする計算になっており、16コアまではこのバランスが崩れない。ところが20コア以上では、明らかにメモリー帯域が不足気味になってくるからだ。
AMDはこのことを理解しており、実際に第2世代Ryzen ThreadripperではメモリーやI/O帯域ではなくCPU性能のみが必要とされる処理に最適、という言い方をしている。逆にメモリー帯域やI/O帯域が必要とされる用途には1P EPYCが格安な価格で用意されており、こちらを使えばいいということだそうだ。
ただ、ほとんどのアプリケーションはそれなりにメモリー帯域を必要とするし、特にコアが増えた場合、その傾向は顕著である。下の画像は発表会で示されたインテルのCore i9-7980XEと第2世代Ryzen Threadripperの性能比較である。
確かに第2世代Ryzen Threadripperの方が高速なのは間違いないのだが、24コア vs 18コアにしては性能差がそれほど大きくない。
レンダリングはBlenderを使い、全体を256ブロックに分割してそれぞれ別々のスレッドでレンダリングしているが、仮にどのブロックも同じ処理速度でレンダリングできるとすると(実際には結構バラつく)第2世代Ryzen Threadripperが254ブロックを処理する間にCore i9-7980XEは189ブロックしか処理できていない。
つまり、第2世代Ryzen Threadripperが34%ほど高速な計算になるの だが、ほぼコア数の比になっているのは、(今となっては)CineBenchが それほどメモリーを必要としない(3次キャッシュでカバーできてしまう)面もあるのだろう。
もっともこれはインテルの28コアCore-Xにも言える話であり、その意味ではダイ数が倍になったからといって性能も倍とはなりにくいことだけは理解しておくべきだろう。
7nmプロセスのZen 2は順調
来年には量産開始
ちなみにCOMPUTEXの発表会の最後で、Lisa Su CEOは7nmプロセスを使ったZen 2の動作サンプルがすでにAMDのラボで稼動していることを明らかにした。
これはまだエンジニアリングサンプル以前の段階の、そもそもちゃんと機能が満たされているか、あるいは変な動作をしないかを検証するためのシリコンだが、動作状況について「Very well(大変に良い)」とSu氏は述べており、少なくとも現段階では致命的な問題はないと受け止めていいだろう。
まだGlobalfoiundriesの7nmプロセスは量産の初期段階で、歩留まり云々を語れる段階ではない。とはいえ、今年中のサンプル出荷開始と来年の量産開始が明言されている以上、そう悪い状況ではなさそうだ。
当然このZen2コアはデスクトップ向けにも降りてくると思うが、どのタイミングかは市場の動向次第だろう。Zen2コアは7nmに移行することでコアの数はさらに増えるものの、ダイサイズそのものはある程度減るようだ。
ただ7nmプロセス、特にEUV(極端紫外線)を使わないトリプルパターニングではマスクコストのみならず量産コストも跳ね上がっており、14nm世代の倍以上のコストになるという試算もある。
したがってAMDとしては、まずは単価の高いEPYC向けを優先するのは当然であり、歩留まりとGlobalfoundries側の7nmプロセスの製造能力、それとEPYC向けのニーズを睨みながらデスクトップ向けの投入時期を決めると言うあたりだろう。その意味では、(Ryzen/Ryzen 2が発表された)4月よりやや後ろにずれる可能性もあるだろう。
発表会の動画
※お詫びと訂正:Core i9との比較で。32コア vs 18コアとありましたが、正しくは24コア vs 18コアになります。またレンダリングデモのソフト名にも誤りがありましたので、記事を訂正してお詫びします。(2018年7月24日)
この連載の記事
-
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 -
第757回
PC
「RISC-VはArmに劣る」と主張し猛烈な批判にあうArm RISC-Vプロセッサー遍歴 - この連載の一覧へ