デスクトップ向けIce Lakeの出荷は絶望的 インテル CPUロードマップ

文●大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

2019年06月10日 12時00分

先週に続き、COMPUTEXで判明した話ということで、今週はインテルである。中山智氏のレポート」で概略はご存知のとおりだと思うので、この記事はIce Lakeと10nmに話を絞り「インテルが語らなかったこと」を紹介したい。

Ice LakeはWhiskey Lakeの
2~2.5倍の性能

Ice LakeはTDP 9WのY SKUと15WのU SKUがまずは出荷される。このあたり、基調講演やニュースリリースでははっきりと書かれていないのだが、Product BriefによればIce Lake-Y / Ice Lake-U Iris Plus / Ice Lake-U UHDの3つのSKUがあり、下表の構成になっているようだ。

Ice Lakeの構成
  Ice Lake-Y Ice Lake-U Iris Plus Ice Lake-U UHD
ベースクロック 不明
最大ターボクロック 不明 不明(おそらく4.1GHz)
コア数 最大4
ハイパースレッディング 可能
3次キャッシュ 最大8MB
対応メモリー DDR4-3200もしくはLPDDR4/x-3733×2
GPU EU数 最大64 48/64 32
GPUクロック 最大1.1GHz
TDP 9W 15W 15W
cTDP(最小) N/A 12W 13W
cTDP(最大) 12W 25W 25W

ちなみに実際のモデルナンバーはいまだに未公開で、ark.intel.comで検索しても、「そんな製品はない」と言われてしまうが、なにしろ基本SoCなのでBGAでの実装で、リテールマーケットに流しようがない。したがって、OEMメーカーにだけスペックが伝わっていれば十分なのかもしれない。

U/Y SKUともにパッケージはこれになる模様。Iris PlusでもたとえばeDRAMを搭載したりはしないと思われる。消費電力枠で考えても、HBM2は無理にしてもeDRAMは不可能ではないが、今のところこれを裏付ける情報はない

ちなみにCOMPUTEXの発表記事にあるように、DellのXPSシリーズにはCore i3-1005 G1/i5-1035 G1/i7-1065 G7といったプロセッサーが搭載されるそうで、思うにこれはIce Lake-U Iris Plusがベースの製品で、G7が64EU(Execution unit:実行ユニット)、G1が48EUだと思うが、確証はない。

さて、問題は性能である。なにしろ基調講演でもニュースリリースでも、AI処理性能とGPU性能しか話をしない。基本的な構成としては、Ice LakeではSunnyCoveアーキテクチャーを採用しており、キャッシュの大容量化に加えて内部バッファもいろいろ手が入っているのがわかる。新しいところでは、Intel Dynamic Tuning 2.0が搭載されたことが明らかになっている。

次世代アーキテクチャーSunnyCoveの概要。詳細は連載506回で説明している

こちらはSunnyCoveに関する新情報。キャッシュの大容量化に加えて内部バッファも手が加えられている。そういえば、上の画像でもμOp Cacheからの帯域が6μOp/Cycleというのは初公開のはずだ

Intel Dynamic Tuning 2.0を搭載する。機械学習を利用して、より長時間高い動作周波数を維持できるようにする仕組みだ。ただこの機械学習が、単に学習済みのモデルを利用するだけなのか(多分こちら)、プロセッサーの稼働状況から随時学習しながら精度を高めていくのか(多分無理)ははっきりしない

こうした新アーキテクチャにより、AIXpertを利用したベンチマークで、Whiskey Lake比で2~2.5倍の性能比になっている、という話は別に珍しくはない。

AIXprtはWebXprtやMobileXprtをリリースしているPrincipled Technologiesが提供する新しいベンチマーク。MobileNet-V1とResNet-50の結果を比較したもので、データ型はInt8である

そもそもIce Lakeの世代ではAVX512ユニットが拡張され、VNNI(Vector Neural Network Instructions)が追加サポートされている。

VNNIはもともとはKnights Millに搭載された機械学習向けの拡張命令で、その後Cascade Lakeにも搭載されたもので、Cascade Lake-SPの場合はResNet-50をInt 8で使った場合Skylake-SP比で約2倍の処理性能になるとされていた。今回も同じ話であるが、伸び幅が2倍ではなく2.5倍なのは次に説明するメモリー帯域がより広いことが影響していると考えられる。

Ice Lakeのグラフィック性能は
Whiskey Lakeの最大2倍

次がグラフィック性能であるが、こちらは以前説明したとおり、EUを64基に強化している。これによりWhiskey Lake比で最大2倍のグラフィック性能というもので、実際Ice Lake-UとCore i7-8565Uを比較してのゲームのフレームレートは1.4~1.8倍に向上しているとする。

おそらくはIce Lake-U Iris Plusの64EUモデルでの結果と思われる

それどころか、基調講演でこそ出てこなかったものの、このIceLake-UをcTDPを利用して25W駆動させた上でRyzen 7 3700Uと比較すると、若干ではあるがIceLake-Uの方が性能が上回るというグラフも示された。

このグラフの問題は、計測環境がはっきりしないことだ

冷静に考えると、IceLake-Uは64EUで最大1.1GHz駆動なので、FP32では1024Flops/cycleで1.1TFlopsを叩き出すが、Ryzen 7 3700Uは10CU(Compute Unit)でGPUが最大1.4GHz駆動なので、理論上は1.8TFlopsの処理性能を持つ。つまりGPU単体性能ではRyzen 7 3700Uの方がはるかに上である。

では性能差はどこで生じているかといえばメモリースピードである。Ryzen 7 3700Uは定格でDDR4-2400×2、オーバークロック動作でもDDR4-3200×2までのサポートであり、一方Ice LakeはDDR4-3200のほかにLPDDR4/X-3733までのサポートがある。

さすがにLPDDR4/X-3733を利用する場合はDIMMではなくボード上に直接搭載になるので拡張性は期待できないが、帯域そのものはずっと上がる。上の画像のグラフを見て「メモリー構成はどうなっているのか?」と質問したものの「わからない」という答えだったあたり、非常に怪しい。

デモ機の説明は下の画像のとおり。メモリー8GBというあたり、もうSO-DIMMではなさそうで、だとするとLPDDR4X-3733あたりが搭載されている可能性は非常に高いと思われる。

Ryzen 7の方もメモリー構成がはっきりしない。これが「定格だから」とDDR4-2400×2を搭載していたとしたら、「これだけメモリー帯域に差があるのに性能が大して変わらないRyzen 7スゲエ」になりかねないのだが、さて。

ちなみにRyzenの方だが、以前デスクトップ向けRyzen APUの発表の際に、メモリーをオーバークロックするとグングン性能が上がるという結果が示されており、この特徴はRyzen 7 3700Uも共通だろう。

統合型グラフィックの場合、メモリー帯域不足が性能の最大のボトルネックであり、これに関しては確かにLPDDR4/XをサポートしないRyzenには多少ディスアドバンテージがあるわけだが、今後LPDDR4/Xではなく普通のDDR4をサポートする35/45W TDPのHモデルが「出たとしたら(反語表現)」、おそらくグラフィック性能はここまで高くはならないだろう。その意味では、インテルが基調講演でアピールしたほどのアドバンテージがGPUにあるとは言いにくい。

余談だが、先の機械学習のベンチマークも、とにかくInference(推論フェーズ)ではメモリーから大量にテストデータを読み出し、それをネットワークに通して判断するわけで、このネットワークに通す過程で当然煩雑にメモリーアクセスを行なう。

こうなるとメモリー帯域が広いほど有利であり、DDR4-2400までしかサポートしないCore i7-8565Uと、LPDDR4X-3733をサポートするIce Lakeではメモリー帯域が極端に異なる(38.4GB/秒 vs. 59.7GB/秒)わけで、当然性能に影響を及ぼすだろう。性能差がCascade Lakeの2倍からIce Lakeで2.5倍に増えたのは、このメモリー帯域の効用と考えられる。

10nmプロセスの動作周波数は
14nm++より低い

さて、このあたりまでは語られたことである。ではいよいよ語られなかったことに入りたい。そもそも動作周波数は? という話である。実は、Ice Lakeでは相当動作周波数が落ちている。

そもそも14nm++を使うWhiskey Lake世代の場合、ハイエンドのCore i7-8665UではTDP 15W枠で最大4.8GHzまで動作周波数が上がる。これに対し、記事冒頭の表でもわかるように、Ice Lake-Uでは4.1GHzどまりである。もうこの時点でなにかおかしい。

さて、インテルは動作周波数が直接わかるような結果をビタイチ出してくれないのだが、幸いにもIPCの改善率とシングルスレッド性能を出してくれている。

IPCの改善率。これはSkylakeアーキテクチャーと比較しての結果。ほとんどのケースで1割以上のIPCの改善が実現できており、平均値で言うと18%、というのがインテルの主張だ

シングルスレッド性能。これはSPECint_rate_base2006での結果。基準がBroadwell、というあたりがまたなんとも……

このシングルスレッド性能の画像でWhiskey Lakeとの性能比を求めると以下のようになり、Whiskey Lake→Ice Lakeではわずかに3.5%の性能改善に留まっている。

Broadwellとの性能比
Broadwell vs. Whiskey Lake 141.9%の性能改善
Broadwell vs. Ice Lake 147.0%の性能改善

IPCが18%改善したにも関わらず3.5%しか性能が上がらない、というのは要するに動作周波数が12%ほど下がっているという計算になる。Core i7-8665Uの場合はBase 1.9GHzなので、これが1.7GHzほどに落ちている計算になるだろうか?

実際はベースクロックはもう少し高めで、ターボブーストがかかってもそれほど動作周波数が上がらない、という感じの実装になっているのではないかと思うが、とにかく動作周波数が14nm++におよばないのが現状の10nmプロセス、というのは間違いない。

この状況は、2014年の秋に投入された14nmの初めての製品であるBroadwellに近いものがある。やはり当初はY SKUのみの投入で、動作周波数も低めであった。

これが改善されるのは2015年に投入されたSkylakeであるが、プロセスを高速化するのではなく、遅いプロセスでも高速動作するようにマイクロアーキテクチャー側に手を入れて解決したわけだ。おそらく現行の10nmも似たような感じになっている。

幸いにこれに10nm+や10nm++が続くという発表はすでになされているので、これらのプロセスが出てくる頃には問題は多少緩和する可能性が高い。

出荷が絶望的になった
デスクトップ向けのIce Lake

さて、最後にその10nmプロセスの話である。今回一番ショッキングであり、かつ筆者の過去の記事の訂正をしないといけない話である。

先ほどIce Lake-Hへの言及で反語表現を使ったが、Ice Lake-HやIce Lake-SはSKU自体が消滅したたようで、おそらく出荷されない。

今回、台湾で複数のルートからTweakers.netが掲載したのとまったく同じロードマップを「入手できて」しまった。最初に見た時はフェイクだろうと判断したのだが、複数のOEMがこのロードマップに基づいて製品計画を立てている以上、かなり信憑性が高いと判断せざるを得なくなってしまった。この結果として以下のことになるらしい。

  • Ice Lakeは現在のY/U SKUは出荷されるが、出荷数量は非常に限られる。そして引き続きWhiskey LakeがU SKUに供給され続け、Y SKUはAmber Lakeが供給される。H SKUはCoffee Lake Refreshが継続(いずれも2020年第3四半期まで)
  • 2020年第2四半期からComet Lakeが投入される。以前のストーリーではComet Lakeは10nmプロセスの製品の予定だったはずだが、これが14nmになり、しかも前倒し投入となる。この世代は最大10コアになるが、その代わりハイパースレッディングが無効化される。これは現在のハイパースレッディングにはさまざまな脆弱性が内包されており、後付けで対策を施すのが難しいかららしい。このComet Lakeはデスクトップ向けのSシリーズを含む全SKUで一斉に投入される。
  • 2021年第2四半期には、同じく14nmのままのRocket LakeがS/H/U SKUに、また10nmを使うTiger LakeがU/Y SKUに投入される予定(こちらはまだ変わる可能性はあり)。
  • Xeon向けにはIce Lake-SPは予定通り出荷される。ただこちら、コア数は増えるが動作周波数は大幅に落ちる模様。

少なくとも連載511回を書いたときに想定していた、2019年末にはデスクトップ向けにも10nmプロセス製品が来るだろうという予想は完全に外れたことになる。おそらく2020年までデスクトップ向けのメジャーアップデートはない。

「ならばせめてSunny Coveアーキテクチャーを14nm++で」というのも、不可能ではないが難しいだろう(まだComet Lakeのアーキテクチャーがどんなものになるのかが判明していないから断言はできないが)。

というのは、インテルがIce Lakeのウェハーを公開してくれたおかげでダイサイズが判明したのだが、おおよそ11.1×11.8mm程度で131mm2ほどとなる。

Ice Lakeのウェハー。改めて見てもダイはかなり正方形に近い

なにしろ内部アーキテクチャーがだいぶ拡張されたので1:1で比較はできないのだが、以前の2.7倍は無茶だとして2倍程度と推定すると、14nmでこれを作ったら260mm2にも達する。今のCoffee Lake 8コアより大きいのに、わずか4コアしかない計算になる。

ダイサイズが肥大化している理由は、GPU(24EU→64EUに増加)とThunderbolt 3(これだけで1コア分より大きい)、Imaging(画像処理エンジンでこれも1コア分くらいある)あたりで、Thunderbolt 3のコントローラーやImagingを抜いて、なんならグラフィックスも全部省くと4コア+メモリーコントローラー+Uncoreで50mm2程度、14nmに移植して100mm2程度だろうか。

Ice Lakeの構造。同じ写真は連載第511回でも示した。こちらのほうが見やすい気もする

8コアにすればだいたい170~180mm2程度になり、今のCoffee Lake並に抑えられるかもしれないが、さんざんGPUを強化しただのThunderbolt 3を内蔵しただのアピールしておいて、いまさら全部ナシというわけにはいかないだろう。現実問題としてそういう選択肢も無いように見える。

とりあえずどんなものになるかはまだ不明なComet Lakeが投入されるまで、現状のCoffee Lake-Refreshで耐えしのぐしかないというのがインテルの現状という、少し悲しい報告で記事を締めたいと思う。

■関連記事