前回のアップデートが昨年9月だったこともあって、あまり情報はないのだが、今後の動向についてまとめておきたい。
まず既存の製品に関しては図のとおりで変更はない。厳密に言えば、Maxwell 1.0世代にGM108コアが存在するが、こちらはモバイル向けのローエンド製品で、GeForce 930M/940Mにのみ採用された製品、SMMの数は3つで、シェーダー数で言えば384となる。
さすがにここまでくると性能が低すぎてデスクトップには向かないと判断されたのか、OEM向けのGeForce GT 740はいまだにGK107ベースで、その上はGM107ベースのGeForce GTX 745になっており、GM208をデスクトップ向けに入れる予定は全然ないまま終わる見込みだ。
アーキテクチャーをPascalに刷新
GP100を4月のGTCで発表か?
さて、ここからは未来の話だ。今年はNVIDIAもPascalアーキテクチャーをあらゆる製品で展開する予定である。まず前回からの相違点で言えば、コード名が当初GPxxxと記していたのだが、PKxxxになるらしいと書いたのが、最新の情報ではやはりGPxxxになるようだ。ということでコード名は再びGPxxxに戻している。
Pascalが最初のお披露目になるのは、このシリーズのハイエンド製品であるGP100となる見込みだ。実はGP100を搭載したモジュールは、昨年9月に開催された2015 Taiwan GTCのディープラーニングにおける講演のスライドで公開されている。
NVIDIA TaiwanのYouTubeビデオの2分47秒あたりから、これが講演スライドの一部として表示されているのがわかる。ただし、あまり詳細に観察してほしくはなさそうでもある。
NVIDIAは、本来Maxwell 2.0となるべきであったTSMCの20nmプロセスを利用したGM104をキャンセルして28nmに戻す作業と並行して、Pascal 1.0の16FF+への実装を急いだのは間違いないし、GP100コアはかなり早いタイミングで最初のシリコンが出てきていると考えられる。
実のところ、早く出てこないとまずいという事情がNVIDIAサイドにはある。いきなり話がスーパーコンピューターに飛んでしまって恐縮なのだが、連載317回で、NVIDIAがTeslaの将来製品にNVLinkを搭載、これがIBMのCAPIと互換になっておりPower8と接続できると解説した。
このPower8+NVIDIA GPUという構成がオークリッジ国立研究所のSummitとローレンス・リバモア国立研究所のSierraに納入されることがすでに決まっている。
もう少し背景を説明すると、現在オークリッジ国立研究所にはTitanというマシンが稼働中で、これは連載302回の最後に触れた、CRAYのXE6ブレードとTesla K20を組み合わせたシステムである。
一方ローレンス・リバモア国立研究所にはSequoiaが稼働中で、これは連載306回で解説したBlue Gene/QをベースとしたASCの一部である。ただどちらも2017年には稼動後5年を経過するということで、そろそろ機材の更新時期になる。
そこでこの2つを置き換えるためのCORAL(Collaboration of Oak Ridge、Argonne、and Livermore)プロジェクトが米エネルギー省で2014年に実施された。要するにすべての研究所でそれぞれ仕様を決めて導入するのではなく、共同で仕様を策定して導入しようというものである。
日本でも筑波大と東大および京大がT2Kと呼ばれる共通仕様のスパコン導入を行なったりしたが、それのもっと大規模版というところだ。
このCORALプロジェクトに選ばれたのがIBM+NVIDIAという組み合わせで、オークリッジ国立研究所にはTitanの更新でSummitが、ローレンス・リバモア国立研究所にはSequoiaの更新でSierraが導入される。
基本構成は同じだが、Summitは300PFLOPS以上、Sierraは100PFLOPS以上の性能を出すことになっている。SummitはSierraの3倍以上のノードを集積する「予定」なわけだ。
契約によればSummitでもSierraも2017年中に設置され、2018年に稼動することになっている。それはいいのだが、問題はこのSummit/Sierraの構成はIBMの次世代プロセッサーであるPower9と、NVIDIAの次々世代GPUであるVoltaの組み合わせとなっていることだ。
もちろん実際にはいきなりPower9とVoltaを用意できるわけもないのだが、用意できるまで待ってるのも無駄だ。OSや通信関係など、開発すべきソフトウェアはインフラ側にも山とあり、アプリケーション側も当然移植作業が必要になるので、事前に開発用機材を用意する必要がある。
この開発機材として、まずはPower 8+KeplerベースのTesla(K40あたりか?)という構成のマシンがすでに少数導入されているのだが、これに加えてPower 8+Pascalという構成の機材が次に導入されることになっている。時期的にはすでに導入されているはずである。
というのはPower 8+Keplerの場合はNVLinkが利用できないため、ホストとの通信はPCI Express経由になっており、最終的な環境とかけ離れすぎている。これがPascalになると80GB/秒ではあるが(Volta世代では200GB/秒に達する)より高速な接続になるので、ライブラリー周りの開発やアプリケーションの予備評価には十分役に立つことになる。
したがって、PascalベースのGP100コアはすでに特定顧客向けに評価用の出荷がとっくに終わっている時期である。出荷していないといろいろ間に合わないことになってかなりマズいだろう。ということで、4月のGTCにはGP100は間違いなく登場すると思われる。
ただし問題は、これがデスクトップ向けとして出す余地があるかどうかである。ここでようやくロードマップに戻る。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ