前回のスーパーコンピューターの系譜は、インテルのKnights Cornerの話で終わってしまったので、今回はこれに続く2製品、それと連載314回の最後で説明した、「欠けている要素」に関する話をしていきたい。
Silvermontベースの
Knights Landing
2014年6月に開催されたISC14で、インテルはKnights Landingという新しいMIC(Many Integrated Core)アーキテクチャーの説明を行なった。
この時点で公開された情報は以下の3つで、これが骨子となっている。
- CPUコアそのものが、従来のP54ベースのものからSilvermont(14nmを使うので事実上はAirmont)ベースのものに切り替わる。この結果、シングルスレッドでの性能が従来比で3倍となった
- パッケージ単体で理論性能3TFLOPS(倍精度)が実現できるようになる
- 3D積層メモリーをオンパッケージで搭載し、最大16GBの容量とDDR4比で5倍の帯域を確保できるようになる
まず1つ目。P54は回路規模が小さく、比較的簡単に使えるということでインテル社内、特に研究開発チームで使いまわされているそうで、インテルのQuark X1000コアがP54ベースなのもこのあたりに理由があったらしい。
しかし、いかんせん2命令のIn-Orderスーパースカラーといいつつも、実態は同じ2命令/サイクルのIn-OrderスーパースカラーのAtomコアと同じ程度の性能で、ベクトル演算はともかくそれ以外の処理が遅いという問題を抱えていたままだった。
実はP54と初代Atomコア(Silverthorne)の性能比較に関する公式な数字がないのだが、こういう便利な数字を示してくださるサイトがあり、PentiumとAtomの性能を比較すると以下のようになる。
PentiumとAtomの性能比較 | ||||||
---|---|---|---|---|---|---|
Freq (MHz) |
Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
||
P54 | 100 | 169 | 31.8 | 122 | 32.2 | |
Atom | 1600 | 2462 | 717 | 1828 | 728 |
これから、性能/動作周波数比を求めると下表のようになる。
PentiumとAtomの性能/動作周波数比 | ||||||
---|---|---|---|---|---|---|
Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
|||
P54 | 1.69 | 0.32 | 1.22 | 0.32 | ||
Atom | 1.54 | 0.45 | 1.14 | 0.46 |
浮動小数点演算を含まないベンチマークのDhrystoneでいいのか? という疑問はともかく、最適化するとPentiumの方が速いが最適化なしだとAtomの方が高速で、ただどちらも似たようなレベルで、そう性能に差がないことがわかる。
なるほど、Knights CornerがP54をSilverthorneに入れ替えなかった理由が理解できる。個人的には、P54コアを無理やり64bit対応にする手間をかけるくらいなら、Silverthorneコアに入れ替えた方が早かった気がするのだが、このあたりの事情はよくわらない。
この結果として3倍の性能が得られたとするのだが、これが整数演算性能なのか、浮動小数点演算性能なのかは明示されていない。
ただ「Xeon Phi 5110P」は倍精度でおおむね1.01TFLOPSとされ、一方Knights Landingは倍精度で3TFLOPS以上としているため、この3倍は浮動小数点演算の方で、整数演算性能はそこまで伸びていないだろうと思われる。
メモリーは「インテルとMicron Technologyの共同開発」と書かれていることから、いわゆるHMC(Hybrid Memory Cube)、もしくはその派生型を採用していると考えられる。
→次のページヘ続く (単体でOSが動作するのが最大の特徴)
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ