前回のスーパーコンピューターの系譜は、インテルのKnights Cornerの話で終わってしまったので、今回はこれに続く2製品、それと連載314回の最後で説明した、「欠けている要素」に関する話をしていきたい。
Silvermontベースの
Knights Landing
2014年6月に開催されたISC14で、インテルはKnights Landingという新しいMIC(Many Integrated Core)アーキテクチャーの説明を行なった。
この時点で公開された情報は以下の3つで、これが骨子となっている。
- CPUコアそのものが、従来のP54ベースのものからSilvermont(14nmを使うので事実上はAirmont)ベースのものに切り替わる。この結果、シングルスレッドでの性能が従来比で3倍となった
- パッケージ単体で理論性能3TFLOPS(倍精度)が実現できるようになる
- 3D積層メモリーをオンパッケージで搭載し、最大16GBの容量とDDR4比で5倍の帯域を確保できるようになる
まず1つ目。P54は回路規模が小さく、比較的簡単に使えるということでインテル社内、特に研究開発チームで使いまわされているそうで、インテルのQuark X1000コアがP54ベースなのもこのあたりに理由があったらしい。
しかし、いかんせん2命令のIn-Orderスーパースカラーといいつつも、実態は同じ2命令/サイクルのIn-OrderスーパースカラーのAtomコアと同じ程度の性能で、ベクトル演算はともかくそれ以外の処理が遅いという問題を抱えていたままだった。
実はP54と初代Atomコア(Silverthorne)の性能比較に関する公式な数字がないのだが、こういう便利な数字を示してくださるサイトがあり、PentiumとAtomの性能を比較すると以下のようになる。
| PentiumとAtomの性能比較 | ||||||
|---|---|---|---|---|---|---|
| Freq (MHz) |
Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
||
| P54 | 100 | 169 | 31.8 | 122 | 32.2 | |
| Atom | 1600 | 2462 | 717 | 1828 | 728 | |
これから、性能/動作周波数比を求めると下表のようになる。
| PentiumとAtomの性能/動作周波数比 | ||||||
|---|---|---|---|---|---|---|
| Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
|||
| P54 | 1.69 | 0.32 | 1.22 | 0.32 | ||
| Atom | 1.54 | 0.45 | 1.14 | 0.46 | ||
浮動小数点演算を含まないベンチマークのDhrystoneでいいのか? という疑問はともかく、最適化するとPentiumの方が速いが最適化なしだとAtomの方が高速で、ただどちらも似たようなレベルで、そう性能に差がないことがわかる。
なるほど、Knights CornerがP54をSilverthorneに入れ替えなかった理由が理解できる。個人的には、P54コアを無理やり64bit対応にする手間をかけるくらいなら、Silverthorneコアに入れ替えた方が早かった気がするのだが、このあたりの事情はよくわらない。
この結果として3倍の性能が得られたとするのだが、これが整数演算性能なのか、浮動小数点演算性能なのかは明示されていない。
ただ「Xeon Phi 5110P」は倍精度でおおむね1.01TFLOPSとされ、一方Knights Landingは倍精度で3TFLOPS以上としているため、この3倍は浮動小数点演算の方で、整数演算性能はそこまで伸びていないだろうと思われる。
メモリーは「インテルとMicron Technologyの共同開発」と書かれていることから、いわゆるHMC(Hybrid Memory Cube)、もしくはその派生型を採用していると考えられる。
→次のページヘ続く (単体でOSが動作するのが最大の特徴)

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











