前回のスーパーコンピューターの系譜は、インテルのKnights Cornerの話で終わってしまったので、今回はこれに続く2製品、それと連載314回の最後で説明した、「欠けている要素」に関する話をしていきたい。
Silvermontベースの
Knights Landing
2014年6月に開催されたISC14で、インテルはKnights Landingという新しいMIC(Many Integrated Core)アーキテクチャーの説明を行なった。
この時点で公開された情報は以下の3つで、これが骨子となっている。
- CPUコアそのものが、従来のP54ベースのものからSilvermont(14nmを使うので事実上はAirmont)ベースのものに切り替わる。この結果、シングルスレッドでの性能が従来比で3倍となった
- パッケージ単体で理論性能3TFLOPS(倍精度)が実現できるようになる
- 3D積層メモリーをオンパッケージで搭載し、最大16GBの容量とDDR4比で5倍の帯域を確保できるようになる
まず1つ目。P54は回路規模が小さく、比較的簡単に使えるということでインテル社内、特に研究開発チームで使いまわされているそうで、インテルのQuark X1000コアがP54ベースなのもこのあたりに理由があったらしい。
しかし、いかんせん2命令のIn-Orderスーパースカラーといいつつも、実態は同じ2命令/サイクルのIn-OrderスーパースカラーのAtomコアと同じ程度の性能で、ベクトル演算はともかくそれ以外の処理が遅いという問題を抱えていたままだった。
実はP54と初代Atomコア(Silverthorne)の性能比較に関する公式な数字がないのだが、こういう便利な数字を示してくださるサイトがあり、PentiumとAtomの性能を比較すると以下のようになる。
PentiumとAtomの性能比較 | ||||||
---|---|---|---|---|---|---|
Freq (MHz) |
Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
||
P54 | 100 | 169 | 31.8 | 122 | 32.2 | |
Atom | 1600 | 2462 | 717 | 1828 | 728 |
これから、性能/動作周波数比を求めると下表のようになる。
PentiumとAtomの性能/動作周波数比 | ||||||
---|---|---|---|---|---|---|
Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
|||
P54 | 1.69 | 0.32 | 1.22 | 0.32 | ||
Atom | 1.54 | 0.45 | 1.14 | 0.46 |
浮動小数点演算を含まないベンチマークのDhrystoneでいいのか? という疑問はともかく、最適化するとPentiumの方が速いが最適化なしだとAtomの方が高速で、ただどちらも似たようなレベルで、そう性能に差がないことがわかる。
なるほど、Knights CornerがP54をSilverthorneに入れ替えなかった理由が理解できる。個人的には、P54コアを無理やり64bit対応にする手間をかけるくらいなら、Silverthorneコアに入れ替えた方が早かった気がするのだが、このあたりの事情はよくわらない。
この結果として3倍の性能が得られたとするのだが、これが整数演算性能なのか、浮動小数点演算性能なのかは明示されていない。
ただ「Xeon Phi 5110P」は倍精度でおおむね1.01TFLOPSとされ、一方Knights Landingは倍精度で3TFLOPS以上としているため、この3倍は浮動小数点演算の方で、整数演算性能はそこまで伸びていないだろうと思われる。
メモリーは「インテルとMicron Technologyの共同開発」と書かれていることから、いわゆるHMC(Hybrid Memory Cube)、もしくはその派生型を採用していると考えられる。
→次のページヘ続く (単体でOSが動作するのが最大の特徴)
この連載の記事
-
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ