前回のスーパーコンピューターの系譜は、インテルのKnights Cornerの話で終わってしまったので、今回はこれに続く2製品、それと連載314回の最後で説明した、「欠けている要素」に関する話をしていきたい。
Silvermontベースの
Knights Landing
2014年6月に開催されたISC14で、インテルはKnights Landingという新しいMIC(Many Integrated Core)アーキテクチャーの説明を行なった。
この時点で公開された情報は以下の3つで、これが骨子となっている。
- CPUコアそのものが、従来のP54ベースのものからSilvermont(14nmを使うので事実上はAirmont)ベースのものに切り替わる。この結果、シングルスレッドでの性能が従来比で3倍となった
- パッケージ単体で理論性能3TFLOPS(倍精度)が実現できるようになる
- 3D積層メモリーをオンパッケージで搭載し、最大16GBの容量とDDR4比で5倍の帯域を確保できるようになる
まず1つ目。P54は回路規模が小さく、比較的簡単に使えるということでインテル社内、特に研究開発チームで使いまわされているそうで、インテルのQuark X1000コアがP54ベースなのもこのあたりに理由があったらしい。
しかし、いかんせん2命令のIn-Orderスーパースカラーといいつつも、実態は同じ2命令/サイクルのIn-OrderスーパースカラーのAtomコアと同じ程度の性能で、ベクトル演算はともかくそれ以外の処理が遅いという問題を抱えていたままだった。
実はP54と初代Atomコア(Silverthorne)の性能比較に関する公式な数字がないのだが、こういう便利な数字を示してくださるサイトがあり、PentiumとAtomの性能を比較すると以下のようになる。
PentiumとAtomの性能比較 | ||||||
---|---|---|---|---|---|---|
Freq (MHz) |
Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
||
P54 | 100 | 169 | 31.8 | 122 | 32.2 | |
Atom | 1600 | 2462 | 717 | 1828 | 728 |
これから、性能/動作周波数比を求めると下表のようになる。
PentiumとAtomの性能/動作周波数比 | ||||||
---|---|---|---|---|---|---|
Dhry1 Opt |
Dhry1 NoOpt |
Dhry2 Opt |
Dhry2 NoOpt |
|||
P54 | 1.69 | 0.32 | 1.22 | 0.32 | ||
Atom | 1.54 | 0.45 | 1.14 | 0.46 |
浮動小数点演算を含まないベンチマークのDhrystoneでいいのか? という疑問はともかく、最適化するとPentiumの方が速いが最適化なしだとAtomの方が高速で、ただどちらも似たようなレベルで、そう性能に差がないことがわかる。
なるほど、Knights CornerがP54をSilverthorneに入れ替えなかった理由が理解できる。個人的には、P54コアを無理やり64bit対応にする手間をかけるくらいなら、Silverthorneコアに入れ替えた方が早かった気がするのだが、このあたりの事情はよくわらない。
この結果として3倍の性能が得られたとするのだが、これが整数演算性能なのか、浮動小数点演算性能なのかは明示されていない。
ただ「Xeon Phi 5110P」は倍精度でおおむね1.01TFLOPSとされ、一方Knights Landingは倍精度で3TFLOPS以上としているため、この3倍は浮動小数点演算の方で、整数演算性能はそこまで伸びていないだろうと思われる。
メモリーは「インテルとMicron Technologyの共同開発」と書かれていることから、いわゆるHMC(Hybrid Memory Cube)、もしくはその派生型を採用していると考えられる。
→次のページヘ続く (単体でOSが動作するのが最大の特徴)

この連載の記事
-
第814回
PC
インテルがチップレット接続の標準化を画策、小さなチップレットを多数つなげて性能向上を目指す インテル CPUロードマップ -
第813回
PC
Granite Rapid-DことXeon 6 SoCを12製品発表、HCCとXCCの2種類が存在する インテル CPUロードマップ -
第812回
PC
2倍の帯域をほぼ同等の電力で実現するTSMCのHPC向け次世代SoIC IEDM 2024レポート -
第811回
PC
Panther Lakeを2025年後半、Nova Lakeを2026年に投入 インテル CPUロードマップ -
第810回
PC
2nmプロセスのN2がTSMCで今年量産開始 IEDM 2024レポート -
第809回
PC
銅配線をルテニウム配線に変えると抵抗を25%削減できる IEDM 2024レポート -
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート - この連載の一覧へ