このページの本文へ

前へ 1 2 3 4 次へ

ロードマップでわかる！当世プロセッサー事情第570回

世界一のスパコン「富岳」が採用したA64FXは、ARMらしくないARMプロセッサー

2020年07月06日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

Predicationで半自動ベクトル化も可能
さらに独自の4オペランドFMAを実装

　Predicationは、Load/Storeの際にも利用できる。Load/Store命令の際に、データを並べ替えながらのロードが可能(インデックスレジスターで指定)だが、これにPredicationを加えて「そもそもLoad/Storeをする/しない」の制御も可能になっている。このPredication付きロードは複数のモードがサポートされている。

ややわかりにくいが、これはZ0.Dというレジスターに、X0というアドレスから始まるメモリーの値をロードする処理で、ただし並び順をZ1.Dというインデックスでして、さらにP0/zのPredicationでロードする/しないを設定している

Predication付きロードは複数のモードをサポートする。どの場合でも、Predicationによる制御が有効になっている

　こうしたPredicationの指定そのものは珍しくないというか、SIMD演算では似たものはいくつかあるが、通常は個々の命令に対する拡張として実装されているのに対し、A64FXではベクトルレジスターに対する操作の一般的な手法としてPredicationが用意されているのが大きな違いである。

　もっともこれは(プロセッサー内部の処理からすると)面倒な作業になるわけで、専用処理ユニットとパイプラインが追加されたのも無理ないところである。

　実際、ここまでの細かな操作がサポートされていないSPARC64 XIfxには、Predicationユニットが搭載されていない。

　そしてPredicationと先のFirst-fault loadを組み合わせると、とてもベクトル化できそうにないコードですら、SVEでぶん回せることになる。

これはわかりにくいが、下の4命令で16要素まとめて判別している。また左のスカラーコードは、A[N]が十分大きければいずれはページフォルトを起こすはずで、その振る舞いはFirst-fault loadで再現できることになる

　A[N]はintなので32bitとすれば16倍、もしこれをINT8で実装したら64倍の速度でwhileループを回せるわけだ。さらには、Predicationを使っての半自動ベクトル化も可能としている。

データ依存がある場合、ベクトル化への展開がしにくい。そこでPredicate Registerを使い、データ依存をSVCに教えてやることで、ベクトル化できるという仕組み

　SVEに絡んだ独自の実装が、4オペランドFMAである。D＝A×B＋Cという一般的なFMA(Fused Multiply-Add)処理の場合、A/B/C/Dの4つのオペランドが必要になる。ただARM v8ではこの4オペランド命令をサポートしていない。

4オペランドFMA。要するにインテルのMacro-Op Fusionと同じ仕組みだ

画像の出典は、2018年のHotChipsにおける講演。（以下同）

　そこで、通常は上のソースにあるように2命令での処理になるわけだが、A64FXではこれを内部的に処理して、1つのFMA4命令としてハンドリングすることになる。これにより、フロントエンドでは2命令として認識されるものの、バックエンドでは1命令で処理されることになり、実質的な性能向上につながるわけだ。

消費電力を下げるために
デコードと実行ユニットを制限できる

　性能向上の一方で、省電力の仕組みもやや独特である。チップ単位のEnergy monitorと、コア単位のEnergy analyzerを併用し、細かく消費電力を監視しながら電圧/動作周波数を制御するというあたりまでは一般的であるが、Power knobの実装はあまり見かけたことがない。

消費電力により電圧/動作周波数を制御する。チップ単位のPower APIはSNLが開発したものに準拠、というのがおもしろい

Power knobを実装。「使っていないユニットを休止」はClock Gating/Power Gatingでおなじみだが、そもそも使う使わないをAPIから設定できるのがなかなか斬新である

　要するに、デコードを絞るとともに、利用する実行ユニットも制限することで消費電力を下げるという仕組みである。最小に絞ると、デコードは2命令/サイクルになるし、EXB/FLBのユニットは休止になるため、実質5命令のスーパースカラー/アウト・オブ・オーダー構成になる。

　ついでにHBM2のバンド幅も10%単位で絞ることが可能になる(もちろん動作周波数も下げられる)仕組みだ。

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

この連載の記事

Amazon売れ筋ランキング「ノートパソコン」（在庫あり）

【Amazon.co.jp限定】Lenovo Chromebook クロームブック Duet 11 10.95インチ MediaTek Kompanio 838 プロセッサー搭載メモリ8GB eMMC 128GB 重量1.0kg 83HH000TJP パソコン

【Amazon.co.jp限定】Lenovo Chromebook クロームブック Duet 11 10.95インチ MediaTek Kompanio 838 プロセッサー搭載メモリ8GB eMMC 128GB 重量1.0kg 83HH000TJP パソコン

【整備済み品】富士通ノートパソコン LIFEBOOK U939 超軽量薄型ノートPC ■Win11搭載 / MS Office H&B 2019 / FHD(1920x1080)/第八世代 Core i5-8265U/8GBメモリ/SSD 256GB/Webカメラ内蔵/13.3インチ

【整備済み品】富士通ノートパソコン LIFEBOOK U939 超軽量薄型ノートPC ■Win11搭載 / MS Office H&B 2019 / FHD(1920x1080)/第八世代 Core i5-8265U/8GBメモリ/SSD 256GB/Webカメラ内蔵/13.3インチ

HP ノートパソコン 15-fd 15.6インチインテル Core Ultra 5 125H メモリ16GB SSD512GB Windows 11 Microsoft Office 2024搭載 WPS Office搭載カメラシャッター指紋認証薄型 Copilotキー搭載ナチュラルシルバー (BJ0M7PA-AAAF)

HP ノートパソコン 15-fd 15.6インチインテル Core Ultra 5 125H メモリ16GB SSD512GB Windows 11 Microsoft Office 2024搭載 WPS Office搭載カメラシャッター指紋認証薄型 Copilotキー搭載ナチュラルシルバー (BJ0M7PA-AAAF)

Lenovo ノートパソコンパソコン IdeaPad Slim 3 14.0インチ AMD Ryzen™ 7 8840HS メモリ16GB SSD512GB MS Office搭載 Windows11 バッテリー駆動12.6時間重量1.39kg ルナグレー 83K90028JP ノートPC

Lenovo ノートパソコンパソコン IdeaPad Slim 3 14.0インチ AMD Ryzen™ 7 8840HS メモリ16GB SSD512GB MS Office搭載 Windows11 バッテリー駆動12.6時間重量1.39kg ルナグレー 83K90028JP ノートPC

FMV 富士通ノートパソコン Note A WA1-K2 (MS Office 2024/Win 11/15.6型/AMD Ryzen 7/16GB/SSD 512GB/スーパーマルチドライブ) FMVWK2A175_AZ

FMV 富士通ノートパソコン Note A WA1-K2 (MS Office 2024/Win 11/15.6型/AMD Ryzen 7/16GB/SSD 512GB/スーパーマルチドライブ) FMVWK2A175_AZ

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII倶楽部

ASCII倶楽部とは

注目ニュース

Tweets by asciijpeditors

ピックアップ

sponsored
「Satechi OntheGo 7 in 1 マルチポートアダプター」レビュー

業務必須の7ポートをギュッとまとめたUSB Type-Cモバイルハブ「OntheGo」が買いだ！
sponsored

AMDのゲームテクノロジーセット「FSR “Redstone”」解説。新GPUが出なくてもソフトは劇的に進化する
sponsored

大きさ1.5倍はそのまま、食べて「おっ！」ファミマの「大きなおむすび」に意外な変化
sponsored
斬新ながらインテリアに溶け込むデザイン　最新のWi-Fi 7対応で性能も十分！

こんな“魅せまくる”Wi-Fiルーターってあった？ファーウェイの「HUAWEI WiFi Mesh X3 Pro」が美しすぎる
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

be quiet!の静音設計パーツを使いまくったら、ものすご〜く静かなゲーミングPCが完成するのでは？
sponsored
「デジタル資産×現場データ」の勝利の方程式とは？

フィジカルとAIをつなぐOODAループはもう実装可能　ソラコムとセンシンロボティクスが語る「リアルワールドAIプラットフォーム」
sponsored
マウスコンピューター「mouse K7-I7G50BK-A」

年度末のこの時期はPC買うべし！場所を取らずに大画面、32GBメモリー搭載の17.3型ノートがオトクなセール中
sponsored
マウスコンピューターのゲーミングPC「G TUNE FZ-I7G80」がセール中

【ゲーミングPCが7万円オフ】憧れのスペック（Core Ultra 7＋GeForce RTX 5080）の1台が今ならオトク！
sponsored

1リットルの衝撃、手のひらサイズに凝縮されたNVIDIA RTXのパワー！　プロが託す信頼の「ThinkStation P3 Tiny Gen 2」
sponsored
じゃんけん大会は400人参加!!

東北初出店のアプライド仙台店スゴすぎ！初日で約3000人来店したオープンイベントで1日店員してきた話
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

パソコンショップSEVENの強化ガラス製ピラーレスの白いゲーミングPCがかっこいい。触りにきませんか？
sponsored
「TOKYO Gaming-PC STREET 7」3月7日（土）開催決定！

サイコムさんが、とあるイベント来場で1TB SSDを2TBに無償でアップグレードしてくれるらしいんですけど……！
sponsored
現地のカメラ映像を見ながら遠隔作業指示も。「オプテージ曽根崎データセンター（OC1）」の新サービス

人手不足のIT運用部門、その課題をOC1のデータセンター運用支援サービスが解決する
sponsored
リピーターの多さに納得のアフターサポートも必見

静音ゲーミングPCはもっと小型になる？個性派BTO PCの雄・サイコムに計画中の新製品からPCの寿命が延びるお掃除のコツまで訊いてきた
sponsored
JN-IPSM27G240Q-HSPをレビュー

4万円台の27型WQHDゲーミングディスプレー、240Hz・1ms・Mini LED・昇降式多機能スタンドの欲張り仕様なら余裕で買いでしょう
sponsored
アプライド仙台店が2月28日（土）オープン

アプライドがMSIノートPC導入を掲げて仙台へ。8年ぶりの新店が挑む「ネット時代の実店舗戦略」とは
sponsored
スマートバンド？スマートウォッチ？どっちにしてもGPS搭載でさらに便利になった！

約1万円でこれはもう本格スマートウォッチ！「HUAWEI Band 11 Pro」レビュー
sponsored
MSI「MPG 274URDFW E16M」レビュー

これが液晶最強クラスのゲーミングモニター！4K160HzとフルHD320Hzを瞬時に切り替えられるMini LEDのOLED級画質にひたすら感動した話
sponsored
12個のカスタム可能なボタンと2つのダイヤル、LCDディスプレーを搭載

え、Stream Deckがすぐ手元にあるってこんなに便利なの!? キーボードと合体した「GALLEON 100 SD」を試した
sponsored
進捗もリスク把握もレポート作成も！コツコツ記録した業務の情報が“組織の資産”に変わる！

まもなく登場！ Backlog AIアシスタントを試したら「できたらいいな」がサクッとできた
sponsored
Zoom活用事例：株式会社マクロミル

4500名規模のオンラインイベントと年100回のウェビナー　マクロミルのマーケティング施策を支えるZoom Webinars
sponsored
メンバーを無言にさせた3つの不安は仕組みで解消する

無言の会議が怖すぎる——心理的安全性を「仕組み」でつくり、お互いに指摘し高め合えるチームへ
sponsored
サイバー攻撃の侵入と拡大を根本から防ぐ“脱VPN”と「Fortinet ユニファイドZTNA」

「わずか3日」で狙われたVPNの脆弱性！対策が後手に回り500GBの情報漏洩… どうやったら防げた？
sponsored

メモリーの価格高騰でDDR4が再注目！あえて今DDR4で組むのは正解か？
sponsored

最速レビュー！ ASRockの新セグメント「Rock」シリーズマザーボードは、モダンですっきりとしたデザインながら快適すぎる⾃作体験を実現
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【外付モデル編】

【ありがとうCrucial】データを運ぶなら「信頼」を選びたい。最後に買っておくべきポータブルSSD総まとめ
sponsored
Crucialブランドで発売中のSSD製品を総まとめ！【内蔵モデル編】

【ありがとうCrucial】今こそ手に入れるべき、Micron品質の内蔵SSD総まとめ
sponsored
止まらないネットワークとセキュリティを融合　フォーティネット「FS-AXシリーズ」の目指す高み

安定性とセキュリティを両立　フォーティネットとアラクサラのシナジーには期待しかない
sponsored
ZEFT Z59Qの魅力をインタビュー

これはファンじゃなくても欲しくなる！CORSAIRづくしのゲーミングPC、タッチスクリーン付きの特別仕様も？
sponsored
STYLE-14FH128-U5-UCRXMをレビュー

大学生のPCはこれで決まり!? 4年保証で1kg未満の14型ノートPCが15万円台はこのご時世でお手頃すぎる
sponsored
JN-V100U-Mで「REANIMAL」をプレイ

元・廃校の体育館にて100型4Kディスプレー＆11.1.4chのサウンドバーで最新ホラーゲームをやってみると……
sponsored
IDOM CaaS Technology×TTS×ソフトバンクの協業で、社会課題に新たな解決策を作る

“車が必要なのに乗れない”人を救う「ノレル」　IoT×AIが実現した新たな自動車サービス
sponsored
創業10周年記念企画を密着レポート

JAPANNEXT、2025年に発表した171製品を校庭に全部並べて謎の料理・キョン汁で10周年を祝う
sponsored
FREX∀RブランドのFRZAB850W/985をレビュー

Ryzen 7 9850X3DでARC Raidersも超快適なゲーミングPC、標準3年保証も魅力的
sponsored
Zoom活用事例：富士ソフトサービスビューロ株式会社

「もう、好評としか言いようがない」コールセンターの現場ニーズをすべて満たしたZoomの導入
sponsored

富士通でこれなら満足、必要十分な性能を持つ12万円台ノートパソコン「FMV WE1-K3」（性能検証編）
sponsored
Zoom活用事例：トラムシステム株式会社

AI時代のコンタクトセンターを見据えて　「Zoom Virtual Agent」と共に進む通信サービス企業
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！

Amazon.co.jp売れ筋ランキング（パソコン・周辺機器）

Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)

Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)

Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応テレワークリモート在宅勤務 0.9m ホワイト

Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応テレワークリモート在宅勤務 0.9m ホワイト

CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電平型磁石マグネット吸着まとまる充電ケーブル PD 240W データ転送 480Mbps (ライトブラック, 1m)

CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電平型磁石マグネット吸着まとまる充電ケーブル PD 240W データ転送 480Mbps (ライトブラック, 1m)

エレコム電源タップ 6個口 3m 雷ガード個別スイッチほこりシャッター付耐熱 PSE技術基準適合ブラック T-K6A-2630BK

エレコム電源タップ 6個口 3m 雷ガード個別スイッチほこりシャッター付耐熱 PSE技術基準適合ブラック T-K6A-2630BK

Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)

Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)

【Amazon.co.jp限定】ロジクール静音ワイヤレストラックボールマウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウスブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定壁紙ダウンロード付き

【Amazon.co.jp限定】ロジクール静音ワイヤレストラックボールマウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウスブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定壁紙ダウンロード付き

Verbatim バーベイタム 1回録画用ブルーレイディスク BD-R 25GB 50枚+3枚増量パックインクジェットプリンタ対応ホワイト片面1層 1-6倍速

Verbatim バーベイタム 1回録画用ブルーレイディスク BD-R 25GB 50枚+3枚増量パックインクジェットプリンタ対応ホワイト片面1層 1-6倍速

UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)

UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)

Amazon Kindle - 目に優しい、かさばらない、大きな画面で読みやすい、6週間持続バッテリー、6インチディスプレイ電子書籍リーダー、ブラック、16GB、広告なし

Amazon Kindle - 目に優しい、かさばらない、大きな画面で読みやすい、6週間持続バッテリー、6インチディスプレイ電子書籍リーダー、ブラック、16GB、広告なし

KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL

KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII.jpからのお知らせ