このページの本文へ

前へ 1 2 3 4 次へ

ロードマップでわかる！当世プロセッサー事情第570回

世界一のスパコン「富岳」が採用したA64FXは、ARMらしくないARMプロセッサー

2020年07月06日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

Predicationで半自動ベクトル化も可能
さらに独自の4オペランドFMAを実装

　Predicationは、Load/Storeの際にも利用できる。Load/Store命令の際に、データを並べ替えながらのロードが可能(インデックスレジスターで指定)だが、これにPredicationを加えて「そもそもLoad/Storeをする/しない」の制御も可能になっている。このPredication付きロードは複数のモードがサポートされている。

ややわかりにくいが、これはZ0.Dというレジスターに、X0というアドレスから始まるメモリーの値をロードする処理で、ただし並び順をZ1.Dというインデックスでして、さらにP0/zのPredicationでロードする/しないを設定している

Predication付きロードは複数のモードをサポートする。どの場合でも、Predicationによる制御が有効になっている

　こうしたPredicationの指定そのものは珍しくないというか、SIMD演算では似たものはいくつかあるが、通常は個々の命令に対する拡張として実装されているのに対し、A64FXではベクトルレジスターに対する操作の一般的な手法としてPredicationが用意されているのが大きな違いである。

　もっともこれは(プロセッサー内部の処理からすると)面倒な作業になるわけで、専用処理ユニットとパイプラインが追加されたのも無理ないところである。

　実際、ここまでの細かな操作がサポートされていないSPARC64 XIfxには、Predicationユニットが搭載されていない。

　そしてPredicationと先のFirst-fault loadを組み合わせると、とてもベクトル化できそうにないコードですら、SVEでぶん回せることになる。

これはわかりにくいが、下の4命令で16要素まとめて判別している。また左のスカラーコードは、A[N]が十分大きければいずれはページフォルトを起こすはずで、その振る舞いはFirst-fault loadで再現できることになる

　A[N]はintなので32bitとすれば16倍、もしこれをINT8で実装したら64倍の速度でwhileループを回せるわけだ。さらには、Predicationを使っての半自動ベクトル化も可能としている。

データ依存がある場合、ベクトル化への展開がしにくい。そこでPredicate Registerを使い、データ依存をSVCに教えてやることで、ベクトル化できるという仕組み

　SVEに絡んだ独自の実装が、4オペランドFMAである。D＝A×B＋Cという一般的なFMA(Fused Multiply-Add)処理の場合、A/B/C/Dの4つのオペランドが必要になる。ただARM v8ではこの4オペランド命令をサポートしていない。

4オペランドFMA。要するにインテルのMacro-Op Fusionと同じ仕組みだ

画像の出典は、2018年のHotChipsにおける講演。（以下同）

　そこで、通常は上のソースにあるように2命令での処理になるわけだが、A64FXではこれを内部的に処理して、1つのFMA4命令としてハンドリングすることになる。これにより、フロントエンドでは2命令として認識されるものの、バックエンドでは1命令で処理されることになり、実質的な性能向上につながるわけだ。

消費電力を下げるために
デコードと実行ユニットを制限できる

　性能向上の一方で、省電力の仕組みもやや独特である。チップ単位のEnergy monitorと、コア単位のEnergy analyzerを併用し、細かく消費電力を監視しながら電圧/動作周波数を制御するというあたりまでは一般的であるが、Power knobの実装はあまり見かけたことがない。

消費電力により電圧/動作周波数を制御する。チップ単位のPower APIはSNLが開発したものに準拠、というのがおもしろい

Power knobを実装。「使っていないユニットを休止」はClock Gating/Power Gatingでおなじみだが、そもそも使う使わないをAPIから設定できるのがなかなか斬新である

　要するに、デコードを絞るとともに、利用する実行ユニットも制限することで消費電力を下げるという仕組みである。最小に絞ると、デコードは2命令/サイクルになるし、EXB/FLBのユニットは休止になるため、実質5命令のスーパースカラー/アウト・オブ・オーダー構成になる。

　ついでにHBM2のバンド幅も10%単位で絞ることが可能になる(もちろん動作周波数も下げられる)仕組みだ。

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

Amazon売れ筋ランキング「ノートパソコン」（在庫あり）

Apple 2026 MacBook Neo A18 Proチップ搭載13インチノートブック：AIとApple Intelligenceのために設計、Liquid Retinaディスプレイ、8GBユニファイドメモリ、256GB SSDストレージ、1080p FaceTime HDカメラ - インディゴ

Apple 2026 MacBook Neo A18 Proチップ搭載13インチノートブック：AIとApple Intelligenceのために設計、Liquid Retinaディスプレイ、8GBユニファイドメモリ、256GB SSDストレージ、1080p FaceTime HDカメラ - インディゴ

Apple 2026 MacBook Air M5チップ搭載13インチノートブック：AIとApple Intelligence、13.6インチLiquid Retinaディスプレイ、16GBユニファイドメモリ、512GB SSDストレージ、12MPセンターフレームカメラ、日本語キーボード、Touch ID - スカイブルー

Apple 2026 MacBook Air M5チップ搭載13インチノートブック：AIとApple Intelligence、13.6インチLiquid Retinaディスプレイ、16GBユニファイドメモリ、512GB SSDストレージ、12MPセンターフレームカメラ、日本語キーボード、Touch ID - スカイブルー

Lenovo ノートパソコンパソコン IdeaPad Slim 3 15.3インチ AMD Ryzen™ 7 7735HS メモリ16GB SSD512GB MS Office搭載 Windows11 バッテリー駆動17.4時間重量1.59kg ルナグレー 83K700HAJP ノートPC

Lenovo ノートパソコンパソコン IdeaPad Slim 3 15.3インチ AMD Ryzen™ 7 7735HS メモリ16GB SSD512GB MS Office搭載 Windows11 バッテリー駆動17.4時間重量1.59kg ルナグレー 83K700HAJP ノートPC

【整備済み品】富士通タブレットノートパソコン ARROWS Tab V727 12.3インチ中古タブレット【Windows 11 】【MS Office2019 H&B 搭載】第7世代 Core M3/ メモリ 4GB / SSD 128GB /無線LAN/HDMI/LTE/タッチペン付属(整備済み品)

【整備済み品】富士通タブレットノートパソコン ARROWS Tab V727 12.3インチ中古タブレット【Windows 11 】【MS Office2019 H&B 搭載】第7世代 Core M3/ メモリ 4GB / SSD 128GB /無線LAN/HDMI/LTE/タッチペン付属(整備済み品)

【整備済み品】富士通ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄ノートPC/第10世代 Core i5-10310U＠1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載ビジネス在宅勤務向けパソコン (メモリ：8GB／SSD：256GB)

【整備済み品】富士通ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄ノートPC/第10世代 Core i5-10310U＠1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載ビジネス在宅勤務向けパソコン (メモリ：8GB／SSD：256GB)

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII倶楽部

ASCII倶楽部とは

注目ニュース

Tweets by asciijpeditors

ピックアップ

sponsored

話題沸騰中のRyzen 9 9950X3D2をASRock Challengerシリーズで固めたチャレンジ構成！安価なマザーとハイエンドCPUの組み合わせはいかに？
sponsored
MSI「MAG B850 TOMAHAWK MAX WIFI II」レビュー

最新の漆黒B850マザーボードは64MB BIOS搭載で将来のCPU換装も安心！AM5を長く使ってコスト削減したい人に魅力あるリフレッシュモデルを紹介
sponsored

最新ビデオカードに買い替えるだけでPCが超快適に！ゲームのフレームレートが10倍以上に爆上がり
sponsored
「本体はどこ？」思わず探してしまうほど薄いPC、でも最高にハイスペック！

デスクトップPCの性能をキーボード1枚に凝縮した「HP EliteBoard G1a Next Gen AI PC」
sponsored
HPの新世代カジュアルゲーマー向けモデルをレビュー

HyperXブランド初のゲーミングノートPCは、OMEN時代からどう進化したのか？　「HyperX OMEN 15」
sponsored

「研究開発に投資を続ける」「日本のユーザーの声に耳を傾ける」そして革新的な製品を出す！ファーウェイ国内トップインタビュー
sponsored
無人運営レンタルオフィスの成功例を取材

これが個室型コワーキングスペースの理想形!?駅徒歩5秒の超好立地、利用料は30分250円、ディスプレーは4K＆ピボット可で仕事がはかどる「いいオフィス浅草」
sponsored
MSI「MAG 321UP QD-OLED X24」レビュー

文句なしの漆黒4Kモニター！次世代フィルムで赤かぶりをねじ伏せた31.5型4K/240Hz対応のQD-OLEDを一度見たら、もう今の環境に戻れなくなった
sponsored

なぜコンビニで熟成ワインが1000円台？ファミマ×神の雫コラボの裏側を聞いた
sponsored
ネットワーク機器に強いファーウェイらしい新製品「HUAWEI WiFi BE3」が登場

8000円台でWi-Fi 7＆メッシュ対応はガチでお買い得！ファーウェイから新Wi-Fiルーター早速レビュー
sponsored

防犯対策！　NASが自宅の「守護神」に変わる、QNAP NASとIPカメラのAI連携を試す
sponsored
Google PixelやSamsung Galaxyにも対応した充電ステーション「Modular Charging Dock with Qi2 25W」

25W急速充電に対応、iPhoneじゃなくてAndroidユーザーもデザインのいい充電器を使いたい！
sponsored
JN-282Ei4KPをレビュー

28.2型の4K Plus（3840×2560ドット）ディスプレーが3万円台！超高解像度な３：２画面で仕事がはかどりまくること間違いなし
sponsored
アスキー編集部がBacklog導入で得た成果は？解決できなかった悩みは？全部話します

忖度なしで語ろう　Backlogユーザー歴1年半、「チームで働く」ってやっぱり難しい！
sponsored
リビングのインテリアとしても違和感なし！

売れ筋ミドルタワーPCケースの前面が木製に！組みやすい工夫多数の「FRAME 4000D」がよりオシャレになったよ
sponsored
STYLE-15FHA21-R7A-UCSXをレビュー

165Hz液晶&Ryzen AI 7 350搭載Copilot+ PCの性能を検証、軽めのゲームなら1920×1200ドットで平均100fps超
sponsored

格安マザーでハイエンドCPUは無理？ ASRockのB860マザーでCore Ultra 7 270K Plusを動かしてみた
sponsored
JN-i245G280F-HSPC6をレビュー

2万2980円と最安級の24.5型ゲーミングディスプレーなのに、280Hz・1ms・USB Type-C給電・昇降式多機能スタンド！もうこれでいいじゃない
sponsored
STYLE-14FH131-U5-UCSXをレビュー

14型なのに1kg切り！Core Ultraシリーズ3と16：10液晶を搭載する軽量モバイルPC、性能も使い勝手もイイ感じ
sponsored
LEVEL-16WR172-U7-UKSXをレビュー

GeForce RTX 5070 Ti＆300Hz＆2560×1600ドットでどこでも遊べる幸せ！ARC RaidersもEPIC画質で200fps超えのゲーミングPC
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！

Amazon.co.jp売れ筋ランキング（パソコン・周辺機器）

KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済国内サポート正規品メーカー保証5年 KLMEA128G

KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済国内サポート正規品メーカー保証5年 KLMEA128G

Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)

Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)

Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応テレワークリモート在宅勤務 0.9m ホワイト

Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応テレワークリモート在宅勤務 0.9m ホワイト

KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL

KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL

Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)

Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)

エレコム電源タップ 6個口 3m 雷ガード個別スイッチほこりシャッター付耐熱 PSE技術基準適合ブラック T-K6A-2630BK

エレコム電源タップ 6個口 3m 雷ガード個別スイッチほこりシャッター付耐熱 PSE技術基準適合ブラック T-K6A-2630BK

NIMASO ガラスフィルム iPad 第11世代（A16） 2025用/iPad 10.9インチ第10世代 2022用衝撃吸収強化ガラス保護フィルム指紋防止ガイド枠付き NTB22I574

NIMASO ガラスフィルム iPad 第11世代（A16） 2025用/iPad 10.9インチ第10世代 2022用衝撃吸収強化ガラス保護フィルム指紋防止ガイド枠付き NTB22I574

【Amazon.co.jp限定】ロジクール静音ワイヤレストラックボールマウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウスブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定壁紙ダウンロード付き

【Amazon.co.jp限定】ロジクール静音ワイヤレストラックボールマウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウスブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定壁紙ダウンロード付き

UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)

UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)

Apple 11 インチ iPad (A16): 11 インチモデル、Liquid Retina ディスプレイ、128GB、Wi-Fi 6、12MP フロント/12MP バックカメラ、Touch ID、一日中使えるバッテリー - ブルー

Apple 11 インチ iPad (A16): 11 インチモデル、Liquid Retina ディスプレイ、128GB、Wi-Fi 6、12MP フロント/12MP バックカメラ、Touch ID、一日中使えるバッテリー - ブルー

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII.jpからのお知らせ