このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第317回

スーパーコンピューターの系譜 今後のGPGPU利用の方向性

2015年08月17日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 連載308回からHPC向けのGPGPUについて説明してきたが、今回はそのまとめとして、現状で判明している問題と、各社の将来の方向性について解説していきたい。

4枚のXeon Phi 5110Pを装着したシステムの例

現状の問題点は
演算の種類が偏ってしまうこと

 現状のHPCの問題は? というとこれはけっこうある。まずはサポートされる演算の種類がどうしても偏る方向にあることだ。

 理由は簡単で、インテルはともかくとしてNVIDIAおよびAMDはGPUとコアを共有しているため、どうしても内部の構成はGPUを意識したものにならざるを得ない。

 ではGPUを意識するとどういうことになるかというと、32bitの単精度浮動小数点でのMAC演算ができれば今のところ十分であり、64bit、つまり倍精度浮動小数点演算のサポートがあってもほとんどが使われないことになる。

 したがって、新しいコアを設計するにあたっては64bitのサポートを追加するか否かは、どの程度HPC向けに使うかを熟慮する必要がある。

 NVIDIAの場合これが顕著で、Tesla(32bitのみ)→Fermi(32bitのみ)→Kepler(32/64bit)→Maxwell(32bitのみ)→Pascal(16/32bitのみ?)→Volta(16/32/64bit?)といった具合に、世代毎にサポートされるデータ型が変わっている始末だ。

 PascalとVoltaはなにしろまだ製品が存在しないため推定での記述であるが、実際問題としてKepler→Maxwellでは同じ製造プロセス(28nm)ながら、GPUとしての性能はMaxwellの方がずっと高く、しかも効率が上がっている。

 この理由はいくつかあるが、1つには倍精度のサポートを削った分、より多くのシェーダーをダイに詰め込めるようになったことが挙げられる。結果、Maxwellベースの製品はKeplerベースの製品をほぼ駆逐することになったが、それも当然であろう。

 NVIDIAの現在の売り上げを見ると、2015年度の売り上げの38億ドルのうち、GPU向けが20億ドル以上を占めており、HPC&クラウド向けの2.8億ドルと比較すると7倍以上の違いがある。

NVIDIAの売り上げの半分以上はGaming、つまりPC向けのGPUが占めている。同社の2015年のInvestor Dayにおける同社のColette M. Kress氏(EVP兼CFO)の資料より

 この状態で、HPC向けに倍精度演算を搭載することで肝心のGPU側の性能が落ちる、というのは普通に考えると許容されにくいのは理解できるだろう。

 結果、Maxwellは従来のHPC向けには非常に使いにくいものになってしまった。ここで「ではGPU以外で倍精度演算がなくても利用できるHPC的な用途はないか?」と模索した結果がディープラーニングである(関連リンク)。

 ところが、実際にはディープラーニングには単精度演算でもオーバースペックであり半精度、つまり16bit演算でも十分という話が出てきた。Pascalはこれに向けて、32bitの演算器を2つの16bit演算に振り分けることで性能を2倍にする、という仕組みが搭載される模様だ。

 要するにHPCは置いておき、Pascal世代ではGPU的な使い方とディープラーニングに焦点を当てた製品になるという話であり、HPC向けには2018年に予定されているVoltaまでの間は引き続きKeplerベースの製品が提供され続けるという形になると思われる。

 一方AMDは、GCNで64bit演算をサポートしており、GCNベースの同社の製品はローエンドからハイエンドまですべてが64bit演算をサポートするという、ある意味整合性の取れたアーキテクチャーである。

 これはAMDの場合、OpenCL経由で普通のアプリケーションからGPGPU的に利用することを想定しており、64bit演算のサポートは当然必要という判断だったようた。結果的にGCNベースのGPUは、同一構成ではMaxwellベースのGPUよりもやや性能は劣ることになるが、AMDはそれは問題ないと考えているようだ。

 もう1つの雄であるインテルの場合、GPU的な使い方は考慮する必要がないので比較的制約は少ないが、その代わりにx86ベースという別の制約が付いてしまっており、これがダイサイズの大型化を招いている。

特定の計算以外は高速化できない

 さて、ここまでは演算の種類を単に単精度か倍精度かだけで説明してきたが、実はこれ以外にもある。GPU/GPGPUが提供する浮動小数点演算は極めて基本的なものだけで、あまり複雑なものはない。

 NVIDIAの場合、ここのSM/SMXは加算や乗算などの基本的な演算のみであり、三角関数や指数/対数などの「基本的ではあるが、やや特殊な」算術演算はSFU(Special Function Unit)に実装される形となっているが、こちらはそれほど種類が多くなく、また演算器の数もずっと少ない。

 例えばKeplerの場合、1つのSMXには192個のSingle-Float CUDA Core、64個のDouble-Float Unit、32個のLoad/Store Unitと同じく32個のSFUが実装されている形で、こうした特殊な演算を利用すると途端に性能が落ちることになる。

 これはAMDも同じで、GCNには特殊な演算命令を持っておらず、ライブラリーで特殊な演算を(通常のベクトル演算器を使って)処理することになり、効率は悪い。

 同じようにインテルのMICアーキテクチャーで採用されるAVX512命令も、ここで扱われるのは基本的な演算の他はデータ移動やフォーマット変換のみである。

 これは、LINPACKなどに代表される行列の乗加算を大量に行なうといった演算にはかまわないが、HPCの用途が広がってきて、それ以外の計算も高速にさせたいなどと思った瞬間に行き詰まりを見せることになる。

 もちろんx86プロセッサーのFPUに相当するものが全部のシェーダーに入っていればこうした問題はだいぶ解決するのだが、これはインテルのMICアーキテクチャーよりもさらにエリア効率を落とすことになりかねない。

 フル機能を実装した倍精度対応のFPUが占めるエリアは、(ダイ上の)CPU全体の面積の中で無視できない割合を占める。ARMのプロセッサーが、FPUをオプション扱いで提供するのは、このあたりの損得勘定が難しいからである。

 これに関しては、今のところ各社あきらめ気味である。こうした特定用途向けには、既存の汎用プロセッサー(IntelのXeonやIBMのPower、長期的にはARMのCortex-Aシリーズなど)を多用するか、もしくはFPGAを利用するという方向性が固まりつつある。

 ただFPGAは「GPGPUにできないこと」をやらせる分には効率が良いが、汎用プロセッサーあるいはGPGPUにできることをやらせると、おそろしく効率が悪いという特徴があり、これも相まって用途に応じて使い分ける方向性になりつつある。

 インテルがFPGA大手のAlteraを買収した、というニュースをこうしたHPC向けの観点から見ると非常に興味深い。MICアーキテクチャー+FPGAというソリューションは、相互に補完しあえる可能性が高いからだ。

→次のページヘ続く (メモリー帯域が不足

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事
1
Apple 2026 MacBook Air M5チップ搭載13インチノートブック:AIとApple Intelligence、13.6インチLiquid Retinaディスプレイ、16GBユニファイドメモリ、512GB SSDストレージ、12MPセンターフレームカメラ、Touch ID - シルバー
Apple 2026 MacBook Air M5チップ搭載13インチノートブック:AIとApple Intelligence、13.6インチLiquid Retinaディスプレイ、16GBユニファイドメモリ、512GB SSDストレージ、12MPセンターフレームカメラ、Touch ID - シルバー
¥177,333
2
Lenovo ノートパソコン パソコン IdeaPad Slim 3 15.3インチ 第13世代 インテル® Core™ i5 プロセッサー搭載 13420H メモリ16GB SSD512GB MS Office 2024搭載 Windows11 バッテリー駆動16.9時間 重量1.59kg ルナグレー 83K100G4JP ノートPC
Lenovo ノートパソコン パソコン IdeaPad Slim 3 15.3インチ 第13世代 インテル® Core™ i5 プロセッサー搭載 13420H メモリ16GB SSD512GB MS Office 2024搭載 Windows11 バッテリー駆動16.9時間 重量1.59kg ルナグレー 83K100G4JP ノートPC
¥107,800
3
【Amazon.co.jp限定】Lenovo Chromebook クロームブック Duet 11 10.95インチ MediaTek Kompanio 838 プロセッサー​搭載 メモリ8GB eMMC 128GB 重量1.0kg 83HH000TJP パソコン
【Amazon.co.jp限定】Lenovo Chromebook クロームブック Duet 11 10.95インチ MediaTek Kompanio 838 プロセッサー​搭載 メモリ8GB eMMC 128GB 重量1.0kg 83HH000TJP パソコン
¥61,800
4
【整備済み品】 富士通 ノートパソコン LIFEBOOK U939 超軽量 薄型 ノートPC ■Win11搭載 / MS Office H&B 2019 / FHD(1920x1080)/第八世代 Core i5-8265U/8GBメモリ/SSD 256GB/Webカメラ内蔵/13.3インチ
【整備済み品】 富士通 ノートパソコン LIFEBOOK U939 超軽量 薄型 ノートPC ■Win11搭載 / MS Office H&B 2019 / FHD(1920x1080)/第八世代 Core i5-8265U/8GBメモリ/SSD 256GB/Webカメラ内蔵/13.3インチ
¥30,800
5
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
¥36,970

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII倶楽部

注目ニュース

  • 角川アスキー総合研究所

プレミアム実機レビュー

ピックアップ
1
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
¥1,880
2
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
¥1,890
3
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
¥740
4
UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み 断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)
UGREEN USB Type Cケーブル PD対応 100W/5A 超急速充電 USB C ナイロン編み 断線防止 iphone17/16/15シリーズ/iPad/MacBook Pro/Galaxy S24/Matebook/iPad/Xperia等USB-C各種対応(1m, ブラック)
¥743
5
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
¥1,100
6
KIOXIA(キオクシア)【日本製】SDカード 128GB SDXC UHS-I Class10 読出速度100MB/s 国内正規品 メーカー保証5年 KLNEA128G
KIOXIA(キオクシア)【日本製】SDカード 128GB SDXC UHS-I Class10 読出速度100MB/s 国内正規品 メーカー保証5年 KLNEA128G
¥1,880
7
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ホワイト T-K6A-2630WH
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ホワイト T-K6A-2630WH
¥1,899
8
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
¥4,918
9
エルパ(ELPA) 扉付タップラン 電源タップ 延長コード 125V 3m 3個口 ホワイト WBT-N3030B(W)
エルパ(ELPA) 扉付タップラン 電源タップ 延長コード 125V 3m 3個口 ホワイト WBT-N3030B(W)
¥652
10
UGREEN LANケーブル CAT8 1M メッシュLANケーブル カテゴリー8 コネクタ 超光速40Gbps/2000MHz CAT8準拠 イーサネットケーブル 爪折れ防止 シールド モデム ルータ PS3 PS4 Xbox等に対応 1M
UGREEN LANケーブル CAT8 1M メッシュLANケーブル カテゴリー8 コネクタ 超光速40Gbps/2000MHz CAT8準拠 イーサネットケーブル 爪折れ防止 シールド モデム ルータ PS3 PS4 Xbox等に対応 1M
¥699

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

デジタル用語辞典

ASCII.jpメール デジタルMac/iPodマガジン