このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第317回

スーパーコンピューターの系譜 今後のGPGPU利用の方向性

2015年08月17日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 連載308回からHPC向けのGPGPUについて説明してきたが、今回はそのまとめとして、現状で判明している問題と、各社の将来の方向性について解説していきたい。

4枚のXeon Phi 5110Pを装着したシステムの例

現状の問題点は
演算の種類が偏ってしまうこと

 現状のHPCの問題は? というとこれはけっこうある。まずはサポートされる演算の種類がどうしても偏る方向にあることだ。

 理由は簡単で、インテルはともかくとしてNVIDIAおよびAMDはGPUとコアを共有しているため、どうしても内部の構成はGPUを意識したものにならざるを得ない。

 ではGPUを意識するとどういうことになるかというと、32bitの単精度浮動小数点でのMAC演算ができれば今のところ十分であり、64bit、つまり倍精度浮動小数点演算のサポートがあってもほとんどが使われないことになる。

 したがって、新しいコアを設計するにあたっては64bitのサポートを追加するか否かは、どの程度HPC向けに使うかを熟慮する必要がある。

 NVIDIAの場合これが顕著で、Tesla(32bitのみ)→Fermi(32bitのみ)→Kepler(32/64bit)→Maxwell(32bitのみ)→Pascal(16/32bitのみ?)→Volta(16/32/64bit?)といった具合に、世代毎にサポートされるデータ型が変わっている始末だ。

 PascalとVoltaはなにしろまだ製品が存在しないため推定での記述であるが、実際問題としてKepler→Maxwellでは同じ製造プロセス(28nm)ながら、GPUとしての性能はMaxwellの方がずっと高く、しかも効率が上がっている。

 この理由はいくつかあるが、1つには倍精度のサポートを削った分、より多くのシェーダーをダイに詰め込めるようになったことが挙げられる。結果、Maxwellベースの製品はKeplerベースの製品をほぼ駆逐することになったが、それも当然であろう。

 NVIDIAの現在の売り上げを見ると、2015年度の売り上げの38億ドルのうち、GPU向けが20億ドル以上を占めており、HPC&クラウド向けの2.8億ドルと比較すると7倍以上の違いがある。

NVIDIAの売り上げの半分以上はGaming、つまりPC向けのGPUが占めている。同社の2015年のInvestor Dayにおける同社のColette M. Kress氏(EVP兼CFO)の資料より

 この状態で、HPC向けに倍精度演算を搭載することで肝心のGPU側の性能が落ちる、というのは普通に考えると許容されにくいのは理解できるだろう。

 結果、Maxwellは従来のHPC向けには非常に使いにくいものになってしまった。ここで「ではGPU以外で倍精度演算がなくても利用できるHPC的な用途はないか?」と模索した結果がディープラーニングである(関連リンク)。

 ところが、実際にはディープラーニングには単精度演算でもオーバースペックであり半精度、つまり16bit演算でも十分という話が出てきた。Pascalはこれに向けて、32bitの演算器を2つの16bit演算に振り分けることで性能を2倍にする、という仕組みが搭載される模様だ。

 要するにHPCは置いておき、Pascal世代ではGPU的な使い方とディープラーニングに焦点を当てた製品になるという話であり、HPC向けには2018年に予定されているVoltaまでの間は引き続きKeplerベースの製品が提供され続けるという形になると思われる。

 一方AMDは、GCNで64bit演算をサポートしており、GCNベースの同社の製品はローエンドからハイエンドまですべてが64bit演算をサポートするという、ある意味整合性の取れたアーキテクチャーである。

 これはAMDの場合、OpenCL経由で普通のアプリケーションからGPGPU的に利用することを想定しており、64bit演算のサポートは当然必要という判断だったようた。結果的にGCNベースのGPUは、同一構成ではMaxwellベースのGPUよりもやや性能は劣ることになるが、AMDはそれは問題ないと考えているようだ。

 もう1つの雄であるインテルの場合、GPU的な使い方は考慮する必要がないので比較的制約は少ないが、その代わりにx86ベースという別の制約が付いてしまっており、これがダイサイズの大型化を招いている。

特定の計算以外は高速化できない

 さて、ここまでは演算の種類を単に単精度か倍精度かだけで説明してきたが、実はこれ以外にもある。GPU/GPGPUが提供する浮動小数点演算は極めて基本的なものだけで、あまり複雑なものはない。

 NVIDIAの場合、ここのSM/SMXは加算や乗算などの基本的な演算のみであり、三角関数や指数/対数などの「基本的ではあるが、やや特殊な」算術演算はSFU(Special Function Unit)に実装される形となっているが、こちらはそれほど種類が多くなく、また演算器の数もずっと少ない。

 例えばKeplerの場合、1つのSMXには192個のSingle-Float CUDA Core、64個のDouble-Float Unit、32個のLoad/Store Unitと同じく32個のSFUが実装されている形で、こうした特殊な演算を利用すると途端に性能が落ちることになる。

 これはAMDも同じで、GCNには特殊な演算命令を持っておらず、ライブラリーで特殊な演算を(通常のベクトル演算器を使って)処理することになり、効率は悪い。

 同じようにインテルのMICアーキテクチャーで採用されるAVX512命令も、ここで扱われるのは基本的な演算の他はデータ移動やフォーマット変換のみである。

 これは、LINPACKなどに代表される行列の乗加算を大量に行なうといった演算にはかまわないが、HPCの用途が広がってきて、それ以外の計算も高速にさせたいなどと思った瞬間に行き詰まりを見せることになる。

 もちろんx86プロセッサーのFPUに相当するものが全部のシェーダーに入っていればこうした問題はだいぶ解決するのだが、これはインテルのMICアーキテクチャーよりもさらにエリア効率を落とすことになりかねない。

 フル機能を実装した倍精度対応のFPUが占めるエリアは、(ダイ上の)CPU全体の面積の中で無視できない割合を占める。ARMのプロセッサーが、FPUをオプション扱いで提供するのは、このあたりの損得勘定が難しいからである。

 これに関しては、今のところ各社あきらめ気味である。こうした特定用途向けには、既存の汎用プロセッサー(IntelのXeonやIBMのPower、長期的にはARMのCortex-Aシリーズなど)を多用するか、もしくはFPGAを利用するという方向性が固まりつつある。

 ただFPGAは「GPGPUにできないこと」をやらせる分には効率が良いが、汎用プロセッサーあるいはGPGPUにできることをやらせると、おそろしく効率が悪いという特徴があり、これも相まって用途に応じて使い分ける方向性になりつつある。

 インテルがFPGA大手のAlteraを買収した、というニュースをこうしたHPC向けの観点から見ると非常に興味深い。MICアーキテクチャー+FPGAというソリューションは、相互に補完しあえる可能性が高いからだ。

→次のページヘ続く (メモリー帯域が不足

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事
1
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
¥39,800
2
【整備済み品】中古 ノートパソコン NEC VersaPro VKT16/15.6型・第8世代Core i5-8250U(最大動作3.4GHz)/快適メモリ8GB/ 高速SSD 256GB/Win11 Pro/MS Office 2019付属/テンキー付, Webカメラ, USB3.0, HDMI, VGA, 有線LAN, WIFI内蔵, Bluetooth/ACアダプター付属/180日間保証
【整備済み品】中古 ノートパソコン NEC VersaPro VKT16/15.6型・第8世代Core i5-8250U(最大動作3.4GHz)/快適メモリ8GB/ 高速SSD 256GB/Win11 Pro/MS Office 2019付属/テンキー付, Webカメラ, USB3.0, HDMI, VGA, 有線LAN, WIFI内蔵, Bluetooth/ACアダプター付属/180日間保証
¥26,880
3
【整備済み品】富士 通 2in1ノートパソコン V727【本体のみ】/第7世代Core M3/12.3型タッチパネル1920×1080/メモリ 8GB/SSD 128GB/Win 11/MS Office 2019/USB 3.1/Type-C/無線WIFI/オーディオ内蔵/WEBカメラ/初期設定済
【整備済み品】富士 通 2in1ノートパソコン V727【本体のみ】/第7世代Core M3/12.3型タッチパネル1920×1080/メモリ 8GB/SSD 128GB/Win 11/MS Office 2019/USB 3.1/Type-C/無線WIFI/オーディオ内蔵/WEBカメラ/初期設定済
¥9,600
4
Lenovo Chromebook クロームブック IdeaPad Flex 3i Gen8 12.2インチ インテル® プロセッサー N100搭載 メモリ4GB eMMC 64GB バッテリー駆動12.0時間 重量1.25kg アビスブルー 82XH001KJP
Lenovo Chromebook クロームブック IdeaPad Flex 3i Gen8 12.2インチ インテル® プロセッサー N100搭載 メモリ4GB eMMC 64GB バッテリー駆動12.0時間 重量1.25kg アビスブルー 82XH001KJP
¥29,800
5
【Amazon.co.jp限定】 ASUS ノートパソコン Vivobook 15 X1502VA 15.6インチ インテル Core i7 13620H メモリ16GB SSD 1TB Windows 11 バッテリー駆動 8.9時間 重量1.7kg PC Game Pass 3ヶ月利用権付き クワイエットブルー X1502VA-I7H161W
【Amazon.co.jp限定】 ASUS ノートパソコン Vivobook 15 X1502VA 15.6インチ インテル Core i7 13620H メモリ16GB SSD 1TB Windows 11 バッテリー駆動 8.9時間 重量1.7kg PC Game Pass 3ヶ月利用権付き クワイエットブルー X1502VA-I7H161W
¥104,800

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII倶楽部

注目ニュース

  • 角川アスキー総合研究所

プレミアム実機レビュー

ピックアップ
1
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
¥1,880
2
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
¥1,390
3
【Amazon.co.jp限定】バッファロー microSD 32GB 100MB/s UHS-1 U1 microSDHC【 Nintendo Switch 対応 】V10 A1 IPX7 Full HD RMSD-032U11HA/N
【Amazon.co.jp限定】バッファロー microSD 32GB 100MB/s UHS-1 U1 microSDHC【 Nintendo Switch 対応 】V10 A1 IPX7 Full HD RMSD-032U11HA/N
¥1,880
4
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
¥660
5
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
¥980
6
【Amazon.co.jp限定】 ロジクール 静音 ワイヤレス トラックボール マウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウス ブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定 壁紙ダウンロード付き
【Amazon.co.jp限定】 ロジクール 静音 ワイヤレス トラックボール マウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウス ブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定 壁紙ダウンロード付き
¥5,280
7
Amazon Kindle Paperwhite (16GB) 7インチディスプレイ、色調調節ライト、12週間持続バッテリー、広告なし、ブラック
Amazon Kindle Paperwhite (16GB) 7インチディスプレイ、色調調節ライト、12週間持続バッテリー、広告なし、ブラック
¥18,980
8
バッファロー SDカード 128GB 100MB/s UHS-1 スピードクラス1 VideoSpeedClass10 IPX7 Full HD データ復旧サービス対応 RSDC-128U11HA/N
バッファロー SDカード 128GB 100MB/s UHS-1 スピードクラス1 VideoSpeedClass10 IPX7 Full HD データ復旧サービス対応 RSDC-128U11HA/N
¥2,000
9
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
¥5,545
10
エルパ(ELPA) 扉付タップラン 電源タップ 延長コード 125V 3m 3個口 ホワイト WBT-N3030B(W)
エルパ(ELPA) 扉付タップラン 電源タップ 延長コード 125V 3m 3個口 ホワイト WBT-N3030B(W)
¥652

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

デジタル用語辞典

ASCII.jpメール デジタルMac/iPodマガジン