暗号化通信など、現在もコプロセッサーが活躍する
ネットワーク分野
前回は、TCP Offloadingを行なうコプロセッサーの話を少し紹介したが、最近のネットワークではこんなクラスでは到底間に合わないほど高い処理性能を必要とする。
例えばインテルは2011年のIDF Beijingで、LTEの基地局の処理をCore i7で置き換えた研究プロジェクトを紹介したが、実際には基地局向けのCPUはもっと先に進んでいる。
下図はFreescaleが基地局向けに現在提供している「QorIQ Qonverge B4860」というCPUであるが、CPUコアそのものも同社の「e6500」という2スレッド対応コアが4つ、つまりCore i7などと同様に同時8スレッド動作が可能だ。
そのうえ「StarCore SC3900」というDSPコアを6つ搭載するほか、MAPLE-B3と呼ばれるLTEや3/3.5Gの通信プロトコルを解釈して処理できるコプロセッサーを搭載している。
この「B4860」は1000ユーザー規模の、いわゆるMacro Cellと呼ばれる大規模基地局向けのSoCであるが、このクラスになると通信プロトコルなどの決まりきった処理はコプロセッサーで処理するのが、性能面でも消費電力およびダイサイズの面でも有利と考えられている。
こうした方向性はFreescaleだけではなく、例えば米CAVIUM Networksの「OCTEON III」という最大32コアのMIPS64ベースのネットワークプロセッサーの場合、RAID/XORエンジンやDPI(Deep Packet Inspection)エンジン、圧縮伸張エンジンなどのコプロセッサーと、これらを制御するアプリケーション・アクセラレーション・マネージャーがCPUコアの外側に設けられており、これらを併用する形でCPUの負荷をなるべく減らすように工夫されている。
「OCTEON III」が凄まじいのは、TDPがローエンドだとわずか3W未満に抑えられていることである。ローエンドなのでCPUコアは1つになるので、CPU性能を使ってのネットワーク処理だとかなり性能が落ちることになるが、コプロセッサーを利用することで一定の処理性能を維持できる。
ここまでの話はCPUに組み込まれたコプロセッサーであるが、サーバー向けなどではTLS/SSLのアクセラレーターが拡張カードとして提供されてきていた。TLSとはTranspoer Layer Security、SSLとはSecure Socket Layerの略で、要するにインターネットで暗号化通信を行なうときに利用されるプロトコルである。
例えばウェブブラウザーでhttps://で始まるアドレスにアクセスする場合、その通信はSSLを使って暗号化されており、途中で傍受されても解読ができないようになっている。
この暗号化をCPUで行なうとそれなりに負荷がかかるため、専用ハードウェアを使って暗号化処理をすることでCPUの負荷を減らそうというアイディアは当然出てくる。
それを実現したのがTLS/SSLアクセラレーターで、米Silicon Ltd.は様々な拡張カードとしてこのアクセラレーターを提供している。これも一種のコプロセッサーと呼んで差し支えないだろう。
もっともある程度規模が大きくなると、サーバーの中にコプロセッサーを追加して処理を高速化するよりも、SSL/TLSに対応した専用アプライアンスを追加し、ここでSSL/TLSの処理をしたほうが効率的という議論は当然ある。
米A10 Networksが提供するAXシリーズがこの好例であるが、AXシリーズの場合はクライアントとサーバーの間に入り、クライアントから来たSSL接続要求を受け取って暗号化/復号化処理を一手に行なってしまい、サーバーとの間は暗号化無しとすることで、サーバー側の負荷を減らす仕組みである。
A10 Networksは、これをSSL/TLS Offload(関連リンク)と呼んでいるが、アクセラレーターをCPUというかシステムの外に追い出してしまうという方向性は、特にネットワークの場合では顕著になりつつある。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ