M35DはAlveoシリーズ初の
FPGAを搭載しない製品
前提の説明が終わったので今回の説明に移りたい。今回発表されたAlveo M35Dは、Alveoの名前は冠しているもののFPGAは搭載されておらず、その代わりエンコード/デコードに特化した専用のASICチップを2つ搭載している。
なぜFPGAではなく専用のASICを起こしたか? というと理由は以下の2つがある。
(1) エンコード/デコードに限るとFPGAのメリットが薄れてきた。FPGAのメリットは、例えば新しいアルゴリズムやフォーマット、プロトコルが出てきた場合に、すぐにロジックを書き換えて対応できることが最大のものなのだが、動画のフォーマットはもう決まっており、そのエンコード/デコード手法もほぼ確立している。
2020年に最初にビデオアプライアンス向けに発表されたとき、H.264はともかくH.265はまだ使われ始めた(*)ばかりで、エンコーダー/デコーダーも十分に熟していたとは言い難かったが、もう現状ではエンコード/デコード方法は十分確立しており、処理を後から変更する可能性は非常に少ない。
AV1についても、以前からFPGA用にAV1のエンコーダー/デコーダーIPを提供、さらにそのIPを使ってまずRadeon RX 6000シリーズでデコードを、RX 7000シリーズではエンコードとデコードをハードウェアで行なえるようにしており、こちらも今後大幅に中身が変わる可能性は少ない。となると、FPGAを使うメリットがほとんどない。
(2) その一方でFPGAとASICを比較すると、ロジック密度は一桁違う(ASICで実装していた処理をFPGAに持っていくと、実装には10倍くらいのトランジスタが必要になる)。これは当然実装密度に跳ね返ってくる。つまり無駄にダイが大型化するわけで、消費電力と発熱が増え、おまけにコストまで上がる。また消費電力が上がるということは高速化しにくいということでもある。
以上のように、中のロジックを書き換える可能性が非常に低い用途であれば、FPGAのままではなくASICに切り替えた方がずっと効率的である。実際にはもう1つファクターがあって、それはASICを作る場合のNRE(初期コスト)が異様に高いので、ある程度数が出ない場合にはASICのコストを回収できないというものだ。
ただAMDくらいの販売規模であれば、これはそもそも問題にならない。設計のためのコンポーネントはFPGA用にすでにIPのかたちで保有しているから、それをそのまま使えることになる。実際には細かな改良を施した、という話ではあったが。
またASICを作る場合にはEDAツール(論理/物理設計を行なうための開発ツール)を使う必要があり、これがまた高かったりするのだが、AMDはすでにCPUやGPUのためにこれらのツールを当然大量に導入しているわけで、そうするとNREはそれほど大きいとは言えない。5nmプロセスに関してもすでにZen 4コアやRDNA 3コアで実績を積んでいる。こうなるとASICにしない方がむしろ不思議なくらいだ。
そんなわけで、これまでFPGAで実装していたエンコーダー/デコーダーを完全にASIC化することで、処理性能を大幅に向上させたのがAlveo M35Dということになる。おもしろいのは、特にAV1の処理のためにAIプロセッサーも搭載していることで、全部が全部ロジックで固まっているわけではない。
後述するがトータル8コアのCPUも搭載されている。Alveo U30との比較は下の画像のとおりなのだが、この手のスライドとして誤解を招きやすい。
チャネル密度とコストに関しては文字通りであるが、圧縮率はH.264とAV1の比較である。Alveo U30はAV1のエンコードができないから、これが可能なAlveo M35Dは最大1.8倍の圧縮が可能という話で、H.264同士で比較したらもちろん圧縮率そのものは大きくは変わらない(これは後述)。
またレイテンシーも、Alveo U30がH.264/4Kだと最大30fpsのエンコードが可能で、一方Alveo M35DはAV1/4Kで120fpsのエンコードが可能なので、1フレーム当たりの時間で言えば33.3ms vs 8.3msでレイテンシーを4分の1に減らせるという意味で、間違ってはいないが同じH.264同士とフレームレートだと当然同じレイテンシーになる。
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ