今回取り上げるのは韓国rebellionsのREBEL-QuadというAI向けチップである。rebellionsは韓国初のAIユニコーン半導体企業なのだそうで、2025年3月には東京にもrebellions Japanを設立している。

rebellionsは2022年にION、2024年にATOMと呼ばれるAIチップをそれぞれ開発しており、どちらも市場出荷されている。IONはTSMC N7で8.7×8.7mmというコンパクトなチップで、FP16で4TFlops、INT 8/4/2でそれぞれ16/32/64TOPSの演算性能を2～6Wという低い消費電力で実現する、エッジAI向け製品である。

チップ単体のほか、HFT(High Frequency Trading:高頻度金融取引)向けのPCIeカード(名称はLightTrader)や、そのPCIeカードを8枚搭載したAIアクセラレーターサーバーなども用意している。

続くAtomはもう少しデータセンター向けに性能を高めた製品で、演算性能はFP16で32TFlops、INT 8/4で128/256TOPSの性能を持つチップをGDDR6 16GB DRAMと組み合わせてPCIeカードの形で提供しており、これを複数枚搭載したATOM-Max Serverや、そのATOM-Max Serverを複数台構成としたATOM-Max PODをすでにラインナップしている。

第3世代「REBEL-Quad」

チップレット構造で実現するLLM特化型性能

今回発表されたREBEL-QuadはION/ATOMに続く第3世代製品であるのだが、おもしろいのはこの製品は名前の通りRebel100というチップを4つ、チップレットの形で組み合わせた構造なことだ。

さてこのREBEL-Quadの目標は、LLMを実用的に利用できる性能を提供することで、実際にこれを実現できたとしている。

その設計目標が下の画像である。言っていることはわりと真っ当な話であるが、問題はこれをどう実装するかという仕組みである。

これに関する回答が下の画像である。基本的にはチップレットを全面的に採用する構造で、ただしあくまでも論理的にはそのチップレット構造を見せない配慮になっている。ただ将来はIOチップレットや(後で出てくる)メモリーチップレットなども自由に接続できるような配慮がなされている。

ちなみにIOチップレットはイーサネット向けとされているが、それがスケールアウトなのかスケールアップなのかは不明である。なんとなくrebellionsの考え方からすると、スケールアウトはチップレットでの接続に留め、イーサネットはスケールアウト向けという感じはしなくもない。

最後が電力管理の問題。時間当たりの電流と、PDN(Power Delivery Network)のインピーダンスのどちらも下げることで、電力供給の安定性を高められることになる。といっても、そもそも電力、というより電流を減らすには動作周波数を下げるしかなく、これは性能低下につながる。性能のターゲットが決まっている場合、この方策は取りにくい。

そこで、次善の策が負荷分散である。1つは時間的な電流負荷の分散である。つまりすべてのコアが一斉に稼働すると、ポーンと電流のピークが跳ね上がり、計算が終わるとコアが一斉に待機して電流が急減する。すなわち、コアの稼働にあたり若干の時間的ズレを入れてピークを高くしない方法、もう1つはEnergy Bufferingであるが、これは後述する。