Groqが前回取り上げたTSPを搭載した
Groq Cardを発表
今回は、AIプロセッサーをいくつか軽く紹介しよう。まずその前に前回の補足をしたい。
Groqであるが、AI Hardware Summitにあわせて同社はTSP(Tensor Streaming Processor)とTSPを搭載したカード(Groq Card)、およびそのカードを複数搭載するGroq Nodeを出荷するとともに、ソフトウェア開発環境であるGroq wareの提供を開始したことを発表した。
ちなみにGroqはAI Hardware Summitのスポンサーでもあり、それもあって同社CEOであるJonathan Ross氏による15分の基調講演があった(この内容はYouTubeに公開されている)が、残念ながらここで具体的なGroq Card/Groq Nodeの構成や価格、あるいは最終的に出荷される製品の性能などは明らかにされなかった。
現時点で判明しているのは下記のとおりだ。
- Groq Nodeの性能は最大で6PetaOps/秒、消費電力は3.3KW。Groq Nodeそのものは5Uのラックサイズで提供される。
- Groq CardはPCI Expressカードとして提供される。前回の最後で触れたように、製品版は1.25GHz駆動で1Peta Ops/秒の性能とされるので、おそらくはGroq Nodeの中にGroq Cardが6枚装着されていると思われる。
- Groq CardはTSP以外に「標準的なサーバーで利用される管理機能が提供される」とあるので、Groq Nodeはおそらくは2ソケットのXeon、もしくは1ソケットのEPYCをベースとしたサーバーで、ここにPCI Express x16が6本以上付き、Groq Cardが差さっているものと思われる。「6本」ではなく「6本以上」というのは、“Multiple Groq nodes can be connected in a wide variety of network topologies, enabling computation at a new scale.”(複数のGroq Nodeはさまざまなネットワーク構成で接続可能であり、これにより新たなスケーラビリティーを提供する)とあり、それこそ400Gイーサネットやインフィニバンドなど、さまざまなネットワークカードに対応可能(Groq自身はそこには手を出さない)という意味で、こうしたネットワークカードを装着するためのPCI Expressスロットが別途用意されるものと考えられる。
- TSPそのものはGlobalfoundriesの(おそらく)14LPPでの製造であるが、物理設計を担ったのはMarvellのASIC部門であった。つまりGroqは論理設計のみを担当し、これの実装はMarvellにお願いした形だ(上のプレスリリースにも、MarvellのASIC Business Unit CTOのIgor Arsovski氏がメッセージを寄せており、ここからも確認できる)。
まだ製品の出荷を開始しただけで、ビジネスとして成功するかどうかはまだ未知数であるが、製品化手前でコケるベンチャーも少なくないだけに、少なくとも製品出荷を開始したことは評価すべきだろう。

この連載の記事
-
第855回
PC
配線太さがジュース缶並み!? 800V DC供給で電力損失7~10%削減を可能にする次世代データセンターラック技術 -
第854回
PC
巨大ラジエーターで熱管理! NVIDIA GB200/300搭載NVL72ラックがもたらす次世代AIインフラの全貌 -
第853回
PC
7つのカメラと高度な6DOF・Depthセンサー搭載、Meta Orionが切り開く没入感抜群の新ARスマートグラス技術 -
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 - この連載の一覧へ













