評価するための情報が足りなすぎるが
すでに量産チップがあるのが強み
さて、どうやってこれを実現しているのかという話にやっとたどり着くわけだが、実は現時点でも詳細は未公開なままである。特徴として紹介されたのは以下の2つなのだが、後者はともかく前者は説明でもさらっと流されてしまって、いまだにイメージが湧かない。
- Structure-driven Data Flow Architecture
- ソフトウェアは常に進化中
全体では8つのクラスターと呼ばれる塊があり、上の画像にある8×13個のタイル(この数も適当なもので、実際の製品とは異なる気がする)全体が1つのクラスター(あるいはクラスターの一部)というあたりなのだろうが、その辺の詳細はさっぱりわからない。
26TOPSというからには、かなりの数のコンピュートタイルが含まれている(あるいは、1つのコンピュートタイルが鬼のような演算性能を持っているか)になるのだろう。
Structure-drivenというのは、ひょっとするとソフトウェア側でタイルの割り振り方をネットワークのビルド時に決定するので、上の画像で言うところのLayer 1~8がどのタイルに割り当てられるかなど、それぞれのレイヤーの中でタイルがどう接続されるかが静的に決定されるが、実際に各タイルがどう動くかはデータフローなので、データが来たときだけ稼働することになるので省電力、というあたりなのかもしれない。
特徴としてもう1つ示されたのは、制御とメモリーにスケーラビリティーがあるという話だが、これも雲をつかむような話である。
例えばメモリー・スケーラビリティーもどのくらいの規模のパラメーターならオンチップで収まるが、それを超えた時にどのくらいのスループットでホスト側からフェッチできるのか、その際のレイテンシーはどう遮蔽するのか(Swiftly fetchedと言われても解釈が難しい)などは一切不明なままである。
このHailo-8、仮にこのプレゼンテーションだけをベンチャーキャピタルに持って行ったら「評価するための情報が足りなすぎる」で終わるし、それは潜在顧客の所に持って行っても同じだろう。
ここでHailo Techが強いのは、すでに量産チップがあることだ。「まずは試してみてくれ。その後で必要なら情報を(秘密保持契約の締結後に)開示する」みたいなことが可能になるし、おそらくはそういう形でビジネスしているのだろう。
今年8月のHotChipsにはHailo Techも参加するそうで、ここではもう少しチップ内部の説明がなされることを期待したいところだ。
この連載の記事
-
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU -
第787回
PC
いまだに解決しないRaptor Lake故障問題の現状 インテル CPUロードマップ -
第786回
PC
Xeon 6は倍速通信できるMRDIMMとCXL 2.0をサポート、Gaudi 3は価格が判明 インテル CPUロードマップ - この連載の一覧へ