動作させるだけで一苦労、コミュニティも活発とはいえず
また、実際にローカル環境で動作させようとすると、筆者の環境でもかなり苦労しました。
そもそもが、入力するプロンプトを画像にするために解析するテキストエンコーダーを4種(Llama、T5-XXL、CLIP-G、CLIP-L)も使います。Flux.1 Devの場合は3種類だったため、テキストの理解力はこの追加により引き上げられているのかもしれません。しかし、当然ですが、その分、VRAMの使用量が増加します。量子化(軽量化)が小さいfp16モデルだとそれぞれ34.2GBもあり、fp8モデルでも17.1Gもあります。さらにClipも読み込むわけですから、VRAMが多く必要になるわけです。
とはいえ、全体をフルパッケージで自動的にインストールしてくれるような便利なインストーラーは存在しないようで、WebUI A1111系にも対応していません。そのため、最初のファイルの設定はかなり戸惑いました。この時点で、挫折する人は多そうな気がします。
ComfyUIが公開しているHiDream-I1にネイティブ対応したサンプルワークフロー。特徴は対応するために新たに作られた4種のCLIPを読み込み可能にした「Quadruple CLIP Loader」(ComfyUIリンク)
なによりHiDream-I1には課題があります。一定量の強力な性能を誇りながらも、エコシステムを作るところに苦戦していることです。
いずれのモデルも厳しい制限がないMITライセンスで公開されており、商用利用についても大きな制限がかかっていないという使いやすさがあります。しかしながら、公開されているHuggingFaceのダウンロード数は、Devが3万2000、Fullが4万で、Fastが6万3000にとどまっています。FullとFastの2モデルの公開は一定の成功を収めているとは言えるものの、すでに公開から250万回以上ダウンロードされているFlux.1 Devに比べると、現状のユーザー数は大きく見劣りします。
LoRAなどの追加学習データを作りやすい環境も登場していないようで、ユーザーが公開したLoRAの数も少なく、あまりコミュニティは活発ではないようです。同様に、ControlNetといった画像を制御するための追加モデルも開発されている気配はまだありません。
やはり要求スペックが高すぎることもあり、利用者をかなり選んでしまうことや、性能の高さがあるにしても、多くのユーザーにとっては既存のエコシステムから急いで切り替えたいと感じさせるほどではないといったことが原因なのでしょう。また、そもそもの画像が、少し中国風に寄りすぎているという印象もします。
本来はライセンスとしても使いやすいモデルのはずなのですが、サービス展開しているAIクラウドサービスも限られており、「Replicate」や「Fal.ai」といったクラウド時間貸出型の一部サービスに限られています。Fullバージョンの公開が4月と後発であることもあって、今後の広がりを目指していくことになると思われますが、特に欧米圏での認知が遅れているという印象です。もちろん、中国語圏で開発されたという強みがあり、中国では支持されているようですが、それでもAPI展開には中国政府の検閲規制もあるために中国本土向けにも思うように広げることができない事情もあるようです。
ただ、4月28日には「HiDream-E1-Full」というというimage-2-image(画像から画像)に対応したモデルを追加で発表しました。ユーザーの画像をより自分の意図通りにコントロールしたいというニーズに応えようという努力は続けています。

この連載の記事
-
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 -
第123回
AI
グーグルの画像生成AI「Nano Banana」は異次元レベル AIコンテンツの作り方を根本から変えた -
第122回
AI
動画生成AI「Wan2.2」の進化が凄い アリババが無料AIモデルの牽引者に -
第121回
AI
愛していたAIが消えた日 ChatGPTだけと“付き合う”危うさ -
第120回
AI
ラフさえ描けばイラスト作品ほぼ完成 画像生成AI「FLUX.1 Kontext」LoRAが示す制作の未来 - この連載の一覧へ







