このページの本文へ

前へ 1 2 3 次へ

新清士の「メタバース・プレゼンス」 第78回

話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは

2024年09月09日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

“閉じた”コミュニティーを充実させるMidjourney

 FLUX.1は大量の潜在空間を持っているのは間違いありません。ただし、後発であるため、描画の能力の高さを引き出すためには、ファインチューニング(微調整)や、LoRAなどを使った最適化が必要になるのは間違いありません。そこの最適化の部分を、公開することでコミュニティーベースでイノベーションの速度を高め、Midjourneyに追いつこうという発想に見えます。

 一方で、元祖オープンモデルのStable DiffusionのStabilityAIはどう動いているのか。先ほど述べたように、CivitaiなどがFLUXに全力を投入してくる中、様々な問題を抱えていたStable Diffusion Mediumについての追加発表はされていません。7月に継続的な改善を約束し、「今後数週間のうちに大幅に改善されたバージョンをリリースすることを目指しています」と発表していました。おそらく社内を再編した上で、再びトレーニングして改善版を出すことを目指しているとは思えるのですが。

 BFLがStabilityAIと同様の課題を抱える可能性があるとしたら、外部の企業にコミュニティー形成を任せているために、的確にハンドリングして、そのいい点を吸収できるかというところにあります。7月末にMidjourneyは、これまでDiscordのチャットbotとしてサービスをおこなっていたところを、ウェブサービスとして正式オープンしました。これは単に生成や管理が簡単になっただけでなく、コミュニティープラットフォームとしても強力です。

Midjourneyのブラウザ画面。プロンプトの検索ができるようになっている。虎の画像のプロンプトもベースは公開されているものを参考にしている

 何よりも、プラットフォームとして強力なのは、他のユーザーが生成した画像のプロンプトが検索できることです。プライベート化するためには、月60ドルのプロプランにする必要があり、基本的には生成した画像とプロンプトは公開されます。優れた画像だと気になったプロンプトや設定を真似て、自分でも似たような雰囲気の絵を作ったり、改造したりすることが簡単にできます。こうした仕組みが、ユーザーの画像の品質を引き上げる効果を果たしており、単に画像生成が高性能であるという以外の付加価値の追加にも、Midjourneyは成功しつつあります。

後発ならではの強みをどう出せるか注目

 今後、FLUX.1にとって重要なのは、まずはAPI利用を促進させ財務基盤を安定させることができるのか。次に、イノベーションのスピードをいかに上げ、オープンモデルであっても、Midjourneyに負けない品質が出るとの評価を取っていくのか。外部クラウド企業中心に進むユーザーコミュニティー形成からも、うまく自社の今後のモデルに反映するようにできるのかというところでしょう。後発企業だからこその強みを、どう発揮してくるのか注目です。

 

筆者紹介:新清士(しんきよし)

1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事
ピックアップ