X「Grok 2.0」画像生成機能にも採用
さらに、8月14日に衝撃が広がりました。XのAI機能「Grok 2.0」がリリースされ、画像生成AI機能が追加されたのです。そして、その技術がFlux.1であると明らかにされたのです。Xに課金しているユーザーであれば、Grokに作ってほしい画像を入力するだけで、簡単に高画質な画像を生成することができるようになりました。
1時間で20回の生成条件があったり、横長のサイズしか生成することができませんが、日本語で指示しても、プロンプトを英訳して出力してくれます。世界で数億人のユーザーを抱えているSNSプラットフォームで、手軽に高性能な画像生成AI機能が展開されたケースは初めてでもあり、有料ユーザー数の拡大に貢献するのかどうかに注目が集まっています。
XはMidjouneyと交渉していることがイーロン・マスク氏からも何度もほのめかされていたのですが、Flux.1を選択したようです。Midjouneyは有料プログラムによって十分に収益を出していると推測されており、Xへの展開でのライセンス条件が結局は折り合わなかったのではないかと考えられます。
ただ、採用されているモデルは、schnellモデルと同じかというとそうでもなさそうです。
前述の「ペットボトル」プロンプトで生成してみたところ、devモデルともschnellモデルとも少しニュアンスの違う画像が出てきます。生成時間も約5秒と非常に短く、複数回試してみると、ペットボトルを手に持っていない画像が生成されることもありました。schnellモデルよりもさらに軽量なカスタムモデルを使っているのではないかと考えられます。
GrokのAI画像生成機能は、他社のクラウドサービスに比べて、コンテンツフィルターが甘めであることがわかっており、イーロン・マスク氏やトランプ大統領といった有名人、ピカチュウから初音ミクまで有名IPのキャラクターといった、いわゆるディープフェイクも簡単に生成可能な状態です。マスク氏傘下の企業らしく、かなり型破りな形でサービスをスタートしています。生成した画像の責任はユーザーにあると規約上は定義されているものの、今後もこのままの方針で行くのかは短期的には焦点となるでしょう。
日本語でも、英語に翻訳して画像を生成してと指定すると、普通に出せました。これでいいかも。 pic.twitter.com/DKX1qBfqWP
— 新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) August 14, 2024
先行企業に学び、後発企業が迅速に攻めていく
Stability AIからスタッフがいつ抜けて、このBFLを組織化したのかは明らかにされていません。ただ、ビジネスモデルを含めて、新会社だからこそ、ゼロから効率よく作れたということではないかと思います。スタート段階だと人数が少ないので人件費も少なくて済むし。権利的にも揉めている相手がいないですからね。IT業界では、先行している企業が常に勝ち残るというわけではなく、後発の企業が先行する企業の動きから学び、効率的に迅速に攻めてすべてを持っていくというのはよくある話です。Stable Diffusionが独占的な地位にあったオープン分野の画像生成AI分野でも似たようなことが起きるのかもしれません。
この連載の記事
-
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは - この連載の一覧へ