このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」 第48回

画像生成AI、フリー時代は終わりに向かう? 有料サービスが目立ちはじめた

2023年12月25日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

AI技術の発展に伴い、肥大化していく開発コスト

 なぜこうした方向になっていくかといえば、学習データの開発にコストがかかるようになっているためでしょう。AI分野での人件費の高騰もあります。肥大化し続ける開発費を回収するため、自らのモデルを公開することなく、クラウド上で展開される課金サービスが今後は主流になる段階に入ったと思えます。

 ただし、これは何も悪いことばかりではなく、一般ユーザーにとってのサービス体験も向上させられます。

 例えば、先月末に正式サービスを開始したアップスケーラー専用AI「Magnific.ai」もクラウドのみでサービスを展開しています。月30ドルで200枚生成できます。特定の画像を読み込むと、ディティールを描き込んだ上で、2倍サイズの画像を生み出してくれるというサービスです。

 特定能力に特化したウェブサービスならではの直感的な使いやすさがあります。

Magnific.aiの実行画面。シンプルなUIで非常に使いやすい。女性のディティールが上昇しているのがわかる。同じようなことはStable Diffusionでも可能だが、設定は複雑(筆者作成)

 Discordを使って画像生成をする仕組みだったMidjourneyも、現在ウェブサービスで利用できるように準備を進めています。一部ユーザーを招待し、α版の運用が始まっています(Midjourney Alpha)。現状のDiscordを使ったUIよりも圧倒的にわかりやすくなっています。スタンダードプランは月20ドルです。

Midjourneyのブラウザの画面(筆者のページ)。上方に「+image…(coming soon)」の表示があり、近くブラウザで生成できるようになることが予告されている

 Stable Diffusionを共同開発していたRunwayは、昨年10月に「Stable Diffusion v1.5」をオープンデータとしてリリースした後、生成動画サービスに集中しましたが、そのサービスはすべてクラウドサービスとして展開しています。実質的な標準のプロの価格は月28ドルです。

Runwayの作成画面。頻繁なアップデートを続けて、品質の向上が続いている

 それぞれの特化した性能の高さを利用して、「Midjourneyで画像を生成し、Magnific.aiでディティールを作り込み、Runwayで動画化する」といった試みも欧米圏のユーザーには出てきています。合計すると月に80ドル(約1万1300円)程度の費用がかかってしまうため、使える人は限られると言えますが、プロフェッショナル用途では複雑化が続くローカル環境ではなく、整理された機能で絞り込んで品質の高い用途を求めるニーズが出てきているとも考えられます。

▲完成画像

 今後も、Tiktokのようなライトなユーザーにも簡単に扱えるようにする環境と、プロ用途に耐えうるものとして使われる環境はどちらも追求されることになるでしょう。しかし、そのどちらも肥大化する開発費をいかに回収するのかという段階に入りつつあるとも言えます。

 画像生成AIは、その技術が複雑化し応用範囲も広がっていますが、学習データを少コストで開発し、それで競争力を持つことができたイノベーションの最初期段階は終わりに向かいつつあるように思えます。来年には、その傾向はさらに顕著になるのではないでしょうか。

 それでも、ControlNet、LCM、AnimateDiffといった小さなチームがローカル環境に引き起こした革新は今年1年に起きているので、少チームでの技術革新の余地はまだまだ残っていると期待したいとも思います。

 

筆者紹介:新清士(しんきよし)

1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事
ピックアップ