Stability.AIは5月10日、同社の画像生成AI製品「Stable Diffusion 3」や「Stable Video Diffusion」などを、競合サービス「Midjourney」のように「Discord」上で利用することができるサブスクリプションサービス「Stable Artisan」の運用を開始した。
豊富な編集ツールも用意
これまで同社の画像生成AI「Stable Diffusion」シリーズは、ローカル環境にダウンロードして利用するのが主流(APIもあり)だったため、高性能のグラフィックボードが必要になるなど利用のハードルが他社サービスと比べて少し高かった。
今回発表されたStable Artisanに加入すれば、コミュニケーションプラットフォームDiscordを利用して、誰でもすぐに画像生成を楽しむことができるようになる。特に、これまでAPI経由でしか利用できなかった同社の最新モデル「Stable Diffusion 3」を気軽に試せるのが嬉しい。
利用するにはStability.AIのサイトでサブスクリプションを購入したあとDiscordの「Stable Diffusion」サーバーに接続する。
「スラッシュコマンド」を利用した操作方法はMidjourneyと酷似しており、Midjourney経験者はこちらもすぐに使うことができるだろう。
作成した画像は直感的なツールを使って下記のような様々な編集作業が可能だ。
・Search and Replace
テキストで指定するだけで画像内の「犬を猫に」といったインペインティング処理が可能になる。
・Remove Background
画像から前景を正確にセグメント化し、背景を削除する。
・Creative Upscale
低解像度または低画質の画像を4K解像度にアップスケールする。
・Outpaint
画像の周囲に追加コンテンツを挿入する。
・Control Sketch
ラフな手描きスケッチを、正確なコントロールで高品質な画像に変換する。
・Control Structure
入力画像の構造を維持して画像を生成する。
・Video
Stable Video Diffusionを使用して、初期画像に基づいた短いビデオを生成する。
Midjourneyよりも安価
料金はクレジット制になっており、画像一枚の生成は3クレジットから(使用モデルや処理によって変動する)可能になっている。
月額9米ドル(およそ1400円)のSTANDARDプランは月に900クレジットなので、300枚の画像を生成できる計算になる。
なお、Midjourneyの最低サブスクリプション料金は月額10米ドル(およそ1560円)だ。
また、年間契約すると年額90米ドルとなり、月額では7.5米ドル(およそ1170円)となる。
現在3日間のフリートライアルが提供されているので、3日以内に退会すれば料金はかからない。
SD3をいち早く試せる
画像の生成はMidjourney同様に「/(スラッシュ)」で始まるスラッシュコマンドを利用する。入力欄に「/」と入力するだけで候補が表示されるので、そこから「/dream」を選ぼう。(なおMidjourneyの場合は「/imagine」となる)
「/dream」に続けてプロンプトを入力する。ここでは「a girl wearing T-shirts stand at pavement」とした。
しばらく待つと2枚(Midjourneyは4枚)の画像が生成された。デフォルトのモデルは「SD3」、サイズは1024x1024、アスペクト比は1:1だ。これらの数値は後述するオプションで変更できる。
拡大するには「View & Edit Image◯」をクリックする。
拡大された画像。下部のボタンをクリックすることでアップスケールやアウトペインティング、オブジェクトの入れ替えや「Stable Video Diffusion」を利用した動画の作成などが可能になる。
「Remove Background」で背景を削除した画像。
Stable Video Diffusionで動画化したもの。(本来作成される動画フォーマットは「MP4」だが、ここでは「gif」に変換しているため多少画質が異なる)
画像モデルを変更する
デフォルトでは同社の最新画像モデル「SD3」が選択されるため、1枚の画像を作成するのに6.5クレジットかかってしまう。これを回避して3クレジットで生成できる「Image Core」にモデルを変更する方法を最後にお伝えしておこう。
「/dream」コマンドを入力した状態で「タブ」キーをクリックすると、上部に設定コマンドがいくつか表示されるので「model」を選択。
モデルを「SD3」から「Core」に変更。これだけでクレジットを1枚6.5から3に減らすことができる。
参考までにまったく同じプロンプト(a beautiful girl)とシード値(271969723)で生成してみた。こちらが「SD3」で生成したもの。
こちらが「Core」で生成したものだ。