Stability AIは11月17日、日本に特化した画像生成AI「Japanese Stable Diffusion XL(JSDXL)」を発表した。
日本語の直接認識にも対応「JSDXL」の主な特徴
同モデルの主な特徴は以下の通りだ。
●AIが直接日本語テキストを認識可能
入力された日本語のプロンプトをAIが直接扱えるため、日本語特有の表現も認識可能。これまでのように翻訳ツールを介してプロンプトを入力する必要はない。
●日本スタイルや日本を題材にした画像の生成能力を強化
伝統的なものから現代的なものまで、日本の広範囲な文化やアートを反映した画像の生成能力を強化している。一般的に大規模に学習されたモデルは西洋系の画像生成に長けているが、このモデルは英語版「SDXL」が抱えていた、西洋系の画像に比べて日本スタイルの画像生成が苦手という弱点を克服している。
●テキストエンコーダーを1つに減らし推論を効率化
テキストエンコーダーの搭載数をSDXLの2つに対し、本モデルでは1つに削減。より効率的な推論を実現した。
商用利用に対応、デザインやプロモーションの現場での利用も想定
JSDXLはプライベートでの利用にくわえ、商用利用にも対応。日本市場向けのプロダクトデザインや広告の制作、ゲームや映画制作時のアイディア出しといった使い方も可能だ。
さらに、出力結果を任意のドメインの画像にチューニングすることで、よりユーザーのニーズに即した画像を生成することもできるという。
AIの構築に利用した学習データについても権利関係の配慮がなされており、以下に該当するデータは使用されていない。
- クリエイターから要求があったオプトアウト
- robots.txtや利用規約に基づいて禁止されたデータ
同社は今後の展望について「複数モダリティのモデルを積極的に研究開発・公開することで、日本のAIコミュニティのさらなる活性化に貢献していく予定です」と述べている。