このページの本文へ

画像生成AIベンチマークでいきなり1位、業界騒然「Recraft V3」

2024年10月31日 13時00分更新

文● G. Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 AIグラフィックデザインスタートアップのRecraftは10月30日、最新の画像生成モデル「Recraft V3」を発表した。画像の品質が業界最高水準を達成したことで、業界内で話題となっている。

 Recraft V3は、Hugging Faceが主催する業界標準のベンチマークテスト(TEXT TO IMAGE MODEL LEADERBOARD)でELOレーティング1172点を記録し、MidjourneyやBlack Forest Labsなど主要企業のモデルを上回り首位に立った。

 Recraft V3の特徴は、長文のテキストを画像として生成する機能を備えること。従来の画像生成AIは1〜2語程度の短いテキストしか扱えなかったが、Recraft V3では複雑な文章を画像に組み込める。

 解剖学的な正確さも特徴の1つだ。AI画像で頻繁に指摘される指や手足の数、体の比率が適切で、背景オブジェクトとの空間的な整合性も保たれている。また、プロンプトで指定した複雑なシーンを正確に再現し、オブジェクトの数、色、位置関係も忠実に表現できる。

 デザイナー向けの機能も備えている。画像内のテキストの位置やサイズを正確に指定できる配置制御機能や、複数の画像とテキストを組み合わせた複雑なグラフィックデザインの生成が可能だ。

 Recraft V3は、Recraftのデスクトップアプリ、iOS/Android向けモバイルアプリ、API経由で無料・有料ユーザーともに利用できる。API利用ではラスター形式とベクター形式の両方をサポートし、テキスト付き画像の生成や、ブランドとしての一貫性を持たせるカスタムスタイル作成機能にも対応している。

 Recraftは2022年、機械学習フレームワーク「CatBoost」開発者であるAnna Veronika Dorogush氏が設立した、英国ロンドンを拠点とするAIグラフィックデザインスタートアップ。AdobeやCanvaなどの大手企業に対抗する形で、独自の基盤モデル開発によって差別化を図っている。

 

■関連サイト

カテゴリートップへ

ピックアップ