このページの本文へ

前へ 1 2 3 4 5 次へ

Stable Diffusion入門 from Thailand 第17回

人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する

2024年07月10日 20時00分更新

文● 田口和裕

ツイートする
一覧
お気に入り

　テキストによるプロンプト（指示）から精細な画像を生成する画像生成AI。無料もしくは安価で利用できる環境が増えるなか、「どのAIを利用すればいいの？」という疑問も自然と出てくる。

　費用、手軽さ、描画速度など比較項目はいくつか考えられるが、やはりいちばん気になるのは“画風”ではないか。

　もちろんプロンプトなどにより好みの画風にすることはある程度可能だが、モデルそれぞれの特徴や得意分野があるため、ある程度の傾向は存在する。

　この記事は、現在注目を集める4つの主要な画像生成AIモデルに同じプロンプトを与えて生成された画像を比較することでそれぞれの傾向を明らかにし、モデル選択の助けになることを目的としている。

^{※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpで配信中の記事をご確認ください}

取り上げる4つのモデル

　それでは、本記事で比較する4つのAIモデルを紹介しよう。

Midjourney

　Midjourneyが提供する画像生成AIサービス。コミュニケーションプラットフォーム「Discord」経由での利用が必須だったがブラウザーから利用できるUIもテスト中。以前は無料でも利用できたが現在は月額10米ドル（およそ1600円）からのプランを購入する必要がある。最新のモデルバージョンは「v6」。

　なお、使い方はこちらの記事を参照。

DALL-E 3（Microsoft Copilot Designer）

　OpenAIが開発し、マイクロソフトがCopilotサービスに統合した画像生成AI。ChatGPTの有料プランであるChatGPT Proでも利用できるが、Copilot経由だと制限はあるが無料で生成できる。自然言語による詳細な指示が可能で、高品質な画像生成が特徴。

Stable Diffusion XL（SDXL）

　Stability.AIが開発したオープンソースの画像生成AIモデル「Stable Diffusion」の拡張版で、より高解像度で詳細な画像生成が可能。ユーザーは直接このモデルをダウンロードしてローカルで利用できるのが最大の特徴だ。ただしそれなりのマシン環境が必要になる。ユーザーが作成した派生モデルも多数出回っているが今回はその大元であるベースモデル（stable-diffusion-xl-base-1.0）を使用した。

　インストールや各種設定が初心者にはハードルが高いが、Stability Matrixを使えばかなりハードルが下がる。

Playground

　Playground AI社が提供する画像生成AIモデル。現在のバージョンは2.5。DALL-E 3やMidjourney同様ブラウザーから利用可能。直感的なUIと素早い画像生成が特徴で、アーティストやデザイナー向けの機能も充実している。無料でも1日50枚の画像生成が可能。

8つの異なるジャンルで比較

　それぞれのモデルの特徴を明らかにするため、「リアル美少女」「アニメ風美少女」「メカ系美少女」「男性キャラ」「自然風景」「サイバーパンク」「不気味な怪物」「料理」の8つの異なるジャンルの画像を生成してみた。

　各ジャンルにつき1つのプロンプトを作成し、4つのAIモデルすべてに同じプロンプトを与えて画像を生成し、比較・分析する。各モデルの強みと弱み、そして特徴的な表現を把握し、自分の好みに最も適したAIモデルを選択する助けになることを目指している。

　プロンプトの質も重要だ。ただ「リアル美少女」とひとこと入力しただけでも生成はされるだろうが、あまりにも漠然としすぎているため、1枚ごとにバラバラの画像になってしまうだろう。

「リアル美少女」のみで生成（Midjouney）

　ある程度内容を細かく指定したプロンプトを用意することで、プロンプトに対する忠実度もわかるので、大規模言語モデル（LLM）に考えてもらうことにした。また、一般的に日本語よりも英語によるプロンプトの方が追随性も高いのでそこもLLMにおまかせだ。

プロンプト：画像生成AIで「リアルな美少女」を生成するプロンプトを英語で書いて

　まずはChatGPTに聞いてみると、期待通り長めのプロンプトを生成してくれた。ただ、気を回してくれたのか「inspired by japanese anime」という文字が入っているのでこれはNG。

ChatGPT（GPT-4）

　キーワードによってはこのように回答を拒否されることもあるが、聞き方を工夫することで回避できる。以後、プロンプトはChatGPTとClaude 3.5 Sonnetを併用して作成している。

Claude 3.5 Sonnet

　個人的にはClaude 3.5 Sonnetの方がプロンプトのセンスはいいと感じた。

　それでは、8つのジャンルそれぞれについて、4つのAIモデルが生成した画像を詳しく見ていこう。

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2025年03月21日

AI

【解説】Geminiの画像生成がすごい　無料で使えるうちに試してみて
2025年03月24日

AI

無料で使えて超高品質、画像生成AIの最新事情
2025年03月10日

AI

動画生成AIの進化がすごい　「超リアル」「ローカルで動く」2つの方向に
2025年03月21日

AI

グーグル「NotebookLM」にみんな大好き「マインドマップ」機能が追加！
2025年03月17日

AI

文章術としてのCursor入門
2025年03月21日

AI

AIがあるので、今年はエンジニア採用やめました　Salesforce
2025年01月27日

AI

動画生成AI、ついにアダルトの扉が開く
2025年03月13日

ビジネス

世界にわずか数台!! 原子1つまでハッキリ見える透過型電子顕微鏡ほか、産総研先端設備を一挙紹介
2025年03月18日

AI

アレクサとの会話がすべてアマゾンに送られるようになる
2025年03月27日

AI

ChatGPTの画像生成で「ジブリ風イラスト」バズる　サム・アルトマンCEOもジブリ風に

ピックアップ

sponsored
手軽なのに安心なサイバーセキュリティ対策「QTクイックセキュリティアセスメントサービスpowered by KDSec」

自社のセキュリティ対策の弱点を2週間で可視化　中小企業向け問診型のセキュリティ診断
sponsored
気軽に着けられるサイズと価格、最長14日間の動作や充実の睡眠モニタリングなどが特長

人気スマートバンドがさらに魅力的に進化！ファーウェイ「HUAWEI Band 10」レビュー
sponsored
JN-i238G200F-HSP-Wをレビュー

200Hzの23.8型ゲーミングディスプレーが2万980円!? さすがに安すぎるけど大丈夫？
sponsored
Wi-Fi 7対応の「Archer BE450」「Archer BE220」、便利なスマートリモコン「Tapo H110」

Wi-Fi 7ルーターで一番売れてたTP-Link！　Amazon限定版は納得の高コスパ、メッシュ化もスマートホームも快適だ
sponsored

ストリーマー・はつめが爆速光回線「ビッグローブ光10ギガタイプ」で配信もゲームもストレスゼロの新体験！
sponsored

ヤリ手ビジネスマンになりたければビッグローブ光10ギガタイプを選べ！ベテラン編集者が新人営業マンに教える高速回線の重要性
sponsored

【PC作業効率大幅上昇】「ノートPCでマルチディスプレイ環境」の基本のキを、マウスのDAIVノート＋iiyamaディスプレイで学ぶ！
sponsored

”モンハンワイルズ”を遊べる！インテル Arc B580ならOS込み15万円でゲーミングPCを作れる
sponsored
Backlog World 2024の運営ではチームワークマネジメントを実践していた

「解散が寂しくなる」ような居心地のいいチーム作りはどうやって実現するのか？
sponsored
積み上がる課題とタスクをチームで前向きにさばくためのBacklog活用

メンバーのやる気をMAXにするチーム組成術　コミュニティイベントから学ぶ
sponsored

驚くほど広くて高解像度のノートがほしい!?　それなら14型＋14型の2画面ノート「Zenbook DUO UX8406CA」だ
sponsored

究極のデジタルライフとカーライフの両立　歯科医レーサーの及川紗利亜がビッグローブ光10ギガタイプで実現
sponsored
この春購入したいマウスコンピューターのノートパソコンをピックアップ

新生活始める人にピッタリなパソコン見つけた！マウスのノートパソコンを選ぶ8の理由
sponsored
MSIからまさかのGoogle TV対応ディスプレーが登場、「Modern MD272UPSW」レビュー

新生活にテレビ不要ならアマプラもネトフリも見られる4Kスマートモニターがベストバイ
sponsored
SOUND TECTORのデスクトップゲーミングスピーカーはどのように作られた？

感動した俺は山形県に飛んだ、パイオニアのゲーミングスピーカーが「驚きの音の良さ」
sponsored
理由は〈品質・価格・安心〉を徹底したオプテージのサービス精神にあり！

なぜ関西では「eo光」が戸建の光回線シェアトップ＆18年連続満足度No.1なのか？
sponsored

高速回線はリアルの人々も繋ぐ！ラリードライバー長尾選手はビッグローブ光10ギガタイプで夢の実現スタート
sponsored
血圧が1日の間でどう変わるのかもわかる

血圧計が常に手首にあると超便利！ファーウェイのスマートウォッチ「HUAWEI WATCH D2 ウェアラブル血圧計」で生活がこう変わる！
sponsored
HYTEのY70 Touch Infinite Pandaを採用、ライザーケーブルでビデオカードを縦置き

【ゲーミングPCにおいて最強】目指しX3DとRTX 5090を選択、タッチ液晶付きPCケースに載せたら超カッコよくなった
sponsored
NVIDIA高橋想氏、津田恵理子氏にインタビュー

いま、NVIDIA RTX AIワークステーションを導入する企業が増えている理由
sponsored
27歳アスキー編集部員がガチ体験レポート（3ヶ月連続企画）

「3ヶ月で15キロ、マジで痩せられたらどうしよう！！」運動なしでダイエットできると評判の「メンズ専用サロンEVOCORE」体験します！
sponsored
Crucial X9 ProポータブルSSDで逼迫するストレージ容量を解決

新生活PCと一緒に外付けSSDを買ったほうがいい理由
sponsored
16型で1.28kgのスタンダードノートや、RTX 40シリーズ搭載ゲーミングノートなどをラインアップ

最大3万5000円引きだと？仕事やゲーム向けのノートパソコンを探しているならパソコン工房「決算セール第2弾」は必見だろ！
sponsored

新しいスマホ、パソコン、銀行口座、サービスアカウントまで、新生活をまとめて守れる1本のソフトがコレ
sponsored
話題の光10ギガサービス、今がはじめどきの「5つの理由」

So-net 光 10ギガが月額基本料金最大12カ月無料、「速い、安い、快適」なら契約しない手はない
sponsored
JAPANNEXTの「JN-IPS34G165UQ-HS」をレビュー

【ド迫力】相性良すぎ！『真・三國無双 ORIGINS』を4万円台の21：9・34型ウルトラワイドディスプレーで遊んだらマジでほしくなった
sponsored

【お悩み解決】推し活もはかどる！ネット動画の時代だからこそ始めよう、全自動録画の魅力
sponsored
JN-i55U-Uをレビュー

55型4Kディスプレーはアームで運用できるのか？困難の先にある圧倒的没入感
sponsored
農作業効率化ソリューション「レポサク」を支える「MEEQ SIM」を紹介

【DX成功のヒント満載！】位置情報ソリューション開発のエゾウィン、IoT通信「MEEQ」ウェビナーに登壇
sponsored
脅威の検知だけでなく対処までを自動化　「FortiEDR」で運用負荷の課題をクリア

EDRが発したアラートへの対応が遅れ、100GB超の情報漏洩！どうやったら防げた？
sponsored

自分なら80型のテレビよりこっち！　手軽に4K高画質と100インチ越えを狙うなら「N1S 4K」だ
sponsored
JN-IPS27Q4FL-HSPC9-DLをレビュー

超多機能27型WQHDディスプレー、USB Type-C給電・デイジーチェーン・有線LAN・KVMアリで3万円台に「おっ？」
sponsored
JN-DMD-IPS156Fをレビュー

2画面モバイルディスプレー2台で夢の5画面環境！ノートPCでも生産性爆上がり間違いなし
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！