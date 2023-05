GW中の連続企画として、画像生成AI「Midjourney」を使ったAIイラスト制作TIPS記事をお届けしています。また、5月2日には、これに関連した生放送企画も実施しましたが、ご覧いただけたでしょうか?

こちらの放送では、本連載企画の第1回と第2回で取り上げた、「Midjourney」の始め方の紹介と、「Midjourney」を使った似顔絵制作に実際にチャレンジしているのですが、放送時間の制約もあり、時間内にできあがったアスキー編集部つばさの似顔絵がちょっと微妙な感じでした。

そこで今回は、引き続き、あのとき例題として利用した写真を使って、もうちょっと本人に似るまで試行錯誤を繰り返したら、どんな結果になるのか、を、その試行錯誤の過程と共にお届けしたいと思います。生放送を未視聴の方は、動画の後半部分、48分20秒ころからの映像を見てから、本稿をお読みいただけるとさらに楽しめると思いますので、ぜひどうぞ。

まず、お題となった写真がこちらです。

この写真を元に、放送では時間の都合上「describe & blend作成法」でのみ制作しました。結果がやや微妙……というかあんまり似ていなかったので、放送終了後、「写真+画風指定 作成法」で再度制作にチャレンジしました。

まずは、この写真を説明するプロンプトの作成からです。

私の場合、絵、そのものを日本語で記述し、あとからDeep-Lを使って英訳してプロンプトを作っています。

まずは、主題(フォーカスを当てて描きたいもの)を記述。

Portrait of Japanese woman with headphones,

次に、髪型に言及しています。これは、「Midjourney」によるdescribeでは反映されない要素だったのと、これまで作ってきたつばさのイラストとは明らかに違う部分だったため、取り込んでおいたほうがいいだろうと判断したためです。

次は服装に言及していきます。色は紺色ですが、複雑な色をそのまま記載するよりは、もともとの写真に映った色も出来上がりのイメージに反映されますので、ここでは絵全体を構成するイメージとしての色を指定します。というわけで、服の色は青。素材感がちょっと特殊で光沢のある感じなので、サテン生地という指定も加えました。さらに、特徴的な星のドット柄。服のタイプは、ワンピースなのでしょうが、ここでは上半身しか映っていないので、単純にドレスということで記述しています。

モチーフとしての説明は以上。ここから、そのモチーフが、どんな人物なのか、という説明を加えていきます。とりあえず、女性の場合はだいたい決まってるんですけどね。可愛い、チャーミング、美人とかそういう感じです。リアルな女性のポートレート写真などを作ろうと思ったら、ゴージャスとかグラマーとか、いかにもアメリカ仕込みでAIが教育されていそうな言葉を使ったりもします。にじジャーニーが日本語対応しているとは言っても、元はアメリカで仕込まれたAIが母体ですので、こうしたアメリカ人が好みそうな表現を模索していくのもAIイラストを作るうえでは重要になってきます。でもまあ、ここではシンプルに以下の3つで試しました(笑)。

さて、ここからが問題です。にじジャーニーを使うことで、一応どんなものでもアニメ調か漫画調の二次元テイストが入りますが、こと写真をベースにしたお題だと、かなりリアル寄りに引っ張られます。ということで、どうせリアル寄りになるなら、とことんリアル寄りな3DゲームCG調に仕上げてみるのはどうだろうかと思いつきました。

ということで、先のプロンプトに、Midjourneyのギャラリーでゲーム美女の作例として載っていたプロンプトの描写を加えます。ここは元からプロンプトがある部分なので日本語訳なしです。

このプロンプトで、実際に3D CGと言及しているのは、「3D, computer graphics art,」この部分だけで、あとはいかにリアルで高精細な画像なのかと延々説明するプロンプトになっています。そして、最後の「ultra - detailed face, 」の部分で、顔の描写をかなり高精細で行なうように指示していますね。

最後にある「beautiful adult woman,」も元のプロンプトにあったのをそのまま残しました。かわいいとか美人とかきれいといった言葉を繰り返しプロンプトに入れ込むことで、扱いとしては強調され、AIが外せない要素として認識してくれるという効果があります。

今回利用するパラメーターは以下です。

【--ar】は、画像比率を指定するパラメーターです。53:89という比率は元のCG美人イラストにあった比率をそのまま引用しています。

【--s】は、正式には【--stylize】で、芸術性を高める度合を指定します。にじジャーニーでは、0~1000の間で設定でき、【--s 1000】は最高設定です。効果的には、よりリアルな描写を求める際にはこの値を上げると良いかと思います。

【--style expressive】は、にじジャーニーに用意されている4つの描画スタイルモードのうち、より大人っぽく西洋風のアニメ絵イラストを目指す時に用いられるパラメーターです。

さて、ではこちらのプロンプトをすべてつなげて、どういった結果が出るか見てみましょう。

つばさ 3DCGバージョン プロンプト

つばさの元写真URL Portrait of Japanese woman with headphones, hair in a bun, Blue satin fabric dress, star dots, cute, charming beauty, Photo real, 3D, computer graphics art, high resolution, best quality, highres, Full Body, 8k character concept, 32k, pixiv, illustration, ultra - detailed, ultra - detailed face, beautiful adult woman, --ar 53:89 --s 1000 --style expressive --niji 5