このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」第23回

画像生成AIに2度目の革命を起こした「ControlNet」

2023年05月22日 09時00分更新

文● 新清士　編集●ASCII

筆者作成

　画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。

　StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i（image2image）」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。

　その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言っていいほど、生成AIのあり方を変えてしまいました。

　ControlNetを発表したのは、ハンドルネームlllyasviel、チャン・リュミンさんという研究者です。2月に関連論文を発表した後、2週間程度でStable Diffusionの制作環境「A1111 Web UI」の拡張機能に組み込まれてきたので、世界中が驚きました。論文発表後、これだけの早さで機能が実装されるというのは非常に珍しいことです。特に企業の場合、チェックプロセスなど様々な工程があるため、発表から1年程度待たされるのは当たり前のことでした。

ControlNetの開発者のチャン・リュミンさん（チャンさんの公式ページより）

　チャンさんはもともと香港中文大学で、白黒のイラストに着彩するAI技術「Style2Paints」を研究されていた方です。この研究は日本でもずいぶんと話題になりました。現在は、2022年にシリコンバレーの中心地にある米スタンフォード大学の博士課程に進み、画像生成AIの研究室に所属しているようです。

日本でも2018年に話題になった「Style2Paints」を使った実際の着彩例。lllyasviel氏の過去の研究を紹介するページから

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2024年11月18日

AI

グーグルのAIがいきなり「死んでください」と言ってきたという報告
2024年11月04日

AI

画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力
2024年11月18日

AI

あなたの作業を超効率化する、すごいAIサービス10選【2024年最新版】
2024年10月23日

AI

AI、ついにパソコンを使えるようになってしまう　Anthropic「Claude 3.5 Sonnet」新機能
2024年10月28日

AI

リアルすぎてキモい　動画AIの進化が止まらない
2024年10月31日

AI

画像生成AIベンチマークでいきなり1位、業界騒然「Recraft V3」
2024年11月18日

AI

誰でもVTuber時代へ　フェイシャルAI技術、続々登場
2024年11月06日

AI

SD3.0の汚名返上なるか？！画像生成AI「Stable Diffusion 3.5」を試してみた
2024年10月25日

AI

ChatGPT「canvas」使い方と、Claude「Artifacts」との違いを解説　文章作成やコーディングがスイスイできます
2024年10月21日

AI

もはや実写と間違えるレベル　動画生成AI「Runway」の進化がすごい

ピックアップ

sponsored
ソラコムが考える物流の課題とIoTソリューションの可能性

意外と身近な「小さな物流」　課題解決や付加価値提供にIoTは活用できる
sponsored
Bowers＆Wilkinsの「Zeppelin Pro Edition」をレビュー

少しお金をかけて最高の音を手に入れたい人の、正解スピーカーを見つけました
sponsored
マウスのゲーミングノート「G-Tune P5-I7G60WT-B」がセール中

【ブラックフライデー】PCゲームをするならゲーミングノートもあり！ハイスペックな1台がセールで約23万円！
sponsored
省スペースなゲーミングPC、マウスコンピューター「G-Tune PG-I7G60」

【一足早いセール情報】ブラックフライデーでゲーミングPCがヤバい！コンパクトなミドル機が5万円オフ！
sponsored
JAPANNEXTの開発中モデル＆最新注目モデルをまとめて紹介！【後編】

令和の時代にテレビ風デザイン!? ディスプレーも見た目で選ぶ時代が来たかもしれない
sponsored
Z世代が本当にほしいPCを目指して企画したモデル

推し活はかどるノートPC「LAVIE SOL」いいかも。けっこう欲しいかも。
sponsored
JAPANNEXTの開発中モデル＆最新注目モデルをまとめて紹介！【前編】

有機ELウルトラワイドに16:18の縦長ディスプレー！ワクワクが止まらないJAPANNEXTの開発中モデルを取材した
sponsored
Core Ultra 9 285KとZ890 Steel Legend WiFiの「ZEFT Z54CM」について聞いた

さっそくCore Ultra 200SのBTOPC登場！ ASRock原口氏に聞いた採用マザボのコダワリに、一同唸る
sponsored

桐井製作所にとってのBacklogは「発注のプロ」になるための成長ツール
sponsored
独自のスタイルで落ちない＆便利なイヤホン、ファーウェイ「HUAWEI FreeClip」

ながら聴きにはオープンイヤー型イヤホンが◎！耳たぶに挟むだけなのに落ちないその不思議と魅力を紹介
sponsored
JN-MD-i156FHDR-Tをレビュー

満天の星空撮影、カメラからモバイルディスプレーに外部出力したらめちゃはかどった話
sponsored
Radeonのよさは、敏感な人は気づき始めている

高コスパなLEVELθになぜ1世代前のAMD Radeon RX 6600モデルが？ユニットコム＆AMD担当者に聞いてみた
sponsored
ROG Cetra True Wireless SpeedNova＆ROG Carnyxをレビュー

ROGデバイスで通話改革！骨伝導マイク搭載のイヤフォンとハイレゾ録音対応マイクがスゴイ
sponsored
Streamplifyで始める配信生活、初心者は統一ブランドで環境を整えるのが安心だ

提案、配信用機材は「このブランド」でまとめよう！　試したら超快適でした
sponsored
電帳法対応にデータガバナンスアドオン、契約の電子化にDropbox Signを採用

建設業の「仕事のやり方変革」にDropboxをフル活用する飛島建設
sponsored
起業家石戸谷由梨がレノボAIノートPCの使い心地を語る

小4からPCに慣れ親しんでいる私から見た、レノボ「ThinkBook 13x Gen4」
sponsored
2024年11月11日まで32GB/64GBメモリーに無料アップグレード

Core Ultra 200S搭載BTO PCを買うならデュアル水冷に超静音、キューブまであるサイコムが狙い目　メモリー倍増キャンペーンもあるし
sponsored

「ダークウェブには何がある？」「もし自分の情報があったらどうすれば？」なんとなく不安に感じる素朴な疑問に答える
sponsored
JN-282IPS4KPをレビュー

画面比率3:2はビジネスにて最強!? 約5万円で4K Plus・28.2型はコスパ良すぎでは
sponsored
なんとなく……ではなくロジカルに考えてみよう

Backlogの「プロジェクト」と「課題」、どう切り分けるのが正解なの？
sponsored
インタフェースの刷新など「使いやすさ」「効率性」をさらに向上、そして「スケール」も強化

大規模ネットワークも手軽に管理！「HPE Networking Instant On」最新版の強化点とは
sponsored
3人制プロバスケチーム「esDGz OTAKI.EXE」が稲作の担い手不足とプロアスリートのキャリア問題を解決!?

「農業×バスケ、ときどきニワトリの孵化（非営利）」というまったく新しい働き方を実践する団体が存在　稲刈りの手伝いがてらお話を聞いてきた
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！