このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」第42回

爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに

2023年11月13日 08時00分更新

文● 新清士　編集●ASCII

ウェブカメラからのリアルタイム生成が可能に

　LCMの活用として、非常に面白いのがimage2imageです。爆速で処理ができるため、映像を使った「リアルタイム生成」ができるんですね。無料でウェブカメラの画像を専用のControlNetを使って変換できるデモが公開されているので、実際に試してみました。

Real-Time Latent Consistency Model

　画面左上に映っているのが筆者です。プロンプトに「boy」と入れると顔が少年になり、「man」にすると老人になる。seaと入れると背景が海になり、「window」と入れると本棚が窓枠に変わり、「ship」と入れると船があらわれ……といった具合に、映像が変化していきます。ほかにもビールを飲ませたり、猫を出したり、筆者と筆者の部屋の情報をソースにどんどん映像を変えていけるんですね。ただ、自分を美少女にすることはできても、美少女をそばに出し続けるのは難しかったんですが……（笑）。

　Stable Diffusionでもリアルタイム生成はできなくはないですが、生成速度的にここまでのことはできません。デモ環境はサーバーサイドでNVIDIA A100を使っていますが、Linux環境を構築できれば、Windows上にも作成可能なようです。モデルが軽量化することで将来的にはリアルタイムが可能な環境になるということですね。現在は画像のシード値を固定しているだけなので、動画にしたとき完全な一貫性を維持できないところは今までと同様ですが、将来的な可能性を感じさせるには十分です（※シード値は画像生成時に割り振られる疑似乱数のこと。値を固定することで似た画像を生成可能）。

　今後、リアルタイム動画生成が進んでいけば、画像からアニメーションを作るAnimateDiffにも応用が利くのではないかと期待されています。AnimateDiffも様々なアプローチが出ていますが、現状は動画をもとにVideo2Videoで生成した方がきれいに出る傾向があります。

Using a latent consistency model for video2video is fast, but it needs control mechanisms.

The speed means you can do high frame rate video conversions. But the lack of control makes it a mess.

180 frames in 55 seconds:https://t.co/Y13KKTdAtp pic.twitter.com/CMaWM62C9A
— fofr (@fofrAI) October 28, 2023

^{▲Video 2 Videoを試した例。高速に処理できるが、ControlNetなど制御の仕組みがないので、生成画像に混乱が起きている}

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2024年05月21日

AI

しまむら、AIモデル「るな」起用　20歳の服飾専門学生（という設定）
2024年06月07日

AI

めちゃ便利になった無料版「ChatGPT」新機能の使い方まとめ【最新版】
2024年05月27日

AI

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場
2024年05月16日

AI

ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）
2024年05月13日

AI

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性
2024年05月29日

AI

実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる
2024年05月15日

AI

新しい「ChatGPT」はココがすごい　解説「GPT-4o」
2024年05月09日

AI

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」
2024年05月10日

AI

15歳の高校生、「日本語能力最強」のAIモデル開発　AITuber向けに設計
2024年05月20日

AI

自分好みのAIチャット相手を簡単に作れる「Dify」が面白い

ピックアップ

sponsored
8人のエバンジェリストが熱血対談！　これは見逃せない！

トヨクモkintoneフェスの「kintoneエバンジェリストしゃべり場」が濃厚すぎる
sponsored
ファッショナブルなデザインに、ヘルスケアやワークアウトの機能が充実！

「HUAWEI WATCH GT 4」はバッテリー長持ち＆デザイン色々、あらゆる人にオススメ可なスマートウォッチの本命！
sponsored
PC/IT系編集者の心構えに通ずるありがたい説法も

再起の時来たれり！インテルPCマイスター上級試験・不合格者のための補講を受けた話【実技編】
sponsored
次回の試験前にぜひ学んでほしい傾向と対策

再起の時来たれり！インテルPCマイスター上級試験・不合格者のための補講を受けた話【筆記編】
sponsored

マザーの背面コネクターって実際どう？ASUS「BTF」で組んでみたら世界が変わった
sponsored

知っておいて損はなし！耐久性◎なCrucialポータブルSSDの選び方・使い方を大紹介
sponsored

クリエイターPCの選び方　写真、動画編集、3DCGのガチプロにオススメのWindowsノートはこれでした
sponsored
新色ベージュが追加＆アップデートで待望のイヤホン単体でのボリューム調整にも対応！

耳を塞がない＆メガネ派もOK！ファーウェイの独自スタイルのオープンイヤー型イヤホンはながら聴きに最適！
sponsored
結局どっちがお得？考え方の違い、クラウドストレージのコストを最小限に抑える方法

ファイルサーバー／NASとクラウドストレージの「コスト」を比較する
sponsored
Northを使ったオシャレPCと、会社の生放送で活躍できる最強PCが爆誕！

PCケースもパーツも！イッペイ＆つばさが理想のBTOPCをカスタマイズ、どんな構成に？
sponsored
JN-MD-IPS133WUXGARをレビュー

16：10で1920×1200ドットの13.3型モバイルディスプレーが2万円は無敵！でも……
sponsored
4つの新モデルを追加、「HPE Networking Instant On」ならば“適材適所”で選択できる！

自社に最適なWi-Fiアクセスポイントは？選び方のコツをHPE Aruba Networkingのプロに聞いた
sponsored
X-360Q（JN-27IPS360WQHDR-HSP）をレビュー

360Hz・WQHDの27型ゲーミングディスプレーが9万円台！ KVMも90W給電も使えてお得感大
sponsored
「JAPANNEXT 上総中川駅」誕生の経緯をいすみ鉄道の社長にインタビュー

ディスプレー会社が駅名に!? JAPANNEXT×いすみ鉄道の異色コラボはなぜ実現したのか
sponsored
Radiant GZ3500Z790/D5をカスタム

BTOってマジ大事。16万円台のふつ～なPCが20万円のi5＆RTX 4060のゲーミングPCに
sponsored
音を知る企業による自社ブランドの第一弾製品

一生使いたいヘッドホンを見つけた。その名は「The Industrial-ist Wired」だ！
sponsored
見た目スッキリでキレイなPCが誰でも簡単に組める

自作PCの配線ゴチャゴチャは過去の話、「PROJECT ZERO」製品一覧と作例を紹介
sponsored
ゲームも作業もすべてがなめらか表示

ヌルヌル動くというのはこのこと、240Hzゲーミングディスプレー「G274QPX」レビュー