このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」第142回

数枚の画像とAI動画で“VTuber”ができる!? 「MotionPNG Tuber」という新発想

2026年02月02日 07時00分更新

文● 新清士

MotionPNG Tuberを使った口の位置推定（右）、MouthSpriteExtractor-SAM3による口の候補（左）（筆者作成）

　バーチャルYouTuber（VTuber）などに見られるアバターを使って、自由に自分を表現したいという技術は、VRMフォーマットを使った3Dアバターであったり、Live2Dを使った2Dデータの組み合わせで表現されるのが一般的です。しかし、それぞれの技術はデータ作成が複雑でした。いま、そこにAI技術を組み合わせることで、もっと簡単に実現できないかという新しい方法が、Xを中心とした日本人のコミュニティから、登場してきています。

ループ動画に合わせて目と口を動かす

　ろてじんさん（@rotejin）が制作している「MotionPNG Tuber」は、AI動画に合わせて目と口を動かすようにすることで、VTuberのような仕組みにしようという画期的な方法論です。AI動画向けに音声のリップシンクを実現する動画環境はクラウドサービスやローカル環境など複数登場していますが、まだリアルタイムに動かすことができません。VTuberのようにリアルタイムに話したことを、そのまま応答することはできないのです。

　しかし、動画に音声に合わせた口パクをリアルタイムに重ね合わせることが実現できれば、簡易的なVTuberのような仕組みが作れるのでは、というのが着目点です。

　実際に、作り方に従って筆者が作成したのが、以下の動画です。話している音声に合わせて口が動いています。

^{△MotionPNG Tuberの筆者の作例}

　ろてじんさんは当初、PNG形式の画像データ4枚だけを使って実現するPNG Tuberを試されていました。「開いた目と開いた口」、「閉じている目と閉じている口」などの組み合わせ4枚を使い、音声に合わせて口パクをさせる仕組みです。

リアルタイムPNGTuberは画像を全てpngに書き出し直し。腕の差分を3枚だけ作って、3～5秒毎にランダムに切り替えてみた。少しポーズが変わるだけでリッチさアップね。 https://t.co/TSDFRqhW7G pic.twitter.com/bsWZcKqo93
— ろてじん (@rotejin) December 17, 2025

^{△ろてじんさんのX投稿より}

　音声に合わせて用意した画像を切り替えるだけでいいので、手軽に作れることもあり、様々な人が挑戦してきています。筆者も、Google AI StudioのBuildで簡易的な環境「PNG TUBE Studio」というアプリを作ってみました。4枚の差分画像があれば、音声に合わせて口パク、適宜の目パチをしてくれるというものです。

^{△PNG TUBE Studioで動かしている状態}

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2026年01月12日

AI

AIフェイクはここまで来た　自分の顔で試して分かった“違和感”と恐怖
2026年01月26日

AI

AIエージェントにお金を払えば、誰でもゲームを作れてしまうという衝撃の事実　開発者の仕事はどうなる？
2026年01月26日

AI

「Dr.STONE」科学監修くられ氏、ChatGPTのアカウントを停止されたと報告
2025年11月24日

AI

xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル
2026年01月19日

AI

3Dモデル生成AIのレベルが上がった　画像→3Dキャラ→動画化が現実的に
2026年01月19日

AI

「こんなもの欲しいな」が、わずか数時間で形になる。AIツール「Google Antigravity」が消した“実装”という高い壁
2026年01月20日

ITトピック

無言電話に「もしもし？」と答えるだけで危険な理由 “AI音声クローン詐欺”の可能性
2025年12月29日

AI

数百万人が使う“AI彼女”アプリ「SillyTavern」が面白い
2025年01月27日

AI

動画生成AI、ついにアダルトの扉が開く
2026年01月09日

Team Leaders

2026年からでも間に合う！　ChatGPTやGeminiの有料プランをお勧めする理由

ピックアップ

sponsored
MSI「MPG 271QR QD-OLED X50」レビュー

液晶を圧倒するOLEDと500Hz駆動がもたらす至高のゲーミング世界。これがゲーミングモニターのフラグシップか！と感動すら覚えた実機レビュー
sponsored
人気イヤホンの第2世代モデルは軽量コンパクト化、音質向上、チップセット強化で登場！

オープンイヤー型イヤホンのヒット商品に新モデル！「HUAWEI FreeClip 2」の魅力に迫る！
sponsored
建設DXを推進するGRIFFYから見た「SORACOM Flux」の現場対応力

生成AIが建設現場のIoTの運用を大変革　顧客の声に営業がプロンプトで応える　
sponsored
“全員参加”のチームづくりでリーダーが気をつけるべきこと、Backlogを役立てる方法

プロジェクトリーダーを悩ませる“指示待ちメンバー”　自発的な行動を促すコミュニケーション術を考える
sponsored
コープさっぽろが挑んだ店舗改革　現場の試行錯誤にカメラはどこまで寄り添えるのか？

デリカコーナーのトップ売上担当者が語る「僕はソラカメで売り場をこう変えた」
sponsored
ZEFT R67CのOSなしモデルにインストール

ゲーミングPCが高くなってきたので無料で使えるゲーム特化OS「Bazzite」で節約してみた【導入方法を解説】
sponsored
JN-IPSB315U-HSPC6をレビュー

4万円台で買える多機能な31.5型4Kディスプレー！USB Type-C給電、KVM、昇降式スタンド、優れた黒表現でコスパ最高か
sponsored

ゲーマー必見！最高設定でもフレームレートが安定するマザーボード「X870E AORUS PRO X3D」で味わう快適ゲームプレイの感動
sponsored

“他校に負けないパソコン教室”の完成を目指した東京実業高等学校は、省スペース性とスペックの両立を実現できるMSI製のマシンを導入
sponsored
流れてしまうフロー情報と溜めておきたいストック情報　ツールを賢く使い分けよう

広報チームを襲う「情報洪水」の正体。必要なのはコミュニケーションの量ではなく設計だった
sponsored
富士通WEB MART価格17万9800円です!!

世界最軽量634gの14型モバイルノートPCはディスプレーもキーボードもインターフェースも万全だった＝「FMV Zero」(WU5-K3)実機レビュー
sponsored
富士通WEB MART価格17万9800円です!!

世界最軽量634gの14型モバイルノートPCはCPUもSSD速度も万全だった＝「FMV Zero」(WU5-K3)実機レビュー
sponsored
UltimateプランでRTX 5080相当の性能を堪能、5Kや最大360fpsでのゲームプレイも！

PCゲームプレイの選択肢が超広がる！進化したGeForce NOWが凄すぎる
sponsored
ダークウェブで攻撃者がやり取りする情報も把握、ASMから進化した“CTEM”＝「FortiRecon」

化学メーカーの研究データが漏洩！脆弱性診断が見落としたVPN装置… どうやったら防げた？
sponsored
2025年に多く発生したランサムウェア被害、そのトレンドから考える

最悪の被害「事業停止」を回避するには？ランサムウェア対策・3つのポイント
sponsored
想像よりもはるかに小さい

ウワサの“机に乗る”AIスパコン「NVIDIA DGX Spark」が、編集部に届きました。
sponsored
JN-VC236Fをレビュー

約1.6万円の23.6型湾曲フルHDディスプレー、3000Rのゆる～いカーブはお買い得？
sponsored
FortiSASEがセキュリティ対策の「すき間」を埋める

危機はエッジから現れる　今こそ検討すべきVPNからSASEへの移行
sponsored
JN-MD-IPS238U-C6をレビュー

23.8型の4Kモバイルディスプレーは携帯するにはアレだけど屋内利用なら全然アリ！最大65WでノートPCにUSB給電できる点も◎
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！