このページの本文へ

OpenAI「Sora 2」で動画革命 AIがついに“TikTok化”

2025年10月01日 09時35分更新

文● G. Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 OpenAIが9月30日、テキストから高品質な動画と同期した音声を生成する最新の動画生成モデル「Sora 2」を発表した。2024年2月に公開された初代「Sora」を大幅に進化させたもの。物理法則のシミュレーションが格段に向上し、物体や人物の動きが自然で、現実味を帯びている。

 オリンピック級の体操競技、水上でパドルボードをしながらのバックフリップ、さらには猫がしがみついたままのフィギュアスケートといった複雑な動作を、浮力や剛性などの物理特性を正確に反映して描写する。

 初代Soraが動画生成の「GPT-1」的な画期的な瞬間だったのに対し、Sora 2は「GPT-3.5」級の成熟度を達成したとOpenAIは位置づけ、シーンの連続性や視覚的な破綻の少なさをアピールした。

音声つきのリアルな動画を生成

 特筆すべきは、動画にリアルな音声がつく点だ。セリフや環境音、効果音が動画の動きとぴったり同期し、まるで本物の映像のように仕上がる。男女が自然な日本語でしゃべるサンプル動画も公開された。

 動画は最大10秒程度で、1080p解像度の動画が出力可能とされている。人物やキャラクターの同一性を保ちつつ、物体間のインタラクションを自然に表現する能力が高く、映画のような実写風から、日本のアニメ風、特にスタジオジブリのような柔らかなファンタジーシーンまで、表現の幅は非常に広い。

 OpenAIは、Sora 2の進化が「世界のシミュレーション」に向けた一歩だと説明しており、単なるエンターテイメントツールを超え、AIが物理現実と対話する基盤を築く可能性を示している。

AI版「TikTok」 自分や友だちも“出演”可能

 発表に合わせて、OpenAIはiOSアプリ「Sora」を同時にローンチした。TikTokを思わせるアルゴリズムフィードで、ユーザーが生成した動画を共有/リミックス/発見できるソーシャルプラットフォームだ。

 目玉機能の「Cameo(カメオ)」では、ユーザーが短い動画と音声を録画して本人確認をして、自分の姿や声をAI動画に挿入できる。友達のカメオを許可すれば共同制作も可能で、プライベートメッセージで共有したりフィードで公開したりといった使い方ができる。

 アプリは現在、米国とカナダで招待制で提供されており、各ユーザーに4つの招待コードが配布される。Android版は後日、ウェブ版はブラウザ経由で利用可能になる見込みだ。

いじめ、依存には「慎重に向き合う」

 SoraはOpenAIが2024年初頭に動画生成の可能性を探るプロジェクトとして始まった。当初はテキストプロンプトから1分程度の動画を生成するデモで話題になったが、映像の破綻や、物理的な誤りが課題だった。

 Sora 2は、こうした課題を克服するため大規模な事前トレーニングと微調整により、ディープフェイクや誤情報生成の危険性を検証。出力にはC2PAメタデータとウォーターマークを標準搭載するなど、安全対策を強化した。

 サム・アルトマンCEOは「いじめやディープフェイク、依存のリスクに慎重に向き合う」と述べ、Soraの運用にも責任ある展開をするとしている。過去にアルトマンは、AIの社会影響を懸念する発言を繰り返してきた。

SNSでは賛否、ディープフェイクの懸念広がる

 SNSでは、Sora 2発表直後から爆発的な反響を呼んでいる。

 X(旧Twitter)では、ジブリ風のアニメーションや、リアルな人物のアクション動画などが数万回の閲覧を記録し、「もはやAIか、現実か区別がつかない」「ゲームチェンジャーだ」との声があふれた。

 一方で、TikTokのようなSNS計画は賛否を呼んでいる。創造的な遊び場として歓迎する層が多い一方、「プライバシー侵害の温床になる」との懸念も噴出。サンプル動画には本物のようにリアルなサム・アルトマンCEOの姿があったことから、著名人の顔を悪用できる可能性が指摘された。

リアリティと倫理観のバランスが焦点に

 メタの「Vibes」や、グーグルのAI統合版YouTubeなど競合の類似サービスが相次ぐ中、OpenAIの動きはAI動画のソーシャル化を加速させる。一方で、リアリティと倫理観のバランスが今後の焦点となりそうだ。

 

■関連サイト

カテゴリートップへ

ピックアップ