このページの本文へ

AIに職人技を教えるデータセット、メタが公開　料理、ダンス、バイク修理など

2023年12月07日 07時00分更新

文● 田口和裕

　メタおよび東京大学を含む17の大学による研究グループは11月30日（現地時間）、料理や自転車修理といった複雑な人間の活動を一人称（エゴセントリック）および三人称（エクソセントリック）視点から同時に撮影し、自然言語による注釈を加えた大規模かつマルチモーダルな動画データセットおよびベンチマークタスクを組み合わせた「Ego-Exo4D」を発表した。

エゴ（一人称）視点とエクソ（三人称）視点を統合

エゴ視点（左）とエクソ視点（右）

　人間の行動、特にスキルと専門知識の理解は、拡張現実（AR）、ロボット学習、ソーシャルネットワーク分析などさまざまな技術分野で重要だが、AIにとっては難しい課題となっている。

　

　Ego-Exo4Dは、手と物体の相互作用、注意の焦点など細かな行動の詳細を捉えるエゴ（一人称）視点と、全体的な動き、身体の姿勢、周囲の環境との関係などを示すエクソ（三人称）視点の2つの動画を同時に撮影し、自然言語による注釈（アノテーション）を加えることによって、人間のスキルと専門知識をより総合的に捉えることを目標としている。

ARグラスと複数のGoProで撮影

エゴ視点（左および右上）とエクソ視点（右下）

　データセットは、800人以上の参加者によって世界13都市で撮影された1422時間に及ぶ動画データが元になっている。

　動画にはスポーツ、音楽、ダンス、自転車修理など、様々な物理的および手続き的スキルを必要とする13の活動が記録されている。

「Aria Glass」

　エゴ視点の動画はメタが開発したARグラス「Aria Glass」を、エクソ視点の動画はAria Glassと同期した複数の「GoPro」カメラを使用して撮影された。

3次元空間上の特定の地点をあらわす点群（Point Clouds）

　また、動画だけではなく、7つのマイクを使用したマルチチャンネルオーディオ、眼球運動、3Dポイントクラウド、カメラの姿勢、IMU（慣性測定ユニット）、気圧計、磁力計などマルチモーダルなデータが含まれており、人間の行動とスキルを多角的に分析し、理解するための豊富なデータソースとなっている。

動画を補足するアノテーション

動画に付けられたアノテーションの例

　さらに、動画データにはコンテンツの理解を深め、多様なアプリケーションでの使用を促進することを目的に自然言語を用いた下記3種類の注釈（アノテーション）が付けられている。

専門家のコメント（Expert Commentary）

　各分野の専門家による詳細なコメント。これにより、特定のスキルや手法に関する深い理解が可能になる。

撮影者によるナレーション（Participant Narration）
　動画撮影者自身が提供するナレーション。撮影者の視点からの活動の説明や、その時の考え方、意図などが反映されている。

アトミックアクションの記述（Atomic Action Descriptions）
　動画内の個々のアクションや動作を具体的に記述したもの。この記述は、動作認識やアクションセグメンテーションなどのタスクに有用。

　これらの自然言語の説明を動画と組み合わせることで、研究者や開発者は人間の行動とスキルに関するより豊かな洞察を得ることができるという。

作成したモデルやアルゴリズムを評価するベンチマークタスクも提供

　Ego-Exo4Dでは、データセット以外に、研究者が自分のアルゴリズムやシステムを評価し、比較するための4種類のベンチマークタスクを提供している。

エゴ・エクソ関連タスク（Ego-Exo Association Tasks）
　エゴ視点とエクソ視点動画間の関連性の特定および理解を評価するタスク。異なる視点からの活動の同期や相関を把握できる。

エゴ・エクソキーステップ認識タスク（Ego-Exo Keystep Recognition Tasks）
　特定の活動やプロセス内の重要なステップやキーモーメントを認識するタスク。スキルの学習や指導に重要。

エゴ・エクソ能力推定タスク（Ego-Exo Capability Estimation Tasks）
　利用者のスキルや能力を推定するタスク。専門的な技能や学習過程を評価するために役立つ。

エゴポーズタスク（Ego Pose Tasks）
　エゴ視点動画から参加者の姿勢や動きを推定するタスク。動作分析や姿勢推定の研究に利用される。

　これらのベンチマークタスクはデータセットの多様な特性を活用し、人間の行動とスキルに関する深い洞察を提供。新たなアルゴリズムやシステムの開発と評価に重要な役割を果たすという。

　Ego-Exo4Dは12月中にすべてのデータをオープンソースで公開する予定。また、来年には公開ベンチマークチャレンジの開催とベースモデルのリリースも予定されている。

　過去に類を見ないスケールで提供される本データセットによって、AIが人間のスキルを効率的に学習できるようになることで、熟練した職人の技を再現するロボットや、より安全な自動運転自動車の開発などさまざまな分野での応用が期待されている。

■関連サイト

ツイートする

カテゴリートップへ

AIオススメ記事

2024年07月15日

AI

危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ
2024年07月23日

AI

「昔の人は火炎瓶をどうやって作ったの？」AIが答えてしまう問題
2024年07月05日

AI

チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます
2024年06月26日

AI

「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」
2024年07月10日

AI

人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する
2024年07月01日

AI

AI動画の品質が仕事に使えるレベルになってきた
2024年06月27日

AI

無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない
2024年07月08日

AI

イラストのペン入れと色塗り、AI使えばわずか1分
2024年07月19日

AI

グーグル、「Pixel 9」購入者に月2900円のAIサービスを無料提供か
2024年06月24日

AI

“革命”起こした画像生成AIに暗雲　「Stable Diffusion 3 Medium」の厳しい船出

ピックアップ

トピックス
抽選で10名様にAmazonギフトカード500円、「ガジェット好きへのアンケート調査」実施中

ガジェット好きのみなさん！アマギフが当たるアンケートにお答えください!!
sponsored
夏休みシーズン到来！海外旅行に行くならeSIMが便利

「Holafly」のデータ無制限eSIMは海外で超快適！レンタルルーターやローミング要らず！
sponsored
【情シス戦隊サポートジャー＃3】“システム管理者の日”特別編「情シスさんのいない一週間」の巻

情シス戦隊が“解散”のピンチ!? 危機を救うのは社員のみんなだ！
sponsored
「さくっと作れる」から生まれるkintoneの課題を解決

業務改善をメニュー化した「キミノマホロ」で顧客とベンダーのギャップは埋まるか？
sponsored
それはASCIIオオタニ、ジョイゾー四宮社長が登壇したトヨクモkintoneフェスの一コマ

システム障害への対応、トヨクモクラウドコネクトの田里氏が問い詰められる
sponsored
「データガバナンスアドオン」を追加し長期間の確実なファイル保管を実現、未来の工事のあり方も模索へ

戸田建設のDropbox活用が拡大、電帳法対応から建設現場のナレッジ蓄積まで
sponsored

仕事や学習、家庭を持つあなたにピッタリ！マウスコンピューターのお勧めノートPCはこれだ！
sponsored
スマートウォッチの中でもワンランク上のグレードで、直接ネット通信も可

これはただのゴルフウォッチではない！スマートウォッチとしても上質・高機能な「HUAWEI WATCH 4 Pro TECRAモデル」登場
sponsored
パソコンショップSEVENの「ZEFT Z52LI」についてインタビュー

LianLiのケースにファン10基！超映えるが組立はかなり面倒、ならBTOPCでプロに任せよう
sponsored
次世代RAPID IPSパネル搭載でゲームも仕事もクリエイティブも快適

応答速度が2倍になってヌルりとした映像で勝ち確定、ゲーミングディスプレー「MPG 274URF QD」レビュー
sponsored

持ち運びやすい14型モバイルノートなのに2万円オフでお手頃価格！マウスのセールに注目
sponsored

ゲームから動画配信まで！幅広く対応できるマウスのゲーミングPCがセール中
sponsored

カルビーの新作「ポテトチップス濃厚キング」を、ラーメン専門メディアがじっくり味わう
sponsored
新キャラもいるぞ！いち早く実食

カルビーにヤバめの新作「ポテトチップス濃厚キング」がキター！濃くて旨いポテトチップス決定版!?
sponsored
Amazon限定モデル、JN-i27144URをレビュー

4K/144Hzのゲーミングディスプレーが6万円切り！PS5とも相性抜群なお手頃モデル
sponsored
ゴルフ機能追加が話題の「HUAWEI WATCH GT 4」など、最新のファーウェイ製品を体験できる！

日本の文化やITの発信地アキバにファーウェイ製品が美しく並ぶショップが登場！詳しく見てきた
sponsored
中堅・中小企業向けの“優しいIDaaS”で「セキュリティ向上」「管理負担軽減」を両立させよう

増え続けるクラウドアプリとユーザーアカウント管理の悩み、「ID Entrance」で解決！
sponsored
PS5やXbox Series Xにもオススメな「ROG Strix XG27UCS」

今どきのゲーミング環境は4K＆160Hz駆動!? ASUSの27型ディスプレーがちょうど良さそう
sponsored
アスキー編集者が最高の「息抜き」をしてきた

居酒屋さんで飲む「サントリー生ビール」が最高にうまい理由は？
sponsored
キャンペーン期間は2024年8月26日まで

BTO PCが4万円近く安くなることもある!? サイコム夏キャンペーンの必見カスタム構成
sponsored
LCDパネル＋ARGB LEDファン＋冷却性能重視の設計がウリ

猛暑日でも高負荷ゲームをしたいなら高性能の水冷CPUクーラーを選ぼう、「MPG CORELIQUID D360」徹底テスト
sponsored
X-500（JN-IPS24X500FR-H-C6）をレビュー

500Hzディスプレーの実力を14900KF＆RTX 4090搭載PCで絞り出す！合計約80万円でロマンを追求
sponsored
ゲームのスクショ、プレイ動画の編集におすすめ

AMD Radeon、AIバッチリ使えます：Adobe PhotoshopやPremiere Proで検証
sponsored
有線LAN搭載モデルや5Kディスプレーなど未発売のアイディアが続々！

折り畳みできる2画面モバイル液晶！JAPANNEXT本社で見た開発中モデルが欲しすぎる