このページの本文へ

AIに職人技を教えるデータセット、メタが公開　料理、ダンス、バイク修理など

2023年12月07日 07時00分更新

文● 田口和裕

　メタおよび東京大学を含む17の大学による研究グループは11月30日（現地時間）、料理や自転車修理といった複雑な人間の活動を一人称（エゴセントリック）および三人称（エクソセントリック）視点から同時に撮影し、自然言語による注釈を加えた大規模かつマルチモーダルな動画データセットおよびベンチマークタスクを組み合わせた「Ego-Exo4D」を発表した。

エゴ（一人称）視点とエクソ（三人称）視点を統合

エゴ視点（左）とエクソ視点（右）

　人間の行動、特にスキルと専門知識の理解は、拡張現実（AR）、ロボット学習、ソーシャルネットワーク分析などさまざまな技術分野で重要だが、AIにとっては難しい課題となっている。

　

　Ego-Exo4Dは、手と物体の相互作用、注意の焦点など細かな行動の詳細を捉えるエゴ（一人称）視点と、全体的な動き、身体の姿勢、周囲の環境との関係などを示すエクソ（三人称）視点の2つの動画を同時に撮影し、自然言語による注釈（アノテーション）を加えることによって、人間のスキルと専門知識をより総合的に捉えることを目標としている。

ARグラスと複数のGoProで撮影

エゴ視点（左および右上）とエクソ視点（右下）

　データセットは、800人以上の参加者によって世界13都市で撮影された1422時間に及ぶ動画データが元になっている。

　動画にはスポーツ、音楽、ダンス、自転車修理など、様々な物理的および手続き的スキルを必要とする13の活動が記録されている。

「Aria Glass」

　エゴ視点の動画はメタが開発したARグラス「Aria Glass」を、エクソ視点の動画はAria Glassと同期した複数の「GoPro」カメラを使用して撮影された。

3次元空間上の特定の地点をあらわす点群（Point Clouds）

　また、動画だけではなく、7つのマイクを使用したマルチチャンネルオーディオ、眼球運動、3Dポイントクラウド、カメラの姿勢、IMU（慣性測定ユニット）、気圧計、磁力計などマルチモーダルなデータが含まれており、人間の行動とスキルを多角的に分析し、理解するための豊富なデータソースとなっている。

動画を補足するアノテーション

動画に付けられたアノテーションの例

　さらに、動画データにはコンテンツの理解を深め、多様なアプリケーションでの使用を促進することを目的に自然言語を用いた下記3種類の注釈（アノテーション）が付けられている。

専門家のコメント（Expert Commentary）

　各分野の専門家による詳細なコメント。これにより、特定のスキルや手法に関する深い理解が可能になる。

撮影者によるナレーション（Participant Narration）
　動画撮影者自身が提供するナレーション。撮影者の視点からの活動の説明や、その時の考え方、意図などが反映されている。

アトミックアクションの記述（Atomic Action Descriptions）
　動画内の個々のアクションや動作を具体的に記述したもの。この記述は、動作認識やアクションセグメンテーションなどのタスクに有用。

　これらの自然言語の説明を動画と組み合わせることで、研究者や開発者は人間の行動とスキルに関するより豊かな洞察を得ることができるという。

作成したモデルやアルゴリズムを評価するベンチマークタスクも提供

　Ego-Exo4Dでは、データセット以外に、研究者が自分のアルゴリズムやシステムを評価し、比較するための4種類のベンチマークタスクを提供している。

エゴ・エクソ関連タスク（Ego-Exo Association Tasks）
　エゴ視点とエクソ視点動画間の関連性の特定および理解を評価するタスク。異なる視点からの活動の同期や相関を把握できる。

エゴ・エクソキーステップ認識タスク（Ego-Exo Keystep Recognition Tasks）
　特定の活動やプロセス内の重要なステップやキーモーメントを認識するタスク。スキルの学習や指導に重要。

エゴ・エクソ能力推定タスク（Ego-Exo Capability Estimation Tasks）
　利用者のスキルや能力を推定するタスク。専門的な技能や学習過程を評価するために役立つ。

エゴポーズタスク（Ego Pose Tasks）
　エゴ視点動画から参加者の姿勢や動きを推定するタスク。動作分析や姿勢推定の研究に利用される。

　これらのベンチマークタスクはデータセットの多様な特性を活用し、人間の行動とスキルに関する深い洞察を提供。新たなアルゴリズムやシステムの開発と評価に重要な役割を果たすという。

　Ego-Exo4Dは12月中にすべてのデータをオープンソースで公開する予定。また、来年には公開ベンチマークチャレンジの開催とベースモデルのリリースも予定されている。

　過去に類を見ないスケールで提供される本データセットによって、AIが人間のスキルを効率的に学習できるようになることで、熟練した職人の技を再現するロボットや、より安全な自動運転自動車の開発などさまざまな分野での応用が期待されている。

■関連サイト

ツイートする

カテゴリートップへ

AIオススメ記事

2025年01月27日

AI

動画生成AI、ついにアダルトの扉が開く
2025年01月20日

AI

AIの書いた小説が普通に面白い　ChatGPT「o1」驚きの文章力
2025年01月27日

AI

ChatGPT超えの中国AI「DeepSeek-R1」の衝撃
2025年01月27日

AI

グーグルAI「Gemini」　無料版と有料版の使い方を徹底解説
2025年01月06日

AI

OpenAI、月額3万円のChatGPT新プランで損失「想像以上に多くの人々が使用」
2025年01月24日

AI

OpenAI、最新AIモデル「o3 mini」無料開放　「o1」超えるつよつよ性能
2025年01月28日

ITトピック

まだ遅くないAI学習　無償の学習基盤を日本マイクロソフトが公開
2024年12月24日

AI

動画生成AI、無料プランでも使い倒せば月200本作れます　サービス同士の違いも比較しました→Runway、Pika、Hailuo、Kling、Luma、Kaiber、PixVerse
2024年12月02日

AI

イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃
2025年01月16日

AI

XのAI、「なんJ民」の口調をマスターしてしまう

ピックアップ

sponsored
ネットワークとセキュリティを統合した「セキュアSD-WAN」がこれからのトレンド

あなたの会社でも起こりうる“SD-WANのセキュリティ設定漏れ”、どうやったら防げた？
sponsored
「最小限の情報しか見せない」設定で社内情報が漏れるのを防ぐ

Backlogに社外メンバーを招待する際のリスクと“安全な設定方法”とは？
sponsored
2ケタ成長が期待される日本・アジアのビジネス、SIパートナービジネスが大きな鍵を握る

企業やSIerが“付き合いやすいColt”へ、大江代表に聞く2025年の成長戦略
sponsored
マウスコンピューターのスタンダードなデスクトップPC「mouse MH-I7U01」がセール中

自宅のWindows 10パソコンを買い替えるなら今がチャンス！ Core i7搭載で高性能なミニタワー機が2万円オフ
sponsored
マウスコンピューター「G TUNE」の白いゲーミングノートが現在セール中

【白いゲーミングノート】Core i7＆RTX 4060＆144Hz　最新PCゲームを遊びまくりたいなら買うべし！
sponsored
Z by HP Data Science Ambassadors×日本HP×NVIDIA、ローカル生成AI特別対談

生成AIの次なるステージ：ローカル環境がビジネスの新しい扉を開く理由
sponsored

「日本のユーザーは製品の機能面に注目する」「今年も革新的な製品を出していく」ファーウェイトップインタビュー
sponsored
小さなオフィスや店舗のWi-Fi 6導入でおすすめできる「間違いのない」選択肢はこれ！

ビジネス向けWi-Fi「HPE Networking Instant On AP21」が安心して選べる3つの理由
sponsored
MSIのハイエンドモデル「MPG 271QRX QD-OLED」を徹底レビュー

液晶に戻れない！ゲーミングPCの性能を最大限引き出す360Hz、GTG0.03msのOLEDディスプレーが究極すぎた体験記
sponsored
JN-V236G180F-RETROをレビュー

180Hzのブラウン管テレビ風ゲーミングディスプレー、昭和レトロファンの心にドンズバ
sponsored
音楽を聞くのはもちろん、通話やビデオ会議にも便利に使えます！

ワイヤレスイヤホン新決定版はコレかも！お手頃価格＆インナーイヤーの「HUAWEI FreeBuds SE 3」に注目した
sponsored
Core Ultra 5 225/225F/235/245T、Core Ultra 7 265/265F/265T、Core Ultra 9 285/285T

コスパ重視ゲーミングPCのド本命、65W＆35W版Core Ultra 200S＆インテルB860マザーがサイコムのBTOに追加
sponsored
Ryzen 7 9800X3Dを搭載するゲーミングPC「ZEFT R59CE」の魅力を聞いた

あの話題作で快適に狩るためのBTOPC、ASRock・AMD・パソコンショップSEVENが出した答えとは？
sponsored
JAPANNEXTの「JN-IPS238G200F-Camo-W」「JN-IPS238G200F-Camo」レビュー

迷彩柄のゲーミングディスプレーをサバゲ―フィールドに持って行き、映える写真を撮ってみた
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！