このページの本文へ

遠藤諭の『デジタルの、これからを聞く』 第3回

電通大宮脇准教授に聞く、視覚に関する脳研究の最新事情

わたしたちの脳は、目にしたものをどのように認識しているのか

2014年06月19日 11時00分更新

文● 遠藤 諭/角川アスキー総合研究所

  • この記事をはてなブックマークに追加
  • 本文印刷

人間はどうやって物体を認識しているのか?

遠藤 視覚野は全部でいくつまであるんですか?

宮脇 V8まであると言われています。

遠藤 各段階で、処理にそれぞれ時間がかかるわけじゃないですか。V1で時間がかかって、V2でもまた時間がかかる。その時間の差って、いろいろなところに影響しそうに思うのですが。

宮脇 いい質問ですが、それはわかっていない問題なんです。

遠藤 そうなんですか?

宮脇 MT(あるいはV5)という部位がありまして、ここでは動きを処理します。人間は、例えば赤色の図形が右に動いて、緑色の図形が左に動くような場合でも、同時に理解できますよね。ところが、脳では動きと色を処理する場所が違います。そして、MTで動きを検出する時間と、V4で色を検出する時間は違うので、混乱しそうですよね。どれとどれを結びつければいいのか、となるはずですが、これはわかってないです。バインディング問題(複数の対象をどう結びつけて認識できるかという問題)として一番難しいもののひとつです。

遠藤 これはテレビの映像処理チップを作っている人たちの課題でもあるんですが、映像の線の処理と色の処理は違うプロセスでやるので、ずれてしまったりするんです。つまり、テレビの画面で、顔の輪郭と顔の色がずれたりするんですよ。今は処理能力が高くなっているのでほとんど起きないんですが、私が家で使っていた初期のデジタルテレビでは、実際にそういうことが起きていました。

宮脇 これとはちょっと違うんですが、色と動きに関連した面白い錯覚現象があります。先日、静止画なのにチカチカ動いて見える、Lady GaGaのCDのジャケットを書かれた北岡先生(立命館大学 文学部人文学科 心理学専攻 北岡明佳教授)。

“Fluttering red hearts in front of the green background”。画像をスクロールするなどして動かすと色と動きがずれて見える。(北岡教授のWebサイト「北岡明佳の錯視のページ」(http://www.psy.ritsumei.ac.jp/~akitaoka/)より引用)

 その北岡先生が、「Fluttering Heart Illusion」というのを公開していらっしゃるのですが、例えば緑と赤で、色は違うけれども明るさは似ている画像を用意します。それを動かしていくと、色の差で定義された境界(この例だとハートと背景の境界)と背景の動きがずれるんですよ。

遠藤 そういった錯覚的な話って、今のV1からV8のどのあたりで起きているんですか?

宮脇 それぞれ錯覚の種類によります。例えば傾きの錯視みたいなものであれば、傾きの検出が中心になっているV1で説明され、色と動きの統合に問題が出てくればさっきの話にあったMTとかV4とかが関係しているのではないかという説明がなされることが多いですね。

遠藤 先ほどもご説明があったように、MTは運動を検出する部分ですね。

宮脇 V1、V2、V3、V4というところは、「低次視覚野」と呼ばれる場所でして、比較的場所の情報が保存されています。この神経細胞はこの辺とか、別の神経細胞はこの辺とか、場所分担がはっきりしているんですけれど、そこから先になると場所分担が曖昧になってきて、MTでは視野の広い範囲をカバーするようなります。

遠藤 視野と神経細胞の対応がV1~V4ではできたけれど、動きはそうはならないんですね。

宮脇 それで、私の研究は、今説明した機能分担、機能分化に関係するんですが、高次の複雑な部分ってあまりわかっていません。私がメインのテーマとして今やっていることのひとつは、物体の認識です。

 これはコーヒーカップで、どこから見てもコーヒーカップですよね。でも、目に映る画像は、前から見るのと、横から見るのとではぜんぜん違います。ですので、コンピューターにコーヒーカップを認識させるのは、ものすごく難しい。

遠藤 そうですね。

宮脇 ですが、映像は大きく変わってしまっていても、人間はいとも簡単にコーヒーカップはコーヒーカップだと認識します。そういった認識が、どうやってできているかということが、私のメインテーマのひとつです。

遠藤 それは、右目と左目で視差から始まって、自分の位置が変わってとか、そういったことを考慮されて研究されているのですか?

宮脇 奥行きの情報は、今は入れていません。人間って、白いコーヒーカップを見ても、マグカップを見ても、全部コーヒーカップだと認識しますよね。

遠藤 概念化みたいな話でしょうか

宮脇 その一歩手前です。あくまでも画像の手がかりによるものなんですけれど、あるカテゴリーに共通の特徴を抽出してきて、これは犬だろう、みたいなことです。

遠藤 ブルドッグであろうが、シェパードであろうが、犬は犬だとわかると。

宮脇 そういうカテゴリー化のプロセスが、どうやって行われているのかというのがひとつです。

遠藤 動物か、犬か、ブルドッグかといったことって、人工知能の世界だと、プロダクションルール(もしAならばBである、といった推論を行う規則)みたいにひとつずつ確認して辿っていくというのがありますよね。あるいは、仮定を立ててそこから逆に戻ってくると、無駄な選択肢に行かなくてピピッと早く正解にたどり着くということになります。同じようなことが、人間の脳でも起きているんですか?

宮脇 まさにそこが知りたいところです。

遠藤 認識のスピードからすると、仮定を立てて戻った方が速いですよね。

宮脇 と、思いますよね。でも、先行研究はそうでもなさそうなんです。猿のデータとか、人間のいろんな他のデータからすると、どうも一番上の粗い概念から見ていって、細かいところへ順に降りていくのではないかと。

遠藤 ただ、コンピューターみたいに、まじめに全部の可能性を総当り的には辿ったりはしないようにも思います。総当たりをやらないのが人間とか生物的なので、仮に上から見ていくのだとしても、全部はやらないんじゃないでしょうか?

宮脇 ですが、一部省くとなると、その手がかりをどこから得るのかというのもあります。

遠藤 そうですよね。とはいえ、総当たりでやっていると。

宮脇 わかりません。結局、物体がどういう風に認識されているのかというのが、視覚の分野では一番わかっていない部分のように思います。

この連載の記事

週刊アスキー最新号

編集部のお勧め

ASCII倶楽部

ASCII.jp Focus

MITテクノロジーレビュー

  • 角川アスキー総合研究所
  • アスキーカード
ピックアップ

デジタル用語辞典

ASCII.jp RSS2.0 配信中