このページの本文へ

遠藤諭の『デジタルの、これからを聞く』 第3回

電通大宮脇准教授に聞く、視覚に関する脳研究の最新事情

わたしたちの脳は、目にしたものをどのように認識しているのか

2014年06月19日 11時00分更新

文● 遠藤 諭/角川アスキー総合研究所

  • この記事をはてなブックマークに追加
  • 本文印刷

遠藤 機械学習の世界だと、文字認識の場合、縦横の比率などを同じになるように補正して、いろいろなパターンの文字をダーッと重ねて、いちばん確率的に重なる文字を探してくる。「パーセプトロン」(神経回路を参考とした、機械学習のアルゴリズムの1つ)みたいな感じですが、脳のパターン学習もそういう手法なんでしょうか?

宮脇 まったく同じですね。パーセプトロンでもいいんです。実際によく使うのは「サポートベクタマシン」(与えられたデータを2つの区分に効率的に分ける、機械学習のアルゴリズムの1つ)というやり方なんですけれども。

遠藤 要は、アルゴリズム的に、人工知能的に脳のしくみを求めていると。

宮脇 そうですね。

遠藤 すごく素朴な疑問なんですが、脳細胞ってワーッと集まって、最近だと何層構造になっているとか言われていますけれども、コンピューターグラフィックスのように、XY軸のピクセルみたいには並んでいないですよね。そもそも、人間の網膜がXY軸の配列ではないじゃないですか。MRIから読み出したデータというのは、どういう状態なんでしょうか。2次元の配列になっている?


宮脇 MRIで測った状態は、基本的に画像と考えていただいていいんですが、みなさんがよく見られるMRIのデータというのは、脳のしわしわがはっきり見えるスライスされたタイプじゃないかと思います。それは解剖画像といいます。MRIは基本的に水分子の密度を測っているんですが、水分子の密度だけだと脳の活動どうこうというのとは関係なくて、構造だけしか見えません。

 一方で活動のデータがどう見えるかというと、グレーの濃淡の、64×64のマトリックスからなっている一断面が、バーっと並ぶかたちになります。

遠藤 水平方向は何枚?

宮脇 水平方向に何枚撮るかは、さっきの何秒で脳全体を撮るかということに依存するんですが、3秒ぐらいだと大体50枚ぐらい撮れます。50枚撮ると、頭の上から、下のほうにある小脳まで、全部カバーできます。

遠藤 解像度は64×64ドットですか?

宮脇 ええ、その解像度が典型的ですね。ドットの1辺が3mmですから、192mm×192mmというスケール感になります。人が実際に何かを見ると、血流がちょっと変わります。血流が変わると、磁性の変化、磁場に対する性質が変わります。それに影響されて、水分子が返してくる信号が変わるということになります。

fMRIで計測した脳内の血流変化の生データ。解像度は64×64ドット。

 脳細胞が活動すると、活動した場所に当然酸素が必要になりますよね。酸素が必要になるので、そこへ血液を送れという信号が出ます。そうすると、実は、血液が過剰供給されちゃうんです。血液が運んでいるのは酸素化ヘモグロビンで、脱酸素化ヘモグロビン、デオキシヘモグロビンは減少します。酸素化と脱酸素化の比が変わると局所的な磁性が変わって、まわりの組織の水の密度から返ってくる信号の強さに変化が出てくるんです。この信号は脳の活動を反映しているので、MRIのあたまに“functional”、つまり「機能的」の“f”をつけて、fMRIと呼ぶんですね。

遠藤 なるほど。そうやって読み出して「車」と「バイク」の違いをとにかく比べていくと。

宮脇 fMRIから出てきた画像は、ただ見ただけではわからないですよね。見てもわからない特殊な画像を機械に学習させて、どこのピクセルがちょっと明るいのか、逆にどこのピクセルがちょっと暗いのか、みたいなことを調べていきます。

遠藤 コンピューターの世界だと、1ビットが“ON”であるか“OFF” であるかってものすごく重要じゃないですか。1ビット違ったらプログラムはもう誤動作してしまう。そのためにパリティビット(データの誤伝達を検出する符号)みたいな仕組みがあるんですが、それに対して、脳はもっとおおらかというか、マクロ的に動いているということなんですか?

宮脇 脳自身がですか?

遠藤 脳細胞が1個つながっているか離れているかによって、動きがすごく変わってくるのか、それとも集合的に動いていているのか。

宮脇 それは脳の場所によりますし、表現している情報の処理にもよります。

遠藤 じゃあ、1ビットで、1つの神経細胞で、決定的に変わることもあるんですね。

宮脇 あるという説もあります。例えば、僕が研究してきたのは初期視覚野と呼ばれる場所ですが、ここではそういうケースはあまりありません。

遠藤 パターン認識っぽいからですか。

宮脇 細胞1個ではあまり意味を持たなくて、結局その隣にはほとんど同じ情報を表現している神経細胞もあるので、わりと冗長なんです。なのですが、高次視覚野と言われる側頭野の部分になってくると、コーヒーカップと手帳とか、複雑な物体を表現するようになってきて、事情は変わってきます。

この連載の記事

週刊アスキー最新号

編集部のお勧め

ASCII倶楽部

ASCII.jp Focus

MITテクノロジーレビュー

  • 角川アスキー総合研究所
  • アスキーカード
ピックアップ

デジタル用語辞典

ASCII.jp RSS2.0 配信中