視覚の解明からコンピュータビジョンへ—脳視覚系を数理モデルで模倣する—

コンピュータ理工学部 インテリジェントシステム学科 田中 宏喜 准教授

脳視覚系を数理モデルで模倣する

 「一目瞭然」という言葉があるように、私たちは目でものを見て、それが何かを判断する能力を持っています。例えば、手を見た時に、壁やテーブルの模様とはっきりと区別し、瞬時に手と認識することができます。実は、この能力は生物が進化の過程で発達させてきた優れた能力なのです。神経生理学、心理学、数理科学の3つの観点から、視覚の仕組みを研究する田中宏喜先生に、視覚情報処理の数理モデル化についてお話しいただきました。

ものを見るというのは実はすごいこと

 私たちは普段、見たものが何であるかわかることを特段すごいこととは感じていません。雑然とものが置かれた机の上であっても、その上に乗せた手を手だと見分けることができますし、手の一部が別の物で隠されていても、手と認識できます。

 「そんなの当たり前じゃないか」と思う人もいるでしょう。しかし、実はこういった複雑な背景から対象を切り分けて認識する能力、遮蔽に影響されずに認識する能力は、生物が長い年月をかけて発達させてきた非常に高度な脳の情報処理なのです。

 デジタルカメラなどで顔認識の技術が利用されているとはいえ、一般の物体を背景から切り分けて認識する能力はまだまだの段階で、コンピュータを使っても、人間の視覚情報処理能力には及びません。

 このことは、逆に考えると、人間の視覚の仕組みを解き明かし、その仕組みをコンピュータに応用できれば、とても効率のよい画像情報処理が可能になるということでもあります。

画像処理にも応用されるガボール関数

図1

 このような発想はすでに一部実際の技術として実践されています。

 目から入った視野の映像が脳に送られると、視野の場所ごとに図1のような縞パターンに分解されて、その情報が運ばれるようになります(図1には分解される縞パターンの一部だけを示しています)。このパターンはガボール関数とよばれる関数で表すことができます。

 ガボール関数に分解されたものは、足し合わせると元の画像に戻せることが数学的に知られています。したがって、脳は、元の画像情報を完全に再現できるように、うまく分解して伝達しているわけです。千差万別のあらゆる画像が、全てこのパターンの組み合わせで表すことができるというのは不思議に感じるかもしれません。

 私自身も、あらゆる画像がこのパターンに分解でき、しかも数学的に逆変換を行うと元の画像を復元できることを初めて知った時には感動を覚えました。

 さらに、このガボール関数によって画像データを表現することは、非常に効率のよい方法であると証明されていて、コンピュータの画像データ圧縮の方式にも応用されています。脳が進化の中で身につけた方法を学べば、それをコンピュータに応用できることを示す一つの例といえます。

物体表面の境界を検出する機能をモデル化

図2
図3

 ものの形を認識するためには、物体とその周囲の境界を決定することが重要となります。これを行うための強力な機構が脳に備わっていることは、図2のようなパターンからも示唆されます。この図は、縦線と横線から構成されているだけですが、私たちは、その境界となっている菱形を知覚します。

 この境界の菱形は、実線で描かれていないにもかかわらず、瞬時に、そしてはっきりと知覚されます。このような機能が、複雑な背景から対象を切り分けて認識するのに役立っていると考えられます。

 私は、この脳が行っている境界検出の数理モデルを構築しました。図3がその概念図です。図の左に示すように、網膜から入った視覚の情報は、脳で、縞パターンにまず分解されます。このことは先ほど説明したとおりですが、ここでは縦縞パターンに注目しています。

 縞パターンの情報を伝えるのは、単純型細胞とよばれる脳の第一段階の細胞です。細胞により、伝えている縞パターンの白黒の位置関係は異なります。

 次の処理段階である複雑型細胞では、視野の場所ごとに、縞の向きの情報がまとめられて、その次の処理段階である境界検出細胞へと送られます。この細胞が、視野の各場所から、どのように縞の入力を受け取るのかは、図の中央のピンクと紫で描かれています。この細胞では、プラスの部分に縦縞(縦線)があると強く反応し、同時にマイナスの部分に縦縞(縦線)があると反応を抑えるような仕組みになっています。

 このように入力を受け取ることで、この境界検出細胞は、縦縞(縦線)と横縞(横線)が隣接している場合により強く信号を発することができるのです。

 さらに、私は、このような神経回路モデルと合致した働きをする細胞が実際に存在するかどうかを、生理学的実験により確かめました。これにより、この数理モデルの妥当性が裏づけられました。

視覚情報処理研究の展望

 ガボール関数や私の作った境界検出細胞の数理モデルなど、形状認識についての理解は進みましたが、さらに高次の段階で、どのような情報が運ばれているのかは、いまだ解明されていない部分が多くあります。例えば、顔、手、机といった実際の物体の情報がどのように運ばれているのか、また、識別する脳の仕組みについてもよくわかっていません。

 脳の働きを調べる技術は近年、急速に高度になってきました。高次の情報を扱う神経回路モデルを構築する新しい数理的枠組みも提案されつつあります。

 これらを融合すれば、脳の物体認識の仕組みが解明されて、それをコンピュータビジョンに応用することも可能になるでしょう。

 この分野は今とても面白い時代に入っています。脳を調べる技術とコンピュータの性能の向上で、10年前では考えられなかった研究が行えるようになっています。コンピュータビジョンによる自動運転車など、新しい技術が次々と実現しつつあり、そこでの応用を見据えた脳の仕組みの解明は、今後ますます重要で注目されるようになるでしょう。

アドバイス

 皆さんが進路を考える際に「この分野は面白そうだ」「この学問は退屈そうだ」などさまざまな印象を持つと思います。しかし、知っておいてもらいたいのは、魅力的な研究の裏には、地道な作業や頭を悩ませる問題が必ず隠れているということです。このことは、研究者だけではなく、世の中のあらゆる職業にも当てはまることです。

 どんな分野に進むにせよ、粘り強く、継続して、やり抜かなければ、面白い成果には到達できないものです。中途半端で投げ出さず、最後までやり抜く粘り強さを持ってください。

コンピュータ理工学部 インテリジェントシステム学科 田中 宏喜 准教授

プロフィール

博士(理学)。専門は脳視覚情報科学、ブレインマシン・インターフェース。大学入学までは心理学や社会学といった人間の行動を説明する分野に興味があったが、大学で脳科学が心を調べる分野として発展しつつあるのを見て「これからは脳だ」と脳科学の分野へと進む。脳の仕組みを調べる神経生理学、数学による脳のモデル化、知覚を扱う心理学の3分野にまたがる研究に取り組む。奈良県立奈良高等学校OB。

PAGE TOP