このページの先頭です

メニューを飛ばして本文を読む

ここから本文です

サイト内の現在位置

研究者情報:研究・産学連携

ユニーク&エキサイティング研究探訪
No.05 情報メディアシステム学専攻 佐藤准教授の視覚に関する研究

視覚の機能をコンピュータでシミュレーション可能に

情報システム学研究科 情報メディアシステム専攻
佐藤 俊治 准教授

情報メディアシステム学専攻 佐藤俊治准教授の論文が、平成21年度日本神経回路学会論文賞を受賞し、その功績により理研理事長(野依良治博士)から感謝状を授与された。

対象になった論文(注1)は、盲点の充填知覚の働きを数式化してコンピュータでシミュレーションできるようにし、それが画像処理に応用できることを明らかにしたものだ。

盲点における充填知覚とは

図1 盲点における充填知覚
図2 盲点における充填知覚を体験してみる

我々がものを見るときは、眼球の奥にある網膜に投影された像を見ていることになるが、実は網膜には1か所、光を感じない領域がある。それが盲点で、左右の眼球の網膜それぞれに1か所ずつ盲点が存在する。カメラで例えれば、フィルムの1か所にいつでも穴があいている状態だ。

盲点に入った光は、感知されないので、本来はそこに黒い穴があいたように見えるはずだが、実際には脳が欠損している情報をうまく補って、見えるようにしている。この現象は充填知覚と呼ばれ、マクロな現象として以前から知られていた。

一方、近年、神経生理学の分野で実際に盲点の欠損部分を補完する働き(つまり充填知覚)を担う脳神経細胞が見つかった、という報告がなされた(注2)。佐藤准教授らの今回の仕事は、その報告を受けて、充填知覚を担う神経細胞の機能を数式化したものだ。充填知覚の機能を数式化してシミュレーション可能にしたのは世界で初めてである。

2009年12月末に研究室を訪れたら、早速充填知覚を体験させられた。図1のように中心の青丸を黄色い丸が取り囲むようなドーナツ型図形を、図中の指示どおりに右目を閉じ左目で十字を見て、顔を近づけて行くと、あるところでドーナツ図形が黄色の満月図形に見える。これは、ドーナツ図形の中心にある青丸が、網膜の盲点に投射された場合に起きる現象である。本来そこは何も見えないはずだが、脳が盲点での欠損情報を、見えている周辺の黄色と同じとして補完するので、全体が黄色の満月図形に見えることになる。図2の直線の場合も同じだ。

絵画や写真のレタッチに応用可能

図3 表面を市松模様のパターンで覆われ、 元の絵柄が判明しない
図4 今回の充填知覚モデルで図3を復元した例

佐藤准教授らは、今回の研究成果を学会論文で発表しただけでなく、特許も出願した。充填知覚をコンピュータでシミュレーションできると、たとえば1部の画素情報が欠落した画像を、人間にとって自然な画像に復元するような、画像処理装置に応用できる。コンピュータ・シミュレーションの場合は、盲点は1個に限らず何個でもいい。図3のように、元の絵のほとんどを市松模様のパターンが覆い隠しているような場合でも、この技術を使えば図4のように元の絵を復元できる。今回の論文中で、Adobe社Photoshopの画像修復ソフトとの違いを紹介しているが、この充填知覚モデルの方がより忠実に原画を復元できる。

佐藤准教授は大学では「人間情報学講座」を担当している。いろいろな情報処理装置が実用化されているが、それを使う人間がどんな情報処理をしているのか、基本的なことを理解しようとする学問だ。佐藤准教授流に言うと、「理解する」ということは「数式に置き換えることだ」という。人間がおこなっている情報処理の中で、特に運動と視覚に関する情報処理能力がずば抜けて優れていて、ロボットや画像処理機械などではまだ追いつけていない部分がある。一方、錯視に代表されるような変な性質も併せ持つ。まず人間の情報処理がどのように行われているのかを研究するのが、人間情報学講座なのだという。

視覚の情報処理に関わっている脳の神経細胞は、複数の領域に分かれており、神経生理学ではそれぞれの領域の機能がある程度解明されているが、それぞれの領域で複雑な細胞間コミュニケーションをしており、詳しくはほとんど分かっていない。今回の仕事は、視覚の情報処理のごく一部をある程度理解(つまり数式化)したに過ぎないが、「基礎的なことを一つ一つ積み上げていけば、何年先になるかはわからないが、いずれ究極の文字認識装置ができると期待して研究を進めている」と佐藤准教授は言う。万里の道も一歩から。道ははるかに遠いようだが更なる前進を期待したい。

(2009年12月)

  • 注1:Shunji Satoh, Shiro Usui,”Computational theory and applications of a filling-in process at the blind spot.”Neural Networks 21,1261-1271
  • 注2:Matsumoto,M.,& Komatsu,H.(2005),Neural responses in the macaque V1 to bar stimuli with various lengths presented on the blind spot. Journal of Neurophysiology, 93, 2374-2387
プロフィール

東北大学出身(1995年工学部通信工学科卒業、2000年3月博士〈工学〉)

電通大大学院情報システム学研究科 情報メディアシステム専攻准教授に2009年4月に就任したばかり。理化学研究所の客員研究員(スーパーコンピュータプロジェクトの構成員の一人)を兼ねている。

もともと、脳には関心がなかったという。文字認識装置を作って目の不自由な人に本を読みあげるようなシステムを作りたいと思っていた。学部卒後、文字認識を研究する研究室に配属になったが、そこで受けたショックが現在の研究に繋がっている。15年前のことである。研究室の文字認識装置にドラえもんの似顔絵を読ませたら、機械は「囲」と誤認識したという。機械が認識できない文字でも人間は簡単に認識できる。それなら人間はどのようにものを見ているのかに関心が移ったという。

エンジニアであって、サイエンティストだと自認している。ミクロな神経細胞の働きを複雑な数式に置き換えて、それを画像の復元システムという応用開発につなげた今回の仕事は、まさにエンジニアで、かつサイエンティストでなければなし得ない研究事例だろう。サイエンスという強力な武器を使いこなせる理想的なエンジニアだが、同時に究極の文字認識装置を作りたいという学生時代の夢を追い続ける粘り強いロマンチストでもあるようだ。

このページをご覧になるために

Adobe Reader ダウンロードページへ(新しいウィンドウが開きます)

PDFファイルをご覧いただくには、Adobe社の Adobe Readerが必要になります。
最新の Adobe Readerは Adobe社のウェブサイトより無料でダウンロード可能です。