◆Homeostasis and Artificial Intelligent - スポンサー広告AI/VR
FC2ブログ

スポンサーサイト

author photo

By浅田麻衣子 会社サイト用コラム

-
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
Share

◆Homeostasis and Artificial Intelligent

author photo

By浅田麻衣子 会社サイト用コラム

人工知能と恒常性

人間の脳は大半が画像処理に用いられている。
ai.jpg

そもそも映像は左右反転上下逆に網膜に映り、盲点という、見えていない部分まであるので、脳の働きはそれを補正するところから始まる。

この動画処理をコンピュータでやるとけっこう面倒なので、目で見るということがいかに脳に負荷がかかるかということが想像できる。

ところで、私は専門がコンピュータでなく絵画と政治経済学を学んだ。

美術短大で絵画を選ぶと、知覚の恒常性というものを学ぶ。

知覚の恒常性を調べると下記のように表記される。
「対象が同じであっても、見る方向や距離、照明などが異なれば、網膜に映る像もそれに合わせて変化するが、対象は比較的一定のものとして知覚される。これを知覚の恒常性と呼ぶ。」(科学辞典より引用)

例えをあげると、遠くに人が立っている。小さい点に見えているのが、だんだん近づいてくると大きくなって見えるのだが、それでも巨人になったようには見えずに同じ人物だと分かるのが形状の恒常性。(実際は、近づくにつれて大きくなって映っているが、大きくなったとは知覚しない)

蛍光灯で見ていた赤いトマト、緑の光で照らしても赤いトマトだと認知できる。或は、夕陽が差して赤い光に晒されても、白いシャツは白だと知覚できることを色の恒常性と呼ぶ。(網膜に映る色は異なっているが、脳内にある元の色だという認知を行なっている)

この普通の人なら働いている恒常性だが、実は赤ちゃんは恒常性が働いていない。恒常性を保つのは、経験というデータベースが必要だからだ。

お母さんが「いないいないばあ」と顔を隠して手を広げると赤ちゃんが喜ぶのは、赤ちゃんはお母さんが顔を手で隠すと「いなくなった」ように見えて不安になるのに、手を開くとお母さんの顔が出て来て嬉しくなって喜ぶというメカニズムだ。

通りすがりの人の顔を赤ちゃんはじっと見ている。

じっと見なければならないのは、近寄ってくる人、近寄った人、近寄った後に去る人、が同じ人物だということを確認する為に見つめ続けなければ認知できないからである。ようは恒常性が働いていないから、細部まで観察してその人物の特徴点を記憶して脳内で何度もマッチングさせて「小さくなったり大きくなったりしているが同じ人物だ」と認知する。

実はコンピュータは、「恒常性」が全くサッパリ働かない。
恒常性を働かせるには、記憶媒体にデータベースを置く必要がある。

色んな色や形をデータベースに記憶させたうえで形のパターン認識で「形状の恒常性」はできても、「色の恒常性」はかなり難易度が高い。

形状の恒常性を人工知能に学ばせようとすると物体を回転させた時に全く異なる形状になるので、そもそも入力の時点で3次元情報が必要となる。

人間の目は右目左目の視差と運動視差から物体の距離情報を常に脳内で計算し、心の中に三次元空間を持っている。見えない部分も、物体を分類してある程度は形状を予想して見えている。

ということは、人工知能も右と左のカメラから映像を入力して、3次元計算をしないと物体の3Dデプスマップは取れないということだ。そして、デプスマップを頂点簡略化したポリゴンにすれば、ある程度までは計算量が減る。

色の恒常性を保つためには、最初に正常な色を「これが本来のこの物の色」という風に記録しないといけない。形状のパターン認識までは自動でできても、この「物の本来の色」を自動的に認識するのは難しいのではないだろうか。

色の恒常性を人工知能に学ばせようとすると、3次元情報+光源の情報が必要となる。どこから光が出ていて、その光源の光の色は何色か、輝度はどれだけかという情報だ。もちろん、色も情報量を間引けるが、色の恒常性を人工知能に学ばせるほうが、情報量がどうしても多くなるので難易度は上がる。(エンコード後の動画は原画よりも情報量が少なくなったとしても、同じ映像をポリゴン化したものよりははるかに情報量が多い)

前回、知能が高い自閉症の女性の話を書いたが、彼女の名前を仮に『変子さん』とする。(彼女のお気に入りのニックネームで本コラムでの利用も了承を得ている)
変子さんは、いつも人の顔や通りすがりの人をじっと見つめるので、変な人だと周囲から思われがちだったそうなのだが、医師から「知能は高いけど、自閉症ですね」と言われて驚いたそうだ。

自閉症患者の反応が人工知能の反応に似ているという話を書いたのだけど、変子さんも恒常性の機能が平均より弱いと言える。

どうして、彼女の恒常性機能は弱いのか。

実は彼女が描く絵は精緻なデッサンが多い。
写真かと思うようなデッサンが描けても、簡略化したイラストが彼女は苦手だ。

それは、彼女の視覚的な記憶が平均よりも詳細だからだ。
詳細過ぎて、一般的な人が捉えられるイラスト化の時点で必要なモノの特徴点が埋もれてしまっているのだ。

変子さんは、お友達がアイシャドウの色を変えたとか、会った人の顔は覚えてなくてもイヤリングや付けていた眼鏡のメーカーなど、付随部分の情報を事細かに覚えている。

初めて出会う人の、その人物を覚える時には平均的な人は顔、目、体型、何色の服かという面積と重要度の高いと思われる部分から効率よく特徴を抽出して恒常性を働かせている。

ところが、自閉症患者は視覚的な情報量が平均的な人間よりも多いので、それを処理するのに時間が掛かる為に「じっと見つめる」という行為を行なわざるを得ない。

赤ちゃんや変子さんの反応と一般的な人間の反応の違いのメカニズムを考えると、ここに人工知能を進化させるヒントが見えてくる。

人間はいかに目に入ってくる情報量を効率よく減らし、特徴点を失わずに一般化したモデルを心の仮想空間上に置いているか。入力保存されている情報量が少ないからこそ、リアルタイムに恒常性を働かせることができている。

特徴を維持しながら情報量をいかに減らすか。

単なるテキストや数値のデータだけを学ぶ人工知能の世界を遥かに超えて、人間の赤ちゃんと同様にコンピュータビジョンから学ぶ人工知能の時代に突入し始めている。

動画圧縮の技術と人工知能は切っても切れない関係が見えてきた。

続く
BY 浅田麻衣子
スポンサーサイト
Share

Comments - 0

Leave a reply

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。