Language, Cognition, and Human Nature 第2論文 「心的視覚イメージ方略についての計算理論」 その5

Language, Cognition, and Human Nature: Selected Articles

Language, Cognition, and Human Nature: Selected Articles


画像を2次元的に処理しながら3次元の奥行きを感じている視覚認知をどう説明するのか.ピンカーは2次元アレイに奥行き情報をセルストリングとして持つ視点座標を基本とし,物理座標への変換テーブルを併せ持つ「デュアルアドレスアレイ」を提唱する.

6. デュアルアドレス理論は空間情報処理をどう扱うのか

そしてここではどのように情報処理がなされるかが細かく描写されている.なかなかテクニカルで難しい.

6.1 視野と視世界
  • デュアルアドレス理論では,物理座標を通じた視覚パターンの処理により物理世界の視知覚(視世界知覚:visual world percepts)が生まれ(つまり現実世界の物体の実際の形状が認識でき),視点座標の処理により視野知覚(visual field percepts)が生まれる.
  • この理論では知覚の処理を行うメンタルセットとイメージの処理を行うメンタルセットを持つことを可能にする.
  • これはイメージ変形がどちらの過程にも従うという証拠と整合的だ:例えばハイウェイを運転し,前方の車までの空間に車5台分をイメージして車間距離を保とうとする場合,その5台の車は少しずつ小さくイメージしているにもかかわらず,距離が5台分という判断に自信を持つことができる.
6.2 メンタル変形
  • 奥行き方向への回転のような変形を行う場合,物理座標調整システムはまず回転させようとする物体に注目する.
  • 回転オペレーターはアレイの境界面のセルを探り,物理座標に変換する.回転調整システムはその物理座標を元に回転角度に応じて新しい物理座標を計算する.それぞれの物理座標は角度に応じて近接場所に一時保管される.(これにより回転の難度が角度の大きさに依存することが説明できる)
  • 時に求めているセルが別のセルの背後に回り込んでいるため情報入手がブロックされることがある.この場合にはこの情報は物理座標形状にかかる長期記憶に回され,回転調整システムはそこにアクセスする.
  • これは2.5次元モデルのような複雑で,角度に応じた難易度が説明できないモデルより優れている.また3次元モデルと異なり,このデュアルアドレス理論では,新しい視点座標は回転とともに創成される.
6.3 メンタルイメージの創成
  • コスリンとシュワルツのモデルでは,イメージは,物体の基礎骨格の形状とその詳細や付加物かかる情報という形で階層的に組織された長期記憶から生成される.つまり基礎骨格イメージがまず物理世界調整システムから作られ,その後に詳細情報でセルを埋めていくのだ.
  • しかしデュアルアドレスモデルでは,物体のパーツを描写するときの目標点を見つけることはもっとずっと簡単になる.なぜならアレイセルは骨格に対しての相対座標を持っているし,長期記憶にあるパーツの位置も骨格に対して相対的に作られているからだ.
6.4 ボトムアップパターン認識
  • 網膜の受容体の位置は刺激についての視点座標(2つの角度座標)を定め,同じ刺激が与える(両眼の)網膜上の不一致は(眼の位置情報を一緒に)その深さを決める.だから視覚入力からアレイセルへのマッピングはかなり直接的なものになる.
  • しかし効率的なボトムアップパターン認識システムには,方角,位置,投影像の形に影響を受けないような形の入力についての描写が必要になる.そうすることによって初めて本質的な「形」についての少数の規範的な記述とのマッチングが可能になるのだ.
  • このデュアルアドレス理論では,一旦深さ情報が得られると,大きさや形が不変になる物理座標における物体のパーツの位置もわかるようになる.もしもともとの世界中心物理座標システムが物体の自然な軸に沿って回転するなら,すべての表面は物体中心物理座標に変換され,相対的に少ない計算しか必要とせずに,認識が可能になる.
6.5 トップダウンパターン認識
  • マーと西村は次のように示唆している:もしボトムアップ過程が物体のパーツの深さが絡む方向について把握するのに不十分なら,何か別の過程を使っているのかもしれない.それは(a)長期記憶にある物体の描写のうち基本軸とパーツの関係を示す情報を使う,(b)同じく長期記憶のうち,軸とパーツの関係に矛盾しない2次元描写をつかう,(c)予測投影と実際の投影のインプットが最もマッチするようなパーツの方向を選ぶ,などだ.
  • デュアルアドレス理論では,この「イメージ空間プロセッサー」はテンプレートマッチングによって可能になる.その際に必要なのは(a)骨格イメージを作るための長期記憶の形状描写,(b)パーツを深さ方向に回転させるための世界中心/物体中心の物理座標,(c)回転されたパーツが入力のシルエットにいつベストマッチするかを決めるためのパターンについての視点中心座標,になる.


ピンカーによる詳細説明はなお続いている.