Language, Cognition, and Human Nature 第3論文 「ヒトの言語における規則と接続」 その3

Language, Cognition, and Human Nature: Selected Articles

Language, Cognition, and Human Nature: Selected Articles


ルメルハートとマククレランドによる過去形獲得モデルはシンボル操作規則の一般化を行わずに連合学習だけで規則に似た振る舞いが可能だと主張し,ある程度のデモに成功したため,一部の熱狂的な支持を集めている.しかしピンカーはこれに疑問を呈する.そして実証的な問題を挙げていく.

ルメルハートとマククレランドモデルが言語構築に失敗しているということについての証拠


なぜルメルハートとマククレランドのモデル(RMモデル)は注目を集めるのか.ピンカーはそれはこのモデルが言語学の伝統的な概念に対応するものを持っていないにもかかわらずうまく動いたからだろうと指摘する.しかしそれではうまくいくはずがないというのがここでピンカーが主張することだ.

  • このモデルは正式な言語学の概念(分節; segment,記号列; string,語幹; stem,接辞; affix,単語; word,語根; root,規則形; regular rule,不規則形; irregular exception)に対応するものを持っていない.
  • しかし標準的な心理言語学の理論では,これらの概念は単に便利だから使われているのではなく,言語の構造に関する事実を説明するために構築されたものだ.RMモデルはこれらの構築物をそれに代わるものもなしにそぎ落としているために,以下に挙げるような事実と整合性を持たなくなるはずだ.
記号列と分節
  • 標準理論によると,単語の音韻的な表象は,分節(音素)の記号列を含み,それぞれの分節は,その分節の発声の様相(有声/無声,鼻音/口音,前舌/後舌など)に対応する特徴に分解することができることになる.
  • これに対してルメルハートとマククレランドは完全な「分散表象」を使っている.つまり単語はユニットのベクトルで表される単一の発音パターンを持つと扱っている.
  • これにより彼等のモデルには表象順序の問題が生じる.もしユニットがそれぞれの音の特徴に対応するなら,このモデルはaptとpatとtapを区別できないはずだ.この問題に対処するため彼等は3文字単位で冗長処理して前後の文脈を扱えるようにした.これにより例えばstayに対して「無声・無声・有声」「摩擦・閉鎖・低舌」という2つの特徴が活性化され,460ユニットからなるベクトルで入出力が表示されることになる.これにより英語の動詞のそれぞれのパターンを表示できる.
  • しかし人々がこのような文脈感受性を持つユニットを使っていないという十分な証拠がある.
  • 3文字単位のユニットはすべての言語学的な分節をエンコードできない.英語では可能でもほかの言語では無理なのだ.(いくつかの例があげられている.algalとalgalgalを峻別する言語例など)
  • この理論では人々が示す心理学的な傾向を説明できない.例えば,slitとsiltは英語話者には似たように聞こえ,実際にこのような語の置換(brid→bird, thrid→third)が歴史上生じている.
  • モデルからは言語に対する誤った予測が生まれる.例えばこの理論によるとabcという動詞に対してcbaという過去形を対応させることは容易なはずだ.(またその音素をアルファベット順の次の音素に変換する,あるいは特定の音素に別の特定の音素を対応させるなど)しかしそのような過去形変化を持つ言語はない.
  • 基本的な問題は,彼等のモデルでは同じユニットに「記号列を音素に分解すること」と「音素の順序」の両方の機能を持たせようとしているところなのだ.この2つの要求はコンフリクト関係にあるのだ.これは認知構造についてのよく知られた拘束の1つだ.
  • 実際の音素構造はよく研究され,音素特徴,分節(segment),音節(syllable),強勢(stress)とつながる構造は良く理解されている.これらを3文字ユニットのために捨て去ることは実証的な問題を引き起こすのだ.
語形論と音韻論
  • RMモデルは語幹の音韻特徴から過去形の音韻特徴まで1段階のマッピングで計算する.これによりこのモデルは規則と抽象的な表象にかかる多くの言語理論をすべて捨て去ることを可能にしている.
  • しかしこのマッピングは複数のレイヤーで構成されているという圧倒的な証拠がある.
  • walked, jogged, pattedの過去形の接尾辞の(発音)パターンを考えてみよう.これらは語幹の最後の音素に依存して変わる.これらは過去形だけではなく,過去分詞形,形容詞形(sabre-toothed, long-nosed)にも現れる,また別の接尾辞を持つ複数形(hawks, dogs, hoses)や所有格形(Pat’s, Fred’s, Goerge’s)にも同じ現象が現れる.さらに単語の中の連続する子音の発音パターンにも同じ現象がある.英語には無声子音が連続するケース(ax, act)と有声子音が連続するケース(adze)があるが,無声子音の後に有声子音が続くことあるいはその逆(例えば*acd, *agt)はない.
  • 誰にでもわかる説明は,この英語の過去形の発音パターン(t-d-ed)は過去形だけの問題ではないということだ.それは英語を英語らしくしているもっと広い発音規則の一環なのだ.(この音韻ルールはこういうものだ「単語の最後に子音が連続する場合にはそれは全部有声で発音されるか全部無声で発音されなければならない.そして連続する2つの子音が同じか似ている場合にはその間に母音を挿入する」)
  • モデルは単一のコンポーネントで処理するためにこの区別を無視しており,そのためにこの過去形のパターンが英語の一般規則から生じていることを把握できないのだ.
語幹と接辞
  • 言語過程は,語幹をわずかな修正だけでコピーしようとする傾向を持つ.walk/walkedが通常パターンで,go/wentは希なのだ.言語によっては語幹を2回コピーすること(reduplication:重複)がある.そのような言語では,例えばgoの過去形はgogoになる.
  • またある1つの接辞がいろいろな現れ方をする時にその同一性を保とうとする傾向もある.英語の過去形ではdとedが使われる.dに対してobとかizとかguが使われたりはしない.
  • ネットワークモデルの重要な特性の1つは,そのような純粋のコピー操作がモデルにはないということだ.あるセットと別のセットの間に調整可能な連結があるだけだ.そしてペアリングの一貫性だけがモデルの挙動に影響する.そのユニットが何を表しているかは影響しないのだ.(理論家にはあるユニットへのラベル付けが見えるが,モデル自身には見えない)だから言語マッピングにおいてコピー操作がよく見られることは(モデルでは)説明できない.ネットワークモデルは簡単に同一性のない別の記号列に入れ替えてしまうはずなのだ.


ピンカーの「連合学習モデルがうまくいかない理由」の指摘はなお続いている.