Language, Cognition, and Human Nature 第1論文 「言語獲得の形式モデル」 その9

Language, Cognition, and Human Nature: Selected Articles

Language, Cognition, and Human Nature: Selected Articles

V ヒューリスティックスによる文法構築 その4


ヒューリスティックス言語獲得についてのコンピュータシミュレーション その3>


(3)自動言語学者

  • クレインとクッピンは「自動言語学フィールドワーカー」なるものを作成した.(Klein and Kuppin 1970)これは自然人と相互作用しながら文法を学習するフィールドワーカーをシミュレートしようとするものだ.この「オートリング」は子供の言語獲得を真似しようとしたものではないが,ある意味で最も野心的なヒューリスティック言語学習の実装とも言える.そして後に子供の言語学習モデルのプロトタイプにもなった.


【分布分析の使用】

  • このプログラムの中心は分布分析学習だ.文を聞くとそれまでに発達させた文法で解析しようとする.最初はそれぞれの規則は単一の文しか作れない.しかしサンプルがオーバーラップするとそれは分布分析を始め,語や語句をクラスにまとめようとし,さらにクラスや語の連なりを作る規則を定義しようとする.オートリングは同じ文脈を判断するために特に2つの手がかりに依存する:同じ語の連なりが異なるアイテムの左に来ること,そしてマッチする語とマッチしない語を代替していくことだ.


【規則の一般化】

  • オートリングは規則の一般化ヒューリスティックスも持っている.例えば,もしある規則が,2番目の規則によって生成できる文の一部を含む文を生成したなら(X→ABCD,Y→BC),最初の規則は2番目の規則を引用して表すことができる(X→AYD).またもしある規則が同じ語句を複数含むストリングを作り出せるなら(X→ABCABC),それを回帰的なペアとして表現できる(X→ABC;X→XABC).このような一般化は文法によって許容できる文の幅を広げる.


この規則の一般化のところは難解だ.特に例示された2番目のルールは多義的になっているようでよくわからない.またいずれにしても単に表記法の問題でそれがどう一般化になって許容文を広げるのかもよくわからないところだ.


【一般化を手なずける】

  • このような形で規則を形成していくと,オートリングは行き当たりばったりに一般化を行ってしまい,チェックがないと広範囲な馬鹿げた文を作るようになってしまう.オートリングはこれを避けるために3つの手法を用いている.
  1. 規則を作るたびにそれを用いた例文を作成し,情報提供者にそれが文法的に許容できるかどうかを尋ねる.否定されればその規則を捨ててヒューリスティックスを少し変えてやり直す.
  2. 第1の方法が繰り返し失敗すると,情報提供者に非文法的とされた例文の正しいバージョンを示すように求め,両方を比べて何が異なっているのかを分析する.そして非文法的な文を正しい文に変えることができるような規則を作り出す.そしてその規則について第1の方法を用いる.
  3. そしてどれも成功しないときにはその規則を完全に捨てて最初からやり直す.


【評価】

  • オートリングは子供の振る舞いのモデルとして作られたわけではない.そして実際にそれに近いわけではない.子供と異なってオートリングは複数の文を何度も分析し,情報提供者からのフィードバックに強く依存し,新しい規則を定められた手続きに従って吟味し,うまくいかないと全部捨てて最初からやり直す.
  • しかしそれはヒューリスティックスで言語学習モデルを作ろうとするときに陥りがちな罠についてわかりやすく示してくれる.オートリングはルーブ・ゴールドバーグ装置*1的なのだ.数多くのヒューリスティックスを用い,冗長的な規則群に都度都度のチェックと再チェックを繰り返し,数多くのクリーンアップルーティンを持ち,多くの不成功を数え上げるなどなど.そしてそのような数々の装置を使ってもなおオートリングの言語学習者としての成功には大きな疑問符がつく.
  • クレインとクッピンはプログラムが算数の表現を表す人工言語の文法をうまく推測した記録を示している.しかし自然言語については,再試行の末に非最節約的な文法を推測するが,それは英語の限られた断片と多様なでたらめ(例えば"need she", "the want take he"など)の混合物に過ぎない.
  • 要するにクレインとクッピンはオートリングが学習できるかどうかさえ示せていないのだ.私はこのようなアドホックヒューリスティックスをかき集めて文法学習する試みは,言語学習理論の構築に向けた方策としてあまり期待できないと考えている.それは発達条件,認知条件,入力条件を満たさないだけでなく,そもそものシミュレーションの目的である学習可能条件すら満たしていないのだ.


ここまで3つの単語の並びから言語を学習するヒューリスティックスを吟味してきた.ピンカーはここでまとめは置いていないが,単語を並べてその順序からのみ文法を分析するのは望みのない方策だということだろう.しかし単語には意味がある.これを利用できないかが次の焦点になる.

*1:手の込んだカラクリを連鎖させて何かをさせようとする装置のこと,日本では「ピタゴラスイッチ」に登場したピタゴラ装置が近いイメージ