Language, Cognition, and Human Nature 第1論文 「言語獲得の形式モデル」 その8

Language, Cognition, and Human Nature: Selected Articles

Language, Cognition, and Human Nature: Selected Articles

V ヒューリスティックスによる文法構築 その3


ヒューリスティックス言語獲得についてのコンピュータシミュレーション その2>


(2)分布分析ヒューリスティック

  • 単語クラス位置ヒューリスティックスの問題は,分析が過度に顕微鏡的なところだ.自然言語の規則性を隣接する単語クラスのみで分析するのは事実上不可能なのだ.

ここでピンカーは別のサンプルを出して単語クラス位置ヒューリスティックが何故うまくいかないかを説明している.

  • 次のサンプルを考えよう

(a) That dog bothers me.
(b) What she wears bothers me.
(c) Cheese that is smelly bothers me.
(d) Singing loudly bothers me.
(e) The religion she belongs to bothers me.

  • このサンプルでbothersに先立つ単語はそれぞれ名詞,動詞,形容詞,副詞,前置詞となっている.そして明らかに学習すべきことは「bothersに先立つのは名詞句だ」である.だが,先立つ単語のクラスを考えることはそれには結びつかない.
  • より一般的なヒューリスティックスはより柔軟な文脈を探すもので,クラスの定義もより広いものだろう.そうすればクラスは語句を含むことができる.
  • ケリーのプログラムはその第3ヴァージョンでこの方向に進んだ.これは「分布分析過程」と呼ばれ,文脈自由言語では異なる文法クラスの実体が同じ文脈で可換であるという事実を踏まえている.だから同じ語に対して先立つ(あるいは続く,あるいは埋め込まれる)語句が同じクラスを形成すると扱う.
  • すると先ほどの例ではbothersに先立つ語句を1つのクラスに扱え,さらに「That dog scares me」を与えられると「bothers me」と「scares me」を同じクラスに扱い,さらに「bothers」と「scares」を同じサブクラスとして扱うことができる.さらに「So I hate that dog」を与えられると先ほどの「bothers me」に先立つ語句のクラスの語句をすべて「So I hate」の後に置くことができることを学習する.
  • このようにして学習者は異なる抽象化のレベルのカテゴリーを組み上げることができ,文の中でそれらを組み合わせる異なる方法をカタログ化できる.


確かにこうすると名詞句のようなより自然なクラスを扱えるようになる.ではこの方法はどう評価できるだろうか.ピンカーはこの分析にもいくつか問題があるとしてこうまとめている.


【評価】

  • まずこの分析には,ミニマルに対比させた非常に多くのサンプルが必要になる.確かにアメリカの子供たちはほとんど途切れなく文を聞かされる.しかしこれがすべての規則を決定できるに十分なサンプルになっているのかどうかは明らかではない.
  • またこの方法は重大な誤謬のリスクを抱えている.何故なら多くの単語のつながりは一つ以上のクラスに属することができるし,またほとんどどんな単語のつながりも異なる規則から生みだすことが可能だからだ.

(a) Hottentots must survive.
(b) Hottentots must fish.
(c) Hottentots eat fish.
(d) Hottentots eat rabbits.

  • このサンプルを分布分析するとmustとeatを同じクラスにしてしまう.そしてHottentots must rabbitsとかHottentots eat surviveなどの文を作ってしまうことになる.
  • さらに文脈を決定するために組み合わせ数爆発の問題が生じてしまう.対象語のほかにn語の文があれば,それを決めるための文脈数は2^n-1通りになる.(残りのn語は文脈に含まれるかどうかなので,この組み合わせが2^nあり,すべて関連しないという1を引くと2^n-1になるという趣旨)さらにどのアイテムを対象にするかという問題,膨大なサンプルにおいて対象アイテムと文脈を比較する方法の多さを考えると,学習者は途方に暮れるだろう.
  • 文脈のタイプを制限することにより,第1,第3の問題と第2の問題をトレードオフにできる.
  • 極めて制限的な学習者は残りのすべての語が一致したときのみ2語を同じクラスと扱うことができる.これは組み合わせ数爆発を避けることができるが,非常にオーバーラップしたサンプルを必要とする.逆に大胆な学習者はより薄い関連性を利用することによりサンプル数を節約できるが,誤謬のリスクは高まり,テストすべき組み合わせは増える.この中間に最適なポイントがあるかどうか見極めるのは難しい.
  • いずれにせよ純粋な分布分析のよい定式化やコンピュータプログラムの実装にはまだ誰も成功していない.リサーチャーはその代わりに様々な裏技を仕込んで何とかしようとする.


後知恵から考えると当たり前だが,並び順だけで文法解析はできないということだろう.単純なコンピュータアルゴリズムで何とかできそうだとがんばるのは60〜70年代の香りということだろうか.
なおこれらの分析を見ると,前段階で子供が聞いた音の流れから単語分けをいかに行うかについてはあまり考慮が払われていないようが,このあたりも本当は問題になるのだろう.日本語のような膠着語的な言語では単語の切り分けが結構難しいと思う.