Language, Cognition, and Human Nature 第1論文 「言語獲得の形式モデル」 その5

Language, Cognition, and Human Nature: Selected Articles

Language, Cognition, and Human Nature: Selected Articles

IV 文法の帰納:その他の結果(承前)


さてベイズ推定的に子供が生得的に自分が出会うであろう自然言語についてのみ高い事前確率を与えているとしてゴールドの定理の前提を緩めれば言語獲得は可能になる.しかしなお解決しなければならない問題があるとピンカーは言う.その1つがこのやり方では学習時間が天文学的になってしまうという問題だ.


<学習時間を縮減する>

(1)効率的な並べ上げ

  • これまで考察してきた学習者のやり方は,すべての可能な文法から1つずつ不可能なものを排除していくというものだ.このやり方では,そもそもサンプルを見るまでもなく排除できる多くの文法を候補として扱わなければならない.例えばそもそも文を作成する前に停止したり無限ループに陥ってしまうような文法だ.
  • おそらく学習に必要な時間が天文学的になってしまうことになるのは,これらの多くの種類の馬鹿げた文法を並べ上げにカウントしてしまうためだろう.ワートンはもし学習者がこれらの馬鹿げた文法を事前に排除する「品質管理検査」を行えれば非常に多くの時間を節約できることを示した.(Wharton 1977)さらにある文法を排除するときに同じような文法群をセットで排除できればさらに時間を節約できることも明らかになった.これは「文法カバー:grammatical covering」と呼ばれる.
  • ホーニングとワートンはそれによる効率向上を推測するコンピュータプログラムを開発し,効率向上が多くの桁を持つ数字になることを示した(Horning 1969;Wharton 1977).もちろん脳の動きとコンピュータの動きは異なるが,楽観的な見方を支えるものではあった.
  • その1つの例では2つの補助記号と2つの終端記号からなる文法を推測するのにIBM360で数分かけている.しかしながら自然言語では10から100の補助記号があり,可能な文法の数は補助記号の数nに対して2^(n^3)で増えていくことを考えるとこれだけで問題の解決はできないのは明らかだ.


IBM360というのが論文の時代感を出していてなかなか渋い.プログラムとして成り立たないような文法が成り立つ文法より何桁も多いというのは当時としては新鮮な驚きがあったのだろうか.


(2)事前確率による順序づけ

  • 事前確率を用いることによっても平均探索時間を減少させることができる.事前確率が高い順番に探索するのだ.これによって多くの事前確率の低い文法は全く考慮する必要がなくなる.同じように「自然文法」から探索を始めれば「不自然文法」を考慮する必要はなくなる.
  • しかしそれでも全く十分ではない.ホーニングの方法では単純な文法群だけでも膨大な計算時間が必要になる.そして新生児から見て同じように可能な自然言語のセットはおそらく膨大だ.だから自然言語を先に探索してもやはり膨大な時間がかかるはずなのだ.
  • 一般的に合理的な時間制限の中での並べ上げ法による学習は無理なのだ.


ということで単純な手法ではうまくいかないことが明らかになった.ピンカーは並べ上げ法に代わる手法を次節で取り上げる.