Language, Cognition, and Human Nature　第1論文　「言語獲得の形式モデル」　その13

Language, Cognition, and Human Nature: Selected Articles

作者: Steven Pinker
出版社/メーカー: Oxford University Press
発売日: 2013/09/27
メディア: Kindle版
この商品を含むブログを見る

意味論構造を利用して文法を推測する方法にはもう一つ利点がある．それは得られた規則をどのように一般化するという問題への手がかりになることだ．

（2）規則の一般化に意味論を用いる

学習者が文を要素に分解し，対応する書き換え規則を仮定できたとする．すると次に異なる文から導かれた規則を組み合わせなければならない．そうでなければそれぞれの文ごとの規則ができてしまうからだ．
規則の結合は分布分析ヒューリスティックスにおいては特に難しい部分だ．何故なら自然言語の文には，短い語句の文法的な曖昧性に起因する非類似構成要素を結合させる落とし穴が数え切れないほどあるからだ．
クレインとクッピンはこの問題に対して，オーバーラップする要素をとりあえず結合させ，それにより新しい文を作り，情報提供者に許容できるかどうかを確認するという方法を採った．しかしこれは非現実的な方法だ．子供はそういう情報提供者を持たないし，仮に持っていてもうまくいかないだろう．一時的な規則は多くの文を作り出せるから，ある創出文が許容されたからといって規則が受け入れ可能かどうかはわからないからだ．
しかしながら意味論的な情報はどの規則を結合すべきかの良い手がかりになり得るだろう．
アンダーソンは以下を示唆した．

まず「意味論的な構成において同じ役割を持ち，異なる文において同じ位置を占める単語は同じクラスに統合できる」とアンダーソンは示唆している．

これはまず単語単位で行うことができる：「白いネコがネズミを食べる」と「緑のカタツムリが葉っぱを囓る」から「白い」と「緑の」，「食べる」と「囓る」などを同じクラスに扱える．

さらにより上位の構成要素間（「白いネコ」と「緑のカタツムリ」）でも同じことをしなくてはならない．アンダーソンはこれについて二つの基準を示している．「それらは同じサブ構成要素に分解できる」「それらは同じ意味論的役割を持つ」

すべての要素について統合が完成すると16通りの文を作れるようになる．アンダーソンはこのヒューリスティックスを「意味論に誘導される文法等価性（Semantics-Induced Equivalence of Syntax）」と呼んでいる．彼はこれについて「自然言語はある与えられた高次構造内の特定の意味的な関係を表現するのに同じ文法構造を用いる傾向がある」ことを利用しているのだと主張している．

この「意味論に誘導される文法等価性ヒューリスティックス」は分布分析に比べて保守性が強いわけでも弱いわけでもないことには注意が払われるべきだ．
どちらも他方が統合しようとしないところを統合しようとする．例えば「白いネコがネズミを食べる」と「緑のカタツムリが葉っぱを囓る」において分布分析は同じ単語がないので何の一般化も行わない．何らかの単語が両方で用いられるまで待つのだ．片方で「意味論に誘導される文法等価性ヒューリスティックス」は「白いネコがネズミを食べる」と「白いネコがゆっくり食べる」について「ネズミを」と「ゆっくり」を統合しない．
基本的に「意味論に誘導される文法等価性ヒューリスティックス」の方がより賢い一般化をすることができるだろう．

要するに（予想通り）分布分析が用いない意味論情報を用いた方が賢い文法推測ができるということだろう．ここからピンカーはアンダーソンが提案したモデルの詳細を吟味する．