
Language, Cognition, and Human Nature: Selected Articles
- 作者: Steven Pinker
- 出版社/メーカー: Oxford University Press
- 発売日: 2013/09/27
- メディア: Kindle版
- この商品を含むブログを見る
VII アンダーソンの言語獲得システム:LAS その4
<LASの評価> その3
(5)文法的形態素を学習する
- 文法的形態素(冠詞,接続詞,関係代名詞,語形変化等)は,意味論構造に相対物がないのでLASに特別の問題を引き起こす.
- アンダーソンは意味論的カウンターパートがなくともこれらの語順規則を学習することは問題ないと主張した.文法的形態素は有限の長さのサブシークエンスにしか現れないので,これらは有限基数言語でしかなく,ゴールドの法則に従えばインフォーマントも意味論もなしで学習可能だからというのだ.
- しかしこの議論はミスリーディングだ.なぜなら特定の文法的形態素が許容されるかどうかはその文脈に依存し,その文脈は無限だからだ.要するに学習者は有限基数文法に相対しているわけではないのだ.
ピンカーはここで具体例を挙げて丁寧に論じている.「to which」が以下の各文で許容される理由は「give」が「to」という前置詞をとる構文を持つためだが,例文は「give」がどこまでも離れた位置に置くことが可能であることを示している.
- (a) The museum to which he gave a million dollars is in Chicago.
- (b) The museum to which it is obvious he gave a million dollars is in Chicago.
- (c) The museum to which I think it is obvious he gave a million dollars is in Chicago.
- (d) The museum to which I think without any justification whatsoever it is obvious he gave a million dollars is in Chicago.
日本語の「を」などの格助詞もこの文法的形態素であり,同様に対応する動詞とどこまでも離れた位置に置くことができるだろう.
- だからこのような形態素の問題は決して些末な問題ではない.アンダーソンが(シミュレーションにおいて)この問題解決のために提示した具体的なヒューリスティックスを吟味してみよう.
- まず最初に注意しなければならないのは,LASが直面した文法的形態素は冠詞の「the」「a」,連結詞(copula)の「is」,関係代名詞の「which」だけだったということだ.「above」などの前置詞は意味のある語でありノードを形成する語として扱われた.さらに問題を簡素化するために「to the left of」などの語は「left-of」という単語に縮退された.
- これによりLASは文法的形態素を扱う単純なヒューリスティックスを用いた.それは「もし1つあるいは複数の文法的形態素があればそれをすぐ右の意味を持つ単語と合成させて新しい構成素を作れ」というものだ.
- このヒューリスティックスはLASが惨めな失敗をすることを防いでくれるが,同時に重要な一般化をすることを不可能にしてしまう.
- 例えばLASは主節にある述部(賓辞)と関係詞節にある述部(賓辞)を一般化できない.後者にはwhichが融合されているからだ.LASが名詞修飾の形容詞(「赤い」正方形)と賓辞として用いられる形容詞(その正方形は「赤い」)を一般化できないのも同じ理由だろう.
- そして様々なサブセットを持つ自然言語に対してこのヒューリスティックスはうまくいかない.アンダーソンも注記しているように,「The woman that he ran after is nimble.」のような文例に対してLASは「after is nimble」のような無意味な構成を作り出してしまう.
(7)文法的形態素を扱うための「修正プロシージャー」
- アンダーソンはこれらの問題への治癒策をいくつか示している.
- 例えば最初の問題(主節と関係詞節の問題)は「同じサブ構成要素がある弧のマージを許容する」として解決できるとする.
- しかしこの方法では一般的な状況での解決にはならない.例えば関係詞節内で目的語が除かれるような場合,この方法では主節と関係詞節の構成要素同士の類似性を判断できないからだ.
- (a)の関係詞節内にはモンスターがむさぼったものがないのでLASは一般化できないが,これは一般化が望まれるところだ.
- さらにアンダーソンは「(名詞修飾する形容詞と賓辞の形容詞のような)冗長なクラスについては,もし同じメンバーが共通にあればマージする」とも提案している.
- しかしこれは問題を引き起こすだけだ.自然言語においては同じ単語が名詞であり動詞であることがしばしばある.しかしこれらを一般化することは大惨事を引き起こすだろう.多くの形容詞や動詞は名詞になれないのだから.
- 最後にアンダーソンは「『The woman that he ran after is nimble.』におけるような不正確な構文解析は,発話者が前置詞のあとに置くポーズによって構成要素間の境界を学習することにより避けることができる」と示唆している.
- しかし,自然言語はしばしばそのような境界以外のところにポーズを持つ.だからそのようなヒューリスティックスはうまくいかないだろう.
<結論>
- LASを注意深く精査すると,アンダーソンの「自然言語の学習にはこのようなメカニズムで十分である」という主張は成り立たない.意味論的ヒューリスティックスで英語をうまく学習できない多くの例が見つかるのだ.
- これはLASをうまく拡張する論理的な方法があるなら決定的な問題にはならない.ただしアンダーソンがこれまで提案しているような方法では多くのサブセットを持つ自然言語の学習はうまくいかないだろう.
- これまでの分析はアンダーソンの仕事の重要性を否定するものではない.伝統的な心理言語学において用いられてきた「言語学習における『認知』理論」はあまりに曖昧に扱われてきたので評価すらできないものだった.アンダーソンはこの理論をコンピュータプログラム化することで,理論がどのような前提によっているか,言語学習のどの様相が理論にとって重要か,あるいは理論にとっての難点なのかを明らかにしたのだ.
ここまでのピンカーの議論をまとめておこう.
文法を語の並び順だけで決定し言語学習するのはゴールドの定理から不可能であることが明らかだ.そして意味論を用いても単に語と意味の対応を利用するだけではやはりゴールドの定理の呪縛からは逃れられない.そして意味論の構造と文法構造の相似を利用する方法は有望に思われたが,いくつか限界があることが示された.
そしていよいよチョムスキーの変形文法の出番になる.