
Language, Cognition, and Human Nature: Selected Articles
- 作者: Steven Pinker
- 出版社/メーカー: Oxford University Press
- 発売日: 2013/09/27
- メディア: Kindle版
- この商品を含むブログを見る
III 文法の帰納:ゴールドの定理
<文法の帰納としての言語獲得>
ピンカーは以下のように始める.
- 人々は自分がしゃべる文章の一覧をリストとして持っていてその中から次に何をしゃべるかを選んでいるわけではない.ということはその言語の文章を創出し理解するための規則セットを持っているはずだ.つまり言語獲得はそのような規則のセットを,コミュニティの人々の言語的な行動から帰納することを含んでいる.以降この規則セットを文法として取り扱う.
- これは人々がしゃべるときに心のなかで書き換えルールを一つ一つ適用しているということを意味しているわけではない.文法の帰納とは「文法的な文章を作り出し理解する能力を持つようになる」ことのショートハンドとして扱える.
- この帰納問題の最も直接的な解決はこのような帰納推論を可能にするアルゴリズムを提示して,子供の言語獲得に当てはめることだ.そしてそれがサンプルの違いによって様々な言語を獲得できることを示せれば,一般的な解決になる.
- しかし残念ながらそのようなアルゴリズムは存在しない.数理言語学者による基本定理によると有限のサンプルから得られる文法は無限にあることになるからだ.そしてそれぞれの文法はサンプルにない文について別の解釈をしうる.
ピンカーはこれをわかりやすくこう説明している.
「The dog barks.」というサンプルがあったとしよう,これは以下のカテゴリーの文からなる言語の例文になり得る;「すべての3語文」「すべての冠詞名詞動詞文」「すべての名詞句を含む文」「その文と1976年7月4日のニューヨークタイムズの記事にある文」「すべての英語の文」.サンプルが増えれば,対象言語のカテゴリーは小さくなるが,サンプルが有限である限り,対象言語は無限だ.
だから言語学習者にとって有限のサンプルから正しい文法を常に導くことは不可能なのだ.
<有限内での言語同定>
ここでゴールドの定理の破壊力が示される.ゴールドはこの問題を「有限の中での言語同定」と呼ぶパラダイムで解決した.このパラダイムは以下のように働く.
- 時間はそれぞれ始期を持つ個別の試行で区切られる.
- 教師あるいは環境は階層の中の事前に定められたあるクラスから1つの特定言語(目的言語)を選ぶ.
- それぞれの試行で学習者は単一のストリング(文)にアクセスする.
- あるパラダイムでは学習者はその言語で可能なすべての文にアクセスできる.これは「テキスト」あるいは「正の情報提示」と呼ばれる.
- 別のやり方では,学習者は文法的な文,非文法的な文にそれぞれ(文法的,非文法的と)ラベル付けされた形でアクセスできる.これは「インフォーマント」あるいは「完全情報提示」と呼ばれる.
- 試行ごとに学習者は文を得て,目的の文法はどんなものかを推測する.
- 試行は無限に続けることが出来,学習者はいつでも推測を変更できる.
- もし有限試行内で常に同じ文法を推測でき,その文法が目的言語の正しい文を生成できるなら,学習者は「有限内で言語を同定した」と言える.
- このやり方では学習者は自分が成功したことを知ることはできないことには注意が必要だ.さらに試行を続けて推測を変えてしまうことになるかもしれないからだ.
ゴールドはここでこう問いかけた.「一般的な学習者はどの程度うまくやれるだろうか.有限内ですべて同定できる階層内のクラスがあるだろうか.」そして以下のことを証明した.
- それは得られる情報のタイプによって異なる
- インフォーマント条件では原始帰納言語は学習可能だ.しかしテキスト条件では有限基数言語のみが学習可能になる.
ピンカーはこの定理の証明は直裁だと評価している.
- 学習者は一般的な戦略を採るとする.当該クラスをすべての文法を並べ上げ,一つ一つの文が許容されるかどうかを調べ,許されないものを排除していくという戦略だ.
- インフォーマント条件では不正な文法は,提示された文を作れないか,その文法で作った文が非文とされることでいずれ排除される.正しい文法は候補文法の中の有限の一部分なので,有限の試行で推測を変更する理由がなくなると仮定できる.そして原始帰納文法は決定性のある文法でありかつ並び上げることができる文法の中の最上位クラスだ.
- テキスト条件では事情が異なる.そこでは有限基数文法のみがようやく学習可能だ.学習者はある言語がこれまでのサンプルに表れた文章を全部持つことしかわからない.そして候補文法のすべての文がサンプルに現れてようやく推測が正しくなりうる.もし対象文法に無限の文を含むものが1つでもあれば,有限基数文法を推測していた学習者は推測の変更の可能性が常にある状態から逃れられないし,無限の文を持つ文法を推測していて,正しい文法が有限基数文法だった場合には,学習者は永遠に推測の誤りを修正できない.
- ゴールドはこういっている「テキスト条件の問題は,もし広過ぎる文法を推測していた場合にはサンプルは決して誤りを教えてくれないことにある」
<ゴールドの定理のインプリケーション>
子供はテキスト条件で学んでいるのだろうか,それともインフォーマント条件なのだろうか.
- 証拠が強力に示唆しているのは,「子供は通常非文法的にしゃべっても直接訂正されないし,訂正されてもほとんど気にしていない」「子供は何が非文法的かについての間接的なエビデンスを受け取っていない」ということだ.そして両親は子供が文法的にしゃべったときと非文法的にしゃべったときにほとんど同じ態度をとる.
- 要するに子供の言語学習はテキスト条件的だ.だからゴールド的な並べ上げ戦略をとる学習者は言語獲得に失敗するはずなのだ.
- さらに悪いことには,このような方法で言語を学習するには(それが仮に可能でも)天文学的な時間が必要になるはずだということがある.正確な文法を決定する前に天文学的な数の試行が必要になるはずだ.わずか7つの終端記号と7つの補助記号のみを使うすべての有限状態文法ですら,学習者は正しい文法を推測するために1グーゴル(10^100)以上の試行を行う必要がある.
- そしてゴールドは並べ上げ戦略より強い一般的学習過程はないことを証明している.それはある有限のサンプルと矛盾しない文法が無限にあることから簡単に得られる.仮に別の方法である文法をより早く正しく推測できたとしよう.この場合並べ上げ法では別の候補文法を推測している.そしてどちらの文法もサンプルとは矛盾していないのだから,実は並べ上げ法の推測した文法が正しい場合もあるはずだ.つまり必ず並べ上げ法より早くかつ正しく推測できる方法は存在しない.そして同様の推測からどのような並べ上げ法をとってもそれらは同等の強さであることが導かれる.
ピンカーはインプリケーションについてこうコメントしている.
- ゴールドのモデルは言語獲得のモデル構築の試みと捉えることもできる.
- そしてゴールドは,仮にモデルが発達や認知や時間的な条件を満たしていても,それだけでは言語獲得が可能にならないことを示したのだ.そしてゴールドのモデルより上手くできる方法がないことまで証明した.
- しかし子供は実際に言語を獲得している.だからゴールドのパラダイムのどこかの前提が現実と異なっているに違いない.続く第4部ではこのゴールドの定理により触発されたリサーチをレビューしていく.
ここまでのピンカーの整理は背景説明ということだろう.ゴールドの定理は1967年の仕事だが,それが当時の一般学習のみで認知を説明しようとしていた言語獲得リサーチ業界にとっては超弩級の「都合の悪い定理」だったわけだ.これを何とかしようとするじたばたとチョムスキーの放り込んだ爆弾がこれから解説されるということなのだろう.