Language, Cognition, and Human Nature 第1論文 「言語獲得の形式モデル」 その2

Language, Cognition, and Human Nature: Selected Articles

Language, Cognition, and Human Nature: Selected Articles

II 言語の形式モデル

まず基礎的な概念が数理言語学的に定義される.このあたりは生成文法でよく出てくるであろう専門用語が並んでいて圧倒される.正確な紹介は私の能力を超えるが,大まかなイメージとしては以下のようなことが述べられている


<言語と文法>

まず単語,文,言語が定義される.

自然言語もコンピュータ言語も限られたメモリを使って無限の表現できるという観察から,そこには何らかの有限の特徴付け(characterization)があるはずであり,そして文法はそういう特徴付けの1つであると考えられるとする.そしてある一組の規則で記述できる言語を帰納的可算言語(recursively enumerable language)と呼ぶ.

文法は4つの部分からなる

  • terminal vocabulary:終端語彙(終端記号集合)通常の意味の語彙
  • auxiliary vocabulary:補助語彙(補助記号集合)単語の集合体についての代替表示を行うもの;「名詞」とか「前置語句」など
  • rewrite rules:書き換え規則
  • start symbol:開始記号


<言語のクラス>

文法や言語をいくつかのクラスに分けることができる.

  • 異なる組み合わせ規則を用いるもの
  • 異なる計算を行うもの
  • その言語や文法について成り立つ原理が異なるもの

これらのクラスは階層を持つ.そしてこれはしばしばチョムスキー階層と呼ばれる

  • 最も上位の(大きな)クラスは先ほど説明した帰納的可算言語だ.
  • しかしこれに含まれるすべての言語が決定プロシージャー(ある単語の連なりが文と認められるかどうかを決める手続き)を持つわけではない.この手続きを持つ言語を決定可能言語(あるいは帰納言語)(decidable or recursive languages)と呼ぶ.
  • 残念なことにある帰納的可算言語が決定可能言語かそうでないかを決める一般的な方法はない*1.しかし決定言語の中に非常に大きなサブセットがある.それは原始帰納言語(primitive recursive languages)と呼ばれ,その決定性が知られているものだ.
  • 原始帰納言語は大きく2つに分けられる.1つは文脈依存文法(context-sensitive grammars)を用いるものでもうひとつは文脈自由文法(context-free grammars)を用いるものだ.文脈依存文法はある補助記号を別の記号集合で書き換える際に,その補助記号が何らかの特定の隣接する記号をともなっていることを要求するもので,文脈自由文法とはそのような条件なしに書き換えを許すものだ.
  • 有限状態文法(finite state grammars)は単一の補助記号を別の単一の補助記号+単一の終端記号へ書き換えることのみを許す.これらの補助記号はしばしば状態と呼ばれる.
  • さらに補助記号を用いない文法がある.これらの文法では有限の文しか生成できない.これらは有限基数文法(finite cardinality grammars)と呼ばれる.


自然言語

言語獲得に関するほとんどすべての原理,そしてコンピュータシミュレーションによるリサーチはチョムスキー階層を参照している.しかしそもそも自然言語チョムスキー階層のどこにあるかを知らなければそれは心理学的にはあまり興味深いものにはならないだろう.

  • 明らかに自然言語は有限基数文法に基づいていない.私たちは無限の文章を生成できるからだ.それはある文章に常に「彼は・・・と主張した」という語句を付加して新しい文章にできることで示せる.
  • また自然文法が有限状態文法に基づいていないことを示すのも容易だ.有限状態文法は任意の数の埋め込みを持つ文章を生成できないが,自然言語は容易にそれができる(彼は働く→彼は働くか遊ぶ→彼が働くか遊ぶかするなら彼は疲れるだろう→・・・・)
  • 自然言語が文脈自由文法に基づいていないことを示すのは難しいが不可能ではない.(いくつか論文が引用されている)
  • しかし自然言語チョムスキー階層のどこにあるかはなお明らかではない.チョムスキーやほかの言語学者自然言語を記述するのに様々な変形文法(transformational grammars)を使っている.これらの文法は深層構造と呼ばれる支持された語句を創り出す.この創出は,深層構造の要素を,通常文脈自由文法,時に変形(transformations)と呼ばれる書き換え規則により書き換え,削除,コピーして新しい文を作り出すことによってなされる.
  • この変形文法は様々な基準により構成されているのでチョムスキー階層上の位置は明らかではない.ただピーターズとリッチーは自然言語を生成する変形文法の1つは文脈依存文法であると主張している.またチョムスキー自身もそう推測している.
  • これに従い以降自然言語は文脈依存文法階層に位置しているとして議論を進める.


このあたりはこれから始まる本筋の議論のための前払いの処理ということだろうが,私には全く背景知識がないので難しい.変形文法(transformational grammars)は生成文法(generative grammars)と同じものなのかどうかもよくわからないところがある.とりあえず原語が違うのでここでは「変形」の語を当てている.


1/17追記 tokbさんのご教示を受けてtransformationsの訳語を「転成」から「変形」に訂正しました.



 

*1:これはチューリングマシンが有限時間で停止するかどうかを決定できるかという問題と等価であるという議論がなされているようだ