...

4。言語の多様性

by user

on
Category: Documents
21

views

Report

Comments

Transcript

4。言語の多様性
シュレディンガーの夢4
04.5.12 9:13 PM
4。言語の多様性
我々の人間世界には,さまざまな言語がある。日本語,中国語,ロシア語,英語,スワヒリ語,アラ
ビア語等いろいろある。しかし,その基本は,言語を構成するアルファベットと文法である。さまざま
なアルファベットの組み合わせは,それぞれの単語を与え,文法は単語と単語の組み合わせを与える。
これは人間の話す自然言語だけでなく,数学やコンピュータサイエンスで扱う人工言語でも同様であ
る。
<アルファベット>
アルファベット(A)は,数えられる個数の文字(letter)の組のことである。それは,例えば{a, b, c}や
{0, 1}のような,何かの絵図で表わせるシンボルの組なら何でもよい。そして文字の合成
(concatenation)は,文字列(string)つまり単語(word)を作る。ここで,文字の合成とは,二つの語
PとQをくっつけてPQを作ることである。つまり,
(P, Q)→ PQ
のことである[ 1 ]。
<言語>
仮に一つのアルファベットAを定め,その中であらゆる文字の合成を考え,その結果できた文字列の
集合(A*)を考えよう。ここでは,何度同じ文字を繰り返し使っても,どんな長さの語を作ってもよい
とする。数学ではこの集合A*のことをアルファベットAの拡張あるいは拡大(extension)という。当
然,この集合A*の中には,サルが勝手にタイプしたような,我々にとってあまり意味のない文字列も
含まれているため,我々が意味を読み取れる単語や文章はその一部にすぎない。このことから,我々の
言語(L)はこの集合の部分集合である
(L⊂A*)。
<文法>
そして,集合A*の要素からその中の別の要素への対応関係を与える規則の集まりを文法規則と考え
ることができる。例えば,主語を表わす単語sと動詞を表わす単語vがあるとき,その2つを合成して
一つの文字列svを作ること[つまり,対応
(s, v) -> sv
]が文法規則の一つを与える。これらの文法規則の集合をPと呼ぼう。そして文が作られるときの初期条
件の集合をSと呼ぼう。さらに,アルファベットには文字を記述するもの(terminal)ばかりでなく,ピ
リオド(。)やコンマ(,)やカッコ([, ])などの文字的でない(non-terminal)アルファベットもあるので,
それらをVと呼ぼう。そのとき,文字アルファベットAと文字的でないアルファベットVと文法規則Pと
初期規則Sの集合
(A, V, P, S)
が文法Gである。
このように,言語の多様性は文法のとり方から現われ,その数だけさまざまな言語が存在することに
なる。
<チョムスキーの変形生成文法>
1950年代,チョムスキー(N. Chomsky)は言語の基本は何かと考え,その基本として文法に着目
した。そして,文を生成する文法を,正則(regular)文法,文脈自由(context-free)文法,無制限
(unrestricted)文法,そして文脈依存(context-sensitive)文法の4つに分類した [ 2 ]。簡単に言う
と,前2つは,文字的と文字的でない両方のアルファベットを使って,何ら制限なく文字合成できるよ
うな文法である。一方,後者2つはさらに,得られた文章を評価するための条件が課されている文法で
http://www.stannet.ne.jp/kazumoto/Schroe4.html
ページ 1 / 2
シュレディンガーの夢4
04.5.12 9:13 PM
ある。自然言語からコンピュータ言語まであらゆる言語の構造は,これら4つに分類され,それらの文
法によって生成されると考えられている。
このように,言語の多様性は,基本的にアルファベットと文法の多様性から現われるのである。この
ことは,数が有理数と無理数にまず分類され,そしてさらに有理数が質の良い整数と分数の2つに分け
られ,無理数が代数的数と超越数の2つに分類されることにたいへん良く似ている。
<数も言語の1つ>
さて,アルファベットを素数の集合
{1, 2, 3, 5, 7, . . . }
とする。そして,単語の文字合成を積で与えられるとする。例えば,
(1, 2)→ 12
を,1と2の積
(12 ≡ 1×2)
と定義する。これらの約束により,あらゆる数は素因数分解で表現できる。
2^3×5^2×7^4
のように表現された1つの語が,1つの数となる。それゆえ,数も1つの言語の構造を持っていると言
える。ただ,数が単なるシンボルとしてではなく,数としての性質を持つのは,数は言語であることの
ほかに,四則演算という論理構造を持っていることである[ 3 ]。
しかし,逆に言語にもそういう1つの論理構造を与えると,数の四則演算のようなことを行うことが
できる。これが,論理の公理系である[4-6]。
このように,数を1つの言語のモデルとして見ることは,他のシステムの構造を考える上で実に役に
立つ。逆に,言語を数のモデルとして見ることも,同様に有効な見方なのである。
参考文献
[ 1 ] T. A. Sudkamp, Languages and Machines, (Addison Wesley, New York, 1988)。
[ 2 ] N. チョムスキー, 言語論, (大修館書店, 1979);ことばと認識, (大修館書店, 1984)。
[ 3 ] 高木貞治, 初等整数論講義, (共立出版社,1931)。
[ 4 ] E. ナーゲル, J. R. ニューマン,数学から超数学へ, (白揚社, 1968)。広瀬健,横田一正, ゲーデルの世
界, (海鳴社, 1985)。
[ 5 ] D. R. ホフスタッター, ゲーデル, エッシャー, バッハ, (白揚社, 1985)。
[ 6 ] R. Penrose, The Emperor's New Mind, (Oxford, New York, 1989).
前セクション 次セクション 目次
ホームページ
和基 和子 維作 条蒔 家族 Donation
「井口和基博士と家族のホームページ」
〒774-0003 徳島県阿南市畭町新はり70-3
井口和基 (C)2004
http://www.stannet.ne.jp/kazumoto/Schroe4.html
ページ 2 / 2
Fly UP