...

全文ファイルダウンロード - Japanese.gr.jp

by user

on
Category: Documents
2

views

Report

Comments

Transcript

全文ファイルダウンロード - Japanese.gr.jp
千葉大学『人文研究』第29号 (2000年 3月
〔
論
)抜 刷
文〕
nグ ラム統計処理を用いた文字列分析 に
よる日本古典文学 の研究
―『古今 和歌集 』 の 「こ とば」 の型 と性差 ―
近
藤
みゆき
nグ ラム統計処 理 を用 い た文字列分析
による 日本古典文学 の研究
―『古今和歌集』 の 「こ とば」 の型 と性差 ―
近
1
藤
みゆき
はじめに一検索利用 から計量分析 ヘー
日本古典文学 のデー タベース環境 は、ここ数年、急展開を遂 げている。1990
年 に完成 した長瀬真理 の 「日本語 ―英語対照 「源氏物語」 のテキス ト・ デー
タベース」 {1)を 先駆的業績 として、その後、 CD―
ROMや オンライ ン121に
おいて、各種 の古典籍 デー タベースが公 開 されて きた。特 に1999年 には、 4
月 に国文学研究資料館 による日本古典文学本文デー タベース (実 験版 )試験
公開の開始、 7月 に国文学研究資料館 デー タベース古典 コレクシ ョン『二十
『源氏物語 (絵 入)〔 承応版本〕CD― R
一代集 〔
正保版本〕CD― ROM』 、
0の
OM』
刊行、下半期 には『角川古典大観 源氏物語』 CD― ROMが 刊
0と
行
、大型 の企画が相次 いで完成・公開を見てお り、国内の研究者に とっ
ては古典文学研究のためのデー タベース環境 の基礎 は、和歌および仮名散文
の分野 では、ほぼ固 まつた といつてよい。 こうした環境 の充実 は、近年の研
究 に着実 に反映 してお り、特 に和歌 の分野 では、1996年 の『新編国歌大観 C
D―
ROM版 』 0の 刊行 以後 、歌 こ とばの研究 、 あ るいは歌人 同士 の表現摂
取 の様相 な どに焦点 をあてた よ うな研究 は、用例 の博捜 とい う点 において、
精密 の度 を加 えて きた。歌風論 ・ 歌人論 の いずれ にお いて もデ ー タベー ス化
の促進 が もた ら した成果 は計 り知れ な い と言 え るだ ろ う。 だが、 しか し、用
例検 索 を徹 底 した研究 の増加 が、一方 で、和歌 の表現研 究 にあ る種 のステ ロ
タイ プ化 を もた ら しつつ あ るこ とも、現在 、私 を含 めて 多 くの研究者 が抱 く
「用例 を検 索 す る」とい う、
所 感 に違 い な い。テキ ス トデ ー タベ ース の活用 が、
いわ ば研究 の補助手段 に とどまる限 り、表現研 究 のあ り方 も固定 的 にな り、
― ゴθ7-
千葉大学 人文研究 第29号
やがては歌語研究や表現研究 自体の魅力の低下を引き起 こすのではないか と
い う危惧 もまた、少なか らず抱かれ るのである。補助手段 としての検索利用
とは別に、言語 と文化 のデー タの集積 ともい うべ き文学作品を計算機 によっ
て総合的 に分析研究することを目指 し、そのために日本 の古典文学作品の分
析 に適 した方法やツール それ自体を検討する研究が、和歌研究者 自身 の手 に
よつて、開始 され るべ き時期に来ていると言えるのではないだ ろうか。
特 に、
前述の国文学研究資料館の公刊デー タに代表 され るように、利用者側が如何
ようにも加工 出来 るフルテキス トデー タベースの提供が本格的に開始 された
事 は、そうした時代の到来を予感 させ る。情報処理研究 のサイ ドではすでに、
古典和歌を対象 として、デー タ分析 という観点 か らの研究が始 まってい る。
山崎真 由美 (6)、 竹 田正幸 (7)ら の共 同研究が それで、最長共通 部分文字列
(LCS)や 最小記述長 (MDL)方 式 といった方法によって、類似歌や特徴 パ
ターンの 自動抽出を可能 にしよ うとするもので今後の進展が期待 され るが、
残念なが ら現段階では和歌研究者側 にはあまり知 られ るに至っておらず、実
際 の和歌研究で どう展開 され るかはこれか らの課題であろう。
本稿 は、和歌研究者の立場か ら、平安和歌研究の一環 として、古典和歌研
究のデー タ分析の方法を新 しく提案 し、あわせて、それによった研究を試み
るものである。新 しく提案す る分析法 とは、 nグ ラム統計処理 とlINIXの 標
準 ツールcOmmを 組み合わせた文字列総比較 によって表現の種 々相 を分析す
る方法であ り、またそれによって試みたい研究 とは、性差 か らみた『古今和
歌集』の 「ことば」 (歌 ことば・表現)の 分析である。
ここで まず、
『古今和歌集』の 「ことば」(歌 ことば・ 表現)を 性差 の観点
か ら考察す ることの意義、 またそれを特に計量分析 によって行 うことの意義
について述 べておこう。和歌 とい う表現形式 の特質 の一つに、それが一 人称
の言語表現であ り、かつ作品内 に仮構 された性 も含めて詠歌世界 において主
体 となって い るものの性 ―男性 の歌であるのか、女性の歌であるのか ―を、
大 きく反映する文学様式であるとい うことが ある。折口信夫以来多 くの論考
゛
が重ね られて い る「女歌」論 は、この問題 をめ くる研究を代 表す るものだが、
近年、特 に平安和歌で は、後藤祥子の 「女流 による男歌 ―式子内親王歌 へ の
一視点」 0に よって大 きな問題提起がなされた。後藤の論 は 「女流 による男
― ′θθ一
nグ ラム統計処理を用 いた文字列分析 による日本古典文学 の研究
歌」 という、発想 を転換 した観点で古今か ら新古今時代 までを縦断 して分析
す ることで、従来 「女歌」側 に集中 していた問題 を相対化 し、詠歌世界にお
ける性 の倒錯や錯綜が、代作・題詠・ 物語取 りな どの和歌史的諸問題 といか
に切 り結ぶかを鮮やかに分析 してみせたものであつて、式子内親王 の代表歌
「玉の緒 よ絶えなば絶えねなが らへ ば忍ぶ ることの弱 りもぞする」を源氏物語
取 の歌で、 しか も男の立場 (作 中の柏木)の 恋を歌つたもの とす るかつて無
い結論 とあわせて、多 くの反響を呼んだ0。 同論 は、詠歌世界 での男装の式
子 という、センセーショナル な指摘 もさることなが ら、論証過程において、
た とえば 「忍恋」の詠み手は古今以来圧倒的 に男性 であることを明 らか にす
るな どといったように、古今以後の和歌世界 に 「男歌」 とい う発想 。表現 の
型があるとい うこと、 い うなれ ば和歌 の発想や表現 に潜む 「男性性」 とい う
問題 を、具体的 に浮かび上が らせ ることになった点で も、斬新かつ従来 にな
い着眼を提供す るものであつた と思われる。時 に男性歌人 が擬装す る「女歌」
とい う型 があ り、一方で女性歌人が、代作 として模倣 した り、題詠世界で成
り変わ つてみせ得 る「男歌Jと い う型があるのだ としたら、平安期 の人々は、
その位相差をどう認識 して いたのだ ろうか。そもそも彼 らが 「王朝和歌」 と
い う表現形態 において、共通 に認識 していた性差の 「型Jの 枠組み とはどの
ようなものだったのだろうか。歌の 「型」 とは、言 うまで もな く、「ことば」
によって形成 され る。そこで本稿では、「ことば」に密着 して この課題 につい
て考 えてみたい。具体的対象 とするのは、以後 の王朝文学 の 「ことばの規範 J
とな り、広 い意味で の王朝の表現文化の基盤で もあった『古今和歌集』であ
る。恋歌だけではな く、四季、覇旅 など歌の領域全体に範囲を広 げ、この『古
今和歌集』 において、性差が、表現や発想 を どう規定 して いたのか、男性 の
言葉 と発想 の型 。女性の言葉 と発想 の型 との関連 か ら、その 「ことばJの 型
を明 らかにすることを目指 してみた い。特 に、『古今和歌集』 では、1100首
の うち、作者名などか ら女性の歌 と確実視出来 るのは87首 を数えるに過 ぎな
い。和歌が、対漢籍 とい う意味においていかに女性的契機 を持つ文学形式で
あるに して も、「古今的表現Jと は、その意味で、紛れ もな い男性 の形成 した
文化的言語表現 に他ならない。そうした男性 の視点 は文芸 としての和歌 にど
う反映 し、また これを機制 したのか、
従来の女歌論 の立場だけに とらわれず、
― ′θ′ ―
千葉大学 人文研究 第29号
後藤論 の示 唆す る ところか ら、更 に展 開す べ き問題 は多 々 あ る と考 え られ る
ので あ る。
それ に して も、平安 時代 の言葉や表現 を、個別例 に即 して男性性 。女性性
の観点 で判別 して い くこ とは、容易 な よ うで いて 、実 は全 く容 易で はない。
『源氏物語』作品中か ら、「女性語」「男性
山 口仲美 は、客観分析 に徹す る時、
語」を、網羅的 に識別 。抽出す ることが、 いかに困難な作業で もあるかを述
べ ているが (10、 『古今和歌集』において、男性が頻繁 に用 い るのに女性 には
用例がない表現 を、 い くつか具体的 に示せ と問 われた とき、た とえ熟達 した
和歌研究者 をもって して も、主観 で即答することは難 しいだろう。語感 。ニ ュ
ア ンス というレベルにおいて、平安和歌 とは、現代語の話者 としての我々研
究者 に とって内省 のほ とん ど通用 しない領域であるとい う立場 を一旦は取 る
べ きであろう。そ こで 内省 に代替す る、あるいは内省を超える客観分析 に適
した手段 として、有効 と考 えられ るのが、和歌のフル テキス トデー タを計算
機で分析す る計量分析である。以下で は、私 に作成 した『古今集和歌』 のテ
キス トデー タベースを対象 に、新 しく提案す る分析方法によって、男性歌人・
女性歌人 のそれぞれの性別 に語彙・ 類句 。句法な どを抽出 し、それぞれが多
く用 いてい る語彙や表現、また一方が他方 に比 して多 く用 いてい る語彙や表
現を網羅的・計量的 に抽出す ることか らはじめてみる。以下、論 の前半では、
統計処理 のツール と方法の提案を行 い、後半で計量結果 に基づ く考察を行 う
こととする。
2 文字列分析の提案― nグ ラム集合演算法―
2.l nグ ラム続計処理 と長尾・ 森プログラム
ことばの型に、性差 はどう反映 して い るか。古今時代 か らすで に男性が女
性 の立場で詠 んだ歌がある、 とはよ く知 られた事実だが、性差 とことばの関
係 の基本 ライ ンを把握するためには、やは りひ とまずは、古今集歌のすべ て
を、男女それぞれ作者表記 に指示 された通 りの性別 に基づいて振 り分け、そ
れぞれの語彙・旬法 。表現 な どを使用頻度 も併せて網羅 してみる事が第一で
一 ′,9-
nグ ラム統計処理を用いた文字列分析による日本音典文学の研究
あ ろ う。特 に古今集 の場合、男性 とも女性 とも性別 の判断で きな い
「読人不
知」 の一群が あ るので、 これ も一つ の位相 を成 す もの として 区別 す る と、全
体 を男性 。女性 ・ 読人不知 の 3つ に分 けて比較 す るこ とが必要 とな る。 で は
その 3つ の位相 を比較 して、 それ ぞれ多 く用 いて い る語彙や表現、 また一 方
が他 方 に比 して多 く用 いてい る語彙 や表現 を計量 的 に網 羅 ・ 抽 出す るには、
語彙 を比較するだけであれば、男性歌人歌、
どのような方法があるだろうか。
女性歌人歌、読人不知歌 にデー タを 3分 類 し、形態素解析 ―いわゆる総索引
作成 のための品詞分解作業 ― を行つて、語彙 の出現頻度 を とり、比較 してい
く方法などもあるのだが (11)、 それでは語彙以外 の、た とえば「恋 もするかな」
のような、 より長 い言 い回 しや表現をうま くす くい上 げる事 は出来ない。そ
こで、本稿 が、 まず取 り上げたいのが、形態素解析 による分析 とは異なる方
法、すなわち情報処理研究で開発 された文字列単位での分析方法 である。そ
してそのための汎用性 の高 い 日本語分析方法 として、ここで注 目したいのが、
京都大学 の長尾真 。森信介 (現 日本アイ・ ビー・ エム東京基礎研 究所)両 氏
の開発 した 日本語語旬 の 自動抽出 プログラムである(121(以 下、長尾・森 プロ
グラム と称する)。
文字列単位で の分析 は、古典文学研究 の分野ではなじみが無 く、応用 した
前例 を聞かない。長尾 。森 プログラムは、 シャノンの情報理論において展開
された言語分析のための理論であるnグ ラム統計 (1助 を、日本語の大規模テキ
ス トに対 して高速で行 うためのプログラム として開発 されたものであるが、
文学研究者 にとってはいずれ も新 しい概念 であ り、 はじめに、 この nグ ラム
統計 および長尾・ 森プログラムについて概観 しておきたい。
まず、 nグ ラム統計 とはテキス ト中で任意の長 さの文字列を抽出 し、その
出現頻度を求 めるものであ り、言語 の種類 を問わず適応可能なものである。
ここでは、やや煩瑣 になるが、古今集め次の一首を例 にとって、その文字列
を抽出する仕方について説明 しておきたい。
としのうちにはるはきにけりひととせをこぞとや いはむ ことしとや いはむ
「nグ ラム
(n・
gram)」
とはこの場合 「n文 字」の意味であるが、まず n=
一 ゴθゴ ー
千葉大学 人文研究
第29号
1す なわち、1グ ラム (1文 字)の 場合を例 に とる。1グ ラムの場合 は、上
記 の歌の頭か ら 1文 字ずつ場所 をず らしなが ら、1文 字単位で取 り出すので、
や
む
のよ うに31個 の文字 が抽出され る。次に、同様 に 2グ ラム、すなわち 2文 字
の場合 には、同様 に 1文 字ずつず らしなが ら、 こん どは 2文 字単位で取 り出
すので、次のようになる。
とし しの
い│ま
0ま
のう
うち
には ……
ちに
しと
とや
やい
む
このよ うに、30種類の 2文 字単位 の文字列を取 り出す ことがで きる。同様 に
3グ ラム、 4グ ラムでは、次のようになる。
としの
しの う の うち
うちに には る はるは
るはき ……
やひは いはむ
としの う
しの うち の うちに
うちには
ちにはる ……
とや いは や いはむ
この グラム数は理論的にはどこまで大 きくすることも可能であるが、 この場
合は、もとのテキス トである和歌 の一首 の長 さである31グ ラムが一応の上限
となる。 また、取 り出 した文字列が、研究の上で何 らかの意味があるもので
なければ抽出す る必要 もないことで もあ り、多 くの言語研究で は数十 グラム
程度 まで抽出すれば十分 であろう。
このようにして抽出された文字列には 「のう」「ちにはる」のように全 く
「いはむ」のように単語や文節
無意味な文字列も含まれるが、同時に「とし」
として意 味 のあ る文字列 も含 まれ る。 しか も、単語や文節 だ けで はな く 「と
しの うち」 あ るいは 「は るは きにけ り」 の よ うな句や言 い回 しもすべ て含 ま
れ る こ とが重要 で あ る。
―」
`″
―
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
さて、抽 出 した各 グラムの文字列 において 、上記 の例 で は、 2グ ラムで は
「いは」「とや 」 が それ ぞれ 2回 出現 し、 また 3グ ラムで は 「いはむ」 が 2回
出現 す る。一首 だ けで な く、例 えば、古今集全体 の 和歌 につ いて 同 じ作業 を
行 つた場合 には、 同 じ形 の文 字列 が複 数回現 れ る例 が多 くな るこ とが容易 に
予想 され るので あ るが、 この よ うに して各 グラム ご とに、 同 じ形 の文字列が
何回 出現 す るかの頻度 を計測す る こ とがで きる。 この よ うな こ とを nグ ラム
統 計 と称 す るが、 これ に よって その作品の中の文字列 の現れ方 につ いて 、 ど
の よ うな文字列 が 高頻度 に出現 す るかの調査 を行 う こ とがで きるわけで あ る。
先 に述 べ た よ うに、文字列 には、単語 。文節 。慣用句 ・ 長 い言 い回 しな どの
すべ てが 網羅的 に含 まれ るので あ るか ら、 nグ ラム統計 は、 そのテキ ス ト全
体 につ いての網 羅 的 な情報 を含 む もの とな るわ けで あ る。
ところで、 nグ ラム統 計 は、上記 の よ うに きわめて機械 的 な処理 で はあ る
が、 たいへ んな手数 を要 す るた めに、 あ る程度 以上 の大 きさのテ キス トにな
る と、 これ を手作業で行 う こ とは まった く不可能 とな る。 また、 コ ンピュー
タを用 いて も、大規模 なテキ ス トデ ー タの場合 は相 当な計算時間 を要 す るた
めに、 この統計 を人文科学的 な研究 に応用 した例 は従来 まった く存在 して い
なか った。
ところが、本研究 で利用 した長尾・ 森 プログラムでは、特殊なアルゴ リズ
ムに よって、 この計算時間 の問題 を解決 し、 日本語の大量デー タについて、
任意の nグ ラム統計 を極めて高速で求めることを可能 とした。両氏 の研究で
は、現代語 の大量デー タを分析 し、単語的文字列 を自動抽出 した結果につい
ての例が報告 されて い るが、 この長尾・ 森 プログラムに よる統計の利点を、
私 の立場 か ら、簡潔にまとめると次 のようになるであろ う。
①大規模テキストに対して、きわめて高速に分析が可能であること。
②形態素解析 (単 語への分解作業)を まったく必要としないこと。
③ nグ ラムのnの 値を任意に設定できること。
④よつて、プレーンなテキストから語彙を含むさまざまな文字列を抽出す
るこ とが可能 で あ るこ と。
一 ゴθθ一
千葉大学 人文研究 第29号
本研究 ではこれを平安時代和歌資料 のデータ分析 に応用 してみる(10の だ
が、それが従来 の形態素解析 によった分析 とどう異なるのか、その具体的 に
意味するところを、次に、
実際 に今回行 った古今集 のデータ分析 によって追っ
てい くこととす る。
2.2
『 古今和歌集』 を nグ ラム分析 する
まず、上記の 「②形態素解析 (単 語への分解作業)を まったく必要 としな
い」についてだが、従来、古典文学で一般的に語彙分析を行う場合には、単
語に分解する作業がかならず必要で、データベースで計量化する際にも
んノこ
oool とし/の ノうち/1こ ノはるノはノきノに/け り/ひ ととせ/を /こ ぞノと/や んヽはノ
い│ま ノ
とし/と ノ
ん。☆
やノ
こほれ/る ノ
のノ
はるノ
たつ/け ふノ
のノ
かぜ/
むすび′し′
0002 そでノひち/て ノ
みづノ
をノ
やノとくノらん。★
の、ように、手作業で 「
/」
などのタグを付 して い く必要があった。古典語の
場合、単語単位 の認定や、統 一 した単位切 り方針の徹底が いかに難 しく、労
力を要する作業であるか は、 いわゆる総索引作 りを経験 した者であれば、誰
もが知 るところであろう。それに対 して、 この長尾・森 プログラムでは、分
表記体系の統 一 されたデー タで
析対象 のテキス トデー タに求められ るのは、“
あること"だ けである。漢字仮名交 じり文であれ、清濁表記であれ、表記方
法が一定であれば結果を出す事が出来 る。今回は和歌であることか ら掛詞な
ども配慮で きるように漢字表記は避 けて平仮名 にひらき、清濁・仮名遣 いを
統一 する方針 を とった。その表記統一 したプレーンテキス トに、性別情報 と
歌番号、歌末記号を タグ付けした次のようなものが、今回の分析用 に作成 し
たデー タである。
きんoo01と しのうちにはるはきにけりひととせをこぞとやいはむこと
しとやいはむ/
m,こ
― f,イ ー
nグ ラム統計処理を用いた文字列分析 による日本古典文学の研究
m,こ きんooo2そ でひちてむすびしみづのこほれるをはるたつけふのかぜや
とくらむ。/
きん0003 はるがすみたてるやいづこみよしののよしののやまにゆきは
ふ りつつ/
゛
1こ きん0004 ゆきのうちにはるはきにけりうくひすのこほれるなみだいま
n,こ
やとくらむ/
゛
きんooo5 うめがえにきゐるうくひすはるかけてなけどもいまだゆきは
ふ りつつ/
゛
m,こ きん00o6は るたてばはなとやみらむしらゆきのかかれるえだにうくひ
n,こ
すのなく/
m@,こ きん0007 こころざしふか くそめてしをりければきえあへぬゆきのは
なとみゆらむ/
入 力本 文 は岩波書店 。日本 古典 文学大 系『古今 和歌集』 (梅 沢本 、1111首 )
で、 これ を清濁 を付 した平仮 名表 記 に あ らため、行頭 に作者名 に応 じて性別
の タグを付 した。性別 タグは、男性 歌人 はm(maleの 頭文字 )、 女性 歌人 は
f Cfemaleの 頭文字 )、 読 人不 知 は n(neutralの 頭文字)と し、 また次 の例 の
よ うに、左注 な どで 作者 が示 唆 されて い る場 合、 男性 はm@、 女性 は f@と
し、今 回 はそれ ぞれ の性 に含 めて統計 した (l動 。
例】古今和歌集 。7番 歌
【
題 しらず
読人不知
心ざしふか く染 めて しお りければ消えあへ ぬ雪 の花 とみゆらん
ある人の曰 く、前太政大臣の歌也
このよ うな場合 にはm@と す る。
→
この デー タを、mof・ nの 性別情報 に従 って分類 し、長尾・ 森 プログラ
ムで処理すると、 どのような結果 が得 られ るか、具体例 をあげてみよう。
男性歌人 3グ ラムの文字列例】
【
74こ ころ
33ひ との
24る らむ
― ゴθ」一
20な がら
第29号
人文研究
千葉大学
50お もひ
33と お も
24こ ひ し
20こ )と に
49の や ま
32お もふ
23ほ とと
20こ ろも
41り ける
30は なの
23と とぎ
20お もヘ
35る かな
30さ くら
22は るの
19ら ばな
35や まの
35の は な
27も みぢ
19む ひ と
27な みだ
21わ かれ
21ひ とに
19の なか
34あ きの
26な りけ
21か り0す
19に け り
33 りけ り
25な くに
20も の を
19に け り
例 示 したの はm(男 性歌 人 )の 全詠歌 において、 n=3、 す なわち 3文 字
の文 字列 を網羅 した結果 の一 部 で、出現頻度 の高 い ものか ら順 に挙 げた もの
で あ る。各頭 の数字 ― た とえば 「74こ ころJの 「74」 が、 その文字列 の 出現
頻度であり、男性歌では 「こころ」が、3文 字の言葉 としては最多出現 し、
それは74回 であることがわかる。 nグ ラム統計においては、 2. 1で も述
べたように、テキストデータ中の文字列を単語であるかどうかにかかわらず
指定 した nの 長 さごとにすべ て列挙 し、頻度をはかるので、 ここで も 「とお
「お もひ」
もJ「 な りけJの ように単語ではない文字列 まで抽出されて い るが、
「こころ」「みや こ」「さくらJ「 もみぢ」「なみだ」のような名詞はもとより、
「ものを」「な らば」など助詞・ 連語 も含めて、すべ てが網羅 されて くる。ち
なみ に同様の統計を女性 の 3グ ラムで とり、抽出されて くる内容を頻度順 に
挙 げる と、
11お もひ 。10わ がみ 。9こ ころ・8ひ との 。7も のを 。6ぬ れば・5わ
かれ
5の なか 。5の お と・5に ひ と 。5な りけ 。5か な し 。4る もの 。4も
なき 。4も あら 。4み や こ
……
とな り、簡単 に比べて も、上記男性 の 3グ ラムの分布 と異なって、女性歌で
は 「我が身」が 「こころ」を退けて 2番 目に多 く用 い られて い る語彙である
ことなどがわか る。
この nの 長 さの設定は、2.1で 、長尾 。森 プログラムの利点 として③ 「n
グラムの nの 値 を任意に設定できること」 としたように、長 くす ることも、
―
I%一
nグ ラム統計処理を用 いた文字列分析 による日本古典文学 の研究
短 くすることも自由であ り、様 々な長 さに設定を変えることによ り、次 のよ
うに、色 々 な角度か ら 「表現」を取 り出 し、計量化することが 出来 るのであ
る。
2.3
計量化される様々な表現
では、古今集で実際に取 り出され る 「表現」を、短 い nの 場合 と長 い nの
場合 の二つの面か ら見てみよう。
(A)基 礎語彙・ 歌語 。枕詞・ 連語などの抽出 ― nを 短 く設定 した場合 ―
女性歌人 2グ ラムの文字列例 】
【
27ひ と 。21お も 。20も の 。19な り 。18わ が 。
16や ま 。15は な 。15と の '14も ひ 。14の な 。
14こ ろ 。13の み 。13な き 。12に は ,12と は・
12し き 。12こ こ
男性歌人5グ ラムの文字列例】
【
23ほ ととぎす
11と おもへ ば
9ぞ ありける
18さ くらばな
10と のこころ
8な らなくに
16を みなへ し
10う めのはな
8し らゆ きの
12は るが すみ
9ひ との ここ
7ひ さか た の
読人不知5グ ラムの文字列例】
【
17ほ ととぎす
8は るが すみ
7う めのはな
12ひ きのや ま
8さ くらばな
6よ のなかは
12し ひ きのや
゛
8う くひすの
6よ のなかの
12あ しひ きの
7ぞ ありける
6も のお もふ
まず、 nが 短 い場合 につ いて見 る と、1 グラムでは、1音 節 の単語 「き」
千葉大学
人文研究
第29号
「め」な ども含 まれ るものの、大半が文字の頻度 となって しまい
あまり有効で
「
はないが 、(A)に 見 るように、2グ ラムでは ひ と」「もの」「わが」「はな」
「ころ」等、基礎語的なことばが現れて くる。3グ ラム
では、前掲のように「こ
ころ」「おもひ」「おもふ」「わがみ」「ひ との」「さ くら」「もみぢ」「こひ し」
「ものを」「わかれ」など と、歌 のことば としての輪郭 の あるものが一気に増
加 し、一句分 に相当する 5グ ラム、すなわち 5文 字 になると 「ほ ととぎす」
「さ くらばな」「をみなへ し」「はるがすみ」「しらゆきの 「はなのい
ろ」「た
」
つたがは」 と、歌語 は歌枕 も含めてますます充実 し、「ひさかたの」「あ しひ
きの」「ちはやぶ る」といった枕詞や、「ものお もふ」な どの動詞、「ならな く
に」「やはあらぬJな ど特徴的な連語 も網羅 されて くる。
(B)類 句・類歌・影響関係の想定できる歌などの抽出―nを 長 く設定した場合―
更 に nが 、一つ の句を超 える文字列である 8グ ラム以上 になると
男性歌人 8グ ラムの文字列例】
【
゛
4か みなづ きしく
れ 3は なすすきほにい
3や まのさくらばな
3も のにぞあ りける
3む ちはやぶ るかみ
3ぬ ものにぞありけ
3な にこそありけれ
3ぞ あやまたれける
3あ らじ とお もへ ば
3あ しひ きのや まの
2を み なへ しおほか
2を お もふ ころか な
゛ 「
「かみなづきしく
れ」 をおもふころかな」のように類句と呼べるようなも
「やまのさくらばな」
「あらじとおもへば」など様々
「なにこそありけれ」
のや、
な言 い回 しが抽 出 されて くる。 これ らはみ な複数 回出現 す る訳 だが、 その内
訳 を見 て い くと、歌風や、特定 の表現 の生 まれて くる機微 を知 る手がか りと
な る もの も少 な くな い。
「あ らじ とお もへ ば」を例 に とろ う。「あ らじ とお もへ ば」は、古今集 には、
『伊 勢物 語』 80段 で も知 られ る、業平 の 「ぬれつ つ ぞ しひて を りつ る年 の 内
に春 はい くか もあ らじ と思 へ ば」 (133番 )、 を は じめ、男性 に他 2首 (880
番 。貫之、978番 。霜恒 )、 女性 に、 これ もまた著 名 な伊勢 の 1首 「三 輪 の 山
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
いか に まち見 む年 ふ ともたづ ぬ る人 もあ らじ と思 へ ば」 (780番 )、 更 に読人
不 知 に 1首 (1032)の 計 5首 が あ るのだが、古今 以後 の作例 は僅 かで、後撰
集 。金葉集三奏本 ・ 詞花集 に各 一 首が あ るにす ぎず、 また万葉 に も用例 はな
い。初 出 は業平 で あ り、過 ぎゆ く春 を惜 しむ思 い を託 した 「春 はい くか もあ
らじ と思 へ ば」 の名句 は、時 の とどめがたい移 ろい をす くい取 った独特 の こ
とば続 き として、古今 当代 の著名歌人 に好 まれ、完結 した、古今集 らしい「こ
とば」 と見 なす こ とが出来 るだ ろ う。長 い nで は、 この よ うに、 歌風 に還 元
可能 な表現 が相 当数抽 出 され て くるので あ る。
で は、古今集 内で複数 回出現 す る最 も長 い こ とば続 き とは どの よ うな もの
であろうか(“
)。
(c)2度 以上出現する最長文字列
男性歌人 =12グ ラム】
【
2あ かず してわか るるなみだ
2な が らの は しのなが らへ て
2か とのみぞあや またれける
2み よ しののや まの しらゆ き
2こ しの しらや ましらね ども
2を み なへ しおほか るのべ に
2さ みだれのそらもとどろに
女性歌人=18グ ラム】
【
2の お とにだにひ との しるべ くわが こひめ
読人不知 =24グ ラム】
【
2あ しひきのや ましたみづの こが くれてたぎつ こころを
上記のように、男性では12グ ラムで 7組 、女性では18グ ラム、読人不知で
は24グ ラムでそれぞれ 1組 を求めることが出来 る。女性・読人不知の歌はそ
れぞれ、一首三十一文字の半分を超 えて一致す ることになるが、 この場合 に
は、次のように異伝歌や、伝承歌的な歌句をもつ歌同志が選 ばれて くる。
一 ゴθθ―
千葉大学
人文研究
第29号
山科 の音羽 の 山の お とにだ に人の知 るべ くわが恋 ひめか も
(恋 三・ 664・ 読人不知 )
「
この
左注
歌、 あ る人、近江采女 となむ 申す」 に よって女性
歌 に入れた もの)
山科の音羽 の滝 のお とにだ に人 の知 るべ くわが恋 ひめや も
(1109・ 墨滅歌、「返 し、 采女 の奉 れ る」
)
あ しひ きの山下水 の こが くれてた ぎつ 心 をせ きぞか ね つ る
(恋 一
。491・ 読人不知)
あ しひきの山下水 の こが くれてたぎつ心をたれにか も相語 らはむ
(雑 林歌 。lool・ 読人不知、長歌の一節)
歌詞 の半分以上を超 えた一致では、類歌が抽出され るといってよい。
それに対 して、男性の12グ ラム 7組 は、次に挙げるように、単純な類歌 と
しては扱えない ものが多 い。
l.あ かず して別 るる涙たきにそふ水や まさると下 は見ゆらむ
(離 別・ 396・
兼芸)
……富士の嶺 の 燃ゆるおもひもあかず して別 るる涙藤衣をれ るここ
゛
ろも八 ち くさの
(雑 体 。1002・ 貫之 )
2.み 吉野 の山辺にさけるさ くら花雪か とのみぞあや またれける
(春 上
。60。 友則)
花見つつ人 まつ時は自妙の袖か とのみぞあや またれける
(秋 下 。274・ 友則 )
3.き
みが行 く越 の 自山 しらね ども雪 の まに まに跡 はたづ ね む
(離 別 。391・ 兼輔 )
思や る越 の 自山 しらね ども一夜 も夢 に こえぬ夜 ぞな き
(雑 下 。980。 貫之 )
4.五
月雨 の空 も とどろに郭公 なにを憂 し とか夜 ただな くらん
(夏 。160・ 貫 之 )
-200-
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
……春霞
思 ひみだれて五 月雨 の空 もとどろに小夜ふ けて山郭公 鳴 くご と
(雑 体
。1002・ 貫之)
5.逢 ふ ことを長柄 の橋 のなが らへて恋ひわたるまに年ぞへ にける
(恋 五・ 826。
是貝U)
……か くしつつ長柄 の橋 のなが らへ て難波 の浦 に立つ なみのなみの数
(雑 体 。1003。 忠琴 )
にや ……
6。
み吉野の山の 白雪つ もるらし古里 さむ く成 りまさるな り
(冬 ・325。
是員U)
み吉野の山の 白雪ふ みわけて入 りに し人のを とづ れ もせぬ
(冬
。327・ 忠琴)
7.女 郎花おほかる野辺 に宿 りせばあやな くあだの名をやたちなん
(秋 上
。229・ 美材 )
花 にあかでなに帰 るらむ女郎花おほか る野辺 に寝なましものを
(秋 上 。238・ 貞文)
1∼ 7の 句 はすべ て万葉 に無 く、 ここにあげた古今時代 歌人が独 自に展開
した もので、 しか も友則・貫之・ 是則・忠琴・兼輔・貞文な ど、活動時期 の
重なる限 られた歌人、交遊の認 め られ る歌人などに集 中 している。 2・ 4の
ように同一歌人が 同一 の類句で詠 じて い るのは、歌人の歌風を考察する一助
となるし、 3・ 5・ 6。 7は 、歌人 どうしの影響関係を想定 させ る。ちなみ
に、男性歌人歌では9∼ 12グ ラムの間 に、同様 に 2句 分 にわた る一致 をもつ
歌が22組 44首 も認められた。歌人 は上記のメンバ ー と重な り、特に貫之が多
いな ど、撰者時代 にお ける 「古今的表現Jの 形成過程や相互影響 の実態を知
る糸口 として重要の事実であろう。
以上か ら、 nの 設定 によって、 いかに様 々な 「表現」が抽出され計量化
され るか、具体化出来た と思われ る。 それは、歌語 。語彙・枕詞・連語、類
句・類歌か ら歌人同志の影響関係に到 るまで、
極めて多岐に渡 るのであって、
2.1で のべた、“nグ ラム統計 は、そのテキス ト全体 についての網羅的な情
報 を含むもの となる"と は、具体的には この ような事を意 味 して い るのであ
る。それによって得 られ る結果は、従来 の品詞 ごとの語彙分析で得 られるも
―,9ゴ ー
千葉大学
人文研究
第29号
の とは、全 く質を異 に してい るといってよい。不要な文字列の混在 とい うデ
メ リッ トはあるが、形態素解析の煩雑な作業が必要な く、かつ様 々 な文字列
を抽出するとい う点 にか けて は全 く遺漏がな く、 しか もそれ ら文字列の頻度
数が同時に計量 され る、 という種 々のメ リッ トはデメ リッ トを補 ってあま り
あろう。研究者 はその 目的 に応 じて様 々な示唆を得、考察を展開することが
可能 となるのである。実際、男性
12グ ラム 7組 で確認 したような詠歌 の実
態は、特徴ある歌人同士の特徴ある歌旬の一致であるにもかかわ らず、
『古今
和歌集』の従来の注釈で指摘 はなされていない。研究者の通常の認識の枠を
超 えた、
新 しい問題 の提示が、これ らか ら得 られ る可能性 もあるに違 いない。
では、上記の手続 きで、文字列単位で、男 。女・読人不知、それぞれの表
現 と出現頻度を得 た として、次に必要なのは、それぞれの独 自表現をより分
ける作業であろう。次頂では、そのためのツールについて述 べ る。
2.4 nグ ラム集合演算法 ― nグ ラム統計処理 とcommを 組み合わせる―
男性歌だけに現れ る文字列、女性歌だけに現れ る文字列、あるいはまた男
女の歌に共通 して現れ る文字列を、すべ てより分 けるには、た とえば、全男
性歌文字列か ら全女性歌文字列を引き算する、また逆に全女性歌文字列か ら
全男性歌文字列を引き算するというような ことが 出来れば良 いわけであるが、
そのための簡便で効果の高 い方法 としてここで用 い ることに したのが、 nグ
ラム統計処理結果 をcommで 相互比較 して い く方法である。commは 多 くの
UNIX(ワ ー クステー シ ョンのオペ レーティングシステム)に 搭載 されて い
る標準 ツールで、整列 された 2つ のテキス トファイルを比較 して、その共通
文字列、独 自文字列を抽出することができる。やや煩 雑 になるが、その仕組
みを、 まず簡単 に示 してお く。
例 えば、次のよ うな内容 の、 Xと Yと い う二つのテキス トファイルがある
とす る。それぞれには、例 えば「あ」で始 まる 7つ ずつの単語が五十音順 (正
確 には文字 コー ド順)に 整列 した状態で入っている状態を考 える。
―′θ2-
nグ ラム統計処理を用いた文字列分析 による日本音典文学の研究
(Xの 内容)
(Yの 内容)
あか
あさ
あさ
あ しひき
あ した
あす
あす
あそび
あせ
あたま
あたま
あた ら
あみ
あり
commを 用 い ることで、 この二つのファイル を比較 して、次のような二 つ
のグルー プの単語群を抽出す ることができる。
(Xに しかない単語 )
(Yに
しかない単語)
(Xと
Yに 共通する単語
あか
あ しひき
あさ
あ した
あそび
あす
あせ
あた ら
あた ま
あみ
あり
)
それぞれが数万の数にのぼる単語や文字列群であって も、 また、対象が 2
つ だけでな く、 3つ 以上のテキス トファイルになる場合で も、 このツールに
よるならば、容易 に相互 に比較を繰 り返 し、テキス トファイル同志の共通部
分 と独 自部分を求めることが出来 るのである。
古今集 の歌 は作者別 に見 ると、男m。 女f・ 読人不知nの 3つ の位相 に分か
れ る訳であるか ら、 この方法で男・女・ 読人不知の三者 の文字列 の相互比較
を繰 り返す と、各 々の独 自表現・ 共通表現 として、下図 A∼ Gに 該当す るそ
れぞれの文字列データを求めることが 出来 る。
A=男 性独 自文字列
B=男 性 。女性共通文字列
C=男 性 ・女性 。読人不知三項
-2θθ―
千葉大学 人文研究 第29号
の共通文字列
D=男 性 。読人不知共通文字列
E=女 性独 自文字列
F=女 性・読人不知共通文字列
G=読 人不知独 自文字列
A∼ Gの 各部分だけでな く、た とえばA・ Dを 組み合わせて男性歌 の表現で
読人不知歌 とは重複す るが、女性歌 に出現 しない ものをすべて抽出する、 と
い うように、パー ッを組み合わせ るな らば、更に色々な側面が、自在 に把握
出来、分析可能 となる。 この方法で、男性 。女性・ 読人不知 3つ の位相 のそ
れぞれの独 自の表現、あるいは相互 に共通する表現を、語彙 を超 えた文字列
の単位で余す ところ無 く抽出する事が 出来 る訳である。
以上述べ てきた、 nグ ラム統計処理 とcommを 組み合わせ 、 2つ 以上のテ
キス トデー タを比較 して、文字列 レベ ルで独 自表現・ 共通表現 を求める方法
を、以下 nグ ラム集合演算法 と称することとす る。
次に、実際に この nグ ラム集合演算法 によって得た表現か ら、性差を反映
した 「ことば」 の型の考察 に移 りたい。
3 古今和歌集の 「ことばJの 型 と性差
3.1 性差を反映 した 『ことば』 ―今回の考察範囲 ―
さて、 ここか らは、抽出 した個々の 「ことばJに 即 した考察 に入 るが、 n
グラム集合演算法 によって得 られ る結果は、量的にも多 く、かつ内容 も多角
的問題 にわたるため、一括 して扱 うことは困難である。そ こで、 まず本稿 で
は、次 の範囲で、計量結果 の報告 と考察 を行 うこととす る (1つ 。
① ② ③
文字列 の範 囲 は n=3∼ 7グ ラム とす る。
男性 歌 の特 有 の 「こ とば」 を抽 出す る。
出現頻度 の 高 い もの 一複 数回用例 の あ るもの ― に注 目す る。
-204-
nグ ラム統計処理を用 いた文字列分析による日本古典文学の研究
④
意味の成す文字列だけに注 目する。 したがって 「べ くわが こひ」「ま
しなのお と」な どの文字列 は除外 した。
以上のように定めた範囲、すなわち男性 に特有な 「ことば」 で、 n=3∼
7グ ラム、出現頻度 は 2以 上、に該当する意味を成す文字列 として、今回658
例 を得た。658例 の全体 については、本稿末 に 「古今和歌集男性特有表現一
覧」 として、用例数 の上位 のものか ら順に掲出する。計量分析 によって得た
一つの結果であ り、今後 の考察 の基礎 資料 として提示 してお く。
さて、その中か ら、まず ここに独 自用例数 の高 い ものか ら順 に50語 を例示
してみよう。数字は男性歌人 における用例数である (B)。
をみなへ し16
あ りけれ7
こころを14
おもほえ7
しらゆき13
かみなづ き7
みだれ 13
くもあるか7
もみぢば13
しなければ7
ながれ 12
ぞち りける7
まさり12
たつたがは7
むか し12
ちはやぶ る7
よしの 12
みや ま7
うめのはな11
あかず6
こひ しき11
あるかな6
あきのの10
いはtr6
か りける10
い ろまさり6
ならな くに10
おもへ ども6
しらくも9
か らに6
とおもひ9
こひ しか り6
もあるか9
こひ しか る6
か りけ り8
しらたま6
しらつ ゆ8
しらや ま6
千葉大学 人文研究 第29号
たれか8
たなばた6
に しき8
ち とせ6
あ しひきの7
つれなき6
あ しひきのや ま7
なければ6
あづ さゆみ7
なみだがは6
あまのかは7
にけるかな6
名詞 もあれば活用語 もある。「か りける」「な らな くに」「しなければ」 の
ような特徴的な言 い回 しが高 い数値で得 られ る事 も注 目され る。名詞にも、
「をみなへ し」「もみぢば」
「うめのはな」のような植物 もあれば、「しらゆき」
「しらくも」「しらたま」 のよ うに色彩 の共通 とい う点で捉 える事 も可能なも
の、「あ しひきの」のよ うな枕詞、また同 じ枕詞で も「あづ さゆみ」のよ うに
物象的働 きをす る語 もある。 また、「こひ しき」 (11例 )、 「こひ しか り」「こ
ひ しか る」(各 6例 )の ように、同 じ語彙 として纏 めるならば、相当の語彙数
にのぼるもの もある。 これ らの用例は、その ことばの性格や、和歌で の働 き
を勘案 して、 い くつかの基準を立てて、仕訳す ることが可能 と思われ るので
658例 の うち、更 に、出現頻度 5以 上の ものの内容を検討 し、分類 を試みた。
次にその分類案をもとに考察を進めよう。
3.2
『 古今和歌集』の男性 の 『ことばJを 腑分 けす る
男性 に独 自に出現するもので用例 数が 5以 上のものを、次のような項 目に
分類 した。景物や物象表現
(名 詞を中心 とする)、
枕詞、動詞な どといった区
分だけでな く、試案 として、時間表現、感覚表現、接続表現 。文末表現、特
徴的連語の項 目を立ててみた。特 に特徴的連語を立てたのは、例 えば「「恋ふ」
を核 とする語」 の内容 に見 るように、動詞 「恋ふ」、形容詞 「恋 し」、複合語
「恋 ひつつ」「恋わたる」、類句 「恋 もす るかな」のよ うに、nグ ラム統計な ら
ばこそ得 られた、品詞等を超 えて、ある概念で纏め うることばを、一括 して
扱 うことが有効 と考えたためである。名詞 「通ひ路」「たむけ山」「佗び人」
な ども、それぞれ 「通 ふ」「手向 く」「化 ぶ」 の項 目に挙 がつているので留意
-206-
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
願 い た い。
景物 。物象】
【
植物 :を みなへ し16。 もみぢば13・ うめのはな11・ あきのの10。 わかな 5。
゛
わすれ くさ 5・ ふ じばか ま4
虫 :う つせ み 5
天象 :あ まのかは 7。 たなばた 6。 くもゐ 5。 ふ くかぜ 5
色彩 :し らゆき13。 しらくも9・ に しき 8。 しらたま 6。 しらつ ゆ 8
身装具 :あ づ さゆみ 7・ かたみ 5。 たまのを 5
住居 :ま が き5
地名 :よ しの12・ たつたがは 7・ しらや ま 6。 お とはや ま5
動詞】なび く5。 わた らむ 5
【
【
枕詞】あしひきの 7・ ちはやぶる7。 あらたまの 5
時間表現】むかし12。 ちとせ 6。 よろづ よ5。 きのふ 5/か みなづき7
【
感覚表現】つれなき6・ かなしか り2・ かなしき2。 かなしけれ 2・ さ
【
むく2・ さむみ4・ よをさむみ 3・ にほひ5
接続・文末表現】か りける10。 か りけり8。 か りけれ 3・ かるべき3・
【
ならなくに9。 ありけれ 7・ あるかな6。 しなければ 7・ ぞちりけ
る 7・ か らに 6・ にけるかな 6・ にこそあ りけれ 5。 まにまに 5。
特徴的連語】
【
「飽 かず 」 を核 とする語 :あ かず 6。 あかず して 2。 あかで 2。 あか
1。
ぬ4
2.「 逢 ふ 」 を核
とす る語 :あ はで 3・ あ は ま し 2。 あ は む 3。 あ ふ こ と
5。 あふさかのせ き 2。 あふ よ 3。 あふよしもがな 2
3.「 ∼に出づ Jを 核 とす る語 :い ろにいで 5。 い ろにはいで じ2(「 い ろ
にいづ」 は古今全例 で 10)。 ほにいでて 3
4.「 老 い」 を核 とす る語 :お いに けるかな 2・ おいらく2
5。
「思ふ」を核 とする語 :お もはず 2・ お もはぬ とき 2。 お もはまし2・
お もはむひ と2。 おもひおき 2。 おもひきや 2・ お もひきゆ 2・ おも
ひけむ 2。 おもひける 2・ おもひおき 2。 お もひそめ 2。 おもひぬる
-2θ 7-
千葉大学 人文研究 第29号
2。 おもふ こころ 5。 おもふ ころかな 2。 おもふひ と3。 おもへ ども
6。 お もほえ 7・ お もほゆ 4。 ものをおもふ 3。 ひ とをおもひ 2・ ひ
とをおもふ 2
6.「 通 ふ」を核 とする語 :か よひぢ 5。 か よひて 2。 か よふ 3・ か よへ る 2
7.「 恋ふ」を核 とする語 :こ ひ しか り6。 こひ しか りける 2。 こひ しか る 6。
こひ しかるべ き 2。 こひ しきものを3。 こひ しと2。 こひつつ2。 こひは4・
こひは し2(恋 死)。 こひむ と2。 こひ も4。 こひ もす るかな 3。 こひやわ
た らむ3。 こひわた る3・ こふ る4
8.「 知 る」を核 とす る語 :し らね ど 3。 しらまし2。 しられず 2・ しられぬ
9。
3。 しりぬ る 2。 しるひ と5。 しるべ く2。 しるらむ 2
「立 つ」を核 とす る語 :た ちいでて 2・ たちか
くす 2。 たちかへ り3。 た
10。
ちなむ 2・ たちわかれ 3
「手向 く」を核 とする語 :た む く3。 たむけ 2。 たむけや ま 1
11.「 散 る」を核 とす る語 :ち らす 3。 ち らず 2・ ち らばちらなむ 2・ ち り
なむのち 2。 ち りぬ る 3・ ちるはなごと2・
12.「 な く (鳴 く。泣 く)」 を核 とす る語 :な きこそわたれ 3。 なきわた る 2・
な くこゑ 3。 な くしかの 2。 な くなみだ 2。 な くなる 3。 な くね 3。 な
みだが │ま 6
13.「 まさる」を核 とす る語 :い ろまさ り6。 まさらじ 2、
まさり 12、 ま
さるな 2、 まされ る 3
14.「 まどふ」を核 とす る語 :ま どひ 4。 まどふ 2・
15.「 見 る」を核 とす る語 :み え し3。 みえず3。 みえな4。 みえなむ2。 みえ
ぬ4。 みえね4。 みえね ど2。 みえわたるかな2。 (み むひ と 。みもせぬ)。
みるまで 。みるらむ、 とみゆらむ 。とみるまで 。ともみえず
16.「 乱 る」を核 とす る語 :み だる2。 みだれ 13
17.「 山」を核 とす る語 :あ しひきのや ま 7。 みや ま 7・ はるのや ま 6・ は
るのや まべ 5。 や またかみ 5。 や まのさ くら5
18.「 催 ぶ」 を核 とする語 :わ び しか り2。 わび しき3・ わび しけれ2。 わび し
ら2・ わび しらに2。 わびて2。 わびび と4。 わぶ とこたへ よ2
―
n3-
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
これ らの語句 。表現 は、古今集 において、女 性 には全 く用例 の な い、男性
側 にシ フ トした用 語 とい うこ とにな る。 しか も、重 ねて述 べ てお くが、上 記
の よ うに nグ ラム集合演算法 で抽 出 されて くる これ らの 「こ とば」 は、 活用
語尾 まで含 めた動詞 ・ 形容詞 、 それが打 ち消 しの助動詞や意志 の助動詞 を伴
う場合 な どの連 語 の語形 その もの (こ ひ しか るべ き 。こひや わた らむ 。しら
れず 。み えず 。み えね、な ど)、 複合語 として歌表 現 を成 す もの (は るのや ま
べ 。わぶ とこたへ よ、 な ど)を 、 すべ て含 むので あ り、 こ う した多面 的情報
は、形態素解析 など単語に分割 した分析では決 して得 られないのである。 こ
の分析法ならで はこそ得 られ る動詞や特徴的連語などを見 ると、当代男性 の
思考・行動 の型見本 のような表現が抽出されて い ることに改めて驚かされ る。
「知 る」や 「見 る」など、対象に積極的に働 きかけて これを知覚 しようとす る
ことは、多 く、男性側 に属す る意志であ り、また彼 らは、「人 を思 い」、「もの
を思ひ」、様 々に思惟す る主体で もある。「通 ふ」「立つ」「わた らむ」など、
「恋Jを し、
対象 に向かって行動 して い くの も、“
男性"の あ り方なのであ り、
その思 いをまず表す役割存在であることが、「穂 に出づ」「色 に出づ」な どの
歌 ことばの背後 にあった。女 の 「つれなき」 ことを嘆 き、恋の思 いに 「まど
ひ」
、「なきわたる」 自己 (泣 き続 ける自分)を ア ピールす る。そうした彼 ら
に とって 「な く鹿」や、鳥 の 「な く音」は 自己を投影 した景物 に他ならない。
中 にはこの特異語 を トリプルでよみ込んだ次のような歌 もある。
つれなきを今は恋ひじと思へ ども心 よは くも落 つ る涙か
(古 今 。恋五・ 809・ 菅野忠臣、寛平御時后宮歌合 の歌)
「つれなき」
「恋ひじ」
専門歌人で はない官人 の詠作 とい うこともあろ うが、
「涙」を盛 り込んだ、まるで男の恋歌 らしい言葉を、パ ッチワー クしたような
歌 と言える。
また一方で、男は 「老 い」を嘆 き、身の不遇を 「佗 ぶJる 。 これが古今集
の 「ことば」 に様式化 された “
男性"と い う存在であつた とい うことになろ
う。では、 これ らの 「ことば」 の乏 しい “
女性"と は、その逆 ということに
なるのだろうか。表現に集約 された、男性 と女性の相違を端的にうかがわせ
-209-
千葉大学 人文研究 第29号
る もの と して 、「恋 ふ 」 と 「飽 く」 を取 り上 げ、次 に歌 の 内容 とあ わせ て ,詳
しく追ってみ よう。
3.3
男性 ―恋する主体 ―
「恋ふ」を核 とす る語 に掲出 した、 こひ しか り 。こひ しきものを 。こひ も
す るかな 。こひやわた らむ 。こふ る、などの語句 は、すべ て、古今 の女性 に
「恋」関係 の語彙全体で は、男女 の比率はどうなっ
は用例がない訳であるが、
て い るのだろうか。語彙索引で検証 してみよう。片桐洋一監修 。ひめまつの
会編 『八代集総索引 和歌 自立語篇』(■ )に よって 「恋」 のつ く語句 と、古今
集での用例数 と詠み手を調 べ ると次のようになる。
10例 、女性歌 0
こひ こふ (恋 ひ恋ふ)全 2例 、女性歌 0
こひ し (恋 し)全 45例 、女性歌 2(小 町 2首
こひ しぬ (恋 死 ぬ)全 4例 、女性 1
こひ (恋 )全
)
(読 人不知だが、詞書で橘清樹 の交際す る女 とされ る)
こひす (恋 す)全 3例 、女性 0
こひはす (恋 はす)全 6例 、女 0
゛
こひわすれ くさ (恋 忘れ草 )全 l例 (貫 之)、 女 0
こひわぶ (恋 化 ぶ)全 1例 (敏 行 )、 女 0
こひわたる (恋 わたる)全 6例 、女 0
こひやわたる (恋 やわた る)全 4例 、女 0
こふ (恋 ふ)全 32
女
1(近 江采女
)
「恋」の付 く語句を網羅すると、古今集で は、上記のように全 114例 となる。
うち、女性歌は 4首 にすぎない。わずか 3%で ある。しか もその中、2首 は、
恋二巻頭 の小野小町 の歌
うたたね に恋 しき人を見て しより夢てふ物 は頼みそめてき (553)
― ′Iθ ―
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
い とせ めて 恋 しき時 はむ ば た まの夜 の 衣 を返 して ぞ着 る (554)
であ り、 これは、後藤祥子が 「忍ぶ る恋」 という主題 を詠む点で女の恋歌で
は例 外的 と指摘する、 まさにその歌 となっている。 もう 1首 は近江采女 が天
皇 に応 え奉 つた歌、残 る 1首 の、橘清樹 へ の女の歌 は、恋三の巻 において、
女の側か ら男に贈つた少数例の うちの 1首 と、む しろ特殊な歌 が多いのであ
る。男性の作例が
ほ ととぎす初 こゑ間けばあぢきな く主 さだまらぬ恋せ らるはた
(夏 ・ 143・
素性 )
山ざ くら霞の間 よりほのかにも見て し人 こそ恋 しか りけれ
(恋 一・479・
貫之)
河の瀬 になび く玉藻 のみが くれて人に知 られぬ恋 もす るかな
(恋 二・565・
友則 )
大空は恋 しき人のかたみかは物思ふごとにながめ らるらむ
(恋 四・ 743・
酒井人真)
逢 ふ ことを長柄の橋のなが らへて恋ひわたるまに年ぞ経 にける
(恋 五・ 826・
是則 )
と、実に自由に、各巻 に渡 つて恋することの歌境を展開 してい くのに比べ、
“
恋す る"女 たちのなん と限定 され ることであろ うか。
後撰集で も、 この傾向 に大 きな変化 はな く、同様の手続 きで得た 「恋」の
付 く語句 100例 の うち、女 は 7例 に とどまっている。 この集で は読人不知 の
割合が高 く、 またその中には女性作者 の想 定 され るもの も古今集 より多 く
なっているが、それにしても男性歌人名の記載 された歌は46首 と、女性 を圧
倒 してお り、当代の男性によっては
あさぢふの小野の篠原忍ぶれ どあまりてなどか人の恋 しき
(後 撰・ 恋一・ 577・
くれは とり綾 に恋 しくあ りしかばふたむ ら山 も越 えずな りに き
一′ゴI一
源等)
千葉大学
人文研究
第29号
(恋 三・ 712・
清原諸実)
と、続々 と恋する事を歌 つた名歌が生産 されて い く。古今 には じまる王朝
和歌 の 「ことば」の型では、“
恋する"の は、まず男性 とい う定型が基本認識
としてあったことが うかがえよ う。
しか し、そうした定型は、万葉集では必ず しも認め られない。万葉では、
次のように、文字通 り “
恋する"女 の歌 は少な くない。
君待 つ と我が恋ひ居れば我が屋戸の簾動 か し秋の風吹 く
(巻 四
。488・ 額田王)
しきたへ の枕 ゆ くるる涙にそ浮 き寝 をしける恋の繁 きに
(巻 四・ 507・
駿河采女)
゛
いふ
のみそ
には
ふる
ことは
が恋ふ
と
のな
我
君
恋
我が背子
くさそ
言
(巻 四 。656・ 大伴坂上郎女)
をみなへ し佐紀沢に生ふ る花かつみかつ て も知 らぬ恋 もす るか も
(巻 四 。675。 中臣女郎)
いな と言 はば強ひめや我が背菅 の根 の思ひ乱れて恋ひつつ もあらむ
(巻 四・ 679。
中臣女郎 )
額田王や坂上郎女や中臣女郎 のよ うに、恋する自己を自由 に歌 いあげる女
性歌 は古今 では影をひそめて しまうのである。恋する主体、その役割を男性
に特化することは、古今集にはじまると言って よい。男性 に とって普通 に用
い られ る 「ことば」が、女性 にはそ うであ り得ないこ と、 この ような 「こと
ば」の型における男女の棲み分 けの実態は、次に見 る「飽 かずを核 とす る語」
では、いつそう顕著 となる。
3.4
『飽かずJ思 う
「飽 かずを核 とする語Jに は、 あかず 6。 あかず して 2。 あかで 2。 あか
ぬ 4と 計
14例 があるが、男性 が “飽 きない"と 詠む内容 は、多岐 にわたる。
一″ ′ 一
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
よそにのみあはれ とぞ見 し梅 の花あかぬ色香 は折 りてな りけ り
(春 上 。37・ 素性 )
鶴亀 もち とせののちは知 らな くにあかぬ心にまかせ果ててむ
(賀 。355。 在原滋春 )
逢坂 の関 しまさしきものならばあかずわか るる君を とどめよ
(離 別 。374・ 難波万雄 )
むすぶ手の しづ くににごる山の井のあかで も人にわかれぬるかな
(離 別 。404・ 貫之)
春霞 たなび く山のさくら花見れ どもあかぬ君にもあるかな
(恋 四・684・
友則)
恋人 (女 性)を 飽 きな く思 うとい う歌だけでな く、季節の景物 をい とお し
み、主家の齢が いつ まで も続かん ことを願 い、旅立つ人 との別れを惜 じむ。
対象への、尽 きることない愛着 の念 をあらわす このことば、それが 「あかず」
の意味である訳だが、しか し、この言葉 は男性 に限 られた用語 となっている。
三代集で 53の 用例があるが、その中で、女性 の歌 は、わずか 2首 を数 える
のみにすぎない。 うち l首 を挙げてみよう。
あ りしだに憂 か りしものをあかず とていづ こに添 ふ るつ らさなるらん
(後 撰 。恋五 。952。 中務、詞書 「左大臣につかは しける」
)
中務 が藤原実頼 に贈 った歌であ り、歌意 は 「今 まで もつ らいこ とで したの
に、それで もまだあなたは満足 いかず、 これ以上、つれない仕打ちをどこに
加えるとお しゃるので しよう」 とな り、実際 は 「あかず」の直接の主語は、
相手 の男性 と解釈 され る。対象を飽 きな く思 う主体 に立つ「ことば」の型 を、
女 は通常では取 り得ない。 こ うした 「飽かず」思 うことばの男性 への偏向ぶ
りの対局 にある言葉が、 nグ ラム集合演算法で得た女性特有表現 に見 いだせ
る。次の 「あかれやはせぬ」である。
'
千葉大学
人文研究
第29号
桜花春 くははれ る年だに も人の心にあかれやはせぬ
61・
(古 今・春上 。
伊勢)
「飽かれやはせぬJ― 「十分 に満足 され ようかJと い う受 け身型 を とる表
現がそれであ り、これには反対に男性の用例がない。出現頻度 1の 語旬だが、
女性の 「ことば」 の型を知 る上で、有効な事例である。伊勢 の 当該歌は、恋
歌ではな く春 の歌で、桜を擬人化 した季節詠だが、彼女 は「(自 分が)飽 くこ
とがあ ろうか」ではな く、「花が」「人の心に」、飽かれ ることがあろうか、と
受け身型の表現をあえて とってい くので ある。人であれ、花・ 月な どの景物
であれ、対象を飽 きな くい とお しむ とい う発想 とことばは、男性の専 らにす
る領域 としてあったことになろう。社会 。生活において、対象 に働 きかける
(な い しは詐 されない)女 性 と
「
い う、両者の社会的役割の別が ことば」の型を規定 してた こと、 しか もそ
の規定 は、当時の言語意識にかな り厳密 に浸透 していたことを、 これ らの事
能動性 を属性 とする男性 と、それを持たない
例は示 していよ う。
ところで、こうした男性の領域に属することばを、女性が例外的に用いる
0、
場合がある。女性が男性の立場で歌を詠む例 としては、後藤祥子によって●
屏風歌・歌合歌や百首歌という題詠の場が指摘されているが、ここでもう一
つ注 目した いケースがある。女性同士の贈答である。「あかず」をよんだ女性
歌で、古今集の残 る一例を挙げてみよう。
女 ともだち と物語 して、別れて後 に、遣 は じける
あかざ りし袖 のなかにや入 りにけむわが魂のなき心地する
992・ 陸卿
下。
“
女友達 と尽 きない会話に花を咲かせて別れた、その名残惜 しさを、恋歌仕
立てに したものである。実 は、 この女房同士の贈答 とい う事例が、女性が男
性特有表現を用 い るケースを見て い くと、日立って認め られ るのである。前
項で述 べ た 「恋 しい 。恋する」で も、後撰集の女性 7例 の中の 1例 とは、次
の贈答であった。
一条が もとに 「い となん恋 しき」 と言ひにや りたれば、鬼の形 を書 きてや
-2コ イ ー
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
る とて
恋 しくは影をだに見てな くさめよわが うち とけて しのぶ顔 な リ
ー条
返し
影見ればい とど心ぞまどはるる近か らぬ気の うときな りけ り
伊勢
。
(後 撰 恋五、9o9。 910の 贈答)
伊勢 と一条 とい う女房 どうしの贈答だが、 この擬似恋愛風のや りとりにお
いて、伊勢 は、「ことばJの 型にお いて、徹底 して男役 に立っている。一条 に
送った手紙文にあった らしい 「い となん恋 しき」 の 「恋 しき」 もそうであれ
ば、「い とど心ぞまどはるる」の 「惑ふ」も、先 に「「まどふ」を核 とす る語 」
として一括掲出 したように、古今 での男性特有表現であ り、かつ後撰集で も
女性の用例は伊勢に しかない。古今・陸奥 の「あかざ りし」の歌 も同様だが、
親密で特別な友情のあらわす時、彼女たちは男性 に対 して発することのない
「ことば」を、女 どうしでは取 り交わす。それはまるで暗黙の了解 のよ うで も
ある。そして、そのような贈答 において、性差を反映 した 「ことば」の型が、
みごとに活用 されて い るのである。 当然 これは、男性 どうしの贈答 に も言え
ることで、従来 か ら言及 され ることの多 い、惟喬親王 と在原業平、藤原兼輔
と紀貫之など、主従の連帯や男性 の友情 の表現について も、逆に女性の 「こ
とば」 の型の反映があるか どうか、検証す ることも出来 るだろう。なお、女
性が男性領域の 「ことば」をよむ事例 には、他 に葬送・ 哀傷歌が多 いなどい
くつか場 の限定があること、また、そうした「ことば」を用 い る女性 として、
伊勢・ 馬内侍 。和泉式部など特定の女流歌人が浮上することなど、新たに論
ずべ き点が多いので、これについては、別稿にまとめたい。
さて、「飽 かず」 の表現 の問題 には、 もう一 つ、見落 とせ ない点がある。
そうした男性的観点で把握 され る対象が、恋人・ 友人 とい う “
人間"だ けで
「
な く、広 く四季の景物 に及んで い ることである。 あかず」が男性的観点を属
性 とす る語であるか らこそ、それによって捉 えられた景物、 た とえば素性 が
「梅 の花あかぬ色香は折 りてな りけ り」と詠む時の「
梅の花」は、“
手折 られ、
愛玩 され る女"と い うような、限 りな く女性イメー ジの付与 された もの となっ
て くるのである。また、「あかれやはせぬ」 と、伊勢が桜花 を詠む とき、桜花
一″
5-
千葉大学 人文研究 第29号
は飽 かれ るか もしれない存在 =女 性性を湛えるもの として立ち現れ ることに
なろう。それは伊勢 自身の 「女性」 とも重なって、 いっそう複雑 に 自然 と人
事 の一体化 が果たされ ることになる。古今的自然の本質 として指摘 されて き
た、 この、景物や風景の人事性について も、性差を反映 した 「ことば」 の型
とい う観点を構 える時、新たな側面か ら、有効な分析 が可能 となるのではな
いだ ろうか。
素性 のよむ 「梅 の花」 も、 3.2の 一 覧 【
景物 。物象】 に示 したように、
男性特有の、用例数 の多 い語旬 として抽出され る語句であった。景物や物象
表現 に、性差を反映 した 「ことば」 はどうかかわるのか。すでに紙幅 も尽 き
てい るが、最後にその点について、簡単な見通 しを述 べ てお く。
3.5
景物・ 物象の問題 ―喩の女性性 と男性性 ―
まず 【
景物 。物象】項で、高 い数値で挙がつて くる語旬に、一つ共通する
傾向 に、人事性 を付与 された景物 が多い とい う事がある。特 に、「植物」項 目
では、女郎花 16。 梅 の花 11、 また用例数は 4だ が藤袴など、男性 の視点で捉
えた女性のイメー ジの付与 された景物が大 きな割合を しめて い る。そ して、
女郎花 も梅の花 も藤袴 も、すべ て万葉にも既 出の景物ではあるが、特に古今
集 において、女郎花はその名称の連想か ら、梅の花は芳香 へ の着 目か ら、藤
袴 は芳香 と 「袴」 とい う語の連想か ら、色濃 い人事性 を持って よまれ るよう
にな り、以後 の類型 となったことが、個別 に指摘 されて い る点が注 目され よ
う。 よ く知 られた事柄ではあるが、女郎花 。藤袴 について も、確認のために
例歌を挙げてお く。
女郎花
誰が秋にあ らぬ ものゆへ女郎花なぞ色にいでてまだきうつ ろふ
(秋 上・232・
貫之)
花 にあかでなに帰 るらむ女郎花おほかる野辺に寝なましものを
(秋 上 。238。 貞文)
-2ゴ ∂一
nグ ラム統計処理を用 いた文字列分析 による日本古典文学の研究
藤袴
宿 りせ し人のかたみか藤袴わす られがたき香 ににほひつつ
240・ 貫a
上。
のに
ぬ し知 らぬ香 こそにほへれ秋 の野 に誰がぬぎかけし藤袴ぞも
。
(秋 上 2410素 性 )
万葉 の女郎花 は、「高円の宮 の裾廻 の野づかさに今 さけるらむをみなへ し
はも」(巻 二十 。4316。 大伴家持 )な ど秋の景物 として詠んだ ものが大半で、
唯一女性 を比喩 したか と思われ る 「我が里 に今咲 く花 のをみなへ し堪 へ ぬ心
になほ恋ひにけ り」 (巻 十 。2279番 。作者未詳)に も、古今 。女郎花の、例
認 め られない。まして藤袴 は、
歌 のよ うな多情 で誘惑的な女性のイメージは、
万葉では、秋 の七草 の歌 「萩 の花尾花葛花 なで しこの花をみなへ しまた藤袴
あさがほの花」 (巻 八 。1538番・ 山上憶良)の 用例 しかないのに対 して、古
今 では、名称 の袴 を衣服 としての袴 と、その花の芳香を人の移 り香 と関連 づ
けて詠んでお り、美 しい女性の脱 ぎ置 いた藤袴 にほのかに恋情 をかき立て ら
れ るとい う、官能性 を内包 した もの となって い る。 これ らでの人事性 とは、
換言すれ ば、芳香 に心惹かれ、姿かたちを鑑賞 し楽 しむ とい う、男性 か らみ
た女性性 の、景物 へ の投影 に他ならない。従来 の研究は、 これ らを、擬人・
実 はそれ らの大半が、
比喩 というレ トリックの問題 として扱つてきたのだが、
男性 の領域 に属す ることばで、 いわば男性 の捉 えた女性性 を属性 とすること
を、あらためて問題提起 しておきた い。ちなみ に、古今集、秋上後半部では、
「女郎花」が 13首 の歌群 を形成す るが、この13首 は貫之 。用恒・ 忠琴・遍昭・
敏行・定方 ら、達者な男性歌人達 の詠歌 ばか りが一堂に会 して圧巻である。
1)。
そ こで は、遍昭 の 「名 にめでて折れ るばか りぞ女郎花 われ おちに き と人 にか
た るな」 (226番 )に は じま り、「女郎花秋 の野風 に うちなび き心 ひ とつ を誰
に よす らむ」 (230番 ・ 時平 )と 浮気 な風情 を問 われ、「一 人 のみ なが む るよ
りは女 郎 花 わが住 む宿 に植 えて見 ま しを」 (236番 ・ 忠琴 )「 女郎 花 う しろめ
た くも見 ゆ るか な荒れ た る宿 に一人 たてれ ばJ(237番 ・兼 覧 王 )と 、様 々 に
男性 の視線 を受 け、 そ して 「秋 の野 に宿 りはす べ しをみ なへ し名 をむつ ま し
み旅 な らな くに」 (228番 ・ 敏行 )「 花 にあかで な に帰 る らむ女郎 花 おほか る
-217-
千葉大学
人文研究
第29号
野辺 に寝なましものを」 ((238番 ・ 素性 )と 一夜 の宿 りを希求され る、 いわ
:ゴ
“
女性"の 代替 としてある。 この喩、配列、そ して配列の うちに生起す る
風景を成 り立たせて い るのは、あ くまで男性の主観 に立った女性性、その景
物 へ の付与であった。そして、 この喩 は、詠み手 もまた男性主導で、後代 に
到 るまで、女郎花 にせ よ、藤袴 にせ よ、女性 は題詠の場以外で これ らを詠む
ことはほ とん どいのであった 。υ。
一方では、検討の範囲を広 げて行 くと、男性が男性を比喩 した景物・ 物象
語 も見 いだされて くる。 4例 の 「きりぎ りす」や 2例 の 「夏虫」な どがそれ
である。「きりぎ りす」 は
きりぎ りす いた くな鳴きそ秋の夜の長 き思ひは我ぞまされ る
(秋 上 。197・ 藤原忠房 )
もろともになきととどめよき りぎ りす秋 の別れ は惜 しくやはあらぬ
(離 別・385。
秋思や離別 に、物思 い、泣 く我
藤原兼茂 )
「夏
(男 性)が 仮託 され る物象であ り、また、
虫」は、
夏虫をなにかいひけむ心か ら我 も思ひにもえぬべ らな り (恋 二・600。 射恒)
な ど、恋に破滅する自己 (男 性)の 比喩 としてある。次の『能因歌枕』 の
一文 は、この言語感覚 が平安後期 まで浸透 していたこ とを、
如実 に窺わせ よう。
夏虫
(ナ
ツムシ)と は 女によりて身をいたづ らになす物 にた とふ
(『
能因歌枕』)
ここでは歌語 「夏虫」を、「女 によ りて身をいたづ らになす」 ことのた と
え、すなわち男が女によって身を破滅 させ る意、 とい う性別 を限定 した認識
を示 して い る。能因自身、夏虫を詠んだ歌には 「夏虫 はうらや ましくや思ふ
らんおのが思ひにもえぬ蛍を」(能 因法師集 。164)が 一 首あ り、彼 は夏虫を
一 ′ゴθ ―
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
飛蛾 と理解 して いた こ とにな るが、 い わば 「飛 んで火 に入 る夏 の虫 」 は、 平
安 時代 の理 解 として は、女で はあ り得 ず、男 の恋 の姿、 それ も男が喩 え る男
の恋 の姿 に限定 され るので あった。これ らの語 もまた、
平安期全体 を通 じて、
女性 の作例 が極 めて乏 しい。八代集 に 「き りぎ りす」 を詠 んだ女性 の歌 は無
く、「夏虫」 は、「夏虫の しるじる迷ふおもひをば こ りぬかな しとたれかみざ
らん」(後 撰 。968)一 あなたは夏虫が、知 っていなが ら火のそばを飛び回 る
ようなもの 一 と、相手 の男性 を 「夏虫」 に喩えて言 い放った伊勢 の歌 と、和
泉式部 の百首歌での一首があるのみである (後 拾遺 。820)● 0。 伊勢や和泉
式部は多作の歌人だが、彼女たちの家集 において も、 この 2首 以外 の用例 は
ない。
古今集 で成立 した、喩 という 「ことば」 の型が、 よみ手の性 を後代 まで限
定 して い くほど強固に、男性性 。女性性を一規範 として内在 させてい ること
は、従来 の研究 では全 く顧慮 されてこなかった。上記の例 に顕著 であるよう
に、男性性 。女性性の型分けは、男性 の視点でなされたものが大半だが、女
性特有 の用語 には、女性 が 自らを比喩 し、あるいは男性 を比喩 したもの も散
見する。出現頻度 2に 過 ぎないことば 「夏虫」 にも、上記 のように有意な裏
付けが得 られるのであ り、今回得 た男女の差のデー タは出現頻度の低 い もの
に到 るまで有意性が高 いことが予測 される。 ここではその導入部を見 たに過
ぎないが、網羅抽出された 「ことば」 を、総合的に検証す る時、喩の成 り立
ちや、更 には喩 の背後 にある、古今集 の「ことば」が何 を男性性の属性 とし、
何を女性性 の属性 としたのか、その認知 の枠組み に追 ることが出来 ると考 え
る。
4
緒語
以上 の検証を通 じて、古今集 の「ことばJの 型 には、男女 の領域の別があつ
たことをあきらかに し、平安時代 において、社会生活 のあ り方が ことばの男
女差 に反映 して い く様子や、男性 に とっての 「恋」が、 どのような型で認識
されて いたか、 また男性が、女性的なるもの、あるいは男性的なるものをど
のよ うに文学 のことばの型に定着 させて いつたか、などを中心 に、その実態
一′ゴθ―
千葉大学
人文研究
第29号
の一端 を見た。それは、広 く日本文化において、女性 らしさ 。男性 らしさな
どとい う認識や型、 またその認識 をあらわす ことばの形成 と展開 に、古今集
をはじめ とす る王朝和歌が大 きな役割を果た したことを予想 させ る。男女差
のことばへ の反映や、山河・草木を男性 。女性 として提 える素朴な自然理解
は、発生的 には古 くか らあるに しても、勅撰和歌集 の 「ことばJに おいて、
動作性・ 感情性 の ことばや、自然界の現象 。景物などの全般 にわたって、事
細 かに男性性 。女性性を型分 け、属性を規定 し付与 して い く、その徹底がな
された意味において、 またそれが以後の表現に とっての規範 となった点にお
いて、古今的表現 とは、性差 を反映 した 「ことばの制度」を自覚的 に内在 さ
せ るようにしたものであつた と捉えなおす事 も出来 るのではないだろうか。
和歌 の 「ことば」 の型におけるジェンダーの確立を、そ こに認 めることも可
能だろう。 いつたい、生物学的性 としてのセ ックス とは別に、社会的 。文化
的役割 としての性差 =ジ ェンダーが、古代和歌に萌すのはいつか らなのだろ
うか。万葉論 において、 この興味深 い問題 を扱ったす ぐれた指摘が、佐佐木
幸綱 にある 124)。 佐佐木 は、東歌 を含む初期万葉の贈答歌は男女対等で、ジェ
「万
ンダー的な意味での性差は認め られない とし、それが現れはじめるのは、
葉集第二期、大伴坂上郎女あた りで はないか。」との見解 を示 してい る。佐佐
木 は 「(立 場)で うた う恋歌 の出現」 と「恋す る (わ れ)の 内部 に照明を当て
た歌の台頭」をそ こに看取す るのだが、では表現はどうだったか とい うと、
こうしたジェンダー を意識 した主体の登場 した時代にあって も、依然 として
女性の恋歌の表現 は古今集 に比べ て 自由なあ り方を保 っていた ことが 阿蘇瑞
枝 によって検証 されて い る 。9。 そうであるな らば、万葉第二期に、文芸世
界でのジェンダーが意識化 されて以降、その認識がやがて 「ことば」。表現 の
こまかなレベル までに及 ぶ機序 とな り、性差を反映 した 「ことばJの 型分 け
か一通 り完了するまで の過程 が、 まさに古今集成立までの間に果たされた こ
とになろう。それは、 どのように進行 したのだろうか。今回触れ ることの出
来なか った読人不知歌 の位相 を検討 して行 くことで、その過程にも、ある程
度見通 しが立て られ ると思われ る。今後は、今回抽出 した 「ことば」をも と
に、男性的な文体、景物 とジェンダー、女性歌人 にとっての男性の 「ことば」
の型の問題、物語和歌や屏風歌など虚構世界 の歌 の性差意識 の問題 な どを漸
-20θ ―
nグ ラム統計処理を用 いた文字列分析による日本古典文学の研究
次扱つて行 く予定だが、あわせて、古今集以外 にも対象を拡大 し、また万葉
も加 えて比較 して い くことで、古代和歌の新たな、そして様々な実態が見え
て くる可能性があると考える。
それに して も、論述 を通 して特 に実感 したのが、平安時代のことばにあら
われた男女差を現代の語感で捉えるのが いかに困難であるか、結果 として従
来 の研究 が いかにそれが もつ問題 を見落 として きたか とい う点である。古典
語 という過去の言語体系 に対 しては、研究者の内省だけでは予想以上に理解
の及ばない点 のあることを認 めねばなるまい。本稿で は、前半で、 nグ ラム
統計処理を用 いた文字列相互比較 とい う、全 く新 しい分析方法を、文学作品
の表現研究法 として提案 したが、 この手法が 内省を助け、時 にそれを超 える
手段 とな り得 ることは、 い くつかの結果 か らも明かであろう。特に nグ ラム
統計処理 にcOmmを 組み合 わせた nグ ラム集合演算法を用 い るな らば、今回
のよ うな分析 に限 らず、例 えば、貫之集 と蒻恒集 の共通文字列をすべ て 自動
的に取 り出す、古今集 と源氏物語の共通文字列をすべて自動的に取 り出す、
和泉式部集 と和泉式部 日記の共通文字列をすべて自動的に取 り出す、清輔集
と奥義抄の共通文字列をすべ て 自動的 に取 り出す、など、和歌・ 散文 を自由
に組み合わせて、
相互 に大量に比較研究する事が容易に実現で きる訳であ り、
文学研究 に、従来 と異なる成果をもた らす ことが期待で きるだろう。稿者 と
しては今後 この分析方法を、古典文学研究に応用することを進めていきたい
と思って い る。
*引 用 した和歌の本文・歌番号 は、勅撰集 は『新編国歌大観』、万葉集は小学
館新編 日本古典文学全集『万葉集』① ∼④ による。ただ し、和歌 の表記 は、
適宜漢字をあてるな ど改めた箇所 がある。
注
(1)長 瀬真理 「日本語―英語対照 「源氏物語Jの テキス ト・ データベース」東京大学大型計算機
センター、長瀬真理 「日本語―英語 「源氏物語」のテキス ト・ データベースの作成 に関する
-2′ ′―
千葉大学 人文研究 第29号
基礎的研究J(「 情報知識学会機関誌」創刊号、1990年
)
(2)和 歌文学関係で、オンラインで提供されているものを挙げてお く。国文学研究資料館の二十
一代集検索, 日本古典文学本文データベース
(実 験版)試 験公開 (1999年
現在の所、 2年 間の限定付きになっている)。 吉村誠『万葉集検索
学部 (URL=http://dtkWs01.ertc.edu・
4月 から。ただし
(試 作版)』
山口大学教育
yamaguchi― u.ac.jp/ kOkugo/ma_ser.html)、
仁美『平安時代私家集J(URL=http://member.nifty.ne.jp/sigeta/、
重田
詠歌年代順に再編
成 した私家集データ、遍昭・敏行・素性・興風・友則・伊勢・貫之他、寿永百首家集の注釈
や後葉・続詞花の作者索引などをのせる。ダウンロー ド可
)、
近藤みゆき『相模集データベー
ス』(URL=http://wwW.1.chiba u.ac.ip/∼ mkOndO,流 布本系相模集の KWIC索 引。文脈
付き単語検索可。 CD―
ROM版 は文部省科学研究費重点領域研究 「人文科学 とコンピュー
タJrじ んもんこんDATABASE“ vol.1(1998年 3月 )で 公刊。
)
またその他、古今集や竹取物語など代表的な作品のデータベースをフロッピー・ディスク
版で提供する、ビー・エス・ データが1993年 から勉誠社で開始されている。
(3)国 文学研究資料館データベース古典 コレクション『二十一代集 〔
正保版本〕CD― ROM」
(中 村康夫・立川美彦・杉田まゆ子監修、岩波書店 。1999年
応版本〕CD―
ROM』
7月 )、 同『源氏物語
(中 村康夫・立川美彦・ 田中夏陽子監修、岩波書店
ROM 角川古典大観 (角 川書店・1999年
(5)『 新編国歌大観』 CD― ROM版 (角 川書店・ 1996年 8月
(4)『 源氏物語』 CD―
(絵 入)〔 承
。1999年 7月 )
11月 )
)
(6)山 崎真由美、竹田正幸、福田智子、南里一郎 「和歌データベースか らの類似歌の自動抽出」
(情 報処理学会
「人文科学 とコンピュータ」研究報告、Vol.98、 No.97,1998年 )
(7)竹 田正幸、福田智子、南里一郎、山崎真由美 「和歌データベースにおける特徴パターンの発
見」 (『 情報処理学会論文誌』Vol.40、 No.3,1999年
3月
)
(8)後 藤祥子 「女流による男歌―式子内親王歌への一視点」 (初 出 関根慶子博士頌賀会編『平安
文学論集』風間書房・1992年 10月 、久富原玲編『和欧とは何か』有精堂・ 1996年 10月 に再録
)
(9)平 安文学で この論を継承発展するものに、久富原玲 「和歌 とは何か 。総論」 (注 (8)著 書
)、
小嶋菜温子 「恋歌 とジェンダーー
業平・Jヽ 町・遍昭J(F国 文学』特集「恋歌―古典世界の」学
燈社・1996年 10月 )な どがあり、また万葉の女歌論から同論に言及するものに、青木生子 「女
歌の意味するもの」(全 国大学国語国文学会編『文学・語学』155号 「講演特集」1997年 5月
)
などがある。
『源氏物語Jの
(10)山 口仲美『平安朝の言葉 と文体J(風 間書房・1998年 6月 )、 第一部・第二章 「
女性語J
(ll)形 態素解析を、計算機で自動化する試みは、残念ながら古典語に関してはまだ少ない。ただ
し現代語に関 しては、工学系で多 くの研究がなされている。特に同じnグ ラム統計処理を応
-222-
nグ ラム統計処理を用 いた文字列分析 による日本古典文学の研究
『人文
用 した新 しい研究 として、次の様 なものがある。「形態素構文解析」(内 元清貴・馬青、
「文字クラスモ
べ
1999年
4月
のす
て」
、勉誠出版
)、
M21「
特集 自然言語処理
学 と情報処理』
デルによる日本語単語分割」 (4ヽ 田裕樹、森信介、北研二、『 自然言語処理』Vol.6。
1999年 10月 、言語処理学会)。
No 7、
これ らの研究成果 の応用によつて、古典語の形態素解析の 自動
化 にも可能性が開けるもの と考えられ る。
「大規模 日本語テキス トの nグ ラム統計 の作 り方 と語旬の自動抽出」(F自 然
長尾員・森信介、
言語処理』96-1、 1993)
Claude E.Shannon & Warren Weaver,The Mathelnatical
Theory Of Conlllunication,The
University Of lllinois Press,1949■ 「
なお、nグ ラム統計処理 と長尾・森 プログラムの古典分析への応用については、近藤泰弘「n
グラム統計か ら見た古典語テクス ト」 (『 第四回
集』 (平 成 H年 10月
国文学研究資料館)、
シンポジウム
コンピュー タ国文学 講演
近藤みゆき 「平安時代和歌資料 における特殊語彙
抽出についての計量的研究 と利用 ツールの公開」(r特 定領域研究「人文科学 とコンピュー タJ
1998年 度研究成果報告書』及川昭文編、 1993年 3月
今回左注 より■0・
fOと
)も 参照 されたい。
して取 り扱ったものを歌番号で一覧 してお く。m=7・
125。 135。
211・ 222・ 283・ 334・ 409・ 621・ 671・ 702・ 720。 866・ 8
93・ 894・ 895・ 899。 907・ 974・ 1108番 、fO=375・ 412・ 664・
703・ 959,973・ 994番 。なお、デー タ整理にあたつては杉山美都子
文学部 日本文化学科
(千 葉大学
平成 10年 度卒業生)の 協力を得 た。
文学作品等を nグ ラム統計で計量する場合、 nを 1グ ラムずつ増加 させてい くと、ある段階
ですべての文字列の出現頻度が 1と なる段階を迎える。今回の古今集を例 に とれば、男性で
は13グ ラム、女性では19グ ラム、読人不知では25グ ラムで出現頻度が 1と なった。 このよう
にすべての文字列の出現頻度が 1と なると、それ以降は、た とえば男性 13グ ラム 「ををみな
へ しうしろめた くも」→ 14グ ラム 「ををみなへ しうしろめた くもみ」→ 15グ ラム 「ををみな
へ しうしろめた くもみゆJと 、実態 としては、既に出現 して い る各文字列が 1字 (1グ ラム)
ずつ増加 して い くにすぎな くなるのである。 このよ うな文字列出現頻度がすべて 1に なる段
階を、稿者 は仮 に 「nグ ラムの飽和」 と称 してい る。飽和値 は、対象 となる作品によって異
なってお り、作品の文体などを考える上で も目安になると考えられる。 この点に関 しては、
近藤みゆき注 (14)で 言及 してい る。
今回、このよ うな範囲 とした理 由を補足 してお く。① は、「2.3計 量化 され る様々な表現」
で述べ たことと関連する。すなわち、1グ ラムでは大半が 1文 字を追 うに過 ぎず、 2グ ラム
では、男性特有文字列は1000以 上にものぼるのだが、元来基礎的語彙が多 い中での差分 とな
ると 「あげ 。あた 。あづ……」 と意味のない文字列が大半 となって しまい、 これ らを範囲に
-223-
千葉大学
人文研究
第29号
合めても、今回の場合はあまり意義を認められない。一方、 8グ ラム以上になると、類歌や
特定歌人の歌風、歌人同士の影響関係 として扱 うべ き内容のものが多 くを占めるようにな り、
論ずべ き問題の質が異なつて くる。性差を反映 した 「ことば」を把握する導入論 としては、
標準的な歌語や特徴的連語の集中する 3∼ 7グ ラムの範囲を挙げてみることが、 まずは有効
と判断 した。② は、女性歌特有の 「ことばJは 今回は扱わない とい うことに もなるのだが、
これは③ とも関連する。今回の古今集では、男・ 女・読人不知の歌数 は、男性歌人 -595首 、
女性歌人 -87首 、読人不知 -429首 となってお り、女性歌が 100首 を割 り込んでお り、全体量
の少なさか ら、その特有の文字列が、ほとん どが出現頻度 1に なつて しまうのである。た と
えば、次に挙げるのが、女性特有文字列のn=5の 「あ」で始 まる文字列の一部である。
1あ かれやは、1あ きのもみ、1あ きのよも、 1あ けぬるも、1あ さぢには、 1あ さつ ゆの、
1あ さなけに、 1あ さなわが、 1あ したゆ く、 1あ しもやす、1あ ぢきな し、 1あ はむつき
実は、 これ ら 1度 しか現れない表現で も、万葉 との比較や次世代での変遷 もあわせて丹念
に検討すると、女性の「ことば」の型の固有性 を考察する手がか りになるものは少な くない。
これは男性特有の表現 において も同様で、後述のように、た とえ出現頻度 lや 2の 「ことば」
で も、差分 として残ったものの中には、重要な意義をもつ例 も散見する。一つ一つの 「こと
ばJの 重みにおいて、勅撰和歌集の和歌 とい う厳選 された作品のそれは、散文 と同列ではな
いこ とが改めて実感 されるのだが、総合的な統計結果に拠 った最初の報告である本稿 では、
差分 として抽出され、かつ出現頻度の高いものに、まず注 目する方針 を取 ることとした。
(18)な お、今回の男性の 「ことば」の うち、女性 とは重ならず読人不知 とのみ共通 して用い られ
てい る「ことば」(2.4図 D部 )は 、今回の統計 に含めてい る。「古今和歌集男性特有表現一 覧J
では、男性・ 読人不知それぞれでの用例数を表示 したので、適宜参照願 いたい。
(19)『 八代集総索引』 (ひ めまつの会編 ・大学堂書店・ 1986年 12月
(20)後 藤祥子注
)
(8)論 文
(21)古 今集の 「女郎花」歌は全 19首 。 うち 3首 が読人不知歌だが、同 3首 は巻十九雑林に配列さ
れてお り、秋上のそれを構成するのは、すべて男性歌 となって い る。
(22)平 安末 までの用例を新編国歌大観 CD―
ROMで 検索・通覧すると、女性が女郎花や藤袴を
よんだ例 は限 られてい る。特 に女郎花 は、平安期全般 を通 じて コンス タン トに詠 まれ全体量
が多いに も関わ らず、女性の詠作は驚 くほど少数で、かつ場が限定 されている。伊勢・中務
では、屏風歌か、でなければ男性が「女郎花」をよんでよこした歌への返歌。次世代の女流、
小大君や馬内侍の家集での用例 も、内容 に当たると相手の男性か らの歌が記 しとどめられて
いるに過 ぎない。和泉式部集でも、百首歌や連作での用例か、花山院歌合の 「女郎花」題の
作例 がい くつか ある程度だが、ただ、やや異色な用例 として、相模 とともに前栽の草花を詠
んだ 「前栽のおもしろきを見て、いひあつめたるJの 連作がある。女性 どうしが庭の草花、
-224-
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
そして女郎花を楽 しんだ例 として、他に、大斎院前御集296∼ 300番 の唱和がある。 こうした
女性 どうしの風流 という場合を除 くと、進んで女郎花を詠む女性は無 く、贈答歌においてか
なり奔放に様々な歌ことばを使用する相模などでも、家集での用例は、小一条院歌合 「女郎
花J題 一首 と、初事百首中一首の 2例 にとどまっている。男性本位のセクシャルな視線を内
在させる歌語 として、女性には厭われたと言えようか。 ところで、こうした女流歌人全般の
用例の現実に比べて、特異なのが『源氏物語』である。源氏では、無論男性側の用例は多い
のだが、女が、贈答に応えたものではな く、あえて自らを喩えて男に詠みかけた例がある。
野分巻の玉菫
(自
分を喩える)、 夕霧巻の一条御息所
(娘 を女郎花に喩える)で ある。前者は
源氏の懸想をかわそうとする玉菫の歌、後者は娘の運命を案 じ、病を押 して母御息所が夕霧
に送った手紙の歌である。特殊な状況下、その特殊性を象徴するかのように、性差 と 「こと
ばJの 古今的秩序を破つた詠歌がなされる訳である。
『源氏物語』では、性差 とことばの古今
的な秩序に反する歌が、他にも散見 し、その点でも、他の物語の和歌 とは異なっている。虚
構の世界で男性の立場 。女性の立場を詠み分ける物語和歌に関 しては、性差を反映 した 「こ
とばJの 型の観点からも、今後論ずべ き点が多いと考える。なお『伊勢集』の女郎花につい
ては、河添房江 「
『伊勢集Jの 秋草の歌」 (『 和歌文学大系184ヽ 町集/業 平集/遍 昭集/素 性
集/伊 勢集/猿 丸集』1998年 10月 、明治書院、月報 7)が ある。
(23)性 別からみた夏虫の用例の中で、大きく揺れがあるのが後撰集・ 夏部の 「つつめども隠れぬ
物 は夏虫の身よりあまれる思ひなりけり」(209・ 読人不知)で ある。同歌、詞書に、「桂のみ
この 「ほたるをとらへてJと 言い侍ければ、わらはのかざみの袖につつみて」 とあり、蛍を
夏虫と詠んだ例なのだが、古来作者については、同歌が
r大 和物語』四十段では、桂み こ
(宇
多天皇皇女学子内親王)に 仕える女童が、内親王のもとに通 う敦慶親王に思いをかけて詠ん
だ歌 として伝えられることともあって、この 「童」を男性 とする説、女性 とする説の両説が
あリー定 しない。近年の注では、片桐洋一
岩波書店)は 男性説を、工藤重矩
(新
日本古典文学大系『後撰和歌集』1990年 4月 、
(和 泉古典叢書『後撰和歌集』1992年
9月 、和泉書院)は
女性説を立てているが、解釈の揺れを提示 した元祖は『古来風林抄Jで ある。
『古来風林抄』
では、「また、一説に」として『大和物語Jと 同じ女童の恋の話を載せるが、後撰集歌の解釈
としては、作者について 「うなゐ童男なり」 と注記し、詞書本文まで、女童の衣裳 「かざみ」
ではなく、男性の衣裳 「狩衣」 とするなど、これをあくまで男性歌 として扱っている。夏虫
の喩は男性 という、俊成の、歌 ことばをめぐる性差感覚の反映 といえるかもしれない。
(24)佐 佐木幸綱 「万葉集
(女 歌)考 」 (『 上代文学』76号 、 1996年
4月
)
(25)阿 蘇瑞枝 「万葉集の女歌―大伴坂上郎女 とその前後―」 (『 上代文学』76号 、1996年 4月 )
千葉大学
人文研究
第29号
謝辞
本研究 にあた っては、長尾員先生 (京 都大学総長 )、 森信介氏
(日
本 アイ・
ビー・ エム東京基礎研究所 )の ご好意 によ り、両氏の開発 になる nグ ラム統
計を高速 に算出するソフ トウェアを利用 させて いただ くことができた。また、
特 に長尾先生か らは、古典文学研究 に nグ ラム統計を用 い ることについて多
大な ご示唆をいただいた。あわせて、本稿 の一部 は、国文学研究資料館「デー
タベース研究会 Jで の研究報告 (1999年 7月 30日 )を もととしてお り、その
際、中村康夫先 生 (デ ー タベース室長 )は じめ、諸先生方か ら貴重なご意見
をいただいた。 ここに記 して、深 く感謝申 し上げます。
なお、本研究 は、平成 9。 10年 度、文部省科学研究費補助金 。重点領域 (10
年度 は特定領域研究に変更)「 人文科学 とコンピュー タ」デー タベース・公募
班 。課題名 「平安時代和歌資料 にお ける特殊語彙抽出についての計量的研究
と利用 ツールの公 開」 の補助を受 けたものである。
(補 注 )
脱稿か ら校正 までの間に、nグ ラムを含む、言語の確率的モデルについての概論である次の文
献が刊行 された。
北 研 二『確率的言語 モデル」 (東 京大学出版会・ 1999年 H月 )
今後 の方向性 を示す もの として注 目されるものである。
-226-
nグ ラム統計処理を用いた文字列分析による日本音典文学の研究
古今和歌集男性特有表現一覧
1
男性
女性
人知
訊不
文字列 (語 彙 )
文字列 (語 彙 )
男性
をみなへ し
3
おもほえ
7
こころを
8
かみなづ き
7
しらゆ き
1
くもあ るか
7
みだれ
6
しなければ
7
もみぢば
9
ぞち りける
7
ながれ
0
たつたが は
まさり
むか し
6
よ しの
うめのはな
7
こひ しき
女性
0
読人
不価
1
0
l
0
0
ちはやぶ る
7
みや ま
7
0
あかず
6
0
あ るか な
6
いはむ
6
あきのの
4
い ろ まさ り
6
0
か りける
0
お もへ ども
6
0
な らな くに
2
か らに
0
しらくも
l
こひしか り
0
とお もひ
2
こひ しか る
0
I
4
しらたま
0
1
か りけり
3
しらや ま
0
し らつ ゆ
4
たなばた
0
ちとせ
0
つれなき
0
もあるか
9
たれか
1
に しき
2
あ しひきの
7
なければ
0
あしひきのやま
7
なみだが は
0
あづ さゆみ
7
にけるかな
0
あまのかは
7
はるのや ま
0
よ しののや ま
0
あ りけれ
― 多 77-
l
l
5
千葉大学 人文研究 第29号
男性
女性
あふ こと
人知
読不
文字列 (語 彙)
7
あらた ま
5
1
い ろに いで
5
3
つつせ み
5
お とはや ま
5
おもふ こころ
5
か けて
5
かたみ
5
かよひぢ
女性
読人
不知
や どの
0
4
や まかぜ
0
0
や またかみ
0
2
や まの さくら
0
1
文字列 (語 彙)
男性
やまのは
0
よろづ
2
よろづ よ
2
0
わか な
3
5
0
わすれ ぐさ
2
かれぬ
5
0
わた らむ
2
きのふ
5
0
あかぬ
4
l
くもある
0
あきぎり
4
3
くもゐ
0
あ きはぎ
4
5
0
あだな
4
2
じるひ と
0
あ らし
4
l
たまのを
0
Vr'?i,
4
ちはやぶるかみ
0
0
いづ ら
4
なきひ と
0
4
おもひき
4
なび く
0
おもほゆ
4
おもほゆるかな
4
がて に
4
きりぎりす
4
0
こころぞ
5
にこそありけれ
0
3
にほて
,
はなぞちりける
0
はるのや まベ
l
0
】
くれて
4
0
ひ とつ
4
け 」ヽは
4
0
ふ くかぜ
6
こひ は
4
0
0
こひ も
4
0
1
こふ る
0
ころかな
0
まさりける
5
まにまに
みだれて
5
5
108
-228-
1
nグ ラム統計処理を用 いた文字列分析による日本古典文学の研究
男性
女性
文字列 (語 彙)
男性
女性
さける
4
わびびと
0
さとは
4
あ きの この は
0
さむみ
4
0
あはで
0
しげ き
4
3
あはむ
0
すみのえ
4
2
あふ よ
0
そ│ま ち
4
1
あふ よし
0
そめけむ
4
2
あへぬ
たなび く
4
l
あまのかはら
ちか く
゛
ち くさ
4
4
2
あらたまのとし
つひに
4
2
あ
つ もり
4
l
つ もれ
4
1
ところ
人如
読不
(語 彙)
人知
読不
文字列
l
l
0
あやまたれける
0
りあけ
あれ ど
4
いた く
1
4
い まこむ と
0
なか りせ ば
4
い まぞ
2
ぬべ し
4
0
い まも
3
はかな く
4
0
はつ しも
4
0
うちつけに
は るか
4
0
お とづれ
l
は る さめ
0
おほか た
2
ふ ぢばか ま
0
おほかた は
3
l
まどひ
0
おもはぬ
3
5
み えな
0
おもふこころは
3
l
み えぬ
0
お もふ ひ と
3
うちつけ
0
3
0
み えね
0
かぎりと
3
むか しの
l
か くす らむ
3
や まの もみぢ
0
かぜふ く
3
わ けて
3
か とぞみる
3
―″
9-
0
l
人文研 究
千葉大 学
か とのみ
男性
女性
人 知
読 不
文字列 (語 彙)
第29号
文字列 信吾彙)
男性
女性
読人
不知
0
さびし
0
か へ るや ま
0
さへぞ
0
1
か よふ
0
さへ や
0
1
かりがね
2
さみだれ
0
か りけれ
l
しらね ど
0
3
か りそめ
か るべ き
3
しらね ども
0
1
しられぬ
0
き くのはな
3
0
そのかみ
0
きつつ
3
0
そめ し
0
きみをのみ
3
0
たちかへ り
0
くものい
0
たちわかれ
0
くるしき
3
たむ く
0
け 口ヽ│こ
0
たむ け
0
ここら
1
ち らす
0
こころか ら
0
ち りぬ る
0
こそわたれ
l
208 つきかげ
0
ごとく
l
つ もれ る
0
ことな らば
1
て るひ
0
ごとも
0
とこたへ よ
0
l
としごと
0
こひもするかな
3
としごとに
0
こひやわたらむ
l
とてか
0
こひわた る
l
215 なが らへて
0
こほ り
3
なか りけ り
0
こひしきものを
3
こよひ
4
217 なきこそ
0
3
なきこそわたれ
0
さきにけ り
0
な くこゑ
0
さくらばなちる
0
な くなる
0
さか り
3
-23θ ―
1
1
1
0
0
0
l
1
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
女性
文字列 (語 彙)
男性
女性
人知
読不
男性
人知
読不
文字列 (語 彙)
0
みえし
0
みえず
3
0
2
み どり
3
0
I
224 ならで
l
252 みね に
3
0
I
225 な りな
2
253 みのう
3
226 なりにけり
l
めづ らし
3
なれ ど
1
255 めもはる
3
に しられぬ
0
ものをおもふ
3
ばか りぞ
0
や まが くれ
3
はつ しもの
0
やまだ
3
はなすすきほに
0
や まぢ
3
な くね
222 なにはの
なみだな り
232 はなのかげ
0
260 やまぶ き
0
l
ゆきふれば
3
はる く詢叫ぎ
0
ゆ くらむ
3
は るの の
0
よ しのが は
3
236 は るの ひ
0
よそにのみ
3
ひ ととせ
l
よをさむみ
3
ふか き
4
わが こころ
3
ふか くさ
0
わがご と
3
ふ るなみだ
1
わが こひは
3
ほととぎすな く
0
0
わび しき
3
ほ │こ い ¬
C‐ で
0
1
われ さヘ
3
を しむ
3
272 あか し
2
まさりけ り
245
まされ る
246
まじり
まだき
l
あかず して
2
1
あかで
2
2
あきくれど
2
あ きのや ま
2
まよふ
-23■ ―
1
0
3
はるがすみたち
ほ 6)か
0
1
1
1
1
千葉大学
人文研究
第29号
人知
読不
読人
不知
文字列 (語 彙)
男性
277 あきはかぎり
2
0
いづ ち
2
0
いづちゆくらむ
0
いづ れ
0
0
308 いで じ
0
l
あきはかぎりと
女性
文字列 (語 彙)
あきはぎのはな
2
あけぬ とて
2
あさぎり
2
あさま
2
あ さみ
2
0
あだなる
2
0
いふ な り
あだなるもの
2
0
いろにはいで じ
0
】
2
l
0
いで ぬ
2
いに しヘ
1
あだなるものと
2
0
あたる
2
0
い ろもか も
あづさゆみはる
2
0
うきくさのうき
289 あはまし
2
0
290 あふさかのせ き
2
0
あふよしもがな
2
0
あ まつ そ ら
2
0
あまびこ
2
0
あまびこの
2
0
女性
いで つ
゛
いろのちくさに
295 あめふれば
男性
0
2
0
1
2
l
0
2
0
うきとき
l
1
0
l
うちはヘ
2
1
うちはへて
2
0
うのはな
2
l
うらみても
2
おいにける
2
おいにけるかな
2
0
ありあけのつき
0
おいらく
2
0
ありとはきけど
0
お くしも
2
0
りながら
0
お くしらつ ゆ
2
いか に して
0
お くはつ しも
2
い くか
0
l
お くや ま
2
0
いそのかみふる
0
l
おとにききつつ
2
0
い´
ブこ
0
2
2
0
いつ しか
0
0
お ほか る
2
0
0
332 おほか るの ベ
2
0
あ
いつ しか と
-2″
330 おな じ
―
]
nグ ラム統計処理を用いた文字列分析による日本古典文学の研究
男性
女性
人 知
読 不
文字列 (語 彙)
文字列
(語 彙)
男性
女性
333 おほか るのべ に
0
かむなび
2
0
お もはず
0
362 か よひて
2
0
0
か よへ る
2
335 お もはぬ とき
336 お もは ま し
か らくれなゐ
0
おもはむひ と
0
かれ な く
0
お もひおき
0
かれ な くに
0
お もひ きや
0
きえかへ り
0
ききわた る
0
おもひきゆらむ
きみがため
0
おもひけむ
きみ こふ る
0
おもひきゆ
368
読人
不知
l
0
お もひける
2
きりぎりすなく
0
おもひけるかな
2
くさき
0
お もひ こし
2
くさの うへ
1
お もひそめ
2
くさのは
l
おもひぬる
2
0
おもふころかな
2
0
おもほえなくに
2
350 かぎ りは
375
くさもきも
2
】
2
かくれぬのした
2
か さ とり
2
0
かすがのの
2
0
l
かぜ のお と
2
0
1
かぜふ くごと
2
0
0
360 かな しけれ
382
384
0
くらぶのや ま
0
くらぶや ま
0
2
1
くれたけのよよ
0
くれ ど
1
2
けふの
0
0
-233-
l
くれた けの
けふにや
l
0
くらす
くれたけ
0
かなしか り
かな しき
0
くもり
か くしつつ
357 かぜふ くごとに
くさば
0
0
けふや
2
0
けらし
2
1
人文研究
千葉大学
こえ くれば
女性
文字列 (語 彙 )
男性
女性
人知
読不
男性
人知
読不
文字列 (語 彙)
第29号
0
さだめ
2
0
0
さび しく
2
0
こきたれて
0
さび しくも
2
0
こころか な
0
さほの
2
0
こころな り
0
さみだれのそら
2
0
こころなりけり
0
さむ く
0
こころをひとに
0
さやか
0
1
0
さやかに
0
1
こしのしらやま
0
さよふけて
0
1
こそかなしけれ
0
ぎりけり
2
0
こそみえね
0
しか ど
2
0
1
したにかよひて
2
0
0
こえぬべらなり
こしぢ
この もと
2
2
2
こひしかりける
1
したば
2
こひしかるべ き
l
しづ こころ
2
0
こひ しと
0
しのび
2
0
しひつ つ
l
しらか は
2
こひは じ
2
しらぎ く
2
0
こひむ と
1
しらくものたえ
2
0
こまつ
0
しらまし
2
0
ころもで
2
しられず
2
0
こゑきけば
1
しりぬる
2
0
さきけ り
0
じる く
2
0
さきそめ
0
じるべ く
2
0
さきそめ し
0
じるらむ
2
0
さ くはな
1
じるらめ
2
さくらむ
0
じるらめや
2
しれぬ
2
しろたヘ
2
ささの は
ささのはにおく
0
-234-
0
1
1
nグ ラム統計処理を用いた文字列分析 による日本音典文学の研究
男性
女性
人知
読不
文字列 (語 彙)
文字列 (語 彙)
男性
女性
0
しろた へ の
2
たれか しらまし
2
しろたへのそで
0
たれかは
2
447 すぎがて
0
゛
ちくさに
2
0
448 すぎがてに
0
ちよに
2
0
すまむ
0
477
ちよも
すみか
2
478
ちらず
すみぞめ
読人
不知
0
2
2
453 すみのえのまつ
2
りなむのち
0
せ みの は
2
0
ちるはなごと
0
せみのはの
2
0
ちるはなごとに
0
そらもとどろ
2
0
つ きのかつ ら
0
そらもとどろに
2
つ くか らに
l
それともみえず
2
0
つれもなきひと
2
たか さご
2
0
1
といふ なる
2
0
l
ときな き
ち らなむ
0
1
ちらばちらなむ
0
l
ち
すみのえのきじ
460 たか さ ごの
たが た め
0
た ぐへ て
463
0
0
2
0
としの うち
2
0
としふ る
2
0
たちいで
0
たちいでて
0
0
としふれ ば
2
0
たちか くす
0
0
とぞな く
2
l
たちなむ
0
とどめむ
2
たちばな
0
とどめ よ
2
とのみ ぞ
2
とのみふ る
2
0
たつたのや ま
としふれ
1
0
0
たつたのやまの
0
たなびくやまの
l
とは きけ
2
0
たびね
l
とはきけど
2
0
たむ くる
0
とはな しに
-235-
0
人文研究
千葉大学
文字列 (語 彙)
男性
女性
とまらぬ
504
嗣人
不知
第29号
文字列 (語 彙)
0
男性
女性
ぬ ぎか け し
0
碗人
不知
とまるべ く
2
ぬ しやたれ
0
とみゆ らむ
2
ぬ じやたれ と
0
0
とみるまで
2
はぎのはな
0
0
ともみ えず
2
とやいはむ
2
とやみむ
2
なかなか
509 なかなか に
0
はつ しものおき
0
はなのかげかは
0
0
はなより
0
2
0
は るたてば
l
2
0
は るる とき
1
はるるときなき
0
ひごと
2
なか りける
2
なきこころ
2
なきわた る
2
540 ひさかたのあま
2
なくしかの
2
ひさかたのつき
0
くなみだ
2
0
ひさし
2
0
な
0
なつ くさ
2
0
ひ とさへ
なつ ごろも
2
0
ひ としる
2
2
2
なつむ し
0
1
ひとしるらめや
2
な とりがは
0
l
ひ としれぬ
2
な に はが た
0
ひ とだ の め
0
520 なにをうしと
0
ひとだのめなる
0
なにをか
0
1
ひとたび
0
なのたつ
0
I
ひととせ に
なみだなりけり
0
なりなむ
0
0
なりにけるかな
なりにし
525 な りにける
な りまさる
2
l
ひとにしられぬ
2
0
ひ とのかたみ
2
l
ひとのかたみか
2
0
1
ひとのこころを
2
0
I
ひ とはい さ
2
0
0
ひ とりのみ
2
0
-236-
0
1
nグ ラム統計処理を用いた文字列分析 による日本古典文学の研究
男性
女性
人知
読不
文字列 (語 彙)
文字列
(語 彙)
男性
女性
読人
不知
ひ とをおもひ
0
みか さのや ま
2
ひ とをお もふ
2
みだ る
2
ひろひおきて
0
587 みだれむ
0
ふ くか らに
0
み ちの く
0
ふ くご と
0
みづの あわ
0
0
みづのお も
0
0
4
みな と
0
l
3
みむひ と
0
みもせぬ
0
みや き
0
595 み るま
0
596 み るまで
0
562 ふ くらむ
2
ふみわ け
564 ふみわ けて
ふゆ くさ
2
2
ふゆごもり
0
0
1
0
567 ふゆなが ら
2
568 ふ りしく
2
ふ りしけ
2
3,022
2
へ だつ
2
ほころび
2
0
ものならな くに
まが き
2
0
ものゆゑ
3
まがふ
2
0
もものはな
0
まさらじ
2
0
もやすると
0
570
0
み る らむ
1
0
0
めもはるに
0
599
ものおもひもな
まさるな
2
577
まつ はれ
2
0
や あはれ と
0
578
まつ や ま
2
0
やたれ
0
579
まどふ
2
0
やちよ
2
3
みえなむ
0
や どのはな
2
l
みえね ど
0
やなぎ
2
み えわた る
0
や まがは
2
l
みえわたるかな
0
0
や まのか ひ
2
l
みか き
0
3
もゆ る
l
612 や まび こ
-2θ 7-
1
2
千葉大学 人文研究 第29号
男性
女性
人知
読不
文字列 (語 彙)
文字列 (語 彙)
ゆきかふ
わかぬ
読人
男性
女性
2
0
l
2
0
1
不 知
ゆきふみわけ
0
ゆきふみわけて
゛
ゆふ くれ
0
わがやどのはな
2
0
l
5
わか る と
2
0
1
l
わかるるなみだ
0
0
0
わかれ し
0
1
0
わかれて
0
0
l
わきてをらまし
0
0
3
わびしか り
0
l
よひよひ
0
わび しけれ
0
よふけ
1
わび しら
0
ゆふづ くよ
2
よただな く
よ どみ
2
よにこそ
よのうき
2
637 わがみ ひ とつ
よふけて
1
わびしらに
0
625
よ よに
0
わ びて
0
626
よるこそ
2
0
わぶ と
0
よるなみ
2
0
よをへ て
650 わぶ とこたへ よ
0
0
0
0
0
l
われ も
0
3
われ なれや
0
わがお もふ
l
わがおもふひと
1
わが ごとく
1
を しければ
0
0
l
を とは
0
0
656 を とめ
0
652 われのみ
わがころも
2
わがころもで
2
わかず
2
を らま し
0
わかなつみ
2
を りつ る
0
-238-
0
Fly UP