...

Title 文学書籍における複合動詞の使用傾向 : 22の後項動詞を指標として

by user

on
Category: Documents
5

views

Report

Comments

Transcript

Title 文学書籍における複合動詞の使用傾向 : 22の後項動詞を指標として
Title
Author
Publisher
Jtitle
Abstract
Genre
URL
Powered by TCPDF (www.tcpdf.org)
文学書籍における複合動詞の使用傾向 : 22の後項動詞を指標として
村田, 年(Murata, Minori)
慶應義塾大学日本語・日本文化教育センター
日本語と日本語教育 No.43 (2015. 3) ,p.61- 80
Departmental Bulletin Paper
http://koara.lib.keio.ac.jp/xoonips/modules/xoonips/detail.php?koara_id=AN00189695-20150300
-0061
慶應義塾大学 日本語・日本文化教育センター紀要
『日本語と日本語教育』43:61‒80(2015.3)
61
文学書籍における複合動詞の使用傾向
―22 の後項動詞を指標として―
村 田 年
1. はじめに
複合動詞の後項動詞は、文章のジャンルを判別するための有効な指標の
一つとなる可能性があると考えられる(村田 2008)。本稿では、村田・山
崎(2012)、村田(2013)に引き続き、『現代日本語書き言葉均衡コーパス』
(BCCWJ)を用いて、その中の文学書籍に現れる複合動詞を対象に、22 の
後項動詞を指標として使用頻度調査を行う。
2. 研究目的
複合動詞の後項動詞が文章のジャンル判別の指標となり得るかどうかを
実証的に分析することを目的として、本稿では、文学ジャンルの文章にお
ける複合動詞の後項動詞の使用傾向を明らかにする。資料としては『現代
日本語書き言葉均衡コーパス』
(BCCWJ)の書籍コーパス内の「文学」の文
章を用いる。
3. 調査対象
3.1 調査対象としての後項動詞
調査対象は、姫野(1999)を参考に選択した 22 の後項動詞である 1)。以
下に 22 後項動詞を挙げる。
〈22 後項動詞〉
(アイウエオ順)
あう、あがる、あげる、あわせる、いる、いれる、かかる、かける、き
62
る、こむ、こめる、だす、たつ、たてる、つく、つける、でる、とおす、
なおす、なおる、ぬく、まくる
3.2 調査対象としての文章資料
調査に用いた資料は、『現代日本語書き言葉均衡コーパス』(以下 BCCWJ)の書籍データである。BCCWJ のデータ量は表 1 のとおりである。書
籍内は 11 に分類され、その内訳は「総記、哲学、歴史、社会科学、自然
科学、技術・工学、産業、芸術・美術、言語、文学、なし」である。各分
類の語数は表 2 に示す。なお、この調査で使用した書籍の部分についての
詳細は山崎(2009)に詳しい。
表 1 BCCWJ のデータ量
サブコーパス
ジャンル
出版サブコーパス
書籍
雑誌
新聞
図書館サブコーパス
書籍
白書
教科書
広報紙
特定目的サブコーパス ベストセラー
Yahoo! 知恵袋
Yahoo! ブログ
韻文
法律
国会会議録
合計
サンプル
表 2 書籍 NDC 別の語数
語数
数
(万)
10,105 2,849
1,989
443
1,479
138
10,461
3,011
1,500
488
412
93
354
400
1,377
371
91,445 1,028
52,680 1,027
253
23
346
100
159
510
172,560 10,481
書籍の NDC 別内訳
0 総記
1 哲学
2 歴史
3 社会科学
4 自然科学
5 技術・工学
6 産業
7 芸術・美術
8 言語
9 文学
分類なし
合計
語数
642,351
1,799,241
2,674,253
6,854,656
1,631,154
1,363,963
878,954
1,311,554
492,255
11,267,012
478,536
29,393,929
(注)「語数」は、コーパスの構築に際して使われている解析の言語単位である「短単位」
で数えたもの。空白、補助記号(句読点など)、記号(A、B、C、ア、イ、ウなど)
を含まない数である。
4. 調査方法
4.1 複合動詞の抽出方法
複合動詞の抽出方法は村田・山崎(2012)と同様である 2)。
4.2 調査結果の整理―複合動詞の選択方法―
用字の異なりをはじめ、前項動詞の音便形の存在など、様々な問題があ
63
るため、本調査では以下の方法で見出し語としての複合動詞を選択した。
(a) 各後項動詞の用字の差異(例: あう/合う/会う)ならびに動詞の
活用変化の形(例: あわな、あいます、あう、あえば、あおう、
あって、あった等)は同定して同じ動詞項目として扱った。
(b) 複合動詞の前項動詞については、同音で用字が異なるものはコー
パスの語彙素項目の用字に合わせて整理した。例えば、
「書き出す」
は「掻き出す」とは別の見出し語になっているが、「探し出す」は
「捜し出す」として一つの見出し語となっている。このように本調
査の結果としてまとめた表内の複合動詞の代表見出し項目につい
ては、異なる用字の可能性も含まれている。
(c) 本調査では複合動詞の動詞としての用法を対象とするので、語彙
素項目が動詞でも、実際には名詞、副詞として用いられているも
のは使用頻度からは外した。例えば、
「届出印」という語の「届出」、
「思い切って輸入する」の「思い切って」のような用法である。
(d) 前項動詞が音便形になっている語については、斎藤(1992)が指摘
するように、前項動詞が音便形になる語が必ずしも非音便形を持
つわけではなく、音便形と非音便形の意味関係も同じとは限らな
い。例えば、辞書 3)で「ぶつける」は「ぶっつけるの転」という説
明があるが、実際には各語の意味するところは同一とは言えない。
前項動詞が音便形になっている語は、このように複雑な意味関係
を持つため、別の見出し語として立てた。ほかにも、「引き込む」
と「引っ込む」、
「くっ付く」と「食い付く」のような例がある。
(e) 「打ち込める」のようにその意味から考えて対応する「打ち込む」
の可能形と考えられるものがあるが、本調査では出現形のままで
数えている 4)。
(f) 動詞が三つ続く場合は最後尾の動詞を後項動詞とした。
64
5. 調査結果
5.1 結果の概要
書籍コーパスの文学ジャンルにおける 22 の後項動詞による複合動詞の
総延べ語数は 129,268 語であった。各後項動詞の使用頻度(延べ語数)は
表 3‒1 のとおりである。これまでに行った社会科学ジャンルの調査結果
(2013)ならびに自然科学系ジャンル(含技術・工学)の調査結果(2012)
と比較するために、それぞれの結果を表 3‒2 と表 3‒3 に示す。
22 の後項動詞による複合動詞の総延べ語数を比較すると、圧倒的に文
学ジャンルにおける複合動詞の使用が多いことがわかる。これは、日本語
教育での現場の経験的な感覚を裏付けるものである。文学、社会科学、自
然科学(含技術・工学)の三つのジャンルでは、文学における複合動詞の
使用が最多で、社会科学、自然科学の順で少なくなっている。
次に、文学ジャンルにおける個別の後項動詞について見ていく。表 3‒1
で使用頻度が圧倒的に高いのは、20,000 語を超える「だす」
「こむ」の 2 動
詞で、これらを後項動詞とする複合動詞は、本調査における全複合動詞の
総延べ語数の約 37%を占めている。造語力の高い 10,000 語台の動詞は、
「つける」
「あげる」
「かける」の 3 動詞で、これらの語から成る複合動詞を
上記の結果と合わせれば、全複合動詞の約 63%を占める。さらに、7,000
∼8,000 語台の「つく」
「あがる」
「あう」までの 8 動詞による複合動詞を合
わせれば全体の約 82%となり、そこに 3,000 語台の「かかる」
「きる」まで
を入れれば、10 後項動詞から成る複合動詞によって全体の約 87%を占め
ることとなる。つまり、文学ジャンルの書籍に出現する 22 の後項動詞の
上位 10 後項動詞を含む複合動詞で、その約 9 割がカバーされているとい
うことになる。
ここで、社会科学ジャンルの調査結果(2013)ならびに自然科学系ジャ
ンル(含技術・工学)の調査結果(2012)と比較してみよう。
社会科学ジャンルの調査結果(2013)では、表 3‒2 からわかるように、
65
「だす」
「こむ」の 2 動詞を含む複合動詞の延べ語数が、22 の後項動詞のい
ずれかを含む複合動詞の総延べ語数の約 34%を占め、その次に造語力の
高い「あう」
「あげる」
「つける」の 3 動詞の各延べ語数を加えれば、全体の
約 61%となっている。さらに、「かける」
「いれる」
「つく」
「あがる」
「たて
る」
「きる」までの頻度数上位 11 動詞を合わせれば全体の約 87%、つまり、
約 9 割がカバーされている。
一方、自然科学系ジャンル(含技術・工学)の調査結果(2012)では、
表 3‒3 のように、「だす」「こむ」の 2 動詞を含む複合動詞の延べ語数が、
22 の後項動詞のいずれかを含む複合動詞の総延べ語数の約 35%を占め、
その次に造語力の高い「つける」
「あげる」
「あう」の 3 動詞を合わせると約
61%となっている。さらに、頻度数上位 11 位までの後項動詞「つく」「か
ける」
「あわせる」
「あがる」
「いれる」
「たつ」の各延べ語数を合わせれば全
体の約 88%、つまり、約 9 割がカバーされている。
このように、社会科学ジャンルならびに自然科学系ジャンルにおける上
位 11 後項動詞の相対的な使用傾向はほぼ同様の結果であった。また、上
位 11 語の内訳については、
「だす」
「こむ」
「つける」
「あげる」
「あう」
「かけ
る」「いれる」「つく」「あがる」の 9 語が共通し、残りの 2 語については、
社会科学ジャンルには「たてる」
「きる」が入り、自然科学系ジャンル(含
技術・工学)では「あわせる」
「たつ」が入っていた。
文学ジャンルについても、社会科学ジャンルならびに自然科学系ジャン
ルの調査と同様に、11 位の後項動詞(「いれる」)を加えて、22 の後項動詞
のいずれかを含む複合動詞の総延べ語数全体に占める割合を計算すると、
約 88%となる。11 位までの後項動詞の内訳を見ると、文学ジャンルと社
会科学ジャンルでは、10 語が共通していて、残りの 1 語として、文学ジャ
ンルには「かかる」が、社会科学ジャンルには「たてる」が入っている。ま
た、文学ジャンルと自然科学系ジャンルでは、9 語が共通していて、それ
以外の 2 語として、文学ジャンルには「かかる」と「きる」が、自然科学系
66
ジャンルには「あわせる」と「たつ」が入っている。
次に、社会科学ジャンルならびに自然科学系ジャンルの調査の際にも
行ったように、22 の後項動詞を大きく三つ(上位 5 語、中位 9 語、下位 8
語)に分けて、ジャンルごとにその比較を試みる。
文学ジャンルも、他の二つのジャンルと同様、上位 5 語が、6 位以下の
語に比べて、延べ語数が非常に多いと言える。最多の「だす」に「こむ」が
続くのは、他の二つのジャンルと同様である。上位 3 位から 5 位について
は、
「つける」と「あげる」が共通するものの、文学ジャンルでは、
「かける」
が 5 位に、
「あう」が 8 位に入っている。他の二つのジャンルに比べて、
「か
ける」の使用頻度の高さが目を引く。
中位の 6 位から 14 位の 9 語については、社会科学と自然科学系の両
ジャンルでは、語の順位に差はあるものの、9 語すべてが共通している。
一方、文学ジャンルでは 6 語(「つく」
「あがる」
「きる」
「いれる」
「たてる」
「なおす」)は他の二つのジャンルと共通しているが、それ以外の 3 語につ
いては、「かける」
「つく」が上位グループに、「あわせる」が下位グループ
に入っている。他の二つのジャンルでは、「あう」は上位グループに、「か
かる」
「でる」は中位グループに入っている。文学ジャンルでは、中位グ
ループ 9 語の中でも、上位の 3 語(6 位∼8 位)の「つく」
「あがる」
「あう」
の使用頻度の高さが際立つ。
下位グループ 15 位から 22 位の 8 語については、文学ジャンルの 15 位
「たつ」、16 位「あわせる」が、他の二つのジャンルと異なるが、それ以外
の 6 語は三つのジャンルで共通し、三ジャンルとも 20 位以下の 3 語「な
おる」
「まくる」
「とおす」の使用頻度の低さが目を引く。
なお、22 の後項動詞からなる複合動詞の全語数に占める割合をジャン
ルごとに比較すると、文学ジャンルでは全語数の約 1.1%(129268/11267012
=0.011)、 社 会 科 学 ジ ャ ン ル で は 全 語 数 の 約 0.6%(37620/6854656=
0.0055)、自然科学系ジャンル(含技術・工学)では約 0.8%(26104/2995117
67
=0.0077)となっている。
以上、22 の後項動詞のいずれかを含む複合動詞の延べ語数の観点から、
三つのジャンルを比較すると、文学ジャンルの使用頻度が圧倒的に高い
が、各ジャンル内の 22 後項動詞を含む複合動詞の相対的な使用傾向は非
常に似た特徴を持っていると言えよう。
次に、異なり語数について見てみる。22 後項動詞の異なり語数につい
ては、文学ジャンルを表 4‒1 として、社会科学ジャンルを表 4‒2 として、
自然科学系ジャンル(含技術・工学)を表 4‒3 として示す 5)。
村田(2012、2013)で、後項動詞の使用頻度が高ければ、結合する前項
動詞の種類もそれに比例して多いというわけではないことはすでに指摘し
た。表 3‒1 と表 4‒1 を比較して見るとわかるように、今回の文学ジャンル
の調査からもそれが確認される。異なり語を 100 語以上持つ後項動詞を上
位から見ていくと、文学ジャンルでは 10 語、社会科学ジャンルでは 7 語、
自然科学系ジャンルでは 6 語である。異なり語数上位 2 語「あう」と「だ
す」は、三つのジャンルとも共通である。自然科学系ジャンルの 6 語には、
これ以外に「こむ」
「なおす」
「あげる」
「きる」の 4 語が入り、その 6 語は、
社会科学ジャンル 7 語のうちの 6 語と共通している。社会科学ジャンル 7
語は、その 6 語に「かける」が加わり、その 7 語は文学ジャンル 10 語のう
ちの 7 語と共通している。文学ジャンル 10 語には、その 7 語のほかに「か
かる」
「つける」
「まくる」の 3 語が加わる。
このように、異なり語数の上位の後項動詞は、延べ語数が大きく異なっ
ても、三つのジャンルに共通していて、それぞれのジャンルにおける各後
項動詞の相対的な頻度順位も近いことがわかった。一方、異なり語数が極
端に低いのは「なおる」で、三つのジャンルともに際立って少ないのが目
を引く。つまり、前項動詞にバリエーションが殆どないということであ
る。
次に、22 の後項動詞ごとに複合動詞の使用傾向を具体的に見ていく。
11923
10739
10504
8526
7700
7627
3272
3216
2357
2073
2013
1972
1825
1815
1348
1329
1324
683
338
332
つける
あげる
かける
つく
あがる
あう
かかる
きる
いれる
たてる
なおす
でる
たつ
あわせる
こめる
ぬく
いる
なおる
まくる
とおす
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
129268
21852
こむ
2
合計
26500
延べ語数
だす
1
後項動詞
表 3‒1 22 後項動詞使用頻度順
(文学)
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
合計
まくる
なおる
とおす
いる
こめる
ぬく
かかる
でる
あわせる
たつ
なおす
きる
たてる
あがる
つく
いれる
かける
つける
あげる
あう
こむ
だす
後項動詞
37620
100
101
120
239
361
409
500
555
719
751
961
1003
1077
1271
1953
2145
2304
3056
3499
3839
5631
7026
延べ語数
表 3‒2 22 後項動詞使用頻度順
(社会科学)
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
合計
なおる
とおす
まくる
いる
こめる
ぬく
かかる
でる
たてる
なおす
きる
たつ
いれる
あがる
あわせる
かける
つく
あう
あげる
つける
こむ
だす
後項動詞
26104
38
53
58
125
189
224
272
386
560
572
613
665
1216
1249
1276
1321
1385
1905
2238
2550
4526
4683
延べ語数
表 3‒3 22 後項動詞使用頻度順
(自然科学系)
68
7
3300
44
ぬく
なおる
21
22
合計
52
52
いれる
とおす
19
20
58
53
たつ
いる
17
18
66
61
あわせる
こめる
15
16
85
76
たてる
でる
13
14
90
88
あがる
つく
11
12
140
127
つける
まくる
9
10
185
149
あげる
かかる
7
8
256
205
かける
なおす
5
6
322
257
きる
こむ
3
391
あう
2
4
536
異なり語数
だす
1
後項動詞
表 4‒1 22 後項動詞使用頻度順
(文学)
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
合計
なおる
いる
たつ
とおす
いれる
でる
ぬく
こめる
たてる
かかる
まくる
あわせる
あがる
つく
つける
かける
あげる
なおす
きる
こむ
だす
あう
後項動詞
1884
5
22
25
27
37
38
39
40
42
46
49
50
57
61
94
100
108
113
120
176
280
355
異なり語数
表 4‒2 22 後項動詞の異なり語頻度
順(社会科学)
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
合計
なおる
とおす
たつ
いる
ぬく
こめる
かかる
まくる
でる
たてる
あわせる
いれる
つく
あがる
かける
つける
きる
あげる
なおす
こむ
だす
あう
後項動詞
1635
4
13
21
25
28
34
35
38
38
38
43
52
55
57
94
94
102
103
128
179
217
237
異なり語数
表 4‒3 22 後項動詞の異なり語頻度
順(自然科学系)
69
70
ここでは対象となる複合動詞が 129,268 語と非常に多いため、便宜上、延
べ語数が 30 回以上の語だけを表 5‒1 から表 5‒5 までに頻度順に挙げる。
表 5‒1 から表 5‒5 では、各見出し後項動詞の同じ欄に、その後項動詞から
成る複合動詞の使用総数に当たる延べ語数と、異なり語数を、(7627*391)
のように記してある。表 5 を見るとほとんどの後項動詞で、使用頻度が非
常に高い複合動詞は上位の限られた数の語であることに気づく。これは自
然科学系ジャンル(含技術・工学)ならびに社会科学ジャンルの調査結果
と同様である。これら上位の複合動詞の使用が当該後項動詞全体の中でど
のぐらいの割合を占めているか、村田(2013)の調査と同様の方法で見て
みる。
各後項動詞によって構成される複合動詞はその総数が異なるため、便宜
上、延べ語数が 1,000 語以上のものは上位 4 語の場合と 8 語の場合を、
1,000 語未満のものは上位 2 語の場合と 4 語の場合についてそれぞれ全体
数における使用割合を調べてみた。その結果を表 6‒1 に示す。なお、比較
のために社会科学ジャンルの調査結果を表 6‒2 に、自然科学系ジャンル
(含技術・工学)の調査結果を表 6‒3 に挙げる。
表 6‒1 を見るとわかるように、各後項動詞の上位 4 語あるいは 2 語とい
う非常に限られた数の語だけで、使用割合が全体の約 50%あるいはそれ
以上の後項動詞が 22 語中 6 語(「あがる」「あわせる」「いれる」「こめる」
「なおる」
「ぬく」)で、上位 8 語まで広げれば、22 語中 16 語(「あげる」
「い
る」
「かかる」
「かける」
「たつ」
「つく」
「つける」
「でる」
「とおす」
「なおす」)
に上り、後項動詞全体の約 7 割を超える。残りの 6 語(「あう」
「きる」
「こ
む」
「だす」
「たてる」
「まくる」)は、上位語の全体に占める割合が低いこと
から、これらの語を後項動詞とする複合動詞は相対的に使用頻度がばらけ
ているということがわかる。
ここで、上位 8 語という非常に限られた数の語で、三つのジャンルに共
通して、使用割合が全体の約 50%以上を占めている後項動詞を見ていく。
71
表 5‒1 22 後項動詞による使用頻度 30 回以上の複合動詞 ( 文学ジャンル )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
あう (7627*391)
付き合う
話し合う
似合う
知り合う
向かい合う
向き合う
抱き合う
取り合う
語り合う
愛し合う
絡み合う
触れ合う
落ち合う
言い合う
重なり合う
請け合う
溶け合う
見詰め合う
寄せ合う
見合う
分かち合う
掛け合う
睨み合う
ぶつかり合う
混じり合う
混み合う
遣り合う
引き合う
噛み合う
分け合う
笑い合う
関わり合う
頷き合う
揉み合う
競い合う
囁き合う
張り合う
混ざり合う
助け合う
渡り合う
握り合う
鬩ぎ合う
縺れ合う
出し合う
交わし合う
通じ合う
隣り合う
奪い合う
擦れ合う
誓い合う
991
569
499
390
333
254
252
189
176
152
131
124
122
106
103
92
89
84
82
79
79
75
73
68
66
55
54
53
51
51
49
48
47
47
44
43
43
43
39
39
37
36
35
34
32
32
31
30
30
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
あがる (7700*90)
立ち上がる
起き上がる
浮かび上がる
出来上がる
飛び上がる
盛り上がる
膨れ上がる
燃え上がる
湧き上がる
駆け上がる
浮き上がる
持ち上がる
跳ね上がる
這い上がる
召し上がる
震え上がる
吊り上がる
迫り上がる
腫れ上がる
吹き上がる
伸び上がる
仕上がる
禿げ上がる
干上がる
伸し上がる
躍り上がる
縮み上がる
すくみ上がる
3195
528
482
363
345
327
220
213
205
192
186
156
115
108
98
89
68
61
61
55
49
43
42
40
37
35
34
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
あげる (10739*185)
見上げる
申し上げる
取り上げる
引き上げる
持ち上げる
込み上げる
差し上げる
作り上げる
張り上げる
拾い上げる
積み上げる
振り上げる
突き上げる
抱き上げる
掻き上げる
吊り上げる
巻き上げる
読み上げる
仕上げる
1601
941
838
708
634
415
329
260
257
238
231
214
207
190
185
179
156
143
127
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
書き上げる
吹き上げる
押し上げる
締め上げる
切り上げる
盛り上げる
捏ち上げる
跳ね上げる
打ち上げる
掬い上げる
築き上げる
仕立て上げる
しゃくり上げる
引っ張り上げる
縛り上げる
吊り上げる
まくり上げる
抱え上げる
摘み上げる
磨き上げる
吸い上げる
蹴り上げる
乗り上げる
調べ上げる
担ぎ上げる
たくし上げる
練り上げる
結い上げる
存じ上げる
育て上げる
ねじり上げる
数え上げる
撫で上げる
115
103
94
90
83
81
76
74
70
68
67
67
67
66
65
58
57
56
54
54
50
48
47
45
38
38
36
36
35
32
32
31
30
1
2
3
4
5
6
7
8
9
10
11
12
13
あわせる (1815*66)
見合わせる
居合わせる
持ち合わせる
組み合わせる
問い合わせる
重ね合わせる
待ち合わせる
突き合わせる
打ち合わせる
こすり合わせる
申し合わせる
繋ぎ合わせる
示し合わせる
500
169
132
126
88
72
67
67
62
47
39
38
33
72
表 5‒2 22 後項動詞による使用頻度 30 回以上の複合動詞(文学ジャンル)
1
2
3
4
5
6
7
8
9
10
11
12
いる (1324*53)
見入る
恐れ入る
聞き入る
立ち入る
押し入る
寝入る
食い入る
分け入る
消え入る
取り入る
込み入る
感じ入る
166
145
106
98
96
74
73
71
61
57
47
45
1
2
3
4
5
6
7
8
9
10
11
12
13
14
いれる (2357*52)
受け入れる
踏み入れる
差し入れる
迎え入れる
仕入れる
取り入れる
聞き入れる
乗り入れる
申し入れる
招き入れる
引き入れる
投げ入れる
運び入れる
請じ入れる
829
301
137
132
109
109
103
81
80
77
66
46
41
33
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
かかる (3272*149)
引っかかる
襲いかかる
取りかかる
差しかかる
通りかかる
寄りかかる
飛びかかる
のしかかる
降りかかる
凭れかかる
切りかかる
掴みかかる
突っかかる
出かかる
殴りかかる
倒れかかる
挑みかかる
成りかかる
461
386
304
252
242
237
172
170
132
123
63
63
52
51
49
46
33
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
かける (10504*256)
出かける
2090
話しかける
878
追いかける
694
見かける
589
呼びかける
581
仕かける
471
言いかける
424
問いかける
365
引っかける
262
語りかける
233
投げかける
223
笑いかける
219
押しかける
194
見せかける
191
持ちかける
160
微笑みかける
143
立てかける
134
成りかける
126
振りかける
85
畳みかける
74
凭せかける
72
吹きかける
71
追っかける
69
囁きかける
65
働きかける
61
浴せかける
55
吐きかける
55
開きかける
54
行きかける
49
詰めかける
48
突っかける
42
死にかける
40
忘れかける
38
吹っかける
37
ぶっかける
36
頷きかける
34
立ち上がりかける
33
傾きかける
31
射かける
30
訴えかける
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
きる (3216*322)
言い切る
仕切る
疲れ切る
断ち切る
振り切る
分かり切る
張り切る
打ち切る
成り切る
思い切る
乗り切る
突っ切る
冷え切る
踏み切る
割り切る
押し切る
取り仕切る
澄み切る
締め切る
のぼり切る
乾き切る
掻き切る
信じ切る
下り切る
煮え切る
209
175
154
153
123
91
88
84
84
79
79
76
75
75
66
64
62
61
59
57
52
34
34
33
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
でる (1972*76)
申し出る
進み出る
突き出る
滲み出る
走り出る
流れ出る
溢れ出る
願い出る
浮き出る
抜け出る
飛び出る
躍り出る
湧き出る
吹き出る
抜きん出る
届け出る
這い出る
名乗り出る
食み出る
迸り出る
206
200
170
120
101
100
94
79
75
69
56
51
46
43
41
40
39
38
33
33
73
表 5‒3 22 後項動詞による使用頻度 30 回以上の複合動詞(文学ジャンル)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
こむ (21852*257)
覗き込む
飛び込む
突っ込む
乗り込む
飲み込む
吸い込む
思い込む
入り込む
巻き込む
考え込む
座り込む
持ち込む
踏み込む
潜り込む
押し込む
黙り込む
差し込む
放り込む
駆け込む
打ち込む
忍び込む
落ち込む
包み込む
吹き込む
滑り込む
送り込む
追い込む
射し込む
しゃがみ込む
流れ込む
詰め込む
書き込む
倒れ込む
割り込む
投げ込む
食い込む
逃げ込む
抱え込む
引っ込む
屈み込む
運び込む
引き込む
咳き込む
染み込む
回り込む
取り込む
押さえ込む
連れ込む
仕舞い込む
申し込む
1048 51
995 52
899 53
821 54
784 55
602 56
546 57
546 58
509 59
493 60
414 61
387 62
380 63
370 64
357 65
317 66
311 67
311 68
294 69
270 70
269 71
263 72
259 73
259 74
251 75
245 76
243 77
242 78
230 79
215 80
209 81
203 82
202 83
201 84
195 85
187 86
187 87
185 88
185 89
181 90
179 91
162 92
161 93
156 94
154 95
133 96
131 97
130 98
127 99
126 100
引き摺り込む
紛れ込む
流し込む
嵌め込む
溶け込む
着込む
決め込む
ぶち込む
仕込む
眠り込む
注ぎ込む
組み込む
沈み込む
刻み込む
転がり込む
埋め込む
切り込む
叩き込む
寝込む
信じ込む
頼み込む
のめり込む
見込む
減り込む
撃ち込む
へたり込む
買い込む
積み込む
話し込む
雪崩れ込む
迷い込む
攻め込む
溜め込む
張り込む
走り込む
捩じ込む
付け込む
はたき込む
舞い込む
売り込む
上がり込む
教え込む
惚れ込む
聞き込む
誘い込む
振り込む
注ぎ込む
織り込む
冷え込む
刷り込む
118
118
116
116
115
113
112
112
111
105
103
100
99
97
97
95
90
90
89
87
87
86
86
86
85
84
79
78
77
73
70
67
67
65
64
63
61
61
59
58
57
52
52
49
49
48
44
43
41
40
101
102
103
104
105
106
107
108
109
1
2
3
4
5
6
7
8
挟み込む
刈り込む
彫り込む
引っ張り込む
くわえ込む
使い込む
煮込む
嵌まりこむ
丸め込む
こめる (1348*61)
閉じ込める
引っ込める
立ち込める
飲み込める
押し込める
封じ込める
突き込める
塗り込める
38
36
36
35
33
33
32
31
30
401
194
163
113
90
63
59
33
74
表 5‒4 22 後項動詞による使用頻度 30 回以上の複合動詞(文学ジャンル)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
だす (26500*536)
思い出す
取り出す
飛び出す
差し出す
言い出す
逃げ出す
歩き出す
乗り出す
突き出す
吐き出す
持ち出す
吹き出す
呼び出す
泣き出す
投げ出す
走り出す
放り出す
抜け出す
引き出す
切り出す
笑い出す
駆け出す
動き出す
追い出す
作る出す
踏み出す
生み出す
捜し出す
引っ張り出す
連れ出す
映し出す
聞き出す
照らし出す
送り出す
見付け出す
繰り出す
押し出す
流れ出す
食み出す
絞り出す
話し出す
運び出す
剥き出す
引き摺り出す
起き出す
降り出す
救い出す
曝け出す
溢れれ出す
考え出す
3983
2002
1301
1250
806
806
693
655
640
536
506
497
425
406
397
389
381
357
352
351
319
315
313
310
300
290
267
260
254
247
240
233
224
215
203
188
170
170
151
138
129
128
111
104
101
99
97
96
93
92
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
掘り出す
描き出す
抜き出す
震え出す
怒り出す
鳴り出す
這い出す
歌い出す
醸し出す
張り出す
打ち出す
書き出す
盗み出す
喋り出す
誘い出す
締め出す
語り出す
騒ぎ出す
湧き出す
割り出す
助け出す
選び出す
探り出す
売り出す
叩き出す
成り出す
駆り出す
迫り出す
弾き出す
踊り出す
掴み出す
つまみ出す
叫び出す
漕ぎ出す
導き出す
撃ち出す
編み出す
滲み出す
浮き出す
痛み出す
貼り出す
おびき出す
紡ぎ出す
89
87
87
84
81
80
80
73
73
73
72
72
67
64
63
61
60
57
56
53
52
51
51
48
47
47
46
43
43
41
41
41
40
39
37
35
34
34
32
31
31
30
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
たてる (2073*85)
掻き立てる
仕立てる
突き立てる
組み立てる
捲し立てる
駆り立てる
追い立てる
急き立てる
引き立てる
見立てる
騒ぎ立てる
並べ立てる
申し立てる
取り立てる
責め立てる
飾り立てる
言い立てる
囃し立てる
書き立てる
押し立てる
喚き立てる
煽り立てる
180
152
142
111
108
101
92
76
75
75
68
61
57
52
49
45
42
42
39
34
33
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
たつ (1825*58)
突っ立つ
下り立つ
成り立つ
飛び立つ
思い立つ
聳え立つ
奮い立つ
連れ立つ
熱り立つ
沸き立つ
切り立つ
そそり立つ
浮き立つ
突き立つ
燃え立つ
237
195
192
168
136
82
78
77
73
72
60
59
57
53
48
75
表 5‒5 22 後項動詞による使用頻度 30 回以上の複合動詞 ( 文学ジャンル )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
つく (8526*88)
落ち着く
思い付く
辿り着く
しがみ付く
凍り付く
張り付く
追い付く
くっ付く
結び付く
取り付く
飛び付く
抱き付く
噛み付く
絡み付く
行き着く
こびり付く
住み着く
縋り付く
考え付く
まとわり付く
巻き付く
へばり付く
焼き付く
帰り着く
染み付く
食い付く
吸い付く
寝付く
纏わり付く
突っつく
有り付く
居着く
寄り付く
食らい付く
似付く
生まれ付く
泣き付く
齧り付く
齧り付く
錆び付く
焼け付く
1
2
とおす (332*52)
見通す
押し通す
92
51
1
まくる (338*127)
喋り捲る
37
1813
749
636
421
328
313
312
281
271
252
244
236
213
156
143
140
127
126
124
123
106
102
95
90
86
83
71
63
60
51
50
49
46
45
44
39
39
38
35
35
35
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
つける (11923*140)
見付ける
2647
押し付ける
758
駆け付ける
645
睨み付ける
603
叩き付ける
417
突き付ける
357
引き付ける
318
締め付ける
313
投げ付ける
284
取り付ける
275
結び付ける
257
巻き付ける
232
押さえ付ける
221
決め付ける
196
見せ付ける
177
打ち付ける
167
張り付ける
158
聞き付ける
157
言い付ける
151
縛り付ける
148
殴り付ける
148
吹き付ける
131
遣っ付ける
129
怒鳴り付ける
123
痛め付ける
118
くっ付ける
110
落ち着ける
108
擦り付ける
107
切り付ける
104
叱り付ける
102
嗅ぎ付ける
94
括り付ける
92
撫で付ける
92
受け付ける
89
呼び付ける
89
植え付ける
87
擦り付ける
83
踏み付ける
77
書き付ける
76
辿り着ける
72
送り付ける
59
撥ね付ける
59
照り付ける
58
申し付ける
57
焼き付ける
57
寄せ付ける
55
売り付ける
54
ねめ付ける
53
刻み付ける
52
追い付ける
50
51
52
53
54
55
56
57
58
59
60
61
乗り付ける
据え付ける
備え付ける
踏ん付ける
有り付ける
漕ぎ着ける
擦り付ける
塗り付ける
寝付ける
蹴り付ける
縫い付ける
1
2
3
4
5
6
7
8
9
10
11
12
13
14
なおす (2013*205)
思い直す
取り直す
座り直す
立て直す
見直す
考え直す
やり直す
書き直す
掛け直す
言い直す
出直す
持ち直す
握り直す
読み直す
161
158
154
135
129
111
105
74
68
64
57
51
43
43
1
2
3
なおる (683*7)
向き直る
立ち直る
開き直る
400
146
88
1
2
3
4
5
6
7
8
9
10
ぬく (1329*44)
引き抜く
見抜く
生き抜く
撃ち抜く
追い抜く
出し抜く
引っこ抜く
守り抜く
刳り抜く
切り抜く
341
307
90
56
51
46
36
36
35
31
50
46
43
43
37
37
37
34
32
30
30
7700
7627
3272
3216
2357
2073
2013
1972
1825
1815
1348
1329
1324
7 あがる
8 あう
9 かかる
10 きる
11 いれる
12 たてる
13 なおす
14 でる
15 たつ
16 あわせる
17 こめる
18 ぬく
19 いる
52
127
7
53
44
61
66
58
76
205
85
52
322
149
391
90
88
256
185
140
257
536
2
2
2
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
43%
19%
80%
39%
60%
65%
51%
43%
35%
30%
28%
59%
21%
43%
32%
59%
42%
40%
38%
39%
17%
32%
4
4
4
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
57%
30%
96%
63%
72%
83%
67%
64%
54%
51%
46%
76%
33%
68%
46%
74%
57%
58%
53%
51%
29%
43%
異なり
語数 A 割合 語数 B 割合
語数
注: A 使用割合は上位 2 語と 4 語の場合で B
使用割合は上位 4 語と 8 語の場合である。
332
8526
6 つく
22 とおす
10504
5 かける
338
10739
4 あげる
21 まくる
11923
3 つける
683
21852
2 こむ
20 なおる
26500
1 だす
後項動詞
延べ
語数
占める割合【文学】
表 6‒1 22 後項動詞の使用頻度上位語が全体に
100
101
120
239
361
409
500
555
719
751
961
1003
1077
1271
1953
2145
2304
3056
3499
3839
5631
7026
49
5
27
22
40
39
46
38
50
25
113
120
42
57
61
37
100
94
108
355
176
280
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
4
4
4
4
4
4
16%
86%
58%
49%
39%
40%
38%
46%
39%
75%
47%
36%
46%
59%
60%
75%
49%
45%
58%
37%
19%
36%
4
4
4
4
4
4
4
4
4
4
4
8
8
8
8
8
8
8
8
8
8
8
32%
99%
71%
64%
58%
56%
58%
57%
55%
83%
59%
57%
70%
72%
75%
88%
72%
61%
68%
49%
33%
49%
異なり
語数 A 割合 語数 B 割合
語数
注: A 使用割合は上位 2 語と 4 語の場合で B
使用割合は上位 4 語と 8 語の場合である。
22 まくる
21 なおる
20 とおす
19 いる
18 こめる
17 ぬく
16 かかる
15 でる
14 あわせる
13 たつ
12 なおす
11 きる
10 たてる
9 あがる
8 つく
7 いれる
6 かける
5 つける
4 あげる
3 あう
2 こむ
1 だす
後項動詞
延べ
語数
に占める割合【社会科学】
表 6‒2 22 後項動詞の使用頻度上位語が全体
38
53
58
125
189
224
272
386
560
572
613
665
1216
1249
1276
1321
1385
1905
2238
2550
4526
4683
延べ
語数
4
13
38
25
34
28
35
38
38
128
102
21
52
57
43
94
55
237
103
94
179
217
2
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
4
4
4
4
4
87%
57%
13%
38%
41%
50%
44%
25%
41%
39%
18%
72%
72%
50%
70%
53%
50%
35%
45%
49%
19%
38%
4
4
4
4
4
4
4
4
4
4
4
4
8
8
8
8
8
8
8
8
8
8
100%
79%
24%
54%
53%
67%
61%
45%
57%
49%
34%
82%
79%
67%
80%
71%
68%
48%
62%
63%
31%
50%
異なり
A 使用
B 使用
語数
語数
語数
割合
割合
注: A 使用割合は上位 2 語と 4 語の場合で B
使用割合は上位 4 語と 8 語の場合である。
22 なおる
21 とおす
20 まくる
19 いる
18 こめる
17 ぬく
16 かかる
15 でる
14 たてる
13 なおす
12 きる
11 たつ
10 いれる
9 あがる
8 あわせる
7 かける
6 つく
5 あう
4 あげる
3 つける
2 こむ
1 だす
後項動詞
占める割合(自然科学: 含技術・工学)
表 6‒3 22 後項動詞の使用頻度上位語が全体に
76
77
その結果を表 7 に示す。
三つのジャンルにおいて、22 語中 16 語(「あがる」
「あげる」
「あわせる」
「いる」
「いれる」
「かかる」
「かける」
「こめる」
「たつ」
「つく」
「つける」
「で
る」
「とおす」
「なおる」
「なおる」
「ぬく」)が、それぞれの後項動詞を含む
複合動詞の上位 8 語によって、出現総数の 50%以上を占めていることが
わかった。中でも「なおる」は、どのジャンルでも異なり語数が 8 語未満
表 7 各ジャンルにおける 22 後項動詞の延べ語数上位 8 語が全体に占める割合
後項動詞
文学
社会科学
自然科学系
1
あう
46%
49%
48%
2
あがる
74%
72%
67%
○
3
あげる
53%
68%
62%
○
4
あわせる
67%
71%
80%
○
5
いる
63%
84%
78%
○
6
いれる
76%
88%
79%
○
7
かかる
68%
81%
81%
○
8
かける
58%
72%
71%
○
9
きる
33%
57%
52%
10
こむ
29%
33%
31%
11
こめる
83%
77%
70%
12
だす
43%
49%
50%
13
たつ
64%
91%
92%
14
たてる
46%
70%
79%
15
つく
57%
75%
68%
○
16
つける
51%
61%
63%
○
17
でる
54%
71%
65%
○
18
とおす
75%
83%
91%
○
19
なおす
51%
71%
61%
○
20
なおる
100%
100%
100%
○
21
ぬく
72%
72%
80%
○
22
まくる
40%
47%
43%
*「なおる」は異なり語数が8語に満たないため、すべて 100%となっている。
** ○印は 3 ジャンルとも 50%以上の場合である。
○
○
78
で、100%となっている。以上のことから、22 後項動詞の 7 割以上の後項
動詞が、複合動詞として使われる際には、限られた前項動詞との結びつき
で用いられているということが明らかになった。
6. おわりに
本調査では、『現代日本語書き言葉均衡コーパス』(書籍コーパス)の文
学ジャンルの文章を対象に、複合動詞の後項動詞となる 22 動詞を検索し
た結果、延べ語数 129,268 語、異なり語数 3,300 語の複合動詞が抽出され
た。そのデータを資料として、22 の各後項動詞の使用傾向を調べた。そ
の結果、文学、社会科学、自然科学系(含技術・工学)のどのジャンルで
も、22 の後項動詞からなる複合動詞を見た場合、延べ語数が数万語と多
くても、無数の異なる複合動詞が用いられているのではなく、限られた数
の複合動詞が繰り返し用いられているということがわかった。今回の文学
ジャンルの調査結果は、村田(2013)の結果を支持するもので、日本語教
育の現場において、複合動詞の導入を考える際に、頻度の高いものを抽出
し、優先して教育することが可能になることを示唆している。今回は、時
間の制約により、個別の複合動詞の分析ができなかったが、今後は、後項
動詞ごとにより詳しい分析を行いたい。また、個々の後項動詞が形作る複
合動詞の特徴を、文学、社会科学、自然科学系(含技術・工学)のそれぞ
れのジャンルごとに見ていき、ジャンルによって使用傾向が異なる後項動
詞が、ジャンル判別の指標となり得るのかどうか、検証をしていきたい。
謝辞
本研究で用いたデータは、村田・山崎(2012)で抽出したデータの一部を使用し
ています。使用をご許可くださった大学共同利用機関法人人間文化研究機構国立国
語研究所准教授山崎誠氏に感謝の意を表します。
79
注
1) 本調査では、紙幅の都合により、村田・山崎(2012)では調査対象とした、
アスペクトを表す「始める」
「続ける」
「終わる」と過剰・過度を表す「すぎる」
の 4 動詞を対象外とした。
2) 村田・山崎(2012)
「4.1 複合動詞の抽出方法」p87 参照。
3)『大辞林』第三版三省堂、
『言泉』第一版小学館
4) 村田・山崎(2012)では、一部の複合動詞が可能形あるいは使役形として出
現していたため、それを文脈から判断して動詞の辞書形に戻して数えるとい
う方法を採った。しかし、社会科学の書籍について作業を進めるうちに、以
下の理由から、出現形のままで頻度を調査する方法に変更し、村田(2013)
から改めた。理由の一つは、テキストコーパスから自動的に複合動詞を抽出
したデータを使用する調査ではあるが、各語については人が個別に文脈を見
て確認する作業を行うため、態の変化まで加工作業に加えると、数多くの動
詞で辞書形に変換する作業が必要となり、データ加工の過程で誤りが増える
可能性があること、二つ目は、態の変換を行う基準が恣意的になる恐れがあ
ること、三つ目は、日本語学習者の目に触れる頻度という観点から考えれば、
出現形のままで頻度を見た方が教育上の示唆が得られやすいのではないかと
考えたことである。ただし、出現形が命令形の場合には、辞書形に戻す基準
が明確なため、辞書形にして頻度を数えることにした。ちなみに、出現形
「落ち着け。」は「落ち着く」の命令形であるが、BCCWJ では語彙素「落ち着
ける」として処理されている。
5) ここでは自然科学系ジャンル(含技術・工学)改訂版を用いている。この経
緯は村田(2013)を参照されたい。
参考文献
斎藤倫明(1992)
『現代日本語の語構成論的研究―語における形と意味―』ひつじ書
房
姫野昌子(1999)
『複合動詞の構造と意味用法』ひつじ書房
村田 年(2008)
「文章と複合動詞―論述文ジャンルを特徴づける新たな指標を探し
て―」『日本語と日本語教育』慶應義塾大学日本語・日本文化教育センター 36 号
pp. 1‒33
山崎 誠(2009)「代表性を有する現代日本語書籍コーパスの構築」人口知能学会
誌,24(5),pp. 623‒631
村田 年・山崎誠(2012)
「自然科学系書籍における複合動詞の使用傾向―後項動詞
を指標として―」
『日本語と日本語教育』慶應義塾大学日本語・日本文化教育セン
80
ター 40 号 pp83‒112
村田 年(2013)
「社会科学系書籍における複合動詞の使用傾向―後項動詞を指標と
して―」『日本語と日本語教育』慶應義塾大学日本語・日本文化教育センター 41
号 pp. 67‒95
関連 URL
「中納言」 https://chunagon.ninjal.ac.jp/
「KOTONOHA 国立国語研究所言語コーパス整備計画」
http://www.ninjal.ac.jp/kotonoha/
Fly UP