Comments
Description
Transcript
Title 文学書籍における複合動詞の使用傾向 : 22の後項動詞を指標として
Title Author Publisher Jtitle Abstract Genre URL Powered by TCPDF (www.tcpdf.org) 文学書籍における複合動詞の使用傾向 : 22の後項動詞を指標として 村田, 年(Murata, Minori) 慶應義塾大学日本語・日本文化教育センター 日本語と日本語教育 No.43 (2015. 3) ,p.61- 80 Departmental Bulletin Paper http://koara.lib.keio.ac.jp/xoonips/modules/xoonips/detail.php?koara_id=AN00189695-20150300 -0061 慶應義塾大学 日本語・日本文化教育センター紀要 『日本語と日本語教育』43:61‒80(2015.3) 61 文学書籍における複合動詞の使用傾向 ―22 の後項動詞を指標として― 村 田 年 1. はじめに 複合動詞の後項動詞は、文章のジャンルを判別するための有効な指標の 一つとなる可能性があると考えられる(村田 2008)。本稿では、村田・山 崎(2012)、村田(2013)に引き続き、『現代日本語書き言葉均衡コーパス』 (BCCWJ)を用いて、その中の文学書籍に現れる複合動詞を対象に、22 の 後項動詞を指標として使用頻度調査を行う。 2. 研究目的 複合動詞の後項動詞が文章のジャンル判別の指標となり得るかどうかを 実証的に分析することを目的として、本稿では、文学ジャンルの文章にお ける複合動詞の後項動詞の使用傾向を明らかにする。資料としては『現代 日本語書き言葉均衡コーパス』 (BCCWJ)の書籍コーパス内の「文学」の文 章を用いる。 3. 調査対象 3.1 調査対象としての後項動詞 調査対象は、姫野(1999)を参考に選択した 22 の後項動詞である 1)。以 下に 22 後項動詞を挙げる。 〈22 後項動詞〉 (アイウエオ順) あう、あがる、あげる、あわせる、いる、いれる、かかる、かける、き 62 る、こむ、こめる、だす、たつ、たてる、つく、つける、でる、とおす、 なおす、なおる、ぬく、まくる 3.2 調査対象としての文章資料 調査に用いた資料は、『現代日本語書き言葉均衡コーパス』(以下 BCCWJ)の書籍データである。BCCWJ のデータ量は表 1 のとおりである。書 籍内は 11 に分類され、その内訳は「総記、哲学、歴史、社会科学、自然 科学、技術・工学、産業、芸術・美術、言語、文学、なし」である。各分 類の語数は表 2 に示す。なお、この調査で使用した書籍の部分についての 詳細は山崎(2009)に詳しい。 表 1 BCCWJ のデータ量 サブコーパス ジャンル 出版サブコーパス 書籍 雑誌 新聞 図書館サブコーパス 書籍 白書 教科書 広報紙 特定目的サブコーパス ベストセラー Yahoo! 知恵袋 Yahoo! ブログ 韻文 法律 国会会議録 合計 サンプル 表 2 書籍 NDC 別の語数 語数 数 (万) 10,105 2,849 1,989 443 1,479 138 10,461 3,011 1,500 488 412 93 354 400 1,377 371 91,445 1,028 52,680 1,027 253 23 346 100 159 510 172,560 10,481 書籍の NDC 別内訳 0 総記 1 哲学 2 歴史 3 社会科学 4 自然科学 5 技術・工学 6 産業 7 芸術・美術 8 言語 9 文学 分類なし 合計 語数 642,351 1,799,241 2,674,253 6,854,656 1,631,154 1,363,963 878,954 1,311,554 492,255 11,267,012 478,536 29,393,929 (注)「語数」は、コーパスの構築に際して使われている解析の言語単位である「短単位」 で数えたもの。空白、補助記号(句読点など)、記号(A、B、C、ア、イ、ウなど) を含まない数である。 4. 調査方法 4.1 複合動詞の抽出方法 複合動詞の抽出方法は村田・山崎(2012)と同様である 2)。 4.2 調査結果の整理―複合動詞の選択方法― 用字の異なりをはじめ、前項動詞の音便形の存在など、様々な問題があ 63 るため、本調査では以下の方法で見出し語としての複合動詞を選択した。 (a) 各後項動詞の用字の差異(例: あう/合う/会う)ならびに動詞の 活用変化の形(例: あわな、あいます、あう、あえば、あおう、 あって、あった等)は同定して同じ動詞項目として扱った。 (b) 複合動詞の前項動詞については、同音で用字が異なるものはコー パスの語彙素項目の用字に合わせて整理した。例えば、 「書き出す」 は「掻き出す」とは別の見出し語になっているが、「探し出す」は 「捜し出す」として一つの見出し語となっている。このように本調 査の結果としてまとめた表内の複合動詞の代表見出し項目につい ては、異なる用字の可能性も含まれている。 (c) 本調査では複合動詞の動詞としての用法を対象とするので、語彙 素項目が動詞でも、実際には名詞、副詞として用いられているも のは使用頻度からは外した。例えば、 「届出印」という語の「届出」、 「思い切って輸入する」の「思い切って」のような用法である。 (d) 前項動詞が音便形になっている語については、斎藤(1992)が指摘 するように、前項動詞が音便形になる語が必ずしも非音便形を持 つわけではなく、音便形と非音便形の意味関係も同じとは限らな い。例えば、辞書 3)で「ぶつける」は「ぶっつけるの転」という説 明があるが、実際には各語の意味するところは同一とは言えない。 前項動詞が音便形になっている語は、このように複雑な意味関係 を持つため、別の見出し語として立てた。ほかにも、「引き込む」 と「引っ込む」、 「くっ付く」と「食い付く」のような例がある。 (e) 「打ち込める」のようにその意味から考えて対応する「打ち込む」 の可能形と考えられるものがあるが、本調査では出現形のままで 数えている 4)。 (f) 動詞が三つ続く場合は最後尾の動詞を後項動詞とした。 64 5. 調査結果 5.1 結果の概要 書籍コーパスの文学ジャンルにおける 22 の後項動詞による複合動詞の 総延べ語数は 129,268 語であった。各後項動詞の使用頻度(延べ語数)は 表 3‒1 のとおりである。これまでに行った社会科学ジャンルの調査結果 (2013)ならびに自然科学系ジャンル(含技術・工学)の調査結果(2012) と比較するために、それぞれの結果を表 3‒2 と表 3‒3 に示す。 22 の後項動詞による複合動詞の総延べ語数を比較すると、圧倒的に文 学ジャンルにおける複合動詞の使用が多いことがわかる。これは、日本語 教育での現場の経験的な感覚を裏付けるものである。文学、社会科学、自 然科学(含技術・工学)の三つのジャンルでは、文学における複合動詞の 使用が最多で、社会科学、自然科学の順で少なくなっている。 次に、文学ジャンルにおける個別の後項動詞について見ていく。表 3‒1 で使用頻度が圧倒的に高いのは、20,000 語を超える「だす」 「こむ」の 2 動 詞で、これらを後項動詞とする複合動詞は、本調査における全複合動詞の 総延べ語数の約 37%を占めている。造語力の高い 10,000 語台の動詞は、 「つける」 「あげる」 「かける」の 3 動詞で、これらの語から成る複合動詞を 上記の結果と合わせれば、全複合動詞の約 63%を占める。さらに、7,000 ∼8,000 語台の「つく」 「あがる」 「あう」までの 8 動詞による複合動詞を合 わせれば全体の約 82%となり、そこに 3,000 語台の「かかる」 「きる」まで を入れれば、10 後項動詞から成る複合動詞によって全体の約 87%を占め ることとなる。つまり、文学ジャンルの書籍に出現する 22 の後項動詞の 上位 10 後項動詞を含む複合動詞で、その約 9 割がカバーされているとい うことになる。 ここで、社会科学ジャンルの調査結果(2013)ならびに自然科学系ジャ ンル(含技術・工学)の調査結果(2012)と比較してみよう。 社会科学ジャンルの調査結果(2013)では、表 3‒2 からわかるように、 65 「だす」 「こむ」の 2 動詞を含む複合動詞の延べ語数が、22 の後項動詞のい ずれかを含む複合動詞の総延べ語数の約 34%を占め、その次に造語力の 高い「あう」 「あげる」 「つける」の 3 動詞の各延べ語数を加えれば、全体の 約 61%となっている。さらに、「かける」 「いれる」 「つく」 「あがる」 「たて る」 「きる」までの頻度数上位 11 動詞を合わせれば全体の約 87%、つまり、 約 9 割がカバーされている。 一方、自然科学系ジャンル(含技術・工学)の調査結果(2012)では、 表 3‒3 のように、「だす」「こむ」の 2 動詞を含む複合動詞の延べ語数が、 22 の後項動詞のいずれかを含む複合動詞の総延べ語数の約 35%を占め、 その次に造語力の高い「つける」 「あげる」 「あう」の 3 動詞を合わせると約 61%となっている。さらに、頻度数上位 11 位までの後項動詞「つく」「か ける」 「あわせる」 「あがる」 「いれる」 「たつ」の各延べ語数を合わせれば全 体の約 88%、つまり、約 9 割がカバーされている。 このように、社会科学ジャンルならびに自然科学系ジャンルにおける上 位 11 後項動詞の相対的な使用傾向はほぼ同様の結果であった。また、上 位 11 語の内訳については、 「だす」 「こむ」 「つける」 「あげる」 「あう」 「かけ る」「いれる」「つく」「あがる」の 9 語が共通し、残りの 2 語については、 社会科学ジャンルには「たてる」 「きる」が入り、自然科学系ジャンル(含 技術・工学)では「あわせる」 「たつ」が入っていた。 文学ジャンルについても、社会科学ジャンルならびに自然科学系ジャン ルの調査と同様に、11 位の後項動詞(「いれる」)を加えて、22 の後項動詞 のいずれかを含む複合動詞の総延べ語数全体に占める割合を計算すると、 約 88%となる。11 位までの後項動詞の内訳を見ると、文学ジャンルと社 会科学ジャンルでは、10 語が共通していて、残りの 1 語として、文学ジャ ンルには「かかる」が、社会科学ジャンルには「たてる」が入っている。ま た、文学ジャンルと自然科学系ジャンルでは、9 語が共通していて、それ 以外の 2 語として、文学ジャンルには「かかる」と「きる」が、自然科学系 66 ジャンルには「あわせる」と「たつ」が入っている。 次に、社会科学ジャンルならびに自然科学系ジャンルの調査の際にも 行ったように、22 の後項動詞を大きく三つ(上位 5 語、中位 9 語、下位 8 語)に分けて、ジャンルごとにその比較を試みる。 文学ジャンルも、他の二つのジャンルと同様、上位 5 語が、6 位以下の 語に比べて、延べ語数が非常に多いと言える。最多の「だす」に「こむ」が 続くのは、他の二つのジャンルと同様である。上位 3 位から 5 位について は、 「つける」と「あげる」が共通するものの、文学ジャンルでは、 「かける」 が 5 位に、 「あう」が 8 位に入っている。他の二つのジャンルに比べて、 「か ける」の使用頻度の高さが目を引く。 中位の 6 位から 14 位の 9 語については、社会科学と自然科学系の両 ジャンルでは、語の順位に差はあるものの、9 語すべてが共通している。 一方、文学ジャンルでは 6 語(「つく」 「あがる」 「きる」 「いれる」 「たてる」 「なおす」)は他の二つのジャンルと共通しているが、それ以外の 3 語につ いては、「かける」 「つく」が上位グループに、「あわせる」が下位グループ に入っている。他の二つのジャンルでは、「あう」は上位グループに、「か かる」 「でる」は中位グループに入っている。文学ジャンルでは、中位グ ループ 9 語の中でも、上位の 3 語(6 位∼8 位)の「つく」 「あがる」 「あう」 の使用頻度の高さが際立つ。 下位グループ 15 位から 22 位の 8 語については、文学ジャンルの 15 位 「たつ」、16 位「あわせる」が、他の二つのジャンルと異なるが、それ以外 の 6 語は三つのジャンルで共通し、三ジャンルとも 20 位以下の 3 語「な おる」 「まくる」 「とおす」の使用頻度の低さが目を引く。 なお、22 の後項動詞からなる複合動詞の全語数に占める割合をジャン ルごとに比較すると、文学ジャンルでは全語数の約 1.1%(129268/11267012 =0.011)、 社 会 科 学 ジ ャ ン ル で は 全 語 数 の 約 0.6%(37620/6854656= 0.0055)、自然科学系ジャンル(含技術・工学)では約 0.8%(26104/2995117 67 =0.0077)となっている。 以上、22 の後項動詞のいずれかを含む複合動詞の延べ語数の観点から、 三つのジャンルを比較すると、文学ジャンルの使用頻度が圧倒的に高い が、各ジャンル内の 22 後項動詞を含む複合動詞の相対的な使用傾向は非 常に似た特徴を持っていると言えよう。 次に、異なり語数について見てみる。22 後項動詞の異なり語数につい ては、文学ジャンルを表 4‒1 として、社会科学ジャンルを表 4‒2 として、 自然科学系ジャンル(含技術・工学)を表 4‒3 として示す 5)。 村田(2012、2013)で、後項動詞の使用頻度が高ければ、結合する前項 動詞の種類もそれに比例して多いというわけではないことはすでに指摘し た。表 3‒1 と表 4‒1 を比較して見るとわかるように、今回の文学ジャンル の調査からもそれが確認される。異なり語を 100 語以上持つ後項動詞を上 位から見ていくと、文学ジャンルでは 10 語、社会科学ジャンルでは 7 語、 自然科学系ジャンルでは 6 語である。異なり語数上位 2 語「あう」と「だ す」は、三つのジャンルとも共通である。自然科学系ジャンルの 6 語には、 これ以外に「こむ」 「なおす」 「あげる」 「きる」の 4 語が入り、その 6 語は、 社会科学ジャンル 7 語のうちの 6 語と共通している。社会科学ジャンル 7 語は、その 6 語に「かける」が加わり、その 7 語は文学ジャンル 10 語のう ちの 7 語と共通している。文学ジャンル 10 語には、その 7 語のほかに「か かる」 「つける」 「まくる」の 3 語が加わる。 このように、異なり語数の上位の後項動詞は、延べ語数が大きく異なっ ても、三つのジャンルに共通していて、それぞれのジャンルにおける各後 項動詞の相対的な頻度順位も近いことがわかった。一方、異なり語数が極 端に低いのは「なおる」で、三つのジャンルともに際立って少ないのが目 を引く。つまり、前項動詞にバリエーションが殆どないということであ る。 次に、22 の後項動詞ごとに複合動詞の使用傾向を具体的に見ていく。 11923 10739 10504 8526 7700 7627 3272 3216 2357 2073 2013 1972 1825 1815 1348 1329 1324 683 338 332 つける あげる かける つく あがる あう かかる きる いれる たてる なおす でる たつ あわせる こめる ぬく いる なおる まくる とおす 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 129268 21852 こむ 2 合計 26500 延べ語数 だす 1 後項動詞 表 3‒1 22 後項動詞使用頻度順 (文学) 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 合計 まくる なおる とおす いる こめる ぬく かかる でる あわせる たつ なおす きる たてる あがる つく いれる かける つける あげる あう こむ だす 後項動詞 37620 100 101 120 239 361 409 500 555 719 751 961 1003 1077 1271 1953 2145 2304 3056 3499 3839 5631 7026 延べ語数 表 3‒2 22 後項動詞使用頻度順 (社会科学) 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 合計 なおる とおす まくる いる こめる ぬく かかる でる たてる なおす きる たつ いれる あがる あわせる かける つく あう あげる つける こむ だす 後項動詞 26104 38 53 58 125 189 224 272 386 560 572 613 665 1216 1249 1276 1321 1385 1905 2238 2550 4526 4683 延べ語数 表 3‒3 22 後項動詞使用頻度順 (自然科学系) 68 7 3300 44 ぬく なおる 21 22 合計 52 52 いれる とおす 19 20 58 53 たつ いる 17 18 66 61 あわせる こめる 15 16 85 76 たてる でる 13 14 90 88 あがる つく 11 12 140 127 つける まくる 9 10 185 149 あげる かかる 7 8 256 205 かける なおす 5 6 322 257 きる こむ 3 391 あう 2 4 536 異なり語数 だす 1 後項動詞 表 4‒1 22 後項動詞使用頻度順 (文学) 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 合計 なおる いる たつ とおす いれる でる ぬく こめる たてる かかる まくる あわせる あがる つく つける かける あげる なおす きる こむ だす あう 後項動詞 1884 5 22 25 27 37 38 39 40 42 46 49 50 57 61 94 100 108 113 120 176 280 355 異なり語数 表 4‒2 22 後項動詞の異なり語頻度 順(社会科学) 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 合計 なおる とおす たつ いる ぬく こめる かかる まくる でる たてる あわせる いれる つく あがる かける つける きる あげる なおす こむ だす あう 後項動詞 1635 4 13 21 25 28 34 35 38 38 38 43 52 55 57 94 94 102 103 128 179 217 237 異なり語数 表 4‒3 22 後項動詞の異なり語頻度 順(自然科学系) 69 70 ここでは対象となる複合動詞が 129,268 語と非常に多いため、便宜上、延 べ語数が 30 回以上の語だけを表 5‒1 から表 5‒5 までに頻度順に挙げる。 表 5‒1 から表 5‒5 では、各見出し後項動詞の同じ欄に、その後項動詞から 成る複合動詞の使用総数に当たる延べ語数と、異なり語数を、(7627*391) のように記してある。表 5 を見るとほとんどの後項動詞で、使用頻度が非 常に高い複合動詞は上位の限られた数の語であることに気づく。これは自 然科学系ジャンル(含技術・工学)ならびに社会科学ジャンルの調査結果 と同様である。これら上位の複合動詞の使用が当該後項動詞全体の中でど のぐらいの割合を占めているか、村田(2013)の調査と同様の方法で見て みる。 各後項動詞によって構成される複合動詞はその総数が異なるため、便宜 上、延べ語数が 1,000 語以上のものは上位 4 語の場合と 8 語の場合を、 1,000 語未満のものは上位 2 語の場合と 4 語の場合についてそれぞれ全体 数における使用割合を調べてみた。その結果を表 6‒1 に示す。なお、比較 のために社会科学ジャンルの調査結果を表 6‒2 に、自然科学系ジャンル (含技術・工学)の調査結果を表 6‒3 に挙げる。 表 6‒1 を見るとわかるように、各後項動詞の上位 4 語あるいは 2 語とい う非常に限られた数の語だけで、使用割合が全体の約 50%あるいはそれ 以上の後項動詞が 22 語中 6 語(「あがる」「あわせる」「いれる」「こめる」 「なおる」 「ぬく」)で、上位 8 語まで広げれば、22 語中 16 語(「あげる」 「い る」 「かかる」 「かける」 「たつ」 「つく」 「つける」 「でる」 「とおす」 「なおす」) に上り、後項動詞全体の約 7 割を超える。残りの 6 語(「あう」 「きる」 「こ む」 「だす」 「たてる」 「まくる」)は、上位語の全体に占める割合が低いこと から、これらの語を後項動詞とする複合動詞は相対的に使用頻度がばらけ ているということがわかる。 ここで、上位 8 語という非常に限られた数の語で、三つのジャンルに共 通して、使用割合が全体の約 50%以上を占めている後項動詞を見ていく。 71 表 5‒1 22 後項動詞による使用頻度 30 回以上の複合動詞 ( 文学ジャンル ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 あう (7627*391) 付き合う 話し合う 似合う 知り合う 向かい合う 向き合う 抱き合う 取り合う 語り合う 愛し合う 絡み合う 触れ合う 落ち合う 言い合う 重なり合う 請け合う 溶け合う 見詰め合う 寄せ合う 見合う 分かち合う 掛け合う 睨み合う ぶつかり合う 混じり合う 混み合う 遣り合う 引き合う 噛み合う 分け合う 笑い合う 関わり合う 頷き合う 揉み合う 競い合う 囁き合う 張り合う 混ざり合う 助け合う 渡り合う 握り合う 鬩ぎ合う 縺れ合う 出し合う 交わし合う 通じ合う 隣り合う 奪い合う 擦れ合う 誓い合う 991 569 499 390 333 254 252 189 176 152 131 124 122 106 103 92 89 84 82 79 79 75 73 68 66 55 54 53 51 51 49 48 47 47 44 43 43 43 39 39 37 36 35 34 32 32 31 30 30 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 あがる (7700*90) 立ち上がる 起き上がる 浮かび上がる 出来上がる 飛び上がる 盛り上がる 膨れ上がる 燃え上がる 湧き上がる 駆け上がる 浮き上がる 持ち上がる 跳ね上がる 這い上がる 召し上がる 震え上がる 吊り上がる 迫り上がる 腫れ上がる 吹き上がる 伸び上がる 仕上がる 禿げ上がる 干上がる 伸し上がる 躍り上がる 縮み上がる すくみ上がる 3195 528 482 363 345 327 220 213 205 192 186 156 115 108 98 89 68 61 61 55 49 43 42 40 37 35 34 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 あげる (10739*185) 見上げる 申し上げる 取り上げる 引き上げる 持ち上げる 込み上げる 差し上げる 作り上げる 張り上げる 拾い上げる 積み上げる 振り上げる 突き上げる 抱き上げる 掻き上げる 吊り上げる 巻き上げる 読み上げる 仕上げる 1601 941 838 708 634 415 329 260 257 238 231 214 207 190 185 179 156 143 127 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 書き上げる 吹き上げる 押し上げる 締め上げる 切り上げる 盛り上げる 捏ち上げる 跳ね上げる 打ち上げる 掬い上げる 築き上げる 仕立て上げる しゃくり上げる 引っ張り上げる 縛り上げる 吊り上げる まくり上げる 抱え上げる 摘み上げる 磨き上げる 吸い上げる 蹴り上げる 乗り上げる 調べ上げる 担ぎ上げる たくし上げる 練り上げる 結い上げる 存じ上げる 育て上げる ねじり上げる 数え上げる 撫で上げる 115 103 94 90 83 81 76 74 70 68 67 67 67 66 65 58 57 56 54 54 50 48 47 45 38 38 36 36 35 32 32 31 30 1 2 3 4 5 6 7 8 9 10 11 12 13 あわせる (1815*66) 見合わせる 居合わせる 持ち合わせる 組み合わせる 問い合わせる 重ね合わせる 待ち合わせる 突き合わせる 打ち合わせる こすり合わせる 申し合わせる 繋ぎ合わせる 示し合わせる 500 169 132 126 88 72 67 67 62 47 39 38 33 72 表 5‒2 22 後項動詞による使用頻度 30 回以上の複合動詞(文学ジャンル) 1 2 3 4 5 6 7 8 9 10 11 12 いる (1324*53) 見入る 恐れ入る 聞き入る 立ち入る 押し入る 寝入る 食い入る 分け入る 消え入る 取り入る 込み入る 感じ入る 166 145 106 98 96 74 73 71 61 57 47 45 1 2 3 4 5 6 7 8 9 10 11 12 13 14 いれる (2357*52) 受け入れる 踏み入れる 差し入れる 迎え入れる 仕入れる 取り入れる 聞き入れる 乗り入れる 申し入れる 招き入れる 引き入れる 投げ入れる 運び入れる 請じ入れる 829 301 137 132 109 109 103 81 80 77 66 46 41 33 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 かかる (3272*149) 引っかかる 襲いかかる 取りかかる 差しかかる 通りかかる 寄りかかる 飛びかかる のしかかる 降りかかる 凭れかかる 切りかかる 掴みかかる 突っかかる 出かかる 殴りかかる 倒れかかる 挑みかかる 成りかかる 461 386 304 252 242 237 172 170 132 123 63 63 52 51 49 46 33 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 かける (10504*256) 出かける 2090 話しかける 878 追いかける 694 見かける 589 呼びかける 581 仕かける 471 言いかける 424 問いかける 365 引っかける 262 語りかける 233 投げかける 223 笑いかける 219 押しかける 194 見せかける 191 持ちかける 160 微笑みかける 143 立てかける 134 成りかける 126 振りかける 85 畳みかける 74 凭せかける 72 吹きかける 71 追っかける 69 囁きかける 65 働きかける 61 浴せかける 55 吐きかける 55 開きかける 54 行きかける 49 詰めかける 48 突っかける 42 死にかける 40 忘れかける 38 吹っかける 37 ぶっかける 36 頷きかける 34 立ち上がりかける 33 傾きかける 31 射かける 30 訴えかける 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 きる (3216*322) 言い切る 仕切る 疲れ切る 断ち切る 振り切る 分かり切る 張り切る 打ち切る 成り切る 思い切る 乗り切る 突っ切る 冷え切る 踏み切る 割り切る 押し切る 取り仕切る 澄み切る 締め切る のぼり切る 乾き切る 掻き切る 信じ切る 下り切る 煮え切る 209 175 154 153 123 91 88 84 84 79 79 76 75 75 66 64 62 61 59 57 52 34 34 33 31 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 でる (1972*76) 申し出る 進み出る 突き出る 滲み出る 走り出る 流れ出る 溢れ出る 願い出る 浮き出る 抜け出る 飛び出る 躍り出る 湧き出る 吹き出る 抜きん出る 届け出る 這い出る 名乗り出る 食み出る 迸り出る 206 200 170 120 101 100 94 79 75 69 56 51 46 43 41 40 39 38 33 33 73 表 5‒3 22 後項動詞による使用頻度 30 回以上の複合動詞(文学ジャンル) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 こむ (21852*257) 覗き込む 飛び込む 突っ込む 乗り込む 飲み込む 吸い込む 思い込む 入り込む 巻き込む 考え込む 座り込む 持ち込む 踏み込む 潜り込む 押し込む 黙り込む 差し込む 放り込む 駆け込む 打ち込む 忍び込む 落ち込む 包み込む 吹き込む 滑り込む 送り込む 追い込む 射し込む しゃがみ込む 流れ込む 詰め込む 書き込む 倒れ込む 割り込む 投げ込む 食い込む 逃げ込む 抱え込む 引っ込む 屈み込む 運び込む 引き込む 咳き込む 染み込む 回り込む 取り込む 押さえ込む 連れ込む 仕舞い込む 申し込む 1048 51 995 52 899 53 821 54 784 55 602 56 546 57 546 58 509 59 493 60 414 61 387 62 380 63 370 64 357 65 317 66 311 67 311 68 294 69 270 70 269 71 263 72 259 73 259 74 251 75 245 76 243 77 242 78 230 79 215 80 209 81 203 82 202 83 201 84 195 85 187 86 187 87 185 88 185 89 181 90 179 91 162 92 161 93 156 94 154 95 133 96 131 97 130 98 127 99 126 100 引き摺り込む 紛れ込む 流し込む 嵌め込む 溶け込む 着込む 決め込む ぶち込む 仕込む 眠り込む 注ぎ込む 組み込む 沈み込む 刻み込む 転がり込む 埋め込む 切り込む 叩き込む 寝込む 信じ込む 頼み込む のめり込む 見込む 減り込む 撃ち込む へたり込む 買い込む 積み込む 話し込む 雪崩れ込む 迷い込む 攻め込む 溜め込む 張り込む 走り込む 捩じ込む 付け込む はたき込む 舞い込む 売り込む 上がり込む 教え込む 惚れ込む 聞き込む 誘い込む 振り込む 注ぎ込む 織り込む 冷え込む 刷り込む 118 118 116 116 115 113 112 112 111 105 103 100 99 97 97 95 90 90 89 87 87 86 86 86 85 84 79 78 77 73 70 67 67 65 64 63 61 61 59 58 57 52 52 49 49 48 44 43 41 40 101 102 103 104 105 106 107 108 109 1 2 3 4 5 6 7 8 挟み込む 刈り込む 彫り込む 引っ張り込む くわえ込む 使い込む 煮込む 嵌まりこむ 丸め込む こめる (1348*61) 閉じ込める 引っ込める 立ち込める 飲み込める 押し込める 封じ込める 突き込める 塗り込める 38 36 36 35 33 33 32 31 30 401 194 163 113 90 63 59 33 74 表 5‒4 22 後項動詞による使用頻度 30 回以上の複合動詞(文学ジャンル) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 だす (26500*536) 思い出す 取り出す 飛び出す 差し出す 言い出す 逃げ出す 歩き出す 乗り出す 突き出す 吐き出す 持ち出す 吹き出す 呼び出す 泣き出す 投げ出す 走り出す 放り出す 抜け出す 引き出す 切り出す 笑い出す 駆け出す 動き出す 追い出す 作る出す 踏み出す 生み出す 捜し出す 引っ張り出す 連れ出す 映し出す 聞き出す 照らし出す 送り出す 見付け出す 繰り出す 押し出す 流れ出す 食み出す 絞り出す 話し出す 運び出す 剥き出す 引き摺り出す 起き出す 降り出す 救い出す 曝け出す 溢れれ出す 考え出す 3983 2002 1301 1250 806 806 693 655 640 536 506 497 425 406 397 389 381 357 352 351 319 315 313 310 300 290 267 260 254 247 240 233 224 215 203 188 170 170 151 138 129 128 111 104 101 99 97 96 93 92 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 掘り出す 描き出す 抜き出す 震え出す 怒り出す 鳴り出す 這い出す 歌い出す 醸し出す 張り出す 打ち出す 書き出す 盗み出す 喋り出す 誘い出す 締め出す 語り出す 騒ぎ出す 湧き出す 割り出す 助け出す 選び出す 探り出す 売り出す 叩き出す 成り出す 駆り出す 迫り出す 弾き出す 踊り出す 掴み出す つまみ出す 叫び出す 漕ぎ出す 導き出す 撃ち出す 編み出す 滲み出す 浮き出す 痛み出す 貼り出す おびき出す 紡ぎ出す 89 87 87 84 81 80 80 73 73 73 72 72 67 64 63 61 60 57 56 53 52 51 51 48 47 47 46 43 43 41 41 41 40 39 37 35 34 34 32 31 31 30 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 たてる (2073*85) 掻き立てる 仕立てる 突き立てる 組み立てる 捲し立てる 駆り立てる 追い立てる 急き立てる 引き立てる 見立てる 騒ぎ立てる 並べ立てる 申し立てる 取り立てる 責め立てる 飾り立てる 言い立てる 囃し立てる 書き立てる 押し立てる 喚き立てる 煽り立てる 180 152 142 111 108 101 92 76 75 75 68 61 57 52 49 45 42 42 39 34 33 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 たつ (1825*58) 突っ立つ 下り立つ 成り立つ 飛び立つ 思い立つ 聳え立つ 奮い立つ 連れ立つ 熱り立つ 沸き立つ 切り立つ そそり立つ 浮き立つ 突き立つ 燃え立つ 237 195 192 168 136 82 78 77 73 72 60 59 57 53 48 75 表 5‒5 22 後項動詞による使用頻度 30 回以上の複合動詞 ( 文学ジャンル ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 つく (8526*88) 落ち着く 思い付く 辿り着く しがみ付く 凍り付く 張り付く 追い付く くっ付く 結び付く 取り付く 飛び付く 抱き付く 噛み付く 絡み付く 行き着く こびり付く 住み着く 縋り付く 考え付く まとわり付く 巻き付く へばり付く 焼き付く 帰り着く 染み付く 食い付く 吸い付く 寝付く 纏わり付く 突っつく 有り付く 居着く 寄り付く 食らい付く 似付く 生まれ付く 泣き付く 齧り付く 齧り付く 錆び付く 焼け付く 1 2 とおす (332*52) 見通す 押し通す 92 51 1 まくる (338*127) 喋り捲る 37 1813 749 636 421 328 313 312 281 271 252 244 236 213 156 143 140 127 126 124 123 106 102 95 90 86 83 71 63 60 51 50 49 46 45 44 39 39 38 35 35 35 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 つける (11923*140) 見付ける 2647 押し付ける 758 駆け付ける 645 睨み付ける 603 叩き付ける 417 突き付ける 357 引き付ける 318 締め付ける 313 投げ付ける 284 取り付ける 275 結び付ける 257 巻き付ける 232 押さえ付ける 221 決め付ける 196 見せ付ける 177 打ち付ける 167 張り付ける 158 聞き付ける 157 言い付ける 151 縛り付ける 148 殴り付ける 148 吹き付ける 131 遣っ付ける 129 怒鳴り付ける 123 痛め付ける 118 くっ付ける 110 落ち着ける 108 擦り付ける 107 切り付ける 104 叱り付ける 102 嗅ぎ付ける 94 括り付ける 92 撫で付ける 92 受け付ける 89 呼び付ける 89 植え付ける 87 擦り付ける 83 踏み付ける 77 書き付ける 76 辿り着ける 72 送り付ける 59 撥ね付ける 59 照り付ける 58 申し付ける 57 焼き付ける 57 寄せ付ける 55 売り付ける 54 ねめ付ける 53 刻み付ける 52 追い付ける 50 51 52 53 54 55 56 57 58 59 60 61 乗り付ける 据え付ける 備え付ける 踏ん付ける 有り付ける 漕ぎ着ける 擦り付ける 塗り付ける 寝付ける 蹴り付ける 縫い付ける 1 2 3 4 5 6 7 8 9 10 11 12 13 14 なおす (2013*205) 思い直す 取り直す 座り直す 立て直す 見直す 考え直す やり直す 書き直す 掛け直す 言い直す 出直す 持ち直す 握り直す 読み直す 161 158 154 135 129 111 105 74 68 64 57 51 43 43 1 2 3 なおる (683*7) 向き直る 立ち直る 開き直る 400 146 88 1 2 3 4 5 6 7 8 9 10 ぬく (1329*44) 引き抜く 見抜く 生き抜く 撃ち抜く 追い抜く 出し抜く 引っこ抜く 守り抜く 刳り抜く 切り抜く 341 307 90 56 51 46 36 36 35 31 50 46 43 43 37 37 37 34 32 30 30 7700 7627 3272 3216 2357 2073 2013 1972 1825 1815 1348 1329 1324 7 あがる 8 あう 9 かかる 10 きる 11 いれる 12 たてる 13 なおす 14 でる 15 たつ 16 あわせる 17 こめる 18 ぬく 19 いる 52 127 7 53 44 61 66 58 76 205 85 52 322 149 391 90 88 256 185 140 257 536 2 2 2 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 43% 19% 80% 39% 60% 65% 51% 43% 35% 30% 28% 59% 21% 43% 32% 59% 42% 40% 38% 39% 17% 32% 4 4 4 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 57% 30% 96% 63% 72% 83% 67% 64% 54% 51% 46% 76% 33% 68% 46% 74% 57% 58% 53% 51% 29% 43% 異なり 語数 A 割合 語数 B 割合 語数 注: A 使用割合は上位 2 語と 4 語の場合で B 使用割合は上位 4 語と 8 語の場合である。 332 8526 6 つく 22 とおす 10504 5 かける 338 10739 4 あげる 21 まくる 11923 3 つける 683 21852 2 こむ 20 なおる 26500 1 だす 後項動詞 延べ 語数 占める割合【文学】 表 6‒1 22 後項動詞の使用頻度上位語が全体に 100 101 120 239 361 409 500 555 719 751 961 1003 1077 1271 1953 2145 2304 3056 3499 3839 5631 7026 49 5 27 22 40 39 46 38 50 25 113 120 42 57 61 37 100 94 108 355 176 280 2 2 2 2 2 2 2 2 2 2 2 4 4 4 4 4 4 4 4 4 4 4 16% 86% 58% 49% 39% 40% 38% 46% 39% 75% 47% 36% 46% 59% 60% 75% 49% 45% 58% 37% 19% 36% 4 4 4 4 4 4 4 4 4 4 4 8 8 8 8 8 8 8 8 8 8 8 32% 99% 71% 64% 58% 56% 58% 57% 55% 83% 59% 57% 70% 72% 75% 88% 72% 61% 68% 49% 33% 49% 異なり 語数 A 割合 語数 B 割合 語数 注: A 使用割合は上位 2 語と 4 語の場合で B 使用割合は上位 4 語と 8 語の場合である。 22 まくる 21 なおる 20 とおす 19 いる 18 こめる 17 ぬく 16 かかる 15 でる 14 あわせる 13 たつ 12 なおす 11 きる 10 たてる 9 あがる 8 つく 7 いれる 6 かける 5 つける 4 あげる 3 あう 2 こむ 1 だす 後項動詞 延べ 語数 に占める割合【社会科学】 表 6‒2 22 後項動詞の使用頻度上位語が全体 38 53 58 125 189 224 272 386 560 572 613 665 1216 1249 1276 1321 1385 1905 2238 2550 4526 4683 延べ 語数 4 13 38 25 34 28 35 38 38 128 102 21 52 57 43 94 55 237 103 94 179 217 2 2 2 2 2 2 2 2 2 2 2 2 4 4 4 4 4 4 4 4 4 4 87% 57% 13% 38% 41% 50% 44% 25% 41% 39% 18% 72% 72% 50% 70% 53% 50% 35% 45% 49% 19% 38% 4 4 4 4 4 4 4 4 4 4 4 4 8 8 8 8 8 8 8 8 8 8 100% 79% 24% 54% 53% 67% 61% 45% 57% 49% 34% 82% 79% 67% 80% 71% 68% 48% 62% 63% 31% 50% 異なり A 使用 B 使用 語数 語数 語数 割合 割合 注: A 使用割合は上位 2 語と 4 語の場合で B 使用割合は上位 4 語と 8 語の場合である。 22 なおる 21 とおす 20 まくる 19 いる 18 こめる 17 ぬく 16 かかる 15 でる 14 たてる 13 なおす 12 きる 11 たつ 10 いれる 9 あがる 8 あわせる 7 かける 6 つく 5 あう 4 あげる 3 つける 2 こむ 1 だす 後項動詞 占める割合(自然科学: 含技術・工学) 表 6‒3 22 後項動詞の使用頻度上位語が全体に 76 77 その結果を表 7 に示す。 三つのジャンルにおいて、22 語中 16 語(「あがる」 「あげる」 「あわせる」 「いる」 「いれる」 「かかる」 「かける」 「こめる」 「たつ」 「つく」 「つける」 「で る」 「とおす」 「なおる」 「なおる」 「ぬく」)が、それぞれの後項動詞を含む 複合動詞の上位 8 語によって、出現総数の 50%以上を占めていることが わかった。中でも「なおる」は、どのジャンルでも異なり語数が 8 語未満 表 7 各ジャンルにおける 22 後項動詞の延べ語数上位 8 語が全体に占める割合 後項動詞 文学 社会科学 自然科学系 1 あう 46% 49% 48% 2 あがる 74% 72% 67% ○ 3 あげる 53% 68% 62% ○ 4 あわせる 67% 71% 80% ○ 5 いる 63% 84% 78% ○ 6 いれる 76% 88% 79% ○ 7 かかる 68% 81% 81% ○ 8 かける 58% 72% 71% ○ 9 きる 33% 57% 52% 10 こむ 29% 33% 31% 11 こめる 83% 77% 70% 12 だす 43% 49% 50% 13 たつ 64% 91% 92% 14 たてる 46% 70% 79% 15 つく 57% 75% 68% ○ 16 つける 51% 61% 63% ○ 17 でる 54% 71% 65% ○ 18 とおす 75% 83% 91% ○ 19 なおす 51% 71% 61% ○ 20 なおる 100% 100% 100% ○ 21 ぬく 72% 72% 80% ○ 22 まくる 40% 47% 43% *「なおる」は異なり語数が8語に満たないため、すべて 100%となっている。 ** ○印は 3 ジャンルとも 50%以上の場合である。 ○ ○ 78 で、100%となっている。以上のことから、22 後項動詞の 7 割以上の後項 動詞が、複合動詞として使われる際には、限られた前項動詞との結びつき で用いられているということが明らかになった。 6. おわりに 本調査では、『現代日本語書き言葉均衡コーパス』(書籍コーパス)の文 学ジャンルの文章を対象に、複合動詞の後項動詞となる 22 動詞を検索し た結果、延べ語数 129,268 語、異なり語数 3,300 語の複合動詞が抽出され た。そのデータを資料として、22 の各後項動詞の使用傾向を調べた。そ の結果、文学、社会科学、自然科学系(含技術・工学)のどのジャンルで も、22 の後項動詞からなる複合動詞を見た場合、延べ語数が数万語と多 くても、無数の異なる複合動詞が用いられているのではなく、限られた数 の複合動詞が繰り返し用いられているということがわかった。今回の文学 ジャンルの調査結果は、村田(2013)の結果を支持するもので、日本語教 育の現場において、複合動詞の導入を考える際に、頻度の高いものを抽出 し、優先して教育することが可能になることを示唆している。今回は、時 間の制約により、個別の複合動詞の分析ができなかったが、今後は、後項 動詞ごとにより詳しい分析を行いたい。また、個々の後項動詞が形作る複 合動詞の特徴を、文学、社会科学、自然科学系(含技術・工学)のそれぞ れのジャンルごとに見ていき、ジャンルによって使用傾向が異なる後項動 詞が、ジャンル判別の指標となり得るのかどうか、検証をしていきたい。 謝辞 本研究で用いたデータは、村田・山崎(2012)で抽出したデータの一部を使用し ています。使用をご許可くださった大学共同利用機関法人人間文化研究機構国立国 語研究所准教授山崎誠氏に感謝の意を表します。 79 注 1) 本調査では、紙幅の都合により、村田・山崎(2012)では調査対象とした、 アスペクトを表す「始める」 「続ける」 「終わる」と過剰・過度を表す「すぎる」 の 4 動詞を対象外とした。 2) 村田・山崎(2012) 「4.1 複合動詞の抽出方法」p87 参照。 3)『大辞林』第三版三省堂、 『言泉』第一版小学館 4) 村田・山崎(2012)では、一部の複合動詞が可能形あるいは使役形として出 現していたため、それを文脈から判断して動詞の辞書形に戻して数えるとい う方法を採った。しかし、社会科学の書籍について作業を進めるうちに、以 下の理由から、出現形のままで頻度を調査する方法に変更し、村田(2013) から改めた。理由の一つは、テキストコーパスから自動的に複合動詞を抽出 したデータを使用する調査ではあるが、各語については人が個別に文脈を見 て確認する作業を行うため、態の変化まで加工作業に加えると、数多くの動 詞で辞書形に変換する作業が必要となり、データ加工の過程で誤りが増える 可能性があること、二つ目は、態の変換を行う基準が恣意的になる恐れがあ ること、三つ目は、日本語学習者の目に触れる頻度という観点から考えれば、 出現形のままで頻度を見た方が教育上の示唆が得られやすいのではないかと 考えたことである。ただし、出現形が命令形の場合には、辞書形に戻す基準 が明確なため、辞書形にして頻度を数えることにした。ちなみに、出現形 「落ち着け。」は「落ち着く」の命令形であるが、BCCWJ では語彙素「落ち着 ける」として処理されている。 5) ここでは自然科学系ジャンル(含技術・工学)改訂版を用いている。この経 緯は村田(2013)を参照されたい。 参考文献 斎藤倫明(1992) 『現代日本語の語構成論的研究―語における形と意味―』ひつじ書 房 姫野昌子(1999) 『複合動詞の構造と意味用法』ひつじ書房 村田 年(2008) 「文章と複合動詞―論述文ジャンルを特徴づける新たな指標を探し て―」『日本語と日本語教育』慶應義塾大学日本語・日本文化教育センター 36 号 pp. 1‒33 山崎 誠(2009)「代表性を有する現代日本語書籍コーパスの構築」人口知能学会 誌,24(5),pp. 623‒631 村田 年・山崎誠(2012) 「自然科学系書籍における複合動詞の使用傾向―後項動詞 を指標として―」 『日本語と日本語教育』慶應義塾大学日本語・日本文化教育セン 80 ター 40 号 pp83‒112 村田 年(2013) 「社会科学系書籍における複合動詞の使用傾向―後項動詞を指標と して―」『日本語と日本語教育』慶應義塾大学日本語・日本文化教育センター 41 号 pp. 67‒95 関連 URL 「中納言」 https://chunagon.ninjal.ac.jp/ 「KOTONOHA 国立国語研究所言語コーパス整備計画」 http://www.ninjal.ac.jp/kotonoha/