Comments
Description
Transcript
技術文書推敲支援システムの改善
技術文書推敲支援システムの改善 テーマ:コンピュータシステムの構築 教養学部 情報科学科 指導教員:松本 章代 0857136 菅井 恵美 1 研究背景および目的 本研究室では,技術文書推敲支援システムというウェブサー ビスが開発されている(図 1).このサービスは,学生自身に よる校正・推敲を支援する教育システムである.現段階では 技術文書の最低限のルールを確認する機能,わかりにくい文 章や文書全体の流れを可視化する機能がある. 私は,利用者が自身の科学・技術的文章作成能力のさらな る向上を目指し,上記で述べた機能のほかに適切な接続詞が 使われているかどうかを判断する機能を追加したいと考えて いる. 技術文書では,文と文の論理的な,あるいは意味的な関係 が読み手にはっきりと分かるように文が継続されていなけれ ばならない [1].しかし,適切な接続詞が使われていないと, 読者が分からなくなくなってしまう.これではせっかく作成 した技術文書がそれだけで台無しになる可能性がある. 不適切な接続詞が使われている場合に,それを指摘できる 機能があればこのサービスをよりよいものになるのではない かと考え,この機能の追加を提案する. 図 2: 文集合体全体を可視化した例 2 システム概要 本システムは,システム自体は Linux 上で動作しており, 開発言語は Ruby,日本語の係り受け解析には CaboCha を用 いている.グラフの描画には Graphviz を使用する. また,本システムは以下の機能が備わっている. 調査する.その特徴から,接続詞ごとに共通の法則性を見つ け,それを満たさない接続詞の使われ方を検出する仕組みを 技術文書推敲支援システムに組み込む. (1) 意図が伝わりにくい文の検出を行い,その文に対して文 単位の可視化を行う機能. 4 (2) 章または節単位の文集合全体のあらすじを可視化する機 能(図 2). (1) では文の簡潔性・一義性の観点からわかりやすい文に修 正するための指針,(2) は文集合全体の論理性を向上させる ための指針を与えることを目的とする. 不適切な接続詞を検出する機能は (2) に追加する. 図 1: 文書可視化システム 現在の進捗状況と今後の予定 まず,電子情報通信学会論文誌の論文賞受賞論文をスキャ ナで取り込み,係り受け解析を行い,接続詞前後の文を抽出 して,コーパスを作成した. つぎに,コーパスを分析し,まずは逆接の接続詞「しかし」 に着目した. 「しかし」の場合,接続詞を含む文かその直前の 文が否定文の意味合いとなることが多い.そこで, 「しかし」 を含む文かその直前の文に否定表現の助動詞「ない」が含ま れる可能性が高い,という仮説を立て,収集したコーパスを 利用して検証を行った.その結果,一方の文に「ない」が存 在し,もう一方の文に「ない」が存在しない事例は約 40%で あった.逆接とは本来,上に述べたことから予想される以外 の結果が示される関係を,あえて結びつける場合をいう.今 回の調査から必ずしも否定的な意味合いを取るものではない ことが分かった.今後は,上記の仮説のほかに,さらに別に 法則性を見つけ,検証していく.また,接続詞「しかし」以 外にもこういった法則性がないかどうか調べていき,技術文 書推敲支援システムに取り入れられるようなプログラムを作 成していく. 参考文献 3 手法 まず技術文書における接続詞の使われ方を分析する.その ために,情報系の論文誌に掲載された論文から接続詞を含む 文とその直前の文を大量に収集し,接続詞ごとの文の特徴を [1] 若林敦:理工系の日本語作文トレーニング,朝倉書店 (2000).