Comments
Description
Transcript
機械翻訳 - 長崎大学 学術研究成果リポジトリ
NAOSITE: Nagasaki University's Academic Output SITE Title 機械翻訳 Author(s) 梶原, 禎夫 Citation センターレポート, 7, pp.4-9; 1986 Issue Date 1986-12 URL http://hdl.handle.net/10069/25322 Right This document is downloaded at: 2017-04-01T01:44:52Z http://naosite.lb.nagasaki-u.ac.jp 機械翻訳 経済学部 梶 原 禎 夫 1985年版センターレポート(第 6号)に機械翻訳についての研究の紹介があり、それを 読んで人文・社会系での利用に関し、意見を述べてみたい。日本文を英訳する場合について考 えてみるが、逆に英文を邦訳する場合、他の欧文との場合についても、ここで取りあげる問題 については基本的には変わらないと思う。それは、機械翻訳の有用性に関することで、同レポ ートでもこの問題に触れており、制限された能力の範囲内で使用されるということであるが、 ここで私が取り上げる問題は、訳文の修正の必要性に関する部分である。修正が名詞、定冠調、 形容詞等の単なる入れ替えで済む場合はいいカ守、動調の入れ替えとそれに伴う何か所かの入れ 替え、さらに文章構造の修正に至る場合には、 「機械翻訳→訳文補正」の作業より、初めから 人で翻訳する方が容易で、時間もかからない。原文と訳文を同時に見ながら訳文を効率的に修 正できるのは、単なる語の入れ替え程度の場合に限られる。関連する何か所かの入れ替え、文 構造の修正が必要になると、原文をみて全部訳をする方が容易である。指導目的で、他人の英 訳を修正した経験のある者なら、初めから自分で訳した方が、完成訳に至るまでの時間が短く なる場合が多いことは分ると思う。ただ機械訳の場合は、一定の能力を備えているから、更に 能力のレベルアップが行われるなら、これまで私どもが教育上経験した個人差の多い場合とは 異なってくる。他人の英訳を補正する場合、指導という意味があるが、機械訳の修正は、処理 方式の改善に結びつくこともなしただ苦労ばかり経験することになる。つまり機械翻訳は、 語の単純入れ替え程度の修正で済むところまで能力をあげてもらわないと使用に堪えないとい うことである。 そこで提案がある。それは、翻訳に当って文の構造を単純化する方法の開発である。人文・ 社会系の文章に多いと思うが、複雑な原文の構造のままで翻訳すると、翻訳文ではさらに構造 が複雑になり、翻訳処理も困難になる筈である。翻訳文では異なる構造ーより単純な構造に変 換する方法についての事例を紹介しておこう。翻訳能力が低い場合、多数の訳文で原文に対応 する場合がみられるが、それとは若干異なることに注意してもらえればと思う。より高度の翻 訳能力を持つ場合、複雑な原文の構造をそのまま訳文で生かすことも可能であるが、果してこ れが訳文として適当かどうかの疑問が残る。適正に意味を伝え、かつ冗長性がなければ、文の 構造は単純な方がいいに決っている。 事例の「日英対訳」をみると、日本文で 1 、2 番は現在の機械訳でも適正な訳文がえられる。 3番になると多少機械訳では無理があり、 4番になると機械訳は殆ど不可能となる。 4番の英 訳文を見ると、原文と構造を変えて、単純なものとなっている。このように英訳が容易になる ような文構造変換の処理についての研究を進めてもらえたらと思う。翻訳文に適した構造への 4- 変換ができれば、翻訳機械は実用性を一挙に高めることになろう。とりあえずのところは、機 械訳の処理に入る前に原文を機械の能力に合せた構造に書き替えるという作業を入れることも できるが、文の意味を正確に把握していないとこれもかなり時閣のかかる作業となろう。また 出来上った翻訳文は分裂状態で、それを母国語とする者にとって読むに堪えないものとなって しまう恐れがある。翻訳の機械処理について何の理解もない者の意見であるが、ユーザの無理 な要求にも応えてゆくのが開発担当者の使命であろう。 日英対訳 7 ーケティングや流通のリーダーシッフ・がメーカー・レベルにあるのが適当であるという場合、 リーダーシップをもっ企業の独占的行動の問題が生じてくる。 2 I 3 市場が安定している場合は、リーダーシップを持つ企業による独占的行動が発生し易い。 I しかし、現代の市場需要は極めて流動的であり、消費者の自由な選択行動の条件下ではリーダ ーシップをもっといえども、企業の独占的行動の機会は制約されている。 4 I つまり、このモデルで述べていることは、流動する市場需要に直面している小売商等流通企業 の自由で創造的な市場行動をネットワークする高次元の 7 ーケティング政策によるリーダーシッ プの維持なのである。 When is desirable that the leadersh p of the market ng programs and the distr bution channels are taken at the manufacturer level, a new problem arises whether the corporation wh ch holds the leadership wi II carry out a monopol st ic behav or. 2 帽 ' 何 い し し し ﹄ し 内 ‘ 。 ﹄ 喝の 戸 自 し - a a a a u -f feh -Eeo ohtn nHnHAU tt . a n H φ t ea"u 'ava&目 、 , ‘ ,a ‘ , deed meer nHVE"vau ubMnawnv aaMau-k auσer‘﹂口 mh.c -D1ate .ewsl hmh AUρuvva tft dct esou-unu ents nu'hu'3nu HauAVρ u mteko t--nr HVE a u p l w Pttor ρ w ' ' ・ ea taW0 rbt1 n ・ d t I ρ u ' a n H nuρMWV C a h u o v ρw n v rmana WEdea H nnln AUr--ee nuqaρuF3 agehb 0hpr ununH ・ cee l r、 n ・g nvqanunH tddr a y n a o auhu U E E ulte- hgct -Le'lV t n H Ges 1mda 1nekm geeeh stosrr rwhe w ρ v'aea a ヨ 'a ttotb sktbmf n H V A ' e oru ee'lt H c p a b e e n 3 、叫 ヨ a &t'J om--Dvo F ν w ρ .a rrlI い 'r r e‘ Ws Retttt 目 v ν Dp.ar1 hssau anl ltlueb etoo edmrt -hues- ν d y c r Dnst tkrto rean m1mts ramrD danl emuom seIre・ d dsp ineEd n e n r s hH1vone uhoot Taereh tiPPI tCEl ηtu l When the market is stable, it is easy for the corporation with the leadersh p to be monopolist c . し ﹄ 内 ﹂ し ﹄ d nuy f o aM h ar t rs o-n vt U mB eu Ba e Tr eu n sg nn o ' -- ct s or n r cn hat TMF , a tp sa -r ens t's cg agrn ate htc cen ka ern a r a h o a k s o h v h 文 英 -5- rATLASIIを効果的に利用して頂くために」 (富士通ソフトウエア事業部 AI開発推進室機械翻訳係談より〉 1.機械翻訳システムの現状 現在の機織翻訳システムの技術では、完全で高品質な機械翻訳を実現することは困難です。 そのため、入手の翻訳に比較すると特別な処理が必要になります。これを、図 1の人間翻訳 者/¥ 制¥/ ﹄ F 駅O十よ の過犯と 1 2 1 2の機械翻訳の過程に示します。 8 │ ト │ 位 ゴ 軒 制訳 I ブラシュ 一 1アップ 官 1 l 2 O 0 ¥十/ ¥十/ .//人、¥ 文書作成者 .//、¥¥ n a t i v e s p e a k e r 1 2 1 1 人目1]翻訳の過程 O ¥十/辞嘗作成者 /〆メ、¥¥ 8 円 ; f r : +回+門+回一回 官 官 合 官 O O O O ¥十/ 〆 / 〆A、 、 文章作成者 ¥十/ , . , ^¥ 文章入力者 ¥十/ ./人、、 前編集者 医1 2 ¥十/ 〆 /J、、¥ 後編集者 。 O ¥十/ ./〆人、¥ n a t i v e s p e a k e r 機械翻訳の過程 上図の比較から分かるように、機械翻訳を人間翻訳と比較して前編集、後編集の作業が増 加します。 また、文書のコンピ旦ータへの入力も必須となるため、この作業も増える場合があります。 -6- しかし、これによって単純に機械翻訳は作業者の費用がかかり過ぎると断定することはでき ません。分業とシステムの支援により、大量翻訳の場合には、費用削減の可能性があります。 この前提のもとに、使用する立場から機織翻訳システムの現状を述べると以下のようになり ます。 r 現在の機械翻訳システムは、分野および文種を限定し、しかも、機械翻訳を使用す る知識をある程度得た人が使用して効果が上がるものである。」 これをもう少し詳細に見てみると、以下のように考えることができます。 ①分野および文種の隈定∞ー辞書作成作業の軽減 一翻訳能力の負荷の軽減 ②機械翻訳の知識の習得時一辞書作成の知識 一前編集の知識 一後編集の知識 ここでの、分野及び文種は何でも良いという分けではなく、分野に関しては専門用語辞書が完 備し、文種に関しては、 7 ニュアルの中でも操作手引書のような目的が明確でしかも短い文で 書かれたものを選択する必要があります。 この他にも、文書の入力、翻訳対象文の抽出、ヲォーマッチング情報の変換など、現状の人 手の翻訳システムとの比較から、検討しなければならない問題が多くあります。ここでは、 上の 2つの問題に限って、さらに、①を前提として機機翻訳の効果を考えてみます。また、辞 書作成も単独の作業として別にすると、②の観点から、機械翻訳の効果は、前編集と機械翻訳、 後編集のコストと人間翻訳のコストの比較により得られることになります。 以下では、日英機械翻訳での前編集、後編集、人間翻訳の作業時間について比較し、効果的 な利用方法及び、機械翻訳システムの展開について説明します。 2 . 効果的な利用方法について ここでは、まず、前編集と後編集の作業時間について、簡単に考え、次に、前編集の作業内 容を検討し、最後に、現状での効果的な利用方法をまとめてみます。 (1)前編集と後編集の作業時間の割合 前編集の程度により、前編集から後編集までの作業時間がどうなるかを測定して以下の結果 を得ました。 [前提条件] 一前編集も後編集も翻訳の知識を持つ閉じ人が実験しました。 一後編集後の翻訳品質は閉じになるようにしました。 一翻訳対象文はソフトウェアのマニュアルです。 [前編集の種類] -7- 一徹底前編集:前編集と翻訳を繰り返し、できるだけ良い結果を得るようにしました。 一簡略前編集:係り受けの制御 これらの項目に関する 主語、目的語、述語、助詞の鴻い 前編集を一回行いました。 語の書換え(慣用的なもの) 一省略 表 1 前編集と後編集の作業時間 前編集の程度 前編集時間 後編集時間 合計時間 徹底 6 0分/ P a g e 1 0 分/ P a g e 7 0分/ P a g e 簡略 9 分/ P a g e 1 7 分/ P a g e 2 6 分/ P a g e 省略 0 分/ P a g e 分/ P a g e 2 4 2 4 分/ P a g e 3 3分/ P a g e 人間翻訳 注) 笑文 200語を 1P a g eとしている。 これらの値は、原文の質と翻訳能力、前編集、後編集支援機能、作業者の知識と方法、能率 により変化します。この例では、前編集は省略した方が良いことを示しています。この前編集 の作業内容について、もう少し検討してみたいと思います。 (2)前編集の作業内容 以前(約 1年半前)に前編集の作業項目を調査した結果を以下の表に示します。前編集の内 容の詳細については rATLASII使用手引書」を参照して下さい。 表2 前編集作業項目 l 係り受けの明確化 2 前編集の作業内容 割合 説 明 4 5 .6 % 連 の 体 明 修 確 飾 化 と連用修飾の係り受け、並列句の範囲 8 . 4 5 引用,表題,説明・項番などの使い方の制隈 3 ふ句の接続関係の 7脱 連用修飾助詞の意味の明確化 4 主語,目的語,述語 6 . 3 % 主語と目的語が両方省略されている場合の補 い、述語の省略の補い 5 慣用表現 6 . 2 % 言い換え 6 表記法の違い 4 . 7 先 送り仮名、カタカナ表記の修正 7 冗長表現 . 44 % 例)-するものである。 記号の用法制限 の省略の補い 8 その他 1 5 .6 % 助詞の省略、活用語尾の省略の補い 一一一一一一 これらの項目の割合については、原文の質や翻訳能力の向上と共に変化していますが、1. -8- 3 . 4項は、現在でも、前編集の主要な項目として残っています。これらの項目の作業は、必 ずしも、機械翻訳のためにだけ行うのでなく、日本語文を明確にするために必要な作業も含ん でいます。また、これらの項目は文章の内容をはっきり理解する必要があるため、文省の内容 の知識がないと、非常に時間がかかることになります。この点は既に御指摘されたとおりです。 このことからも、日本語の原文そのものを充分に推敵することが重要になります。 ( 3 )効果的な利用方法 以上のことから、一般的にも、前編集は極力少なくした方が良いと思います。原文の質につ いては、日本語そのものを明確にする方向で解決する方が良いと考えます。 後編集については、御指摘のとおり、構文を変更しなければならない場合は、まず翻訳結果 を理解するのに時間がかかります。さらに、修正にも時間がかかります。このことから、一読 して、分からない翻訳結果を利用するのをあきらめて、最初から入手で翻訳し直すのが良いと 思います。 以上の結果は以下の 3原則にまとめることができます。 ①原文を充分に推敵する。 ②前編集は極力少なくするか、止める。 ③後編集では、翻訳結果ぞ割り切って利用する。 3 . より効果的に利用して頂くために われわれは、この 3原則をより広い範聞の分野、文種に適用できるように以下のような開発 を行っています。 翻訳品質の向上が最も重要な課題だと認識しており、着実に文法、基本辞書の充実を図って 年には、ほぼ 1月に 1回の割合で文法,辞書の改良版の提供を行ってきました。 6 おり、 61 2年には、多義語処理や概念構造変換処理の強化を行い、さらに一歩進んだ翻訳品質を目差し ています。これも文法、辞書の改良として定期的に提供する予定ですので御利用下さい。 この翻訳品質を支援する機能として、日本語文の推敵を支援する機能の開発も行っています。 また、後編集を支援する機能として、訳語選択、構文選択、用例検索などの機能の開発も進め、 62年より 1 ) 噴にお使い頂けるようにしたいと思います。 御要望の長い複雑な分を短い簡潔な文の分割についても、検討を進めており、限定された範 囲から順に提供していきたいと考えています。 -9