Comments
Description
Transcript
漢籍全文資料庫 利用の手引き
漢籍全文資料庫 利用の手引き 大東文化大学図書館 16-Dec-1998 一、漢籍全文資料庫とは 中国哲学・史学・文学といった漢学の世界では、コンピュータの導入が遅れていました。きわめて多くの漢字が必要とされるためです。 しかし、急速な技術の進展は、満足のいく形ではないにせよ約 20,000 字の漢字を日常的に利用できる環境を産みだし、ネットワ-クの 拡がりと相まって、漢学の世界にも否応なく、学的地平の転換を迫ってきているのです。 こうしたコンピュ-タを利用した最先端の漢学研究は、中華民国中央研究院の歴史語言研究所で行われています。1997 年、大東文 化大学文学部中国文学科は、歴史語言研究所との間に学術交流協定を締結しました。日本では他に東京大学が締結しているだけで す。この協定に基づき、日本では始めて、図書館において歴史語言研究所が作成した「漢学全文資料庫」を使用することができるよう になったのです。 「漢籍全文資料庫」には、中国学を研究する際のデータベースとして比類ない価値を持つ「二十五史」が含まれています。「二十五史」 とは、司馬遷が著した『史記』に始まり、中国最後の王朝となった清朝の歴史書である『清史稿』に至るまで、中国の歴代王朝が認めた 正式な歴史書(正史)を総称する呼び方です。その字数は、39,969,533 字に及びます。この膨大な史料の中から、目的とする語句を瞬 時のうちに検索し、そのままユニコードが使用できるエディタ(Windows NT のメモ帳)やワープロ(ユニコード-フォントをインストールして ある一太郎8・9やワード 98)などに張り付けることが可能となったのですから、これは中国学の方法論を変える劇的な技術革新と言え ましょう。 中央研究院が計算機処理を開始したのは 1984 年からで、現在までにネットワ-クに載せられた全文資料庫は1億1千万字を越えて います。大東文化大学では、このうち「二十五史」と「漢晉史三種」を導入しました。 漢籍全文資料庫は、原文献のすべての文字を素材とし、可能な限り原文献の版面を保存する方式で構築されています。各資料庫は、 同一の検索ソフトである「中文全文検索系統」によって、検索と閲覧の双方に対応しています。資料は、章・節・段落などの構造がその ままの形で全文入力されており、利用者は必要に応じて、「或」「且」「且非」の条件を付けながら特定の語句を検索したり、資料の正文 を呼び出して閲覧することもできるのです。もちろん、資料につけられた注や補だけを検索したり、閲覧することも可能になっています。 二、漢籍全文資料庫の使い方 1. 接続方法 「漢籍全文資料庫」への接続方法は、学内LANに接続された端末から IE4.0 を使用して行います。 i. ii. iii. iv. IE4.0 のアドレスに、http://china/と打ち込みます。これだけでは何も表示されません。 IE4.0 のメニューバーから"表示"をクリックし、プルダウン-メニューから"フォント"ないしは"文字コードセット"を選び、"繁 体字中国語(BIG5)"をクリックします。 「漢籍全文資料庫」のホームページが現れたら、「資料庫名称」から使用する資料庫を選び、資料庫の前にある丸印をク リックします。現在は、二十五史と漢晉史三種から選べます。 「開啓」ボタンをクリックします。これで資料庫に接続できました。 2. 本文の閲覧 漢籍全文資料庫では、階層的なディレクトリ構造を利用することにより、底本の章・節・段落などの構成をそのまま反映してい ます。利用者はそれに基づいて本文を調べ、あるいは検索の範囲を修正することもできます。さらに、このシステムは、底本の 頁数を表示するので、容易に原典に当たり直すことができます。 i. 底本 「二十五史」は、中華書局が出版した校点本を底本としています。現在、最も入手しやすい「二十五史」であり、校勘もし っかりしています。もちろん、校勘記もデータとして入力されています。 「漢晉史三種」は『八家後漢書輯注』『九家舊晉書輯本』『後漢紀校注』から構成され、『八家後漢書輯注』は、周 天游が輯注をした上海古籍出版社(1986 年)本を、『九家舊晉書輯本』は、湯球の輯本を楊朝明が校補をした中 州古籍出版社(1991 年)本を、『後漢紀校注』は、周天游が校注をした天津古籍出版社(1987 年)本を底本として います。本文や検索結果を学術論文に使用する際には、底本に当たり直すことが当然必要でしょう。 ii. 閲覧 1の i~iv までの要領に従って資料庫に接続したら、あとは目的の部分までクリックを続けていけばよいのです。『三國 志』巻三十五 諸葛亮傳を閲覧するまでを例に説明しましょう。 1 a. 資料庫名称から「二十五史」を選択し、「開啓」をクリックします。 b. 「二十五史」の「5.新校本三國志」をクリックします。 c. 「新校本三國志」の「2.蜀書」をクリックします。ちなみに「865」は、中華書局本の頁数です。 d. 「蜀書」の「5.巻三十五 蜀書五」をクリックします。『三國志』は宋代までは、『魏書』『蜀書』『呉書』が別々の本と されていたので、『三國志』全体で巻三十五と数える時と、『蜀書』第五と数える時があるので、それに対応してい るのです。 e. 「巻三十五 蜀書五」の「〈巻標頭〉」をクリックします。 f. 「三國志巻三十五 蜀書五 諸葛亮傳第五」の表題が出ます。表題の下の「↓」をクリックすると次の頁が出て、諸 葛亮傳の本文が始まります。「頁」ボタンをクリックすることにより、頁単位で、「段」ボタンをクリックすることにより 段落単位で表示できます。また、「↑」をクリックすると巻三十四の最後になります。こうして表れた本文を閲覧した り、必要な部分をドラッグして反転させ、コピーとペーストによってメモ帳や一太郎・ワードに張り付けることができ るのです。 もとに戻す時には、「根目録」をクリックすれば最初の目録に、「回上層」をクリックすれば一段上層に戻ることが できます。 3. 検索方法 検索したい語句は、一文字から数百文字の言葉まで自由に設定することができます。しかも、それぞれの言葉の前後に「ある いは」「かつ」などの検索条件をつけることにより、絞り込んだ検索が可能になります。検索の対象とする範囲は、小さいものでは 段落、大きいものではデータベース全体を指定することもできます。 検索の結果は、検索したことばを含む句や段落にすることが指定でき、また検索したことばの前後の決まった長さの本 文を取り出すこともできます。これらの検索の言葉とその前後の文を並べることにより、自分の目的にあった用語索引を 作成することができます。 i. 自由検索 1の i~iv までの要領に従って資料庫に接続したのち、検索條件の部分に検索したい語句を入力します。 一文字から数百文字の言葉まで自由に設定することができます。語句を入力した後に、検索の範囲を定めます。 「目録深度」を利用してもよいですし、より確実には、検索したい書名のクリックにより該当の段落を出し、チェック -ボックスにチェックをして検索範囲を定めるとよいでしょう。具体的には、「二十五史」全体を検索範囲とするの であれば、二十五史にチェックをしてから検索し(何もチェックをしないと全体が検索範囲となります)、『三國志』を 検索範囲とするのであれば、「5.新校本三國志」の部分だけをチェックします(チェックは『後漢書』と『三國志』と いう具合に複数個同時に指定できます)。『三國志』巻三十五 諸葛亮傳を検索の範囲とするのであれば、「5.新 校本三國志」をクリックして「巻三十五 蜀書5」を探し、チェックをして「執行」ボタンを押します。単純な自由検索で あれば、2~3秒で検索が終了し、結果が表示されます。 ii. 条件検索 条件検索は、一つあるいは多くの検索する言葉に条件をつけることによって、より精密な検索を行う方法です。具体的 には、次の三つの記号によって、語句を複合的に検索できます。 記号 効果 | あるいは(or) & かつ(and) ! かつ~ではない(and not)、そしてこれに続く条件は成立できない。 「&」と「!」の優先順位は同じであり、「|」はこれに次ぐものです。さらに、括弧記号( )によって優先順位を調 整して、自分が必要とする史料を的確に検索することができます。 例えば、(減|免|除|復)&(租|賦)という式を検索條件に入れて「執行」をクリックすると、検索範囲の中か ら、「減」「免」「除」「復」のうちの一つが使用されている段落で、かつ「租」「賦」のうちの一つが、使用されている段 落を検索することができます。こうして、田租や賦役に対する減免政策に関する史料を一瞬にして集めることがで きるのです。 また、ある言葉を検索した場合に、必要としない用例が大量に検索されてしまう場合があります。そうした場合に は、{ }により、検索しない字を指定することもできます。例えば、気象に関連する「風」を検索したいと考えた場合、 2 {國扶遺郷承歌八移}風{伯后師土俗教刺諫喩} という条件式を利用すると、{ }により囲まれた言葉が含まれる「國風・扶風・風伯・風后……」といった必要のな い語彙は検出されず、目的の語彙だけを検索することが可能となるのです。 iii. 検索結果の表示 「執行」をクリックして現れる検索の結果は、そのままでは検索語句が使用されている段落ごとに表示されます。検索條 件;……の下に、「找到……段,此爲第1段」とある……の部分に、全体の件数が示され、現在表示されている部分がそ の第1段目であることが分かります。検索条件の部分は、フォントの色が代わっているので、すぐに見つけることができる でしょう。この状態のまま、次々と「↓」をクリックしていけば、検索された最後の段まで、順序よく表示されていきます。 これをもう少し早く行いたい場合には、「検索報表」をクリックします。すると、検索されたすべての段落が一挙に 表示されます。ただし、検索件数が多い場合にこの方法を取ると、表示されるまでに非常に多くの時間で必要とな ります。そうした場合には、「検索條列」をクリックすることにより、検索された言葉が何という本の何頁に掲載され ているかを示す一覧表が表示されます。検索件数と自分の時間の量に応じて検索結果の表示方法を選択するこ とができるのです。 iv. ファイルへの保存と印刷 検索結果などのファイルへの保存や印刷は、すべてブラウザの機能によって行うことができます。必要な部分でファイ ル→印刷や名前を付けて保存を利用して下さい。 三、漢籍全文資料庫の限界と展望 1. 限界 「漢籍全文資料庫」は、中華民国の文字セットである BIG5 を利用して構築されています。もちろん、日本のコンピュータOSが 採用している日本語文字セットとは異なった文字の配列になっています。したがって、本来は日本語コンピュータの上では、その まま利用できないデータベースなのですが、ユニコードと呼ばれる日本語・中国語・韓国語の漢字などを統合した文字セットを利 用することによって、日本語コンピュータの上で使用できているのです。ばじめの方でも触れましたが、この文字セットが不完全 なものであるため、漢籍全文資料庫の利用にはいくつかの限界が存在します。それを認識した上で、利用することは重要なこと でしょう。 第一に、外字は表示されません。中華民国の BIG5 は、13000 字近くの漢字を使用することができますが、「二十五史」 を表現するためには、これでも漢字が足りません。そこで、歴史語言研究所では 5000 字近くの外字を用意して「二十五 史」のすべての漢字を表示することにしています。その外字のファイルは「安装造字?」をクリックすることにより、獲得する こともできますが、日本語の文字セットと、台湾の BIG5 の外字区画が異なるため、日本語 Windows 上では使用できませ ん。したがって、大東文化大学では、「漢籍全文資料庫」は外字の部分が□や空白となって表示され、検索することもで きません。日本語上で使用する限界と考えて下さい。もちろん、Windows 台湾版を入手して自分のノートパソコンにインス トールし、情報コンセント-ルームでネットワークに接続すれば、Windows 台湾版には外字をセットすることができます。そ うすれば、完全な形で「漢籍全文資料庫」を利用することができます。 第二に、検索語句に使用する漢字に制限があります。IE4.0 のユニコード機能によって、日本語により検索語句を入力 することができますが、その検索はあくまで BIG5 上で行われます。したがって、日本語に固有な漢字を使用しても検索を することはできません。具体的には「国」と入力しても検索はできず、「國」と入力する必要があるのです。しかし、すべて の漢字に旧字が用意されているわけではないため、日本語入力では表現しきれない漢字が存在することになります。こ の問題を解決するためには、日本語 Windows 上で擬似的な中国語環境を作り上げる「日中の星」や「ユニオンウェイ」と いったソフトを利用するか、一太郎8・9やワードの 98 などユニコードが利用できるワープロの日本語入力機能を使う必要 があります。しかし、これらのソフトは、図書館・情報センターの端末には、インストールされていないため、自分のノート パソコンを情報コンセント-ルームで使用する以外に方法はありません。 2. 展望 以上のような限界もありますが、「漢籍全文資料庫」が限りない可能性を秘めたデータベースであることは間違いがありません。 限界を認識した上で、自分なりの活用方法を考えていって下さい。また、図書館としても「十三経注疏」など「二十五史」以外のデ ータベースを次々と購入して「漢籍全文資料庫」を充実していく方向ですので、ご期待下さい。 3