...

奈良女子大学附属図書館における電算システムの概要 ILIS と NCAT

by user

on
Category: Documents
2

views

Report

Comments

Transcript

奈良女子大学附属図書館における電算システムの概要 ILIS と NCAT
Nara Women's University Digital Information Repository
Title
奈良女子大学附属図書館における電算システムの概要 ILISと
NCAT
Author(s)
岡田, 暎子
Citation
岡田暎子:奈良女子大学情報処理センター広報, Vol. 4, pp. 93-109
Issue Date
1992-03
Description
URL
http://hdl.handle.net/10935/3791
Textversion
publisher
This document is downloaded at: 2017-03-31T21:08:12Z
http://nwudir.lib.nara-w.ac.jp/dspace
利用の事例
奈良女子大学附属図書館における電算システムの概要
ILIS と NCAT
附属図書館岡田瑛子
当情報処理センターの開設と同時に本学図書館も電算化を開始し、センターの機種更新を終えた
今年、図書館も揺藍期をなんとか越したという感じで、ここに「電算システムの概要」といえるよ
うな、まとまったものを報告できることは幸せなことである。これは、いうまでもなく、前センター
長藤原教授、理学部横村教授など、本当に多くの方々からあたたかいご指導を頂くことができたと
いう幸運に恵まれた結果である O 先ず、紙面を借りて、このような多くの方々に感謝を申し上げた
し
、
。
ここでは、学術情報センターと本学図書館の電算化、そして奈良女子大学蔵書検索システム
<NCAT
>のシステムの成り立ちについて、その概要の説明をしたい。 ILISの利用者は図書館関
係者だけであるのに対して、 NCATの利用者は広範囲にわたるということから、 NCATの方に多
くの紙面を割いていることをご了承頂きたい。
1.学術情報センターと本学図書館の電算化
NACSIS-IRを利用している方には、 JBCAT、FBCAT、JSCAT
、FSCATという名のデータベー
ス名をご存知の方もあろう。学術情報センターが提供している、我が国の大学図書館等が所蔵して
いる図書・雑誌の総合目録情報データベースである O
このデータベースと大学図書館の電算化は深く関わっている。
1- 1 NACSIS-CATと本学図書館
奈良女子大学の蔵書データベースにおける冊数は、図書約 1
4万冊、雑誌約 7
6
0
0種(平成 4年 3
月現在)である。この図書 1
4万冊のうち約 1
3万冊は、雑誌ではその殆どのデータは、奈良女子大
学附属図書館の館員の力だけでできたものではない。それは、本学の図書館員を含む、全国の大学
図書館員が共同で、つくったものである。学術情報センターの NACSIS-CAT(目録所在情報サービ
ス)がそのシステム名である。
全国の大学図書館員がどのようにして共同の作業を行なうのか。大学図書館以外の方々にはこれ
について知る機会も少ないと思われるので、先ずここで NACSIS-CATにおけるデータのっくり
方について少し説明させていただこう。
①先ず、学術情報センターのデータベースを検索する。入力しようとする資料(図書、雑誌〉
に該当するものがあれば、それについての所蔵データ(その図書館に所蔵していることを示す
9
3
記録)だけ入力する O この際、書誌データ(書名や著者など、その資料の内容を示す記録)に
不十分な部分があれば、データの修正をすることもある。
②学術情報センターのデータベースに該当するものがなければ、システムが自動的に参照デー
タベースを検索する。ここに該当するものがあれば、そのデータを利用して…不十分な部分が
あれば修正や補足などして…学術情報センターのデータベースに書誌データとして登録し、そ
の上で、その書誌データについてその図書館の所蔵データを入力する。この時点で、(多分、
他の)図書館の館員がその同じ資料についての入力をしようとする場合は①のケースになる。
参照データベースには、和図書の場合 JP-MARC (国立国会図書館の MARC、
) TRC-
MARC(業者 MARC)、洋図書の場合 LC-MARC(アメリカ L
i
b
r
a
r
yo
fC
o
n
g
r
e
s
sの MARC
、
)
UK-MARCC
英国図書館の MARC)、和雑誌の場合 JP-MARC、洋雑誌の場合 LC-MARC
がある。
③参照データベースにも該当するものがなければ、オリジナル入力ということになる O ワープ
ロ方式で、自分の手で入力して、学術情報センターのデータベースに書誌データとして登録、
その上で、所蔵データを入力する。この時点で、次の入力者の場合は①のケースになる O
本学図書館の場合で見ると、入力件数に対する該当件数はほぼ以下のようである。
和図書の場合①のケースが約 95% ②が約 4 % ③が約 1%
洋図書の場合①
65% ②
(英語のものに限ると
10% ③
35%
①が 90%)
このようにしてつくられた学術情報センターの総合目録情報データベースにおける件数は、平成
和図書書誌データ
6
0万
洋図書
oot
和雑誌
所蔵データ
−
洋雑誌
万万万
4年 3月現在
4
0
0万
2
6
0万
1
5
0万
9
0万
NACSIS-CATでサポートされる文字は J
I
S第 1水準、第 2水準文字である。拡張文字(外字)
はサポートされない。その理由は、学術情報センターを利用する大学図書館が使用する電算機機種
は様々であり、拡張文字の互換性が全くないからである。
英字の場合、独語や仏語等のウムラウトやアクサン等が付く字は使用頻度が高いことから、 NVT
拡張文字(約 6
0
0種)として特定のコードが設定され、電算機の機種を問わず、学術情報センター
との UIP (後述)において同ーのコードを使用する。画面表示のための共通の文字フォントも造
られている。
漢字の場合、拡張文字はサポートされないが、拡張文字に該当する字は全く扱えないでは困るの
で、その入力のために次のような、特別の約束が決められている O
先ず、「基本辞書」として「大漢和辞典〈諸橋轍次編)」、「広漢和辞典(諸橋轍次他編)」「新字
源(小川環樹他編)」が定められている。これらの基本辞書の検字番号を用いて、それがどの文字
9
4
であるかを示す。例えば、「内田百+D41248~砂」となっているデータは、「大漢和辞典」の検字番
号 41248に該当する字は「開」であるので、「内田百関」だということになる。「大漢和辞典」は
D、「広漢和辞典」は K、「新字源」は Sの記号が付されることになっている。
中国語の簡体字、ハングル文字等は、現在のところ、汎用的な文字コードを持たないために、サ
ポートされていない。国際的な言語事情もからみ、今後の大きな課題となっている。
簡体字や拡張文字がサポートされていないため、中国語資料、漢籍は学術情報センターのデータ
ベースには殆ど入力されていない。これは本学図書館でも同様である。ただし、本学内のシステム
においてだけであれば JEFコードの拡張文字がサポートされるので、「叢書集成初編」、「百部叢
書集成」(約 1
0
.
0
0
0余冊)に限り、本学蔵書データベースに入力されている。これは、 NACSIS-
CATを利用しない、全くのローカル入力によるものである。
1-2 I
l
lSのシステム構成……蔵書データベース構築のための
NACSIS-CATは学術情報センターのシステムである。学術情報センターとデータのやりとり
を行うためには各大学図書館側に UIP(
U
s
e
rI
n
t
e
r
f
a
c
eProgram)が必要となる。全国の大学図
書館で使用される電算機機種のメーカーは様々であり、各大学側の UIPはそれぞれのメーカーが
それぞれに用意することになる。本学図書館では富士通提供の UIP(ILIS-NVT)を使用してい
る
。
本学図書館が使用する図書館システムは、富士通の総合図書館パッケジソフトウェア ILIS (
あ
いりす…I
n
t
e
g
r
a
t
e
dL
i
b
r
a
r
yI
n
f
o
r
m
a
t
i
o
nSystem)である。
ILISの業務機能には、蔵書データベース構築部分である目録作成、そして図書受入、雑誌受入、
閲覧などがある O
本学図書館の電算システムは、この ILISでカバーされる部分の以外にも、冊子体目録サービス
などがあるが、ここでは目録作成…蔵書データベースの構築に関する部分を、 UIPを中心として、
パッケジソフトウェア ILISについてその概略を説明しよう。
1- 2- 1 U IP (
U
s
e
rI
n
t
e
r
f
a
c
e Program)
学術情報センターとの接続は Nlネットを介している。
学術情報センターとの送受信で使用される文字コードは、 1バイト文字(カタカナ、英小文字、
数字、記号など)は J
I
S8単位系コード、 2バイト文字(漢字など)は J
I
S コードである。これ
に対して、奈良女子大学の ILISにおけるホスト( M 7
7
0)では、 1バイト文字は拡張 EBCDIC
(英小文字ベース)、 2バイト文字は JEFコードを使用している。また、 ILISにおけるローカル
(図書館内の端末 FMR)では、 1バイト文字は JIS8単位系コード、 2バイト文字は JEFコード
を使用する。
このように、扱う文字コードに違いがあることから、 ILISの UIP (ILIS-NVT)では図のよ
うなコード変換をおこなっている。
9
5
コ
(FMR)
コ
IL IS
ド
変
ホスト
(M770)
換
ド
変
換
学術情報センター
ILISローカ jレ
ILISにおけるホストとローカル間のデータ転送には DUET会話ライブラリが使用される。この
場合、ローカル側端末はパソコンの OS(APCS)の下で動いている。
学術情報センターで、また ILISのローカル側で、 1バイト文字に JIS8単位系コードが使用され
るのは、画面上で、半角のカタカナ、英小文字を混在で表示することを可能にするためである。
NACSIS-CATでは、カタカナは半角で扱うことになっている。
このようなデータのやりとりをしながら、学術情報センターのデータベースに書誌デー夕、所蔵
データを登録することになるが、同時に奈良女子大学側にもダウンロードを行う。ダウンロードデー
タは、直接に蔵書データベースにではなく、一旦ホスト( M770)配下の中間ファイルに格納され
る
。
UIPの中にコマンドテーブルをもち、書誌デー夕、所蔵データを学術情報センターに登録する
コマンドが発行される時、先に中間ファイルにデータを落し込むコマンドを自動的に発行し、その
後、学術情報センターへデータを送信するコマンドが機能するようにされている O
また、所蔵データ入力画面では、奈良女子大学のローカルな所蔵データをデフォルト表示してい
る。異なる場合にだけ、その部分を修正すればよいようにするためのものである。
書誌データ表示画面から所蔵データ入力画面へ移行するコマンドが発行された時、画面表示の直
後にデフォルトのプログラムが CALLされる。このプログラムでは、和図書、洋図書の画面判定
をし、それに従って、それぞれのデフォルトデータを、それぞれ所定の項目に表示する。端末の前
のオペレーターの眼には、始めからデフォルトデータをもった画面が表示されるように見える O こ
の画面デフォルトのプログラムは、遡及入力を促進するためにつくられた、本学図書館の自館開発
による外付けプログラムである O
1-2-2 I
l
lSの蔵書データベースへの入力
中間ファイルに格納されたダウンロードデータから ILISデータベースへ入力するわけだが、先
ずそのための編集が行われる。
中間ファイルのレコード形式は VBS、画面データがそのままのイメージで格納されている。こ
のファイルから一旦別の作業ファイルに移されるが、この段階で、一画面データから各画面項目
(書名、著者、出版事項など)ごとのレコードに切り分けられる。この作業ファイルから ILISデー
タベースへ入力するわけだが、各項目ごとのレコードは、この段階で更に、例えば、書名項目であ
9
6
れば本書名、副書名などに、出版事項であれば、出版地、出版者、出版年などに、それぞれ細分化
されたかたちで入力される。
ILISの DBMSは AIM-RDB。データセット編成は VSAM。リレーショナル・データベース
である。従って、データベース中はテーブル形式で管理されている O データベース操作言語は AQLo
DBMS用言語として国際的に標準化されている SQLに準拠したものである。
ILISデータベースで使用する文字コードは、 1バイト文字は拡張 EBCDIC、 2バイト文字は
JEFコードである。データベース中では JEFコード、拡張 EBCDICの混在となっている。
拡張 EBCDICが使用されるのは、半角のカタカナ、英小文字を混在させるためである。漢字、
ひらがなは JEFコード。カタカナ、英大文字、英小文字、その他の記号は拡張 EBCDICである。
英字のウムライト、アクサンなどの付く NVT拡張文字は、ホスト(M770)において JEFコード
の外字として、 NVTコードのそのままで管理されている。
中間ファイルから ILISデータベースへ入力する処理は、ほぼ毎日の夜間にパッチ処理として行
われる。午後 8時 5
0分に、 ILISデータベースへの一括入力のパッチジョブが自動的にスタートす
る。これは富士通の自動運転機能システム AOFを利用したものである。
2. N C AT……そのシステムの成り立ち
奈良女子大学蔵書検索システム<NCAT>は、研究室など図書館外の電算機端末から本学の蔵書
を検索することができるようにするための、本学図書館の自館開発による OPAC (
O
n
l
i
n
eP
u
b
l
i
c
A
c
c
e
s
sC
a
t
a
l
o
g
u
e)である O <NCAT
>は FAIRS-Iとその検索のために特別仕様を加えた検索シ
ステムの呼称、である。
2-1
NGATデータベース
NCATのデータベースシステムは FAIRS-Iである。 FAIRS-Iは富士通が提供する対話型情
報検索システムで、当情報処理センターのユーザ IDをもっ者であれば誰で、も、検索もできるし、
またそのデータベースをつくることもできる O 本学図書館もセンターのユーザーとしてこれを利用
したものである。(当広報創刊号文学部戸祭助教授「データベース<地理学文献 情報>について」
J
参照)
2-1-1
N C ATデータベースの構成
NCATデータベースはほぼ以下のような構成となっている。以下の記述は、おおよそ、 FAIRS
データベース作成の手順を追ったものである O
使用文字コードは、 1バイト文字は拡張 EBCDIC。これは勿論、半角のカタカナ、英小文字混
在で使用するためである。 2バイト文字は JEFコードと決まっている。
検索するときに使う英字は、大文字であると指定している O この指定に従って、インデックスの
中の英字は、 FAIRSによってすべて大文字として管理されている O
9
7
NCATは OPACB (図書)、 OPACZ(雑誌)という 2つのデータベースをもっている。 OPACB
は WBFILE (和図書入 YBFILE(洋図書)、 OPACZは WZFILE(和雑誌)、 YZFILE (洋雑誌)
という、それぞれ 2つのサブファイルで構成される。
サブファイルを構成する項目は以下の通りである。(全サブファイルほぼ共通)
<項目名> <文字属性>
<内
容>
TR
日本語
AUTH
日本語
編者(雑誌のみに使用)
VOL
日本語
巻(雑誌のみに使用)
PUB
日本語
出版地、出版者、出版年
PHY
日本語
形態(大きさ、頁数)
SER
日本語
シリーズ名など
VTR
日本語
各巻書名など
cw
*注 3
(キ一項目)
書名、著者表示、版、巻表示
日本語
注記
CLS
英数カナ
分類番号
ISBN
英数カナ
国際標準図書番号
ISSN
英数カナ
国際標準雑誌番号
HOLD
日本語
所蔵事項(所蔵場所、請求記号等)
YOMI
英数カナ
書名のヨミ( SORTのためのもの)
PLAZ
日本語
所蔵場所(図書館、研究室など)
HNO
英数カナ
登録番号(業務用に使用)
CALL
英数カナ
請求記号
USR1
英数カナ
特殊記号
NCNO
英数カナ
学情書誌番号(業務用に使用)
YEAR
英数カナ
出版年
SPUB
英数カナ
出版者
NPUB
日本語
出版者
SRRR
英数カナ
書名に関する事項
SNRR
日本語
書名に関する事項
SSAL
英数カナ
著者に関する事項
SNAL
日本語
著者に関する事項
SSSH
英数カナ
件名(テーマ名)
SNSH
日本語
件名(テーマ名)
9
8
。
。
。
00000
日本語
NOTE
0000 000
内容著作など
資料形態(ビデオなど)
。
000
日本語
FORM
*注 1
00000
英数カナ*注 2
00000
B
I
BNO
<標準出力><検索対象>
*注 1 標準出力とは、画面表示の際、わざわざ出力指定しなくても表示される。この指定がな
い項目は、画面表示のためにはその都度出力の指定が必要となる O
*注 2 英数カナ属性は、 1バイト文字のみが許される。
*注 3 日本語属性は、 2バイト文字だけでなく、 1バイト文字の混在も許される。
すべての項目は文字形式項目である O
検索対象の項目は FAIRSによってインデックスが作成される。その際、日本語項目であれば、
データ中の 1バイト文字は 2バイト文字に変換されたかたちでインデックスが作成される。
NCATの項目の中で検索対象となっていない項目は、画面表示のためだけの項目である。項目
は標準出力の指定をし、且つ検索対象とすることができるが、 NCATでこの両方の指定があるの
は項目 CLSのみである O 画面表示だけのための項目と検索対象だけのための項目と、いわば、同
じ内容のデータを 2重にもっていることになる。また、例えば、項目 SRRR と SNRRなど、同
じような内容の項目が 2つず、つあるものがある。 NCATは、何故このような設計なのか。次節以
下の詳しい説明をお読みいただきたい。
2-1-2 NCATデータベースの設計
NCATデータベースは ILISデータベースをもとに入力することになるが、 FAIRSシステムの
項目にするために、データ変換、フォーマット変換など、いくつかの処理を行う。 FAIRS型に編
集したファイルを作成し、 FAIRSシステムによるファイル入力を行っている O どのような編集を
行なうか。まず、 NCATの設計上の考え方を説明したい。
2-1-2-1 文字
NCATは当情報処理センターの TSSの下で利用されることになるが、当センターの TSSでは、
画面表示に関しては、インタフェースコードは英小文字ベースかカナベースかのどちらか一方にな
る
。
英小文字ベースは半角の英小文字を表示することができるものである。この場合、半角のカタカ
ナは正常に表示されない。カナベースは半角のカタカナを表示することができるものであり、この
場合、半角の英小文字は大文字になって表示される。
NCATはインタフェースコードを英小文字ベースで使用するように設計しである O
カナベースで使用すると、英小文字はすべて大文字として表示されることになる。洋図書、洋雑
誌などの英大文字、小文字混じり文を画面で見る場合、英小文字が英小文字のままで表示されたも
のと、全部が大文字になって表示されたものでは、その違いを直接比べてみた者には一目瞭然であ
る。大文字、小文字混じりの文の方が見やすいのである。では、英字をすべて全角文字に変換した
らどうか。大文字、小文字混じり文の状態は変わらないことになる O しかし、これも違いは一目瞭
然である。
このような理由で、 NCATはインタフェースコード英小文字ベースで使用されることを想定し
9
9
て設計しである。本学の TSS端末の大半が英小文字ベースで使用されていることは、 NCATにとっ
て幸運であった。
一方、このために、 NCATでは、半角のカタカナは正常に画面表示することができない。した
がって、標準出力項目については、カタカナは表示することができる全角文字に変換することが必
要になる。
前述のように、 ILISデータベースでは JEFコード、拡張 EBCDICコードの混在となっている O
このような状態の拡張 EBCDICを JEFコードに変換するアプリケーションはメーカー提供のもの
にはない。まして、その中からカタカナだけを選択して変換するプログラムはない。ないので、自
館で開発した。 NCATでは、標準出力項目であれば、英字は半角の大文字、小文字混じり文(英
字拡張文字が含まれる)で、日本語は漢字、ひらがな、カタカナすべて正常に画面表示することが
できる。いかにも自慢しているようだが…その通り、これは NCATの自慢なのである。
検索対象だけの項目の場合は、すなわち標準出力項目でないものは、カタカナは半角のままとなっ
ている。理由は、言うまでもない、データ長において 1バイト文字は 2バイト文字の半分以下であ
り、その分ファイル容量を節約できるからである。
英字のウムラウトやアクサンなどが付く NVT拡張文字については、そのコードのままでは、 ILIS
のソフトがインストールされている端末以外では画面表示することができない。このため、その同
じ文字を示す JEFコード(非漢字拡張文字)に変換しである。 NVT拡張文字は約 6
0
0種、それ
に対応する JEFコードは約 6
0種だが、文字の使用頻度に偏りがあるので、ほぼ 99%U
上がカバー
されている。したがって、拡張文字フォントを備えた富士通製の端末であれば、これらの文字は正
常に画面表示される O
2-1ー 2-2 検索対象のためだけの項目
NCAT設計の際、検索画面の項目を書名、著者、出版者、キーワード、所蔵場所、分類等と決
めた時に、このうちではキーワード項目が最も多く利用されるであろうと設計者は予想した。その
理由は、設計する当人が、自分であればキーワードで検索したいと考えたからという単純なもので
あるが、この予想は間違っていなかった。 NCAT設計の中心は「キーワード」項目である O
NCATでは、検索画面のどの項目がデータベースの中のどの項目を検索するかは、検索プログ
ラムによって操作する。(後述)キーワードで検索する場合、データベース中の項目としては、ま
ず件名(テーマ名)の項目である SSSH(SNSH)がその対象項目となる o NCATでは、これに加
えて、書名に関するデータを中間一致で検索するように設計しである。
書誌データは、前述のように、全国の大学図書館員共同で作成したものである O 言換えれば書誌
作成の完全な専門家だけによって作成されたものではない。データの質にかなりのバラツキがある
ことは否めない事実である。殊に、件名(テーマ名)の項目にこれが端的に表れている。したがっ
て、キーワード検索をする場合、件名(テーマ)の項目を検索するだけでは不十分である O
考えられる方法として、書名に関するデータから FAIRSシステムでキーワードを切り出す方法
1
0
0
がある。しかし、 FAIRSシステムによるキーワード切り出しには不安がある〈広報創刊号戸祭助
教授の稿参照)ことから、この方法は採用しなかった。このため、書名に関するデータを中間一
致検索するということになったわけである。
昭和 6
4年 9月
、 NCATがはじめて公開された時、 NCATのデータベースでは、検索対象のため
だけの項目というものはなく、標準出力項目が同時に検索対象項目でもあった。
書名に関するデータは、項目表を見て頂ければわかるように、通常の書名項目だけでなく、シリー
ズ名、各巻書名、内容著作などの項目に分かれている。 FAIRSシステムでは複数項目が共通のイ
ンデックスをもつことはできない。インデックスは各項目ごとに独立する O したがって、書名に関
するデータを中間一致検索するには、項目 TR,SER,VTR,C W (この他に、はじめは「書名のヨ
ミ」の項目もあった。)の全部を順々に中間一致検索するということになった。
この結果はどうであったか。キーワード検索をすると、殊にデータ量の多い和図書の場合、検索
結果が出力されるまでのレスポンス時間、なんと 5分以上であった。すぐに設計の変更をした O 書
名に関するデータについては検索対象を一つだけの項目にまとめることにした。現在のような項目
構成に変更したのはその翌年 1月
。 NCATのはじめてのデータベースの命はわずか 3ヶ月だった。
これ以後、データベースの構成に変化はない。設計変更後は、キーワード検索では項目 SSSH (
又
は SNSH)の完全一致検索、そして、項目 SRRR (又は SNRR)の中間一致検索を行っている。
レスポンス時間は 1分余りに改善された。
ところが、データ量が増えるにつれ、キーワード検索のレスポンス時間はまた大きくなりつつあ
る。中間一致検索をしないキーワード検索の方法を考えなければならない。だが例えば UNIXな
どコンピュータ環境の変化も著しく、メーカー提供のソフトウェアも更によいものが出るかもしれ
ない… NCATは今なお試行錯誤の中にある。
検索対象だけのための項目と画面表示のためだけの項目との 2本立てにすると、当然、ファイル
容量の心配がでてくる。ファイル容量を少しでも小さく抑えるために、検索対象項目については以
下のような設計となっている O
① 書 誌 1件について、同一の索引語はもたない。
検索対象にする書誌データを空白や,(コンマ)などの記号を区切りとして切り分ける。切
り分けられた一つ一つの部分が索引語となる。例えば、書名に関する項目では、書名 C
l
a
s
s
i
c
a
l
a
n
a
l
y
s
i
sandf
u
n
c
t
i
o
n
a
la
n
a
l
y
s
i
sの時、切り分けられた索引語は「C
l
a
s
s
i
c
a
l
J,
「a
n
a
l
y
s
i
s
,
」
「
andJ,
「f
u
n
c
t
i
o
n
a
l
」
,
「a
n
a
l
y
s
i
s」となる。
日本語図書の場合、 NCASIS-CAT-..ILISシステムでは以下のような書誌データのっくり
方をする。例えば、
書名
遊びの社会学
ヨ
ミ
アソピムノムシャカイガク
(半角カタカナ
ムは空白)
この場合、切り分けられた索引語は「遊びの社会学」、「アソピコ「ノム「シャカイガク」となる。
1
0
1
同一書誌において、通常の書名のほかに副書名、シリーズ名、各巻書名、内容著作などがあ
れば、それから切り出されたすべての索引語を書誌単位ごとにグループとする。グループ内で
文字コード順にソートし、 2つ以上同ーの索引語がある場合は 2以上のものは切り捨てる。英
字については、ソートの前処理として、比較のために小文字を大文字に変換してすべて大文字
に統一する。
これは、殊に、洋図書、洋雑誌、カタカナのヨミにおいて効果は非常に大きい。
②可能な限り 1バイト文字を使用する。
検索対象項目においては、カタカナは拡張 EBCDICコードのままで使用する。
データベース作成時に、検索対象指定のものは、日本語属性の指定にすると、インデックス
はすべて 2バイト文字として作成され、英数カナ属性の指定にすると、インデックスは 1バイ
ト文字のまま作成される。このため、検索対象項目を日本語属性、英数カナ属性の 2種類の項
目とし、索引語を仕分けして格納する。
拡張 EBCDICのうち、英数字はすべて英数カナ属性の方に格納する。ウムラウト、アクサ
ンなどが付く拡張文字は、それに対応する通常の英字に変換して 1バイト文字にする。これは
検索しやすさの点からも必要な処置である。
拡張 EBCDIC中のカタカナは、 1バイト文字のままで日本語属性の方に格納して、インデッ
クスのみ 2バイト文字にする O カタカナは、検索される際には 2バイト文字が使用されるから
である。(インタフェースコード英小文字ベースで、半角カタカナは入力することができない。)
設計変更の前後で、使用ファイル容量に大きな変化はなかった。
平成 3年 5月、以下のような設計の追加を行った。
①書名、著者などのヨミを、各単語に切り分けたものと連結したものとの両方の索引語をつくっ
た。これは、ヨミで検索する場合、連絡した形で検索する利用者が圧倒的に多いことがわかっ
たからである。この場合、次のようになる。
書名
遊びの社会学
ヨミの索引語
アソピ
ノ
シャカイガク
アソピノシャカイガク
②著者を、苗字と名に切り分けたものと、連結したものとの両方の索引語をつくった。理由は
①と同じである。
③ データが旧漢字であるものを新漢字を使って検索することができるようにするために、旧漢
字に対応する新漢字を使った索引語も作成し、追加した。これについては、検索する時に検索
プログラム中で漢字対応テーブルを使用する方法も考えられたが、レスポンス時間に当然影響
することになるので、索引語を追加する方法をとった。
2-1-3 NGATデータベースへの入力
図書館の I
L
I
Sデータベースは、 NACSIS-CAT、ILISシステムを利用して、毎日新しいデー
タが追加されたり、すでにあるデータの修正が行われたりする。新たに追加または修正されたデー
1
0
2
タは、一旦中間ファイルに格納され、夜間の定まった時間に、 ILISデータベースに一括入力され
る。この処理の直後に、その日に新たに追加または修正されたものを ILISデータベースから抽出
し、編集し、 FAIRSに入力可能なフォーマットのファイルを作成する。 ILISの一括入力と NCAT
入力のためのファイル作成は 1本のパッチジョブとして処理される。
「その日」のものを抽出するために、 JCL文で日付け指定を行う必要がある。このために、この
パッチジョブの起動は TSSコマンドプロシジャを使用している。その記述は次のようなものである。
PROC 0
CONTROL NOFLUSH MSG LIST
SET&MON=&SUBSTR(1:2,&STR(&SYSDATE))
SET&DAY=&SUBSTR(4:5,&STR(SYSDATE))
SET&AR=SUBSTR(7:8,&STR(&SYSDATE))
SET&AR=&AR.MON.&DAY
SET&YE=&STR(19)
SET&DT=&YE.&DA
EDIT’
XX99999.JJ.CC(LL)' OLDCNTL
CHANGE 0
2
5
3
0
0
4
60
5
0
7
0
0
6
3’
DDDDDDDD’’&DT’ALL
CHANGE 0
4
7
2
0
0
4
60
4
7
8
0
0
4
6’
AAAAAA’’&DA’ ALL
SUB
ENDN
EXIT
&SYSDATEは制御変数、&MON,&DAY,&AR,&DA,&YE,&DTは記号変数、&SUBSTR
は組込関数。このコマンドプロシジャが起動されると、その日が例えば 1
9
9
2年 3月 1
0日であると
9
9
2
0
3
1
0
すると、データセット XX99999.JJ.CCの中の LL名の JCLは文中の DDDDDDDDが 1
に
、 AAAAAAが 9
2
0
3
1
0に変更されて SUBMITされ、その JCLは SAVEされずに終了する。
このようにして作成されたファイルは、翌朝に、 FAIRSシステムによるファイル入力の方法で
NCATデータベースに入力される。入力のための FAIRS コマンドは DEGEN下の INPUT。
INPUTのサブコマンド ADD,DELETEコマンドを使用する。新しく追加のものは ADD、修正
のものは DELETEの後に ADD。高速入力のために INPUT コマンドに MASSUPDATE指定を
行う。 MASSUPDATE指定をすると、使用できるサブコマンドは ADDだけとなる。このため、
修正されたものについては、一括して先に DELETEを行い、その後一括して ADDを行う。 DE-
LETEのためのファイルを作成し、このファイルで、先に INPUT、この後、入力のためのファイル
で MASSUPDATE指定の I
N
P
U
T
・
・ ・となる。 MASSUPDATE指定での INPUTでは、約 1
0
0件で
所要時間約 5分である。 DELETEのためのファイルの作成は次のように行う。
NCATは
、 NCATデータベース中のレコードキーの管理ファイルをもっている。入力のための
1
0
3
ファイルが作成された後、管理ファイルを読込み、入力されようとするものが新たな追加か修正か
を判定する。修正のものについては DELETEのための別ファイルに記入。新たな追加があれば管
理ファイルも更新される。
2-2 NCATの検索システム
FAIRSの通常の検索方法はコマンド方式であるが、奈良女子大学内のどんな人にも、例えばコ
ンビューターのそばには近寄りたくないという人にも利用してもらうために、少しでも検索しやす
いように、図のような検索画面を使って検索するという方法をとっている。
和区遣のみ検索画面
I
S
B
N
:
I
S
S
N
:
書名:
著者:
キーワード:
出版者:
野誠場所:
出版年:
請求書己号:
分類:
特殊項目:
*検索値を入力し,第子キーを押して下さい。
*メニュウ画面に戻るには
P
F
3キーを押して下さい。
*検索値の入力法....等々 使用のしかたの詳しい説明は
P
F
lキーを押して下さい。
分類表,所蔵場所リストも P
F
lキーを押して下さい。
この検索システムについてのおたずね,ご意見など
図書猿閲覧係(内線2
2
9
) まで どうぞ
実際には、検索がなされて検索結果が画面に表示されるまでの聞に、利用者の眼に見えないとこ
ろで、 FAIRSの検索コマンドが発行され、検索結果の出力コマンドが発行され…などが行われて
いるわけである。ここには検索プログラムが介在しているわけだが、このプログラムは本学図書館
による自館開発のものであり、 FAIRSにとっては利用者プログラムということになる。この検索
プログラム、そして画面処理について少しここで説明してみたい。
2-2-1 NCATの検索プログラム
NCATの検索画面は、富士通提供の PFD対話管理機能におけるメニュー定義体を利用したもの
である。検索画面で入力された検索値は PFD対話管理機能における対話変数として扱われる。対
話変数の宣言、メニュー定義体(検索画面)の呼出し、対話変数参照などは TSS コマンドプロシ
ジャで行っている。更に、 FAIRSを起動し、受け取った対話変数をパラメタとしてまとめて、
FAIRSコマンドで検索プログラムを CALLし、パラメタ(検索値)をプログラムに渡す。ここ
までを一つのコマンドプロシジャで行っている。図示すれば次のようになる O
1
0
4
TSSコマンドフ。ロシジャ
PFD対話管理機能
NCAT
対話変数宣言
検索プログラム
メニュー定義体
対話変数参照
検索コマンド合成
パラメタ合成
出力コマンド合成
CALL
出
,力
果
結
索
索検
検
FAIRSにおいては、利用者プログラムを CALLする時、使用できるパラメタは 1つのみである。
検索画面には検索値を入力することができる項目が複数あるので、検索プログラムにおいてどの項
目の検索値であるかの判断をするために、各対話変数にそれがどの項目のものであるかの記号を付
けて、連結して、 1つのパラメタに合成する。検索プログラムでは、以下のような処理を行ってい
るO
①「ただいま検索中です。しばらくお待ち下さい。」のメッセージを表示する。
②パラメタから受け取ったアーギュメントを項目別に分解する。各項目ごとに以下の処理を行
う。検索値のない項目はパス。
③書名、著者項目の場合、検索値が全角文字か半角文字かの判定をする。全角文字であれば、
検索値中の@の有無を判定する。検索値が全角文字であれば、@も全角文字の筈であるが、
FAIRSにおいては、前方一致などの@は半角文字でなければならない。@が有であれば、
@のみを半角文字に変換する。
④検索値の中に空白があるか、いくつあるかを判定する。空白があれば、一つ一つの検索値に
分解する。
⑤全角文字であれば、英数字であるかどうか判定する。英数字であれば、半角文字に変換する。
⑥全角文字であれば、検索値の中にハイフンがあるかどうか判定する。あれば、カタカナの長
音に変換する。
⑦出版者、分類の項目の検索値は、最後に@を付ける。分類、請求記号の項目の検索値は
./(コンマ、スラッシュ)が含まれる可能性があるので、引用符で囲む。
⑧検索値一つ一つについて、データベース上の項目に対応させる。
1
0
5
画面項目の書名、著者の検索値の場合は、それぞれ全角文字であれば、 SNRR、SNALに
、
半角文字であれば SRRR、SSALに対応させる。
キーワード項目の検索値は、全角文字であれば SNSHそして両端に@を付けて SNRR、半
角文字であれば SSSHそして両端に@を付けて SRRRとして、 2つの項目に対応させる。
例えば、検索値が「経済」であるとすると対応関係は次のようになる。
SNSH=経済 OR SNRR=@経済@
⑨ 先 頭 に SEARCHコマンドを付けた FAIRSの検索コマンドを合成する。複数項目を使用す
る時には、「AND」そして必要に応じて(
)(カッコ)などを付ける O
FAIRSに SEARCHコマンドを発行する。
⑬
ヒット件数によって次の処理をおこなう。
0件の時 「あなたが入力した検索値に対して、該当する…」のメッセージ出力。
ヒット件数を表示する。
1件の時 OUTPUTコマンド発行。標準出力項目全部が表示される O (詳細表示)
2件以上の時
7件までの TR、VOL、PUB項目の OUTPUTコマンドを発行。
(簡略一覧表示)
OUTPUT後に表示するメッセージ(「ここでは…B コマンド…」)は 1件
、 2∼ 7件、 8
件以上の 3種類を使い分けて出力する。
ここで、検索プログラムは終了する。
2-2-2 NCATの画面の動き
TSSの READY画面で NCATと入力すると、「NCATへょうこそ」と書かれた、検索方法を選
択する画面が表示される O NCATというコマンドは当情報処理センターに登録された TSS コマン
ドの一つである O そのコマンドの機能は、 NCATという名の TSSコマンドプロシジャを起動させ
ることにある。 NCATという名のコマンドプロシジャでは、 FAIRSや PFD対話管理機能を使用
するために必要なファイルの割り当てなどをし、そして「NCATへょうこそ」の画面を表示する。
この「NCATへょうこそ」の画面は PFD対話管理機能における選択メニュー定義体である。
ところで、当情報センターに接続する端末の接続手順には BSCと TTYの 2種類があるが、こ
の 2つでは PFDの機能が若干異なっている O PFD対話管理機能においても同じである。このた
め実は、 NCATと NCAT2という 2種類のコマンドプロシジャがあり、 READY画面で NCAT
というコマンドが入力されたら、それが BSC手順のものか TTY手順のものかを判定し、それに
よってどちらかのコマンドプロシジャを起動する。( BSC、TTYの判定は理学部西岡助事対受によっ
て開発されたものである。) TTY手順でも PFDで漢字入力することを可能にするエミュレータが、
当情報処理センターのご好意によって利用者に配付されたことは、利用者の方々がすでにご承知の
通りである。
さて、選択メニュー定義体(「ょうこそ…」の画面)での入力値を対話変数に受けて、メニュー
1
0
6
定義体である検索画面が表示される。更に、検索画面で入力された検索値が対話変数となり、パラ
メタとなり、 FAIRS検索コマンドの内容となり、そして検索結果が画面に表示されるということ
になる。この時点で、 NCATは PFDの世界から FAIRSの世界へ移行する O が、この時そのまま
では画面が乱れる、即ち、 PFD対話管理機能のメニュー定義体の画面の上に、 FAIRSの検索結
果が重なって表示されるのである。(PFDと FAIRSとは干渉しあう部分がある、というのは
FAIRS専門家の話であるが、筆者は詳しくは知らない。)富士通提供の IPFという、 FAIRSと
は干渉しあわない(?)画面処理機能があるが、 IPFはプルスクリーン画面でのみ使用すること
ができる。本学内の端末の約 8割が接続手順 TTYであり、フルスクリーン画面は使用できない。
従って、 IPFを使用すると、学内端末の大半が利用できないということになるので、 IPFではな
く
、 PFD対話管理機能を使用することになったわけである。
とにかく、 PFDから FAIRSへ、また FAIRSから PFDへ移行する時には画面が乱れるとい
う現象が起こる。このため、画面クリアが必要になってくる O 検索画面から検索結果を表示する画
面に移行するときの画面クリアは、対話変数の受渡しなどをしているコマンドプロシジャの中で画
面クリアのための TSSコマンドを発行している。
FAIRSの世界に移行してからは、当然 FAIRSの画面処理下にある。「ただいま検索中…」の
メッセージが表示されてから、利用者によって Eコマンドが入力されるまでが FAIRSの世界で
ある。
NCATでは FAIRSの画面をラインモードで使用している。フルスクリーン端末の場合も、ラ
インモードに変更して使用している。その理由はいくつかあるが、大きなものは次の 3点である。
学内端末の大半が TTY手順であるために、ラインモードしか使用できない。
画面表示にかかるレスポンスが、ラインモードの方がフルスクリーンより若干速い。
検索結果出力において、詳細表示の場合、フルスクリーンモードではー画面ーレコードとなり、
複数レコードをー画面に連続して表示することができない。
接続手順 TTYの端末の場合には、検索結果表示画面で画面が流れるのを防ぐために、画面表示
が2
0行で静止するように設定しである。はじめに起動される NCAT名のコマンドプロシジャで
「TERM LINE(20)」という TSSコマンドを発行している。
NCATでは、 FAIRSコマンドの他に NCAT独自のコマンドをもっており、 NCATの利用は基
本的にはこれらのコマンドだけで利用できるようになっている。
NCAT独自のコマンドは次の 5つである O
D .
.
・ ・−−…詳細表示をさせる。
H
B…
.
.
.
・ ・−−簡略一覧表示をさせる O
H
E … ・・−−−終了又は再検索
H
H
CARD……検索結果をカード形式で NLPに出力する。
LPRINT …検索結果をローカルプリンターに出力する。
1
0
7
これらは、 FAIRSのカタログ機能を利用したものであり、これらのコマンドはそれぞれカタロ
グの名前である。 FAIRSのカタログ機能とは、一連のコマンド群に名前をつけて登録し、必要に
応じて、これらのコマンド群を呼び出して実行させることができるものである。カタログ名を入力
すると、そのカタログに登録された一連のコマンドが実行されるという仕組みである。 NCATの
コマンド名でもある、カタログの内容は次の通りである。
<カタログ名>
D
<コマンド群>
CALL CLEAR
OUT R(%01 %02 %03 %04 %05)
B
CALL CLEAR
OUT R(%01 %02 %03 %04 %05) EL(TR,VOL,PUB)
E
CALL CLEAR
END FAIRS
CARD
CALL CARD %01%02
LPRINT
CALL LPRINT %01
コマンド群中にある%..は、カタログが呼び出されるときに渡されるオペランドを受ける仮パレ
:
1
0」(検索結果の 3番目と、 7番目から 1
0番目までの詳細表示を
メタである O たとえば、「D 37
する)と入力された場合、このカタログは「OUT R(
3 7
:
1
0)」となって実行される O 利用者自
身で、 D コマンドを使わずに OUT R(
3 7
:
1
0)というコマンドを入力しでも同じ結果(画面ク
リアを別にすれば〉になる。
オペランドは 5つまで使用できることがこれでわかる。
CALLは利用者プログラムを実行させる FAIRSコマンドであり、 CALLの後にある CLEAR、
CARD、LPRINTはそれぞれ利用者フ。ログラムの名前である。 (コマンドと同名で紛らわしいが…)
それぞれの利用者プログラムの処理内容は次の通りである。
プログラム CLEARは FAIRSの中で画面クリアのための TSSコマンドを発行する O
プログラム CARDはファイルを作成し、検索結果をファイルにダウンロードし、更にそれをも
とにカード形式に編集し、 NLPに印刷して出力するためのパッチジョブを起動させる O
プログラム LPRINTはプリンタ出力の形式でファイルを作成し、ダウンロードする。
プログラム名の後の%..は入力されたオペランドをそのままプログラムのパラメタとして利用し
ているものである。 FAIRSでは、利用者プログラムに渡すことができるパラメタは 1つだけなの
で\カタログ CARDでは、 2つのオペランドを連結して、 1つのパラメタにしている。
カタログ Eの ENDFAIRSは検索(RS)モードの終了、そして FAIRSの終了コマンドであ
る
。
1
0
8
CALLCLEARコマンドについては、カタログ D、Bの場合と Eの場合とでは目的が異なって
いる。画面をラインモードで使用しているので、通常であれば新しい表示は、古い表示を保持した
まま、その下行から表示されることになる。 D、Bの場合、検索結果表示コマンドなので、新しい
表示を画面の先頭から表示するために、画面クリアを行っている O E の場合は、 FAIRSから PFD
への移行になるので(前述)画面クリアを行っている。
FAIRSから PFDへの移行、即ち、 E コマンドが発行されて、「NCATへょうこそ…」の画面
か、又は検索画面に戻ることになる。(再)検索画面へ戻ると、前回に入力した検索値がそのまま
表示されている筈である。これはコマンドプロシジャの中で、バッファに残っている対話変数を再
び呼び出してデフォルト値として画面に表示しているからである。検索結果が多すぎた時など、
AND検索で検索結果を絞るなど FAIRSコマンドを使用すれば当然可能であるが、(再)検索画
面で前回の検索値に更に検索値を追加する方法の方が、 FAIRS検索に慣れていない一般利用者に
は使いやすいと考え、このように設計したものである O
ここ検索画面ではまだ、対話変数を宣言し、初めて検索画面を表示した、そのコマンドプロシジャ
の制御の下にある。ここで PF3キーが押されると「NCATへょうこそ…」の画面に戻る。ここは
まだ、 NCAT名のコマンドプロシジャの制御下である。ここで PF3キーが押されると、 NCAT
のすべての制御から抜け出ることになる。
******
NCATがいくつかの間題点を抱えていることはすでにおわかり頂けたかと思うが、ほかにも設
計者の意識にはない大きな問題点もあるかも知れない。設計者の知識の範聞にはない改善法も恐ら
くあるであろう。今後ともご助言、ご教示を願う次第である O
NCAT開発に使用したフ。ログラム言語は PL/Iである。
NCATの開発に際しては、理学部西岡助教授、文学部戸祭助教授から貴重なアドバイスを頂く
ことができた O
富士通関係の SEから適切なアドバイスを受けたことは言うまでもない。
NCATの使用法について詳しくは、当広報 3号をご覧下さい。
他に詳しくは FAIRS使用手引書、 TSSコマンド文法書、 PFD使用手引書(対話管理機能篇)
をご覧下さい。
1
0
9
Fly UP