Comments
Description
Transcript
Oracle Secure Enterprise Searchの実装
Oracle Secure Enterprise Search の実装 オラクル・ホワイト・ペーパー 2006 年 9 月 Oracle Secure Enterprise Search の実装 概要 ................................................................................................................................................................................. 3 計画に関する考慮事項.................................................................................................................................................. 3 ハードウェア/OSのプラットフォーム .................................................................................................................. 3 セキュアな検索とパブリックな検索の必要性 .................................................................................................... 4 識別プラットフォーム ............................................................................................................................................ 4 ユーザー・インタフェース(標準またはカスタマイズされたWeb Servicesアプリケーション) ............... 4 クロールされるデータ・ソース ............................................................................................................................ 5 カスタム・コネクタ ................................................................................................................................................ 5 再クロールのスケジュール .................................................................................................................................... 6 索引のデフラグメンテーションのスケジュール ................................................................................................ 6 高可用性の方針 ........................................................................................................................................................ 6 ファイアウォール/DMZの問題 .............................................................................................................................. 6 プロセスとタイムスケール.......................................................................................................................................... 7 インストール ...................................................................................................................................................... 7 ソースの設定 ...................................................................................................................................................... 7 ユーザー・インタフェースの作成................................................................................................................... 7 管理 ...................................................................................................................................................................... 7 ユーザー・トレーニング .................................................................................................................................. 7 結論 ................................................................................................................................................................................. 7 Oracle Secure Enterprise Search の実装 2 Oracle Corporation 発行「Implementing Oracle Secure Enterprise Search」の翻訳版です。 概要 Oracle Secure Enterprise Search は、使いやすいシンプルな 1 つのインタフェースからエンタープライズのすべての データ・ソースを検索できるオラクルの製品です。ユーザーは、エンタープライズ・データの検索を、インター ネットでの検索と同様、簡単に実行できます。 Oracle Secure Enterprise Search での、最も重要な設計上の目的は「インストールと実装を簡単にする」ことです。 ただし、実装を成功させるためには、ある程度の計画が必要です。 このホワイト・ペーパーでは、Oracle Secure Enterprise Search をインストールおよびデプロイするために必要な手 順を説明します。ここでは、顧客が Oracle Secure Enterprise Search を実装する独自のプロジェクト計画を作成する ことを想定しています。 初期計画の一環として、次の事項の決定が必要になります。各事項については、後で詳しく説明します。 • ハードウェア/OS のプラットフォーム • セキュアな検索とパブリックな検索の必要性 • 使用する識別プラットフォーム(Oracle Internet Directory または Microsoft Active Directory など) • ユーザー・インタフェース(標準またはカスタマイズされた Web Services アプリケーション) • クロールされるデータ・ソース • 記述が必要なカスタム・クローラのプラグイン • 再クロールのスケジュール • 索引のデフラグメンテーションのスケジュール • 高可用性の方針 • ファイアウォール/DMZ の問題 計画に関する考慮事項 ハードウェア/OS のプラットフォーム Oracle Secure Enterprise Search(SES)は、Microsoft Windows や UNIX/Linux など、様々なプラットフォーム上で稼働 します。SES はプラットフォームに拠らない機能で、いずれのコネクタおよびデータ・ソースもサポートされて いる任意のプラットフォーム上で稼働します。 あるデータ・ソース(たとえば、NTFS ファイル・クローラや Exchange email クローラ)に対しては、Windows シ ステムで agent プログラムを実行する必要があります。そのため、これらのソースをクロールするには、適切な Windows サーバー・システム(およびそのシステム上で適切な権限を付与されているアカウント)に対するアク セスが必要です。 識別プラットフォームの選択(以降のセクションを参照)は、OS プラットフォームに影響を与えないため、Linux や UNIX マシンなどから Microsoft Active Directory へ接続することができます。 Oracle Secure Enterprise Search の実装 3 Oracle Corporation 発行「Implementing Oracle Secure Enterprise Search」の翻訳版です。 セキュアな検索とパブリックな検索の必要性 プライベートなコンテンツを索引付けおよび検索する必要はありますか?検索するすべてのコンテンツがパブ リックなものであれば、識別プラットフォームを使用する必要はありません。これは、実装を容易にします。プ ライベートなコンテンツを検索するには、何らかのディレクトリ・サーバーへ接続することが必要です。これに ついては次のセクションで説明します。 識別プラットフォーム セキュアな検索では、LDAP(Lightweight Directory Access Protocol)が必要です。これにより、ユーザーはログイ ン時に再び認証され、ACL(Access Control List)の情報が提供されます。この情報は Oracle Secure Enterprise Search に格納されます。 SES 10.1.6 では、識別プラットフォームとして Oracle Internet Directory のみがサポートされます。SES をセキュア・ モードで使用するには、最初にこのプラットフォームをインストールする必要があります(これは、SES のイン ストール・パックの一部としては提供されていません)。 10.1.6 を使用しており、会社の標準が Microsoft Active Directory などの他の製品である場合は、これらを同期化す るためにディレクトリ間にブリッジをインストールする必要があります。これについては、添付の資料で説明し ます。(Microsoft Active Directory での Secure Enterprise Search の使用) SES 10.1.8 では、さらにオプションがあります。SES では、Active Directory、iPlanet、OpenLDAP などの一般的な 識別プラットフォームに対する多数のプラグインが提供されています。またユーザーは、Java クラスのセットと して独自の識別プラグインを記述することもできます。 実際のプラットフォームの選択は、データ・ソースの保護に何を使用しているかによって、大きく異なります。 注意: 1 つの SES インスタンスでは、アクティブにできるのは 1 つの識別プラグインのみです。たとえば、次の ようなソースが混在している場合、 • Oracle Internet Directory(OID)で Oracle Portal が保護されている。 • Microsoft Active Directory によって Exchange email が保護されている。 次のような 2 つのオプションを選択できます。 1. プライマリ・ディレクトリとして OID を使用し、他のディレクトリに対してブリッジを作成する(前述 の参考文書を参照)。 2. 2 つ(またはそれ以上)の SES インスタンスをインストールし、1 つを OID で保護し、1 つを AD で保護 する。ユーザーは、各インスタンスに別々にログインし検索する必要があります。 ユーザー・インタフェース(標準またはカスタマイズされた Web Services アプリケーション) SES を使用するための最も簡単な方法は、デフォルトの検索 API を使用することです。これは、設定せずに使用 でき、どのような型のデータ・ソースに対してもカスタマイズを必要としません。 ただし、多くの顧客は、自分の会社のルック&フィールに合わせて検索機能を実装したいと考えています。また、 既存の Web ページにも検索ボックスを実装したいと考えています。そのためには、SES の一部として提供される Web Services API を使用して、カスタマイズされた検索アプリケーションを作成する必要があります。 Oracle Secure Enterprise Search の実装 4 Oracle Corporation 発行「Implementing Oracle Secure Enterprise Search」の翻訳版です。 クロールされるデータ・ソース おそらく、これはプロセスの中で最も重要で時間のかかる部分です。ユーザーは、索引付けするデータ、これら のソースをクロールするために使用するメソッド(ソース・タイプ)を決定し、クロールに必要な情報を定義す る必要があります。 各ソース・タイプに対して、様々なパラメータを設定する必要があります。ここでは、一般的な選択として、Web ソース・タイプを想定します。 Web ソース・タイプには、1 つ以上のエントリ・ポイントが必要です。これは、クローラが追跡するリンクの検索 を開始する場所です。たとえば、スタート・ポイントとして http://www.oracle.com を選択することができます。ま た、リンクが 1 つもない場合のために、http://technology.oracle.com を 2 番目のスタート・ポイントとして追加する こともできます。 次に、インクルード・ルールとエクスクルード・ルールを検討します。デフォルトでは、http://www.oracle.com が スタート・ポイントの場合、http://download.oracle.com というページはクロールされません。これは、デフォルト のインクルード・ルール(includes: www.oracle.com)に適合しないためです。ここで、oracle.com(または download.oracle.com)に対して新しいインクルード・ルールを設定する必要があります。 また、検索結果に含めても無用と思われるページは除外したい場合があります。logs ディレクトリは、 www.oracle.com/logs のエクスクルード・ルールによって除外されます。 場合によって、次のような理由により、サイト内のすべてのページを直接クロールできないことがあります。 • 顧客の入力によって、ページが標準で動的なコンテンツとして提供される(ヘルプ・ページなど)。 • ページが、フラッシュベースのハイパーリンク(または複雑な Javascript リンク)によってリンクされ、 SES クローラが追跡できない。 この場合、最適な方法は、索引付けする各ページの URL のリストから構成されるページを作成することです。こ のページは、クローラの特別なスタート・ポイントとして使用することができます。ページが自動的に生成され、 Web ページの作成で使用するすべての本番システムについて最新の状態を保持できれば、それがベストです。 他の設定で特に注意が必要なものは、「Crawling Parameters」タブの「クロールの深さ」、「Index Dynamic Page」 および「Honor Robots Exclusion」です。これらの設定を誤ると(または 10.1.6 で説明したデフォルトのままにして おくと)、索引付けされるページが意図したよりも少ない、または、はるかに多いことがあります。 カスタム・コネクタ SES では、様々なタイプのソースが提供されます。多くの顧客にとって、コンテンツをすべて索引付けするには これらのソースで十分です。ただし、顧客の中には、標準のクロール・タイプを使用しても簡単にクロールでき ない情報リポジトリを持っている人もいます。このような場合には、クローラのプラグインが必要です。オラク ルでは新しいコネクタを定期的に開発およびリリースして、コネクタを探している顧客に次のようにアドバイス しています。 1. 必要なコネクタが SES の最新リリースで提供されているかどうかを確認し、必要に応じて、そのリリー スへのアップグレードを検討する。 2. 適切なコネクタがリリースされているかを確認する。 3. データ・ソースに対してカスタム・コネクタ・プラグインの作成を検討する。 Oracle Secure Enterprise Search の実装 5 Oracle Corporation 発行「Implementing Oracle Secure Enterprise Search」の翻訳版です。 再クロールのスケジュール 各データ・ソースに対して、再クロールする頻度、またその日時を決定する必要があります。これは、再クロー ルの有効性によってある程度決まります。たとえば、Oracle Portal は、SES が実際にクロールしなくても、変更さ れたページを SES に対して通知することができます。これに対して、Web ソースは、新しい文書または修正され た文書を検出するため、常にすべてをクロールする必要があります。日次に再クロールされるソース、またはあ まり頻繁に再クロールされないソースでは、一日のうち最もアクティブでない時間を特定し、ユーザーによるク エリーの実行に対する影響が最小限になるようにクローラを開始する方法が最適です。 索引のデフラグメンテーションのスケジュール 時間とともにコンテンツが変化するにつれ、Oracle Secure Enterprise Search で使用される Oracle Text の索引は断片 化されます。これによって、クエリーのスピードは低下します。断片化の量は、「Global Settings / Index Optimization」 ページで監視できます。通常、断片化のレベルが 30%を超えると、問題が発生する原因になります。 多くの顧客にとって最適化のスケジューリングを行うタスクは、週に 1 回で十分です。ただし、頻繁に入れ替わ る文書が含まれているデータ・ソースの場合には、最適化を日次に行うとことをお薦めします。 高可用性の方針 SES サーバー上でソフトウェアまたはハードウェアの障害を処理する方法を決めておくことは、SES を計画する 際に必須です。SES の現在のリリースでは、データベースのバックアップとリカバリはサポートされていません。 システムのメタデータをバックアップして新しくインストールされたシステムにリカバリすることは可能ですが、 実際のデータ・ソースは再クロールすることが必要になります。 このプロセスには多少の時間がかかるため、SES がクリティカルなリソースの場合には常に許容できるわけでは ありません。このような場合、オラクルでは 2 つの SES インスタンスを並行して実行することをお薦めしていま す。これらの 2 つのインスタンスには、クロールの対象として同じデータ・ソース・セットを提供する必要があ ります。また必要に応じ、バックアップ目的に加えロード・シェアリングのために、2 つのシステムを使用するこ とができます。 ファイアウォール/DMZ の問題 この最後のトピックは、パブリックな環境に置かれている SES サーバーにのみ該当します。一般に、企業はファ イアウォールの内部または外部にあるパブリックなマテリアルを索引付けしたいが、SES サーバーはファイア ウォールの外部に置きたくないと考えています。 このような場合、多くの顧客は SES サーバー自身をファイアウォール内に置くか、または非武装地帯 (De-Militarized Zone: DMZ)に置き、ファイアウォールの外部にある他のマシン上でフロント・エンドとして機能 する Web サーバー(Oracle Application Server)を実行します。 Oracle Application Server で SES を使用する場合については、『Oracle Secure Enterprise Search 管理者ガイド』で説 明しています。 Oracle Secure Enterprise Search の実装 6 Oracle Corporation 発行「Implementing Oracle Secure Enterprise Search」の翻訳版です。 プロセスとタイムスケール 次に実装のスケジュールを決定します。各ステージの実際のタイムスケールは、必要な作業量によって大きく異 なります。カスタム・クローラをいくつか記述しなければならない場合、すべてのソースで標準のソース・タイ プを使用する場合に比べ、時間がかかります。 次に、お薦めできるタイムスケールを示します。 インストール • インストール前 − パッケージのチェック、OS の設定など: 2 時間 • SES のインストール: 30 分 • Oracle Internet Directory および(必要に応じ)Oracle Application Server 2 のインストール − 12 時間(複雑 さ、作業者の習熟度によって異なる) • OID/AD のブリッジの作成: 1 日 ソースの設定 • ソースの作成(ソース 1 につき): 1 時間 • クロール時間(ソースのサイズ、タイプなどによって異なる): 1 時間から数日 • ソースの検証、テストおよび更新: 4 時間/1 ソース • カスタム・ソース・プラグインの作成: 1~10 日(複雑さによって異なる) ユーザー・インタフェースの作成 • サンプルによる標準の Web Services Application の作成: 2 時間(ユーザーが Web Services および Oracle JDeveloper に精通している場合)~2 日(初心者の場合) • 完全なカスタム UI の作成 − 通常は 2~10 日(テストを含む) 管理 • ソースおよび索引の最適化のスケジューリング: 2 時間 • クエリーの統計、クエリーのチューニングの監視: 2~4 時間/週 • 問題のあるクローラ・スケジュールの調整: 0~2 時間/週 ユーザー・トレーニング • 「Basic Search」ページの使用: 5 分/ユーザー • 「Advanced Search」ページの使用: 30 分/ユーザー 結論 Oracle Secure Enterprise Search は、インストール、構成、使用が簡単です。ただし、他のエンタープライズ・ソフ トウェア製品と同様、プロジェクトを準備し、実際に開始するためのステップを事前に計画しておくことが必要 です。 Oracle Secure Enterprise Search の実装 7 Oracle Corporation 発行「Implementing Oracle Secure Enterprise Search」の翻訳版です。 Oracle Secure Enterprise Search の実装 2006 年 9 月 著者: Roger Ford 寄稿者: TBA Oracle Corporation World Headquarters 500 Oracle Parkway Redwood Shores, CA 94065 U.S.A. 海外からのお問合せ窓口: 電話: +1.650.506.7000 ファックス: +1.650.506.7200 www.oracle.com この文書はあくまで参考資料であり、契約または協定には含まれていないことがあります。 Oracle はオラクル社の登録商標です。 このガイドで使用されているさまざまな製品名およびサービス名には、オラクル社の商標です。 その他のすべての製品名およびサービス名は、各社の商標です。 Copyright © 2006 Oracle Corporation 無断転載を禁ず。