...

SharePoint 2013 検索

by user

on
Category: Documents
47

views

Report

Comments

Transcript

SharePoint 2013 検索
共同作業の
新しい進め方
SHARE
ORGANIZE
DISCOVER
BUILD
MANAGE
 アイデア
 チーム
 エキスパート
 アプリケーション
 コスト
 コンテンツ
 プロジェクト
 答え
 Web サイト
 リスク
 ビジョン
 情報
 コネクション
 クラウド
 時間
を共有する
を組織する
を見つける
を構築する
を統制する
ユーザーに合わせて
ユーザーが探してる結果を
見つけることが出来る
常に一歩先の
エクスペリエンスを伴って、
答えを取得し、次の行動を
行うことが出来る
あらゆるスケール要件にも
対応可能でスマートな
アプリケーションを
構築することが出来る
検索を意識させずに、
ミッションクリティカルな
アプリケーションに
検索機能を利用することが
出来る
ベストプラクティス
に基づいた
スケールと冗長化を
兼ね備えた構成
サーバー ロール
コンポーネント (スケールする単位)
外部公開 API
カスタム モジュール
斜体 : 実行モジュール名
カスタム
アプリケーション
検索インデックス
クラウド
mssearch.exe
noderunner.exe
noderunner.exe
noderunner.exe
検索管理 DB クロール DB リンク DB
分析レポート DB
noderunner.exe
「検索の解剖図」("Search Patterns", http://searchpatterns.org/) より
【エンド ユーザー】
絞り込み
パーソナライズ
検
索
API
リッチな UI
迅速なレスポンス
HTML + JavaScript の
表示フォーマット設定
REST
+ JSON
コネクタ フレームワーク
検索キーワード意味判断
類義語展開 等
クエリ処理
コンテンツ処理
検索インデックス
セキュリティ トリミング
結果順位調整
レコメンド 等
【情報リソース】
絞り込み
並び替え 等
属性抽出
カテゴリ分け
言語処理
外部システム呼出
フィルタリング 等
ク
ロ
ー
ラ
ー
データベース
SharePoint
Lotus Notes
ファイルサーバー
Webサイト
4コア / 12GB / 300GB
4コア / 12GB / 300GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 12GB / 300GB
4コア / 12GB / 300GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
4コア / 16GB / 500GB
8コア / 24GB / 800GB
インデックス / サーチ コア コンポーネントの指標
• 1,000 万アイテム / ノード
• 500 GB / 1,000 万アイテム
クエリ処理コンポーネントの指標
• 8,000 万アイテム毎に追加
ディスクの指標
1KB Read
[IOPS]
32KB Read
[IOPS]
32KB Write
[IOPS]
64KB Read
[IOPS]
管理コンポーネント
コンテンツ処理コンポーネント
分析処理コンポーネント
インデックス / サーチ コア コンポーネント
クロール コンポーネント
クエリ処理コンポーネント
256KB Write
[IOPS]
仮想環境
100MB Read
[MB/s]
100MB Write
[MB/s]
10,000 rpm 以上、RAID 5 構成、SAS インターフェースを推奨
2,000
1,800
900
-
-
500
250
-
-
-
300
100
200
200
どこのアイテムも
システムに合わせて
適切な情報を取得
検索インデックス
ファイル サーバー
社内外の
Web サイト
SharePoint サーバー
ひとプロフィル
Lotus
Notes/Domino
Exchange
RDBMS (SQL Server, LOB アプリケーション
パブリック フォルダ Oracle Database 等)
(SAP, Siebel 等)
標準で対象のファイル形式
Office ドキュメント、テキスト、HTML、
XML、PDF、 ZIP 圧縮ファイル、
オープンドキュメント・フォーマット、
Outlook メッセージファイル など
クラウド
ローカルまたはリモートの
(Office 365, Azure 等)
SharePoint サーバー
OpenSearch
クロール
検索
差分クロールのスケジュール実施例
インデックス新鮮度の検証結果
時間
期待値
変更プロセス
変更プロセス
変更プロセス
変更プロセス
現実値
変更プロセス
変更プロセス
変更量が多い際にクロール時間が長くなり、スケジュールされた差分クロールがスキップされる
変更量が多い際にクロール時間が長くなり、スケジュールされた差分クロールがスキップされる
継続的クロール実施例
時間
ク
ロ
ー
ル
さ
れ
て
い
な
い
コ
ン
テ
ン
ツ
数
Crawl Schedule
Incremental Crawl Freshness
Continuous Crawl Freshness
現実値
#6
#4
#1
#7
#2
#8
#9
#10
#3
#5
コンテンツ変更の
多い時間帯
スキップされるスケジュール無し
コンテンツ変更の
少ない時間帯
コンテンツ変更の
多い時間帯
日時
低い値でほぼ一定となる
章タイトル プロパティの値
;
;…
コンテンツへの情報付与
カスタム プロパティ A の値
;
;
;
カスタム プロパティ B の値
;
;
ドキュメント解析
メタデータ抽出
管理プロパティ
へのマッピング
言語判別
コンテンツ
エンリッチメント
発音変換
ワード
ブレーク
カスタム
エンティティ抽出
外部 Web サービスから取得した情報
外部 Web サービス
ドキュメント
サマリー生成
検索意図が理解され、
結果が視覚化され、
次の行動を起こせる
検索インデックス
検索結果
Web ブラウザ
絞り込み 「検索結果はこう分類されますよ」
ひと検索 「この検索キーワードに関連した人です」
クエリ候補 「こんな検索キーワードはどうですか?」
お気に入り 「以前、これを参照しましたよ」
ソーシャル 「いいね!と xx 回押されていますよ」
検索結果からコンテンツのダウンロード
コンテンツ
サムネイルおよびプレビューの確認
Office Web Apps による Web ブラウザ上の参照または編集
ランク付けモデルによる適切な検索結果順序
検索ホバー パネルによる適切な次のアクション
検索インデックス
検索ボックスに入力
された検索キーワード
クエリ ルール
お気に入り
実際に実行される
検索クエリー
ひとの検索結果
表示テンプレート
ひとのアイテムの表示形式 (HTML)
表示テンプレート
Word アイテムの表示形式 (HTML)
表示テンプレート
PowerPoint アイテムの表示形式 (HTML)
結果の種類
ドキュメントの種類
などの判断
ドキュメントの
検索結果
「OSS」を検索
共有フォルダ 1
セキュリティ情報を
持った検索インデックス
検索結果
各種認証基盤の利用
OSS.DOCX
OSS.DOCX
OSS.PPTX
共有フォルダ 2
「OSS」を検索
検索結果
OSS.DOCX
OSS.XLSX
OSS.XLSX
SharePoint ポータル
検索実行時における
セキュリティ情報の確認
OSS.PPTX
Active Directory
などの認証基盤
活用が可能な
分析機能の提供
検索インデックスへの
推奨情報の投入
推奨アイテムのリクエスト
推奨アイテム
Web パーツ
や REST API
推奨アイテムの送信
イベント情報の送信
アイテム間の関連グラフの計算
イベント情報の登録
分析レポート DB
各種イベント
– 利用状況レポート機能により、
人気のあるアイテムの利用状況データの取得
最も人気のあるアイテム、
推奨アイテムの送信
アイテム間の関連グラフの計算
推奨アイテム
Web パーツ
を含むページ
イベント情報の送信
イベント情報の登録
カスタム分析
アプリケーション
利用状況レポート
利用状況データの取得
分析レポート DB
柔軟で
権限移譲された管理
こんな頻度で継続的ク
ロールを実行しよう
ファーム管理者による
ファーム レベルの検索管理
サイト コレクション管理者による
サイト コレクション単位の検索管理
この管理プロパティも
検索出来るようにしよう
サイト管理者による
サイト単位の検索管理
カスタム管理
アプリケーション
このサイトを
もう一度クロールして!
検索 UX の構築
簡単な統合
サーバー ロール
コンポーネント (スケールする単位)
外部公開 API
カスタム モジュール
下線 : 新機能
カスタム
コネクタ
コンテンツ
エンリッチメント サービス
カスタム
フィルタ
カスタム
ワード ブレーカー
斜体 : 実行モジュール名
カスタム
セキュリティ トリマー
カスタム
アプリケーション
検索インデックス
クラウド
mssearch.exe
noderunner.exe
noderunner.exe
noderunner.exe
noderunner.exe
カスタム分析
アプリケーション
カスタム管理
アプリケーション
検索管理 DB クロール DB リンク DB
分析レポート DB
Web ブラウザ
REST クライアント
マネージド クライアント
3. 検索時に情報を渡す
1. クロール
2. 検索
Web ブラウザ
検索を意識させず、
重要なシステムに
検索機能を利用
SHARE
ORGANIZE
DISCOVER
BUILD
MANAGE
 アイデア
 チーム
 エキスパート
 アプリケーション
 コスト
 コンテンツ
 プロジェクト
 答え
 Web サイト
 リスク
 ビジョン
 情報
 コネクション
 クラウド
 時間
を共有する
を組織する
を見つける
を構築する
を統制する
クエリ結果
Web パーツ
(SharePoint 2010)
コンテンツ検索
Web パーツ
(SharePoint 2013)
サイト コレクションを
跨いだ情報表示
×
〇
コンテンツ タイプを
跨いだコンテンツ表示
×
〇
結果のプレビュー
×
〇
単なる検索結果だけではなく、
答えを見つけるための
インテリジェントな検索 UX を
提供します
ビジネス ユーザーに、
更に関連性の高く、魅力的で、
アクションを起こし易い検索を
提供します
統合し易く、管理し易い、
拡張性のあるプラットフォームを
提供します
代替方法
検索アラートまたは SharePoint RSS を利用
検索の分析機能に変更
KQL または FQL を利用
REST または CSOM の利用を推奨
BCS コネクタ フレームワークの利用を推奨
変更前
変更後
-
個数制限なく作成できる
最大 12 個まで
パイプライン拡張
コンテンツ エンリッチメント
Web サービス
おすすめコンテンツ
ビジュアルおすすめコンテンツ
昇格した結果
Content SSA + Query SSA
Search SSA
代替方法
なし (カスタムによる方法を検討中)
SharePoint コネクタを利用
BCS ベースのカスタム コネクタ
なし
標準で 55 種類のファイル種類に対応
必要なファイル種類に対応した iFilter の導入
なし
なし
検索アラートまたは SharePoint RSS を利用
どこのアイテムも
システムに合わせて
適切な情報を取得
クラウド
5 分間隔に変更する場合
$ssa = Get-SPEnterpriseSearchServiceApplication
$ssa.SetProperty("ContinuousCrawlInterval", 5)
$ssa.Update()
ドキュメント解析機能によって
見出しやスライドのタイトル情報を
検索ホバー パネルにリンクとして表示
カスタム プロパティ A の値
;
;
;
カスタム プロパティ B の値
;
カスタム
エンティティ
抽出
ドキュメント解析
メタデータ抽出
管理プロパティ
へのマッピング
言語判別
Web サービス
コールアウト
発音変換
ワード
ブレーク
トリガー
評価
Web サービスへ
Web サービスから
カスタム
エンティティ抽出
ドキュメント
サマリー生成
検索意図が理解され、
結果が視覚化され、
次の行動を起こせる
昇格した結果
クエリ候補
分析レポート DB
お気に入り
分析レポート DB
注意
各絞り込みカテゴリ内の絞り込みフィルターごとのヒット数は検索結果に含まれているが、
標準 UI では非表示のため、表示したい場合には表示テンプレートの変更が必要
縮小表示
プレビュー
PowerPoint プレゼンテーションの関連情報
PowerPoint プレゼンテーションのアクション
ディスカッションの関連情報
ディスカッションのアクション
標準で提供されるランク付けモデル
既定の検索モデル
カタログのランク付けモデル
推薦者のランク付けモデル
ひとの専門分野の検索 (社会的距離に基づくランク付けモデル)
サイト候補のランク付けモデル
Minspan を高く設定した検索モデル
ひとの検索の社会的距離モデル
ひとの検索に適用する専門分野ランク付けモデル
ひとの名前の検索 (社会的距離に基づくランク付けモデル)
ひとの名前の検索に適用するランク付けモデル
人気のランク付けモデル
O14 既定の検索モデル
補足
ひとの検索アプリケーションのランク付けモデル
製品リリース後に CodePlex から GUI ベースのランク モデル管理ツールを
提供する予定
Minspan なしの検索モデル
検索クエリを「製品」だと認識し、
「Knowledge Center」サイトを推奨
「人の名前」と認識し、
ひと検索の結果を表示
ビデオ検索でよく利用されている
検索クエリであると認識し、
ビデオ検索の結果を表示
活用が可能な
分析機能の提供
特定のサイトに
対する推奨アイテム
特定のアイテムに対する
推奨アイテム
特定のドキュメントに
対する推奨アイテム
「
ア
イ
テ
ム
A
の
推
奨
ア
イ
テ
ム
」
エキスパート 1 履歴情報
アイテム B
アイテム C
アイテム D
エキスパート 2 履歴情報
アイテム B
アイテム E
アイテム F
エキスパート 3 履歴情報
アイテム E
アイテム F
アイテム G
エキスパート 4 履歴情報
アイテム B
アイテム E
アイテム G
アイテム A
アイテム A
アイテム A
アイテム A
アイテム A
アイテム A
3
3
2
2
1
1
アイテム B
アイテム A
3
アイテム B
アイテム E
アイテム F
アイテム A
アイテム G
アイテム A
2
2
アイテム F
アイテム G
アイテム C
アイテム D
アイテム A
1
アイテム D
エキスパート
バックリンク
あるアイテムにその時点で
最も関わっているユーザー
• 特定のアイテムのエキスパートが、そのアイテムを推奨していることを確認
• 関係性の相互相関により、精度と関連性を担保
アイテム B
アイテム F
アイテム G
アイテム D
柔軟で
権限移譲された管理
サイト コレクション
管理者
サイト管理者
クエリ ルールおよび昇格した結果の追加および更新
✓
✓
結果の種類および表示テンプレートの追加および更新
✓
✓
検索先の追加および更新
✓
✓
管理プロパティの追加
✓
サイト インデックスの再作成
(次回クロール時に再インデックスさせる)
✓
✓
サイトおよびサブ サイトを検索結果の対象外とする
✓
✓
インデックス対象外にする列 (例 : 「いいね!」の数)
✓
✓
構成 (クエリ ルールや検索先など) の
インポートおよびエキスポート
✓
✓
検索 UX の構築
簡単な統合
OData 形式
(Atom / JSON)
WFE
サ
ー
ビ
ス
検索を意識させず、
重要なシステムに
検索機能を利用
公開 API
Exchange 関連
SharePoint 関連
カスタム ソリューション
Fly UP