Comments
Description
Transcript
Karearea V2.0 ご紹介資料
In-Memory XML Database カ レ ア レ ア Karearea V2.0 ご紹介資料 1 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. XMLデータベースの背景 XMLの普及に伴い、XMLデータの管理の必要性が増大 特に、大量データからのリアルタイムな検索、取り出しが求め られる局面が多くなっている XMLデータをファイルとして格納 木構造のため、検索の柔軟性や性能を確保することが難しい XMLデータをRDBに格納 いくつかの格納方式があるが、検索の柔軟性と性能を両立させること は困難 設計時にデータ構造を決定する必要があり、後から変更しにくい XMLに特化したネイティブXMLデータベースの誕生 2 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. XMLデータベースの特長 XMLデータをそのまま格納、取り出し ファイルシステムのようなイメージが多い XMLの柔軟性と高速な検索を両立 問い合わせ言語は「XPath」「XQuery」(W3Cにて策定) テラバイト級データからの高速検索 スキーマ設計が不要 格納出来るXMLデータの種類を問わない データ構造が後から変更になっても問題ない フルオートインデックス テキスト系データに強い 全文検索機能 3 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. XMLデータベースの課題 更新用言語が統一されていない 「XUpdate」「XQuery Update Facility」「DOM風」など DBアクセス用のAPIも各製品独自 チューニングのノウハウが十分蓄積されていない RDBと比較すると実績が尐ない 信頼性や運用面での不安 運用、保守機能の不足 テキスト系データに比べ、数値データは苦手? スキーマ、型を意識しない 4 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. インメモリデータベース メモリの大容量化 PCも64bit時代に突入(Intel EM64T、AMD64) Windows、Linuxも64bit対応 32bitでの2GB制限からの解放 メモリの低価格化が続く 数十GB~数TBオーダーのメモリも搭載可能 従来はディスクにあったデータが全てメモリに載る時代へ 従来のDBMS高速化の限界 従来のデータベース管理システムは、データがディスクにあることを前 提 高速化の手段がキャッシュやインデックス機能などに限定される インメモリデータベースへの注目 5 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. Kareareaとは インメモリXMLデータベース 超高速性能を実現 効率的なメモリ利用 多彩かつ柔軟な機能 検索、ソート、クロス集計、結合 テキスト系データだけでなく、数値データ処理にも有効 導入が容易 使いやすいJava APIを提供 添付ツール(GUI、バッチ処理) 6 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. インメモリXMLデータベース インメモリに特化した超高速データ処理エンジン 「DAYDA.LabooⅡ」(株式会社ターボデータラボラトリー)を 搭載 独自のデータ構造(FAST)と処理アルゴリズム(LFM)により、超高速 性能を実現 同一文字列の実体を複数持たないことによるデータ圧縮効果 性能向上のためのインデックス、キャッシュなどの冗長な情 報は持たない メモリを効率的に利用 チューニング不要で安定した性能 データベースレジューム機能 フォルダ単位の高速ロード、セーブ 7 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. 多彩かつ柔軟な機能 超高速な検索機能 XMLの構造や検索条件にかかわらず、高性能を実現 検索結果を保持し、再検索や一部分の抽出なども可能 コールバック関数により、任意の判定条件を定義可能 検索結果のソート機能 ソート条件を任意に複数定義可能 検索結果に対するクロス集計機能 集計軸を任意に4次元まで定義可能 集計軸のカテゴライズ機能 集計方法として、カウント、最小、最大、合計を指定可能 異種XML間の結合(Join)機能 リアルタイムでの検索や集計、データ加工を実現 8 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. 導入が容易 Javaのライブラリとして動作 アプリケーションプログラムと同一プロセスのため、通信等によるオー バーヘッドが存在しない JDBCライクで使いやすいAPI 添付ツール Karearea Manager →XMLドキュメントの登録、検索等をGUIにて実行 Karコマンド →ドキュメントの登録、抽出をバッチ実行 RMIによるリモート接続 複数プロセスや複数マシンからアクセスする場合は、サーバ/クライ アント形式による利用も可能 9 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. 動作環境 OS RedHat Enterprise Linux AS 4 CPU x64 メモリ 256MB以上推奨 HDD 20MB以上の空き Java環境 JDK 5.0以上 ※上記以外のディストリビューション、OSについてはお問い合わせください。 LFMは、株式会社ターボデータラボラトリー(http://www.turbo-data.co.jp/)が開発した技術です。 本資料に記載された会社名・製品名は、各社の商標または登録商標です。 10 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved. お問い合わせ 〒158-0097 東京都世田谷区用賀4-10-1世田谷ビジネススクエア 開発本部 企画営業部 Karearea担当 TEL : 03-5491-4770 FAX : 03-5491-4771 E-mail : [email protected] URL : http://www.sec.co.jp/business/karearea/ 11 Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.