...

Karearea V2.0 ご紹介資料

by user

on
Category: Documents
7

views

Report

Comments

Transcript

Karearea V2.0 ご紹介資料
In-Memory XML Database
カ
レ
ア
レ
ア
Karearea V2.0
ご紹介資料
1
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
XMLデータベースの背景
XMLの普及に伴い、XMLデータの管理の必要性が増大
特に、大量データからのリアルタイムな検索、取り出しが求め
られる局面が多くなっている
XMLデータをファイルとして格納
木構造のため、検索の柔軟性や性能を確保することが難しい
XMLデータをRDBに格納
いくつかの格納方式があるが、検索の柔軟性と性能を両立させること
は困難
設計時にデータ構造を決定する必要があり、後から変更しにくい
XMLに特化したネイティブXMLデータベースの誕生
2
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
XMLデータベースの特長
XMLデータをそのまま格納、取り出し
ファイルシステムのようなイメージが多い
XMLの柔軟性と高速な検索を両立
問い合わせ言語は「XPath」「XQuery」(W3Cにて策定)
テラバイト級データからの高速検索
スキーマ設計が不要
格納出来るXMLデータの種類を問わない
データ構造が後から変更になっても問題ない
フルオートインデックス
テキスト系データに強い
全文検索機能
3
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
XMLデータベースの課題
更新用言語が統一されていない
「XUpdate」「XQuery Update Facility」「DOM風」など
DBアクセス用のAPIも各製品独自
チューニングのノウハウが十分蓄積されていない
RDBと比較すると実績が尐ない
信頼性や運用面での不安
運用、保守機能の不足
テキスト系データに比べ、数値データは苦手?
スキーマ、型を意識しない
4
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
インメモリデータベース
メモリの大容量化
PCも64bit時代に突入(Intel EM64T、AMD64)
Windows、Linuxも64bit対応
32bitでの2GB制限からの解放
メモリの低価格化が続く
数十GB~数TBオーダーのメモリも搭載可能
従来はディスクにあったデータが全てメモリに載る時代へ
従来のDBMS高速化の限界
従来のデータベース管理システムは、データがディスクにあることを前
提
高速化の手段がキャッシュやインデックス機能などに限定される
インメモリデータベースへの注目
5
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
Kareareaとは
インメモリXMLデータベース
超高速性能を実現
効率的なメモリ利用
多彩かつ柔軟な機能
検索、ソート、クロス集計、結合
テキスト系データだけでなく、数値データ処理にも有効
導入が容易
使いやすいJava APIを提供
添付ツール(GUI、バッチ処理)
6
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
インメモリXMLデータベース
インメモリに特化した超高速データ処理エンジン
「DAYDA.LabooⅡ」(株式会社ターボデータラボラトリー)を
搭載
独自のデータ構造(FAST)と処理アルゴリズム(LFM)により、超高速
性能を実現
同一文字列の実体を複数持たないことによるデータ圧縮効果
性能向上のためのインデックス、キャッシュなどの冗長な情
報は持たない
メモリを効率的に利用
チューニング不要で安定した性能
データベースレジューム機能
フォルダ単位の高速ロード、セーブ
7
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
多彩かつ柔軟な機能
超高速な検索機能
XMLの構造や検索条件にかかわらず、高性能を実現
検索結果を保持し、再検索や一部分の抽出なども可能
コールバック関数により、任意の判定条件を定義可能
検索結果のソート機能
ソート条件を任意に複数定義可能
検索結果に対するクロス集計機能
集計軸を任意に4次元まで定義可能
集計軸のカテゴライズ機能
集計方法として、カウント、最小、最大、合計を指定可能
異種XML間の結合(Join)機能
リアルタイムでの検索や集計、データ加工を実現
8
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
導入が容易
Javaのライブラリとして動作
アプリケーションプログラムと同一プロセスのため、通信等によるオー
バーヘッドが存在しない
JDBCライクで使いやすいAPI
添付ツール
Karearea Manager
→XMLドキュメントの登録、検索等をGUIにて実行
Karコマンド
→ドキュメントの登録、抽出をバッチ実行
RMIによるリモート接続
複数プロセスや複数マシンからアクセスする場合は、サーバ/クライ
アント形式による利用も可能
9
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
動作環境
OS
RedHat Enterprise Linux AS 4
CPU
x64
メモリ
256MB以上推奨
HDD
20MB以上の空き
Java環境 JDK 5.0以上
※上記以外のディストリビューション、OSについてはお問い合わせください。


LFMは、株式会社ターボデータラボラトリー(http://www.turbo-data.co.jp/)が開発した技術です。
本資料に記載された会社名・製品名は、各社の商標または登録商標です。
10
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
お問い合わせ
〒158-0097
東京都世田谷区用賀4-10-1世田谷ビジネススクエア
開発本部 企画営業部 Karearea担当
TEL : 03-5491-4770
FAX : 03-5491-4771
E-mail : [email protected]
URL : http://www.sec.co.jp/business/karearea/
11
Copyright © 2012 Systems Engineering Consultants Co.,LTD. All rights reserved.
Fly UP