Comments
Description
Transcript
PDF形式 - 電子情報通信学会
第 12 回データ工学ワークショップ伊豆熱川 DEWS2001 アブ ストラクト集 2001 年 3 月 8 日 (木)-10 日 (土) 1A : コンテンツ提供とスケジューリング ( 3/8 13:00-15:06 ) 1A-1 : 配信型情報源に対する統合要求記述とルール生成 梶野智行,北川博之,石川佳治 [email protected] 配信型情報源を含む各種情報源の統合利用への要求から,我々の研究グループでは,ECA ルー ルを用いた配信型情報源統合システムを構築してきた.このシステムではユーザが直接 ECA ルー ルを記述することで新たな情報配信サービ スを定義することができるが,ルールの記述は決して容 易ではない.本稿では,情報配信サービ ス定義の代数的記述のための枠組みと,それに基づいた ECA ルール自動生成のための方法について述べる. 1A-2 : 2 次元的な配信スケジューリングにおける配信間隔について カンギョウビ ,浅田一繁,飯沢篤志,古瀬一隆 [email protected] 本稿では、デジタル放送を用いたプッシュ型情報配信システムにおける配信スケジューリング方 式を提案する。これまでの配信スケジューリングに関する研究では 、主に配信時間のみを問題に した1次元的なスケジューリング方式が提案されてきたが 、我々は、デジタル放送ならではの特徴 に着目し 、配信時間のみならず、配信帯域幅も考慮した2次元的なスケジューリング方式を提案し てきた [12]。本稿では、このような 2 次元的なスケジューリングの際に、システムの全体応答時間 ( overall mean response time )を最短にするように、各データの最適な配信間隔を求める方法を考 案し,さらには求めた配信間隔を守りながら,配信スケジューリングをするアルゴ リズムを提案す る.最後に,シミュレーションを用いて,本方式の有効性を示す. 1A-3 : 配信制約を考慮したコンテンツ配信スケジューリング方式 川口知昭,大川泰蔵,山口陽一 [email protected] インターネット上の利用者に対し 、蓄積型コンテンツや放送型コンテンツを提供するストリー ムコンテンツ配信サービ スでは、コンテンツ配信スケジューリングが重要となってくる。本研究で は、様々な制約条件を考慮した、コンテンツ配信スケジューリング手法について提案すると共に、 コンテンツ配信スケジューリングシステムを構築した。また、開発システムの有効性を検証するた めに、現在行っている実証実験について報告する。 1A-4 : 携帯情報端末のための音声を用いた 惣田 一幸 平松 治彦 角谷 和俊 上原 邦昭 1 Web ナビゲーション [email protected] 本稿では,ユーザが携帯情報端末を用いてネットワークから情報を取得する際の,音声を用いた Web ナビゲーションの手法について述べる.携帯情報端末も,現在ではネットワークに接続する ことが可能であり,携帯情報端末を通してネットワーク上に広がる多くの情報源へとアクセスする 機会も増えている.しかしながら,装置として様々な制約を持つ携帯情報端末を用いてそれらの情 報へとアクセスするためには,多くの問題がある.本論文では,情報配信を行うために,ある特定 のユーザ群をコミュニティと見なし ,このコミュニティ内での情報の共有を通して,ユーザの情報 取得を支援する方法を提案する.本論文では,携帯情報端末を使用して効率的に情報を取得するた めに音声読み上げを用い,ユーザの使用状況に適した情報の呈示を行う方法を提案する.また,提 案する手法に基づいたプロトタイプシステム i-Shadow について述べる. 1A-5 : インタラクティブマルチメディアプレゼンテーションのための同期制約 管理モデル 桂智之, 天笠俊之, 植村俊亮 [email protected] 本稿では,インタラクティブマルチメディアプレゼンテーションのための同期制約管理モデル を提案する.このモデルにおいて,全てのオブジェクト及び双方向イベント間の同期は Allen の時 区間論理を拡張した同期制約で記述される.このモデルの特長はどのオブジェクトからでも全ての オブジェクトとの関係が記述されていることである.また,本モデルの同期制約を作成するアルゴ リズムも合わせて提案する.これらの提案により同期制約の追加,削除,不足検査,プレゼンテー ションデータの動的生成といったインタラクティブマルチメディアプレゼンテーションシステムで 必要な機能が容易に実現することが出来る.更に本モデルをリレーショナルデータで表現するス キーマを提案し ,プレゼンテーション作成者及び利用者が必要となる問合わせ例を示す. 1A-6 : 放送データの相関性およびアクセス頻度を考慮したスケジューリング方式 内田 渉,原 隆浩,塚本 昌彦,矢島 悦子,西尾 章治郎 [email protected] 近年,有線および無線の通信技術の発展に伴い,放送通信技術を用いたプッシュ型の情報システ ムに関する研究の関心が高まっている.プッシュ型情報システムでは,サーバが繰り返しクライア ントにデータを放送するため,クライアント数が非常に多い場合に,データアクセスのスループッ トの向上が期待できる.本稿では,クライアントのデータアクセスに対する応答時間の短縮のため に,放送データ間の相関性とアクセス頻度を考慮した新たなスケジューリング方式を提案する.提 案方式では,各データアイテムに対するクライアントのアクセス要求頻度に基づいてそのアイテム の放送頻度を決定し,相関性のあるアイテム同士を近接して放送することで平均応答時間の短縮を 図る. 1A-7 : キャッシングプロキシにおける WWW コンテンツの効率的な転送方式 藤本拓,中野賢,春本要,西尾章治郎 [email protected] 2 近年,WWW(World Wide Web) の性能向上を目的として,キャッシングプロキシが広く利用 されている.プロキシのキャッシュを特定のユーザグループで共有し ,WWW コンテンツを再利 用することによって,クライアントの応答時間を短縮できる.一方,HTTP (Hypertext Transfer Protocol) の機能強化により,クライアントがサーバからの応答を待たずに WWW コンテンツを連 続的に要求できる,パイプライン処理が可能となった.しかし,キャッシングプロキシがクライア ントからパイプライン処理で WWW コンテンツのリクエストを受けた場合,キャッシュの状況に よっては,効率的に WWW コンテンツを転送できない事がある.そこで本研究では,この問題を 解決するため,キャッシングプロキシにおける WWW コンテンツの効率的な転送方式を提案する. 1B : 時空間モデルと環境デザイン ( 3/8 13:00-15:06 ) 1B-1 : 時空間被覆と移動軌跡による移動体映像問合せ 中西吉洋,矢島史,廣瀬竜男,秦淑彦,田中克己 [email protected] スポーツ等の映像に対して, 「 選手がコート全体を動いた映像」や「 選手がこのように動いたと きに,ボールがこのように動いた映像」がほしいという要求が考えられる. ここで課題となる点は, このような複雑な問合せをどのように生成するかという事である. そこで,本研究では直感的な操 作として GUI 上のキャンパスに範囲や軌跡を指定する事で映像を問合せる手法を提案する. 1B-2 : 空間マウスを用いた人体骨格モデルの動作定義支援システムの構築 佐藤貴子,上島崇宏,富井尚志,有澤博 [email protected] 本研究では、人体骨格モデルの動作定義支援システムの設計と実装を行った。人体の構造は複雑 な構造を成すために、骨格に基づいたモデル (Bone-Based Human Model:BBHM) での動き記述が 最も本質的であると考えた。しかし 、BBHM は部品点数が多いため、動きを与える事が容易では なかった。そこで構造を単純化したモデル (Simplied システム上で Human Model:SHM) を用い、グラフィック SHM を動かすことで、BBHM に動きをマップするシステムを設計・実装した。特 に直観的な操作の為、本研究では 3 次元測定デバイスである空間マウスを用いて SHM を動かすシ ステムを実装・評価した。 1B-3 : 仮想世界データベースシステムにおけるスキーマ・ド メイン定義言語の 設計 渡辺知恵美,大杉あゆみ,佐藤こずえ,増永良文 [email protected] 我々は,VR システムにデータベースシステムを連動させることで,仮想世界の格納だけでなく, 問合せ処理や更新処理時のトランザクション機能や一貫性管理機能など のデータベース機能を十 分に備えたシステム「仮想世界データベースシステム (Virtual World Database system :VWDBs) の設計と実装を進めている.本稿では,VWDB において仮想世界や仮想世界に存在するオブジェ クトのスキーマ定義言語について述べる. 3 1B-4 : 時区間概念データモデルを用いたデータの実装方法 羽石将士,有次正義,金森吉成 [email protected] 本論文では,我々が提案している時区間概念データモデルの実装について議論する.実装にはい くつかの方法が考えられ,それぞれ利点,欠点が存在する.例えば,事象の発生した期間について の問合わせを効率よく処理できる実装方法もあれば,事象の起こっていない期間について効率よく 処理できる実装方法もある.本論文では,モデルの実装方法をいくつか考え,それぞれの方法での データの格納・扱いについて述べる.さらに,それぞれの実装方法を用いてデータベースを構築し, それを使った検索実験によってそれらの性能の比較,検討を行う. 1B-5 : 高速ネット ワークグラフィックス表示装置を用いた遠隔仮想水族館の実 現手法 川口琢也,青木健浩,富井尚志,有澤博 [email protected] 本研究では、広域ネットワークを利用した遠隔仮想水族館を実現するための手法について述べ る。 遠隔仮想水族館を実現するためには、1.魚の形状や運動を魚の生態に照らし合わせてモデ ル化すること, 2.高速ネットワークを用いてモデル化されたグラフィックスオブジェクトを伝 達・表示することが必要である。 そこで本研究では特に1に関しては脊椎に束縛される柔構造モ デルを用いた試みを行った. 1B-6 : 位置情報と時間情報を用いた映像データの索引付け手法の提案 上田隆正,天笠俊之,吉川正俊, 植村俊亮 [email protected] 本論文では,人間が身体に装着したビデオカメラ(ウェアラブルカメラ)を用いて流し撮りし た映像に対して,時間情報と地理情報を利用した映像の検索を実現する索引手法を提案する.利 用者はウェアラブルカメラに加えて GPS を装着し ,常時映像を撮影する.その際,映像と同時に GPS より時間情報と位置情報( 緯度,経度)を取得する.このように蓄積された映像に対して,位 置情報,地名,ランド マーク名などの地理情報を利用した索引を付与する.これにより,利用者は 長時間の映像の中から,時間情報,地理情報と言った,身近な情報を利用した検索が可能となる. 1B-7 : 3D ゲーム開発 SDK を用いた環境デザインのための景観シミュレーション 呉受妍,花房哲生,盧祥偉,上善恒雄,加賀有津子,笹田剛史 [email protected] 環境デザインは統合的デザインであり、環境デザインを実現させるためには社会的な合意形成が 行なわれなければならない。そのためには適したメディアの必要性が求められる。そこで本論文で は現在使われているメディアの問題を解決でき、より多くの人々が参加しやすいデザイン メディア としてリアルタイム 3D ゲームの開発環境に着目し 、実際の環境デザインプロジェクトに摘要する ことでその有効性を考察する。In this paper, we focus on PC 3D game SDK for the new media of 4 environmental design. First, we are using this media to the real project of environmental design, the eectiveness will be discuss. 2A : 情報の構造化と発見 ( 3/8 15:00-17:08 ) 2A-1 : リレーションを表現した空間におけるOLAPモデル 笹栗 茂,牧之内 顕文 [email protected] データウェアハウス分野の中で、ビジネスデータの多角的な分析業務を効果的にサポートする ツールとして On‐Line Analytical Processing( OLAP )が注目されている。我々は、OLAP の実 現手法の一つである多次元データベースが表すキューブと座標空間の類似性に着目し 、幾何空間を 用いた OLAP の実現を目指している。本論文では、OLAP の機能を提供するデータベースモデル として、空間モデルを提案する。また、その中で提案する操作を用いて、いくつかの問合せ例を 示す。 2A-2 : 類似画像検索技術を用いた情報整理支援方式 酒井崇男,三井一能,赤間浩樹 [email protected] 大量の画像データを分類整理するのは、一般に困難であるが 、類似画像検索技術を用いると分 類、整理を行う時間的コストを大幅に下げることができる。ユーザが大量画像に対してメタデータ と画像特徴量双方の観点からコンテンツにアプローチすることができ、個人の整理情報を生成でき るシステムを紹介する。 2A-3 : ハイパービデオを利用したビデオ・データベースの意味構造に基づくブ ラウジング手法 牛尼剛聡,渡邉豊英 [email protected] 本論文ではビデオ・データベース上で簡単な操作で効率的な内容確認を実現するためのハイ パービデオを利用したブラウジング手法を提案する.本手法はイベント -アクティビティ・モデル によって内容記述がなされたビデオを対象に,イベントの依存関係に基づいてデータベース中のビ デオのをハイパービデオ化する.本手法により,利用者は目的や興味に応じてビデオの内容を対話 的に確認可能である. 2A-4 : 話題構造に基づく Web ページ間の意味的関係の発見 松倉健志、平田陽一、田中克己 [email protected] Web ページは複数の話題を含み、1 つの話題はその主題と内容を表す 2 つのキーワー ド 群から構成されていると考え、キーワード の出現密度分布と共出現傾向を用いて Web ページの 本稿では 5 話題構造を抽出する方法について提案する。また話題構造を比較することで Web ページ間の詳細 度等に基づいた意味的関係を推定する方法について提案する。最後に本提案に基づく予備実験とそ の結果について報告する。 2A-5 : WWW ページ群の部分文書抽出と直列化による閲覧支援 高橋美乃梨,角谷和俊,上原邦昭 [email protected] 本論文では,ある Web サイト内に存在するページ群の構造とハイパーリンクを用いた部分文書 抽出によるユーザへの自動呈示システムについて提案する.また,呈示する際の演出効果について 述べる.更に,実際の Web サイトへの適用を行うため,プロトタイプシステムを開発している. 2A-6 : 3D オブジェクト と属性情報の受動的視聴方式 矢部武志,四方正輝,灘本明代,田中克己 [email protected] 3 次元オブジェクトから情報獲得の手段はウォークスルー等による能動的な操作よりアニメー ションによる受動的な方法が適していると考え,3D オブジェクトと属性情報を用意するだけでア ニメーションを自動生成し音声にて呈示を受動的視聴方式を提案する. 2B : データ圧縮と高性能 DB ( 3/8 15:00-17:08 ) 2B-1 : 二段階圧縮法の圧縮率の改良 大塚真吾,宮崎収兄 [email protected] テキストファイル中の単語と既存のアーカイバを用いた圧縮法である二段階圧縮法は高速検索 が可能で、しかも圧縮率も良好である。本論文では符号語長を可変長にする事で圧縮率の向上を 図る。 2B-2 : 圧縮によるディスク読み出しの最適化 平嶋朋子,横田治夫 [email protected] デ ィスクの処理速度が限界に近付いているにもかかわらず、CPU の性能はなお向上し続けてい る。このような状況下では 、データを圧縮することでデ ィスク処理速度の向上が望める。そこで 我々は、デ ィスクに格納するデータに対して圧縮を行うかの判断基準を求める方法を提案する。 2B-3 : 自律ディスクにおける故障時の動作とそのルール処理の実装 阿部 亮太,横田 治夫 [email protected] 6 我々は 、デ ィスク装置中のプ ロセッサやメモリを有効活用し 、装置内で高度な機能 (故障対策、 障害回復等) を実現するアプローチとして、自律ディスクを提案してきた。本稿では、自律ディス クにおいてディスク障害を起こした場合について焦点をあて、故障をマスクし 、ルール記述によっ てシステムを止める事なく、検索対象をプライマリからバックアップに変更する方法を示す。更に JAVA で実装された模擬自律デ ィスクの PC 実験による結果と効果を報告する。 2B-4 : / 自律ディスクにおけるディスク故障時 追加時のクラスタ再構築法 伊藤大輔, 横田治夫 [email protected] 我々はネットワーク接続ディスクの負荷分散, 信頼性向上のために自律ディスクを提案している. 各ディスクは分散ディレクトリ構造持ち, 負荷の変化や障害およびネットワーク環境の変化を感知 して対応する. また , 上記の対応を行うためにルール記述機構を備えている. ルールを用いること で不可分散や耐故障処理の戦略に柔軟性を持たせることが可能となる. 本稿ではネットワーク上の デ ィスクの故障時/追加時のクラスタ再構築に 2 フェーズコミットの考え方を用いた手法について 報告する. 2B-5 : DVD-RAMド ライブを用いたスケーラブルアーカイバにおけるホット デクラスタリングの性能評価 根本利弘,喜連川優 [email protected] DVD-RAM ド ライブを用いたスケーラブルアーカイバにおける負荷分散手法であるホットデ クラスタリング手法について述べる.スケーラブルアーカイバは,複数の小規模アーカイバをその 間のメディアの移送を可能とするメディアマイグレーション装置によって接続することで構成され る.また,ホットデクラスタリングは,このメディアマイグレーション装置を用いることで,エレ メントアーカイバ間で物理的に メデ ィアを移動させ,負荷分散を図る手法である.本稿では,シ ミュレーションにより性能評価を行い,その有効性を示す. 2B-6 : An Ecient Scheme for Processing Wireless Read-only Transactions in Data Broadcast SangKeun Lee, Masaru Kitsuregawa [email protected] This paper addresses the issue of ensuring consistency and currency of data items requested by wireless read-only transactions in data broadcast. To handle an inherent property in wireless data broadcast that data can only be accessed strictly sequential by users, a predeclaration-based query optimization is explored and a practical method, called PwA (Predeclaration with Autoprefetching), is devised for ecient wireless read-only transactions processing. The performance of the proposed method is also evaluated by an analytical study. Evaluation results show that the predeclaration technique we introduce reduces response time signicantly and adapts to dynamic changes in workload. 7 3A : 分散・並列 DB ( 3/9 8:30-10:18 ) 3A-1 : 複合オブジェクト に対する並列複合検索システム 福岡久長,樋口健,都司達夫,宝珍 輝尚 [email protected] このシステムでは複合オブジェクト集合を並列計算機上に分散配置し 、並列操作をすることに よって検索スループットの向上を試みている。複合検索とは、論理演算和、積などで結合された複 数の検索条件から検索し 、検索結果のオブジェクト集合を得る検索のことである.本論文では,そ のためのアルゴ リズムに関して論じる。また,連続的に検索要求が発生している状況で,間に更新 要求が発生する場合にも,検索スループットをなるべく落とさないようなアルゴ リズムに関して論 じる.最後に,それらのアルゴ リズムに対する測定結果を報告する. 3A-2 : 並列オブジェクト 指向データベースプログラミング言語のための動的性 能最適化機構 木村健一郎,天野浩文,牧之内顕文 [email protected] データベースプログラミング言語では、処理対象の個数や分散の様子などが実行時まで不確定で ある。そのため、従来コンパイル時に行われていた最適化を行うのが困難である。本論文では、並 列オブジェクト指向データベースプログラミング言語のための動的性能最適化機構を提案し 、その 有用性を確認している。 3A-3 : 並列データベースカーネル ECデータによる実験 DBkernel を用いた高速情報検索処理:TR 合田 和生,田村 孝之,喜連川 優 [email protected] 関係データベース上での文書検索 (IR) 技術が提案されている。本研究では、データベースプラッ トフォームとして注目されている PC クラスタ上で、並列関係データベースシステム (DBKernel) を利用し 、文書検索を実装し 、検証した。ワークショップでは、更に PC クラスタの規模を拡大し 、 並列化の問題点について報告を行う。 3A-4 : 関係データベース処理系 機構の実装 DBKernel における複数問合せ実行の高速化 石井賢治,田村孝之,喜連川優 [email protected] データウェアハウスのように、大規模なテーブルスキャンが頻発するようなアプリケーションの 高速化は重要な課題である。またその普及と共に、マルチユーザ環境での利用も考慮に入れた高速 化が必要となっている。本論文では、テーブルスキャンのスケジューリングを行うことにより、こ れまでの FCFS 方式に比べて大幅な性能向上が達成できたことを実機上でのベンチマークにより 示す。 8 3A-5 : 分散独立アクティブデータベースにおける障害ハンド リング 井川智崇,横田治夫 [email protected] 我々は分散した独立アクティブデータベースシステム間のメッセージ通信によってワークフ ローを実現する方式を提案してきた。今回障害ハンド リングの手法について説明する。障害対策は サブモジュール内で行う部分と、サブモジュール間で協調して行う部分とに分かれる。それぞれの 処理について述べる。 3A-6 : 分散ディスクへの XML データの分割格納方法 夏目 亘,横田 治夫 [email protected] 現在、web 上や、共通のデータ交換用のフォーマットとして注目されている XML だが 、一つの ファイルに含まれるデータ量が多くなればその分ファイルサイズが大きくなり、扱いにくくなる。 そこで XML データの格納方法として、一つの XML ファイルを複数のウェルフォームド な XML ファイルに分割し 、分散デ ィスク上で管理することを考える。その際に 、データを格納する分散 デ ィスクとして、我々が研究中の自律デ ィスクを用いる。 3B : 高度データ操作・管理 ( 3/9 8:30-10:18 ) 3B-1 : SuperSQL処理系におけるグルーピング操作の効率的な実装 有澤達也,遠山元道 [email protected] SuperSQLでは構造化データの取得が全体の処理時間に大きく影響する。本研究では、S uperSQLの質問処理でSQL文にORDER BY節を付加することにより、グルーピング 操作に必要なソートを事前に行う方法を実装する。 3B-2 : 木構造データに対する宣言的操作とその完全性 今知 律子,掛下 哲郎 [email protected] 複合オブジェクトは複雑なデータ構造を表現でき、リスト・木構造・グラフ等の自己参照型 データ構造を表現するのに適している。XQL や XML-QL を始めとして木構造を検索するために 多数の宣言型言語が提案されているが 、木構造に対する宣言的な編集機構を備えたものは知られて いない。本論文では木構造に対する宣言的な編集機構としてビュー機能を提案する。ビュー機能は 木構造の構成要素 (節点、経路、部分木等) にマッチングする領域変数と 、様々な条件式をによっ て定義される。条件式は編集対象の木構造データを検索するためと、木構造データに対する変更を 記述するために用いられる。本論文では編集操作の完全性を定義し 、提案したビュー機能が完全で あることを証明する。 9 3B-3 : 多次元分類を用いた情報整理方式の運用実験 井ノ口 励,掛下 哲郎 [email protected] 電子的に流通する様々な情報の共有および活用を円滑に行うためには、情報の分類および整理を 効果的に行う必要がある。我々が提案する多次元分類方式は独立した複数の木構造によって構成さ れており、情報の概観が容易かつ、柔軟な検索が可能である。本論文では、多次元分類方式を用い た情報整理方式の運用実験を行う。実験では、実際にデータを登録していく方法を採る。これによ り、木構造を再構成する際の管理者にかかる負担や実用上の問題点を発見する。また、実験から得 られた結果について考察し 、多次元分類方式の実用性について検討する。運用実験では 5 個の問題 点を発見した。これらの内の 3 個については、有効な解決策を見つけることができた。 3B-4 : メタ質問の論理的最適化 松本渉,柏川伸悟,三浦孝夫,塩谷勇 [email protected] 本稿ではメタ質問の論理的最適化について論じる. 以下では, メタ質問をいくつかの標準型 (stan- ) に分け, 各々に対する変換法則を提案する. また, 論理的最適化と物理的最適化の動的関 係についても議論し , 特にシグニチャを利用したときの変換法則を提案する. 我々の研究中である HOME システムでは , シグニチャによりメタ質問において効果的な走査やアクセスが可能である. dard type 3B-5 : データベースにおけるグループ化と集約関数の形式化 柏川伸悟、松本渉、 三浦孝夫、塩谷勇 [email protected] Codd の関係代数式はグループ化演算や集約関数を定義をせず、入れ子の関係を想定していない ため単純には導入できない。今までの研究として、Gray が関係代数言語を拡張して演算ができる ことを証明している。Gray の関係代数言語は 、余分な操作記述が必要で煩雑である。本稿では 、 Gray の拡張に加えメタオブジェクトという概念を用いてグループ化演算や集約関数を論じ 、形式 化するものである。この形式化は、少ない記述で洗練された表現が可能である。 3B-6 : 柔軟なプロセス管理のためのプロセス設計履歴の管理 井上創造, 岩井原瑞穂 [email protected] 現実の世界においては,ワークフロー管理システム (Work ow Management System ,WfMS) において扱うことが難しい協調作業が存在する.本稿ではそのような作業のためのモデルとして コミュニケーションプロセスを導入する.コミュニケーションプロセスは,作業の参加者ど うしが 議論によって形成し,その議論の発言の中で自然言語で記述されるプロセスである.コミュニケー ションプロセスは設計と並行して実行され,設計と実行の間にやり取りが行われることも考えられ る.コミュニケーションプロセスの管理は,ワークフローの例外処理や動的再構築を含めた,予測 困難な状況への適応を実現するという意味で重要である.本論文では,コミュニケーションプロセ スの設計履歴を記録し,その設計履歴に沿ってコミュニケーションプロセスを生成,実行すること 10 ができる M- Trans システムを提案する.コミュニケーションプロセスは,プロセスと利用者間の コミュニケーションを統合的に記述するメッセージトランザクションモデルに基づく. 4A : データマイニングと情報フィルタリング ( 3/9 10:30-12:18 ) 4A-1 : ド メイン知識を導入した電波天文データマイニング 古畑玲奈,青木賢太郎,大石雅寿,増永良文 [email protected] 近年注目されている,データマイニングの手法を電波天文データに応用し, 新たな発見をが できることを期待する.分析する際に,ド メイン知識の欠落が 大きな影響を及ぼすことが確認さ れた.本研究では,その解決策を検討している. 4A-2 : デイトレーディング用の株取引可視化システム 山下 陽子, 市川 哲彦, 藤代 一成, 尹 熙元 [email protected] 株式投資のためファンダ メンタル分析やテクニカル分析の手法は盛んに研究されているものの, これらの分析手法の多くは日単位,週単位の中長期投資に利用することを目的としている.これに 対して,分単位で実時間売買を行ういわゆるデ イトレーデ ィング用の分析方法は確立されていな い.そのため,現在利用されているシステムは,注目する複数の銘柄毎に折れ線グラフを表示させ, 人が売買注文のタイミングを判断する手法を用いている.しかしながら,慣れたトレーダであって も10銘柄程度の値動きに着目するのが限界で,多数銘柄の値動きを迅速に把握することは非常に 困難である.そこで本研究は,東証一部上場銘柄の売買を記録した時系列データのデータベース化 と,これに対する情報可視化技術の適用を行い,デイトレーダーのテクニカル分析における対話的 支援環境の構成を目的としている.本稿では,可視化対象となるデータの概略説明に続いて,初期 プロトタイプとして構築した3 D チャートによる可視化を示し ,その視覚的構造の記述と有効性 に関する考察を行う. 4A-3 : アソシエーションルールを用いた時系列データベース解析 渡辺浩平,三浦孝夫,塩谷勇 [email protected] 時系列データベースを時間軸上で解析する方法を提案する。時系列データベースはある瞬間に対 するデータの集合を保持している。この抽象度を上げ、幅を持った時間帯を得ることを考えること にする。具体的には、データベースに矛盾のない時間に対する知識を獲得することを考える。デー タ解析手法として知られているアソシエーションルールを用いてこの問題を解く。 11 4A-4 : Dimension Reduction Method: Preprocessing for Interactive Association Rule Mining Gyoergy J. Simon, Tadashi OHMORI, Mamoru HOSHI [email protected] In the last decade, among the dierent areas of data mining, association rule mining with item constraints have gained much popularity and many fast algorithms have been developed. Lately the need for interactive mining has risen, but the current algorithms can not support such a need suciently. Our algorithm, Dimension Reduction Method (DRM), is not a mining algorithm, it is only a method that extends existing mining algorithms to be able to perform interactive association rule mining with item constraints eectively. We created our test system around Reorder and Apriori. 4A-5 : A Context Dependent Information Filtering Method of Document Data and its Application to Document Mining Dai Sakai, Yasushi Kiyoki, Naofumi Yoshida, Takashi Kitagawa [email protected] In this paper we present an information ltering method with context recognition and its application to document mining. The ltering method is able to remove irrelavant data that are less correlated in meaning with given context words. Our method is based on an idea that meaning of document data varies with contexts or viewpoints. By ltering out retrieval candidate data items with low semantic correlation with the given context words, information retrieval and data mining become eective because analysis of data is only performed on data items with high correlation with the given context words. This ltering is realized by the use of the Semantic Associative Processing Method. Dynamic semantic analysis of document data according to the given context words is made possible by a semantic projection operation to select a semantic subspace of an orthogonal multiple dimension space where document data are mapped. We apply this ltering method to a semantic clustering method. The meaning of document data obtained after the information ltering are analyzed according to the given context words. In the clustering process, semantic correlation of document data with respect to each other is calculated in the semantic subspace to form distance matrix. A semantic distance calculation formula designed based on the machinery of the semantic subspace is applied to stress the characteristics of document data as the distances are computed. By this process, relevant clusters can be obtained. The feasibility of our information ltering method and its application to a semantic clustering is shown in two experiments. The application of the context dependent semantic ltering of data to document mining enables ecient knowledge acquisition from document data according to a given context words. 4A-6 : 主成分分析を用いた遺伝子発現データ検索結果の出力手法について 山脇晋吾,廣中大雅,竹中要一,松田秀雄,橋本昭洋 [email protected] 12 生物の遺伝子がどれだけ働いているかを示す遺伝子発現量のデータ( 遺伝子発現データ)が蓄積 され,データベースかされつつある.この発現データを問い合わせとして発現データベースの類似 検索をするのであるが,発現データの類似関係をユーザに分かりやすく掲示できる表示インタフェ イスが望まれている.そこで,本研究では,主成分分析を用いて多次元データである発現データの 類似関係の把握が容易な検索結果表示のインタフェイスを考える. 4B : 類似検索と視覚化インタフェース ( 3/9 10:30-12:18 ) 4B-1 : メディアデータを対象としたメタデータ自動抽出方式の実現とその意味 的楽曲検索方式への適用 中西崇文,北川高嗣,吉田尚史,清木康 [email protected] 本稿では,メディアデータを対象としたメタデータ自動抽出方式のための感性作用素の実現方式 について示す.本方式は,メタデータ自動抽出方式の出力する重みつき単語群によるメタデータを 対象として,感性作用素により人間の感性を反映したメタデータを変換することを可能とする.メ ディアデータ群を対象としたメタデータ自動抽出方式において,人間の感性や感覚を解釈する機構 が導入されれば ,人間の直感に合致した言葉によるメタデータの自動抽出が可能となる.さらに, 意味的連想検索方式を用いることにより,メディアデータ群を対象とした人間の直感に合致する検 索が可能となる.本稿では,楽曲メディアデータを対象とした自動抽出方式と組み合わせ,その楽 曲メデ ィアデータを対象とした感性作用素を有するメタデータ自動抽出方式として示す. 4B-2 : ビデオデータベースにおける抽象化階層に基づく類似シーン検索 小坂健,牛尼剛聡,渡邉豊英 [email protected] ビデオデータベースは様々なユーザを対象とするため、単純な操作で望んだ シーンを検索する 技術が重要となる。本論文では動画像に人手で付加された インデックスの系列について、抽象化 を行い類似検索を実現する方法を述べる。 4B-3 : 多次元空間における近傍連鎖点列を用いた類似検索システム 田中覚,遠山元道 [email protected] 利用者に提示される検索結果は、ある基準に従って分類されていることが望ましい。しかし 、利 用者が見つけたい情報の特徴を利用者自身が正確に把握することは難しく、そのため検索システム 側で利用者の真に欲する情報を与えられるようにナビゲートする仕組みが必要である。そこで本稿 では 、多次元空間内の新しい近傍探索の手法を提案する。この手法は 、利用者に検索に必要なパ ラメータを要求することなく、利用者の望む情報へと適切にナビゲートすることが可能である。ま た、検索結果が利用者の要望する情報から極端に外れている場合を想定し 、それを防ぐ 方法を提案 する。本稿では、この手法を用いた類似検索システムを試作し 、画像類似検索に適用した例を示す。 13 4B-4 : 発想標語を用いたクラシック音楽メタデータ生成による意味的連想検索 方式 伊地智麻子,清木康 [email protected] マルチメディアデータベースの分野では,メディアデータを検索するためのメタデータを生成す る方法の実現は,重要な研究課題となっている.本稿では,クラシック音楽を対象とし,その楽譜 の持つ属性情報である"発想標語"を用いてメタデータを生成し,意味の数学モデルによる意味的連 想検索方式に適用するメタデータ生成方式を提案する.この方式によって生成されるメタデータを 対象として,意味的連想検索を適用することにより,検索者が,印象などの感性的な表現を問い合 わせとして言葉によって与えると,その印象に相関の強い楽曲を検索することが可能となる.本稿 では,提案方式を実現し,意味的連想検索による実験を行なった結果を示し,既に提案している楽 曲メタデータ自動生成方式との比較を行い,本提案方式である発想標語によるメタデータの生成方 式の有効性を検証する. 4B-5 : クラスター分析木を用いた対話的画像検索のためのインタフェース 前迫隆志,黒木進,佐藤聡,北上始 [email protected] 画像データベースから必要とされる画像を効率的に,取りこぼし無く検索することは重要な研究 課題である.本研究ではクラスター分析木に対話的な検索におけるインデックスの役割を持たせた. また,クラスター分析木を検索に用いる事について考察し,分析木の構造を調整する事で検索効率 の良いインデックスとして用いることができた.調整したクラスター分析木に基づいてクラスター の代表画像や特徴を提示したり,ランキング表示などを行う画像検索システムの試作も行った. 4B-6 : 統計的データの主観的な編集・統合のためのマルチデータベースシステ ム実現方式 池田知弘,藤原敬史,清木康 [email protected] 公的機関や調査機関により提供される統計的データは,社会・経済・環境指標データとして加 工・編集することにより,種々の目的に応じたアセスメントや意思決定に役立つ有効な情報資源と なる.そのため,ネットワーク上に散在する統計的データコンテンツを効果的に統合利用するこ との意義は大きい.本稿では,同一ド メインを持つ統計的データの編集・統合を目的とした,統計 データベース知的統合システムの実現方式を提案する.本システムでは,統一的なデータ相互結 合機能の実現により,利用者への主観的なデータ編集・統合環境を提供可能とする.その特徴とし て,統計的データの意味的な特徴に着目した多様な関連性を包括的に評価する機構の実現があげら れる.本稿では,さらに,地域統計データを対象とした設計・実装により実現した地域特性評価シ ステムについて示し ,実験を通して提案システムの有効性を明らかにする. 14 5A : XML と DB ( 3/9 14:50-16:56 ) 5A-1 : 遺伝子発現データのクラスタリング検索を行う XML データベースの構築 坊垣恭右,増山智久,竹中要一,松田秀雄,橋本昭洋 [email protected] 分子生物学の分野では各生物種の遺伝子の情報を解析する研究が行なわれている.そして,近 年,大量の遺伝子の発現データが得られ,データベースに蓄積されている.遺伝子発現データを基 に遺伝子の機能を解析するためには、クラスタリングを行い、その結果である木構造を比較して変 化している箇所を見つけ出すことが重要となる.そこで,本研究ではクラスタリング結果を体系的 に格納し ,検索できるデータベースの実現を考える. 5A-2 : 企業間サプライチェーンにおける 清水 哲郎 (長岡技術科学大学),春日 史朗 XML 文書開示制御システム (NTT サイバースペース研究所) [email protected] XML による BtoB フレームワークが実用化されているが,文書送信の面で,効率性,利便性を 欠いていると考えられる。本稿で提案するシステムは,データ暗号化を用いて文書内の情報参照の 可否を制御する,開示制御を実現する。よって,企業間サプライチェーンにおける X M L 文書流 通において,効率性,利便性を向上させることが可能となる。 5A-3 : 拡張可能 XML 問合せ言語 X^2QL における拡張機構 品川徳秀, 川田純, 北川博之, 石川佳治 [email protected] XML 文書を対象とした問合せ言語では、多様化、複雑化する文書処理要求に柔軟に対応可能で なければならない。この観点から、我々はユーザ定義の外部関数による機能拡張性を持つ拡張可能 XML 問合せ言語 X^2QL を提案してきた。本稿では、これまでに報告を行なった外部関数に加え、 集約関数等のより高度な外部関数の導入について説明する。併せて、XML サーバを情報源として 利用した X^2QL 問合せ処理系について報告する。 5A-4 : オブジェクトデータベースによる XML データの管理 岩城貴雅,有次正義,金森吉成 [email protected] XML 文書を格納,管理する事を考える.その 実現のために W3C で提唱されている DOM を利用する.これにより,従来の DOM アプ リケー ションの様に XML データを処理毎にパースする必要が無くなるため,処理が高速になる.さら に,データベース上の XML データの操作を DOM のインターフェースを通して操作することが できる.本論文ではさらに,提案する手法と,従来の処理毎に XML データを DOM にパースし 本論文では,オブジェクトデータベースを用いて て処理する手法との処理時間の比較を行い,我々の手法の有効性を示す. 15 5A-5 : 実行場所の切り替えによる XSL アプリケーション応答時間の削減 山田信太郎,岩井原瑞穂 [email protected] XML と XSL の組み合わせを用いると表示のために HTML へ変換する処理を行う場所を,ク ライアントとサーバで切り替えて実行することができる.最適な実行場所を動的に選ぶことができ れば,アプリケーション応答時間を短縮することが可能である.本稿では時間が逆転する条件を調 べ,最適な場所を選ぶための判断基準を考える. 5A-6 : ソフト ウェア要求仕様書の形式変換 蜂巣吉成 [email protected] 本稿では仕様記述言語 Z で書かれた要求仕様書をさまざ まな形式に変換する方法について提案 する。構造化文書をオブジェクトとして表現し 、デザインパターンを適用することで、統一的な枠 組みで形式変換を行うことができた。 5A-7 : Application of Relative Region Coordinate for XML Storage Dao Dinh Kha, Masatoshi Yoshikawa, Shunsuke Uemura [email protected] The current XML storage methods are often costly in term of content update. Due to XML structure, many element coordinates expressed by absolute value have to be re-computed if the content of source data is updated. The reconstruction of large portion of index les causes a serious problem, especially when XML data content is frequently changed. In this paper, we propose a XML storage method using the Relative Region Coordinate that can reduce the reconstruction workload eectively by expressing the XML element coordinate based on the region of its parent element and storing related coordinates together in a tree-structured index. 5B : 個人化と適応化 ( 3/9 14:50-16:56 ) 5B-1 : アクティブルールに基づく Web 個別化・環境適応システム:ActiveWeb の実装 竹内 淳記,清光 英成,田中 克己 [email protected] Web データの個別化・環境適応に関する研究は多くなされているが,そこでは,作者の個別化・ 環境適応の意図はプログラム内に埋め込まれている.本論文では,ページ作者の個別化・環境適応 に関する意図を明示的に表現することができる ActiveWeb の実装について議論する.ActiveWeb は,XML 表現されたルールを用いて個別化・環境適応を行っている. 16 5B-2 : ユーザからのフィード バックを利用した目的指向ナビゲーション手法の 検討 戸田浩之,榎本俊文,佐藤哲司 [email protected] 電子情報の増大により、効率的な情報取得を支援するシステムの必要性が高まっている。その流 れは企業内など 組織内にも浸透し 、必要な文書を探し出すためのシステムにおいて、全文検索が広 く利用されている。しかし 、従来の全文検索では、主にキーワード 頻度に基づくため不要文書が検 索結果中に存在し 、ユーザは結果の中から本当に必要な情報を選択しなければならず、大きな負担 となっている。そこで本稿では組織内の特徴を生かし 、ユーザの目的にあった結果を提示する情報 ナビゲーション手法を提案する。 5B-3 : 動的生成されたシナリオを用いた個人化コンテンツの自動生成 岡本道也, 大川泰三, 鎌原淳三, 下條真司, 宮原秀夫 [email protected] 近年, インターネットの普及によりユーザが多くの情報をネットワークを通して容易に受け取る ことが可能となった. インターネットにおいて今後さらに多くの情報が氾濫することが予想され , ユーザはこれらの膨大な情報の中から自分に必要な情報だけを選択して視聴する必要が出てきた . 本研究では料理番組を題材として扱い, ユーザの情報発見を支援するシステムの提案を行なう. 本 システムではユーザの嗜好情報とコンテンツの属性情報を用いて各コンテンツを対する評価値を計 算し , 配信コンテンツの選択を行なう. また配信する際に , コンテンツ提供者が設定するコンテンツ 利用制約でフィルタリングを行なうことによりユーザ, コンテンツ提供者の両者の制約を満たした コンテンツ配信が行なえる. さらに複数のコンテンツを組み合わせて配信する場合, 各コンテンツ 間の関係を考慮する必要がある. コンテンツ間の関係を記述する手段としてシナリオという概念を 導入した. コンテンツ間の関係を記述したシナリオを利用してコンテンツの構成を行なうことによ り, 配信コンテンツにおいてバランスのとれたコーデ ィネートを実現する. 5B-4 : ユーザ間の関連性に基づいた連続的情報転送モデル 竹内 亨,鎌原 淳三,下條 真司,宮原 秀夫 [email protected] インターネット上の情報流通手段として,メール,NetNews,WWW など 多数存在し ,それら の情報のフィルタリングするための手段として,コンテンツベースフィルタリングと協調フィルタ リングなどが提案されている。しかし 匿名性の高いインターネットにおける情報流通を考えた場 合,情報の価値を判断する際に重要になってくるのは,情報の発信者とそれを伝えてきた中継者に 対する信頼性である。そこで本稿では,隣接ユーザ間の連続的な情報転送に基づいた P2P コミュ ニケーションモデルを提案する。このモデルでは情報転送の可否は転送を行うユーザが決定するた め,転送するユーザに対する信頼性を優先度という形で評価することによって,送られてきた情報 をフィルタリングすることが可能となる。これをヒューマンネットフィルタリングと呼ぶ。本稿で は,このモデルとフィルタリング方式を実装し ,その評価を行う。 17 5B-5 : ユーザの嗜好の部分的な類似性を利用した情報推薦手法の提案 浅川智文,鎌原淳三,下條真司,宮原秀夫,川口知昭,山口陽一 [email protected] インターネットの普及によりユーザが獲得できる情報は非常に多くなり,推薦システムなど の ユーザの嗜好に合わせて情報を提供するシステムが開発されている.しかし ,これらの手法では ユーザの嗜好を中心とした情報しか提供されず,ユーザが新しく興味を持つことができる情報を発 見できることは少ない.そこで,ユーザの嗜好の部分的な類似性を利用して,ユーザが新しく興味 を持つことができる情報を推薦する手法の提案を行い,実験として実装を行った TV 番組の推薦を 行うシステムについて説明する. 5B-6 : 時空間情報を利用したサッカー番組のダイジェスト 作成方式 橋本隆子,白田由香利,飯沢篤志 [email protected] 放送のデジタル化に伴い,映像情報の内容を説明する情報を番組補足情報として付加し,その 番組補足情報を用いて映像情報を検索する方式が各種研究されている.番組補足情報を利用した映 像情報検索方式の一つとして,ダ イジェスト生成がある.我々はこれまで野球およびサッカー番組 に対してダ イジェスト生成方式の研究を行ってきた.サッカー映像の特徴は試合の構造が明確でな く,動きが速く,協調プレ イが多いことである.そのため我々の方式では,番組補足情報として映 像上の事象情報のみでなく,ボールの動き,位置といった時空間情報を付加し重要シーンの抽出機 能を実現している.本稿ではこれまで我々が提案してきたサッカー番組に対するダ イジェスト生成 方式を,実際に実装し,いくつかのサッカー番組に適用した結果について報告する.時空間情報に 基づいてシーン抽出する我々の方式には,各種の課題があるため,それらの課題を洗い出した上で その解決方法も検討する. 5B-7 : Actiview:SuperSQL を利用した適応型ビューの実現 遠山 元道 [email protected] WWW の普及に伴い、データベースに格納されている情報を WWW 技術と結合する研究が重 要性を増している。情報を WWW を通して表示する際、近年急速に普及した小型携帯端末からの アクセスを考慮し 、表示する環境に合わせたページを作成することが要求されてきている。関係 データベースと WWW 連係システムである SuperSQL を利用することで、データベースの情報を ビューとして表示する際に、端末の表示画面サイズに動的に対応することを実現する。本稿では、 SuperSQL 内の処理として表のレ イアウト変換について説明し 、動的表示ビューを生成するシステ ムを提案する。 6A : クラスタリングとコミュニティ発見 ( 3/10 8:30-10:18 ) 6A-1 : 情報の新規性を考慮したインクリメンタルなクラスタリング手法 陳怡冰,石川佳治,北川博之 18 [email protected] 近年,インターネット上の情報提供・配信サービ スの進展により,オンライン情報処理には ますます注目が集まってきている.大量の提供された情報からの有用な情報の選択,抽出,要約な どを行なうため,クラスタリング手法は有効な手段の一つである.本研究では,ユーザが一般に新 しい情報をより重視することを考慮し,情報の時間的な価値の概念をとりいれたクラスタリング手 法を提案した.本稿では,提案した手法の概要と実装方式について述べる. 6A-2 : フィルタリングの関数的性質とその関係ついて 澤井里枝,Loh Yin Huei,寺田努,塚本昌彦,西尾章治郎 [email protected] 本研究では,フィルタリングを関数として定義し,さまざ まなフィルタリング手法の性質を関数 が満たす条件として表現する.各性質を表現する制約条件の包含関係を示すことで,フィルタリン グがもつ性質の関係を明らかにする. 6A-3 : 高次元データベースにおける距離結合演算を用いたクラスタ検出方式 古立智之,大森匡,星守 [email protected] 本論文では、高次元データベースのクラスタ検出を行なう際に生じる、データの高次元化による 問題及び 、データに存在する大量のノイズデータによる問題の2点に焦点をあてる。そしてその問 題の解決を目的とした距離木の考えに基づいたデータベースの分割方法を提案する。また、その データ構造を用いて DBSCAN を行なう際の効率的なアルゴ リズムについて述べる。 6A-4 : Clustering on Web Search Results with Link Analysis 王軼トン,喜連川 優 [email protected] With information proliferation on the Web, how to obtain high-quality information from the Web has been one of research hot spots in many elds like Database, IR as well as AI. Web search engine is the most commonly used tool for information retrieval; however, its current status is far from satisfying. In this paper, we present a new approach to cluster search results returned from Web search engine on a specic query topic with link analysis. We think that clustering on web search results is not only a tool to reorganize search results so as to facilitate users' accessing and browsing but more important, it could improve the quality of web search results. While traditional document clustering that has been well studied in IR could be applied to web pages, we would like to reconsider clustering on web search results by taking account of link information, which is the main dierence between text documents and web pages. We rst discuss some special requirements for clustering in Web domain, and then give detailed description of the approach. Preliminary experiment results are also presented to indicate its eectiveness. 19 6A-5 : リンク解析を用いた地球環境ポータルサイト 構築の試み 豊田正史,菊地時夫 [email protected] 近年、地球環境問題の重要性が増すにしたがって、地球環境に関する web ページも増加を続け ている。地球環境に関する話題は、気象、海洋、地質など 多岐に渡っており、関連する組織も、政 府機関から、大学、企業、民間公益団体 (NGO) など 幅広い。このため、地球環境情報を提供する web ページへのリンクを集めたポータルサイトを構築することは、地球環境の研究者や専門家に とって有用である。我々は、リンク解析を用いた web ページの分類および関連付け手法を開発し ており、本論文ではこの手法がポータル作成者にとって有効なツールとして働くかを確認する調査 を行った。 6A-6 : Inferring Web communities through relaxed cocitation and dense bipartite graphs P.Krishna Reddy, Masaru Kitsuregawa Community forming is one of the important activity in the Web. A community is a group of content creators that manifests itself as a set of interlinked pages. The Web harbors a large number of communities. The recently proposed trawling algorithm abstracts the core of the community as a group of pages that form a complete bipartite graph. Given a large collection of pages, the trawling algorithm rst extracts all the possible cores and then expands each core to full-edged community using the HITS algorithm. In this paper we propose a dierent method to infer communities. We term a set of pages as a community, if all of its members form an out-link relationship with a certain number of pages of another set. The existence of such phenomena is found based on power-law relationship of certain group of pages. In this paper, we have dened trans cocite relationship by relaxing cocitation relationship to nd related pages of a given page. Given a collection of pages, for each page, after gathering related pages based on trans cocite relationship, we analyze an power-law relationship displayed by children of these pages to detect the possible community. We present the proposed trans cocite algorithm to infer possible communities. We also report experimental results on 10 GB TREC (Text REtrieval Conference) data collection that contains 1.7 million pages and 21.5 million links. With the current status of experimentation, we report power law characteristics by expanding some example URLs. There results demonstrate power-law characteristics of a group of pages in the Web. The experiment is still continuing. We are investigating to gure out correspondence with the distinct special characteristics of the of the curve and closeness of the URLs around certain topic. We will produce the complete results soon. 6B : 情報統合・共有 ( 3/10 8:30-10:18 ) 6B-1 : 検索サイト 統合のためのラッパー生成法 古賀 康則, 田口 剛史, 廣川 佐千男 20 [email protected] 膨大な Web の世界の情報を利用するには Yahoo! 、Goo 、Google などの検索エンジンは必須で ある。しかし 、対象が Web 全体であるため、検索結果の品質が問題となっている。一方、Web 上 から検索可能なデータベースや、そのサイト内情報が検索可能なサイトが増えている。このよう なサイトを検索サイトと呼ぶ。目的に合った検索サイトを選び 、一括した検索ができれば 、高品 質な情報が効率良く得られる。我々はこのような検索サイトを統合するシステムを開発している。 検索サイト統合には、インターフェースを統一するラッパーの自動生成が必要であり、検索結果の HTML ファイルからのレコード 抽出はその核となる。本稿では、検索結果の HTML ファイルに現 れるタグ列の特徴的性質を利用したレコード 抽出法を提案し 、それを用いたラッパー生成法を述べ る。また、レコード 抽出の精度評価として、具体的な検索サイトを対象とした実験結果について述 べる。本手法は、自然言語処理の知識を一切必要としないので 、対象とするサイトで使われている 言語に依存しない。 6B-2 : 辞書ベースと統計ベースの手法による言語横断情報検索 サダト ファティア ,前田 亮, 吉川 正俊 , 植村 俊亮 [email protected] インターネットがより多くの国々で利用可能になるのに伴い,ヨーロッパ言語とアジア言語と の間の言語横断情報検索手法の開発が必要になってきている.言語横断情報検索の研究の多くは, ベースの手法に曖昧性を解消するための統計的アプローチを組み合わせるものである.また,適合 率および再現率の向上のためと,このような手法によって起きる誤訳を減少させるために,問合せ 拡張が用いられる.本研究では,翻訳前の問合せ拡張のために対話的適合性フィード バックを用い る対訳辞書ベースのアプローチを目標とする。また,訳語の曖昧性解消の後に,二回目の問合せ拡 張が行われる。この手法は,言語横断情報検索の英語―フランス語モジュールとして用いられる。 本手法は平均適合率に関して単言語の 91.95 %を得た。 6B-3 : アクセス系 OSS 統合のための XML データスキーマ設計・管理手法の 提案 石川数馬,増田健 [email protected] これまで各設備ごとに独立に開発されてきたアクセス系 OSS だが,近年その統合が進められて いる.一方,システム間を流れるデータの共通フォーマットとして,XML が注目を集めている. しかし,システム間インターフェースのデータスキーマを設計する作業は,複数のスキーマが相互 依存の関係にあるため,煩雑な部分が多い.そこで,これらのデータスキーマを効率的に設計・管 理する手法を提案する. 6B-4 : 例示オブジェクト を用いたマルチメディア Web ビュー構築ツールの設 計, 実装, 評価 小泉清一,森嶋厚行,高野智,北川博之 [email protected] 21 近年,多様な情報源中のデータに基づく Web サイト構築が重要なデータ操作の一つとなってい る.この操作では次の 2 つの処理が必要である.(a) 情報源から必要なデータを抽出する,(b) 抽 出したデータを埋め込むための Web サイトのレ イアウトを設計する.本稿では,これら 2 つの操 作をシームレスに統合した Web ビュー構築ツール AQUA について述べる.本システムを実装し 評価実験を行った結果,解答時間,正答率,使い易さの各項目において高い評価が得られた. 6B-5 : XML に基づく WWW アプリケーション統合支援環境の構築 倉垣公一,品川徳秀,北川博之,石川佳治 [email protected] 出力データに XML 文書を用いる WWW アプ リケーションを対象に、その統合利用を容易にす る環境の実現を目標とする。本手法では、従来の XML 問合せ言語の記述能力に加え、その拡張機 能を用いて各アプ リケーションへの要求や、WWW ページ内のナビゲーション等の記述が可能な 問合せ言語と、一連の処理手順を記述可能な処理記述言語を用いる。 6B-6 : 複数のメディアで構成された電子文書の検索手法 鈴木優,波多野賢治,吉川正俊,植村俊亮 [email protected] 本稿では,電子文書を構成している各メデ ィアの検索手法を統合することにより,複数のメディ アで構成された電子文書を検索する手法の提案を行う.本手法では,単語の出現頻度情報,画像の 色ヒストグラム情報,そしてそれらのレ イアウト情報からそれぞれの特徴ベクトルを生成し,その 索引を生成する.一方,利用者は検索の際にそれぞれの特徴ベクトルを全て利用するのではなく, 興味を持っているメディアだけを選択する.そしてシステムは利用者が選択した空間に対して利用 者の興味を反映した特徴ベクトル空間を生成し,その空間に文書を射影することにより検索を行う ことができる.この検索手法は,利用者の興味をより検索システムに正確に伝えることができるた め,利用者の興味に応じた検索を実現することができる.本論文では,電子文書として,図や文字 を含む PDF 文書を用いて実験を行い,本手法が有効であることを検証した. 7A : 高度索引技術 ( 3/10 13:20-15:26 ) 7A-1 : 検索と更新の並列処理可能な複合オブジェクト に対する索引の分散管理 システム 樋口健,都司達夫,宝珍輝尚 [email protected] オブジェクト指向データベースにおいて複合オブジェクトの参照関係に関して索引を構成し 、そ れを分散配置、並列処理することによる処理の向上を目指す。本研究では検索処理と索引の更新処 理の同時実行が可能は方式を提案し 、それによる検索効率の向上を計算機シミュレーションにおい て実証する。 22 7A-2 : 時々刻々と変化する時空間情報を管理するための索引手法 丸山幹夫,寶珍輝尚,樋口健, 都司達夫 [email protected] 時々刻々と変化する時空間情報( 時変オブジェクト )を管理するために 、良好な更新性能を有 し 、検索を高速に行える索引構造( MD -R 木)を提案する。MD-R 木では、オブジェクトの位置 や大きさを把握でき、動的なデータ管理が可能なR木を基にした索引構造である。MD-R 木では、 時間は開始時刻と終了時刻からなる平面上の点として扱い、さらに現在のデータは開始時刻軸上で 管理する手法を用いた。計算機実験による評価の結果、時間をセグ メントとして扱う3 D − R 木 と比べ During 検索において高速でかつ高い更新性能を持つことを明らかにした。 7A-3 : The L-index: An Indexing Structure for Ecient Subsequence Matching in Time Sequence Databases 森中 雄,吉川 正俊, 天笠俊之 植村 俊亮 [email protected] We propose a novel indexing structure, the L-index, for searching similar patterns in large time sequences eciently. L-index is a sequence of line segments which compactly approximates the original data sequence. A line segment is used to approximate a subsequence of the original data sequence until the accumulated error exceeds a threshold value. By scanning the L-index, we can quickly nd approximate answers of similarity queries.An important feature of the L-index is that approximate answers are guaranteed to include exact answers. it does not produce false dismissal. Our experimental result shows that the L-index does not require much storage area and process similarity queries eciently. 7A-4 : 高次元空間における表面索引構造 安際元,古瀬一隆,大保信夫 [email protected] 本論文では 、高次元データのための新しい空間分割方法に基づく索引機構を提案する。多次元 空間索引構造として、R-tree 等が知られている。しかし 、高次元になるに伴い、索引の効果を発 揮できなくなる。本論文では、高次元空間の体積の殆んどの部分が表面層で占められることを着 目した空間分割を行う。これにより、Pyramid tree より効率的検索ができた。30次元以上場合、 R*-tree より良い索引効果を得ることができた。 7A-5 : 問い合わせ分布を考慮した R 木における領域分割法 佐藤龍生,大森匡,星守 [email protected] 本稿ではR木を用いた多次元データのインデクシングにおいて部分属性での範囲問い合わせお よびそれを含む問い合わせの分布について検索時のアクセスノード 数をコストとしたコストモデ ルの提案を行い. 提案したコストモデルを用いたインデックス作成法について示しその評価実験を 行う. 23 7A-6 : 連続メディアデータに対するディスクリト ライアルゴリズムの評価 石田学,横田治夫 [email protected] ハードディスクの用途が連続メディアデータの格納へと変化しつつある近年、ディスク自体も連 続メディアデータの仕様にあったものが必要とされている。連続メディアデータはプログラム等と は違い、データの信頼性よりも連続性を優先することがある。そこで、データ内容の連続性を可能 な限り保証できるように、ディスク内のリトライ回数を動的に変化させる方法を検討し 、その評価 を行う。 7A-7 : 並列ディレクト リ構造 Fat-Btree におけるレンジ問い合わせの取り扱い 風戸 広史,横田 治夫 [email protected] 我々は,無共有並列計算機上でのデータベース用ディレクトリ構造として Fat-Btree を提案して いる.並列 B-Tree を用いた従来のディレクトリ構造と比較した場合,Fat-Btree 方式では検索・更 新処理ともに高いスループットを得られることが明らかにされている.本稿では,Fat-Btree に対 するレンジ問い合わせの取り扱いについて検討する. 7B : 空間メディアとユーザ支援 ( 3/10 13:20-15:26 ) 7B-1 : 位置属性サーチエンジンのためのインタフェース 原 雅美,佐藤 聡,北上 始 [email protected] あらゆる場面において,サーチエンジンを利用した検索が行われている.検索の際に,住所など の位置を表すキーワード( 位置属性)を用いた場合,検索対象となるのは,その Web 文書中に入 力したキーワード と一致する記述のある Web 文書である.しかし ,空間的に近い,遠いという概 念を用いた検索が行えるべきである. 我々は,入力された位置属性を緯経度という数値的な情報 に変換することにより,空間的な位置関係を利用した検索を行えるサーチエンジンの実現を目指し ている.このとき,従来のブラウザのようにテキストを用いたインタフェースでは検索結果である Web ページの空間的関係が理解しにくくなる.本論文では,空間的な位置関係を利用したサーチ エンジンのためのブラウザとして,地図を利用した検索,結果表示を行えるブラウザを提案し,ま た表示処理に適したデータ形式を提案する. 7B-2 : 位置依存情報配信のための空間ハイパーメディアの枠組み 平松治彦,角谷和俊,上原邦昭 [email protected] 本論文では,位置依存情報配信システムのための空間ハイパーメディアの枠組みについて提案す る.提案する枠組みは,リンク元,リンク先が動的に決定される動的リンク機構から成る.このリ ンク機構は,仮想空間上に構築した概念的な位置関係を利用して情報間の関連付けを行うものであ る.本方式では,時間依存性を持つ位置依存情報を,位置・時間の一方,あるいは両方の変化に追 24 従して動的リンクを生成することが可能である.また,提案する枠組みは,特定の環境に依存せ ず,既存のハイパーメディアにより実現することが可能である.本枠組みを用いることで,分散す る位置依存情報を時間的,空間的なハイパーリンク構造に変換することで,動的にコンテンツを利 用することが可能になる. 7B-3 : インクリメンタルなデータ転送機構を持つ空間データ提供システムの提 案と実装 白石陽,安西祐一郎 [email protected] 本稿では,インクリメンタルなデータ転送機構を持つ空間データ提供システムを提案する.本シ ステムは,位置情報を用いてデータアクセスおよびデータ転送の順序づけを行い,検索した空間 データをクライアントで情報抽出が可能な意味のあるまとまりに分割し,その分割データをインク リメンタルにクライアントへ転送する.さらに,本システムを Java 言語を用いて実装し ,その有 用性について議論する. 7B-4 : 検索ログを利用したユーザ検索活動の効率化 川前徳章,青木輝勝,安田浩 [email protected] 検索システムを利用するユーザの検索効率を向上させるために、ユーザに対してキーワード を 提示することで検索活動を支援する手法を提案する。手法の実現には検索ログを利用し 、提示され るキーワード は語彙不一致やユーザのニーズを具体化したキーワード となっている。本稿は手法の 実現の為に、検索ログの分離方法とハッシュの作成、キーワード 間の関連性を定義する。提案する 手法は、ユーザが入力したキーワード に対し提示可能なキーワード 集合のハッシュのキーが一致し た場合、ハッシュ内部からキーに関連性の高いキーワード をユーザに提示し検索効率を実現する。 7B-5 : XML を用いたシーンの時空間オブジェクト 情報の記述 松田一章,越前谷健二,富井尚志, 有澤博 [email protected] 本研究では、シーンの内容が登場者の意味・意図を記述することのできる情報キャリアの設計を 行う。現実の世界で行われた事象には、登場者の意図などの意味的な要素のために、様々な解釈が ある。これらの意味をデータベースにすべて蓄積すれば 、リッチな意味表現を持つ DB が実現で きる。一方、VRML などの空間記述言語は、意味的情報を記述するタグ付けが存在しない為、DB からの研究によって得られたシーンデータには、意味的情報を付加することができない。そこで、 本研究では DB の一部を切り出して作成したシーン情報に意味的情報を付加できる伝達媒体「時空 間オブジェクト情報キャリア」を設計した。また、自空間オブジェクト情報キャリアを XML 文書 で表現することでその実現可能性を検証した。 25 7B-6 : 移動オブジェクト に対する周辺情報提供のための空間データベース問合 せ手法 河島徹,石川佳治,北川博之 [email protected] 本稿では移動オブジェクトの移動経路情報を用いることでその周辺情報を効率的に提示するため の手法について述べる.さらに,空間データベースに対して実際に検索を行う際に範囲問合せやk 近傍問合せなどを既存の空間索引を利用するためのアルゴ リズムを述べる. 7B-7 : 地域コミュニティ支援のための時空間 BBS システム 田中浩也 [email protected] 現在 WWW ページをはじめとするネットワーク上で、空間をキーとした情報の流通が 始め られている.現段階では、その多くは店舗案内や住所表示などの客観的・公的な情報であるが 、各 個人が場所に根ざした自らの記憶・感想・意見などの主観的・私的な情報を能動的に発信すること ができれば 、より多様な空間コンテンツを共有利用することが可能となる.また、そのような情報 群を位置情報・日時情報をもとに管理し 、コンピューター上の仮想都市内に表示することで、地域 コミュニティの情報を時空間的に閲覧することが可能となり、より多人数による応答や対話を促進 することもできると考えられる.このようなシステムによって受信と発信を含めた空間情報の循環 が実現すれば 、合意形成のためのオピニオン・チャンネルなど 地域コミュニティ支 援への応用が 期待できる.本稿では、ネットワーク上でユーザが空間情報を発信・受信するための時空間 BBS システムについて述べ、開発を行ったプロトタイプシステムを紹介する.さらに地域コミュニティ 支援への有効性と問題点を明らかにするための実証実験の概要を示し 、今後の方向性をまとめる. 26