Comments
Description
Transcript
NII学術コンテンツサービス研究開発センターの紹介
次世代学術情報コミュニケーションのた めのコンテンツサービス基盤研究開発 -NII学術コンテンツサービス研究開発センターの紹介- http://www.nii.ac.jp/cscenter/ 論文を読む人とタスク • 論文を読む人たち – – – – A.研究者 B.開発者 C.学生 D.一般 • A.研究者のタスク – 論文を読みながら,仮説形成, 実験または論証して,そして執 筆 – 論文誌のEditor in Chiefが Board of Directorを含めたレ ビュアに査読依頼 – 論文を査読.他の論文を読んで 確認し査読コメントに反映 • B.開発者のタスク – 開発戦略の立案.マーケットリ サーチ.技術戦略ロードマップの 中で技術ニーズを予測.論文や 特許,技報で情報収集 – 開発戦略に基づいて,設計,プ ロトタイプ作成.プロトタイプの実 証実験 – 特許出願 – 製品化・商品化 • C.学生のタスク – 指定された論文や本を読んでレ ポート,輪講 – 論文を読みながら,仮説形成, 実験または論証して,そして執 筆 • D.一般のタスク – 知的好奇心を充足 – 生活上の知恵 2 http://www.nii.ac.jp/cscenter/ 関連情報技術のトレンド • データベースのオープン化・分散化 • システムのオープンアーキテクチャ化 • サービスのオープン化 – 様々なレベルでのサービスの統合 – サービスが多様な利用形態に応える必要性 • 大規模ポータルサイト – Google, Yahoo, MSN • Webインタフェースを介したユーザ参加型の利用形態 – Wikipedia,flickr, YouTube, Blogger, MySpace, mixi, はてな • コンピューティングリソースの分散化 – グリッドコンピューティング,HPC,ユビキタスコンピューティング 3 http://www.nii.ac.jp/cscenter/ 学術情報関連技術の代表例 Live Search 4 http://www.nii.ac.jp/cscenter/ e-サイエンス • e-サイエンスとは? – e-Science is characterized as computationally intense science employing grid computing technology to analyze very large data collections [John Taylor, 2000] – Data-driven Science • e-サイエンスのための基盤 – e-Infrastructure (in RCUK, UK, 2001) – Cyber Infrastructure (in NSF, US, 2003) • 多様で膨大な学術情報の組織化 – ゲノムデータや地球観測情報など – インターネットを介した様々なサイエンスデータの共有 5 http://www.nii.ac.jp/cscenter/ センターの目的 • 2006年4月に発足 • NIIが推進する最先端学術基盤(サイバー・サ イエンス・インフラストラクチャ:CSI)の実現の 一翼 • 次世代学術情報の提供サービスおよび流通 基盤に関わる研究開発 – 新しいサービス形態 – 新しいコンテンツ分野 6 http://www.nii.ac.jp/cscenter/ 論文と人の情報 • 【論文】 – タイトル,著者,概要,キーワード,本文,参考文 献 • 【人】 – 名前,所属,連絡先,学位,学歴,職歴,研究分 野,業績リスト,学内活動,社会貢献 【論文】 タイトル 本文 概要 著者 【人】 所属 連絡先 名前 学位 学歴 研究分野 職歴 業績リスト 社会貢献 キーワード 学内活動 書誌情報(メタデータ) 参考文献 7 http://www.nii.ac.jp/cscenter/ 学術情報リソースの拡大 • 論文から学術情報一般へ • 種々の学術情報から生まれる価値の創出 実験データ 人 論文 人 論文 ノート 参考資料 ソフトウェア 8 http://www.nii.ac.jp/cscenter/ 主体関係の拡大 • 人からコミュニティへ • コミュニティから生まれる価値の創出 コミュニティ コミュニティ 実験データ 人 論文 ノート 参考資料 コミュニティ ソフトウェア 9 http://www.nii.ac.jp/cscenter/ サービス開発のアプローチ • 「人」と「論文」にかかわって起こりうる人のタスクの 中で,付加価値のあるサービスを展開 • 人や論文の情報断片を学術情報リソースと呼ぶと, サービスを展開するために必要な基本機能は? – 学術情報リソース・同定 – 学術情報リソース・リンケージ • 基本機能とサービスを実現するコンピューティング のスタイル – シンタクティック・コンピューティング – セマンティック・コンピューティング 10 http://www.nii.ac.jp/cscenter/ サービスとデザイン • 情報爆発,情報大航海と情報の過 剰性が謳われる時代に • ユーザ指向サービス – プログラム(ソフトウェア)=データ構 造+アルゴリズム – サービス=リソース+ソフトウェア – ユーザ指向サービス=セマンティック リソース+ソフトウエア • 価値創出を研究者主体で • 学術情報サービス基盤のデザイン – サービスをデザイン – 研究活動をデザイン – コミュニティをデザイン 学術情報サービスのデザイン 学術情報リソースの同定とリンケージ サービス可能なコンピューティング環境 11 http://www.nii.ac.jp/cscenter/ プロジェクトとNIIコンテンツラボ 1. 2. 3. 4. 参加型学術情報サービス・プロジェクト 情報同定プロジェクト 電子化・情報抽出・活用プロジェクト 機関リポジトリ連携プロジェクト • NIIコンテンツラボの開設 12 http://www.nii.ac.jp/cscenter/ 1.参加型学術情報サービス・プロジェクト • Web2.0的利用者参加型のコンテンツサービス – partikle: participatory article organizing service • 参加型の文献情報管理・公開・共有 • 集中型情報収集提供サービスとは異なった情報収集 提供が可能であり,相互に補完的 • 一般ユーザを念頭に開発中であり,試験を経て実験的 サービスを計画中 13 http://www.nii.ac.jp/cscenter/ partikleの概念 14 http://www.nii.ac.jp/cscenter/ 2.情報同定プロジェクト • 信頼のある情報流通実現の鍵技術 – 類似の情報から情報を識別して,同一の情報であるかを 判定すること – 研究者と論文を例にとり,多様な情報源からの情報の中 から同一性を判定しその情報を提供する仕組みを実装 • 研究者同定サーバ • 論文同定サーバ • 同定問題を研究するためにサーバを開発 • 情報・システム研究機構融合研究センター融合プロ ジェクトと連携 15 http://www.nii.ac.jp/cscenter/ 3.電子化・情報抽出・活用プロジェクト • 学術論文文書画像データを対象とした技術開発 – 高い精度で効率良くテキスト化する電子化技術 – 上記データに対する効果的な検索技術 – 上記データから引用等の情報活用に有用な情報を抽出 する技術 – CMAG:サイバーマガジン http://ldear.ex.nii.ac.jp/jp/project/project.php?projectname=cma g http://cls-ta.ex.nii.ac.jp/cmag/ • NIIでの効率サービスのための研究成果の実用化 実験 16 http://www.nii.ac.jp/cscenter/ 電子化・情報抽出・活用プロジェクト のシステム構成図 OCRサーバ OCR テキスト PDF 書誌・引用抽出 • 全文テキスト化 ELS ファイルサーバ 書誌 XML i-Linkage システム – ELSに含まれる 410万記事 • 引用・書誌抽出 • 抽出データの活用 別システム 17 http://www.nii.ac.jp/cscenter/ 4.機関リポジトリ連携プロジェクト • NIIの学術コンテンツ運営・連携本部 – 日本における機関リポジトリ構築を推進 • 機関リポジトリ間での情報流通を促進するシ ステムを構築する予定 18 http://www.nii.ac.jp/cscenter/ 機関リポジトリポータルJuNii+ • 日本の機関リポジトリを対象としたポータルサイト JuNii2 metadata over OAI-PMH IR IR IR • 2つの検索手法 – 資源の種類(資源タイプ)や提供機関などの分類を使った ナビゲーション – 関連性の重ね合わせモデル(RSモデル)による検索 • 機関リポジトリ搭載メタデータ(junii2フォーマット)の 横断的検索 19 http://www.nii.ac.jp/cscenter/ センターホームページ • http://www.nii.ac.jp/cscenter/ 20 http://www.nii.ac.jp/cscenter/