Comments
Description
Transcript
平成17年度大学院 知識システム特論
平成23年度大学院 Webインテリジェンス論 やまぐち たかひら 山口 高平 居室:慶應義塾大学矢上キャンパス 24-619A 内線:42673 電話:045-566-1614 FAX; 045-566-1617 メール:[email protected] Web: www.yamaguti.comp.ae.keio.ac.jp 授業内容と授業計画,講義資料,成績評価 授業内容 人工知能に関する基本的知識を修得した後、次世代Webとして、 セマンティックWebとオントロジーに関する知識とスキルを身につける。 授業計画 ①4/19 ガイダンス,人工知能歴史 ②4/26 エキスパートシステム 5/3 休講 ③5/10 知識モデリング ④5/17 セマンティックWeb概論 ⑤5/24 RDF/RDFS ⑥5/31 RDF Graphical Tool MR3 (休講?) ⑦6/7 オントロジー言語OWL ⑧6/14 オントロジーエディター Protege ⑨6/21 セマンティックWebサービス ⑩6/28 セマンティックWebアプリケーション ⑪7/5 LOD ⑫7/12 まとめ 講義資料:pptやpdf資料をWebに掲載 www.yamaguti.comp.ae.keio.ac.jp 成績:レポート数回で評価 人工知能(AI)の歴史 1956年 ダートマス会議 ↑ • • • • • • • John McCarthy (LISP) Marvin Minskey (フレーム理論) Shannon (情報理論,チェス) オートマトン≠人工知能(AI) AI:人間のような知的な動作を機械にさせるには? GPS (General Problem Solver) 探索の研究 A*アルゴリズム 1965年~ AIの3(4)大事件 → ・導出原理:拡張三段論法J.A.Robinson 1972:Prolog処理系 1982~1994:第5世代コンピュータ ・DENDRAL:スペクトラム分析→分子構造 ファイゲンバウム(スタンフォード大学) 一つのアプリケーションにしかすぎない,汎用性 ・ピアス勧告:MTは不可能 ・ファジィ理論:ザデー教授 推論の時代→ Toy Problems、AI冬の時代へ 1970年代:冬の時代 ↓ 1980年代→知識工学 ↑ • HPP:Heuristics Programming Project 完全ではないがたいていの場合うまくいく知識や方法 • MYCINプロジェクト(1973~1976) • • • • MYCIN,TEIRESIAS,GUIDN,EMYCIN 知識表現、知識利用、知識獲得→知識工学 There is power in the knowledge ! (1977) by Feigenbaum 1980年代→知識の時代へ エキスパートシステム,自然言語・画像・音声理 解システム,知的教育支援システム,... 国家プロジェクト,AIハード・ソフトベンダー Machine Intelligence 過去 1956年:ダートマス会議(汎用知能,探索,チェス,定理証明) 1965年:推論(演繹)→Toy Problem 1970年代:AI冬の時代へ 1980年代 : Knowledge is Power! (ファイゲンバウム教授,スタンフォード大) 知識工学,エキスパートシステム知識表現、知識獲得,知識の利用(推論) 説明 機能 知識 ベース 推論 エンジン 知識 獲得 作業 領域 (専門家) ユーザ 対話 I/F デモ1:対話デモ(Eliza, 人工無能) デモ2:献立支援ES 1990年代:大規模データの活用 新パラダイムの誕生 ↓ • 知識獲得ボトルネック→機械学習,ニューラルネット, GA(進化計算),ベイジアンネット,データマイニング • エージェントの研究:自律,マルチエージェント • 自然言語処理:スキーマ(‘70),文法重視(’80)からコーパス(統計)へ • DeepBlue:チェスの世界チャンピオンに勝利 カスパロフ(ロシア人)1勝2敗 DeepBlue(iBM) 1997年 512台並列処理,1秒間2億手,α-β法(量は質の変化を生む) 「毎回、対戦相手が違っていた気がする」 学習パラメータを人手により変更(MLは使っていない)→DeepBlueの振る まいが変わる でもゲームだよね.閉じた問題,整構造問題だからできるんだ • ロボットとAI:ロボカップ(1995) ,ホンダヒューマノイドASIMO (二足歩行1996), AIBO(1999) • 生物とAI(ゲノム情報...) GACTTTCAGTAA…… 機能分析,バイオ特許 過去 1990年代:知識獲得ボトルネック 知識(ルール) →ESが専門家代行という過大な期待. 知識ベース開発のための知識獲得は大変だ! 通産省:第5世代コンピュータ(1982-1994)の失敗? →推論マシンに特化しすぎ.知識は 1990年代: 大規模知識ベース,大規模辞書プロジェクト CYC, EDR, WordNet(フリーなので現在も広く使われる) でも,あまり変化しない静的知識だけ.現実には動的知識が 多い.使えないなぁ.AIブームは完全にさめて下火へ 1997年:Deep Blueがチェス世界チャンピオンに勝利. でもゲームだよね.閉じた問題,整構造問題だからできるんだ. 2000- H/Wの進展と共にAIの成熟 データマイニング 多くの応用が生まれる ①米国ウォールマートが購入された商品分析 日曜日,既婚若者男性,購入商品組合せ 缶ビール-(?) ②10年前,日本のスーパーマーケットで, 右図の商品配置は非常識? ※10年間のGB単価の大凡減尐傾向(不正確?) 2000年(1000円),2001年(400円),2002年(200円) 2003年(150円), 2004年(120円),2005年(100円) 2006年(60円) , 2007年(50円) , 2008年(20円) 2009年(10円) ,2010年(5円) コンピュータ将棋「あから2010」vs女流名人 知能ロボットの展開 ロボット産業 知能ロボット (サービスロボット) 産業用ロボット 工場(自動車や電 子部品など) ・溶接ロボット ・塗装ロボット ・運搬ロボット ・電子部品実装ロ ボット 期待 成熟 家庭・介護・医療など ・セラピーロボット ・コミュニケーションロ ボット ・多目的(受付・案 内・誘導など)ロ ボット ・レスキューロボット ・清掃ロボット 知能ロボットの分類 アシモ Bigdog (移動型ロボット:運動能力) http://bigdogrobotvideos.com/ アイボ パロ (ペット型ロボット:癒し) http://paro.jp/?page_id=247 コミュニケーション ロボット 石黒教授 ジェミニ (アンドロイドロボット:見た目) http://www.youtube.com/watch?v=QMEXBWJDUMk 2000- NWの進展と共にAIの成熟 • インターネットに保存されている文書量は? 1ZB?(KB, MB, GB, TB, PB, EB, ZB) http://www.emc.com/leadership/ digital-universe/expanding-digital-universe.html 自然言語処理+高度ML 検索エンジンの高度化 TREC-QAシステム セマンティックWeb(ページの意味が分かるWebへ) 2003年 QA Challenge !(1) IBM PIQUANT • 2003~ IBM,PIQUANT(Practical Intelligent Question Answering Technology)プロジェクト ★チェスのような閉じた問題ではなく、事前に分からないクイズ に解答するという開いた悪構造問題に挑戦することがポイント 深い論理形式分析と浅い機械翻訳ベースのアプローチを統合 でも、この難しい問題にチェレンジするには、AI技術が未熟で、 マシンパワーも不足して、大きな成果はあげられずに終わる。 2007年 QA Challenge !(2) Powerset (2008年にMSが$1億で買収) 問合せ:アルカトラズ島から逃げた囚人の数は? Google:関連するページを表示。 答えはページを読まないと分からない Googleはページ検索エンジン Powersetは関連するページ内の文章を ハイライト→文章検索エンジン。 QAシステムといえる。 ただし、Web全体を検索するのではなく、 Wikipediaのみを検索対象。軽いオントロジー を使って、同義語、類義語を判断している様子。 正当:0回。 計14回あった脱獄計画に36人の囚人 が関わり、全員脱獄に失敗した。 新しい事柄に関するQAは、 Googleの方が上になるケースがあり、 開放性が低い、データ規模が小さい、意味処 理技術が不十分?により、この3年間、成果発 表はない。でも、急に発表があるかも? 2011年 QA Challenge ! (3) IBM Watson ・IBM Deep Question Answering Project (ジョパディで,ワトソンがチャンピオンに挑戦して勝利) Open-Domain Question Answering PIQUANTから時代が進み,技術が成熟、マシンパワーが拡大 IBM Watsonの概要 ★大規模知識の獲得(100万冊,2億ページ) 百科事典、辞書、シソーラス、ニュース記事、著作物などを情報源。 自動的にコーパスを拡大。 ★徹底した質問文解析:LAT(Lexical Answer Type)と重要語抽出 ★突出した一つのAI技術ではなく,言語理解,情報検索,不確実性推論,仮説生成, 仮説統合とランキング、機械学習,知識表現(オントロジー),構造化データなど, 100以上の従来AI技術(20年前の技術もある)の集大成 ★精度、確信度、速度を考慮したAIインテグレーション ★計算力:並列計算による計算パワー ★汎用性:Jeopardy Challengeに特化していない。TREC QAにも適用して成功。 ★展開性: 医療、金融、行政、マーケティングにも適用可能