Comments
Description
Transcript
自然言語処理 とは 1 評判分析(情報抽出) 人間が使っている言語を
鈴木良弥研究室では 人間が使っている言語を コンピュータに処理させる技術 (自然言語処理) 鈴木良弥 研究室 自然言語処理 について研究しています 自然言語処理 とは 1 評判分析(情報抽出) 通販サイトのレビューは商品購入の参考になる 情報だけど・・・ 評判・感情解析 情報検索 レビューが多すぎて 見るのが面倒・・・ ずっと欲しかったものなので、 毎日遊んでいます 夜に注文し、翌日に届きました。 早く届いたので驚きました。 店頭で購入するよりも安く購入できたので 満足です。息子は大満足してました。 自動要約 文書分類 検索:ポケットモンスターX 今回の作品はとっても楽しいです^^ やることもたくさんあってなかなか飽きません!! 例えば SiriやGoogleの検索システムにも使われている 商品の評価にかかわる文だけ抜き出してまとめる! 2 Twitterを利用した評価(情報抽出) A社のパソコンのレビュー 入力:A社のパソコン A社のパソコンおすすめ! 値段が安いしデザインが良い! 送られてくるのが遅い! 操作性も悪い! レビューを検索 ● ある対象についてのツイートが良い評価をし ているのか悪い評価をしているのかを判定 ⁞ ● 出力:表示 良い点 ・値段が安い ・デザインが良い ・画面がきれい ⁞ 解析 悪い点 ・操作性が悪い ・送られてくるの が遅い ⁞ 抽出回数の高いもの をピックアップ ● 評価の分類 良い 悪い 良い 評価文 値段が安い 操作性が悪い デザインが良い 抽出回数 3 3 1 ● ポジティブ…良い評価 ネガティブ…悪い評価 ツイートを利用して レビューサイトみたいな 評価ができないかなぁ 判定結果を集計して対象の評価を行う ⁞ SAOⅡについて ポジティブな人は7割 ネガティブな人は3割 だったよ SAOⅡって面白いんか? Twitter つまらない SAO、今回も面白くてあっという間だったな~ キリトさん可愛すぎる・・ 面白い ツイート 戦闘シーン期待してたけどやはり魅せてくれたな あとでもっかいみよう 今後も楽しみだ 検索 解析 ほんとにGGO編はストレスになる話の 引き伸ばし方なんだよなぁ 『コンピュータ』 『視聴者』 なんでや!! ・ ・ ・ 『ユーザ』 質問応答とは 3 質問応答システム ● 膨大な量のWebデータ ● ユーザの質問にシステムが適切な解答を示す ● 例えば 世界遺産の厳島神社は 何県にある? 目的の文書が見つからない ● 正しい情報? ● 広島県 Copyright © 2014 Google Web上で実行してみる 検索 質問:「アメリカの大統領は誰?」 新聞記事から答えを探す 解答候補 スコア オバマ 5.009 4.402 3.897 レーガン クリントン 4 地名検索システム(例:大塒町) システムの流れ(例:大塒町) 直接入力できない地名 入力 地名データ 地名 部首を指定して”?”に 使用する漢字を選択 5 ニュース記事の分類(文書分類) スポーツ エンタメ IT 経済 国際 国内 システムの流れ 例:大”塒”町 → 大?町 候補: 219個 例:大?町 (部首:つちへん) 候補: 11個 文字数・文字列が一致する 例:大塒町 地名をリストに表示 大塚町 本文の内容を利用 大場町 ・・・ 選択した地名と同名の 場所と読みをリストに表示 ・・・・ 選択された場所の地図 音声読み上げ スポーツ エンタメ IT 経済