電子情報通信学会ワードテンプレート (タイトル)

by user

on 28 марта 2017

Category: Documents

>> Downloads: 4

views

Report

Comments

Description

Download 電子情報通信学会ワードテンプレート (タイトル)

Transcript

電子情報通信学会ワードテンプレート (タイトル)

DEIM Forum 2015 D3-3
比較に基づいたオブジェクト選別支援ためのレビューランキング手法
趙耕弘†
角谷和俊‡
牛尼剛聡‡
†九州大学大学院芸術工学府〒815-8540 福岡県福岡市南区塩原 4-9-1
‡兵庫県立大学環境人間学部〒670-0092 姫路市新在家本町 1 丁目 1-12
‡九州大学大学院芸術工学研究院〒815-8540 福岡県福岡市南区塩原 4-9-1
E-mail: †[email protected],
‡[email protected],
‡[email protected]
あらまし近年，インターネット上で，映画や書籍などのオブジェクトの選別が行われるようになった．オブジェクトの選別に
おいてユーザレビューは重要な役割を果たす．しかし，ユーザレビューが大量に存在する場合には，選別に効果的なレビュ
ーを見つけることが困難である．本研究では，ユーザが検索や推薦などによって絞りこまれた２個の候補オブジェクトから１個
を選別することを支援するために，ユーザレビューをランキングする手法の開発を目標としている．本論文では，候補オブジ
ェクトの共通特徴と固有特徴という観点から単語の重み付けをする手法を提案する．そして，その重み付け手法を用いて，レ
ビューをランキングする手法を検討する．
キーワード
レビュー，ランキング，選別支援
1. はじめに
るために，いくつかの試みがなされている． Amazon
近年，社会の発展とともに，我々は生活をする様々な局
では｢このレビューが参考になった｣というレビューに対する
面において選択肢が多くなった．毎日その日に着る服を選
評価を登録することができる．YAHOO 映画では，「役立ち
んだり，昼食を食べる店を選んだり，我々は，毎日，いくつの
度」という映画レビューに対する評価を登録できる．これらの
選択から一つを選ぶことを行っている．現在，Web 上には膨
レビューに対する評価に基づいたレビューランキングを利用
大なコンテンツや商品が存在し，我々はそれらの膨大な候
すると，ユーザは有用なレビューを発見できる可能性が高く
補の中から，一つを選別することが多い．大量のオブジェク
なる．しかし，上記のレビューランキング手法は比較する時
トから，ユーザの要求に合致した対象を発見するためには
にあまり役に立たないことが多い．選別においては，同じ種
検索が利用されることが多い．しかし，一般に，検索条件を
類で，類似点が多いオブジェクトから，一つを抽出す
満足するオブジェクトは複数存在し，検索結果の中からユ
る作業が必要となる．一つを選ぶ時に，オブジェクト
ーザが自分の目的に適した一つのオブジェクトを選別する
の間の異なる特徴を探すのはもっと難しい．
必要がある．その際に，候補となるオブジェクトを比較するこ
そこで，本研究では，ユーザが選別の候補として指
とが重要である．しかし，これまで，ユーザの選別のためにオ
定した２オブジェクトに関して，それぞれのオブジェ
ブジェクトを効果的に比較する機構に関する研究は十分に
クトの特徴を知るために適したオンラインレビューの
行われてきているとは言えない．
ランキングを行う手法を開発することを目的とする．
楽天 1 ，Amazon 2 などのネットショッピングサイトには，ユー
本論文では，ユーザが指定した２オブジェクトに
ザが，自分の買った商品についてレビューを書くことが提供
関して，それらのユーザレビューから，自動的にいく
されている．その他にも，食べログ 3 ，YAHOO 映画 4 などのサ
つのオブジェクトの共通の特徴と固有の特徴を明確に
イトでは，飲食店，映画などの対象についてレビューが多数
して，それぞれの特徴が表現されているという観点か
投稿されている．これらのレビューはユーザが選択する時に
ら，ユーザレビューのランキングを行う手法を提案す
重要な役割を果たしている．しかし，ユーザが選別のために
る．
レビューを利用する場合には，いくつかの問題点がある．ま
2. 関連研究
ず，ユーザが大量のレビューを全部読むことは困難である．
近年，ユーザレビューについての研究が多く行われてい
また，ユーザは膨大なレビューからオブジェクトの特徴を発
る．これらの研究は，大きく２種類に分類できる．一つは，ユ
見するのは困難である．したがって，選別に必要なレビュー
ーザレビューをランキングする手法であり，もう一つはユーザ
を発見することが困難である．
レビューから，ユーザの観点を抽出することである．
大量のレビューの中から有用なレビューを発見す
2.1
レビューの価値を推定する研究
ユーザレビューの価値を推定する研究は，ユーザレビュ
1
2
3
4
http://www.rakuten.co.jp/
http://www.amazon.co.jp/
http://tabelog.com/
http://movies.yahoo.co.jp/
ーの特徴に基づいてレビューの価値を推定するアルゴリズ
ムを開発することである．Zhang ら[1]はテキストのセンチメン
ト情報を利用して，ユーザレビューの実用性を推定する．彼
図１：データの収集と前処理のイメージ
らは，回帰モデルを利用して，実用性の高さを予測する手
法を提案している．Moghaddam ら[2]は，ユーザごとに，レビ
ューの質が異なるユーザのために等価ではないかもしれな
いと考え，レビューの有用性をパーソナライズして推定する
手法を提案している．彼らは，レビューと評価者間の社
会的ネットワークを利用して提案手法を拡張すること
も検討している．また，Moghaddam ら[3]はユーザレビュ
ーから特徴及び特徴の相関スコアを抽出するため，三
つの確率モデルを導入し，ILDA という新しい LDA モ
デルを提案している．
2.2
レビューからユーザの観点を抽出する研究
3.2
比較する特徴の計算
近年，レビューからユーザの観点を抽出する研究も数多
本節では，比較に基づいたオブジェクト選別支援手法を
く報告されている．中国のショッピングサイト Taobao 5 はユー
説明する．本論文では，二つのオブジェクトに対しての選別
ザレビューから，ユーザの観点を抽出し，直感的にユーザに
を対象とし，二つ以上のオブジェクトの選別は将来の研究
提示する手法を提案している．Moghaddam ら[4]は商品の
で検討する．二つのオブジェクトを比較するため，我々はそ
重要な観点を抽出するため，教師なし機械学習手法を用
れぞれの単語の，それぞれのオブジェクトにおける重要度を
い，商品のレビューから，完璧，良い，普通，悪い，ひどい，
考える．
という，5 つの満足度を推定する手法を提案している．Lin ら
例として，「永遠の 0」と「プライベート・ライアン」という二つ
[5]はレビューの質を決定するための集合を用いて，低品質
の映画を比較することを考える．このとき，一つの映画に関
の商品レビューから有用性の観点を抽出する手法を提案し
するレビューを結合して一つの文書としたとき，作品におけ
ている．
るそれぞれの単語の TFIDF 値を計算することができる．いま，
このように，レビューに関する研究は数多く行われている
比較対象とする２オブジェクト𝑂1 , 𝑂2 に対するある単語 w の
が，2 つのオブジェクトを比較するためにレビューをランキン
TFIDF の値を(tfidf(w, 𝑂1 ), tfidf(w, 𝑂2 ))と表現すると，単語
グする手法については研究されていない．
の重要度は 𝑂1 に対する重要度をｘ軸，𝑂2 に対する重要度を
3. 対象の比較と特徴の計算
y 軸とする平面上の１点として表現できる．図１に，「永遠の
本節では，比較に基づいたオブジェクト選別支援手法に
ついて具体的に説明する．3.1 節と 3.2 節では，データの前
0」と「プライベート・ライアン」を対象として，ソレラの映画に出
現する単語を平面上にマッピングした図を示す．
処理について説明する．3.3 節は特徴的な単語についての
図２：比較の例
計算方法について説明する．3.4 節は最後の特徴レビュー
の計算方法について述べる．
3.1
データの収集と前処理
本研究は商品，店，映画などのことをオブジェクトとして，
これらのユーザレビューを対象とする．本論文は例題として，
映画のユーザレビューを用いる．我々は JSOUP 6 というライブ
ラリを利用して，HTML 解析で YAHOO 映画がら公開されて
いる映画６００件と約２２万件のレビューを収集した．
収集したデータに対して，形態素解析を行った．形態素
解析については， Mecab を利用した．次に，解析した単語
の重要度を計算する．重要度の計算のために， TF 値と
TFIDF 値を利用する．膨大な文本データの TF 値と TFIDF
次に２つのオブエクトに共通の特徴と固有の特徴を分け
値を計算するため，我々は Hadoop を利用する．我々は，
るために，二つの閾値を設定する．図１では，見やすさのた
形容詞と形容動詞を特徴単語として利用する．計算し
め，閾値を黒い線で表示している．青い部分は２つの映画
た特徴と特徴の重要度は Hbase という「Big Table」データベ
に共通の特徴であり，黄色いと赤の部分は固有の特徴であ
ースで保存する．
る．単語から原点までの直線と横軸の角度は以下で計算
する．
5
6
http://www.taobao.com/
http://jsoup.org/
θ1 =𝑡𝑎𝑛−1
𝑡𝑓𝑖𝑑𝑓(𝑤1 ,𝑂1 )
𝑡𝑓𝑖𝑑𝑓(𝑤1 ,𝑂2 )
(1)
(8)
共通の特徴の中に，二等分線から遠い点は近い点よりも
重要な共通の特徴であると考えられる．そこで，以下の式に
よって共通の特徴量を計算する．
特徴量とコサイン相関値のバランスを取るため，以下の計
算式によりレビューの重要度を計算する．
𝑅𝑒𝑣𝑖𝑒𝑤𝑄𝑢𝑎𝑛𝑡𝑖𝑡𝑦 = 𝐹𝑒𝑎𝑡𝑢𝑟𝑒𝑄𝑢𝑎𝑛𝑡𝑖𝑡𝑦 ∗ 𝐶𝑂𝑆𝑟𝑒𝑣𝑖𝑒𝑤&𝐹𝑒𝑎𝑡𝑢𝑟𝑒
(9)
𝑖𝑚𝑝𝑠𝑖𝑚 (𝑤1 , 𝑂1 , 𝑂2 )= sin(2 ∗ θ1 )
(2)
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑉𝑎𝑙𝑢𝑒(𝑤1 , 𝑂1 , 𝑂2 ) = ( 𝑡𝑓𝑖𝑑𝑓(𝑤1 , 𝑂1 ) +
𝑡𝑓𝑖𝑑𝑓(𝑤1 , 𝑂2 ) ) ∗ 𝑖𝑚𝑝𝑠𝑖𝑚 (𝑤1 , 𝑂1 , 𝑂2 )
図３：結果のイメージ
(3)
固有の特徴に対しては，横軸または縦軸から近い点は遠い
点よりも，重要な固有の特徴であると考えられる．そこで，以
下の式により，固有の特徴量を計算する．
𝑖𝑚𝑝𝑑𝑖𝑓𝑓 (𝑤1 , 𝑂)= |cos(2 ∗ θ1 )|
(4)
𝐷𝑖𝑓𝑓𝑒𝑟𝑒𝑛𝑡𝑉𝑎𝑙𝑢𝑒(𝑤1 , 𝑂) = ( 𝑡𝑓𝑖𝑑𝑓(𝑤1 , 𝑂) ) ∗ 𝑖𝑚𝑝𝑑𝑖𝑓𝑓 (𝑤1 , 𝑂)
4. 実験評価
(5)
今回は，閾値としては，３０度と６０度および，１５度と７５度
本研究の手法の有効性を検証するために，予備実験を
の 2 組の閾値で予備実験をおこなった．予備実験結果によ
行った．予備実験として，まず単語の特徴度の有効性を検
って，閾値は１５度と７５度を採用する．
証した．レビューのランキングについては，また実験方法を
本研究では，オブジェクトの選別に効果的なレビューを発
見することが目的である．以下にレビューの重要度の計算
方法を示す．
検討している．
4.1.
実験目的
この実験の目的は単語の特徴度の有効性を検証す
3.2.1 レビューの特徴度の計算
ることである．本実験では，本手法で計算した二つの
レビューの特徴度の計算については，データ前処理で計
オブジェクトに対する単語の分類結果と被験者の分類
算した特徴の重要度のデータベースを利用し，各レビュー
結果が一致する割合によって，有効性を評価する．
の特徴度を計算する．
4.2
実験手法
被験者は，我々が収集した６００件の映画の中で，
自分が一番知っている映画を 2 件選んで，この 2 件の
𝐹𝑒𝑎𝑡𝑢𝑟𝑒𝑄𝑢𝑎𝑛𝑡𝑖𝑡𝑦𝑠𝑖𝑚 = ∑ 𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑉𝑎𝑙𝑢𝑒(𝑤𝑖 , 𝑂1 , 𝑂2 )
映画を検索対象として本手法によって特徴度を計算す
𝑖
(6)
る．そして，共通の特徴と特有の特徴に分類し，上か
𝐹𝑒𝑎𝑡𝑢𝑟𝑒𝑄𝑢𝑎𝑛𝑡𝑖𝑡𝑦𝑑𝑖𝑓𝑓 = ∑ 𝐷𝑖𝑓𝑓𝑒𝑟𝑒𝑛𝑡𝑉𝑎𝑙𝑢𝑒(𝑤𝑖 , 𝑂)
ら１０個の単語，合計３０個の単語を取って，ランダ
ムに並べる．被験者に，３０個の単語を共通の特徴と
𝑖
(7)
２種類のそれぞれの映画の特有の特徴という，三つの
レビューの特徴度だけでレビューを重み付けを行った場
グループに分類する．最後にユーザが分類した結果と
合，長いレビューが重要度が大きくなる傾向があった．長い
システムの計算結果はが一致する割合を計算する．
レビューは短いレビューよりもっと多いの特徴を含む可能性
4.3
が高い．でも，重要な特徴をどのぐらい含むかどうかのは確
実験結果
被験者５人が選んだ映画と結果を表１に示す．本手
認できない．
法で計算した特徴は被験者の判断との合う確率は約７
3.2.2 特徴ベクトルとのコサイン相関値
３％である．そして，本手法で抽出した単語の特徴度
重要な特徴を含むレビューを探すため，我々は式３と式５
の結果とレビューの特徴をベクトルとし，レビューと共通特徴
或は固有特徴のベクトルのコサイン相関値として，重要度を
計算する．
𝐶𝑂𝑆𝑟𝑒𝑣𝑖𝑒𝑤&𝐹𝑒𝑎𝑡𝑢𝑟𝑒 =
に有効性があるということを検証した．
4.4
レビューランキングについての実験
この実験では，抽出した単語の特徴度の有効性を検
証できた．しかし，単語の特徴度に基づいたレビュー
∑𝑤𝑜𝑟𝑑 𝑂𝑐𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑒𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑦∗𝐹𝑒𝑎𝑡𝑢𝑟𝑒𝑉𝑎𝑙𝑢𝑒
√∑ 𝑂𝑐𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑒𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑦 2 ∗√∑ 𝐹𝑒𝑎𝑡𝑢𝑟𝑒𝑉𝑎𝑙𝑢𝑒 2
ランキングについての検証はまだ行っていない．これ
らについての実験は現在検討中である．
表１：実験結果
映画１
アナと雪の女王
インセプション
タイタニック
パシフィックリム
名探偵コナン異次元の狙撃手（スナイパー）
合計
5. まとめ
本論文は比較に基づいたオブジェクト選別支援ためのレ
ビューランキング手法を提案した．提案手法では，二つのオ
ブジェクトの共通の特徴と固有の特徴を含むレビューをユー
ザに分かりやすく提示することができ，オブジェクトの選別を
支援する．今回の実験では，単語の特徴度の有効性を検
証した．今後，特徴を含むレビューのランキングについ有効
性を検証する予定である．
参考文献
[1] Zhu Zhang,Balaji Varadarajan,“Utility Scoring of
Product Reviews”, CIKM’06, November 5–11, 2006,
Arlington, Virginia, USA.
[2] Samaneh Moghaddam, Mohsen Jamali, Martin Ester,
“ETF: Extended Tensor Factorization Model for
Personalizing Prediction of Review Helpfulness” ,
WSDM’12,
February
8 –12,
2012,
Seattle,
Washington, USA.
[3] Samaneh Moghaddam, Martin Ester, “ILDA:
Interdependent LDA Model for Learning Latent
Aspects and their Ratings from Online Product
Reviews”, SIGIR’11, July 24–28, 2011, Beijing,
China.
[4] Samaneh Moghaddam, Martin Ester, “Opinion
Digger: An Unsupervised Opinion Miner from
Unstructured Product Reviews”, CIKM’10, October
26–30, 2010, Toronto, Ontario, Canada.
[5] Jingjing Liu, Yunbo Cao, Chin-Yew Lin, Yalou
Huang,Ming Zhou, “Low-Quality Product Review
Detection in Opinion Summarization ”, Proceedings
of the 2007 Joint Conference on Empirical Methods
in Natural Language Processing and Computational,
pp. 334–342, Prague, June 2007.
[6] Anindya Ghose, Panagiotis G, “Estimating the
Helpfulness and Economic Impact of Product
Reviews: Mining Text and Reviewer Characteristics”,
IEEE TRANSACTIONS ON KNOWLEDGE AND
DATA ENGINEERING, VOL. 23, NO. 10, OCTOBER
2011
[7] Anindya Ghose, Panagiotis G. Ipeirotis, “Designing
Novel Review Ranking Systems: Predicting the
Usefulness and Impact of Reviews”, ICEC'07, August
映画２
トランスフォーマー
ミッション：8 ミニッツ
もののけ姫
サマータイムマシンブルース
サマーウォーズ
合う数 /総数
25/30
23/30
20/30
24/30
20/30
112/150
19{22, 2007, Minneapolis, Minnesota, USA.
[8] Jianxing Yu, Zheng-Jun Zha, MengWang, Tat-Seng
Chua, “Aspect Ranking: Identifying Important
Product Aspects from Online Consumer Reviews ”,
Proceedings of the 49th Annual Meeting of the
Association for Computational Linguistics, pages
1496–1505, Portland, Oregon, June 19 -24, 2011.
[9] M. P. O’Mahony, B. Smyth, “Learning to recommend
helpful hotel reviews”, Proceedings of the third ACM
conference on Recommender systems - RecSys ’09, p.
305, 2009.
[10] Y. Liu, X. Huang, A. An, and X. Yu, “Modeling and
predicting the helpfulness of online reviews”,
ICDM’08. IEEE, 2009, pp. 443–452.
[11] 松尾昇，牛尼剛聡 , “差異を明確化する「たとえ」の
提示によるコンテンツ選別支援手法 ”, DEIM Forum
2014
[12] P. Chaovalit and L. Zhou, “Movie review mining: a
comparison between supervised and unsupervised
classification approaches”, Proceedings of the 38th
Annual Hawaii International Conference on System
Sciences, vol. 00, no. C, pp. 112c–112c, 2005.
[13] L. Zhuang, F. Jing, and X.-Y. Zhu, “Movie review
mining and summarization”, Proceedings of the 15th
ACM international conference on Information and
knowledge management - CIKM ’06, p. 43, 2006.
[14] M. Hu and B. Liu, “Mining and summarizing
customer reviews”, Proceedings of the tenth ACM
SIGKDD international conference on Knowledge
discovery and data mining. ACM, 2004, pp. 168–177.
[15] C. L. A. Clarke, M. Kolla, G. V. Cormack, O.
Vechtomova, A. Ashkan, S. B¨uttcher, and I.
MacKinnon, “Novelty and diversity in information
retrieval evaluation”, Proceedings of the 31st annual
international ACM SIGIR conference on Research
and development in information retrieval, ser.
SIGIR ’08. New York, NY, USA: ACM, 2008, pp.
659–666.
[16] K. Dave, S. Lawrence, D. M. Pennock, “Mining the
peanut gallery: opinion extraction and semantic
classiﬁcation of product reviews”, WWW ’03:
Proceedings of the 12th international conference on
World Wide Web, pages 519–528, New York, NY,
USA, 2003. ACM Press.