Comments
Description
Transcript
1.89MB - 情報処理学会電子図書館
Vol.2013-MUS-98 No.9 Vol.2013-EC-27 No.9 2013/3/15 情報処理学会研究報告 IPSJ SIG Technical Report Web 中の文章とリスト構造体を用いたバンドメンバ ー自動収集手法に関する研究 澤田真吾†1 浜中雅俊†1†2 本論文では Web 中にある文章とリスト構造体から音楽のバンドやグループに関連するメンバーを自動的 に収集する手法を述べる.音楽のバンドやグループには,ボーカルやギタリスト,ベーシストなど,多 くのミュージシャンがメンバーとして参加している.これらの情報を収集する手段として,従来提案さ れていた手法では特定のパターンと Web テキストとのパターンマッチングによりバンドのメンバーを抽 出していた.しかし特定のパターンを用いた抽出では汎用性に乏しく精度が不十分であった.本研究で は N-gram モデルを用いたメンバー抽出と Web 上に存在する「メンバーリスト」を利用した手法を提案 し,精度の向上を目指す.我々はまず,Web 上でメンバー情報が主に記載されている文章とリスト構造 体を取得する.次に,N-gram モデルを用いて文章からメンバー抽出をおこなう.さらにその結果を用い てメンバーリストを判定し,リスト中のメンバーを抽出する.文章からの抽出とリストからの抽出で生 じる誤情報のパターンには違いがあるため,それらの共通データのみを利用することで,正しいメンバ ーだけを収集することができる.我々は提案手法を用いてメンバー収集の正確性と汎用性を評価した. その結果提案手法は従来手法より精度の高い収集が可能であることを示した. Extraction of Band Members from Sentence and List Structure on the Web SHINGO SAWADA†1 MASATOSHI HAMANAKA†1†2 In this paper, we propose a method of automatic collecting members that belongs to music band or group. Music band or group contains various kinds of members, vocalist, guitarist and bassist. As a means to gather this information, conventional method has been extracted the band members by the pattern matching between specific patterns and Web texts. But conventional method was poor in versatility and accuracy. We propose the method of extraction band members using N-gram model and member list on web, to improve the accuracy. First, we obtain sentences and list structure from web texts. Next, we extract band members from sentences using the N-gram model. Determining the member lists using the result, we extracted the members in the lists. We can extract the correct members by using the intersection of the data obtained from sentences and lists, because their incorrect information is difference each other. We evaluated the accuracy and versatility of the collection member by using the proposed method. As a result, he proposed method was able to collect accurate than the conventional methods. 1. は じ め に べてのメンバーを集約したデータが記載されたデータベー スや Web サイトは存在しないため,バンドのメンバー情報 本論文では,音楽のバンドやグループに関連するメンバ を得るのは容易ではない.従来,Wikipedia から関連人物を ーを収集するため,Web 中にある文章とリスト構造から自 抽出した手法もあったが[1],Wikipedia などの Web サービ 動的に情報抽出をする手法を述べる. 音楽のバンドやグル スでは,有名なバンドやミュージシャンに関する情報は詳 ープには, 「メンバー」として多くのミュージシャンが関わ 細に記載されているというメリットがある反面,知名度の っている.ボーカリストやギタリスト,ベーシスト,ドラ 低いバンドに関しては,極端に情報量が少ない場合や,ペ マーなど,様々なミュージシャンによってバンドが構成さ ージそのものが存在しないことが多いため,情報を収集で れている.そして,どんなボーカルが歌っているか,どん きなかった.検索エンジンにより取得した複数のページを なギタリストが演奏しているかという情報は,エンドユー 利用した手法[2]では,メンバー名と共に出現しやすい単語 ザが自分の好みに合ったバンドを選択する際の重要な要素 列と Web テキストとのパターンマッチングによりメンバ である. ー収集を行うことで,知名度の低いバンドのメンバー収集 しかし,バンドの現メンバーや過去のメンバーなどのす †1 筑波大学大学院システム情報工学研究科 University of Tsukuba, Graduate School of System and Information Engineering †2 JST さきがけ PRESTO JST ⓒ 2013 Information Processing Society of Japan を可能にした.しかし,収集後の閾値処理によって多くの 正解データが失われてしまっていたため,精度が不十分で あった.閾値処理の問題に対応した手法[3]では,パターン マッチングにより得られたメンバーの中で特に信頼性の高 いデータを選択し,そのデータと同じパターンで出現する 1 Vol.2013-MUS-98 No.9 Vol.2013-EC-27 No.9 2013/3/15 情報処理学会研究報告 IPSJ SIG Technical Report メンバーを再取得することで,閾値処理によって削除され リストを用いた抽出では,Web 上に存在するリスト構造 た正解データの再取得を可能にした.これにより,バンド 体から,バンドのメンバーリストである可能性の高いもの に一時的に参加したメンバーや,演奏支援を行ったミュー を抽出し,リスト中のデータをすべて取得することで多く ジシャンなどの,バンドと関連性の低いメンバーの抽出を のメンバーの収集が可能である.しかし,Web 上に大量に 実現した.しかし,特定のパターンを用いたマッチングに 存在するリスト構造体からバンドのメンバーリストのみを よる抽出では得られる情報量が少なく,さらに Web 上でパ 抽出することは非常に困難であり,類似バンド・ミュージ ターンの共起が起こる頻度が低かったため,大幅な精度向 シャンリスト(図 2)などのメンバーリストでないリストか 上には至らなかった. ら,バンド名や他のバンドのメンバーなどの誤った情報を そこで我々は,メンバー抽出に適切なパターンを発見す 多く収集してしまう. るために N-gram を用いる.そうして得られたパターンと 我々は文章とリストからの抽出で得られる誤情報のパタ のマッチングにより Web テキスト上からメンバーを抽出 ーンの違いに着目し,二つの結果の共通項のみを利用する し,さらに閾値処理によって削除されたメンバーを,Web ことで正解データのみの抽出が出来ると考えた.その手法 中のリストを用いて再取得する手法を提案する.本手法で の全体図を図 3 に示す. メンバーを抽出するパターンを N-gram モデルを用いて生 はじめに Web ページの収集をし,情報源を取得する.出 成することで,Web 上のメンバー情報の様々な出現パター 来るだけ対象とするバンドの情報のみが記載されていて, ンに対応した抽出を可能とする.また閾値処理により削除 さらにメンバーの情報を含んでいる可能性の高いページを されたデータを,メンバーリストとのマッチングにより再 収集する(2.1 節,図 3. a). 取得することで,削除されたデータの中から,正しいメン 次に,得られたページから文章とリスト構造体を抽出す バーのデータのみを抽出することが可能となる. る.それぞれの HTML 文中での出現の特性を利用し,正規 我々は提案手法が正しいメンバーの収集が可能である 表現により抽出する(2.2 節,図 3. b). かという点と,すべてのメンバーを収集可能であるかとい HTML 文より抽出した文章から,N-gram モデルを用いて う点を調べるため,メンバーの収集実験を行った.その結 作成したパターンとのマッチングによりメンバーを抽出す 果,提案手法はメンバーリストとのマッチングを行わなか る.このとき抽出数が多いデータは信頼性が高く,抽出数 った場合と比べて,高い精度でのメンバー収集が可能であ の少ないデータは誤ったデータが多く含まれている.そこ ることを示した. で閾値 N を設け,抽出数が N 以上のデータを正解のメンバ ー,N に満たないものをリザーブメンバーとして一時保存 する(2.4 節,図 3. c). 2. メ ン バ ー の 自 動 収 集 HTML 文より抽出したリスト構造体からメンバーを抽出 Web 上に存在するメンバー情報は,主に「文章」と「リ する.Web ページ上にはリスト構造体が大量に存在するた スト構造体」に存在する.その出現例を図 1 に示す. め,どのリストがメンバー情報を表したリストであるかを 文章中に出現するメンバー名は,その周囲に単語列が存 選定しなければならない.そこで先ほど文章中から抽出し 在するため,確率的手法による抽出が可能である.しかし, た正解のメンバーが含まれているリストをメンバーリスト その出現パターンの類似性から,誤った情報としてバンド であると判断し,そのリスト中の人名をすべて抽出する のアルバム名やライブツアー名を少量抽出してしまい,抽 出回数の少なかったメンバーと紛れてしまう. ⽂文章中に存在するメンバー名 リスト中に存在するメンバー名 図 1. Web 上に存在する文章とリストの例(文献 11 より 図 2. 誤って抽出しやすいリスト例(バンドに類似する 引用) バンドやミュージシャンのリスト) ⓒ 2013 Information Processing Society of Japan 2 Vol.2013-MUS-98 No.9 Vol.2013-EC-27 No.9 2013/3/15 情報処理学会研究報告 IPSJ SIG Technical Report (2.5 節,図 3. d). は違うバンドの情報が書かれているということもある.本 最後にリストから得たメンバーと,文章から抽出したメ ンバーの中でリザーブメンバーとなったデータとのマッチ 手法では,誤った情報の抽出を避けるためランキング上位 50 までの Web ページを利用する. ングをおこなう.この作業によりお互いのデータの正しい 情報のみを利用することが可能となる(図 3. e). 2.2 文 章 と リ ス ト 構 造 体 の 抽 出 文章とリスト構造体は,それぞれの HTML 文中での出現 Yahoo 検索API の特徴から,正規表現を用いて抽出する. a.Webページ収集 文章は基本的にアルファベットの大文字から始まり,ピ リオド ”.” で終わる.また,必ず二つ以上の単語が連続 Webページ して存在していなければ文章は成立しない.これらの仮定 b.文章・リスト 抽出処理 N-gramモデルによる パターン生成 から正規表現を生成し,Web ページ中の文章を抽出する. リスト構造体の抽出は HTML タグを利用する.Web ペー ----------- ジ上のリストは,HTML 文中では項目ごとに,リストタグ ” 文章データ <li>” によって囲まれ,それらが連続して表記されること Name1--------------------------.-------------Name2---Name3-. --------------Name4.— ---Name5--------- メンバー抽出パターン で構成されている(図 3).この性質を利用し,リストタグが 連続して記載されている部分を正規表現により抽出する. c. パターン マッチング 閾値処理 1 2 正解メンバー リストデータ Name1 Name2 Name1 Name2 Name3 Name4 Name6 3 4 d.メンバー リスト判定 5 リザーブメンバー Name3 Name4 Name5 3 4 W e b ! Ritchie Blackmore (1968 - 1975) ! Rod Evans (1968 - 1969) ! Nicky Simper (1968 - 1969) リストのメンバー e.マッチング Name3 Name4 Name6 メンバー名: Name1, Name2, Name3, Name4 図 3. メンバー収集の全体の流れ 2.1 Web ペ ー ジ の 収 集 H T M L <li> Ritchie Blackmore (1968 - 1975) </li> <li> Rod Evans (1968 - 1969) </li> <li> Nicky Simper (1968 - 1969) </li> 図 4. HTML 文中のリスト構造体の記述例 Web ページの収集には Yahoo の検索 API を用いる.検索 API に適切なクエリを渡すことで,よりバンドのメンバー 情報を含む確率の高い Web ページを取得できる.従来手法 2.3 メ ン バ ー 抽 出 パ タ ー ン 生 成 [3]では,バンド名に以下の 4 種類の検索ワードを加えたク N-gram を用いて,バンドのメンバー名の周囲に出現しや band すい単語を求め,抽出モデルを作成する.本来,N-gram は members のクエリで検索した結果が最も精度が高かった 目的の語句の直前に出現する単語列を求めるのが一般的だ と記されている. が,バンドのメンバー名は文頭に来ることが多く,直前に “バンド名” music 単語列が存在しない場合も多いため,本研究では,メンバ “バンド名” music members ー名の直前と直後に出現する確率の高い単語列をそれぞれ “バンド名” band members 求め,抽出モデルを作成する. エリで検索を行なった.実験の結果,”バンド名” “バンド名” band lineup 本研究でもこの結果に従い,クエリは ”バンド名” モデル作成に用いるバンドのメンバーは,音楽情報デー band members を採用する. タベース Musicbrainz[13]に存在するバンド 50 組と,それら に演奏参加したことのあるメンバーとする.はじめにメン また,検索 API を用いて得た結果には,クエリとの関係 バー情報の記載されている Web ページを取得するため「" 性の強さに応じて,ランキングが付けられている.つまり バンド名” band members」のクエリで Yahoo API で検索を ランキングの高いページは目的のバンドのメンバー情報が かけ,上位 50 ページを取得する.次に,取得したページか 記載されている可能性が高いが,ランキングの低いページ らピリオドで終わる文章をすべて抽出する.文章中にメン は,メンバー情報が載っていない場合や,目的のバンドと バー名が存在する場合,メンバー名(MemberName)と直前の ⓒ 2013 Information Processing Society of Japan 3 Vol.2013-MUS-98 No.9 Vol.2013-EC-27 No.9 2013/3/15 情報処理学会研究報告 IPSJ SIG Technical Report 2 単語(𝑤! 𝑤! )との Trigram と,メンバー名と直後の 2 単語 (𝑤! 𝑤! )との Trigram をすべて抽出し,それぞれの抽出数 𝐶 𝑤! 𝑤! 𝑀𝑒𝑚𝑏𝑒𝑟𝑁𝑎𝑚𝑒 𝐶(𝑀𝑒𝑚𝑏𝑒𝑟𝑁𝑎𝑚𝑒 𝑤! 𝑤! ) を取得する.次に抽出した単語列がすべての文章中で何回 出現するのかをカウントし,それぞれの抽出数 図 5. Web 上に存在するメンバーリストの例 𝐶(𝑤! 𝑤! ) (文献[12]より引用) 𝐶 𝑤! 𝑤! を取得する.最後にそれらの単語列がメンバー名の直前, このようにメンバーリストはいくつかのメンバーが箇条書 直後に出現する条件付き確立を式1,式2により計算する. きのような形で表記されている.つまり,一人でも正しい 𝑃!"# 𝑀𝑒𝑚𝑏𝑒𝑟𝑁𝑎𝑚𝑒 𝑤! 𝑤! = メンバーが分かっていれば,そのメンバーを含むリストは 𝐶 𝑤! 𝑤! 𝑀𝑒𝑚𝑏𝑒𝑟𝑁𝑎𝑚𝑒 𝐶 𝑤! 𝑤! メンバーリストである可能性が高い.そこで文章中から抽 (1) 𝑃!"# 𝑀𝑒𝑚𝑏𝑒𝑟𝑁𝑎𝑚𝑒 𝑤! 𝑤! = 𝐶(𝑀𝑒𝑚𝑏𝑒𝑟𝑁𝑎𝑚𝑒 𝑤! 𝑤! ) 𝐶(𝑤! 𝑤! ) 出したメンバーの中で,信頼性が高いと判断された正解の メンバーがリスト中に含まれていれば,そのリストをメン バーリストと判断し,リスト中に記載されている人名をす (2) べて抽出する.このとき抽出する人名は 3.4 の場合と同じ く,先頭文字は大文字,2 つ以上 5 つ以下の連続した単語 2.4 文 章 か ら の メ ン バ ー 抽 出 列であることをを条件とする. 作成したモデルを用いて,HTML 文中の文章とのパター ンマッチングによりメンバーを抽出する.このとき,正し いメンバーである可能性の高いデータの抽出を目指すため, 3. BandNavi HD 2.3 で取得した単語列のうち,メンバー名の前に出現する 提案手法により収集したバンド・グループのメンバー情 条件付き確立が 70%以上の単語列を用いる.また,抽出す 報を用いてミュージシャンを探索するアプリケーション” る文字列は人名であることを考慮して,以下の条件を付加 BandNavi HD”を構築した.BandNavi HD はミュージシャ する ンのつながりを利用して,新たなバンド,ミュージシャン, l 先頭文字は大文字 楽曲を発見できることが出来る iPhone アプリ「BandNavi」 l 2 つ以上 5 つ以下の連続した単語列 [5]を iPad 上で実装し,さらにミュージシャンの関係性を可 次に抽出したメンバーをソートする.例えば,正解のメ 視化する機能を加えたアプリケーションである.バンドに ンバーが「Freddie Mercury」であるとき,誤って「Freddie 在籍するミュージシャンの中には,複数のバンドを掛け持 Mercury Live」など,名前に余計な単語が付加されたもの ちしていたり,サポートメンバーとして他のバンドのアル を抽出してしまうことがある.この場合,抽出した単語列 バムに演奏参加していたり,作曲家としての楽曲提供やラ 同士を比較し,ある単語列が,別の単語列に含まれている イブでのゲスト出演などの活動により, 一人の人物がたく 場合,2 つの単語列の抽出数を比べ,抽出数の低いものを さんのバンドと関係を持っていることがある.このような 削除し,その抽出数を残った単語列の抽出数に加算する. 最後に抽出したメンバーを,抽出数によりフィルタリン グし,正解メンバーとリザーブメンバーに分類する.正解 とする抽出数 N の適切な値は 4 章の実験で求める. 2.5 リ ス ト か ら の メ ン バ ー 抽 出 リストからメンバーを抽出するためには,はじめに Web 上に大量に存在するリスト構造体からメンバー情報を表す リストを選び抜かなければならない.図 5 は Web 上に存 在するメンバーリストの例である. 図 6. BandNavi HD 画面図 ⓒ 2013 Information Processing Society of Japan 4 Vol.2013-MUS-98 No.9 Vol.2013-EC-27 No.9 2013/3/15 情報処理学会研究報告 IPSJ SIG Technical Report 関係性を持つバンドとミュージシャンを繋いでいくと,ネ マッチングとパターンの共起によりメンバー収集を行った ットワークが形成される.BandNavi HD はこのバンドとミ 従来手法[3]による結果を表 2 に示す.表より,提案手法に ュージシャンのネットワークを次々と辿っていくことで, より収集されたメンバーは,従来手法より適合率,再現率 お気に入りのボーカルやギタリストが参加している他のバ ともに高いという結果を得た.これは,提案手法は従来手 ンドの楽曲を発見することができる新しい楽曲探索インタ 法より,メンバーの収集精度が高ことを示す.適合率が向 フェースである. 上した要因は,従来手法が特定のパターンのマッチングに よる抽出であったのに対し,提案手法は N-gram モデルを 用いたため,メンバーである確率の高いデータのみを抽出 4. 評 価 実 験 できたためである.再現率が向上した要因は,従来は閾値 提案した手法が,バンドの正確なメンバーを収集でき 削除されてしまった正解データを,信頼性の高いデータと るかを調べるため,メンバーの収集実験を行った. 実 のパターンの共起を用いて再取得していたのに対し,提案 験に用いたバンドは,大型音楽情報データベース 手法ではリスト上での共起により再取得を行ったためと考 MusicBrainz に存在するバンド 50 組を無作為に選択しそ えられる.これは,メンバー同士のパターンが共起する頻 れらのバンドのメンバーの収集を試みた(4.1).提案手法 度より,リスト内での共起の頻度の方が多いため,正解デ により収集した結果と従来手法との結果を比較した(4.3). ータの再取得に適していたためである. またリザーブメンバーとのマッチングを行った提案手 法と,マッチングを行わず,リストのメンバーをすべて 正解のメンバーとした結果,リストを用いず N-gram モ デルによる抽出のみの結果とを比較し,提案手法の有効 性を評価した(4.4). 表 2. 提案手法と従来手法の収集結果 メンバー収集手法 適合率 再現率 F値 0.87 0.67 0.75 提案手法 0.68 0.62 0.65 従来手法 4.1 正 解 デ ー タ 正解データであるバンドのメンバーはバンドの情報 が記載されている Web サイトから手動で収集した.メン 4.4 リ ス ト の 利 用 方 法 の 比 較 表3はザーブメンバーとのマッチングを行った提案手 バーは,現在所属しているメンバーや過去に所属してい 法による結果と,リストのメンバーをすべて正解メンバー たメンバーだけでなく,ライブやツアーなどに参加した とした結果,リストを利用しなかった場合の結果を示す. メンバーや,リリースしたアルバムでの演奏にゲストと 表より,提案手法は N-gram のみでの収集に比べ,適合率 して参加したメンバーも正解のメンバーとした. を大きく下げることなく,再現率を大幅に上げることがで きるという結果を得た.これはリストを用いることで,正 4.2 文 章 か ら の 抽 出 に お け る 閾 値 の 設 定 確なメンバーのみをリザーブメンバーから抜き出すことが 正しいメンバーリストを抽出するためには,閾値処理 できたためである.リザーブメンバーとのマッチングをせ によって正解メンバーとなったデータが十分に信頼性 ずに,リストのメンバーをそのまま正解とした場合は,最 のあるデータでなければならない.表 1 は抽出数 N の閾 も多くの正解のメンバーを抽出することができるが,適合 値を変化させたときのそれぞれの結果である. 率が著しく低くなるという結果となった.これは対象のバ 本手法では 9 割以上の適合率を示した N=6 以上の閾値 ンドのメンバーリストだけでなく,他のバンドのメンバー 処理を採用する.また,最大抽出数が 6 に満たなかった リストやその他のリスト構造体が混在してしまったため, 場合は,最も大きい抽出数を1とした場合のそれぞれの 誤ったデータを多く抽出してしまったことが原因である. 抽出数の割合により閾値を設ける.こちらも,9 割以上 これより,リスト上の正しいメンバーのみを抽出するため の正解率を示した,閾値 0.8 を採用する. に,リザーブメンバーを利用することは有効であった. 表 1. N-gram での抽出結果 抽出数Nの閾値 適合率 再現率 N=1以上を正解 0.15 0.74 N=4以上を正解 0.83 0.55 N=5以上を正解 0.89 0.50 N=6以上を正解 0.91 0.47 表 3. リストの利用方法の結果比較 F値 0.25 0.66 0.64 0.62 4.3 従 来 手 法 と の 比 較 提案手法を用いてメンバー収集をした結果と,パターン ⓒ 2013 Information Processing Society of Japan メンバー収集手法 リザーブメンバーとの マッチングあり (提案手法) 適合率 再現率 F値 0.85 0.67 0.75 リザーブメンバーとの マッチングなし 0.66 0.69 0.68 N-gramのみ 0.91 0.47 0.62 5 情報処理学会研究報告 IPSJ SIG Technical Report 5. ま と め 本論文では,Web 上の文章とリスト構造体を用いること でバンドのメンバーを収集する手法を述べた. 本論文の意義は次の二つである.第一の意義は,Web 上 の文章中に存在するメンバー情報は,N-gram モデルを用い たパターンマッチングにより抽出可能であることを明らか Vol.2013-MUS-98 No.9 Vol.2013-EC-27 No.9 2013/3/15 10) 濱崎 雅弘,後藤 真孝: Songrium: 多様な関係性に基づく音楽 視聴支援サービス,Vol.2012-MUS-96 No.1 (2012). 11) Last.fm Deep Purple’s Biography. http://www.last.fm/music/Deep+Purple/+wiki?setlang=en (2013). 12) Wikipedia Deep Purple’s Biography.http://en.wikipedia.org/wiki/List_of_Deep_Purple_band_me mbers (2013). 13) MusicBrainz.http://musicbrainz.org/ (2013). にした点である.従来の手法は特定のパターンのみを利用 したメンバー抽出であったが,提案手法は N-gram モデル を用いてパターンを生成した.そのため Web 中での様々な メンバー名の出現パターンに対応し,多くのメンバーの収 集が可能となった. 第二は,閾値処理によって失われた正解データは,Web 上のリストを用いることで正しいデータの再抽出が可能で あることを明らかにした点である.閾値によって削除され た誤った情報は,バンドのアルバム名やライブ名であった. リスト中の誤った情報は,他のバンド名やそれに在籍する メンバー名であった.これら二つの誤情報のパターンの違 いを利用し,互いの共通部分のみを利用することで正解デ ータの再抽出が可能であることを確認した. 今後,英文で記載された情報抽出のみでなく,日本語で 書かれた情報抽出を行うことで,J-POP や J-ROCK などの バンドにどのようなミュージシャンが関連しているかとい う情報も明らかにしていきたい. 参考文献 1) Yulan Yan, Yutaka Matsuo and Mitsuru Ishizuka: Unsupervised Relation Extraction by Mining Wikipedia Texts with Support from Web Corpus, Proc. the Joint conference of the 47th Annual Meeting of the Association for Computational Linguistics and the 4th International Joint Conference on Natural Language Processing of the Asian Federation of Natural Language Processing 2009 (2009). 2) M.Schedl and G.Widmer, ”Automatically Detecting Members and Instrumentation of Music Bands via Web Content Mining,” Proceedings of the 5th Workshop on Adaptive Multimedia Retrieval (2007). 3) 吉谷幹人, 宇佐美敦志, 浜中雅俊:“メンバー情報に基づくバン ドネットワークの構築と利用”, 情報処理学会 音楽情報科学研究 会 研究報告 2009-MUS-82-5 (2009). 4) Xiaoxin Yin, Wenzhao Tan, Xiao Li, Yi-Chin Tu “Automatic extraction of clickable structured web contents for name entity queries”, WWW 2010, 991-1000 (2010). 5) 吉谷幹人, 宇佐美敦志, 浜中雅俊: “BandNavi: バンドメンバー の変遷情報を辿るアーティスト発見システム”, 情報処理学会 音 楽情報科学研究会 研究報告 MUS-86-16 (2010). 6) Grosche, P., Mu ̈ller, M. and Serr`a, J.: Au- dio Content-Based Music Retrieval, Multimodal Music Processing (Mu ̈ller, M., Goto, M. and Schedl, M., eds.), Dagstuhl Follow-Ups, Vol. 3, Schloss Dagstuhl– Leibniz-Zentrum fuer Informatik, Dagstuhl, Germany, pp. 157–174 (online), DOI: http://dx.doi.org/10.4230/DFU.Vol3.11041.157 (2012). 7) 吉井和佳,後藤真孝:音楽推薦システム,情報処理 (情報 処理学 会誌), Vol. 50, No. 8, pp. 751–755 (2009). 8) Celma, O.: Music Recommendation and Discovery: The Long Tail, Long Fail, and Long Play in the Digital Music Space, Springer (2010). 9) 松尾豊, 友部博教, 橋田浩一, 中島秀之, 石塚満. Web 上の情報 からの人間関係ネットワークの抽出. 人工知能学会論文誌, Vol. 20, No. 1E, pp. 46–56 (2005). ⓒ 2013 Information Processing Society of Japan 6