Comments
Description
Transcript
歌詞情報を用いた歌の感情抽出手法の提案
歌詞情報を用いた歌の感情抽出手法の提案 10871131 山田 彬 (灘本研究室) あらまし:本研究では楽曲の歌詞から感情語を抽出し,その楽曲がどの感情ベクトルを持っ ているか決定することを目的としている.具体的には歌詞中の単語と感情表現辞典の単語と を比較し,共通する単語の数により楽曲の感情ベクトルを決定する. 1.はじめに 3.予備実験 現在パソコン上で音楽の再生・管理をするソ フト「iTunes」や「Windows Media Player」な どの普及により,パソコンから手軽にダウンロ ードでき,歌を持ち運べるようになっている. 歌詞も同様にデジタルオーディオプレーヤーの 中に歌詞を入れて手軽に持ち運べるようになっ ている.また歌詞については「歌ネット」や 「うたまっぷ」のような歌詞サイトの普及によ り歌詞が重要視されつつあり,歌詞を詩や小説 のように読むことを目的とする人や歌詞の良さ を色々な人と共有する人が増えてきている[1].し かしながら,現在楽曲を選択する際は,歌詞よ りもアーティストやメロディーで選択している のが事実であり,検索システムにおいてもアー ティストやメロディーでの検索しかなく,歌の 感情を用いた検索はない.そこで,本研究では, 歌詞から感情を示す言葉である感情語を抽出し, 中村明の提案する感情表現辞典[2]の単語と比較す ることにより歌詞の示す感情を求める手法を提 案する.これにより,アーティストやメロディ ーに偏らない,歌詞の持つ感情から歌を検索す ることが可能となる. 3.1 実験内容 歌詞の感情を仮決定するために予備実験を行 った.被験者 9 名(20 代男性 4 名,女性 5 名) で任意に選曲した楽曲 100 曲に対して,静かな 場所で 1 人の時に平常心を保って実験を行った. 被験者はまず歌詞を読み,次に歌詞が 10 次元の どの感情ベクトルを持っているか 1 つ選択する. 被験者が選択した感情ベクトル(以下,正解デ ータ)と提案手法が決定した感情ベクトルを比 較する. 3.2 感情ベクトルの除外 予備実験の結果,正解データにおいて「厭, 怖,怒,恥,驚」の 5 次元の感情ベクトルはほ ぼ無いことが判明した.よってこの 5 次元を除 外した「喜,好,安,哀,昂」の 5 次元で歌詞 の感情を決定することにする.正解データを閾 値 22%以上とし,提案手法が決定した感情ベクト ルの上位 2 位まで見たときの結果を表 1 に示す. 2.提案手法の概要 歌詞を形態素解析[3]をすることにより,単語の 原形を取得する.取得した単語の原形と感情表 現辞典の単語とを比較し共通の単語を抽出する. 抽出した単語を感情表現辞典の 10 次元の感情ベ クトル「喜,好,安,哀,厭,怖,怒,恥,昂, 驚」にそれぞれ振り分ける.感情語を一番多く 持つ感情ベクトルをその楽曲の感情とする. 歌 詞の単語(図 1 左図)と感情表現辞典の単語 (図 1 右図)とを比較する様子を図 1 に示す. 表 1.予備実験の結果 上位 2 位 適合率 再現率 F値 43% 45% 44% 3.3 提案手法の結果と予備実験の結果の比較 実験の結果は,適合率は 43%,再現率は 45%,F 値は 44%であった.全体的に抽出できた感情語が 少なく,図 2 のように提案手法では感情語を抽 出できなかった歌詞が存在した.この問題を解 決するために,感情表現辞典の拡張を行う. グロウアップ 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 喜 好 安 哀 人 図 1.歌詞の単語と辞典の単語との比較例 誕生日 100% 昂 提案手法 喜 好 安 哀 人 昂 提案手法 図 2.被験者実験の結果と提案手法の結果の比較 語を抽出できなかった楽曲(図 2)があったが, 感情表現辞典を拡張したことによって図 4 のよ 予備実験により感情表現辞典の拡張の必要性 が判明した.そこで感情表現辞典の拡張を行う. うに感情語を抽出できるようになり,正解デー タとも一致した. 様々な拡張方法がある中で,歌詞には「出発」 を「たびだち」と読むように当て字が存在する ため,本研究では類語辞典を用いて拡張を行う. 100% グロウアップ 誕生日 100% Yahoo! 辞書の類語辞典「必携類語実用辞典」[4] 90% 90% 80% 80% を用いて感情表現辞典の全 1097 単語を 1 単語ず 70% 70% 60% 60% つ検索し,出力された類語を感情とは関係のな 50% 50% い単語を手作業で除外して辞典に登録し拡張す 40% 40% 30% 30% る.拡張の様子を図 3 に示す.拡張の結果は, 20% 20% 平均約 1.8 倍の拡張に成功した. 10% 10% 4.感情表現辞典の拡張 0% 0% 喜 好 安 哀 人 昂 提案手法 喜 好 安 哀 人 昂 提案手法 図 4. 拡張後の被験者実験結果と提案手法の結果の比較 感情表現辞典を拡張することによってF値を向 上させることができた.感情表現辞典の単語は 歌詞には使われない単語が多かったため,感情 表現辞典の一般的な用語への対応が必要である. 本研究では英文に対する感情の振り分けは行っ ておらず,英文を考慮する必要がある.さらに, 「晴れない」などの否定語は形態素解析時に 「晴れる」と「ない」に分割され,「晴れる」 のみが感情ベクトルに付与されるため,否定語 の考慮も必要である. 感情ベクトル 拡張前(個) 感情ベクトル 拡張後(個) 喜 231 喜 389 好 224 好 456 安 116 安 200 哀 250 哀 418 昂 276 昂 467 図 3.感情表現辞典の拡張 5 感情表現辞典拡張後の評価実験 5.1 実験内容 感情表現辞典の拡張を行った後,3 章と同様 の実験を行った.なお,正解データは 3 章の結 果を用いる.実験の結果を表 2 に示す. 表 2.予備実験の結果 上位 2 位 適合率 再現率 F値 41% 70% 51% 5.2 提案手法の結果と評価実験の結果の比較 実験の結果は,適合率は 41%,再現率は 70%, F値は 51%であった.3 章での予備実験では感情 6.おわりに 本研究では歌詞情報から感情表現辞典を基に 感情語を抽出し,歌詞がどの感情ベクトルを持 っているか決定した.予備実験を行ったことに よって「厭,怖,怒,恥,驚」の 5 次元の感情 ベクトルは歌詞において人が抱かない感情だと 判明した.さらに感情表現辞典の拡張を行った. 今後の課題は以下の通りである. ① 感情表現辞典の一般的な用語への対応 ② 否定語に対する感情語の振り分け ③ 状況によって変化する単語の考慮 ④ 英文への対応 参考文献 [1].オリコンエンタテインメント株式会社, “ORIGINAL CONGIDENCE”, オリコ ン・エンタテインメント, 平成 23 年 9 月 12 日号 [2].中村明,“感情表現辞典”,東京堂出版 [3].黒橋禎夫,河原大輔“日本語形態素解析シ ステム JUMAN”, <http://nlp.kuee.kyotou.ac.jp/nlresource/juman.html>,平成 21 年 9 月 [4].Yahoo! 辞書 類語辞典“必携 類語実用辞 典”,<http://dic.yahoo.co.jp/>