...

SNS におけるユーザのトレンドに対する態度を考慮した ファッション情報

by user

on
Category: Documents
78

views

Report

Comments

Transcript

SNS におけるユーザのトレンドに対する態度を考慮した ファッション情報
DEIM Forum 2016 F2-5
SNS におけるユーザのトレンドに対する態度を考慮した
ファッション情報推薦手法 内田 友梨香†
牛尼 剛聡‡
†九州大学芸術工学部 〒815-8540 福岡県福岡市南区塩原 4-9-1
‡九州大学大学院芸術工学研究院 〒815-8540 福岡県福岡市南区塩原 4-9-1
E-mail:
†[email protected],
‡[email protected]
あらまし 現在,ファッション情報は SNS やブログなどの様々なインターネットメディアから得ることができ
る.その一方で,莫大な情報の中から自分にとって有益な情報を見つけることが困難となったため,情報推薦が重
要となっている.ファッションにおける推薦は「トレンド」が大きく関係しており,ユーザによって「新商品はす
ぐに購入する」
「巷で流行しているから購入する」等,トレンドに対する態度が異なる.しかし,従来の推薦手法の
多くでは,ユーザとアイテムとの関係のみを考慮して,その時間的な側面を考慮していないため,ファッションに
関する情報を適切に推薦できない場合がある.本研究では,ファッション投稿が活発な写真投稿型 SNS である
Instagram を利用して,ユーザの「トレンドに対する態度」を考慮した推薦手法を提案することで,より精度の高い
ファッション情報推薦の実現を目指す.
キーワード SNS,情報推薦,ファッション,トレンド
1.
はじめに
ユーザの嗜好には「トレンド」が強く関係するからで
従来,ファッションに関する情報は雑誌やテレビな
あ る .す な わ ち ,
「 新 商 品 は す ぐ に 購 入 す る 」,
「巷で流
どのマスメディアから得ることが一般的であった.し
行しているから購入する」などユーザによってトレン
か し ,近 年 ,Instagram[1]に 代 表 さ れ る SNS,Ameba[2]
ドに対する態度が異なり,それらはアイテムを推薦す
に 代 表 さ れ る ブ ロ グ ,WEAR[3]に 代 表 さ れ る Web サ ー ビ
る際に重要な特性と考えられる.従来の推薦手法では
スなどのインターネットメディアからファッション情
ファッション情報に大きな影響を与える「トレンド」
報を得る人々が増加している.しかし,ユーザは莫大
に対するユーザの態度を考慮していないため,トレン
な情報の中からユーザは自分にとって有益な情報を見
ドが影響を与える情報を適切に推薦できない場合があ
つけることが困難となったため,情報推薦が重要とな
る . っている.情報推薦に関する研究では,ユーザに対し
上記の問題を解決するために,本研究では,ファッ
てより精度の高い推薦を行うことが大きな目標の 1 つ
シ ョ ン に 関 す る 投 稿 が 活 発 な 写 真 投 稿 型 SNS で あ る
で あ り , こ れ ま で に も 様 々 な 提 案 が 行 わ れ て き た . Instagram を 利 用 し て , フ ァ ッ シ ョ ン ア イ テ ム の ト レ
従来の代表的な推薦手法として,協調フィルタリン
ンド性と,ユーザがファッションアイテムに反応した
グ が 挙 げ ら れ る [4].協 調 フ ィ ル タ リ ン グ に は ,様 々 な
タ イ ミ ン グ( 投 稿 時 刻 )の 2 つ に 注 目 す る こ と で ,ユ
手法が存在するが,基本的には,既に明らかになって
ーザの「トレンドに対する態度」を考慮したファッシ
いるユーザとアイテムの関係性に基づいて,ユーザと
ョン情報推薦手法を提案し,より精度の高いファッシ
未知のアイテムとの関係性を推定するアプローチに基
ョ ン 情 報 推 薦 の 実 現 を 目 的 と す る . づ い て い る .例 え ば ,
「 ユ ー ザ 」と「 ア イ テ ム 」の 間 に
「購入」という関係性に注目した場合,推薦対象とす
2.
関連研究
るユーザと購入履歴に類似性が高いユーザを発見し,
本 研 究 の 関 連 研 究 と し て ,時 間 を 考 慮 し た 協 調 フ ィ
多くの購入履歴の類似性が高いユーザが購入している
ルタリングや,ユーザの嗜好の遷移に注目した協調フ
ア イ テ ム を 推 薦 す る と い う も の で あ る . ィルタリングに関する研究の概要と,本研究の位置づ
一般的に,従来の推薦手法の多くでは,ユーザとア
け に つ い て 説 明 す る . イテムとの関係が有する時間的な側面は考慮していな
古 川 ら [5]は , ユ ー ザ の 嗜 好 の 遷 移 過 程 に 注 目 し た
い.例えば,ユーザの購入履歴に基づいて推薦を行う
推 薦 シ ス テ ム を 提 案 し て い る .こ の シ ス テ ム で は ,
「ユ
場合には,ユーザの購入した日時は考慮されない.し
ーザがある時間にアイテムを採用する(=閲覧する,
かし,ファッションにおける推薦を行う場合には,ユ
購入する,ブックマークする)」という基本的なデー
ーザとアイテムとの時間的な側面が重要な意味を持つ
タのみを扱い,ユーザ間のマルコフ連鎖に基づいた既
場合がある.何故なら,ファッションにおける情報や
存の推薦手法を基に,アイテム間のマルコフ性を考慮
することで,多くのデータに対応する推薦アルゴリズ
るとされている.アーリーマジョリティは,アーリー
ム を 実 現 し た . アダプターからの影響を強く受け,慎重ではあるが,
大 力 ら [6]は , ソ ー シ ャ ル ブ ッ ク マ ー ク 内 の デ ー タ
全 体 の 平 均 か ら す る と 早 め に 新 商 品 を 採 用 す る . を 用 い て , 「 URL の 大 部 分 を , 他 の ユ ー ザ よ り 先 に 登
レイトマジョリティは新しい様式の採用には懐疑
録するユーザ群」と定義されたイノベータに注目し,
的で,周囲の大多数が試している場面を見てから同じ
常に変化するユーザの嗜好に即時対応できる効率的な
選 択 を す る グ ル ー プ で あ り , 市 場 全 体 の 34.0%で あ る
推薦手法を提案した.イノベータを利用した手法は協
と さ れ て い る . 調フィルタリングを利用した推薦に比べ,利用するデ
ラガードは世の中の動きに関心が薄く流行が一般
ー タ が 少 な く て 済 む ,計 算 量 が 少 な く て 済 む ,ユ ー ザ・
化するまで採用しない,もしくは,最後まで採用しな
URL の 増 加 に 対 す る 耐 久 性 が 高 い と い う 3 つ の 利 点 が
い グ ル ー プ で あ り , 市 場 全 体 の 16.0%で あ る と さ れ て
あ る と し て い る . い る . 川 前 ら [7]は , 過 去 の 購 入 行 動 が 対 象 ユ ー ザ と 類 似
エ ベ レ ッ ト は ,イ ノ ベ ー タ と ア ー リ ー ア ダ プ タ ー を
するだけではなく,先行している度合いの高いユーザ
合 わ せ た 層 に 普 及 し た 段 階 ( 普 及 率 16%) を 急 激 に 市
の履歴を重視して選別し利用することで,ユーザごと
場が拡大する分岐点とし,他のユーザへの影響力が大
の嗜好の時系列性と,ユーザ間の行動の先行性に注目
きいアーリーアダプターが商品普及の鍵を握ると主張
したユーザの最新の嗜好を反映できる協調フィルタリ
し た . ン グ を 提 案 し て い る . 3 . 2 . ト レ ン ド を 利 用 し た 推 薦 の ア プ ロ ー チ 上記の関連研究はファッションにおけるトレンド
を考慮していないため,適切なファッション情報推薦
エ ベ レ ッ ト [8]は , ユ ー ザ の 新 商 品 を 採 用 す る 時 期
が難しいと考えられる.本研究では,ファッションに
の違いによって,新商品に対する考え方やライフスタ
おけるトレンドとユーザがファッションアイテムに反
イルに差があり,異なる行動の特徴が表れることを示
応したタイミングを考慮したファッション情報推薦を
している.この事から,それぞれのグループに属する
実 現 す る こ と を 目 的 と す る . ユーザによって,インターネット上での行動特性も異
な る 可 能 性 が あ る と 考 え ら れ る . 例 え ば ,ユ ー ザ A と ユ ー ザ B が ,あ る ア イ テ ム X に
3. ア プ ロ ー チ
3.1. ユ ー ザ の ト レ ン ド に 対 す る 態 度 に よ る 分
類と特性
対して反応(検索,投稿,購入などの何らかのポジテ
エ ベ レ ッ ト [8]は , ユ ー ザ の 商 品 購 入 へ の 態 度 に 違
タリングであれば,「ユーザ A とユーザ B は類似して
ィブな行為)をした場合を考える.従来の協調フィル
い が 存 在 す る こ と を ,イ ノ ベ ー タ 理 論 と し て 提 案 し た .
いる」と判断され,それに伴った推薦が行われると考
イノベータ理論において,ユーザは,以下の5種類に
えられる.しかし,ユーザ A が「新商品に特に興味を
分 類 さ れ る . 持つユーザ」であり,新商品に特に興味を持っている
1.
イ ノ ベ ー タ ( 革 新 者 ) の で ,ア イ テ ム X は 発 売 後 す ぐ に 購 入 し て い た と す る .
2.
ア ー リ ー ア ダ プ タ ー ( 初 期 採 用 者 ) 一方,ユーザ B が「周囲の大多数が利用しているのを
3.
ア ー リ ー マ ジ ョ リ テ ィ( 前 期 追 随 者 ) 確認してから同じ選択をするユーザ」であり,アイテ
4.
レ イ ト マ ジ ョ リ テ ィ ( 後 期 追 随 者 ) ム X は巷で流行しており,自分の周囲の人も採用して
5.
ラ ガ ー ド ( 遅 滞 者 ) いるので購入していたとする.このような場合には,
イノベータは新しい商品を進んで採用するグルー
プ で あ り ,市 場 全 体 の 2.5%を 占 め る と さ れ て い る .イ
ノベータは商品の目新しさのみを考慮して採用するた
め,イノベータが採用した段階では,その商品の価値
が 世 間 に 受 け 入 れ ら れ て い る か ど う か は 不 明 で あ る . アーリーアダプターは社会と価値観を共有してお
り,流行には敏感で,自ら情報収集を行い判断するグ
ル ー プ で あ り , 市 場 全 体 の 13.5%を 占 め る と さ れ て い
る.アーリーアダプターは,商品の価値を理解した上
で 採 用 し , 他 の グ ル ー プ に 対 し て 強 い 影 響 力 を 持 つ . アーリーマジョリティは新しい様式の採用には比
較 的 慎 重 な グ ル ー プ で あ り , 市 場 全 体 の 34.0%を 占 め
ユ ー ザ A と ユ ー ザ B は 類 似 し て い る と は 言 い 難 い (図
1)
.
Instagram で は , そ の 日 の フ ァ ッ シ ョ ン コ ー デ ィ ネ ー
トを日記のように投稿する際に付けるハッシュタグと
し て 「 #ootd( Outfit Of The Day) 」 , 「 # 今 日 の コ
ーデ」というものがある.それらのタグが付与された
投 稿 は , 「 #ootd」 に つ い て は 6,000 万 件 , 「 #今 日 の
コ ー デ 」に つ い て は 38 万 件 に も 及 ぶ .こ れ ら の 投 稿 に
は ,「 #ト レ ン チ コ ー ト 」な ど の 着 用 し て い る フ ァ ッ シ
ョ ン ア イ テ ム の ハ ッ シ ュ タ グ や ,「 #ユ ニ ク ロ 」な ど の
着用しているファッションブランドのハッシュタグ,
「 #足 元 倶 楽 部 」な ど の グ ル ー プ を 表 す ハ ッ シ ュ タ グ な
図 1 ユーザによる商品に対する反応の違
い ど , 様 々 な ハ ッ シ ュ タ グ が 付 い て い る . 3.4.
我 々 は 上 記 の よ う に ,ト レ ン ド に 対 す る ユ ー ザ の 特
ファッションアイテムのトレンド性とユ
ーザの関係性についての分析
性を,「トレンドに対する態度」と呼ぶ.そして,本
本 節 で は ,本 研 究 に お い て 考 慮 す べ き 2 つ の ポ イ ン
研究では,ユーザがアイテムに反応したタイミングに
トのうちの 1 つであるファッションアイテムのトレン
注目し,「同じアイテムに対して,類似したタイミン
ド 性 と ユ ー ザ の 関 係 性 に つ い て Instagram を 利 用 し て
グで反応したユーザ同士はトレンドに対する態度が類
分 析 し た . 似している」という仮説を立てる.つまり,本研究で
フ ァ ッ シ ョ ン ア イ テ ム の ト レ ン ド 性 は ,対 象 と す る
は,「同じアイテムを採用している」だけではなく,
ファッションアイテムがある時点において,どれほど
「類似したタイミングで反応した」ことを考慮するこ
流 行 し て い る か を 表 す . とで,ユーザのトレンドに対する態度を考慮した推薦
を 行 い , よ り 精 度 の 高 い 推 薦 の 実 現 を 目 的 と す る . 2015 年 に お い て ト レ ン ド 性 が 高 い と 考 え ら れ る「 ガ
ウ チ ョ パ ン ツ 」 を 例 と し て , Instagram を 利 用 し て ,
イノベータもしくはアーリーアダプターと考えられる
3.3.
SNS に お け る フ ァ ッ シ ョ ン に 関 す る ユ ー
ザの振る舞い
ユーザと,アーリーマジョリティもしくはレイトマジ
本 研 究 で 開 発 す る ,ユ ー ザ の ト レ ン ド に 対 す る 態 度
そ れ ぞ れ を ユ ー ザ A,ユ ー ザ B と す る .ユ ー ザ A,ユ ー ザ
を考慮した協調フィルタリングによる推薦手法におい
B は ,Instagram に お い て そ れ ぞ れ ,2014 年 6 月 ,2014
て,ユーザの行動特性を抽出する場として,ファッシ
年 5 月からファッションに関する投稿を行っている.
ョ ン に 関 す る 投 稿 が 活 発 で あ る 写 真 投 稿 型 SNS の 1 つ
利 用 し た ハ ッ シ ュ タ グ 数( 重 複 あ り )は ,そ れ ぞ れ 395
で あ る Instagram を 利 用 す る . Instagram の 利 用 者 は
件 , 372 件 で あ っ た . ョリティだと考えられるユーザを 1 人ずつ見つけた.
世 界 で 4 億 人 ,日 本 で は 810 万 人 に の ぼ り ,毎 日 8,000
図 2 に Instagram に お け る 「 #ガ ウ チ ョ パ ン ツ 」 の
万 枚 以 上 の 写 真 が 投 稿 さ れ て い る . Instagram の 使 い
投 稿 数 の 遷 移 と ユ ー ザ A,ユ ー ザ B の 「 #ガ ウ チ ョ パ ン
方は多岐にわたっており,雰囲気のある芸術的な写真
ツ 」の 投 稿 時 期 を 表 し た グ ラ フ を 示 す .横 軸 は 投 稿 月 ,
を投稿するユーザもいれば,ハッシュタグを利用して
縦軸は投稿数を投稿月の全投稿数で正規化したもの,
日記のような使い方をするユーザもいる.気軽に世界
丸がそれぞれのユーザの投稿時期を表している.図 2
のあらゆる瞬間をユーザごとに異なる様々な世界観に
の波の盛り上がりをトレンド波とした場合,ユーザ A
よ っ て 捉 え , 表 現 し , 共 有 す る ク リ エ イ テ ィ ブ な SNS
は ,ト レ ン ド 波 の 始 ま り 周 辺 で あ る 2014 年 10 月 か ら ,
の 1 つ で あ る . ト レ ン ド 波 の ピ ー ク と な る 2015 年 5 月 ま で 「 #ガ ウ チ
本 研 究 で , Instagram を 対 象 と す る の に は 2 つ の 大
ョパンツ」をタグとして投稿していることから,「ガ
き な 理 由 が あ る .1 つ 目 の 理 由 は ,Instagram で は ,フ
ウチョパンツ」に対しては,イノベータもしくはアー
ァ ッ シ ョ ン の 投 稿 が 活 発 で あ る こ と で あ る .Instagram
リーアダプターであると言える.方,ユーザ B は「ガ
では,気軽に写真を投稿できることから,著名なファ
ウチョパンツ」に関してはアーリーマジョリティもし
ッションモデルから一般ユーザまで多くのユーザがフ
く は レ イ ト マ ジ ョ リ テ ィ で あ る と 考 え ら れ る . ァ ッ シ ョ ン に 関 す る 投 稿 を し て お り , 「 #fashion」 と
い う ハ ッ シ ュ タ グ の 付 い た 投 稿 は 2 億 5,000 万 件 を 超
え て い る .2 つ 目 の 理 由 は ,Instagram が 自 分 の フ ァ ッ
ションの記録として利用されていることである.
4.
提案手法
本研究では,従来の協調フィルタリングに,ユーザ
がアイテムに反応したタイミングと,ファッションの
トレンド性を加えて考慮した手法を 3 段階に分けて提
案する.
4.1.
ユーザの利用ハッシュタグを用いた協調
フィルタリング
本 説 で は ,ユ ー ザ の 利 用 ハ ッ シ ュ タ グ を 用 い た 協 調
フ ィ ル タ リ ン グ に つ い て 述 べ る . こ れ に よ り , SNS に
おけるファッション情報推薦を実現する.ここでは,
Instagram に 投 稿 さ れ た 記 事 を「 メ デ ィ ア 」と 表 現 し ,
図 2 「 #ガ ウ チ ョ パ ン ツ 」 の 投 稿 数 の 遷
移 と ユ ー ザ A, ユ ー ザ B の 投 稿 時 期
ハ ッ シ ュ タ グ 𝑔が 付 与 さ れ た メ デ ィ ア を 投 稿 す る こ と
り , 「 ユ ー ザ が フ ァ ッ シ ョ ン ア イ テ ム 𝑔に 反 応 す る 」
とは,
「 ユ ー ザ が Instagram に お い て ,ハ ッ シ ュ タ グ 𝑡を
別 の フ ァ ッ シ ョ ン ア イ テ ム「 つ ば 広 ハ ッ ト 」に つ い
利 用 す る 」 と い う こ と で あ る . を 「 𝑔の ハ ッ シ ュ タ グ を 利 用 す る 」 と 表 現 す る . つ ま
て も 同 様 に 検 討 す る . 図 3 に Instagram に お け る 「 #
本 手 法 で は ,フ ァ ッ シ ョ ン ア イ テ ム に 対 す る ユ ー ザ
つ ば 広 ハ ッ ト 」 の 投 稿 数 の 遷 移 と ユ ー ザ A, ユ ー ザ B
の興味を,ユーザが利用したハッシュタグに基づいて
の「 #つ ば 広 ハ ッ ト 」の 投 稿 時 期 を 表 し た グ ラ フ を 示 す .
推 定 す る . 以 下 の 2 つ の 手 順 を 行 う . 図 3 か ら ,「 #つ ば 広 ハ ッ ト 」に は ,大 き く 二 つ の ト レ
①
ユ ー ザ が 利 用 し た ハ ッ シ ュ タ グ に 基 づ い て ,シ ス
ンド波があることが分かる.二つ目のトレンド波につ
い て の み 考 慮 す る と , 「 #ガ ウ チ ョ パ ン ツ 」 同 様 に 「 #
テ ム 利 用 者 と 他 の ユ ー ザ 間 の 類 似 度 を 求 め る ②
① の 類 似 度 に 基 づ い て ,ハ ッ シ ュ タ グ の 推 薦 評 価
つば広ハット」においても,ユーザ A は比較的イノベ
ータもしくはアーリーアダプターの傾向があり,ユー
値 を 求 め る ま ず は ,ユ ー ザ が 利 用 し た ハ ッ シ ュ タ グ に 基 づ い て ,
ザ B はアーリーマジョリティもしくはレイトマジョリ
システム利用者と他のユーザ間の類似度を求める.本
テ ィ の 傾 向 が あ る と 言 え る だ ろ う . 手法では,類似度を求める方法として,コサイン距離
を 利 用 す る . い ま , ユ ー ザ 𝑎, 𝑏が 利 用 し た ハ ッ シ ュ タ グ ( 重 複 な
し )を 𝑀!! ,𝑀!! と し た と き ,ユ ー ザ 𝑎, 𝑏の 類 似 度 𝑠𝑖𝑚! (𝑎, 𝑏)
を 以 下 の 式 (1)で 定 義 す る . 𝑠𝑖𝑚! (𝑎, 𝑏) =
𝑀!! ∩ 𝑀!!
!
𝑀!!
!
𝑀!!
⋯ 1
ま た ,ユ ー ザ 𝑢の ハ ッ シ ュ タ グ 𝑔に 対 す る 評 価 値 の 予
測 値 pred! 𝑢, 𝑔 を 以 下 の 式 (2)に よ っ て 推 定 す る . pred! (𝑢, 𝑔) =
図 3 「 #つ ば 広 ハ ッ ト 」の 投 稿 数 の 遷 移 と
ユ ー ザ A, ユ ー ザ B の 投 稿 時 期
!
pref 𝑖, 𝑔 ∙ sim! 𝑢, 𝑖 ⋯ 2 こ こ で ,pref(𝑖, 𝑔)は ,ユ ー ザ 𝑖の ハ ッ シ ュ タ グ 𝑔に 対 す
る 評 価 値 を 表 す .本 研 究 で は ,ユ ー ザ 𝑖の ハ ッ シ ュ タ グ
以 上 の こ と か ら ,SNS も ,フ ァ ッ シ ョ ン ア イ テ ム の
𝑔に 対 す る 評 価 値 pref(𝑖, 𝑔)と し て ユ ー ザ 𝑖が ハ ッ シ ュ タ
トレンド性や,ユーザのトレンドに対する態度はユー
ザ に よ っ て 傾 向 が 存 在 す る 可 能 性 が あ る グ 𝑔の 利 用 頻 度 を 利 用 す る . 以 上 の 手 順 で ,ユ ー ザ が 未 使 用 の フ ァ ッ シ ョ ン ア イ
テムのハッシュタグに対する評価を推定し,評価値が
高いと推定されたファッションアイテムのハッシュタ
pred! (𝑢, 𝑔) =
グ を 推 薦 す る . 4.2.
同じハッシュタグを利用したユーザの時
間的距離を考慮した協調フィルタリング
本 説 で は ,同 じ ハ ッ シ ュ タ グ を 利 用 し た ユ ー ザ の 時
!
pref(𝑖, 𝑔) ∙ 𝑠𝑖𝑚! (𝑢, 𝑖) ⋯ 5
以上の手順で,ファッションアイテムのハッシュタグ
に対する評価を推定し,評価値が高いと推定されたフ
ァッションアイテムのハッシュタグを推薦する.
間的距離を考慮した協調フィルタリングについて述べ
る . こ れ に よ り , SNS に お け る ユ ー ザ が フ ァ ッ シ ョ ン
4.3.
アイテムに反応したタイミングを考慮したファッショ
ン 情 報 推 薦 を 実 現 す る . 以 下 の 3 つ の 手 順 を 行 う . ①
②
③
ユーザの時間的距離とハッシュタグのト
レンド性を考慮した協調フィルタリング
本 説 で は ,ユ ー ザ の 時 間 的 距 離 と ハ ッ シ ュ タ グ の ト
同じハッシュタグを利用したユーザ同士の時間
レンド性を考慮した協調フィルタリングについて述べ
的 距 離 を 求 め る る . こ れ に よ り , SNS に お け る ユ ー ザ が フ ァ ッ シ ョ ン
①の値を考慮した上でユーザ間の類似度を求め
アイテムに反応したタイミングとファッションアイテ
る ムのトレンド性の 2 つを考慮したファッション情報推
② の 類 似 度 に 基 づ い て ,未 使 用 の ハ ッ シ ュ タ グ の
薦を実現する.
評 価 値 を 推 定 す る ①
ハ ッ シ ュ タ グ の ト レ ン ド 性 を 求 め る ②
①の値を考慮した上でユーザ間の類似度を求め
ま ず ,同 じ ハ ッ シ ュ タ グ を 利 用 し た ユ ー ザ 同 士 の 時
間的距離を求める.同じハッシュタグを利用したユー
ザ 同 士 の 時 間 的 距 離 と は , ユ ー ザ 𝑎ユ ー ザ 𝑏が 同 じ ハ ッ
る ③
② の 類 似 度 に 基 づ い て ,未 使 用 の ハ ッ シ ュ タ グ の
シュタグを利用した場合における,それぞれのハッシ
ュ タ グ の 投 稿 時 刻 の 平 均 の 差 で あ る .投 稿 時 刻 は UNIX
時 間 を 利 用 す る . 評 価 値 を 推 定 す る ハ ッ シ ュ タ グ 𝑡の ト レ ン ド 性 は , ハ ッ シ ュ タ グ 𝑡の
2013 年 か ら 2015 年 の 3 年 間 の 月 ご と の 平 均 投 稿 数 か
あ る ハ ッ シ ュ タ グ 𝑔に 関 す る ユ ー ザ 𝑎, 𝑏の 時 間 的 距
離 𝑡𝑠𝑖𝑚(𝑎, 𝑏, 𝑔)を 以 下 の 式 (3)で 定 義 す る . ら,毎月の実際の投稿数を引いた分散値によって求め
る .図 4,5 に そ れ ぞ れ ,ト レ ン ド 性 の 高 い ア イ テ ム( ガ
ウ チ ョ パ ン ツ ),ト レ ン ド 性 の 低 い ア イ テ ム( ト レ ン チ
𝑡𝑠𝑖𝑚 𝑎, 𝑏, 𝑔 = 1 −
𝑎𝑣𝑔 𝑎, 𝑔 − 𝑎𝑣𝑔 𝑏, 𝑔
⋯ 3
365×24×60×60
コート)に関する投稿数のグラフを示す.横軸は投稿
月,縦軸は該当月のそれぞれのハッシュタグの投稿数
を 全 体 の 投 稿 数 で 割 る こ と で 正 規 化 し た も の で あ る . ここで,
図 が 示 す よ う に ,ト レ ン ド 性 の 低 い ア イ テ ム は ,平
𝑎𝑣𝑔 𝑢, 𝑔 =
𝑡∈𝑡𝑖𝑚𝑒(𝑢,𝑔) 𝑡
均投稿数と実際の投稿数のグラフがほとんど一致して
𝑡𝑖𝑚𝑒 𝑢, 𝑔
おり,分散値は小さくなる.その一方で,トレンド性
の高いアイテムは,平均投稿数と実際の投稿数との差
と す る . ま た , こ こ で , 𝑡𝑖𝑚𝑒 𝑢, 𝑔 は ユ ー ザ 𝑢が ハ ッ シ
ュ タ グ 𝑔を 投 稿 し た 時 刻 の 集 合 と す る .
が 大 き く , 分 散 値 は 大 き く な る . トレンド性 を考 慮 したユーザ𝑢のハッシュタグ𝑔に対 する評
次 に , 4.1 で 求 め た 提 案 手 法 1 に お け る ユ ー ザ 間 の
価 値 𝑝𝑟𝑒𝑑! 𝑢, 𝑔 を以 下 の式 (3)によって推 定 する.
類 似 度 𝑠𝑖𝑚! (𝑎, 𝑏)と ,上 記 の ユ ー ザ 𝑎, 𝑏の あ る ハ ッ シ ュ タ
グ 𝑔に 関 す る 時 間 的 距 離 𝑡𝑠𝑖𝑚(𝑎, 𝑏, 𝑔)を 用 い て , ユ ー ザ
𝑎, 𝑏の 類 似 度 𝑠𝑖𝑚! (𝑎, 𝑏, 𝑔)を 以 下 の 式 (4)で 定 義 す る .
𝑠𝑖𝑚! 𝑎, 𝑏 = 𝑠𝑖𝑚! (𝑎, 𝑏)
×
pred! 𝑢, 𝑔 =
!
pref 𝑖, 𝑔 ∙ 𝑠𝑖𝑚! 𝑢, 𝑖 ∙ 𝜎(𝑔) ⋯ 6
ここで,𝜎(𝑔)はタグ𝑔の投 稿 の各 月 ごとの標 準 偏 差 の平
!∈!!! ∩!!! 𝑡𝑠𝑖𝑚
𝑀!! ∩ 𝑀!!
𝑎, 𝑏, 𝑔
均 であり,タグのトレンド性 を表 す.トレンド性 が高 いほど大 き
⋯ 4
ま た ,ユーザ𝑢のハッシュタグ𝑔に対 する評 価 値 𝑝𝑟𝑒𝑑 𝑢, 𝑔
を以 下 の式 (5)によって推 定 する.
な値 になる.
れている点である.本研究では,ユーザがファッショ
トレンド性の高いアイテム
(ガウチョパンツ) ンアイテムに反応したタイミングに注目しており,フ
ァ ッ シ ョ ン 全 般 に 関 す る ハ ッ シ ュ タ グ で あ る「 #フ ァ ッ
ション」では,「あるファッションアイテムに興味が
0.03
月ごとの投稿数 あるだけなのか」,もしくは「あるファッションアイ
月ごとの平均値 テムを所持しており,着用したのか」などの判断を行
0.025
0.02
うのが困難であると考えたためである.以上の 2 点か
0.015
ら ,本 研 究 で 扱 う デ ー タ は「 #今 日 の コ ー デ 」と い う ハ
ッ シ ュ タ グ が 付 い た 投 稿 に 限 定 す る こ と に し た . 0.01
対 象 と し た デ ー タ は ,Instagram 上 で 2011 年 8 月 か
0.005
ら 2015 年 12 月 に か け て 投 稿 さ れ た 「 #今 日 の コ ー デ 」
201511
201509
201507
201505
201503
201411
201501
201409
201407
201405
201403
201311
201401
201309
201307
201305
201303
201301
0
と い う ハ ッ シ ュ タ グ が 付 随 し た 投 稿 約 25 万 件 の デ ー
タ で あ る . デ ー タ は , ユ ー ザ ID, 投 稿 ID, メ デ ィ ア ,
投 稿 時 刻 か ら 構 成 さ れ る . 図 4 ト レ ン ド 性 の 高 い ア イ テ ム の 投 稿 数 ユ ー ザ が 利 用 し た フ ァ ッ シ ョ ン ア イ テ ム に 関 す る ハ
ッ シ ュ タ グ と ,そ の 投 稿 時 刻 の デ ー タ を 利 用 す る た め ,
取得した投稿データに対してデータのクレンジングを
行う必要がある.データのクレンジングの処理は大き
く 3 段 階 に 分 け る 事 が で き る . トレンド性の低いアイテム
(トレンチコート)
①
メディア本文から,メディアに付随している
ハ ッ シ ュ タ グ の み の 抽 出 0.045
②
月ごとの投稿数 0.04
0.035
ファッションアイテムに無関係なハッシュタ
グ ( 不 要 な ハ ッ シ ュ タ グ ) の 排 除 月ごとの平均値 0.03
③
0.025
ハッシュタグの利用数(重複あり)が少ない
ユ ー ザ の 排 除 0.02
0.015
まず,メディア本文から,メディアに付随しているハ
0.01
ッシュタグのみを抽出する.本研究では,ユーザが利
0.005
用したファッションアイテムに関するハッシュタグと,
201511
201509
201507
201505
201503
201501
201411
201409
201407
201405
201403
201401
201311
201309
201307
201305
201303
201301
0
その投稿時刻のデータを利用するため,メディア本文
す べ て の 情 報 を 保 存 す る 必 要 は な い . 次 に , 不 要 な ハ ッ シ ュ タ グ を 排 除 し た . 不 要 な ハ ッ
図 5 ト レ ン ド 性 の 低 い ア イ テ ム の 投 稿 数 シ ュ タ グ と は ,フ ァ ッ シ ョ ン に 無 関 係 の ハ ッ シ ュ タ グ ,
文章のハッシュタグ,他言語によるハッシュタグ,ユ
ーザに利用された回数が 5 回以下のハッシュタグ,フ
5.
実験
提案手法の有効性を評価するために被験者実験を
行った.
ァッションブランドのハッシュタグなどである.ファ
ッ シ ョ ン ブ ラ ン ド は , Wikipedia の フ ァ ッ シ ョ ン ブ ラ
ン ド 一 覧 [10], フ ァ ッ シ ョ ン プ レ ス の フ ァ ッ シ ョ ン ブ
ラ ン ド 一 覧 [11]に あ る フ ァ ッ シ ョ ン ブ ラ ン ド と 一 致 す
5.1.
実験に使用するデータ
る も の を 排 除 し た . デ ー タ は , 約 24 万 件 と な り , 約
Instagram 社 が 提 供 し て い る InstagramAPI[9]を 利
22 万 件 あ っ た ハ ッ シ ュ タ グ の 種 類 は ,約 4,500 件 と な
用 し て , Instagram 内 の 投 稿 デ ー タ を 取 得 す る . 本 シ
っ た . ス テ ム で は ,デ ー タ と し て「 #今 日 の コ ー デ 」と い う ハ
次 に , ハ ッ シ ュ タ グ の 利 用 数 ( 重 複 な し ) が 少 な い
ッシュタグが付いた投稿のみを扱う.
「 #今 日 の コ ー デ 」
ユーザを排除する.ユーザの中には,ハッシュタグの
というハッシュタグに限定した理由としては 2 点ある.
利 用 数 ( 重 複 な し ) が 1 の ユ ー ザ も い れ ば , 300 の ユ
まず,主に日本で利用されているハッシュタグである
ーザもいる.本手法による推薦を行うにあたって,ハ
ことである.本研究では,日本におけるファッション
ッシュタグの利用数(重複なし)が少ないユーザは,
に注目しているため,日本で一般的に利用されている
推薦対象ユーザとの類似度を求めることができない可
ハッシュタグを利用する.次に,日記のように利用さ
能性が大きいため,不適切であると考えた.また,ハ
ッ シ ュ タ グ の 利 用 数( 重 複 な し )が 10 以 下 の ユ ー ザ は
平均適合率 10,298 人 中 7,895 人 も 存 在 し ,計 算 量 が 極 端 に 多 く な
0.25
っ て し ま う た め , 今 回 は 排 除 す る こ と と し た . *
0.2
5.2.
*
*
0.15
実験手法
0.1
提案手法の有効性を確かめるために,5 分割交差検
0.05
証による推定評価値の評価実験を行った.5 分割交差
0
検証では,推薦対象ユーザが利用したハッシュタグを
5 つに分割し,そのうちの 1 つを正解データ,残りを
訓練データとする.訓練データを使用して上記手法の
類似度計算・推薦を行い,得られた推薦結果と正解デ
* : p < 0.0 5
ータの適合率を求める.5 分割データのすべてが正解
図 7 実験結果
データとなるように,上記の作業を 5 回行い,平均適
合 率 か ら , 推 薦 精 度 を 確 か め る 手 法 で あ る [12]. 比 較 す る 手 法 は ,提 案 し た 3 つ の 手 法 と ,ハ ッ シ ュ
5.4.
考察
タグの利用ランキングによる推薦の 4 つである.推薦
上 記 の 実 験 の 考 察 を 以 下 に 示 す .3 つ の 提 案 手 法 の 平
対 象 と す る ユ ー ザ は , 2,404 人 の ユ ー ザ の 中 か ら ラ ン
均 適 合 率 は,ランキングによる推 薦 手 法 の平 均 適 合 率 より
ダ ム に 選 ん だ 15 人 で あ る .以 下 の 図 6 に 実 験 の 概 要 図
も高 くなった.また,ハッシュタグのみを利 用 した協 調 フィル
を 示 す . タリングよりも,ユーザ間 の時 間 的 距 離 を考 慮 した協 調 フィ
ルタリングの方 がより高 い適 合 率 を示 し,ユーザ間 の時 間 的
距 離 を考 慮 した協 調 フィルタリングよりも,ユーザ間 の時 間
的 距 離 とハッシュタグのトレンド性 のどちらも考 慮 した協 調 フ
ィルタリングの方 がより高 い適 合 率 を示 したことから,本 研 究
の目 的 である,SNS におけるより精 度 の高 いファッション情 報
の推 薦 が行 えたと考 えられる.
提 案 手 法 による,より精 度 の高 いファッション情 報 推 薦 を
実 現 するための今 後 の課 題 として,以 下 を挙 げる.
l
適 切 なデータの正 規 化
今 回 ,ファッションアイテムのトレンド性 を求 める際 に利 用 し
図 6 実 験 概 要 図 たデータは,Instagram 上 で 2011 年 8 月 か ら 2015 年 12
月 に か け て 投 稿 さ れ た「 #今 日 の コ ー デ 」と い う ハ ッ シ
5.3.
実験結果
ュ タ グ が 付 随 し た 投 稿 約 25 万 件 の デ ー タ を ク レ ン ジ
以下の図 7 に実験結果を示す.平均適合率はそれぞ
ン グ し た も の で あ る . ク レ ン ジ ン グ の 結 果 , 2013 年 1
れ , 0.189, 0.196, 0.213, 0.109 と な っ た . つ ま り ,
月 か ら 2015 年 12 月 ま で の 3 年 間 の デ ー タ を 扱 う こ と
100 個 中 そ れ ぞ れ ,約 18 個 ,約 19 個 ,約 21 個 ,約 10
と な っ た が , 2015 年 の 平 均 投 稿 数 が 14,267 件 , 2014
個正解となる結果であった.それぞれの手法について
年 の 平 均 投 稿 数 が 2,296 件 で あ る の に 対 し て ,2013 年
有意差があるかどうかを,t 検定で調べた結果,3つ
の 平 均 投 稿 数 は 57 件 で あ っ た .こ の こ と か ら ,正 規 化
の提案手法の間では有意差は見られなかったが,3つ
を 行 う 際 に 2013 年 の 投 稿 が ト レ ン ド 性 に 強 く 影 響 を
の提案手法とランキングによる推薦手法の間には有意
与えてしまったのではないかと考えられる.以下の表
差 が 見 ら れ た . 1 に本研究においてトレンド性が高いとされたアイテ
ム の 上 位 5 件 を 示 す . 1 オ ー バ ー オ ー ル 2 ギ ン ガ ム チ ェ ッ ク 3 ト ー ト バ ッ グ 4 タ イ ト ス カ ー ト 5 シ ョ ー パ ン 表 1 ト レ ン ド 性 が 高 か っ た ア イ テ ム 証 実 験 を通 して改 善 を行 っていく.
ま た ,図 8 に ト レ ン ド 性 が 一 番 高 い と さ れ た「 オ ー
バーオール」の投稿数の遷移(正規化済)を示す.
図 8 か ら , 2013 年 2 月 の 正 規 化 さ れ た 値 は 1 と な っ
て お り ,2013 年 2 月 に 投 稿 さ れ た ハ ッ シ ュ タ グ は「 オ
ーバーオール」の 1 件だけであったということが分
か る .ち な み に ,ハ ッ シ ュ タ グ 𝑔の あ る 月 の 投 稿 数 を
その月の全投稿数で割ることで正規化を行っている.
2013 年 の 投 稿 数 が あ ま り に も 少 な い た め ,2013 年 時
点で「オーバーオール」がトレンドアイテムであっ
たかどうか判断することは難しいのではないかと考
えた.ファッションアイテムの正しいトレンド性を
測るためにも,検証を通した適切なデータの正規化
を 行 う 必 要 が あ る . オーバーオール 1.2
1
0.8
0.6
0.4
0.2
0
月ごとの投稿数 201511
201509
201507
201505
201503
201411
201501
201409
201407
201405
201403
201311
201401
201309
201307
201305
201303
201301
月ごとの平均値 図 8 オーバーオールの投稿数の遷移
6.
まとめ
現 在 ,フ ァッシ ョン 情 報 は SNS や オ ン ライン シ ョップ な ど
様 々なインターネットメディアから得 ることができる.しかし,そ
の方 で莫 大 な情 報 の中 から自 分 にとって有 益 な情 報 を見
つ け る こ とが 困 難 とな っ た た め ,情 報 の 推 薦 が 重 要 とな っ て
いる.ファッションにおける推 薦 は「トレンド」が大 きく関 係 して
おり,ユーザによって「新 商 品 はすぐに購 入 する」「巷 で流 行
し て い る か ら 購 入 す る 」な ど , ト レ ン ド に 対 す る 態 度 が 異 な る .
しかし,従 来 の推 薦 手 法 の多 くでは,ユーザとアイテムとの
関 係 のみを考 慮 して,その時 間 的 な側 面 を考 慮 していない
ため,ファッションに関 する情 報 を適 切 に推 薦 できない場 合
がある.
そこで,本 研 究 では,ファッション投 稿 が活 発 な写 真 投
稿 型 SNS である Instagram を利 用 して,ユーザがファッショ
ンアイテムに反 応 したタイミングと,そのファッションアイテム
のトレンド性 注 目 することで,ユーザの「トレンドに対 する態
度 」を考 慮 した推 薦 手 法 を提 案 した.
実 験 の結 果 ,ユーザのトレンドに対 する態 度 を考 慮 した
提 案 手 法 は,従 来 手 法 よりも高 い推 薦 結 果 を示 した.今 後
の課 題 として,適 切 なデータの正 規 化 や,ユーザ間 の時 間
的 距 離 を 考 慮 した 類 似 度 計 算 手 法 の 妥 当 性 に つ い て ,検
7.
[1]
[2]
[3]
[4]
参考文献
Instagram, https://www.instagram.com/
Ameba, http://www.ameba.jp/
WEAR, http://wear.jp/
神 嶌 敏 弘 , ” 推 薦 シ ス テ ム の ア ル ゴ リ ズ ム ”,
http://www.kamishima.net/archive/recsysdoc.pdf,
2015.
[5] 古 川 忠 延 , 松 尾 豊 , 内 山 幸 樹 , 石 塚 満 , “嗜 好 の 遷
移 過 程 に 注 目 し た Web ア ル ゴ リ ズ ム の 提 案 ”,人 工
知 能 学 会 全 国 大 会 論 文 集 (CD-ROM), 2008
[6] 大 力 慶 祐 , 大 向 一 輝 , 武 田 英 明 , “ソ ー シ ャ ル ブ ッ
クマークにおけるイノベータに注目した情報推
薦 手 法 の 提 案 ”, 人 工 知 能 学 会 全 国 大 会 論 文 集
(CD-ROM), 2008.
[7] 川 前 徳 章 , 坂 野 鋭 , 山 田 武 士 , 上 田 修 功 “ユ ー ザ の
嗜好の時系列性と先行性に着目した協調フィル
タ リ ン グ ”,電 子 情 報 通 信 学 会 論 文 誌 , J92-D(6), pp.
767-776, 2009.
[8] E.M. Rogers, “The Free Press”, New York, 1995
[9] InstagramAPI, http://www.instagram.com/developer/
[10] Wikipedia 「 フ ァ ッ シ ョ ン ブ ラ ン ド 一 覧 」 ,
http://ja.wikipedia.org/wiki/ フ ァ ッ シ ョ ン ブ ラ ン ド
一覧
[11] FASHION PRESS「 フ ァ ッ シ ョ ン ブ ラ ン ド 一 覧 」 ,
http://www.fashion-press.net/brands/
[12] Fushiki T, “Estimation of prediction error by using
K-fold cross-validation”, statistics and computing,
(to appear)
Fly UP