...

オンラインショッピングサイトにおけるコーディネートの類似

by user

on
Category: Documents
0

views

Report

Comments

Transcript

オンラインショッピングサイトにおけるコーディネートの類似
言語処理学会 第20回年次大会 発表論文集 (2014年3月)
オンラインショッピングサイトにおけるコーディネートの類似度判定手法とその印象評価
1村上大志 2黒澤義明 2目良和也 2竹澤寿幸
1 広島市立大学情報科学部 2 広島市立大学大学院
1
はじめに
通信販売業界において,2012 年の 1 年間での
世帯購入率は 8 割,個人利用率は 6 割を超え,非
常に巨大な市場になってきている[1].2012 年に
おいてオンラインショッピングを利用して購入
された品目は,
「本・雑誌・コミック」,
「食料品・
飲料(アルコール類をのぞく)」に次いで「レディ
ースファッション・靴」が多い[2].また,オンラ
インショッピングに限らず,
通信販売により 2012
年に購入された商品は「婦人衣料品」の占める割
合が最も高い.
近年,ファッション関連のオンラインサイトで
は,商品を単体で販売するのみでなく,複数の写
真を組み合わせてコーディネートを作成し,販売
することで,購買者を増やす傾向がある.コーデ
ィネートを販売する際に重要になる要素は,コー
ディネート紹介写真や文中で印象や雰囲気を述
べている単語である.
本研究では,あるコーディネートを選択すると
類似したコーディネートを提案するシステムを
構築するための基礎情報の調査を行う.システム
の概要を図 1 に示す.このシステムは,企業側か
らは売り上げ向上,ユーザ側からは普段は着用し
ないコーディネートに気づくという利点がある.
図 1:システムの概要
関連研究
本章は,本研究に関連する研究について述べる.
2.1 ファションイメージキーワードに基づいた
コーディネートシステムの提案
神間ら[3]は,ファッションを記述する感性語と
して定義されているイメージキーワード()と「気
づき」の関係について調べた結果,イメージキー
2
情報科学研究科
ワードがコーディネートの推薦に有用であるこ
とを示している.
本研究では,着用アイテムに属性辞書を用いて,
自動でタグ付けを行い属性を付与し,その属性を
基に類似度を求める.
2.2 ファッション雑誌を用いたファッション推
薦システム
岩田ら[4]は,雑誌の写真画像から,コーディネ
ートに関する情報を自動抽出し,抽出した上下の
衣服領域の類似度に基づく手法とトピックモデ
ルに基づく手法を用いて,コーディネートを推薦
するシステムを提案している.
本研究では,コーディネートの画像情報ではな
く,画像に付与されている着用アイテムの情報や
紹介文中の特徴語を用いる.
2.3 服の着用経験に基づき服自身がコーディネ
ートを推薦するシステム
福田ら[5]は,ユーザがその日の気分を色に変換
し,システムから提示されたカラーパレットから
選択する.選択された色のイメージに最も近い服
が推薦され,そこから得ることが出来る情報を蓄
積し,その情報を用いて推薦を行う.
本研究では,色情報ではなく,画像に付与され
ている着用アイテムの情報や紹介文中の特徴語
を用いる.
3 提案手法
本研究で対象とするデータは,オンラインショ
ッピングサイト内にあるコーディネート紹介ペ
ージに付与されている着用アイテムの情報,およ
びコーディネート紹介文である.本研究で対象と
するデータを図 2 に示す.
本研究における提案手法を以下に 3 つ示す.な
お,アイテムタグ手法と全タグ手法に対し,属性
辞書を用いて着用アイテム名に自動でタグ付け
を行う.
 アイテムタグ手法:アイテムのタグのみを用
いて類似度を求める手法
 全タグ手法:全てのタグを用いて類似度を求
める手法
 特徴語手法:コーディネート紹介文中の特徴
語を用いる手法
― 282 ―
Copyright(C) 2014 The Association for Natural Language Processing.
All Rights Reserved. 図 2:本研究で対象とするアパレルサイトの典型例
属性辞書はアパレル関連の書籍[6][7][8]および
テムタグ手法では,収集したタグの種類が 43 種
ファッション用語辞典 apparel-fashion wiki[9]を
類と少なかったためと考えられる.コーディネー
基に作成し,色,ディテール,アイテム,素材,
トの上位 10 件を表 2 に示す.
柄,シルエット,技術,国名,人物名,サイズ,
表 2:コーディネートの上位 10 件
小ささ,トレンド,その他,不明,不必要の 15
コーディネート
件数(件)
種類である.タグ付けの流れを図 3 に示す.
ワンピース
85
3.1 アイテムタグ手法
トップス
パンツ
55
アイテムタグ手法では,タグ付けされた着用ア
イテムのアイテム(最後の部分)のタグからコサイ
トップス
スカート
51
ン類似度を求める.属性として収集したタグは 43
プルオーバー
スカート
42
種類であった.また,各コーディネートの平均タ
ジャケット
ワンピース
35
グ数は,1.96 であった.収集したタグの一部を表
1 に示す.
プルオーバー
パンツ
31
表 1:収集したタグ
カーディガン ワンピース
31
T シャツ
コンビネゾン
スタジャン
T シャツ
パンツ
26
トップス
ブラウス
アウター
カーディガン
ニット
ガウン
スカート
26
プルオーバー
V チュニック
ショート
T シャツ
スカート
24
パンツ
シャツ
キュロット
アイテムタグ手法で得られたコーディネート
アイテムタグ手法では,類似度を基に提案でき
の組み合わせは全 241 種類であった.しかし,ト
るコーディネートの量が多いのでユーザにとっ
ップスとパンツの組み合わせのコーディネート
て有用ではない.よって,本研究では全タグ手法
が 55 件,トップスとスカートの組み合わせのコ
および特徴語手法を用いて,実験,考察を行う.
ーディネートが 51 件と 1 つのコーディネートに
属している数が非常に多くなった.これは,アイ
図 3:タグ付けの流れ
― 283 ―
Copyright(C) 2014 The Association for Natural Language Processing.
All Rights Reserved. 3.2 全タグ手法
全タグ手法では,タグ付けされた着用アイテム
の全てのタグからコサイン類似度を求める.属性
として収集したタグは 637 種類であった.収集し
たタグの一部を表 3 に,コーディネートの平均タ
グ数を表 4 に示す.表 3 の着用アイテム数とは,
各コーディネートに付与されているアイテムの
数である.着用アイテム数 2 の平均タグ数 9.34
は類似度が 0.5 の場合,4~5 個のタグが一致して
いることを示す.
表 3:収集したタグ
ジャンクフード マルチカラー
アウター
ピーナッツ
サテン
カフス
T シャツ
リブ
ビジュー衿
後ろリボン
ノーカラー
ガウン
表 4:コーディネートの平均タグ数
着用アイテム数
平均タグ数
1
4.66
2
9.34
3
13.19
4
17.86
全コーディネート
9.01
3.3 特徴語手法
特徴語手法では,コーディネート紹介文中の特
徴語を用いる.特徴語とは,コーディネート紹介
文から形態素解析を行った解析結果の中から形
容詞 179 種類を用いて,
「Yahoo!知恵袋データ(第
2 版)」から各単語の出現率の比を求め,ファッシ
ョンに関連する形容詞である.以下に出現率の比
の式(1)を示す.
「カテゴリ− ~− ファッション− 」内での単語の出現率
出現率の比=
それ以外のカテゴリ内での単語の出現率
(1)
なお今回は,全タグ手法,特徴語手法の比較の
ため,両条件で提案コーディネートが変化するよ
う,重みの設定を行った.以下に重みの計算式(2)
を示す.
重み = 1⁄
(2)
(各コーディネートの特徴語の出現頻度の和)3
4 印象評価
4.1 使用データ
使用データは特徴語が 2 単語以上出現し着用ア
イテムの情報が上半身,下半身 1 つずつの計 2 つ
存在しているコーディネート対を選んだ.総数は
348 件であった.
4.2 評価方法
評価サイトを用いて,前述の 348 件が似ている
かどうかの印象評価を行った.被験者は 5 人の女
子大学生であった.評価サイトの例を図 4 に示す.
図 4:評価用サイトの例
4.3 評価結果
評価結果を表 3 に示す.なお,評価値は 7 段階
評価で,「1:非常に似ている,2:似ている,3:
やや似ている,4:どちらでもない,5:やや似て
いない,6:似ていない,7:非常に似ていない」
に設定した.7 段階に設定した理由は,評価値を
ばらつかせて,より詳細な評価を得るためである.
表 3 の S とは,被験者のことを示す.
表 3:評価結果
S1
S2
S3
上式に基づき,全タグ手法で求めたコサイン類
似度の値に重みをかけ,特徴語手法の値とした.
全タグ手法上位 100 件と特徴語手法 100 件を比較
すると,特徴語手法の上位 100 件に含まれ,かつ
全タグ手法と異なるコーディネート対は 36 件で
あった.本研究では,特にこの 36 件(全-特手法)
について考察を行う.
S4
S5
― 284 ―
0%
50%
評価値1
評価値2
評価値3
評価値5
評価値6
評価値7
100%
評価値4
Copyright(C) 2014 The Association for Natural Language Processing.
All Rights Reserved. 5
考察
全タグ手法の上位 100 件と特徴語手法の上位
100 件,3.3 節の 36 件を比較し,似ていると評価
された結果を表 5 に示す.表 4 の括弧内は件数を
表し,
比率は全タグ手法,
特徴語手法は 100 件で,
全-特手法は 36 件で件数を割った値である.
表 5:似ていると評価された件数および比率
全タグ手法
特徴語手法
全-特手法
1人
以上
0.83
(83)
0.78
(78)
0.72
(26)
2人
以上
0.55
(55)
0.52
(52)
0.39
(14)
3人
以上
0.36
(36)
0.33
(33)
0.22
(8)
4人
以上
0.18
(18)
0.14
(14)
0.08
(3)
5人
0.06
(6)
0.06
(6)
0.06
(2)
全タグ手法では似ていないとされていたコー
ディネート対 36 件に対して,特徴語手法では 5
人の内 1 人以上が似ていると評価したコーディネ
ート対が 26 件発見された.したがって,本研究
の特徴語手法は有用であったと言える.
また,全タグ手法で求めたコサイン類似度の値
の高い上位 5 件について表 6 に示す.ここでの評
価値は,
「1:似ている,2:似ていない」を示す.
表 6: 全タグ手法で値の高い上位 5 件
類似度
評価値
0.625
1
0.589
1
0.572
1
0.556
2
7
今後の課題
今後の課題としては,より多くの画像を用いて,
同様の実験を行うことや特徴語を形容詞,形容動
詞と限定せず,その他の自立語やオノマトペで実
験し結果が異なるか考察する必要がある.
謝辞
この研究の一部は,広島市立大学特定研究費
(一般研究平成 24 年度~)の補助を得ている.
また,本研究の実施に際し,ヤフー株式会社から
国立研究所に提供された「Yahoo!知恵袋データ(第
2 版)」を利用している.
参考文献
[1] 公益社団法人 日本通信販売協会,
“第 20 回全
国通信販売利用実態調査報告書”,2013.
[2] 公益社団法人 日本通信販売協会,
“第 5 回イ
ンターネット通信販売利用実態調査報告”,2013.
[3] 神間唯,丸谷宜史,梶田将司,間瀬健二:
“フ
ァッションイメージキーワードに基づいたコー
ディネートシステムの提案”, 情報処理学会研究
報告,HCI,ヒューマンコンピュータインタラク
ション研究会報告,pp.1-7,2011.
[4] 岩田具治,渡部晋治,澤田宏:
“ファッション
雑誌を用いたコーディネート推薦システム”,情
報 科 学 技 術 フ ォ ー ラ ム 講 演 論 文 集 9(3) ,
pp.179-180, 2010.
[5] 福田未央,仲谷義雄:
“服の着用経験に基づき
服自身がコーディネートを推薦するシステム”,
情 報 処 理 学 会 全 国 大 会 講 演 論 文 集 2011(1) ,
pp.161-163,2011.
[6] 富田明美,“アパレル構成学 着やすさと美し
さを求めて”
,朝倉出版,2004.
[7] 飯塚弘子,内田八重子,香川幸子,
“服装デザ
イン論”
,文化出版局,1985.
[8] 小林茂雄,“装いの心理 服飾心理学へのプロ
ムナード”,アイ・ケイコーポレーション,2003.
[9] ファッション用語辞典 apparel-fashion wiki,
0.510
2
表 5 より全タグ手法では高い値を示し,似てい
るとされていたコーディネートでも,印象評価で
は似ていないと評価されることがある.よって,
全タグ手法での値が高いという理由だけで,コー
ディネートを提案することは妥当ではない.
http://apparelwiki.symphonic-net.com/.
6 おわりに
本研究では,特徴語手法を用いて印象評価を行
い,全タグ手法との比較,考察を行った.考察の
結果,全タグ手法の値のみでコーディネートを提
案することは妥当ではないことがわかった.また,
特徴語手法を用いると,全タグ手法では似ていな
いとされていたのに対し,似ていると評価された
コーディネートが 26 件発見された.よって,特
徴語手法が有用であることがわかった.
― 285 ―
Copyright(C) 2014 The Association for Natural Language Processing.
All Rights Reserved. 
Fly UP