...

ECサイトにおけるCRM推進システムの開発

by user

on
Category: Documents
5

views

Report

Comments

Transcript

ECサイトにおけるCRM推進システムの開発
筑波大学大学院博士課程
システム情報工学研究科修士論文
EC サイトにおける CRM 推進システムの開発
菅谷 健人
(社会システム工学専攻)
指導教員 住田 潮
2008 年 3 月
概要
情報技術の発達により不特定多数を対象に情報の受発信を低コストかつ簡単に行えるよう
になった. その結果, インターネットを通して得られる経済活動に大きな影響を及ぼし, 市場
の拡大から Web 上のデータ分析にデータマイニングを適用する Web マイニングに注目が集
まっている.
サイト経営者側の観点から Web での有料施策の費用対効果を図る指標としてコンバージョ
ンがある. コンバージョンとは訪問者がアクションを起こして「何らかの結果」に繋がった
瞬間のことを指す. 例えば Web 広告からやってきた来訪者が資料請求や商品購買等の行動を
行うことにより, 「閲覧者」から顧客に変わる瞬間である. EC サイトを運営する経営者とし
ては, 如何にして閲覧者を効率的にコンバージョンまで誘導するかが重要となっている. 膨大
な量のユーザーの行動を把握することは困難であり実際にコンバージョンまで行きつくユー
ザーはほとんどいない. 本研究ではユーザーがサイトに訪問して早期に優良顧客か否かを判別
することで, どのようなプロモーションを行えば購買に結び付くかを提言する.
本論文では, Web サイトを閲覧する顧客をリアルタイムで優良顧客か否かを判別して, サイ
ト管理者が見せたい情報を与えてコンバージョンに結びつけることを目的とする「CRM 推進
システム」の開発を行った. CRM 推進システムの要諦は閲覧顧客毎のクラスの特性を把握す
ることにあり, 分析はミクロ・マクロ両視点から行う. ミクロ分析ではクラスのアップグレー
ドの促進を図る為に, 各顧客クラスにおけるパス経路の特性パターン分析を行い, マクロ分析
ではアップグレード過程のスピードアップを図る為に推移確率行列の感度分析により全体の
ユーザーの行動を捉えて顧客特性に即した情報発信を行う.
目次
第1章
1.1
1.2
1.3
1.4
序論
背景 . . . . . . . . . . . .
目的 . . . . . . . . . . . .
CRM 推進システム . . .
論文構成 . . . . . . . . . .
.
.
.
.
1
1
1
2
3
.
.
.
.
4
4
4
6
8
.
.
.
.
.
.
11
11
12
13
15
16
18
テストデータによる検証
学習データ期間の決定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ミクロ分析による特性パターンの抽出と顧客クラス判別 . . . . . . . . . . . .
マクロ分析による感度分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
22
23
28
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
第 2 章 アクセスログデータを用いた CRM 推進システムの開発
2.1 データ概要 . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 対象データ . . . . . . . . . . . . . . . . . . . . .
2.1.2 サイト訪問顧客とサイト URL のカテゴリ分類 . .
2.1.3 データ基礎分析 . . . . . . . . . . . . . . . . . . .
第3章
3.1
3.2
3.3
3.4
第4章
4.1
4.2
4.3
アクセスログデータを用いた CRM 推進システムの開発
先行研究 . . . . . . . . . . . . . . . . . . . . . . . . . . .
CRM 推進システムの開発 . . . . . . . . . . . . . . . . .
ミクロ分析によるクラスアップグレードの促進 . . . . . .
3.3.1 各段階におけるパス経路の特性パターン分析 . . .
3.3.2 最適パラメータの特定 . . . . . . . . . . . . . . .
マクロ分析によるクラスアップグレードの促進 . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
第 5 章 結論
33
参考文献
34
謝辞
35
付 録A
36
i
図目次
1.1
1.2
顧客毎のプロモーション . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
CRM 推進システムの概念図 . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
3
2.1
2.2
2.3
時間帯別 PV 数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
曜日別 PV 分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
参照ソースの内訳 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
9
9
3.1
X 社におけるユーザーのクラス . . . . . . . . . . . . . . . . . . . . . . . . .
12
4.1
平均の差の割合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
A.1
A.2
A.3
A.4
A.5
A.6
A.7
クラス別 PV 数 . . . .
クラス別アクセス数 .
直帰ユーザーの割合 .
C1 アクセスランキング
C2 アクセスランキング
C3 アクセスランキング
C4 アクセスランキング
44
44
44
45
45
45
45
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
表目次
2.1
2.2
2.3
2.4
2.5
2.6
X 社サイトの商品カテゴリ . .
アクセスログデータ属性 . . .
サイト訪問者のクラス分類 . .
大カテゴリ ID と大カテゴリ名
学習データ . . . . . . . . . .
テストデータ . . . . . . . . .
.
.
.
.
.
.
4
5
6
7
10
10
3.1
3.2
判別表の集計表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
第一種の過誤と第二種の過誤 . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
18
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
4.14
4.15
C1 Stage における判別結果と C1 Stage におけるパラメータセット .
C1 Stage における Present C1 クラスの UCP と Upgrade の UCP . .
C2 Stage における判別結果 と C2 Stage におけるパラメータセット
C2 Stage における Present C2 クラスの UCP と Upgrade の UCP . .
C3 Stage における判別結果と C3 Stage におけるパラメータセット .
C3 Stage における Present C3 クラスの UCP と Upgrade の UCP . .
C4 Stage における判別結果と C4 Stage におけるパラメータセット .
C4 Stage における Present C4 クラスの UCP と OUT の UCP . . . .
山本 [3] の C1 stage における判別結果 . . . . . . . . . . . . . . . . . .
山本 [3] の C2 stage における判別結果 . . . . . . . . . . . . . . . . . .
山本 [3] の C3 stage における判別結果 . . . . . . . . . . . . . . . . . .
山本 [3] の C4 stage における判別結果 . . . . . . . . . . . . . . . . . .
感度分析を実行する前の行列 V . . . . . . . . . . . . . . . . . . . . .
γk = 0.1 で感度分析 1 を実行した後の行列 V . . . . . . . . . . . . . .
感度分析 2 を実行した行列後の V . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A.1 カテゴリリスト (1) . . . . . . . . . . . . . . . .
A.2 カテゴリリスト (2) . . . . . . . . . . . . . . . .
A.3 カテゴリリスト (3) . . . . . . . . . . . . . . . .
A.4 カテゴリリスト (4) . . . . . . . . . . . . . . . .
A.5 カテゴリリスト (5) . . . . . . . . . . . . . . . .
A.6 カテゴリリスト (6) . . . . . . . . . . . . . . . .
A.7 カテゴリリスト (7) . . . . . . . . . . . . . . . .
A.8 C2 Stage での振り分けを改良する前の判別結果
A.9 ξ = 0.05 で感度分析 2 を実行した行列後の V . .
A.10 ξ = 0.2 で感度分析 2 を実行した行列後の V . . .
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
24
24
25
25
26
26
27
27
27
27
27
29
30
31
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
36
37
38
39
40
41
42
42
43
43
第1章
1.1
序論
背景
IT(情報技術) の発達により不特定多数を対象に情報の受発信を低コストかつ簡単に行える
ようになり, 高速ネットワークの整備により世界中どこからでもインターネット接続が可能
となっている. ネットワークが接続されている場所であれば, 好きな時に商品・サービスやそ
の価格情報を収集することができる. その結果, 経済活動に大きな影響を及ぼしている. ユー
ザーが求める商品・サービスをインターネット上で探すことは時間の効率化や検索コスト削
減に繋がり, 電子商取引は物理的な取引コストも減少させる. 店舗を設立する為の初期投資も
少ないことから, E-コマース (EC) を行う企業も増え続けている.
日本における 2006 年の B to C での電子商取引の市場規模は, 4 兆 3910 億円であり, 2005
年と比較して 27. 1%増加した [1]. 電子商取引市場の拡大から, Web 上におけるユーザーの購
買行動に注目が集まっている. POS データに代表されるような実際の店舗においては, 購買品
目や購買金額等がデータとして記録される. これに対してインターネット上の店舗ではアクセ
スログデータから顧客の購買前のユーザーの閲覧履歴を得ることができる. この膨大なデータ
からサイト内を行動するユーザーのアクセス解析が可能となったことで, 従来の購買データに
基づくマーケティング手法とは異なる, 新たな e-マーケティング時代が到来したと言える.
1.2
目的
このような市場の拡大から Web 上のデータ分析にデータマイニングを適用する Web マイニ
ングに注目が集まっている. Web アクセスログやリンクの解析を行うことでユーザーの Web
上の動きを捉え. アクセス経路に基づく新しい Web サービスやサイト構造を提案する研究が
為されている.
従来行われてきた研究はインターネットユーザーの一般的な行動の抽出や, 類似した動きの
ユーザーの興味や目的を発見してきた. しかしながら, 閲覧顧客をリアルタイムに判別してサ
イトにアクセスしている最中に顧客特性によってアプローチする研究は多く存在しない.
サイト経営者側の観点から Web での有料施策の費用対効果を図る指標としてコンバージョ
ンがある. コンバージョンとは訪問者がアクションを起こして「何らかの結果」に繋がった
瞬間のことを指す. 例えば Web 広告からやってきた来訪者が資料請求や商品購買等の行動を
行うことにより, 「閲覧者」から顧客に変わる瞬間である. EC サイトを運営する経営者とし
ては, 如何にして閲覧者を効率的にコンバージョンまで誘導するかが重要となる. 膨大な量の
ユーザーの行動を把握することは困難であり, 実際にコンバージョンまで行きつくユーザーは
ほとんどいない. 本研究ではユーザーがサイトに訪問して早期に優良顧客か否かを判別して,
どのようなプロモーションを行えば購買に結び付くかを提言する.
1
1.3
CRM 推進システム
CRM(Customer Rerationship Management) 推進システムとは, Web サイトを閲覧する顧
客をリアルタイムで判別して, 既存のリコメンデーションシステムに見られる商品推奨あるい
は付随情報の機能を包括し, 更にサイト管理者が見せたい情報を与えてコンバージョンに結び
つけることを目的とするシステムである. CRM 推進システムは以下の二段階で構成される.
第一段階では, 先ず全てのページを M 個のカテゴリに分類する. これは Web サイトのペー
ジ数が非常に多過ぎる為に, ユーザーの閲覧パターンの特徴を掴み難いこと, 顧客クラスをリ
アルタイムで判別する際に膨大な計算時間が掛かってしまうことによる. 次に, 顧客のリファ
ラ URL・リクエスト URL・検索ワード等のアクセスログデータから特性パターンに基づいて
サイト訪問顧客を異なるクラスに類型化する. すわなちサイトの訪問顧客を重要度別に N 個
(C1, C2, C3, · · · , CN) のクラスに分類する.
第二段階では, 第一段階の判別結果に基づいて, 購買に繋がりやすいと考えられる閲覧者を
サイト管理者が見せたいページに誘導する. 更に, 持続的なデータで実験・検証を行うことに
より, CRM 推進システムを導入して売上増大の効果測定を行う. 各顧客クラスの特性を把握
図 1.1: 顧客毎のプロモーション
し, クラスのアップグレードの促進・アップグレード過程のスピードアップを行う必要がある.
アップグレードするユーザーの特性を捉え, またサイトを閲覧したが何もアクションを起こさ
ずに離脱してしまうのかを把握して適切なプロモーションを行う. 最重要クラスである CN 顧
客に対しては繰り返し購買を促進する等, Lifetime Value の最大化を目的とし, 一度掴んだら
顧客を逃さない CRM 推進システムを目指す.
本分析はミクロ・マクロ両方の視点から顧客を捉える. ミクロ分析として各クラスのトラン
ザクションを解析し, クラスのアップグレードの促進を図る為にマクロ分析を行う. 離散時間
マルコフモデルを用いることで感度分析を行い, 全体のユーザーの行動を捉えることが可能と
なる. 以上の分析から顧客特性に即した情報発信を行う.
2
図 1.2: CRM 推進システムの概念図
1.4
論文構成
本論文は全 5 章で構成される. 序論では本研究の背景・目的, 開発した CRM 推進システム
の概要について述べた. 第 2 章ではシステム開発の為に用いたデータの概要, Web ページのカ
テゴリ化や閲覧者のクラス分けについて述べる. 第 3 章では CRM 推進システム開発アルゴリ
ズムを述べる. テストデータを用いた検証を第 4 章で行い, 本研究における成果と結論及び課
題を第 5 章にまとめる.
3
第2章
2.1
アクセスログデータを用いた CRM 推
進システムの開発
データ概要
2.1.1
対象データ
分析対象データは株式会社 環から提供された, X 社が運営しているサイトのアクセスログ
データである. サイトの内容は健康食品の宅配サービスの紹介・販促である. サービスの特徴
として, 正会員になる前に必ず仮入会をしなければならない. 4 週間のお試しサービス (仮入
会) を経て「サービスの継続」か「サービスの停止」を選択する. 資料請求を行った場合には
送付された資料に X 社のサービスの説明とお試しサービス入会案内が記載されており, 紙の
上でもお試しサービス入会を行うことができる. また, 会員になると ID とパスワードが与え
られ, 会員専用のページにログインすることができる. 商品は定期品と注文品に大きく分かれ,
定期品は数種類の野菜と果物, 卵を組み合わせた 1 週間分の野菜セット定期品 (1) と, 米・乳
製品等の商品の定期品 (2) がある. 登録・注文した商品が定期的に宅配される仕組みとなる.
商品のタイプを表 2.1 に示す. 会員は定期品 (1) を必ず登録しなければならない. 会員専用
ページでは「注文商品の変更」や「定期注文の停止」等ができる. 定期品 (2), 注文品はオプ
ション品となる. 注文品には約 4,000 アイテムの中から必要なものをカタログから注文する注
文品 (1), 毎週や月 2 回といったサイクルを選択する注文品 (2), 夏冬年 2 回発行のギフトカタ
ログから選択する注文品 (3) 等がある.
商品カテゴリ
定期品
定期品
注文品
注文品
(1)
(2)
(1)
(2)
注文品
表 2.1: X 社サイトの商品カテゴリ
内容
~ 種類の野菜と果物 たまごを組み合わせた 週間分の野菜セット
米や食パン 牛乳 豆腐等の商品
約
アイテムの中から必要なものをカタログから注文する商品
1回の登録で一定期間 継続して届けする形式
毎週や月 回等のサイクルを選択する
夏冬年 回発行のギフトカタログから選択する
7
12
,
,
1
,
4, 000
,
.
2
(3)
2
Web サイトにアクセスしたとき, ユーザー (クライアント) のブラウザと Web サーバーとの
やり取りは全て Web サーバーにアクセスログデータとして記録される. ユーザーのやり取り
によりどこのページからどのページへジャンプし, いつ, どのくらい閲覧したか等の情報が記
録される. 本研究で用いたアクセスログデータの詳細を表 2.2 に記載する. アクセスログデー
タはデータを取る形式によって形が変わってくる. 従って本研究で使用したアクセスログデー
4
タについて必要なものには説明を加えた.
表 2.2: アクセスログデータ属性
年
月
日
曜日
時
分
秒
IP アドレス
ポート
ホスト名
ユーザエージェント リクエスト URL リファラ URL ユーザーID セッション ID
UNIX 時間
検索ワード 検索エンジン リスティング
• IP アドレスとはインターネットやイントラネット等の IP ネットワークに接続されたコ
ンピュータや通信機器 1 台 1 台に割り振られた識別番号を指す.
• ポートとはインターネット上の通信において, 複数の相手と同時に接続を行なう為に IP
アドレスの下に設けられたサブアドレスである.
• ホスト名とはユーザーがアクセスした際に利用したネットワークで使われている識別名
で, 一般的にプロバイダ名称や企業ドメイン名等である.
• ユーザエージェントとは Internet Explorer や Opera 等, 一般的には Web ブラウザの名
称を指す.
• リクエスト URL とはアクセスしたユーザーが現在閲覧しているページの URL を指す.
• リファラ URL とはアクセスしたユーザーが現在閲覧しているページの前に閲覧したペー
ジの URL を指す.
• ユーザー ID とは各ブラウザに個々に付与された ID であり, 90 日以上アクセスの無い
場合や, ブラウザの「Cookie を破棄」を行った場合はユーザー ID が異なるものになる.
• セッション ID とは各ブラウザの起動毎に振られる ID であり, ブラウザを閉じると破棄
される. ここで「セッション」とはユーザーのアクセスの基本単位を表し, 各ブラウザ
の起動からブラウザを閉じる迄の一連の行動をまとめたものを指す.
• UNIX 時間 とは 1970 年 1 月 1 日からアクセスを記録した時間まで経過した時間を秒で
表したものである.
• 検索エンジンとはサイトアクセスの際に利用された検索エンジン名であり対象は Yahoo・
Google 等の 8 種である.
• リスティングとはユーザーが「リスティング広告」といわれる検索エンジン連動型広告
を利用した場合に記載され, 対象は「Overture」と「Google Adwords」の 2 種である.
• キーワードとはユーザーが検索エンジンからアクセスした際に入力した語句を指す.
5
2.1.2
サイト訪問顧客とサイト URL のカテゴリ分類
サイトを訪問する顧客をいくつかのクラスに分類する. それぞれに異なる情報を与える為,
1.3 節の議論に基づいて訪問顧客を下記の 4 クラスに分類した.
クラス
C1
C2
C3
C4
C4-Present
C4-OUT
表 2.3: サイト訪問者のクラス分類
クラスの定義
サイトを閲覧したものの, 資料請求やお試し会員サービスへの登録
を未だしていない閲覧者層
資料請求・お問い合わせをしたものの, 未だお試し入会を
行なっていない閲覧者層
4 週間のお試し入会をしたものの, 未だ会員メニューでコンバージ
ョンをしていない閲覧者層
メンバーズサイトにアクセスすることができる閲覧者層
お休み受付をコンバージョンした後, 再びサイトに戻ってこなかっ
た閲覧者層
ここで特筆すべきことは, サイトの特性上顧客が所属するクラスがアップグレードしていく
ということである. サイトを初めて訪問したユーザーがお試し入会を経て, その後正会員にな
ることは宅配サービスを長期に渡って利用する重要顧客に繋がることを表している. すわなち,
顧客の重要度は C1 → C2 → C3 → C4 の順に高くなる. これを以後「クラスのアップグレー
ド」と呼ぶことにする. 本論文では, 同一のユーザーがある時点で所属するクラスを「Stage」
として表しているが詳細は 3.2 節で述べる.
前述したように, データ解析の便宜上, ページの内容に基づいて X 社のサイトの全ペー
ジ (1000 以上) をカテゴリ化した. カテゴリを大・中・小の 3 種類に分類し, カテゴリ ID を
P030101(大カテゴリ:P03[商品情報] − 中カテゴリ:P0301[定期品 (1) 案内情報] − 小カテゴ
リ:P030101[定期品 (1) 案内一覧]) というように, ”P”に続いて大カテゴリは 2 桁, 中カテゴリ
は 4 桁, 小カテゴリは 6 桁の数字で表わすものとする. その結果, カテゴリ数は大カテゴリが
12, 中カテゴリが 64, 小カテゴリが 127 となった. 具体的に大カテゴリを表 2.4 にまとめる. 中
カテゴリ・小カテゴリは付録に載せる. X 社のサイトでは全部で 13 種類のコンバージョンが
存在する. その 13 種類全てのページにおいて, 住所・氏名等の入力フォームを記入した後に
記入した情報が正しいかを確認する画面が現れ, それで決定した場合, 送信完了画面が現れる.
入力フォームを記入しながら別のブラウザを立ち上げ, サイトを並列しながら閲覧する場合ア
クセスログデータの記録には「入力フォーム」,「入力内容確認」,「送信完了」が必ずしも連
続して記録されないことに注意して置く.
従って本論文におけるコンバージョンとは,
「入力フォーム ⇒ 入力内容確認 ⇒ 送信完了」
の順にアクセスパターンのプロセスを経たものと定義する.
コンバージョンを大きく分類すると (1) 非会員から非会員へのコンバージョン (2) 非会員
から会員へのコンバージョン (3) 会員から会員のコンバージョンの 3 つに大別される. (1) は
P1101(資料請求・問い合わせ−入力フォーム)→ P1102(資料請求・問い合わせ−入力確認)
→ P1103(資料請求・問い合わせ−送信完了) と資料請求あるいは問い合わせを行った際の, こ
のコンバージョンでは会員になることはない. (2) は P1001(お試しサービス入会−入力フォー
6
ム) → P1003(お試しサービス入会−入力確認)→ P1004(お試しサービス入会−送信完了) を
経て, 且つユーザーがサービスを申し込むことにより非会員から会員になる.
(3) は大カテゴリで P06・P07・P08・P09 であり, (1), (2) と同様に入力フォーム・入力内容確
認・送信完了の順になる. それぞれ中カテゴリで P0601(友人紹介−入力フォーム)→ P0602(友
人紹介−入力確認)→ P0603(友人紹介−送信完了)という形になる. P06 の他のコンバージョ
ン (+)・P07 以降も同様なので省略する.
大カテゴリ ID
P01
P02
P03
P04
P05
P06
P07
P08
P09
P10
P11
P12
表 2.4: 大カテゴリ ID と大カテゴリ名
大カテゴリ名
TOP ページ
基本情報
商品情報
マーケティング
内容
トップページ
会社の運営など基本的な情報が記載
されている
サイトの主力製品などの紹介
営業活動に関わるページ
の紹介
会員専用ページにログインすること
ができる. 専用ページ内では商品の
会員専用メニュー 検索や過去に購買した商品などを調
べることができる. コンバージョン
には関係ないメニューである.
コンバージョンの中でもサイト運営
会員コンバージョン(+) 者側の観点からプラスの利益をもた
らすと考えられるもの
会員情報変更やパスワード再発行等
会員コンバージョン(0) 利益とは直接関係のないコンバージ
ョン関連のメニュー
サービスの休止など, サイト運営者
会員コンバージョン(-) 側の観点からマイナスの利益をもた
らすと考えられるもの
このカテゴリ内で, メンバーズサイ
メンバーズサイト登録 トの登録を行うと会員専用サイトの
アクセスが可能となる
4 週間のお試しサービスへの入会の
お試しサービス入会 コンバージョン
資料請求のコンバージョン, 若しく
資料請求・お問い合わせ はメールでの質問
その他
特定不能ページ・入力内容ミス等
7
2.1.3
データ基礎分析
サイト特性を把握する為にデータ基礎分析を行った. データクリーニングとして直帰ユー
ザー (一度だけしかサイトを訪問せず, 1 ページしか閲覧しなかったユーザー) を除外した. こ
れは本研究がサイトを訪問するユーザーの行動分析に焦点を当てている為, 期間内に 1 回しか
アクセスをしていないユーザーは極めて購買に繋がりにくいと判断した為である. 本節では時
間別 PV 数・曜日別 PV 数・参照ソースの割合について述べているが, 他の基礎分析結果は付
録に記載する.
400000
時間別PV数
350000
300000
250000
200000
数
V150000
P
100000
50000
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
時間
図 2.1: 時間帯別 PV 数
図 2.1 は時間帯別 PV 数 (ページ・ビュー数) を表している. PV とは Web サイト内の特定の
ページが閲覧された回数, すわなちアクセス数を指す. これを見ると, 1 日のアクセスは午前中
から昼と夜 21 時∼24 時の間に集中していることがわかる. 10 時, 16 時にアクセスが多いこと
から, 家事が済んだ家庭の主婦等が閲覧している可能性がある. また 21 時∼24 時には帰宅後
のサラリーマンや OL 等が閲覧してアクセス数増加に繋がっており, 個人ユーザー主体のサイ
トであると考えられる.
8
曜日別PV数
1000000
800000
600000
数
V
P 400000
200000
0
月
火
水
木
曜日
金
土
日
図 2.2: 曜日別 PV 分析
図 2.2 は曜日別 PV 数を表したものである. 土日よりも平日にアクセスが集中しており, 一
般的な EC サイトの特徴が表れている.
図 2.3: 参照ソースの内訳
図 2.3 は参照ソースの内訳である. サイトアクセスの半数以上がアフィリエイト広告若しく
は Yahoo・Google などの検索エンジンを経由している. このようにやってくるユーザーはサ
イトを一度だけしか訪問しない傾向が高い. 購買意思が薄いユーザーに興味ある情報を与える
ことで, 閲覧顧客を優良顧客に転換させることが利益の向上に大きく関わってくる.
9
本研究では CRM 推進システムの開発に際して分析データを学習用とテスト用の 2 つに分
割した. 学習データは各顧客クラスの特性を把握する為のパラメータ値決定と特性パターン
の抽出の為に用い, テストデータを使って開発したアルゴリズムの有効性を検証する. データ
期間は 2007 年 4 月 1 日から 9 月 20 日迄であり, その内始めの 12 週間を学習用データ, 残り
の 13 週間をテストデータとした. 学習データとテストデータの分割方法は 4 章で述べる. 学
習データ, テストデータの詳細を表 2.5, 表 2.6 に示す. ここで, 「平均 PV 数」とは期間内に
1 ユーザーが閲覧した PV 数の平均であり, 「平均セッション数」は期間内に 1 ユーザーが起
こしたセッションの回数の平均を表している.
クラス
C1
C2
C3
C4-Present
C4-OUT
全体
クラス
C1
C2
C3
C4-Present
C4-OUT
全体
ユーザー数
180, 294
11, 389
753
14, 259
884
207, 579
ユーザー数
115, 733
9, 978
923
15, 848
1, 289
143, 771
表 2.5: 学習データ
セッション数
PV 数
473, 152 1, 158, 394
20, 688 146, 241
3, 327
28, 443
90, 773 1, 108, 406
4, 169
43, 268
592, 109 2, 484, 752
表 2.6: テストデータ
セッション数
PV 数
239, 694 868, 040
17, 173 127, 402
2, 881
30, 839
98, 289 1, 159, 575
5, 879
56, 870
363, 916 2, 242, 726
10
平均 PV 数 平均セッション数
6. 43
12. 84
37. 77
77. 73
48. 94
11. 97
2. 62
1. 81
4. 41
6. 36
4. 71
2. 85
平均 PV 数 平均セッション数
7. 50
12. 77
33. 41
73. 17
44. 12
15. 60
2. 07
1. 72
3. 12
6. 2
4. 56
2. 53
第3章
3.1
アクセスログデータを用いた CRM 推
進システムの開発
先行研究
学術用として利用されていた Web は次第にビジネスへの利用へと中心を変えていった. 現
在では EC サイトの発達や広告やメールによる情報配信などにより, ユーザーは日常的に Web
を用いる. アクセスログデータは元々サーバーを管理する際のセキュリティを守る為に生まれ
た. Web 上に「履歴を記録する」ことが可能となったことで, ネットワークのセキュリティだ
けでなく様々なアプローチによる研究が行われてきた. Web サイトで顧客が商品を購買する
際にユーザーに対して影響のある要因を探り, Web サイトの構造や使い易さを向上させる為
の提案やプロキシサーバーを経由した場合のユーザーを特定する研究, ユーザーのページ履歴
から次の閲覧ページの予測をする研究等が行われている.
ユーザーの閲覧行為に基づいてサイトの製品・サービスをリコメンドする研究も行われて
いる. Zhang and Jiao [7] は顧客の嗜好に対してそれぞれ顧客毎に異なるリコメンデーション
を行うシステムを作成した. 顧客がどのような商品が欲しいのかを「文章」で入力し, その文
章と顧客の購買履歴から推薦する商品を Web 上に表示するシステムであり, 携帯電話の EC
サイトのトランザクションデータを用いている. テキストマイニングとアソシエーションルー
ル, 強調フィルタリングを分析手法としている. 1000 個のテストデータで推奨される携帯電話
のリストとユーザーが過去に購買したものに含まれるかを検証し, システム開発環境にも言及
している.
Srikant and Yang[6] はアクセスログデータを用いてサイト構造評価・改善を提案した. 昨
今の Web サイトは情報量やページ数の増大により複雑化の一途を辿っており, サイトを利用
するユーザーには目的とするページがどこに存在するのかを把握することが困難であるとい
う問題, 管理者側としてはユーザーがどのページを目的としているのか把握することが困難で
あるという問題が存在する. アクセスログデータを時系列で分析することによって, ユーザー
の目的ページがどこの階層にあるのか, また, ユーザーは目的ページに辿り着く段階でそれが
どこの階層にあると推測していたのかを明確にしてサイトの再構築に役立てるということを
目的としている.
ユーザーのページ履歴から次の閲覧ページの予測をする研究としては Montgomery et al[5]
がある. サイト訪問者のセッションに対して, 最初の k 回目のページ閲覧に基づいてユーザー
が購買するか否かを判定している. 2 ページ閲覧後より 6 ページ閲覧後の方が良い判定結果を
得ることができたと示しているが, それでも実際に購買したユーザーの大部分を判定すること
ができず, モデルの改善が必要であると言及している. ユーザーの経路解析を行うことは Web
サイトを構築するときのデザインの向上やリコメンデーションを行う上でのマーケティング
戦略に非常に有効であると考えられる. 顧客情報として, 性別・年齢, 職業, 地域等が与えられ
ている. サイトのページを 8 つのカテゴリに分類し, 次に訪問するページのカテゴリを予測し
ている. 隠れマルコフモデル, 階層的ベイズアプローチ, 多項プロビットモデルを用いてあて
はめが行われている.
11
山本 [3] はサイトに訪れるユーザーを訪問してから 3PV・4PV・5PV 以内に判別する方法
を提案した. しかしながら, ユーザーを判別する為には 3PV では不十分であり, 4PV 以上取る
とユーザーのパターンが多岐に渡ってしまい, 抽出した特有なパターンのヒストグラムの裾が
広がってしまい, 逆に精度を落としてしまう. 山本 [3] とのアルゴリズムを比較した結果を 4.2
節で述べる. 小池・菅谷・住田ら [2] は 3PV でのローリングホライゾンの形を取りユーザーの
判別精度をはじめの 3PV から 6PV までに序々に高めていく方式を取っている. しかし, この
研究は購買を一度しか行わない B to B のサイトである.
従って, 本研究で扱うようなユーザーの所属する顧客クラスがコンバージョン毎に C1 →
C2 → C3 → C4 の順に高くなっていく場合には, 資料請求やお試し会員サービスへの登録を
未だしていない閲覧者層 (C1) や資料請求・問い合わせを行った (C2) のユーザーと比較して,
お試しサービス入会をしたユーザー (C3) はある程度正会員になることに対する興味の度合が
強く, それによりそれぞれの顧客に対して行う CRM 推進のアプローチは当然異なる. このよ
うに顧客クラス毎に異なる CRM 推進が必要な場合, ユーザーのミクロの流れだけでなく, マ
クロの視点から全体を通してもユーザーの動きを捉えることが重要である.
アクセスログデータが登場したことにより, ユーザーの閲覧行為をリアルタイムで把握する
ことが可能となり, それによりユーザーのセッション進行中に情報発信をして購買に繋がりや
すくするという新たなマーケティングの観点からプロモーションを行うことができる.
3.2
CRM 推進システムの開発
本分析ではミクロ分析とマクロ分析両面から CRM 推進を行う. 2.1 節で述べたように X 社
のサイトで正会員になる為にはお試しサービス入会が必要であり, その後 4 週間を経て正式に
会員になるかを選択する. 資料請求後もお試しサービス入会を行わないと会員にはなれないこ
とに注意する必要がある. お試しサービス入会後, 会員 ID がユーザーに送られ会員専用サイ
トにアクセスすることが可能となる. アクセスログデータの記録上, ユーザーの行動は図 3.1
のような行動を辿る.
図 3.1: X 社におけるユーザーのクラス
サイトを一度も訪問したことのないユーザーを C0 として, 初めてサイトに来たユーザーの
所属クラスは C1 から始まるものとする. ユーザーが資料請求を行った場合は顧客クラス C2
12
へ, お試しサービス入会を行った場合は顧客クラス C3 へ推移し, 会員メンバーサイトへ登録
すれば顧客クラス C4 となる. C4 クラスになった後に表 2.4 における P08(お休みサービス受
付) をコンバージョンして, その後再びサイトに戻ってこなかった状態を「OUT」と呼ぶ. 資
料請求・お試しサービス入会のコンバージョンに至らずサイトを二度と訪問を行わなくなっ
た場合にはそのユーザーが属した最終的な顧客クラスは「Present C1」となる. 同様に, 資料
請求のコンバージョンを行ったが, お試しサービスに至らなかった場合にはそのユーザーが属
した最終的な顧客クラスは「Present C2」, お試しサービスのコンバージョンを行ったが, 会
員サイト登録に至らなかった場合には「Present C3」, 会員サイト登録を行い, お休みサービ
ス受付を行わなかった場合には「Present C4」と定義する. また例外としてデータの記録上,
ユーザーが期間外にお試しサービス入会を行った場合, お試しサービス入会完了のコンバー
ジョンのアクセスログデータは記録されないのでデータ期間前に既に所属クラスが C3 である
ものと判断する.
また, 顧客クラスのアップグレード過程が途中であるユーザーの顧客クラスを表す状態をそ
れぞれ「C1 Stage」, 「C2 Stage」, 「C3 Stage」, 「C4 Stage」と呼ぶ. 例えば, 資料請
求のコンバージョンを行ったが, お試しサービス入会のコンバージョンに至らずサイトを二度
と訪問しなくなったユーザーの場合, そのユーザーの状態は「C1 Stage」→「C2 Stage」→
「Present C2」となり, 最終的な顧客クラスは「Present C2」となる.
本研究の目的として
• アップグレードするユーザーを増やし, アップグレードせずにサイトから離脱してしま
うユーザーを減らす
• 最終的な顧客クラスが C4 で居続け, 繰り返し購買するユーザーを増やす
• サービス休止を行い OUT してしまうユーザーを減らす
ことの方策を見出すことに本研究の目的がある. X 社のサービスは定期品と注文品に分かれて
おり, サイト運営者の観点から考えると, 顧客が C4 でいる限り定期的に収益を得ることがで
きるので, 顧客クラス C4 が最重要顧客と言える.
初めてサイトを訪問した顧客 (C1) を最重要顧客 (C4) に導く為に各顧客クラスの特性を把
握し, クラスのアップグレードの促進・アップグレード過程のスピードアップを行う必要があ
る. クラスのアップグレードの促進を考える為に各クラスのトランザクションを解析し, その
特徴を把握することで, 顧客特性に合うようにページ誘導や商品の推薦を行う.
クラスのアップグレードの促進をする為にミクロ分析, アップグレード過程のスピードアッ
プ化を行う為に全体のユーザーの状態を捉えるマクロ分析を行う. 分析フローとしては, 先ず
ローリングホライゾンする為のデータセットの単位を決定する. データセットの単位を決定す
ることでデータの更新の際に適切な量で顧客の判別, シミュレーションを行うことができる.
データセットの単位を決定した後にミクロ分析により各ステージでクラス毎の特徴パターン
を抽出し, それに基づいて顧客判別を行う. マクロ分析ではミクロ分析によって得られた各ス
テージでの特性パターンを用いて感度分析を行い, 最終的に C4 に残るユーザーが最も多くな
るように CRM 推進を行う.
3.3
ミクロ分析によるクラスアップグレードの促進
ミクロ分析ではユーザーが各 Stage から 6PV 以内にそのユーザーが所属する Stage からアッ
プグレードするか現クラスに留まってしまうかを判別する. その際に学習データから得られる
13
各クラスに固有の経路を特性パターンと呼ぶことにする. 特性パターンを以下に詳細に定義す
る. 図 3.1 で Stage s(s = 1, 2, 3, 4) においてユーザーは Prsent クラスになるか Upgrade クラ
スになるかの行動を取り, i = P resent, U pgrade である顧客クラスを Cs:i とする. Cs におい
てアップグレードした場合は (s + 1) Stage に進み, その Stage での顧客クラスは Cs:U pgrade
となる. 逆に, コンバージョンを起こさなかった場合は Cs:P resent となる. 但し, 図 3.1 で C1
Stage → C3 Stage となる場合だけこれを満たさないことに注意する.
学習データに現れる Stage s における閲覧顧客の T (T = 1, 2, 3, 4) 番目の PV から (T + 2)
番目の PV までのページ履歴を
(T, j) = [ps:1 (T, j), ps:2 (T, j), ps:3 (T, j)] , j = 1, · · · , K(T )
p⊤
s
def
と書く. ps:m (T, j), m = 1, 2, 3 は Stage s における閲覧顧客のパターン j の m 番目の PV を
表す. ここで K(T ) は中カテゴリの分類で考えると 3PV で可能なアクセスパターン数 643 の
内, 学習データに現れた実際のアクセスパターン数である. ps (T, j) の集合を
(3.1)
def
Ps (T ) = {ps (T, 1), ps (T, 2), · · · , ps (T, K(T ))}
と定義する. また, 閲覧顧客 c の T 番目から (T + 2) 番目までのページ履歴を cs (T ) で表し,
(3.2)
c⊤
s (T ) = [cs:1 (T ), cs:2 (T ), cs:3 (T )]
def
と書く. cs:m (T ), m = 1, 2, 3 はそれぞれ Stage s における閲覧顧客 c の (T + m) 番目のペー
ジ履歴である. ps (T, j), cs (T ) において, m = 2, 3 に対し, (T + m − 1) 番目の閲覧ページが存
在しない場合には ps:m (T, j) = cs:m (T ) = ϕ とする. δ{S} を命題 S が真のとき 1, それ以外は
0 の値をとる命題関数とし, 学習データの内 ps (T, j) を実現した Cs:i 顧客数を
(3.3)
def
ns:i (T, j) =
X
δ{cs (T )=p
s
(T,j)}
c∈Cs:i
と定義する. この ns:i (T, j) に対し, サポートとコンフィデンスをそれぞれ
(3.4)
Supps:i (T, j)
(3.5)
Confs:i (T, j)
def
ns:i (T, j)
PK(T )
j=1 ns:i (T, j)
def
ns:i (T, j)
ns:P resent (T, j) + ns:U pgrade (T, j)
=
=
で与える. このとき, パラメータ αs:T , βs:T ∈ [0, 1] に対して Supps:i (T, j) > αs:T , Confs:i (T, j) >
βs:T を満たすパターン ps (T, j) を T ∼(T + 2)PV 間における Cs:i の特性パターンとして
(3.6)
def
CP s:i:T (αs:T , βs:T ) = {ps (T, j) | Supps:i (T, j) > αs:T , Confs:i (T, j) > βs:T }
と定義する. T ∼(T + 2)PV 間における Cs:i の特性パターンの内, Cs:i にのみ現れる特性パター
ンの集合を
[
def
(3.7)
/
CP s:k:T (αs:T , βs:T )}
UCP s:i:T (αs:T , βs:T ) =
{ps (T, j) | ps (T, j) ∈
k̸=i
として, これを「ユニーク・キャラクタリスティック・パターン (以下 UCP) 集合」と呼ぶこ
とにする. 一組のパラメータセット (αs:T , βs:T ) を与えたときにその閾値以上の特性パターン
及び UCP を算出することができる.
14
3.3.1
各段階におけるパス経路の特性パターン分析
本節では各 Stage において閲覧顧客がコンバージョンを起こす前にそのクラスに留まるか
アップグレードするかを判別するアルゴリズムを記述する. アルゴリズムは基本的に先行論文
[2] で開発したものに準ずる. 先行論文 [2] では B to B のサイトにおいて 6PV で 4 クラスを
判別しようと試みた. しかし, 優良顧客になるに従ってユーザーの数が少なくなりクラス毎の
特性パターンと UCP に関して十分な量のパターンが取れなかった. 本論文の分析対象サイト
は先行論文 [2] での分析対象サイトと性質が異なり, ユーザーがアップグレードする仕組みと
なっている. 従って, 現クラスかアップグレードの 2 分類とした.
ある顧客がある時点でアップグレードすると判断された場合はその時点で判別を終了する
ものとする. すなわち, 1 回目 (1∼3PV) の時点では未だ何も判別されていない顧客をアップ
グレードするか 4 回の判別で行い, 4 回の判別を行ってもアップグレードしないと判断された
顧客は最終的な顧客クラスが決定することになる.
各ステージにおいてアルゴリズムを実行し, 学習データで得たパラメータをテストデータ
で使用して検証を行う. Stage s においてアップグレードした顧客集合を U pgrades , アップグ
レードしなかった顧客集合 P resents とする. アルゴリズムを表記する為に以下の集合を定義
する.
(3.8)
def
def
REC s:T = {cs (T )|∀m ∈ M, cs:m (T ) ̸= ϕ}, M = {1, 2, 3}
: T ∼(T + 2)PV間の 3 ページが全て記録されたアクセス・パターンの集合
(3.9)
def
EM P s:T = {cs (T )|∀m ∈ M, cs:m (T ) = ϕ}
: T ∼(T + 2)PV間の 3 ページが全て記録されていないアクセス・パターンの集合
def
(3.10) M AT s:T = {cs (T )|∃m ∈ M, cs:m (T ) = P 1103}
:資料請求の送信完了ページ(P 1103)を含むアクセス・パターンの集合
def
(3.11) T RY s:T = {cs (T )|∃m ∈ M, cs:m (T ) = P 1004}
:お試しサービスの送信完了ページ(P 1004)を含むアクセス・パターンの集合
def
(3.12) M EM s:T = {cs (T )|∃m ∈ M, cs:m (T ) = P 0903}
:メンバーズサイトの登録完了ページ(P 0903)を含むアクセス・パターンの集合
def
(3.13) CON V s:T = M AT s:T ∪ T RY s:T ∪ M EM s:T
:送信完了ページ(P 1103, P 1104, P 0903)を含むアクセス・パターンの集合
15
Algorithm 1 顧客判別アルゴリズム
3.3 節で定義した特性パターン・UCP を基に, 閲覧顧客が属する顧客クラスを最大で 6PV
以内に判別するアルゴリズムを開発する. 判別は連続する 3PV の履歴を基本単位とし, これを
1∼3, 2∼4, 3∼5, 4∼6 という具合にずらし, 最大 6PV・4 回の判別でアップグレードするの
か否かを判別する. アルゴリズムの説明に際し注意すべき点としてコンバージョンは 2.1.1 節
で定義したように「入力フォーム ⇒ 入力内容確認 ⇒ 送信完了」というアクセスパターンで
定義されており, その実現には少なくとも 3PV を必要とすることである. すなわち, 3PV 以内
でコンバージョンを達成してしまった場合 (c(T ) ∈
/ RECs:T でありながら c(T ) ∈ CON Vs:T
である場合), 入力ミスと判断して以後その顧客を考察の対象から排除する. また, ある顧客 c
が時点 T でアップグレードしないと判断されているとき, (T + 1) 時点以降にアップグレード
するかを判断し, T = 4 時点での判断を最終判断とする. 但し, アップグレードしないと判断
されている顧客が 6PV 前にアップグレードのコンバージョンを実現した場合には, コンバー
ジョンの見逃しとして処置し, それ以後, その顧客を考察の対象から排除する. ■で判別終了
を意味する.
Step 1
Step 2
Step 3
Step 4
Step 5
Step 6
Step 7
3.3.2
c(T ) ∈ EM Ps:T であれば Step7 へ, そうでない場合は Step2 へ
c(T ) ∈ RECs:T であれば Step3 へ, そうでない場合は Step6 へ
c(T ) ∈ CP s:P resent:T (αs:T , βs:T ) ∪ CP s:U pgrade:T (αs:T , βs:T ) であれば Step4 へ,
そうでない場合は Step5 へ
c(T ) ∈ UCP s:i:T (αs:T , βs:T ) ならば c ∈ Cs:i とし振り分け後 Step7 へ, そうでない
場合は学習データから得られるこのデータのサポート比について該当する顧客ク
ラスに振り分ける. 振り分け後 Step7 へ
c(T ) ∈ CON Vs:T である場合コンバージョンの見逃しとみなして, 以後この c を
判別対象から排除する. そうでない場合は学習データから得られるクラスの顧客
数比に基づいて該当する顧客クラスに振り分ける. 振り分け後 Step7 へ
c(T ) ∈ CON Vs:T である場合入力ミスとみなして, 以後この c を判別対象から排
除する. そうでない場合は学習データから得られるクラスの顧客数比に基づいて
該当する顧客クラスに振り分ける. 振り分け後 Step7 へ
c ∈ U pgrades であればその時点における判別結果に基づいて c の属する
顧客クラスを確定する■. T < 4 であれば Step1 へ
最適パラメータの特定
本節では, 判別アルゴリズムの評価指標として広く用いられている 2 つの指標「Precision」
∗ , β ∗ ) を抽出する. あるパ
と「Recall」を導入して学習データから最適パラメータセット (αs:T
s:T
ラメータセットに対し, 前節で述べた顧客クラス判別アルゴリズムを学習データに適用したと
きに Stage s において Cs:i であると判別された顧客の内, 実際は Cs:j であった顧客数を xs:ij
とする. ここで,
def
Xs:i = xs:i,
(3.14)
(3.15)
P resent
+ xs:i,
def
U pgrade
xs:ii
P recisioni (αs:T , βs:T ) =
,
Xs:i
def xs:jj
Recallj (αs:T , βs:T ) =
Ys:j
def
16
, Ys:j = xs:P resent, j + xs:U pgrade,
j
とすれば, 表 3.1 のようにまとめることができる. Xs:i は Cs:i と判別された顧客数を表わし,
Ys:j は実際に Cs:j に属する顧客数である. P recisioni は顧客クラス Cs:i と判別されたユーザー
の内, 実際に顧客クラス Cs:i であったユーザーの占める割合である. それに対して Recallj
は実際の顧客クラス Cs:j の内, Cs:j と正しく判別することができたユーザーの割合を表して
いる. 例えば, 表 3.1 の xs:P resent,P resent は Present クラスであると判別された顧客の内, 実
際に Present クラスであった顧客数である. Xs:P resent は Present クラス (アップグレードし
ない) であると判別された顧客の総計であり, 実際には Upgrade クラスだが Present クラス
であると判別してしまった1 顧客を含む. 今, 全ての顧客をアップグレードすると判別すると,
表 3.1: 判別表の集計表
Truth
J
u
d
ge
m
en
t
C s: present
C s:Upgrade
C s:Pr esent
x s:Pr esent , Pr esent
x s:Pr esent ,Upgrade
C s:Upgrade
x s:Upgrade , Pr esent
x s:Upgrade ,Upgrade X s:Upgrade
X s:Pr esent
Ys:Upgrade
Ys:Pr esent
Recall は 100%になるが, Precision は対応するクラスの顧客数比の値になる. 一般に Precision,
Recall は互いに負の相関を持ち, Recall の値を減らしながら Precision の値をどれほど増やせ
るかが重要となる. パラメータ αs:T , βs:T (T = 1, 2, 3, 4) を与え, Algorithm 1 を実行するこ
とで P recisioni (αs:T , βs:T ) を計算することができる. 表 3.2 は第一種の過誤と第二種の過誤
の関係を表したもので, 実際は Upgrade クラスであるのに (実際は重要顧客), 誤ってアップ
グレードしないと判別をした場合 (非重要顧客と判別した場合) に第一種の過誤が発生する.
アップグレードすると判別したが (重要顧客と判別した), 実際は Present クラスであった場
合 (非重要顧客であった場合) を第二種の過誤という. 第一種の過誤は優良顧客を誤って非優
良顧客と判断してしまうことで機会費用の損失に繋がり, 非優良顧客を誤って優良顧客と判
断してしまうことは費用対効果の減少に繋がってしまう. 従って, T = 1 の段階においては
Present クラスと判断した顧客が実際は Upgrade クラスであったときの機会損失を最小にす
る必要があるので, P recisionP resent (α1 , β1 ) が最大となる (α1∗ , β1∗ ) を算出する. T = 2, 3, 4 に
おいては Upgrade クラスと判別された顧客からコンバージョンを展開することが必要であり,
P recisionU pgrade (αT , βT ) が最大となる (αT∗ , βT∗ ) を求める.
∗ , β ∗ )(T = 1, 2, 3, 4)
学習データに対して Algorithm1 を実行し, 最適パラメータセット (αs:T
s:T
を得る. それを用いて, テストデータに対して Algorithm 1 を T = 1, 2, 3, 4 について実行し,
顧客クラス判別の検証を行う.
1
アップグレードしないと判別した顧客が, 実際にはアップグレードしていた
17
表 3.2: 第一種の過誤と第二種の過誤
Ju
d
ge
m
en
t
Truth
Present
Present
Upgrade
第二種の過誤
Upgrade
第一種の過誤
Algorithm 2 最適パラメータ特定
値 v から w まで刻み幅 c で格子探索することを [v, w](c) によって表す. 格子幅を大きく取り
次第に刻み幅を狭くしていき, 全部で 3 回の実行で最適なパラメータを特定する. α に関して
はパターンが多い為格子探索を 3 回行い, β に関しては Present クラスと Upgrade クラスの 2
分類の為 2 回の実行で十分と判断した.
Step 1
(αT , βT ) に関して [0.1, 0.9](0.1)2 の全ての組み合わせについて計算を実行する. T = 1 の段
階では P recisionP resent (α1 , β1 ) が最大となる (e
α1 , βe1 ) を算出する. T = 2, 3, 4 においては
P recisionU pgrade (αT , βT ) を最大化する (e
αT , βeT ) を求める.
Step 2
fe = (e
αT , βeT ) のそれぞれについて [fe − 0.01, fe + 0.01](0.01) の全ての組み合わせについて計
算を実行する. T = 1 の段階では P recisionP resent (α1 , β1 ) が最大となる (b
α1 , β1∗ ) を算出する.
T = 2, 3, 4 においては P recisionU pgrade (αT , βT ) を最大化する (b
αT , βT∗ ) を求める.
Step 3
βT∗ (T = 1, 2, 3, 4) を除き, T = 1, 2, 3, 4 について, [b
α − 0.01, α
b + 0.01](0.001) の全ての組み
合わせについて計算を実行する. T = 1 の段階では P recisionP resent (α1 , β1∗ ) が最大となる
(α1∗ , β1∗ ) を算出する. T = 2, 3, 4 においては P recisionU pgrade (αT , βT∗ ) を最大化する (αT∗ , βT∗ )
を求める.
3.4
マクロ分析によるクラスアップグレードの促進
マクロ分析では, ミクロ分析で得られた特性パターンから CRM 推進を行う. 推移確率行列
(これを V とする) を用いて感度分析を行うことで, どのようなパターンを増やせば最終的に
C1 から C4 になるユーザーが増加するかを分析した. なお, マクロ分析に関してはユーザーが
所属する顧客クラスは全て C1 から始まり, アップグレードしていくことを分析しているので,
初期から C3, C4 であるユーザーは分析の対象から外し, 表 2.4 の大カテゴリにおける P12 は
特定不能ページであるため, 推移確率作成の対象から除外した.
Algorithm 3 推移確率行列 V の算出
2
α, β を 0.1 から 0.1 刻みで 0.9 までの組み合わせの 92 通りを実行
18
Step 0 各 Stage におけるページ数推移行列・推移確率の算出
第 1 週から第 k 週までのデータで作成されたユーザーの各カテゴリ間のページ数推移行列 Q を
求める. ユーザーの行動は図 3.1 に従うものとする. C1 Stage の場合は資料請求・問い合わせ
―送信完了 (P1103) を行うと C2 Stage へ, お試しサービス送信完了を行えば C3 Stage へ移動
する. C2 Stage ではお試しサービス入会―送信完了 (P1004) を行えば C3 Stage へ, C3 Stage
ではメンバーズサイト登録―送信完了 (P0903) を行えば C4 Stage に移動する. C4 Stage にお
いて, ユーザーが会員サービス休止受付―送信完了ページ (P0803) をコンバージョンした後に
そのユーザーが二度とサイトを訪問しなかった場合を OUT とした. またユーザーがそのペー
ジからその後二度とサイトを訪問しなかったページの遷移を Cs : END (s = 1, 2, 3, 4) とする.
ここで END とはサイトへの訪問を行わなくなったユーザーの状態を指す, 但し, C4:END に
関しては OUT していない, すなわち Present C4 の状態である. ユーザーのカテゴリ間の推
移確率行列を P s とした.
Step1 各 Stage における確率ベクトルの算出
C1 Stage において第 1 週から第 k 週までにユーザー が各カテゴリ・Stage j にいる確率を
pCi:j (k) とし, 第 1 週から k 週迄に出現した人数の合計を ni:k とする. その確率ベクトルを
p⊤
(k) =
C1
def
(3.16)
[pC1:P0100 (k), pC1:P0200 (k), pC1:P0301 (k), . . . , pC1:C2 (k), pC1:C3 (k), pC1:END (k)]
と定義すると,
p⊤
(k + 1) = p⊤
(k)P C1 = p⊤
(0) · P k+1
(k = 1, 2, . . . , 25)
C1
C1
C1
C1
(3.17)
が成り立つ為, 第 (k + 1) 週目の状態確率を求めることができる. p⊤
(0) は第 1 週から第 k 週迄
C1
に出現したユーザーが初期に到着した中カテゴリの分布とした. P C1 はユーザーの C1 Stage
におけるカテゴリ間の推移確率行列を表し, 以下のように与えられる.
・・・
・
・
・
・
・
=・
def
ここで, CAT = {P0100, P0200, · · · P1103} である.
C1 Stage において C2, C3, END が吸収状態であることから, k → ∞ とすると, 時間が十
分に経った時のユーザーの各状態の確率は p⊤
= [0, v12 , v13 , v11 ] となる. ただし, v1j は Stage
C1
C1 から Stage Cj に移行する確率であり, 0 は中カテゴリの分布にそれぞれ滞在する確率が全
て 0 である |CAT | 次元ベクトルである. C2 Stage∼C4 Stage に関しても同様の操作を行う.
Step2 マクロ分析における推移確率行列の算出
19
C2 Stage∼C4 Stage に関しても同様の操作を行うと, マクロ分析における推移確率行列は

C1

C2 

C3 

V =
C4 


END 
OUT
C1
C2
C3
C4
END
OUT
0
0
0
0
0
0
v12
0
0
0
0
0
v13
v23
0
0
0
0
0
0
v34
0
0
0
v1:END
v2:END
v3:END
v4:END
1
0
0
0
0






v4:OUT 


0 
1
となる.
最終的に第 1 週から k 週迄に X 社のサイトを訪問し C4 になった顧客は nC4:1:k = n1:k ·v4:END
で表すことができる. Algorithm 3 で得られた V の v4:END , nC4:1:k を評価することにより, 最
終的に C4 になった顧客数の期待値を求めることができる.
本研究ではミクロ分析における Algorhm1∼2 を実行することによって得られたアップグ
レード若しくはアップグレードしなかった特性パターンを推移確率行列に組み入れ, 推移確
率行列の確率を変化させることで感度分析を行う. 詳細は Algorithm 4-1, 4-2 に示す (Step1,
Step2). また感度分析は 2 種類の方法で実行させた. ミクロ分析で得られた Upgrade クラスの
UCP, すなわち優良顧客のみに現れる特有なパターンのみの流量を増やした場合 (Algorithm
4-1:感度分析 1) とミクロ分析で得られた Present クラスの UCP, すなわち非優良顧客のみに
現れる特有なパターンの流量を減らし, 感度分析 1 と同様に Upgrade クラスの流量を増やし
た場合 (Algorithm 4-2:感度分析 2) である.
Algorithm 4 -1 感度分析 1
Step1
ミクロ分析より, 学習データから得られた各 Stage における U CPs:Upgrade (αs , βs ) を得る.
Step2
Upgrade クラスの UCP が含まれるパターン集合 U CPs:Upgrade を考える. j, r ∈ U CPs:Upgrade
def
に対し, Stage s におけるカテゴリ間の推移数行列を Q = [Qs:jr ] とする. Qs:jr は j のカテ
s
ゴリから r のカテゴリに遷移したユーザーの数を表す. j ∈ U CPs:Upgrade のとき, j → r(r ∈
U CPs:Upgrade ) の推移数を増やす為に j → k(k ∈ U CPs:Upgrade \{r}) の推移数を減らすことを考
P
える. 今, j → k の推移数を γk ·Qs:jk だけ減少させ, j → r の推移数を Qs:jk +
γk ·Qs:jk
k∈CAT \{r}
とする.
Step3
Step2 で算出された各推移数行列を基に推移確率行列を算出, Algorithm 3 を実行し最終的な
行列 V を求める.
Algorithm 4 -2 感度分析 2
Step1
ミクロ分析より, 学習データから得られた各 Stage における U CPs:i (αs , βs ), i = P resent, U pgrade
20
を得る.
Step2
各 Stage における Present クラスの UCP が含まれるパターンの集合 U CPs:Present とし, 各
Stage における Upgrade クラスの UCP が含まれるパターン集合 U CPs:Upgrade を考える. j, r ∈
U CPs:Upgrade に対し, Stage s におけるカテゴリ間の推移数行列を Q
def
s
= [Qs:jr ] とする.
Qs:jr は Stage s において, j のカテゴリから r のカテゴリに遷移したユーザーの数を表す.
j ∈ U CPs:Upgrade のとき, j → r(r ∈ U CPs:Upgrade ) の推移数を増やす為に u → w(u, w ∈
U CPs:Present ) の推移数を減らす. u → w の推移数を ξ · Quw だけ減少させ, j → r の推移数を
Qjr + ξ · Quw とする.
Step3
Step2 で算出された各推移数行列を基に推移確率行列を算出, Algorithm 3 を実行し最終的な
行列 V を求める.
第 4 章ではローリングホライゾンさせる為のデータセットを決定した後, そのデータを用い
てミクロ分析, マクロ分析を実行し X 社のサイトにおける顧客への CRM 推進を提案する.
21
第4章
4.1
テストデータによる検証
学習データ期間の決定
ローリングホライゾンする為に十分なデータセットの単位を算出する. マクロ分析で用いた
Algorithm 3 で算出できる行列 V の, 平均の差の割合がある一定以上の値を下回われば良いと
判断する. すなわち,


0 v12 (k) v13 (k)
0
v1:EN D (k)
0


0
v23 (k)
0
v2:EN D (k)
0
0





0
0
0
v
(k)
v
(k)
0
def 
34
3:EN D
 ,
V (k) = 
0
0
0
v4:EN D (k) v4:OU T (k)
0



0
0
0
1
0
0

0
0
0
0
0
1
¯
¯
def
def¯ vij (k) − vij (k − 1) ¯¯
Dij (k) = ¯¯
¯ , k = 1, 2, 3, · · · , 25 , (i, j) ∈ S = {(1, 2), (1, 3), · · · , (4, OU T )}
vij (k − 1)
として
(4.1)
k ∗ = arg min{Dij (k) < ε, ∀(i, j) ∈ S}
def
k
を求める. 今, ε = 0.02 としたときの k ∗ を算出すると k ∗ = 12 となった. 従って, ローリング
ホライゾンする際のデータの基本単位は 12 週間 (3 か月) とし, ミクロ分析・マクロ分析では
学習データを 1∼12 週, テストデータでは残りの 13 週のデータを用いた. 学習データ・テスト
データは表 2.5, 表 2.6 に記載した通りである.
22
平均の差の割合
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
1
2
3
4
5
6
V12
V34
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
V13
V3:END
V1:END
V44
V23
V4:OUT
V2:END
図 4.1: 平均の差の割合
4.2
ミクロ分析による特性パターンの抽出と顧客クラス判別
学習データ (第 1∼12 週) に対して Algorithm1∼2 を実行し, 決定されたパラメータでテス
トデータ (第 13∼25 週) を検証した結果を示す. 以下の表 4.1・4.2 は各ステージにおいて判別
を行った結果と特性パターンと UCP を取る為のパラメータセットである. またミクロ分析で
得られた UCP をマクロ分析で用いた. ここでは, Present クラスと Upgrade クラスそれぞれ
サポートの高い順から 10 パターンを示した.
表 4.1: C1 Stage における判別結果と C1 Stage におけるパラメータセット
t
n
e
m
eg
d
u
J
C1
Upgrade
合計
Recall
Original
C1
84,635
31,098
115,733
73.13%
90. 99%
Truth
Upgade
6,144
5,310
11,454
46.36%
9. 01%
Precision
β
90,779 93.23% C1 Stage α
T=1 0.015 0.10
36,408 14.58%
T=2 0.08 0.01
127,187
T=3 0.01 0.02
T=4 0.05 0.01
合計
23
表 4.2: C1 Stage における Present C1 クラスの UCP と Upgrade の UCP
C1
supp
P0403-P0403-P0403 0. 321
P0200-P0200-P0200 0.040
P0100-P0403-P0403 0.035
P0403-P1001-P0301 0.031
P0403-P1101-P0100 0.025
P0100-P0301-P0301 0.022
P0402-P0402-P0402 0.021
P0100-P0200-P0200 0.020
P0403-P1101-P0301 0.019
P0403-P1101-P1001 0.018
conf
1.00
0.99
1.00
0.96
0.93
0.97
0.99
0.99
0.96
0.92
UpGrade
P1101-P1102-P1102
P1102-P1102-P1102
P0403-P1101-P1102
P0100-P1101-P1102
P1101-P1101-P1102
P0409-P1101-P1102
P1001-P1002-P1002
P0402-P1101-P1102
P0409-P1001-P1002
P1001-P1101-P1102
supp
0.385
0.286
0.024
0.014
0.014
0.013
0.003
0.003
0.003
0.003
conf
0.47
0.47
0.46
0.48
0.47
0.47
0.38
0.47
0.35
0.47
表 4.2 を見ると, 非優良顧客を高い精度 (Precision=93.23%) で判別できていることがわかる.
Precision と Recall は一般的に負の相関関係にあり, 一方が増加すると, 一方が減少する関係
にある. しかし, この結果では優良顧客も正しく拾い出されている (Recall=46.36%). Original
とは元々の顧客数比を表しており, 46.36%は Original の 9.01%と比べても良いことがわかる.
定期的にローリングホライゾンするデータセットを更新して持続的にデータを検証すること
で Precision の向上を図ることが必要となる. Upgrade クラスのパスを見ると Present C1 で
サイトを離脱してしまうユーザーに比べて入力フォーム (P1101, P1001) を閲覧した後スムー
ズに内容確認まで移ることがわかる. Upgrade クラスにマーケティング-お知らせ (P0409) が
多いのに比べ, Present C1 クラスには TOP ページ (P0100), Web 広告 (P0403) が多い. すな
わち, 顧客クラスによって閲覧するパターンが異なるといえる.
表 4.3: C2 Stage における判別結果 と C2 Stage におけるパラメータセット
Truth
tn
e
m
eg
du
J
C2 Upgrade 合計 Precision
C2
9, 187
355 9, 542 96. 28%
Upgrade
791
73
864 8. 45%
合計
9, 978
428 10, 406
Recall 92. 07% 17. 06%
Original 95. 87% 4. 13%
24
C2 Stage α β
T=1
0.014 0.08
T=2
0.017 0.08
T=3
0.016 0.10
T=4
0.010 0.08
表 4.4: C2 Stage における Present C2 クラスの UCP と Upgrade の UCP
C2
P1103-P0100-P0406
P1103-P0100-P0100
P1103-P0100-P0403
P1103-P0100-P0301
P1103-P0100-P1101
P1103-P0403-P0403
P0403-P0403-P0403
P1103-P0100-P0409
P0100-P0406-P0406
P0100-P0301-P0301
supp
0.160
0.109
0.073
0.060
0.058
0.051
0.051
0.048
0.043
0.036
conf
0.97
0.97
0.98
0.97
0.99
0.99
1.00
0.99
0.94
0.98
UpGrade
P0406-P1001-P1002
P1002-P1002-P1002
P0100-P0406-P1001
P1001-P1002-P1002
P1103-P1001-P1002
P0406-P0406-P1001
P1001-P1002-P0301
P0100-P0403-P1001
P0301-P0401-P0401
P1101-P0406-P1001
supp
0.107
0.083
0.080
0.065
0.062
0.054
0.046
0.045
0.028
0.028
conf
0.50
0.75
0.15
0.47
0.47
0.18
0.56
0.17
0.17
1.00
C2 Stage に関しては Algorithm 1 を実行しても良い判別結果が得られなかった. これは資
料請求後, 送付されてくる資料でお試しサービス入会を行う1 ためである. このようなユーザー
はデータの記録上, C2 Stage では P1103 のみになってしまう2 . 学習データでは 11389 人存在
する Present C2 の内, 4368 ユーザーがこれにあたる. T = 2 段階以降での判別に大きな影響を
及ぼすと判断して, Algorithm 1 の Step5 の振り分けをこの 4368 ユーザーを除外した顧客数
比で割り振りを行った. その結果, Upgrade クラスの Precision が 8.11%から 8.45%に, Recall
が 16.36%から 17.06%と共に向上した3 UCP を比較すると, C2 クラスには資料請求送信完
了 (P1103) 後, TOP ページ (P0100)・定期品 (1) 案内情報 (P0301) に進むパターンが圧倒的
に多い. 従って, C2 Stage においては TOP ページや製品案内などサービスの概要を説明した
ページよりもマーケティング (P04) 情報を与えた方がユーザーの購買意欲を上昇させること
ができる.
表 4.5: C3 Stage における判別結果と C3 Stage におけるパラメータセット
t
n
e
m
eg
d
u
J
C3
C4
合計
Recall
Original
C3
174
749
923
18. 85%
21. 58%
Truth
C4
103
3, 251
3, 354
96. 93%
78. 42%
Precision
277 62. 82%
4, 000 81. 28%
4, 277
合計
1
C3 Stage
T=1
T=2
T=3
T=4
2.1.1 節で触れたように Web 上でなく, 紙の上でお試しサービス入会を行う場合がある
C2 Stage でのアクセスログでの記録が残らない
3
振り分け改良前の結果は付録に記載した
2
25
α β
0.001 0.10
0.004 0.10
0.019 0.08
0.005 0.10
表 4.6: C3 Stage における Present C3 クラスの UCP と Upgrade の UCP
C3
P0407-P0100-P0406
P0407-P0901-P0100
P0401-P0401-P0401
P0406-P0406-P0100
P0100-P0100-P0100
P0407-P0100-P0100
P0100-P0100-P0406
P0409-P0409-P0409
P0100-P0401-P0401
P0100-P0301-P0303
supp
0.032
0.024
0.024
0.022
0.022
0.019
0.019
0.019
0.015
0.015
conf
1.00
0.59
0.38
0.38
0.22
0.89
0.10
0.24
0.60
0.35
UpGrade
P0406-P0901-P0902
P0100-P0406-P0901
P0403-P0100-P0406
P0100-P0406-P0406
P0406-P0406-P0901
P0901-P0902-P0902
P0407-P0901-P0902
P0100-P0407-P0901
P0100-P0406-P0407
P0100-P0100-P0406
supp
0.132
0.093
0.082
0.076
0.071
0.057
0.040
0.037
0.033
0.030
conf
0.99
0.99
1.00
0.94
0.98
1.00
1.00
1.00
1.00
0.92
C3 Stage では Present C3 よりも Upgrade クラス, すなわち, C4 クラスの判別がより高
くなっており, この段階まで進めば, 非優良顧客よりもより優良顧客の判別が必要となってく
る. Recall を見ても Original の 78.42%と比べ, Upgrade クラスは 96.93%と極めて高い数値
で優良顧客を拾いながらも高い精度で判別されている (Upgrade クラスの Precision 81.28%)
Upgrade クラスに関してはコンバージョン関連サービス (P0406) がほぼ全て UCP に現れる結
果となった. お試しサービス入会を行ったユーザーをコンバージョン関連サービスに誘導する
ことで X 社のサービスに高い関心を持っている顧客を Upgrade クラスに繋げることができる.
表 4.7: C4 Stage における判別結果と C4 Stage におけるパラメータセット
t
n
e
m
eg
d
u
J
C4
C4
14,303
OUT
1,545
合計
15,848
Recall 90.25%
Original 92. 48%
Truth
OUT
1,030
259
1,289
20.09%
7. 52%
Precision
15,333 93.28%
1,804 14.36%
17,137
合計
26
C4 Stage
T=1
T=2
T=3
T=4
α
β
0.005
0.005
0.006
0.001
0.10
0.10
0.06
0.06
表 4.8: C4 Stage における Present C4 クラスの UCP と OUT の UCP
C4
P0100-P0407-P0604
P0903-P0902-P0903
P0100-P0406-P0407
P0902-P0903-P0407
P0903-P0100-P0902
P0406-P0407-P0604
P0100-P0902-P0903
P0407-P0604-P0619
P0619-P0619-P0619
P0100-P0407-P0408
supp
0.138
0.092
0.086
0.082
0.069
0.065
0.063
0.055
0.043
0.035
conf
0.92
0.96
0.91
0.96
0.98
0.92
0.98
0.97
0.97
0.94
OUT
P0407-P0801-P0802
P0408-P0604-P0801
P0801-P0802-P0804
P0100-P0100-P0406
P0406-P0407-P0801
P0801-P0802-P0803
P0604-P0607-P0801
P0604-P0801-P0604
P0406-P0406-P0407
P0100-P0406-P0100
supp
0.027
0.022
0.017
0.012
0.010
0.008
0.008
0.007
0.007
0.006
conf
0.25
0.24
0.22
0.16
0.26
0.27
0.37
0.15
0.20
0.12
C4 Stage においては繰り返し購買と宅配サービスによって利益を得ることができるので,
サービス休止をして OUT してしまうユーザーを減らす情報発信が必要となる.
今, もし全ての顧客が顧客数比によってクラスを割り振って判定することを考えたとき, 二
項分布から 1804 人を無作為に抽出してユーザーを正しく 259 人以上判別できる確率を求める
と限りなく 0 に近くなる. 本アルゴリズムを適用した場合は Precision の値 0.1436 となること
を考えると, OUT するユーザーに関する高い精度の判別する結果を得られたことがわかる.
表 4.9: 山本 [3] の C1 Stage における判別結果
表 4.10: 山本 [3] の C2 Stage における判別結果
Truth
Truth
tn
e
em
gd
uJ
C1
Upgade
合計
Recall
Original
合計
C1
Upgade
Precision
108, 873
8, 109 116, 982 93. 07%
6, 860
3, 345 10, 205 32. 78%
115, 733 11, 454 127, 187
94. 07% 29. 20%
90. 99% 9. 01%
表 4.11: 山本 [3] の C3 Stage における判別結果
t
n
e
m
eg
d
u
J
Truth
C3
C4
C3
385
441
C4
538 2,913
合計
923 3,354
Recall
41.71% 86.85%
Original 21. 58% 78. 42%
Precision
826 46.61%
3,451 84.41%
4,277
tn
e
m
eg
udJ
表 4.12: 山本 [3] の C4 Stage における判別結果
合計
27
C2
Upgrade 合計 Precision
9,674
400 10,074 96.03%
304
28
332
8.43%
合計
9,978
428 10,406
Recall 96.95%
6.54%
Original 95. 87%
4. 13%
C2
Upgrade
t
n
e
m
eg
d
u
J
C4
15, 224
624
合計
15, 848
Recall 96. 06%
Original 92. 48%
C4
OUT
Truth
合計
OUT
Precision
1, 214 16, 438 92. 61%
75
699 10. 73%
1, 289 17, 137
5. 82%
7. 52%
先行研究と比較する為に, 山本 [3] のアルゴリズムを本研究のデータに適用して行った場合
の結果を表 4.9∼表 4.12 に示した. C1 Stage について考えると, 山本 [3] では, C1 の Precision
が 93.07%, Recall が 29.20%, Upgrade クラスの Precision が 93.23%, Recall が 46.55%であり,
表 4.1 における本研究の結果と比較すると, 本研究では Upgrade クラスの Precision の値が落
ちているものの, 非優良顧客の判別が山本 [3] より正しく行えていること, また優良顧客を拾え
ている割合が大幅に高まっていることがわかる (Present C1 の Precision が 93.28%, Upgrade
クラスの Recall が 46.55%).
一般に Precision, Recall は互いに負の相関を持っている為, Recall の値を減らしながら Precision の値を高めていくことがアルゴリズムの判別評価として重要になってくる. 新規のユー
ザーが現れる C1 Stage において, 実際に優良顧客であるのに非優良顧客を判定することを
避けることが重要であることから, C1 Stage の結果としては優れているものではないかと考
えられる. C2 Stage の Upgrade の Recall に注目すると, 山本 [3] では 6.54%に対して本研究
(表 4.2) では 17.06%と大幅に向上しているのがわかる. C3 Stage を比較すると, Upgrade ク
ラスの Precision に関しては多少劣るものの, 本研究 (表 4.3) では Recall が 96.93%と実際に
存在する顧客の中でほぼ全ての顧客を正しく判別している. 一方, C4 Stage において OUT の
顧客に対して目を向けると, 山本 [3] では Precision が 10.73%であるのが本研究 (表 4.4) では
14.36%, Recall が山本 [3] では 5.82%に対して本研究では 20.09%と大幅に上昇することに成
功している. 全ての Stage において Recall が既存研究に比べて高い結果を得ていることから,
機会損失の低下につながることができていると考えられる. すなわち, 3PV をパターンの基
本単位として, 1∼3, 2∼4, 3∼5, 4∼6PV という形でずらし, ユーザーの判別精度をはじめの
3PV から 6PV までに序々に高めていく方式が有用であることがあわかる.
4.3
マクロ分析による感度分析
ミクロ分析において C1 Stage∼C4 Stage についてそれぞれ Algorithm 1∼2 を実行し, 与え
られたパラメータセット (αs:T , βs:T ) 以上で得られた UCP を全ての組み合わせで Algorithm3
∼4 を実行し, 一番確率が増加したパターンを感度分析 1 と感度分析 2 で下に示す. 感度分析 1
では全ての k について, γk = 0.1, 感度分析 2 では ξ = 0.1 とした (ξ = 0.05, 0.2 の結果は付録
参照) 表 4.13 は感度分析を実行する前の行列 V である. 学習データから得られた推移確率行
列と初期分布, 顧客数を用いて算出した. これは図 3.1 における C1 Stage から始まったユー
ザーが 127156 人存在し, 最終的に C4 になったユーザーが 733 人いることを表している.
表 4.14 は 3 章で述べた Algorithm4-1 の感度分析 1 を行った結果である. 確率を変化させた
UCP は
• C1 Stage の UpGrade の UCP:(P0403 - P1001 -P1101)
• C2 Stage の UpGrade の UCP:(P0409 - P1001 -P1002)
• C3 Stage の UpGrade の UCP:(P1004 -P0406- P0901)
• C4 Stage の C4:END の UCP:(P0604 -P0619 -P0619)
である. ただし, 中カテゴリ ID:大カテゴリ名−中カテゴリ名
P0403: マーケティング− Web 広告
P0406:マーケティング−コンバージョン関連サービス
P0409:マーケティング−お知らせ
28
表 4.13: 感度分析を実行する前の行列 V
C1
C2
C3
0. 0648 0. 0046
(8235) (588)
0. 0649
0
(534)
C1
0
C2
0
C3
0
0
0
C4
0
0
0
END
OUT
0
0
0
0
0
0
合計
END OUT
0. 9631
1
0
0
(118333)
(127156)
0. 9351
1
0
0
(7701)
(8235)
1
0. 6941 0. 3059
0
(779) (343)
(1122)
1
0. 9406 0. 0594
0
(733)
(46)
(779)
0
1
0
1
0
0
1
1
C4
P0604: コンバージョン (+) −注文品 (1) 注文画面
P0619: コンバージョン (+) −注文品 (1) リスト
P0901: メンバーズサイト登録−メンバーズサイト登録(入力フォーム)
P1001: お試しサービス入会−お試しサービス入会(入力フォーム)
P1002: お試しサービス入会−お試しサービス入会 (商品選択)
P1101: 資料請求・お問い合わせ−資料請求・お問い合わせ(入力フォーム)
である. この組み合わせの結果, 最終的に C4 であり続けるユーザーの割合が 0.0043 (21 人)
増加した. 次に Present クラス UCP の流量を減らし, Upgrade クラスの UCP の流量を増やす
Algorithm4-2 の感度分析 2 の結果を表 4.15 に示す.
増加させた UCP
• C1 Stage の UpGrade の UCP:(P0403 - P1001 -P1101)
• C2 Stage の UpGrade の UCP:(P0409 - P1001 -P1002)
• C3 Stage の UpGrade の UCP:(P1004 -P0406- P0901)
• C4 Stage の C4:END の UCP:(P0604 -P0619 -P0619)
減少させた UCP
• C1 Stage の C1 の UCP:(P0301-P0301 - P0100)
• C2 Stage の C2 の UCP:(P0402 -P0402-P0402)
• C3 Stage の C3 の UCP:(P0406-P0100-P0301)
• C4 Stage の OUT の UCP:(P0620-P0801-P0802)
29
表 4.14: γk = 0.1 で感度分析 1 を実行した後の行列 V
C1
C2
C3
0. 0648 0. 0047
(8239) (594)
0. 0669
0
(551)
C1
0
C2
0
C3
0
0
0
C4
0
0
0
END
OUT
0
0
0
0
0
0
合計
END OUT
1
0. 9305
0
0
(127156)
(118323)
0. 9331
1
0
0
(7688)
(8239)
0. 6971 0. 3029
1
0
(798) (347)
(1145)
1
0. 9449 0. 0551
0
(754)
(44)
(798)
0
1
0
1
0
0
1
1
C4
の結果, 最終的に C4 であり続けるユーザーの割合が 0.0031 (101 人) 増加した. ただし,
P0301: 商品情報−定期品 (1) 案内情報
P0402:マーケティング−レシピ
P0409:マーケティング−お知らせ
P0801: 会員コンバージョン (−)-お休み受付(入力フォーム)
P0802: 会員コンバージョン (−)-お休み受付(入力確認)
P0620: 会員コンバージョン (+) 注文品 (1) カート
である. この結果より, 感度分析 1 と感度分析 2 を比較した場合に感度分析 2 の方が C4 にな
る顧客が多いことがわかる. すなわち, アップグレードする UCP を増加させて, Present クラ
スの UCP を減らす CRM 推進を行えば最優良顧客である C4 顧客を増加できる. 今回の分析
の場合には, 具体的に以下のプロモーションを行えば一番効率良くユーザーをコンバージョン
へと導くことができる.
C1 Stage における CRM 推進
• マーケティング− Web 広告 (P0403) からお試しサービス入会入力フォーム (P1001)・
問い合わせ・資料請求案内 (P1101) 迄の流れを増加させる. またお試しサービス案内と
資料請求案内ページをリンクさせる. これはお試しサービス案内を見たときに, お試し
サービスにいきなり入会せず, 先ずは資料請求の案内を見てみたいと思うユーザーの特
徴であると考えられる.
• 商品情報−定期品 (1) 案内情報 (P0301) で止まっているユーザーから他のページへ誘導
を行う. その際 TOP ページ (P0100) に誘導しないようにする. このサイトの主力サービ
スである定期品 (1) を閲覧した後, サイトの全体的な構造が把握できる TOP ページを
閲覧すると離脱してしまう可能性が高い. すなわち, 定期品 (1) を閲覧後更に詳細なサー
ビスを説明するページに誘導する必要がある.
30
表 4.15: 感度分析 2 を実行した行列後の V
C1
C2
C3
0. 0647 0. 0048
(8229) (610)
0. 0802
0
(660)
C1
0
C2
0
C3
0
0
0
C4
0
0
0
END
OUT
0
0
0
0
0
0
合計
END
OUT
0. 9304
1
0
0
(118317)
(127156)
0. 9198
1
0
0
(7569)
(8229)
0. 6959 0. 3041
1
0
(884) (386)
(1270)
0. 9437 0. 0563
1
0
(834)
(50)
(884)
0
1
0
1
0
0
1
1
C4
C2 Stage における CRM 推進
• マーケティング−お知らせ (P0409) からお試しサービス入会案内 (P1001) 迄の流れを増
加させる. お知らせ (P0409) は直接入会のサービス案内が記載されているわけではない
が, それを契機として X 社のサービスに関心を持つユーザーが多いことを表している.
• マーケティング−レシピ (P0402) のみを閲覧し続けているユーザーはコンバージョンに
繋がりにくいので他のページへ誘導させる. 常にレシピ (P0402) のみを閲覧し続けてい
るユーザーはサイト上のサービスには関心が薄いといえるので如何にレシピから他の
ページへと誘導するのかが重要となる.
C3 Stage における CRM 推進
• お試しサービス登録完了 (P1004) 後, コンバージョン関連サービス (P0406) へ誘導させ
るとメンバーズサイトに登録しやすい. この Stage でのユーザーは購買の意思が極めて
高い. 従って, コンバージョンに関係する内容のページを閲覧させ, よりユーザーの購買
への意欲を促す必要がある.
• コンバージョン関連サービス (P0406) を閲覧した後に TOP ページ (P0100) →商品情
報−定期品 (1) 案内情報 (P0301) の後, すぐにメンバーズサイトの案内画面に誘導させる
ことが必要となる. すなわち, C1 Stage と同様に, サイトの全体的な構造が把握できる
TOP ページと主力サービスである定期品 (1) を閲覧した後に離脱させないようにする.
C4 Stage における CRM 推進
• コンバージョン (+) −注文品 (1) 注文画面とコンバージョン (+) −注文品 (1) リスト
(P0619) を閲覧し続ければ, OUT に行きにくくなる. リスト (P0619) は注文品 (1) の具
体的な商品が掲載されているページであり, サイトの魅力ある商品を載せて, スムーズ
に入力フォームへと誘導させるべきである.
31
• 注文品 (1)・買い物カゴ (P0620) からお休みサービス受付案内 (P0821) に進んだ場合,
そのまま OUT に行ってしまう可能性があるため, このパターンを起こした場合は他の
ページに誘導させることが必要となる.
32
第5章
結論
本研究ではアクセスログデータを用いてミクロ分析・マクロ分析を行った. データ機密の関
係上, 購買データ分析は行うことはできなかったが, CRM 推進システムは第二段階で構成さ
れる. 第一段階で得られた CRM 推進の結果と顧客の購買データを用いることで, これ迄にな
い CRM 推進システムを開発できる.
EC 市場の拡大から Web 上で行われるユーザーの購買行動に注目が集まっており, POS デー
タに代表されるような購買記録のみしか得られなかったものから顧客の購買前の行動を知る
ことができるようになった. アクセスログデータを活用することにより, 閲覧顧客のページア
クセスの時間的変化をリアルタイムで捉えることが可能となり, サイト訪問の進行中にユー
ザーの行動特性を解析し, その結果に基づいてマーケティングの観点から顧客に対して個別的
なアプローチを可能とする道が拓かれた. e-ビジネスにおいては, このようにリアルタイムで
判別するアルゴリズムを開発して実装することが重要視されてきている.
本論文では高い精度で優良顧客と非優良顧客を判別するアルゴリズムを提案し, その精度で
得られた UCP を用いて各ユーザーがどの Stage にいるときに, どの組み合わせで CRM 推進
を行えば最も優良顧客を増加させることができるかを示すことができた.
ミクロ分析においては各ステージにおいて高い精度を得ることができた. C1 Stage におい
て非優良な顧客を 93.32%で判別できたことは特に着目すべき点であり, これは非優良顧客に
無駄な投資をする必要がないことを意味している. C1 Stage では全てのユーザーが白紙の状
態から始まるので, 如何にして早期に非優良顧客を判別して省くことが重要となってくる. C3
Stage では逆に優良顧客 (C4) の判別の方が精度は高くなるという結果を得た. 今回分析した
サイトにおいては, C3 Stage では会員専用サイトに登録すれば C4 になる. C3 Stage において
ユーザーは, C1 Stage のようにほぼ購買に繋がりにくい膨大なユーザー数ではなく, 購買の意
思が極めて高い少数なユーザーであると考えられる. 従って, この段階まで進めば非優良顧客
よりもより優良顧客を抽出したいので C3 Stage ということを考えればこちらの方がより良い
結果といえる. マクロ分析では推移確率行列を用いた感度分析によって, 閲覧顧客が行動する
パターンをどの様に変化させれば最優良顧客が増加するのかも示すことができた. データ機密
の制約上, X 社の購買データを含めた実験・検証を行うことができなかったが, 勿論, このア
ルゴリズムは他の繰り返し購買のある EC サイトにおけるアクセスログデータにも適用可能
である. ローリングホライゾンするデータセットの量を決定することで, サーバーに耐えうる
適切なデータ量で持続的に検証することができる.
インターネットを巡回するユーザーは不特定多数存在し, 気まぐれな行動を取るため非常に
捉え難い. 本研究で開発した購買する見込みがほとんど無い C1 顧客から最も優良である C4
顧客まで判別するアルゴリズムは十分に役立つ結果を示すことができたといえるであろう.
今後の課題としては, 以下の諸点を挙げることができる. ミクロ分析においてはキーワード
や, 滞在時間等を組み入れて更に精度を高めた解析を進める必要がある. 今回は中カテゴリの
みで特性パターンや UCP を抽出してマクロ分析に適用したが, 小カテゴリでも同様にして行
う必要がある. またマクロ分析において感度分析 1 の方法では減少させる割合を一定にしてい
る為, 様々な組み合わせで行う必要がある.
33
参考文献
[1] 経済産業省 「平成 18 年度電子商取引に関する市場調査」の結果公表について (2007)
[2] 小池雄平, 菅谷健人, 住田潮, 高橋一樹, 平野智章, 山本浩平「アクセスログデータに基づ
く重要顧客の “リアルタイム” 判別」,
筑波大学システム情報工学研究科 Discussion Paper, No.1177(2007)
[3] 山本浩平「ウェブアクセスログデータを用いた閲覧者の行動解析,
筑波大学システム情報工学研究科修士論文 (2007)
[4] Pierre. B, Paolo. F and Padhraic. S 原著, 水田 正弘, 南 弘征, 小宮 由里子 共訳, 「確率
モデルによる Web データ解析法」, 森北出版 株式会社 (2007)
[5] Montgomery. A.L, Srinivasan. K, Li. S and Liechty. J.C, “Modeling Online Browsing
and Path Analysis Using Clickstream Data,”
M arketing Science, Vol. 23, No. 4, pp. 579-595, 2004
[6] Srikant. R and Yang. Y, “Mining web logs to improve website organization,”
P roceedings of the T enth International W orld W ide W eb Conf erence, pp. 430-437,
2001
[7] Zhang .Y and Jiao. J, “An associative classification-based recommendation system for
personalization in B2C e-commerce applications,”
Expert System with Applications, Vol. 33, pp. 357-367, 2007
34
謝辞
本研究を行うにあたり様々な方からご指導・ご指摘を頂きました. 特に常日頃から論理的か
つ的確な指導をご教授頂きました住田潮教授に厚く御礼申し上げます. 住田潮教授との出会い
によって自らの人生観を変えるほどの影響を受け, 私にとって恩師という言葉がまさに当ては
まります. ゼミで頂いたアドバイス・指摘も勉強になりましたが, 最も勉強になったのは先生
が歩んでこられた道から話される先生の生き方であったと思っています. このぽらーの広場で
培った 3 年間の経験はこれからの人生の中で大きな核となっていくことを確信しております.
研究室の憧れであり目標である高橋一樹先輩には, 研究の進捗を心配して戴き, 様々な面倒を
見て頂きました. 3 年間, 大変お世話になりました. 同じプロジェクトのメンバーであり常に頼
れる後輩として支えてくれた平野智章君に感謝致します. 楊さん, 左さん, 小池君, 金さん, 盧
さん, 高君, 足立君にも大変お世話になりました. また, 今回データを提供して頂きました株式
会社 環様によって研究を行うことができました. この場を借りて皆様に深く感謝の意を示し
ます. 最後に大学院まで進学したいと申し出たときに, 文句の一言も言わずに肩を押してくれ
た両親に感謝致します.
35
付 録A
表 A.1: カテゴリリスト (1)
大カテ
ゴリ ID
P01
P01
P01
P02
P02
P02
P03
P03
P03
P03
P03
P03
P03
P03
P03
P04
P04
P04
P04
P04
P04
P04
P04
P04
P04
大カテゴリ名
ページ
TOP ページ
TOP ページ
基本情報
基本情報
基本情報
商品情報
商品情報
商品情報
商品情報
商品情報
商品情報
商品情報
商品情報
商品情報
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
TOP
中カテゴ
リ ID
P0100
P0100
P0100
P0200
P0200
P0200
P0301
P0301
P0301
P0302
P0302
P0302
P0303
P0304
P0305
P0401
P0401
P0401
P0401
P0401
P0401
P0401
P0401
P0401
P0401
中カテゴリ名
ページ
TOP ページ
TOP ページ
基本情報
基本情報
基本情報
定期品(1)案内情報
定期品(1)案内情報
定期品(1)案内情報
定期品(2)案内情報
定期品(2)案内情報
定期品(2)案内情報
注文品(1)案内情報
注文品(2)案内情報
厳選
イベント・取り組み
イベント・取り組み
イベント・取り組み
イベント・取り組み
イベント・取り組み
イベント・取り組み
イベント・取り組み
イベント・取り組み
イベント・取り組み
イベント・取り組み
TOP
36
小カテゴ
リ ID
P010001
P010002
P010003
P020001
P020002
P020003
P030101
P030102
P030103
P030201
P030202
P030203
P030301
P030401
P030501
P040101
P040102
P040103
P040104
P040105
P040106
P040107
P040108
P040109
P040110
小カテゴリ名
ページ
はじめに
X 社へようこそ
会社概要
プライバシーポリシー
サイトマップ
定期品(1)案内一覧
定期品(1)紹介
定期品(1)案内情報
地区毎の案内情報(1)
地区毎の案内情報(2)
地区毎の案内情報(3)
注文品(1)商品紹介
注文品(2)商品紹介
厳選の商品
イベント・取り組み(1)
イベント・取り組み(2)
イベント・取り組み(3)
イベント・取り組み(4)
イベント・取り組み(5)
イベント・取り組み(6)
イベント・取り組み(7)
イベント・取り組み(8)
イベント・取り組み(9)
イベント・取り組み(10)
TOP
表 A.2: カテゴリリスト (2)
大カテ
ゴリ ID
大カテゴリ名
P04
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
P04
P04
P04
P04
P04
P04
P04
P04
中カテゴ
リ ID
中カテゴリ名
P0402
レシピ
レシピ
レシピ
レシピ
web 広告
レシピ
P0404
Q&A
P0402
P0402
P0402
P0402
P0403
小カテゴリ
ID
P040201
P040202
P040203
P040204
P040301
P040201
P040401
P0405
アフィリエイト
P040501
マーケティング
P0406
サービス案内画面
P040601
P04
マーケティング
P0406
サービス案内画面
P040602
P04
マーケティング
P0406
サービス案内画面
P040603
P04
マーケティング
P0406
サービス案内画面
P040604
P04
P04
P04
P04
P04
P04
P04
P04
P04
P04
P04
P05
P05
P05
P05
P05
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
マーケティング
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
P0406
P0407
P0408
P0409
P0409
P0409
P0409
P0409
P0409
P0409
P0409
P0501
P0501
P0501
P0501
P0501
サービス案内画面
ログインページ
ログインエラー
お知らせ
お知らせ
お知らせ
お知らせ
お知らせ
お知らせ
お知らせ
お知らせ
商品検索
商品検索
商品検索
商品検索
商品検索
37
P040605
P040701
P040801
P040901
P040902
P040903
P040904
P040905
P040906
P040907
P040908
P050101
P050102
P050103
P050104
P050105
小カテゴリ名
レシピ(1)
レシピ(2)
レシピ(3)
レシピ(4)
web 広告
レシピ(1)
商品・サービス Q&A
アフィリエイト
会員サービスセンタ
ーご利用案内
ご利用案内
メンバーサイト
ご利用案内
メンバーサイト登録
申請画面
友人紹介(案内画面)
ログインページ
ログインエラー
お知らせ(1)
お知らせ(2)
お知らせ(3)
お知らせ(4)
お知らせ(5)
お知らせ(6)
お知らせ(7)
お知らせ(8)
商品検索(1)
商品検索(2)
商品検索(3)
商品検索(4)
商品検索(5)
大カテゴ
リ ID
P05
P05
P05
P05
P05
P05
P05
P05
P05
P05
P05
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
表 A.3: カテゴリリスト (3)
大カテゴリ名
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員専用メニュー
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
会員コンバージョ
ン(+)
中カテゴ
リ ID
P0501
P0502
P0502
P0502
P0502
P0502
P0502
P0503
P0503
P0503
P0503
P0601
P0602
P0603
P0604
P0605
P0606
P0607
P0607
P0608
P0609
中カテゴリ名
商品検索
お気に入り
お気に入り
お気に入り
お気に入り
お気に入り
お気に入り
購買履歴
購買履歴
購買履歴
購買履歴
友人紹介
(入力フォーム)
友人紹介
(入力確認)
友人紹介
(送信完了)
注文品(1)注文
(入力フォーム)
注文品(1)注文
(入力確認)
注文品(1)注文
(送信完了)
定期品(2)変更・注
文(入力フォーム)
定期品(2)変更・注
文(入力フォーム)
定期品(2)変更・注
文(入力確認)
定期品(2)変更・注
文(送信完了)
38
小カテゴリ
ID
P050106
P050201
P050202
P050203
P050204
P050205
P050206
P050301
P050302
P050303
P050304
P060101
小カテゴリ名
商品検索(6)
お気に入り(1)
お気に入り(2)
お気に入り(3)
お気に入り(4)
お気に入り(5)
お気に入り(6)
購買履歴(1)
購買履歴(2)
購買履歴(3)
購買履歴(4)
友人紹介
(入力フォーム)
P060201
友人紹介(入力確認)
P060301
友人紹介(送信完了)
P060401
P060501
P060601
P060701
P060702
P060801
P060901
注文品(1)注文
(入力フォーム)
注文品(1)注文
(入力確認)
注文品(1)注文
(送信完了)
定期品(2)変更・注文
(入力フォーム)
定期品(2)変更・注文
(入力フォーム)
定期品(2)変更・注文
(入力確認)
定期品(2)変更・注文
(送信完了)
表 A.4: カテゴリリスト (4)
大カテゴ
リ ID
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
P06
大カテゴリ名 中カテゴリ
ID
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
P0610
P0610
P0611
P0612
P0613
P0614
P0615
P0616
P0617
P0618
中カテゴリ名
注文品(2)変更・注
文(入力フォーム)
注文品(2)変更・注
文(入力フォーム)
注文品(2)変更・注
文(入力確認)
注文品(2)変更・注
文(送信完了)
ギフト注文
(入力フォーム)
ギフト注文
(入力確認)
ギフト注文
(送信完了)
限定アイテム
(入力フォーム)
限定アイテム
(入力確認)
限定アイテム
(送信完了)
小カテゴ
リ ID
P061001
P061002
P061101
P061201
P061301
P061401
P061501
P061601
P061701
P061801
小カテゴリ名
注文品(2)変更・注文(入
力フォーム)
注文品(2)変更・注文(入
力フォーム)
注文品(2)変更・注文(入
力確認)
注文品(2)変更・注文(送
信完了)
ギフト注文
(入力フォーム)
ギフト注文
(入力確認)
ギフト注文
(送信完了)
限定アイテム
(入力フォーム)
限定アイテム
(入力確認)
限定アイテム
(送信完了)
P0619
注文品(1)リスト
P061901
注文品(1)リスト
P0619
注文品(1)リスト
P061902
注文品(1)リスト(買い
物かごからきた場合)
P0620
注文品(1)カート
P062001
注文品(1)買い物
P0620
注文品(1)カート
P062002
P0620
注文品(1)カート
P062003
P0620
注文品(1)カート
P062004
39
注文品(1)買い物
(商品追加)
注文品(1)買い物
(カタログ→カート)
注文品(1)買い物再計算
(数量変更時)
表 A.5: カテゴリリスト (5)
大カテゴ
リ ID
P06
P06
P06
P06
P06
P06
大カテゴリ名 中カテゴリ
ID
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
会員コンバージ
ョン(+)
P0620
P0621
P0622
P0623
P0624
P0625
P07
会員コンバージ
ョン(0)
P0701
P07
会員コンバージ
ョン(0)
P0701
P07
会員コンバージ
ョン(0)
P0702
P07
会員コンバージ
ョン(0)
P0702
P07
会員コンバージ
ョン(0)
P0703
P07
会員コンバージ
ョン(0)
P0703
P07
会員コンバージ
ョン(0)
P0704
中カテゴリ名
注文品(1)カート
定期品(2)変更
(その他)
注文品(2)変更
(その他)
限定アイテム
(その他)
ギフト注文
(その他)
友人紹介(その他)
会員情報変更・パ
スワード再発行
(入力フォーム)
会員情報変更・パ
スワード再発行
(入力フォーム)
会員情報変更・パ
スワード再発行
(入力確認)
会員情報変更・パ
スワード再発行
(入力確認)
会員情報変更・パ
スワード再発行
(送信完了)
会員情報変更・パ
スワード再発行
(送信完了)
会員コンバージョ
ン(0)その他
40
小カテゴリ
ID
P062005
P062102
P062202
小カテゴリ名
注文品(1)買い物
商品取消
定期品(2)変更(戻
る)
注文品(2)変更(戻
る)
P062301
限定アイテム(戻る)
P062401
ギフト注文(入力)
P062501
友人紹介(戻る)
P070101
会員情報変更・注文
(入力フォーム)
P070102
パスワード再発行
(入力フォーム)
P070201
会員情報変更
(入力確認)
P070202
パスワード再発行
(入力確認)
P070301
会員情報変更
(送信完了)
P070302
パスワード再発行
(送信完了)
P070401
会員情報変更(戻る)
表 A.6: カテゴリリスト (6)
大カテゴ
リ ID
P07
P08
P08
P08
P08
P09
P09
P09
P10
P10
P10
P10
P10
P10
P10
大カテゴリ名 中カテゴリ
ID
会員コンバージ
ョン(0)
会員コンバージ
ョン(-)
会員コンバージ
ョン(-)
会員コンバージ
ョン(-)
会員コンバージ
ョン(-)
メンバーズサイ
ト登録
メンバーズサイ
ト登録
メンバーズサイ
ト登録
お試しサービス
入会
お試しサービ
ス入会
お試しサービス
入会
お試しサービス
入会
お試しサービス
入会
お試しサービス
入会
お試しサービス
入会
P0704
P0801
P0802
P0803
P0804
P0901
P0902
P0903
P1001
P1002
P1003
P1004
P1005
P1005
P1005
中カテゴリ名
会員コンバージョ
ン(0)その他
サービス休止受付
(入力フォーム)
サービス休止受付
(入力確認)
サービス休止受付
(送信完了)
サービス休止受付
(その他)
メンバーズサイト
登録(入力フォー
ム)
メンバーズサイト
登録(入力確認)
メンバーズサイト
登録(送信完了)
お試しサービス入
会(入力フォーム)
お試しサービス
入会(商品選択)
お試しサービス入
会(入力確認)
お試しサービス入
会(送信完了)
お試しサービス入
会(その他)
お試しサービス入
会(その他)
お試しサービス
入会(その他)
41
小カテゴリ
ID
P070402
P080101
P080201
P080301
P080401
P090101
P090201
P090301
P100101
P100201
P100301
P100401
P100501
P100502
P100503
小カテゴリ名
パスワード再発行
(戻る)
サービス休止受付
(入力フォーム)
サービス休止受付
(入力確認)
サービス休止受付
(送信完了)
サービス休止受付
(戻る)
メンバーズサイト登
録(入力フォーム)
メンバーズサイト登
録(入力確認)
メンバーズサイト登
録(送信完了)
お試しサービス入会
(入力フォーム)
お試しサービス入会
(商品選択)
お試しサービス入会
(入力確認)
お試しサービス入会
(送信完了)
戻る(商品選択時)
お試しサービス入会
(スキップ)
戻る(入力フォーム
時)
表 A.7: カテゴリリスト (7)
大カテゴ
リ ID
大カテゴリ名
P11
資料請求・
問い合わせ
P1101
P11
資料請求・
問い合わせ
P1101
P11
P11
P11
P11
P11
P11
資料請求・
問い合わせ
資料請求・
問い合わせ
資料請求・
問い合わせ
資料請求・
問い合わせ
資料請求・
問い合わせ
資料請求・
問い合わせ
中カテゴ
リ ID
P1102
P1102
P1103
P1103
P1104
P1104
中カテゴリ名
資料請求・
問い合わせ
(入力フォーム)
資料請求
・問い合わせ
(入力フォーム)
資料請求・問い合
わせ(入力確認)
資料請求・問い合
わせ(入力確認)
資料請求・問い合
わせ(送信完了)
資料請求・問い合
わせ(送信完了)
資料請求・問い合
わせ(その他)
資料請求・問い合
わせ(その他)
P12
その他
P1201
その他・特定不能
ページ
P12
その他
P1201
その他・特定不能
ページ
小カテゴリ
ID
小カテゴリ名
P110101
資料請求(入力フォー
ム)
P110102
問い合わせ(入力フォ
ーム)
P110201
資料請求(入力確認)
P110202
問い合わせ
(入力確認)
P110301
資料請求(送信完了)
P110302
問い合わせ
(送信完了)
P110401
資料請求(その他)
P110402
問い合わせ(その他)
P120101
P120102
その他・特定不能ペー
ジ(コンバージョン
関連サービス)
その他・特定不能
ページ
表 A.8: C2 Stage での振り分けを改良する前の判別結果
Truth
tn
e
m
eg
du
J
C2
UpGrade 合計 Precision
C2
9,185
358 9,543 96.25%
UpGrade
793
70
863
8.11%
合計
9,978
428 10,406
Recall 92.05% 16.36%
Original
9,185
358
42
表 A.9: ξ = 0.05 で感度分析 2 を実行した行列後の V
C1
C2
C3
0. 0647 0. 0047
(8232) (599)
0. 0732
0
(603)
C1
0
C2
0
C3
0
0
0
C4
0
0
0
END
OUT
0
0
0
0
0
0
合計
END
OUT
0. 9306
1
0
0
(118325)
(127156)
0. 9268
1
0
0
(7629)
(8232)
0. 6950 0. 3050
1
0
(835) (367)
(1202)
0. 9421 0. 0579
1
0
(787)
(48)
(835)
0
1
0
1
0
0
1
1
C4
表 A.10: ξ = 0.2 で感度分析 2 を実行した行列後の V
C1
C2
C3
0. 0647 0. 0050
(8228) (631)
0. 0917
0
(754)
C1
0
C2
0
C3
0
0
0
C4
0
0
0
END
OUT
0
0
0
0
0
0
合計
END
OUT
0. 9303
1
0
0
(118298)
(127156)
0. 9083
1
0
0
(7474)
(8228)
0. 6975 0. 3025
1
0
(966) (419)
(1385)
0. 9471 0. 0529
1
0
(915)
(51)
(966)
0
1
0
1
0
0
1
1
C4
43
クラス別PV数
クラス別セッション数
C4
C4
C3
C3
C2
C2
C1
C1
0%
2
20%
~ 5PV 6~ 10PV
40%
11
~ 20PV
21
60%
~ 50PV
51
~ 100PV
80%
101
100%
~ 200PV
~
201PV
図 A.1: クラス別 PV 数
2.065%
2.415%
直帰ユーザー
27.174%
C1
C2
68.184%
20%
1
40%
2
3
4
60%
5
~7
8
~10
80%
11
~
図 A.2: クラス別アクセス数
直帰ユーザーの割合
0.162%
0%
C3
C4
図 A.3: 直帰ユーザーの割合
44
100%
アクセス数
アクセス数ランキング
アクセス数
アクセス数ランキング
C1
C2
広告
ページ
定期品(1)案内情報
資料請求・問い合わせ(入力フォーム)
基本情報
サービス案内画面
レシピ
イベント取り組み
お知らせ
資料請求・問い合わせ(入力確認)
資料請求・問い合わせ(送信完了)
TOPページ
定期品(1)案内情報
サービス案内画面
web広告
イベント取り組み
レシピ
お知らせ
資料請求・問い合わせ(入力フォーム)
注文品(2)案内情報
web
TOP
0
200000 400000 600000 800000 1000000
図 A.4: C1 アクセスランキング
0
5000 10000150002000025000300003500040000
図 A.5: C2 アクセスランキング
アクセス数
アクセス数ランキング
アクセス数
アクセス数ランキング
C3
C4
TOPページ
サービス案内画面
メンバーズサイト登録(入力確認)
定期品(1)案内情報
メンバーズサイト登録(入力フォーム)
レシピ
ログインページ
イベント取り組み
お知らせ
注文品(2)案内情報
注文品(1)リスト
注文品(1)注文(入力フォーム)
TOPページ
注文品(1)カート
ログインページ
サービス案内画面
定期品(2)変更・注文(入力フォーム)
注文品(1)注文(入力確認)
注文品(2)変更・注文(入力フォーム)
注文品(1)注文(送信完了)
0
5000
10000 15000 20000 25000 30000
0
200000 400000 600000 800000 1000000
図 A.7: C4 アクセスランキング
図 A.6: C3 アクセスランキング
45
Fly UP