Comments
Description
Transcript
第 2 回:ルールの発 「Web アクセスログ」
【Web 連載】ビジネスを牽引させるビッグデータ活用 第 2 回:ルールの発⾒「Web アクセスログ」 データサイエンティスト 木暮大輔 第 1 回で実施した、ファネル分析の結果、サイト訪問者が資料請求というアクション(コンバージョン)にた どり着くまでに、かなりの離脱があることがわかりました。 サイト訪問者全体が最初にたどり着く当該サイトのランディングページからサイト内を回遊し、資料請求⼊⼝ ページにたどり着くまでの間の離脱、⼊⼝ページから⼊⼒フォームまでの間の離脱、資料請求を完了するまで の間の離脱は、各段階で 30%近くあることがわかり、導線設計(リンク等)を改善する対策が求められまし た。 さらに、⼊⼒フォームからの離脱が大きいことを考えて、⼊⼒フォームの簡素化を計画しました。これには、 資料請求顧客についてのより詳細な情報を得ておきたい半⾯、⼊⼒の作業を簡素化するために、取得項目の取 捨選択が⾏われました。 回遊分析 ファネル分析では、サイトの各ページをカテゴリ(ランディング、資料請求⼊⼝、資料請求フォーム)に分類 しましたが、ページ単位で⾒ていくと、ランディングページから資料請求⼊⼝に⾄るまでに、サイト訪問者は 複数のページを回遊しています。この回遊のパターンによっては、資料請求⼊⼝、⼊⼒フォーム、さらには完 了に⾄るまでの確率が異なってきます。資料請求完了に⾄る確率の⾼い回遊パターンを検出するために、回遊 分析(シーケンス分析)が⾏われました。 Web 広告 メルマガ ドロップアウト 資料 請求 検索サイト 第 2 回:ルールの発見「Web アクセスログ」 ドロップアウト 【Web 連載】ビジネスを牽引させるビッグデータ活用 シーケンス分析では、「どのページとどのページが同じセッション内で閲覧されているか」に注目 「どのページとどのページが同じセッション内で閲覧されているか」に注目 「どのページとどのページが同じセッション内で閲覧されているか」に注目します。 さらに、閲覧者が特定の前提条件を満たしたときに、どれほどの確率で結果となるページに⾄ったかも算出し ます。分析者は、前提条件を満たす⼈数(インスタンス)、または全サイト訪問者を⺟数とした⽐率(サポー ト)と、結果に⾄る確率(信頼度)を設定することで、無数の組み合わせの中からスピーディーに有意な組み ト)と、結果に⾄る確率(信頼度)を設定することで、無数の組み合わせの中からスピーディーに有意な組み 合わせを発⾒することができます。前提条件を満たす⼈数⽐がどれだけ多い回遊に着目するか、結果まで⾄る 前提条件を満たす⼈数⽐がどれだけ多い回遊に着目するか、結果まで⾄る 確率がどれだけ⾼いルールを検出したいかによって、これらの値を設定します。 Support(⽀持度) ルール「ページ B⇒ページ A」の⽀持度は 」の⽀持度はページ B の発生率で、「前提条件が発生する割合」を示します。施 が発生する割合」を示します。施 策上の意味で捉えなおすと、「ルールを適用できる割合」となります。割合ではなく 策上の意味で捉えなおすと、「ルールを適用できる割合」となります。割合ではなく、絶対数をとった絶対⽀ 持度も利用されます。この値が大きいほど信頼度の測定精度も⾼くなり、実際の分析では最低でも 100 以上は 確保することが望ましいと言えます。 Confidence(信頼度) 」について、ページ B とページ A が併起した割合を Confidence(信頼度)と呼 Confidence ルール「ページ B⇒ページ A」について、 びます。ページ B が発生した条件のもとでページ が発生した条件のもとで A が併起されることの確からしさとして解釈されます。信頼 が併起されることの確からしさとして解釈されます。 度は、0 から 1 の値をとり、これが⾼いほど併売の可能性が⾼いと考えられます。 ⾃動⾞販売会社の Web サイト訪問者 10 万⼈のうち、1 回の訪問中に「ホームページ」と「ユーザーの声」を 閲覧した⼈は 1,280 ⼈(インスタンス)で、1.28%(サポート)を占め、さらにそのうちの ⼈(インスタンス)で、1 (サポート)を占め、さらにそのうちの 56%(信頼度) が資料請求⼊⼝に到達していることを表します。 分析設定(⽀持度と信頼度)によっては、数百から数万のルールが検出されます。これら多数のルールから、 運用に結び付けたいルールを検出していく作業が、シーケンス分析の後には必要になってきます。 第 2 回:ルールの発見「Web アクセスログ」 【Web 連載】ビジネスを牽引させるビッグデータ活用 Support(⽀持度)と Lift(リフト)※1 それぞれ、信頼度の弱点を補う統計指標の⼀つです。信頼度(ページ B⇒ページ A)が⾼く、かつ⽀持度(ペー ジ B⇒ページ A)も⾼かったとしても、そもそも結果である B の発生率と変わらなければあまり有効なルール とは言えません。もしページ B の発生とページ A の発生が無関係であれば、「ページ B とページ A の併起率」 は「ページ B の発生率」となることが期待できます。 この関係を利用した指標がリフトで、A と B の相関関係の強さを表します。0 以上の値をとり、1 より大きい ほど相関関係が強い(有効な)ルールといえます。 リフトが 1 に近いほどページ B とページ A は無関係 1 より小さいほど同時には起こりにくい 1 より大きいほど同時に起こりやすい ※1 Support(⽀持度)と Lift(リフト)は、下記のような併売分析のために使用されます。 |X| |A| 全体の中で X が 買われる 確率 信頼度の弱点を補うために、Support(⽀持度)を考慮する理由は、次のようなルールを有効と判断しないた めです。たった 1 ⼈の顧客が商品 X を購⼊し、商品 Y も購⼊した実績があると、 Confidence(信頼度)は 100%となり、次に X を購⼊した顧客へのおすすめ商品が Y になるからです。 第 2 回:ルールの発見「Web アクセスログ」 【Web 連載】ビジネスを牽引させるビッグデータ活用 Lift(リフト)の分子は Confidence(信頼度)で、分⺟は Y の発生確率を表しています。何もしなくても Y を 購⼊する確率に対して、X を購⼊し、さらに Y も購⼊する⼈の確率を示しています。 分析担当 A さんは、ルール分類図の中では、多数のルールをそれらのサポートとリフトによって、下記のよう に名前を付けしました。 「流⾏り前」ルール: サポートが⾼くリフトも⾼い 「あたりまえ」ルール: サポートが⾼くリフトが低い 「目利き」ルール: サポートが低くリフトが⾼い 「はずれ」ルール: サポートが低くリフトも低い 「流⾏り前」ルールは検出の難しい希少なルールで、「目利き」ルールの認知が⾼くなったタイミングで検出 されることもあります。例えば、顧客の⽐率が低い⾞種に、その⾞種を⾼確率で購⼊する組合せを検出すると、 リフトは⾼くなります。この組合せが「目利き」ルールにあたります。 プロモーションなどにより、市場での認知が⾼まると、より広範囲の顧客に当てはまり、しかも⾼確率でリフ トする「流⾏り前」ルールが検出されます。 やがて、その組み合わせが当たり前(事前確率が⾼確率)になると、リフトは⾼くならなくなって、「あたり まえ」ルールになります。「あたりまえ」ルールは広範囲(大⼈数)に当てはまり、少しでも併買率が上がる とビジネス効果は大きいために、よく併売促進施策に用いられます。 第 2 回:ルールの発見「Web アクセスログ」 【Web 連載】ビジネスを牽引させるビッグデータ活用 上記のルールを理解した分析担当 A さんは、下記の「目利き」ルールに着目しました。 ・「ランディングページ」 ⇒ 「資料請求⼊⼝」 → 「興味のある⾞種選択」 → 「ユーザーの声」 (1,280:1.28%、0.56) そして、下記の施策を計画しました。 ・利用シーンが簡単にイメージできるような「ユーザーの声」ページを増設し、「興味のある⾞種選択」で 選択した⾞のページから、「ユーザーの声」に誘導するバナーを掲載する。 さらに、特定販売店から聞き取り調査を⾏い、「ユーザーの声」ユーザーの“ライフスタイル”に選択した⾞が どのようにマッチするか、乗⾞シーンがどれだけイメージできるかということがユーザーに響いているのでは ないかという仮説が浮かび上がってきました。これを検証するためには、さらなる分析が必要との結論になり ましたが、分析結果を待たずに、「TOP ページから、“⾞種カテゴリを選択するサイト構成”から、ユーザーの “ライフスタイル別に⾞が選択できる構成”に変更する」施策案を企画に盛り込むことを決めました。 ■分析結果を受けた施策の提案 上記の分析結果を受けて、A さんは上層部に対して 3 つの施策を提案しました。 ① 最初の検索からの該当ページ TOP10 に、ID 取得率の⾼い Top5 ページへのリンクを掲載する。 ② TOP ページに対して、「⾞種カテゴリを選択するサイト構成」からユーザーの「ライフスタイル別に⾞が 選択できる構成」に変更する。 ③ 新たに利用シーンが簡単にイメージできるようなページを設け、②で選択した⾞のページから、新しいペ ージに誘導するバナーを掲載する。 Web アクセスログの分析結果により、上記施策は効果が⾒込めると A さんは判断しました。 さらに、A さんは、Web サイト内における上記施策と合わせて、Web サイトと関連した施策を実⾏すること により、顧客獲得効果を⾼めることを検討しました。サイト訪問者中から購⼊確度の⾼い⾒込み客を抽出し、 販売店がフォローすることにより成約率を⾼める営業施策です。この施策を成功させるには、過去に蓄積した データから、⾞を購⼊した顧客と、購⼊に⾄らなかった顧客を分析し、サイト訪問者の中から購⼊の可能性が ⾼い、⾒込み客層を⾒つけることが課題でした。 (以後、次回につづく) 第 2 回:ルールの発見「Web アクセスログ」