Comments
Description
Transcript
携帯電話の基地局通信履歴を用いた人々の活動分析 菅野卓也・金杉洋
携帯電話の基地局通信履歴を用いた人々の活動分析 菅野卓也・金杉洋・関本義秀・柴崎亮介 A Study on Personal Activity Analysis Based on Call Detail Records Takuya KANNO, Hiroshi KANASUGI, Yoshihide SEKIMOTO and Ryosuke SHIBASAKI Abstract: Using spatial and temporal features of the telecommunication histories of mobile phones (CDRs: call detail records), classification of personal attribute through everyday use of mobile phones and estimation of using railway as feature of moving pattern have been tried. Compared with estimate of traffic mode using GNSS, which has high spatial resolution, estimate of traffic mode using CDRs, which has low spatial resolution is aimed.. In this paper, we show distribution map made using characteristic temporal vector. There are peculiarities as to person who has occupation they have to or can use mobile phone in daytime. In addition, we compared position of CDRs during moving by train with GNSS position. Keywords: 携帯電話の基地局通信履歴(CDR: call detail record),活動パターン(activity pattern),クラスタリング(clustering),交通モード推定(estimation of traffic mode) 1. はじめに 一方で,既存の大規模なインフラデータを用い 適切な都市計画や防災計画,更に日々のインフ ることで利用者端末に新たな負担をかけない移 ラマネジメントにおいて,人々の日々の活動パタ 動データとして,携帯電話の基地局通信履歴 ーンを明らかにする事は重要である.特に通勤行 (CDR: Call Detail Record)を用いた人々の活動 動の地理的分布の特徴がわかれば,都市内の交通 分析が近年注目されている(Kanasugi. H, et al, 構造の実態を把握する事ができる. 2013,金杉ら 2012).CDR は携帯電話からの通話・ 人々の日々の移動を観測する方法として携帯 データ通信に伴って時刻と基地局位置情報が記 電話の GPS 機能が挙げられ,既往研究でも GPS ロ 録されるため,携帯電話の使用を通して人々の活 グを用いた生活パターンの分類に関する研究 動を知る手がかりになる. (Witayangkurn. A, 2013)が行われている.一方で. 本論文では,CDR の時間的・空間的な特徴を利 しかし,GPS ログを継続的に取得するには専用の 用して,携帯電話の利用状況から個人属性の分類 アプリケーションが必要となり,電池の消費量が を試みると共に,移動パターンの特徴として鉄道 増えるなど,継続的に多人数の観測を行うにはま の利用状況の推定を試みる.空間的に高精度な だ課題がある. GPS 履歴を用いた交通モードの推定に対し,基地 菅野卓也 〒277-8561 千葉県柏市柏の葉 5-1- 5 局位置情報のみの粗い空間的分解能による CDR か 東京大学大学院 新領域創成科学研究科 らの推定を目指す. Phone: 03-5452-6412(内線 56412) 2. 調査データについて E-mail: [email protected] 2.1 CDR の概要 ッファ操作に焦点を当て,空間オブジェクトの 位置 CDR は,携帯電話と基地局との間で行われた通 ベクトルのユークリッド距離を計算し,多次元尺 話及びデータ通信が記録されたものであり,従来 度法を用いて CDR の時間特徴の分布図を作成す は通信インフラの障害検出や通信料金算出の基 る. 礎データとして用いられている.本論文で用いた 3.2 CDR に含まれる情報は(ユーザーID,通信開始の日 調査2の被験者の CDR の時間特徴の分布図に, 時,通信開始基地局の緯度経度,通信終了の日時, 調査で得た職業属性の情報を重ねたものを図1 通信終了基地局の緯度経度)である.また,通話と に示した.その結果,比較的同じ職業の人が近く 通信の区別の情報については含まれていない. に位置するという分布が見られた. 2.2 移動履歴調査の内容 サービス職業従事者(図 1 中 A)は,他の人と比 本研究では CDR の利用に同意を得た被験者を対 べて日中の使用が多い人や使用のピーク時間が 象に行われた2つの調査の CDR を用いた. 異なる為に,分布図において他者と離れていた. 調査1: 業務での電話使用が多い事や,仕事の時間が異な ・期間:2013 年 2 月 1 日〜2013 年 2 月 28 日 る事が考えられる.大学生・短大生・各種専門学 ・取得データ::CDR のみ 校生(図 1 中 B)については分布がばらける結果と ・データ数:1250 名分 なった.これは学業の時間が一定である場合と, ・平均通信間隔:113 分 日により異なる事がある場合によって日中の使 ・対象者: au ユーザー(LTE 非対応端末,フィー い方が異なり,分布が広がったと考えられる.事 チャーフォン含む) 務従事者(図 1 中 C)については,どの時間でも通 ・年齢・職業などの個人属性アンケートがある 信が発生しているという点が共通していた.職業 調査2: 上の特性というよりは,常駐アプリによる通信と ・期間:2013 年 2 月 1 日〜2013 年 3 月 1 日 考えられる.技術的・専門的職業従事者(図 1 中 D) ・取得データ:CDR と GPS の両方 で分布から外れている人に関しては,朝の通勤時 ・データ数:48 名分 間と昼休みに使用し,夕方以降はあまり使用して ・平均通信間隔:2.9 分 いないという点で他の人と異なっていた.帰宅時 ・対象者: Android au ユーザー(LTE 非対応) 間が一定でない為に時間帯別の使用がばらけた ・山手線,京浜東北線,埼京線,中央線,中央・総武 為か,仕事後には使用ない為等の理由が考えられ CDR の時間特徴の分布結果図及び考察 線,小田急線,常磐線,自動車の移動手段のいずれ かを週4日以上利用していること ・年齢・職業などの個人属性アンケートがある 3. CDR の時間特徴による個人属性の分類 3.1 CDR の時間特徴によるクラスタリング手法 まず 24 時間を 15 分ごと 96 個のタイムスロッ トに分割し,15 分ごとの通信時間の合計を計算す る.ここで通信時間は通信の開始と終了の時刻の 差分とした.これを ID ごとに全日数分で集計する とともに,集計した 96 個の特徴量の規格化を行 い特徴ベクトルとする.その上で,ID 間の特徴 図 1 タイムスロット毎の合計通信時間を特 徴ベクトルとした多次元尺度法の分布 る. 3 人分(A,B,C)のトリップについて,鉄道沿線か 3.3 まとめ ら 100 m のバッファで集計した結果を表2,表3 以上の結果から,CDR の時間特徴の分布図に反 に示す. 映される職業上の特徴として,サービス職業従事 表 1 通勤トリップ内の CDR の集計結果 者や学生の日中の携帯電話利用がある事が明ら かになった.また,勤務時間の差異も要因である トリップ A B C と考えられる.一方で,常駐アプリ等により日常 沿線 CDR 数 23 26 364 的に通信しているという特徴も CDR の時間特徴の 非沿線 CDR 数 27 4 146 分布図に反映される事が明らかになった. 3.4 今後の課題 表 2 通勤トリップ内の GPS 点の集計結果 CDR から人の活動を捉えるためには,利用者の トリップ 意図的な通信と常駐アプリによる定期的な通信 沿線 GPS 点数 20 3 20 を分離することが望まれる.また特徴ベクトルが 非沿線 GPS 点数 20 3 19 A B C 24 時間で区切られている為に,24 時を跨ぐ1つの ピークを2つに分断している箇所もある.連続的 三人分のトリップについてプロットし比較し なものとして捉えて分析を行う必要がある. た所,A について,GPS はほぼ正確に利用路線を表 していた.一方 CDR は路線上に記録がある場所も 4. 利用鉄道路線の推定について あるものの,路線から 500m ほど離れる点も多かっ 4.1 CDR 位置情報からの通勤区間の抽出 た.地下区間は利用していない被験者だった.B に まず(Kanasugi ら, 2013)の手法を用いて,CDR ついて,GPS は点数が少なかったものの,正確に利 の時空間情報のクラスタリングを通じて滞在地 用路線を表していた.CDR は A と比べると利用路 点を抽出する.連続する滞在の間にトリップを設 線に近かった.また地下区間について CDR のみ記 定し,午前 8 時に移動しているトリップを通勤ト 録が取れていた.C について,GPS はほぼ正確に利 リップとして抽出した.その上で,該当するトリ 用路線を表していた.CDR は A と同様に利用路線 ップに含まれる CDR のうち,鉄道の路線形状から から遠い点もあったが,B のように利用路線に近 約 100m の距離のバッファに含まれるか否かを集 い点もあった.また地下区間については CDR のみ 計する.同時に,同じトリップの時間帯に重なる 記録が取れていた.C の記録の一部と周辺の路線 GPS 履歴を抽出し,同様に GPS 位置情報が沿線バ 図を図 4 に示した.C に関しては,アンケートから ッファに含まれるかについて調査し集計した. 通勤には東金,中央・総武,東西,南北線を用いて 4.2 通勤区間の鉄道利用の推定結果と考察 いる事がわかっている. CDR の記録は都心まで存 調査1から抽出したトリップのうち,通勤トリ 在する一方,GPS の記録は地下区間の路線では得 ップが存在する人について調べた.48 人中 39 人 られず,C が地下鉄を利用している都心区間にお おり,調査期間の一ヶ月の間に平均 5 回のトリッ いては空白となっている.CDR,GPS 共に路線同士 プが検出され,最大で 15 回のトリップが抽出され が近接していない区間では記録点と路線が 1 対 1 た.午前 8 時には通勤のための移動を行っていな で対応している事がわかる.一方,路線が密集し い被験者や通勤の時間が日によって異なる被験 ている区間では 1 つの記録点が複数の路線に対応 者が存在する為に,全ての通勤トリップを抽出で する場合が多い.特に CDR の場合,基地局が近くの きていない可能性が考えられる.抽出結果のうち, 別の路線のバッファに含まれる場合もある. で,常駐アプリ等により日常的に通信していると いう特徴も CDR の時間特徴の分布図に反映される 事が明らかになった.また空間的特徴に関しては どの地域からどのような経路で通勤移動がされ ているかという基準での分類を行うために,CDR からの利用路線の推定を目標とした.今回の研究 図 2 トリップ C の通勤トリップの一部における 周辺路線図と,その 100m 沿線に含まれる CDR(赤) と GPS(青)のログ では,通勤トリップに路線の沿線 100m 以内にある 基地局が含まれており,その分布が 5 分毎に記録 される GPS ログと同等に扱える可能性がある事が 明らかになった. 以上の事から,鉄道を用いた通勤トリップに含 今後の課題として, 利用者の意図的な通信と まれる CDR 及び GPS を路線の沿線 100m に絞り 常駐アプリによる定期的な通信の分離及び CDR か 抽出すると,郊外部においては,CDR は GPS の記 らの利用路線推定が挙げられる. 録と比べて分布やその数は同等であると見積る 事ができる.地下区間については,地上区間と比べ 謝辞 て GPS は記録数が減る一方で,CDR は一定の記録 本研究にあたり,KDDI 株式会社の携帯電話の基 が残る事がわかった. 地下区間においては,駅や 地局通信履歴を使用させていただきました.ここ 駅間の電波を中継する子機を介して地上の基地 に感謝の意を申し上げます. 局との通信が行われる.C の通勤トリップにおい ては東西線を利用しているが,CDR には東西線と 参考文献 接続する別の路線の近くの基地局の位置情報が Witayangkurn Apichon,2013, A STUDY ON HUMAN 記録されていた.このため,路線が密集する地下区 ACTIVITY ANALYSIS WITH LARGE SCALE GPS DATA 間においては,基地局と利用路線は一対一に対応 OF MOBILE PHONE USING CLOUD COMPUTING しない事が明らかになった.この点から, 地下区 PLATFORM, 東京大学大学院工学研究科社会基 間も含めた人の動きを知る上では,GPS よりも 盤学専攻,博士論文 CDR の方に優位性があるものの,利用路線の特定 Kanasugi. H, Sekimoto. Y, Kurokawa. M, には課題が残されている. Watanabe. T, Muramatsu. S, Shibasaki. R, 4.3 今後の課題 2013, Spatiotemporal Route Estimation 沿線 CDR の記録点が,どの路線の沿線であると Consistent with Human Mobility Using 判定された情報から,利用路線の推定ができる可 Cellular Network Data, Proceedings of 能性がある. PerMoby2013, pp.267-272 金杉洋, 関本義秀, 黒川茂莉, 渡邉孝文, 村松 5. お わ り に 茂樹, 柴崎亮介, 2012, 携帯電話基地局通信 今回の分析では,携帯電話の基地局通信履歴か 履歴に基づく人の移動行動の推定可能性に関 ら時間的特徴・地理空間的特徴により人の活動を する研究 , 地理情報システム学会講演論文集 分類する事を試みた. 今回の手法を用いた CDR の CD-ROM, Vol.21 時間特徴の分析においては,日中の携帯電話利用 や勤務時間の差異が特徴として反映された.一方