Comments
Description
Transcript
社会心理モデルとシミュレーション 今日のお話
2013/7/12 コンピュータモデルで社会を見る 社会心理モデルとシミュレーション システム創成学専攻 鳥海不二夫 今日のお話 • 公共財ゲーム再び – 公共財ゲームで協調を促進するには? • 様々な社会シミュレーション – なぜ中華街が出来るのか – 地震の時渋谷の街からどう逃げる? – 被災者を救うための最適戦略とは? – 情報量が増えたとき誰が影響力を持つのか 1 2013/7/12 公共財ゲーム • 公共財ゲーム(Public Goods Game)とは – 全員が協力し合うと幸せな世界 – 一人だけ裏切っても影響が小さい • たとえば・・・ – ある漁港を考える – 一定の水揚げ量を守るとずっと魚が捕れて幸せ – 一人だけ裏切るといっぱい魚が捕れて超幸せ – 全員が裏切ると魚が捕れなくなって不幸 公共財ゲーム • 囚人のジレンマの1対多への拡張 – 仮想的に2x2ゲームとして定式化可能 • ある資源をどのように使うか – 協調:決められた量だけ利用する – 裏切り:自分だけたくさん使う みんなが協調 みんなが裏切り 自分が協調 割と嬉しい 一人だけ 悲しい 自分が裏切り 一番うれしい 誰も うれしくない 2 2013/7/12 公共財ゲームで 協調を促進する ためには? 公共財ゲームにおける協調の促進 • 規範ゲーム – 裏切りに対する罰則(規範) • 裏切りが発見されると罰せられる • メタ規範ゲーム – 罰しないことに対する罰則(メタ規範) • 裏切りを見ても罰しないと罰せられる • メタ規範の存在が協調を促進 Axelrod, R.: An Evolutionary Approach to Norms, American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986) 3 2013/7/12 懲罰によるメタ規範 罰する 裏切り者 罰しない人を 罰する 罰しない メタ規範ゲーム • エージェントは「大胆さ」と「復讐度」の2つのパラメータ を持つ – 大胆さ(B)=裏切る確率 – 復讐度(V)=裏切りを罰する確率 n人囚人のジレンマ 0 裏切らない -1 裏切る -1 -1 0 3 -1 0 0 -1 0 0 4 2013/7/12 メタ規範ゲーム • エージェントは「大胆さ」と「復讐度」の2つのパラメータ を持つ – 大胆さ(B)=裏切る確率 – 復讐度(V)=裏切りを罰する確率 規範ゲーム -1 裏切りを発見&罰しない 裏切りを発見&罰する -2 -1 裏切る メタ規範ゲーム -1 -1 -9 -1 -1 3 3 -1 -1 -1 -1 -9 裏切る 裏切り罰しない ことを発見 &罰する -2 メタ規範ゲーム k doesn’t punish j j doesn’t punish i Vk i defects i gets T others get H Vj k gets E’ j gets P’ k punishes j j gets E i gets P j punishes i S<B T=3 H=-1 E=-9 P=-2 E’=-9 P’=-2 Axelrod, R.: An Evolutionary Approach to Norms, American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986) 5 2013/7/12 Axelrod実験(規範ゲーム) 協調の崩壊 協調の達成 • 協調する場合としない場合が存在 – 常に強調するわけではない Axelrodの実験(メタ規範) 協調の達成 協調の達成 6 2013/7/12 メタ規範の超長期における崩壊 • 超長期間後に崩壊する – メタ規範でも安定とは言えない Boldness Vengefulness 社会的ワクチンの導入 • 社会的ワクチン – ごく少数、常に裏切るエージェントを導入 – ワクチン:弱毒化した病原体を接種することで抗体を つくり予防 – ここでは、常に裏切るエージェント=ワクチン=5% – 社会的ワクチン=(裏切り,懲罰)=(B,V)=(1,0) • 少数の病原体(裏切り)に接することで、免疫を 作る – 病原体に対する抵抗力=懲罰の必要性の認識 7 2013/7/12 社会的ワクチンの有無による試行例 ワクチンなし ワクチンあり • ワクチンなしでは、協調達成時に復讐度が減 少することを防ぐことができない – 警戒心がなくなる 悪人がいないと 世の中うまく 回らないものなのか? 8 2013/7/12 飴と鞭 規範は罰だけではない • 協調者へ報酬 – 協調したことに対して報酬を与える – 報酬によって協調が促進 • 報酬者へのメタ報酬 – 報酬を与えたことに対する報酬 • 報酬とは? – あらゆるタイプの利得 – 賞金,褒める,承認する・・・etc 9 2013/7/12 一般化メタ規範ゲーム k doesn’t punish j j doesn’t punish i Vk i defects i gets T others get H k gets E’ j gets P’ k punishes j k doesn’t reward j Vj j gets E i gets P Lk k gets C’ k rewards j j gets R’ j punishes i S<B k doesn’t punish j j doesn’t reward i Vk i cooperats 協調 i gets F others get M k gets E’’ j gets P’’ k punishes j Lj k doesn’t reward j j gets C i gets R j rewards i Lk k gets C’’ k rewards j j gets R’’ 従来の議論 • 報酬では協調は促進されづらい ・Sutter, M., Haigner, S., and Kocher, M. G.: Choosing the Carrot or the Stick? Endogenous Institutional Choice in Social Dilemma Situations, Review of Economic Studies, Vol. 77, No. 4, pp. 1540–1566 (2010) ・Hilbe, C. and Sigmund, K.: Incentives and opportunism: from the carrot to the stick Proc. R. Soc. B, Vol. 277, pp. 2427–2433 (2010) – メタ報酬ゲームで協調は促進されるのか? • 二つのゲームを比較 – メタ懲罰ゲーム • Axelrodによるメタ規範ゲーム – メタ報酬ゲーム • ソーシャルメディアをモデル化したメタ規範ゲーム 10 2013/7/12 一般化メタ規範ゲーム メタ懲罰ゲーム k doesn’t punish j j doesn’t punish i Vk i defects i gets T others get H k gets E’ j gets P’ k punishes j k doesn’t reward j Vj j gets E i gets P Lk k gets C’ k rewards j j gets R’ j punishes i S<B k doesn’t punish j j doesn’t reward i Vk i cooperats 協調 i gets F others get M k gets E’’ j gets P’’ k punishes j Lj k doesn’t reward j メタ報酬ゲーム j gets C i gets R j rewards i Lk k gets C’’ k rewards j j gets R’’ シミュレーション条件(1) • シミュレーションステップ数:10000 • エージェント数:N=20 • ネットワーク:完全ネットワーク • エージェントの進化 – Bi, Vi, Liをより利得が高いエージェントからコピー – 遺伝的アルゴリズム • 一様交叉 • 突然変異率: 0.01 11 2013/7/12 シミュレーション条件(2) メタ懲罰ゲーム メタ報酬ゲーム 値 値 裏切り利得T 裏切られた痛手H 懲罰コストE 3.0 -1.0 -2.0 協調コストF 協調利得M 報酬コストC -3.0 1.0 -2.0 懲罰痛手P メタ懲罰コストE’’ -9.0 -2.0 報酬利得R メタ報酬コストC’’ 9.0 -2.0 メタ懲罰痛手P’’ -9.0 メタ報酬利得R’’ 9.0 メタ報酬ゲーム +1 協調 +1 +1 S<B j doesn’t reward i i cooperats -3 協調 i gets F others get M Lj k doesn’t reward j +1 +1 メタ報酬ゲーム j gets C i gets R j rewards i Lk k gets C’’ k rewards j j gets R’’ 12 2013/7/12 メタ報酬ゲーム 協調者への報酬 協調者を発見&報酬を与える -2 協調 S<B +9 j doesn’t reward i i cooperats 協調 i gets F others get M Lj k doesn’t reward j j gets C i gets R メタ報酬ゲーム Lk k gets C’’ k rewards j j gets R’’ j rewards i メタ報酬ゲーム 協調へのメタ報酬 協調を発見&報酬 +9 協調 S<B j doesn’t reward i i cooperats -2 協調 i gets F others get M Lj k doesn’t reward j 報酬を与えたことを発見 &報酬 メタ報酬ゲーム j gets C i gets R j rewards i Lk k gets C’’ k rewards j j gets R’’ 13 2013/7/12 進化 高い利得のエージェントをコピー 利得の高いエージェント GAによる進化 エージェントパラメータ 協調率:L 報酬率:V 報酬ゲーム 14 2013/7/12 メタ懲罰ゲーム メタ報酬ゲーム 15 2013/7/12 一般化メタ規範ゲームにおける 協調の進化 • メタ懲罰ゲーム – 当初は協調が支配的 – あるタイミングで裏切りが支配 • 裏切り者を罰するエージェントがいなくなることが原因 • メタ報酬ゲーム – 完全協調支配ではないが協調が多い • 協調者へ報酬を与えるエージェントが常に多数 メタ報酬系のシステムは 協調を促進しやすい メタ報酬ゲームの例 • たとえばソーシャルメディア – 罰則機能は導入困難 • 情報提供しないユーザを罰を与えられない – 情報提供者への報酬は可能 • コメント,「いいね」ボタン,ポイント • メタ報酬ゲーム – 報酬・報酬への報酬(メタ報酬) 16 2013/7/12 ソーシャルメディアにおける行動 SNS Q&Aサイト サイト レシピ投稿 サイト 協調 日記の投稿 質問の投稿 レシピ投稿 報酬 コメント メタ報酬 コメントへの 回答への 返信 お礼・ポイ ント 回答の投稿 感想の投稿 感想への お礼 利得は妥当か? メタ報酬ゲーム 値 利得がコストに比べて 非常に高い 協調コストF 協調利得M 報酬コストC -3.0 1.0 -2.0 報酬利得R メタ報酬コストC’’ 9.0 -2.0 メタ報酬利得R’’ 9.0 17 2013/7/12 コストと利得 • メタ報酬ゲームにおけるコストと利得 – 利得とコストにどのような関係があれば協調が進 化するのか 値 • コストの変化 -3.0 協調コストF – C=C’’=c – 0≦c≦10 1.0 協調利得M • 利得の変化 c 報酬コストC – R=R’’=r r 報酬利得R – 0≦r≦10 c メタ報酬コストC’’ メタ報酬利得R’’ r シミュレーション条件 • • • • • • シミュレーションステップ数:10000 エージェント数:N=20 ネットワーク:完全ネットワーク c=2.0固定 0≦r≦10 100回シミュレーションの平均 18 2013/7/12 利得による協調の変化 c=2.0,0≦r≦10 シミュレーション条件 • • • • • • シミュレーションステップ数:10000 エージェント数:N=20 ネットワーク:完全ネットワーク 0≦c≦10(0.1刻み) 0≦r≦10(0.1刻み) 100回シミュレーションの平均 19 2013/7/12 コストと利得による協調率の変化 協調率 被報酬利得(r) 報酬コスト(c) コストと利得による協調率の変化 • 利得がコストを上回ったとき協調が支配的 – r(利得)>c(コスト)+ε – エージェント数が変化しても同様の結果 • ソーシャルメディアでいえば – Facebookのいいね!ボタン • 低いコスト・低い利得 – Q&Aサイトの回答 • 高いコスト・高い利得 ⇒情報に対する反応システムの設計へ応用 20 2013/7/12 結論 • 公共財ゲームにおける協調の実現 – メタ規範という考え方 • メタ懲罰 • メタ報酬 • メタ報酬ゲームで協調を実現 – 100%協調ではないが,おおむね協調が支配的 • 協調促進は報酬とそのコストで説明可能 – たとえば:ソーシャルメディア⇒報酬とコストの設計 が重要 今日のお話 • 公共財ゲーム再び – 公共財ゲームで協調を促進するには? • 様々な社会シミュレーション – なぜ中華街が出来るのか – 地震の時渋谷の街からどう逃げる? – 被災者を救うための最適戦略とは? – 情報量が増えたとき誰が影響力を持つのか 21 2013/7/12 分居モデル • 人種の分居モデル – シェリング(1971) • アメリカの住居分布を見ると人種ごとに固 まって暮らしている – 黒人は黒人同士 – ヒスパニックはヒスパニック同士 • 仮説:人々は自分の周りにいる人が同じ人種 の場合安心して暮らせる 分居モデルの概要 • NxNのセル世界 – 各セルが1エージェント • エージェントに与えられたルール 1. 周りの多くが自分と同じならば満足する 2. 自分と異なるエージェントが多ければ移動する 満足 不満足 22 2013/7/12 分居モデルの結果 • シミュレーションを繰り返すと,徐々に同じタイ プのエージェントが集まる – 満足と移動という2つのルールだけで分居を表現 – シンプルなモデルから分居が発生するメカニズム を発見 http://www.waseda.jp/wias/researchers/monthly/spot_k_yamamoto.htmlより 今日のお話 • 公共財ゲーム再び – 公共財ゲームで協調を促進するには? • 様々な社会シミュレーション – なぜ中華街が出来るのか – 地震の時渋谷の街からどう逃げる? – 被災者を救うための最適戦略とは? – 情報量が増えたとき誰が影響力を持つのか 23 2013/7/12 帰宅困難者対応 • 規模 – 首都圏直下型:650万人 – 東日本大震災:300~400万人 • 各機関の連携した支援の必要性 – 国、都県、市区、消防、警察 – 公共交通機関、電力、ガス、水道 – 周辺地域:飲食店、コンビニ、パブリックビジョン • 帰宅困難者の行動予測が必要 – 情報提供の効果 – 訓練支援 人流シミュレーションによる避難予測 • 情報提供例: – 帰宅困難者へのパブリックビューイング(PV)を含めた 情報配信 – 広域の集中緩和が実現できるか? • 避難シミュレーションNetMASによる検証 – 対象地区:渋谷駅周辺地域(3km×2.5km) – 対象者数:約4万人・1時間の移動 – 2つのシナリオの比較 1. 最悪のシナリオ:情報がないので渋谷駅に立ち寄る 2. 最善のシナリオ:配信された情報に基づいて行動 » オフィスに待機、避難所へ移動、帰宅可能な人は帰宅 24 2013/7/12 社会的影響の評価 • シミュレーションの利用:混雑の比較 – 帰宅困難者の混雑に対するPVを含めた情報配信の効果の検証 シナリオ1:全員情報なし シナリオ2:全員情報あり 現実は二つの間 のどこか できるだけ 右側に!! 赤い部分 混雑 • 災害時に機能する情報システムの必要性 – 大災害時でも機能するために必要な機能は? – どの程度の普及が必要か? どんな情報を流すか? 今日のお話 • 公共財ゲーム再び – 公共財ゲームで協調を促進するには? • 様々な社会シミュレーション – なぜ中華街が出来るのか – 地震の時渋谷の街からどう逃げる? – 被災者を救うための最適戦略とは? – 情報量が増えたとき誰が影響力を持つのか 25 2013/7/12 レスキューシミュレーション • 目的:自律ロボットによる災害救助活動 • 災害時におけるあらゆる事象をシミュレーション • 役割の異なる自律エージェントによる救助活動 – – – – 救急隊 自衛隊 消防隊 市民 :市民の救助 :がれきの撤去 :火災の消火 :救助対象 • 複数エージェントによる協調行動 世界大会が毎年開催 街を火災から守り人を助ける 救急隊 自衛隊 消防隊 市民 :市民の救助 :がれきの撤去 :火災の消火 :救助対象 26 2013/7/12 どのような戦略が 効率的な救助につながるのか? • 様々な場所 – 神戸,パリ,架空都市・・・ – できる限りリアルな地図を再現 • 様々なシチュエーション – 大規模火災を伴う地震 – 津波による浸水 – 隕石の落下(!?) – ゴジラが歩いた(・・・) 今日のお話 • 公共財ゲーム再び – 公共財ゲームで協調を促進するには? • 様々な社会シミュレーション – なぜ中華街が出来るのか – 地震の時渋谷の街からどう逃げる? – 被災者を救うための最適戦略とは? – 情報量が増えたとき誰が影響力を持つのか 27 2013/7/12 膨大な知識を持つ人々 • 知識共有の目的 – 個々人が持つ知識量の増加 • 膨大な知識を持つ人々とは – インフルエンサー論(集団の意思決定に対して、 強い影響を及ぼす少数の人々,Merton 1957) – イノベータ論(商品の普及過程において、最初期 に商品を導入する人々,Rogers 1962) 情報流通量等の推移(H8=100) 入手しうる情報量は10年で530倍 *総務省平成18年度情報流通センサスより再作成 28 2013/7/12 情報が多様化した社会 • ビッグデータの時代 – 個人が入手しうる情報の量が爆発的に増加 情報が多様化した状況でも知識が 多いことは良いことか? 情報伝播モデルにより 知識の量と影響力の関係を評価 情報伝播モデル • 情報 – 総情報数M – 情報の種類 {b1 , b2 , b3, ・・・ , bM } 例:携帯電話キャリア( b1 :A社, b2 :B社…) • 人間(エージェント) ai – 保持可能情報数 ci b1, b1, b1 b1, b1, b2 b2, b3 保持可能情報数=8 29 2013/7/12 情報伝播の概要 • 集団内で、ランダムに情報伝播が発生 b1 b2 b1 影響力による評価 • 知識を多く持つ人物 • 周囲への影響力大(Merton,Rogers) 情報伝播に対する影響力 • 影響力が大きいエージェントとは – 多くのエージェントへ情報を伝播 – 他のエージェントに伝えた情報がさらに伝播 30 2013/7/12 エージェント間の影響力 情報bkが伝播した経路 a1 1/4 a2 1/2 a3 1 a4 aiのajに対する影響力 :経路の集合 :aiとajの距離 シミュレーション • 目的 – 情報が多様化した社会において、影響力を持つ エージェントの分析 • 設定 – 情報量の変化は影響力のある人を変化させるか – どのような人が影響力を持つのか • 評価指標 – 最も広まった情報における各エージェントの影響力 31 2013/7/12 Rogersの普及曲線 • 一種類の財・情報が普及する過程をプロット エージェントの分類 • Rogersの分類を参考 採 用者数 アーリー アダプター イノベータ フェロワー 2.5% 84% 13.5% 採用時期(経過時間) 32 2013/7/12 エージェントの設定 2 保持可能 情報数 100 12 10 62 1 人数 イノベータ アーリー アダプター フェロワー • 保持可能情報数はBarabási(2002)の議論を参 エージェントの種類ごとの影響力 情報伝播に対する影響 力 影響力:イノベータ:アーリーアダプター 影響力:イノベータ<アーリーアダプター 存 の結果と一 とは異なる結果 33 2013/7/12 知識のフラット化 発信する情報を できていない状 自分が持つ情報の価値を づけできていない状 知識・情報の価値がフラットな状 現実には • 膨大な知識を持つ人々(オタク・マニア) – 膨大な知識を持つ に知識に づけできない – ちょっとした質問に様々な答えを返し、質問者を 混 させる、あるいは影響を与えられない • 情報を適度に持つ人々 – 情報を みを持つ し、限定することで必要な情報の 34 2013/7/12 情報が多様化した社会における 影響力の分析 • 所持する情報量と影響力 – 情報の種類が増加 – 知識がフラット化したイノベータが存在 – イノベータの影響力が低下 アーリーアダプタの影響力が最大に 今日のお話 • 公共財ゲーム再び – 公共財ゲームで協調を促進するには? • 様々な社会シミュレーション – なぜ中華街が出来るのか – 地震の時渋谷の街からどう逃げる? – 被災者を救うための最適戦略とは? – 情報量が増えたとき誰が影響力を持つのか 35 2013/7/12 社会シミュレーション • コンピュータによる人間社会の再現 – どうすれば金 は防げるのか – なぜTwitterはこんなに流行ったのか – 災害救助の最適な戦略は か • コンピュータの中の社会=人 社会 • 現実社会では再現不可能な事象 シミュレーションによって確認 36