...

社会心理モデルとシミュレーション 今日のお話

by user

on
Category: Documents
2

views

Report

Comments

Transcript

社会心理モデルとシミュレーション 今日のお話
2013/7/12
コンピュータモデルで社会を見る
社会心理モデルとシミュレーション
システム創成学専攻
鳥海不二夫
今日のお話
• 公共財ゲーム再び
– 公共財ゲームで協調を促進するには?
• 様々な社会シミュレーション
– なぜ中華街が出来るのか
– 地震の時渋谷の街からどう逃げる?
– 被災者を救うための最適戦略とは?
– 情報量が増えたとき誰が影響力を持つのか
1
2013/7/12
公共財ゲーム
• 公共財ゲーム(Public Goods Game)とは
– 全員が協力し合うと幸せな世界
– 一人だけ裏切っても影響が小さい
• たとえば・・・
– ある漁港を考える
– 一定の水揚げ量を守るとずっと魚が捕れて幸せ
– 一人だけ裏切るといっぱい魚が捕れて超幸せ
– 全員が裏切ると魚が捕れなくなって不幸
公共財ゲーム
• 囚人のジレンマの1対多への拡張
– 仮想的に2x2ゲームとして定式化可能
• ある資源をどのように使うか
– 協調:決められた量だけ利用する
– 裏切り:自分だけたくさん使う
みんなが協調
みんなが裏切り
自分が協調
割と嬉しい
一人だけ
悲しい
自分が裏切り
一番うれしい
誰も
うれしくない
2
2013/7/12
公共財ゲームで
協調を促進する
ためには?
公共財ゲームにおける協調の促進
• 規範ゲーム
– 裏切りに対する罰則(規範)
• 裏切りが発見されると罰せられる
• メタ規範ゲーム
– 罰しないことに対する罰則(メタ規範)
• 裏切りを見ても罰しないと罰せられる
• メタ規範の存在が協調を促進
Axelrod, R.: An Evolutionary Approach to Norms,
American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986)
3
2013/7/12
懲罰によるメタ規範
罰する
裏切り者
罰しない人を
罰する
罰しない
メタ規範ゲーム
• エージェントは「大胆さ」と「復讐度」の2つのパラメータ
を持つ
– 大胆さ(B)=裏切る確率
– 復讐度(V)=裏切りを罰する確率
n人囚人のジレンマ
0
裏切らない
-1
裏切る
-1
-1
0
3
-1
0
0
-1
0
0
4
2013/7/12
メタ規範ゲーム
• エージェントは「大胆さ」と「復讐度」の2つのパラメータ
を持つ
– 大胆さ(B)=裏切る確率
– 復讐度(V)=裏切りを罰する確率
規範ゲーム
-1
裏切りを発見&罰しない
裏切りを発見&罰する
-2
-1
裏切る
メタ規範ゲーム
-1
-1
-9
-1
-1
3
3
-1
-1
-1
-1
-9
裏切る
裏切り罰しない
ことを発見
&罰する
-2
メタ規範ゲーム
k doesn’t punish j
j doesn’t punish i
Vk
i defects
i gets T
others get H
Vj
k gets E’
j gets P’ k punishes j
j gets E
i gets P
j punishes i
S<B
T=3
H=-1
E=-9
P=-2
E’=-9
P’=-2
Axelrod, R.: An Evolutionary Approach to Norms,
American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986)
5
2013/7/12
Axelrod実験(規範ゲーム)
協調の崩壊
協調の達成
• 協調する場合としない場合が存在
– 常に強調するわけではない
Axelrodの実験(メタ規範)
協調の達成
協調の達成
6
2013/7/12
メタ規範の超長期における崩壊
• 超長期間後に崩壊する
– メタ規範でも安定とは言えない
Boldness
Vengefulness
社会的ワクチンの導入
• 社会的ワクチン
– ごく少数、常に裏切るエージェントを導入
– ワクチン:弱毒化した病原体を接種することで抗体を
つくり予防
– ここでは、常に裏切るエージェント=ワクチン=5%
– 社会的ワクチン=(裏切り,懲罰)=(B,V)=(1,0)
• 少数の病原体(裏切り)に接することで、免疫を
作る
– 病原体に対する抵抗力=懲罰の必要性の認識
7
2013/7/12
社会的ワクチンの有無による試行例
ワクチンなし
ワクチンあり
• ワクチンなしでは、協調達成時に復讐度が減
少することを防ぐことができない
– 警戒心がなくなる
悪人がいないと
世の中うまく
回らないものなのか?
8
2013/7/12
飴と鞭
規範は罰だけではない
• 協調者へ報酬
– 協調したことに対して報酬を与える
– 報酬によって協調が促進
• 報酬者へのメタ報酬
– 報酬を与えたことに対する報酬
• 報酬とは?
– あらゆるタイプの利得
– 賞金,褒める,承認する・・・etc
9
2013/7/12
一般化メタ規範ゲーム
k doesn’t punish j
j doesn’t punish i
Vk
i defects
i gets T
others get H
k gets E’
j gets P’ k punishes j
k doesn’t reward j
Vj
j gets E
i gets P
Lk
k gets C’ k rewards j
j gets R’
j punishes i
S<B
k doesn’t punish j
j doesn’t reward i
Vk
i cooperats
協調
i gets F
others get M
k gets E’’
j gets P’’ k punishes j
Lj
k doesn’t reward j
j gets C
i gets R
j rewards i
Lk
k gets C’’ k rewards j
j gets R’’
従来の議論
• 報酬では協調は促進されづらい
・Sutter, M., Haigner, S., and Kocher, M. G.:
Choosing the Carrot or the Stick? Endogenous Institutional Choice in Social
Dilemma Situations, Review of Economic Studies, Vol. 77, No. 4, pp. 1540–1566 (2010)
・Hilbe, C. and Sigmund, K.: Incentives and opportunism: from the carrot to the stick
Proc. R. Soc. B, Vol. 277, pp. 2427–2433 (2010)
– メタ報酬ゲームで協調は促進されるのか?
• 二つのゲームを比較
– メタ懲罰ゲーム
• Axelrodによるメタ規範ゲーム
– メタ報酬ゲーム
• ソーシャルメディアをモデル化したメタ規範ゲーム
10
2013/7/12
一般化メタ規範ゲーム
メタ懲罰ゲーム
k doesn’t punish j
j doesn’t punish i
Vk
i defects
i gets T
others get H
k gets E’
j gets P’ k punishes j
k doesn’t reward j
Vj
j gets E
i gets P
Lk
k gets C’ k rewards j
j gets R’
j punishes i
S<B
k doesn’t punish j
j doesn’t reward i
Vk
i cooperats
協調
i gets F
others get M
k gets E’’
j gets P’’ k punishes j
Lj
k doesn’t reward j
メタ報酬ゲーム
j gets C
i gets R
j rewards i
Lk
k gets C’’ k rewards j
j gets R’’
シミュレーション条件(1)
• シミュレーションステップ数:10000
• エージェント数:N=20
• ネットワーク:完全ネットワーク
• エージェントの進化
– Bi, Vi, Liをより利得が高いエージェントからコピー
– 遺伝的アルゴリズム
• 一様交叉
• 突然変異率: 0.01
11
2013/7/12
シミュレーション条件(2)
メタ懲罰ゲーム
メタ報酬ゲーム
値
値
裏切り利得T
裏切られた痛手H
懲罰コストE
3.0
-1.0
-2.0
協調コストF
協調利得M
報酬コストC
-3.0
1.0
-2.0
懲罰痛手P
メタ懲罰コストE’’
-9.0
-2.0
報酬利得R
メタ報酬コストC’’
9.0
-2.0
メタ懲罰痛手P’’
-9.0
メタ報酬利得R’’
9.0
メタ報酬ゲーム
+1
協調
+1
+1
S<B
j doesn’t reward i
i cooperats
-3
協調
i gets F
others get M
Lj
k doesn’t reward j
+1
+1
メタ報酬ゲーム
j gets C
i gets R
j rewards i
Lk
k gets C’’ k rewards j
j gets R’’
12
2013/7/12
メタ報酬ゲーム
協調者への報酬
協調者を発見&報酬を与える
-2
協調
S<B
+9
j doesn’t reward i
i cooperats
協調
i gets F
others get M
Lj
k doesn’t reward j
j gets C
i gets R
メタ報酬ゲーム
Lk
k gets C’’ k rewards j
j gets R’’
j rewards i
メタ報酬ゲーム
協調へのメタ報酬
協調を発見&報酬
+9
協調
S<B
j doesn’t reward i
i cooperats
-2
協調
i gets F
others get M
Lj
k doesn’t reward j
報酬を与えたことを発見
&報酬
メタ報酬ゲーム
j gets C
i gets R
j rewards i
Lk
k gets C’’ k rewards j
j gets R’’
13
2013/7/12
進化
高い利得のエージェントをコピー
利得の高いエージェント
GAによる進化
エージェントパラメータ
協調率:L
報酬率:V
報酬ゲーム
14
2013/7/12
メタ懲罰ゲーム
メタ報酬ゲーム
15
2013/7/12
一般化メタ規範ゲームにおける
協調の進化
• メタ懲罰ゲーム
– 当初は協調が支配的
– あるタイミングで裏切りが支配
• 裏切り者を罰するエージェントがいなくなることが原因
• メタ報酬ゲーム
– 完全協調支配ではないが協調が多い
• 協調者へ報酬を与えるエージェントが常に多数
メタ報酬系のシステムは
協調を促進しやすい
メタ報酬ゲームの例
• たとえばソーシャルメディア
– 罰則機能は導入困難
• 情報提供しないユーザを罰を与えられない
– 情報提供者への報酬は可能
• コメント,「いいね」ボタン,ポイント
• メタ報酬ゲーム
– 報酬・報酬への報酬(メタ報酬)
16
2013/7/12
ソーシャルメディアにおける行動
SNS
Q&Aサイト
サイト
レシピ投稿
サイト
協調
日記の投稿 質問の投稿 レシピ投稿
報酬
コメント
メタ報酬
コメントへの 回答への
返信
お礼・ポイ
ント
回答の投稿 感想の投稿
感想への
お礼
利得は妥当か?
メタ報酬ゲーム
値
利得がコストに比べて
非常に高い
協調コストF
協調利得M
報酬コストC
-3.0
1.0
-2.0
報酬利得R
メタ報酬コストC’’
9.0
-2.0
メタ報酬利得R’’
9.0
17
2013/7/12
コストと利得
• メタ報酬ゲームにおけるコストと利得
– 利得とコストにどのような関係があれば協調が進
化するのか
値
• コストの変化
-3.0
協調コストF
– C=C’’=c
– 0≦c≦10
1.0
協調利得M
• 利得の変化
c
報酬コストC
– R=R’’=r
r
報酬利得R
– 0≦r≦10
c
メタ報酬コストC’’
メタ報酬利得R’’
r
シミュレーション条件
•
•
•
•
•
•
シミュレーションステップ数:10000
エージェント数:N=20
ネットワーク:完全ネットワーク
c=2.0固定
0≦r≦10
100回シミュレーションの平均
18
2013/7/12
利得による協調の変化
c=2.0,0≦r≦10
シミュレーション条件
•
•
•
•
•
•
シミュレーションステップ数:10000
エージェント数:N=20
ネットワーク:完全ネットワーク
0≦c≦10(0.1刻み)
0≦r≦10(0.1刻み)
100回シミュレーションの平均
19
2013/7/12
コストと利得による協調率の変化
協調率
被報酬利得(r)
報酬コスト(c)
コストと利得による協調率の変化
• 利得がコストを上回ったとき協調が支配的
– r(利得)>c(コスト)+ε
– エージェント数が変化しても同様の結果
• ソーシャルメディアでいえば
– Facebookのいいね!ボタン
• 低いコスト・低い利得
– Q&Aサイトの回答
• 高いコスト・高い利得
⇒情報に対する反応システムの設計へ応用
20
2013/7/12
結論
• 公共財ゲームにおける協調の実現
– メタ規範という考え方
• メタ懲罰
• メタ報酬
• メタ報酬ゲームで協調を実現
– 100%協調ではないが,おおむね協調が支配的
• 協調促進は報酬とそのコストで説明可能
– たとえば:ソーシャルメディア⇒報酬とコストの設計
が重要
今日のお話
• 公共財ゲーム再び
– 公共財ゲームで協調を促進するには?
• 様々な社会シミュレーション
– なぜ中華街が出来るのか
– 地震の時渋谷の街からどう逃げる?
– 被災者を救うための最適戦略とは?
– 情報量が増えたとき誰が影響力を持つのか
21
2013/7/12
分居モデル
• 人種の分居モデル
– シェリング(1971)
• アメリカの住居分布を見ると人種ごとに固
まって暮らしている
– 黒人は黒人同士
– ヒスパニックはヒスパニック同士
• 仮説:人々は自分の周りにいる人が同じ人種
の場合安心して暮らせる
分居モデルの概要
• NxNのセル世界
– 各セルが1エージェント
• エージェントに与えられたルール
1. 周りの多くが自分と同じならば満足する
2. 自分と異なるエージェントが多ければ移動する
満足
不満足
22
2013/7/12
分居モデルの結果
• シミュレーションを繰り返すと,徐々に同じタイ
プのエージェントが集まる
– 満足と移動という2つのルールだけで分居を表現
– シンプルなモデルから分居が発生するメカニズム
を発見
http://www.waseda.jp/wias/researchers/monthly/spot_k_yamamoto.htmlより
今日のお話
• 公共財ゲーム再び
– 公共財ゲームで協調を促進するには?
• 様々な社会シミュレーション
– なぜ中華街が出来るのか
– 地震の時渋谷の街からどう逃げる?
– 被災者を救うための最適戦略とは?
– 情報量が増えたとき誰が影響力を持つのか
23
2013/7/12
帰宅困難者対応
• 規模
– 首都圏直下型:650万人
– 東日本大震災:300~400万人
• 各機関の連携した支援の必要性
– 国、都県、市区、消防、警察
– 公共交通機関、電力、ガス、水道
– 周辺地域:飲食店、コンビニ、パブリックビジョン
• 帰宅困難者の行動予測が必要
– 情報提供の効果
– 訓練支援
人流シミュレーションによる避難予測
• 情報提供例:
– 帰宅困難者へのパブリックビューイング(PV)を含めた
情報配信
– 広域の集中緩和が実現できるか?
• 避難シミュレーションNetMASによる検証
– 対象地区:渋谷駅周辺地域(3km×2.5km)
– 対象者数:約4万人・1時間の移動
– 2つのシナリオの比較
1. 最悪のシナリオ:情報がないので渋谷駅に立ち寄る
2. 最善のシナリオ:配信された情報に基づいて行動
» オフィスに待機、避難所へ移動、帰宅可能な人は帰宅
24
2013/7/12
社会的影響の評価
• シミュレーションの利用:混雑の比較
– 帰宅困難者の混雑に対するPVを含めた情報配信の効果の検証
シナリオ1:全員情報なし
シナリオ2:全員情報あり
現実は二つの間
のどこか
できるだけ
右側に!!
赤い部分
混雑
• 災害時に機能する情報システムの必要性
– 大災害時でも機能するために必要な機能は?
– どの程度の普及が必要か? どんな情報を流すか?
今日のお話
• 公共財ゲーム再び
– 公共財ゲームで協調を促進するには?
• 様々な社会シミュレーション
– なぜ中華街が出来るのか
– 地震の時渋谷の街からどう逃げる?
– 被災者を救うための最適戦略とは?
– 情報量が増えたとき誰が影響力を持つのか
25
2013/7/12
レスキューシミュレーション
• 目的:自律ロボットによる災害救助活動
• 災害時におけるあらゆる事象をシミュレーション
• 役割の異なる自律エージェントによる救助活動
–
–
–
–
救急隊
自衛隊
消防隊
市民
:市民の救助
:がれきの撤去
:火災の消火
:救助対象
• 複数エージェントによる協調行動
世界大会が毎年開催
街を火災から守り人を助ける
救急隊
自衛隊
消防隊
市民
:市民の救助
:がれきの撤去
:火災の消火
:救助対象
26
2013/7/12
どのような戦略が
効率的な救助につながるのか?
• 様々な場所
– 神戸,パリ,架空都市・・・
– できる限りリアルな地図を再現
• 様々なシチュエーション
– 大規模火災を伴う地震
– 津波による浸水
– 隕石の落下(!?)
– ゴジラが歩いた(・・・)
今日のお話
• 公共財ゲーム再び
– 公共財ゲームで協調を促進するには?
• 様々な社会シミュレーション
– なぜ中華街が出来るのか
– 地震の時渋谷の街からどう逃げる?
– 被災者を救うための最適戦略とは?
– 情報量が増えたとき誰が影響力を持つのか
27
2013/7/12
膨大な知識を持つ人々
• 知識共有の目的
– 個々人が持つ知識量の増加
• 膨大な知識を持つ人々とは
– インフルエンサー論(集団の意思決定に対して、
強い影響を及ぼす少数の人々,Merton 1957)
– イノベータ論(商品の普及過程において、最初期
に商品を導入する人々,Rogers 1962)
情報流通量等の推移(H8=100)
入手しうる情報量は10年で530倍
*総務省平成18年度情報流通センサスより再作成
28
2013/7/12
情報が多様化した社会
• ビッグデータの時代
– 個人が入手しうる情報の量が爆発的に増加
情報が多様化した状況でも知識が
多いことは良いことか?
情報伝播モデルにより
知識の量と影響力の関係を評価
情報伝播モデル
• 情報
– 総情報数M
– 情報の種類 {b1 , b2 , b3, ・・・ , bM }
例:携帯電話キャリア( b1 :A社, b2 :B社…)
• 人間(エージェント) ai
– 保持可能情報数 ci
b1, b1, b1
b1, b1, b2
b2, b3
保持可能情報数=8
29
2013/7/12
情報伝播の概要
• 集団内で、ランダムに情報伝播が発生
b1
b2
b1
影響力による評価
• 知識を多く持つ人物
• 周囲への影響力大(Merton,Rogers)
情報伝播に対する影響力
• 影響力が大きいエージェントとは
– 多くのエージェントへ情報を伝播
– 他のエージェントに伝えた情報がさらに伝播
30
2013/7/12
エージェント間の影響力
情報bkが伝播した経路
a1
1/4
a2
1/2
a3
1
a4
aiのajに対する影響力
:経路の集合
:aiとajの距離
シミュレーション
• 目的
– 情報が多様化した社会において、影響力を持つ
エージェントの分析
• 設定
– 情報量の変化は影響力のある人を変化させるか
– どのような人が影響力を持つのか
• 評価指標
– 最も広まった情報における各エージェントの影響力
31
2013/7/12
Rogersの普及曲線
• 一種類の財・情報が普及する過程をプロット
エージェントの分類
• Rogersの分類を参考
採 用者数
アーリー
アダプター
イノベータ
フェロワー
2.5%
84%
13.5%
採用時期(経過時間)
32
2013/7/12
エージェントの設定
2
保持可能
情報数
100
12
10
62
1
人数
イノベータ
アーリー
アダプター
フェロワー
• 保持可能情報数はBarabási(2002)の議論を参
エージェントの種類ごとの影響力
情報伝播に対する影響 力
影響力:イノベータ:アーリーアダプター
影響力:イノベータ<アーリーアダプター
存
の結果と一
とは異なる結果
33
2013/7/12
知識のフラット化
発信する情報を
できていない状
自分が持つ情報の価値を
づけできていない状
知識・情報の価値がフラットな状
現実には
• 膨大な知識を持つ人々(オタク・マニア)
– 膨大な知識を持つ
に知識に
づけできない
– ちょっとした質問に様々な答えを返し、質問者を
混 させる、あるいは影響を与えられない
• 情報を適度に持つ人々
– 情報を
みを持つ
し、限定することで必要な情報の
34
2013/7/12
情報が多様化した社会における
影響力の分析
• 所持する情報量と影響力
– 情報の種類が増加
– 知識がフラット化したイノベータが存在
– イノベータの影響力が低下
アーリーアダプタの影響力が最大に
今日のお話
• 公共財ゲーム再び
– 公共財ゲームで協調を促進するには?
• 様々な社会シミュレーション
– なぜ中華街が出来るのか
– 地震の時渋谷の街からどう逃げる?
– 被災者を救うための最適戦略とは?
– 情報量が増えたとき誰が影響力を持つのか
35
2013/7/12
社会シミュレーション
• コンピュータによる人間社会の再現
– どうすれば金
は防げるのか
– なぜTwitterはこんなに流行ったのか
– 災害救助の最適な戦略は か
• コンピュータの中の社会=人 社会
• 現実社会では再現不可能な事象
シミュレーションによって確認
36
Fly UP