...

ZE現象

by user

on
Category: Documents
6

views

Report

Comments

Description

Transcript

ZE現象
統計学 講義
第 11 回
確率分布の基礎 Part-3
2015 年 5 ⽉ 22 ⽇(⾦)1 限
担当教員:
唐渡 広志(からと・こうじ)
研究室:
経済学研究棟4階432号室
email:
website:
[email protected]
http://www3.u-toyama.ac.jp/kkarato/
1
お知らせ

中間試験
ギリシャ⽂字 [⼩⽂字,⼤⽂字,読み⽅例]
 ⽇時と場所:6⽉2⽇(⽕)3 限,13:00 – 14:30,
201教室
 持ち込み:⾃筆のノート(A4の紙1枚,表
裏),電卓(平⽅根が計算できるもの)
 パソコンや通信機器の使⽤は禁⽌
 範囲:第 2 回から第 13 回まで

演習問題の回収期⽇と処分
 演習問題 #1−11 の提出締切は 6 ⽉ 5 ⽇(⾦)
まで。
 これ以降提出しても成績に反映されません。
 回収した演習問題(#1−11)は 6 ⽉ 19 ⽇まで
預かり,それ以降は処分します。

配布物と演習問題
 ホームページからダウンロード
2
講義の目的
 標準化された確率変数の特徴について学びます。
 実現値が連続的に変化する確率分布の特徴について学び
ます。
keywords: 連続型確率変数,離散型確率変数,確率密度,⼀
様分布,指数分布,正規分布,カイ2乗分布
参考書
 ⽩砂 pp.107 – 114
 ⿃居 pp. 77 – 92
 ⼤屋 pp. 102 – 134
3
確率変数の標準化
Z  aX  bについて,a 
Z

1
V X 
X
X  E X 
E X 
1
V X 
,b
E X 
V X 
とするとき
V X 
V X 
を標準化された確率変数とよぶ.
E  Z   E aX  b   aE  X   b 
1
V X 
E X  
E X 
V X 
0
2
 1 
 V X   V X   1
V  Z   V aX  b   a 2V  X   
 V X  
V X 


必ず E  Z   0, V  Z   1 が成立する。
4
標準化された確率分布 (1)
0.0
0.2
p
0.4
0.6
X の分布
-2
-1
0
1
2
3
2
3
x
0.0
0.2
p
0.4
0.6
Z の分布
-2
-1
0
1
z
確率変数を(1次式で)変換しても棒の⾼さ(確率)は変わらない
5
-1
0
1
2
3
1
2
3
x
である確率は等しい.
V X 
の分布
0.0
X  E X 
0.3
0.6
0.61
-2
p
例.X  1 である確率と Z 
1  0. 7
0.0
E  X   0 .7
V  X   0.61
0.3
X の分布
p
0.6
標準化された確率分布 (2)
-2
-1
0
z
6
「離散」と「連続」
ヴァイオリンで出せる⾳には「切れ⽬」がない.
出せる⾳は「連続的」
ミ E ファ F
ミとファの間には無数の⾳が存在する
ピアノで出せる⾳には「切れ⽬」がある.
出せる⾳は「離散的」
ミとファの間には出せる⾳がない
7
離散型確率変数と連続型確率変数
 離散型確率変数
 変数が特定の値をとる確率変数
 離散→実現値に切れ⽬がある
サイコロの⽬ {1,2,3,4,5,6}
コイン { 表1点,裏2点 }
⼆項分布(成功回数) など
 連続型確率変数
 変数の測定尺度をいくらでも細
かくできる確率変数
 連続→実現値に切れ⽬がない
離散の場合:実現値に切れ⽬がある
2
3
⾝⻑や体重の値の分布,株価の
変化率の分布,正規分布,指数
分布など
連続の場合:実現値は2と3の間に無数にある
(いくらでも細かくできる)
2
3
8
離散型確率分布と連続型確率分布
曲線の⾼さは確率を⽰さない!?
0.3
0.2
0.2
0.0
0.1
0.1
0.0
確率
0.3
0.4
0.5
0.4
棒の⾼さが確率を⽰す
0
1
2
3
4
5
6
7
0
1
2
3
4
5
6
7
X
離散型確率分布
実現値に切れ⽬がある
連続型確率分布
実現値に切れ⽬がない
9
連続型確率変数の確率:Pr (160≦X<161)
0.03
幅 : 1cm
0.02
確率
0.04
0.05
⾝⻑の連続型確率分布
高さ
0.00
0.01
0.03
150
160
170
180
190
Pr 160  X  161  0.031  0.03 Pr 160  X  160.5  0.028 0.5  0.014
1cmの幅に3%の⼈がいる.
幅を狭くすると
幅がないと確率が定義できない
0.5cmの幅に1.4%の⼈がいる.
さらに幅を狭くすると
Pr  X  160  0.026 0  0
!?
10
長さ1単位あたりの「確率密度」の定義
 確率を定義するためには区間の幅が必要.
 幅をゼロにすると,確率もゼロになってしまう。
160.0 cm 以上160.1 cm 未満の⼈はいるが,ちょうど160.000000000…cmの⼈はほとんどいない
 ある程度の範囲(幅)をとらないと確率は定義できない。
 そこで「確率密度」という概念を定義する。
確率密度
⾼さ


Pr x  X  x  1 cm 
⻑さ 1 単位 (1cm ) あたりの確率密度 
1 cm
X : 連続型変数(⾝⻑ ; 単位は cm とする)
x : X の実現値
Pr 160  X  161
 0.03
1cm
Pr 160  X  160 .5  0.014
例2.区間160~160 .5cm の確率密度 

 0.028
0.5cm
0 .5
例1.区間160~161cm の確率密度 
11
確率密度関数
確率密度関数 : f x 
 確率密度は X の実現値 x に対応してさまざ
まな値をとる⾼さ f (x) を⽰している。
【重要】
確率  ⾯積
Pr x  X  x   x 
0.02
0.03
Pr x  X  x   x 
x
0.01
f (x)
確率密度
(⾼さ)
・確率密度は確率そのもの
ではない。
・確率密度と確率は区別し
なければならない。
0.00
確率
f x  
 確率密度は微⼩な区間の幅 x あたりの確
率に対応している。
150
160
170
 x:幅(小さな区間)
12
確率密度関数 f (x) を用いて確率を定義
f x  
Pr x  X  x   x 
x
幅

確率 Pr x  X  x   x   
f x  x  面積
高さ
f x  : 確率密度関数  点 x における高さ 確率ではない 
 x : 小さな幅
Pr  : 確率  幅をもった面積
  高さ 幅 
【重要】連続型確率分布では,⾼さと幅,つまり⾯
積によって確率を定義する.
「確率」= ⾼さ × 幅
13
極限x を 0 に近づけること
「極限」で考える確率密度関数
intervals=1
幅 x = 0.5
0.4
0.0
0.2
Density
0.2
0.0
Density
0.4
intervals=0.5
0
2
4
6
0
x
2
6
幅intervals=0.1
x = 0.1
0.2
0.0
0.0
0.2
Density
0.4
0.4
intervals=0.2
幅
x = 0.2
Density
4
幅を狭くするとより正確
x
に⾯積を計算できる。
0
1
2
3
4
x
5
6
7
0
1
2
3
4
5
6
7
x
14
連続型確率分布における確率の計算
intervals=0.1
0.5
区間の幅:  x1   x1     x10  0.1
0.3
0.2
0.1
0.0
Density
0.4
⼀定間隔で区切られた棒の⾯積
を合計すると確率が計算できる。
0
1
2
3
Pr 2  X  3
4
5
6
7
x
 Pr 2.0  X  2.1  Pr 2.1  X  2.2     Pr 2.9  X  3.0 
 f x1  x1  f x2  x2    f x10  x10
10

 f x   x
i
i
i 1
【重要】 確率密度関数 f (x) × 幅 x の合計が確率になっている.
15
確率を計算するために積分を利用する
a からb までの区間を n 等分して確率(面積) を計算
Pr a  X  b   f x1 x  f x 2 x   
n
f x n x   f x i x


i 1
n番目の棒の面積
確率密度関数 f (x) の区間 [a,b) に敷き詰められた微細な⻑⽅形の総和は,
a 以上 b 未満の確率に等しい(関数 f (x) を区間 [a,b) で積分する).
【注意】
・連続変数の合計は Σ ではなく ∫(インテグラル)を⽤いる.
・積分とは合計することである.
・Δx に代えて dx という記号を⽤いる.
・何等分したかは考えずに,⾯積の区間だけを⽰す
16
確率変数 X が区間 (3, 4) に入る確率
0.5
f x 
0.3
f 1
0.2
 x の幅を⼩さくして ,
f xi  x をたくさん⾜す  積分をとる
0.1
⾼さ: 確率密度
Pr { 3 < X < 4 } = 0.0954
0.0
Density
0.4
X の確率密度関数 f (x)
0
1
2
3
4
5
6
7
X
17
連続型確率分布の特徴
・任意の実現値をとる確率は0以上である。
離散のときは P X  x i   0
・すべての実現値が起こる確率の合計は1である。

 離散のときは



 P X  x i   1
i 1

n
期待値
分散
18
例.確率の計算
2  2 x , 0  x  1
確率密度関数 f x   
x  0, x  1
0,
b
b
2.0
  1 
 1
  1
積分計算例.  x  dx  
x  
b 
a
 1
 1
a  1
a
1.5
例1
f x   2  2 x
0.5
1.0
0.75
例2
0.0
0.25
-1 .0
0 .0
1 .0
2 .0
19
例.連続型確率分布の期待値
期待値
2  2 x, 0  x  1
確率密度関数 : f x   
x  0, x  1
0,
20
例.連続型確率分布の分散
分散
実現値 x と期待値の差(偏差)の2乗に確率 f (x) dx をかけて合計する
21
連続型確率変数の期待値演算ルール
離散型と同じ結果
22
練習問題 (1)
 2 3
  x ,
確率密度関数 f x    5 10
0,

2x4
x  2, x  4
1. Pr 3  x  4  13  0.65
20
1.0
2. E X   16
0.2
0.4
0.6
3. V X  
4.
0.0
fx(x)
0.8
5
0
1
2
3
4
5
6
 
88
300
E X2 
 3.2
 0.29333...
158
 10.533
15
x
23
代表的な連続型確率分布 (1):正規分布
正規分布 (Normal distribution) の確率密度関数
E  X    ミュー,
正規分布の平均は ,
2
分散は  2 で与えられている V  X    シグマ2乗
の正規分布
平均 ,分散  2 の正規分布
0.02
0.04
釣鐘状の形
(Bell Shape)


を N ,  2 と表現する
  170
0.00
f(x)
0.06
N (170,36)
140
150
160
170
x
180
190
200
正規分布に近い現象: ⾝⻑,株価の変化率
24
正規分布の確率密度関数 f (x)
 や e は数学的な定数.
 や  の値が変わると f (x) の形が変わる.
 正規分布は  や  の⺟数(パラメータ)によって形を特徴づけることができ
る。
 平均  ,分散  の正規分布を記号 N ( ) と書く。
25
0.25
例. 3種類の正規分布
0.20
N 10, 2
0.15
N 0, 3
0.00
0.05
0.10
f(x)
N  10, 4
-20
-10
0
10
20
x
26
代表的な連続型確率分布 (2):指数分布
指数分布の確率密度関数
指数分布の平均および分散は
f x    e  x , x  0
の値によって与えられる.
1
1
E X   , V  X   2


0.5
Exponential Distribution
0.3
1
2
0.5
指数分布に近い現象:ある事柄が起きる
間隔の確率
0.1
0.2
E X  
機械の寿命,交通事故発⽣の間隔
0.0
f(x)
0.4
(ラムダ)= 0.5 の指数分布
0
2
4
6
8
10
X
27
ネイピア数(自然対数の底)
N
は N の値が十分に大きくなると,ある一定の値 e  2.718282  に近づく。
e: exponential(指数),ネイピア数
1.0
1.5
1 

1  
 N
N
N
のグラフ
0.0
0.5
(1+1/N)^N
2.0
2.5
1 

1  
 N
0
5
10
15
20
25
150
N
2
2.25
2.370370
2.593742
2.653298
2.691588
2.704814
2.716924
2.718146
2.718268
2.718280
2.718282
0
50
y
100
y  e x のグラフ
1
2
3
10
20
50
100
1,000
10,000
100,000
1,000,000
10,000,000
-4
-2
0
2
4
e −1 = 0.3678794…
e0 = 1
e1 = 2.718282…
28
代表的な連続型確率分布 (3):一様分布
⼀様分布の確率密度関数
一様分布の平均および 分散は
区間 a, b のとり方によって決ま る.
E X  
例.区間 [0,1] の⼀様分布
ba
2
1.5

b  a 2
V X  
1.0
12
1 0
 0.5
2
0.0
0.5
E X  
-1.0
-0.5
0.0
a0
0.5
1.0
b 1
1.5
2.0
サイコロの出⽬は「離散型」の⼀様分布
29
練習問題 (2) 一様分布の平均と分散
1. 区間 [ 0,1] の一様分布の期待値と分散を求めなさい。
2. 区間 [  2, 2 ] の一様分布の期待値と分散を求めなさい。
30
代表的な連続型確率分布 (4):カイ2乗分布
m は自由度, は オイラーのガンマ関数
・自由度 m によって形が変わる分布
・m  2のカイ2 乗分布は指数分布に一致する
E X   m
V  X   2m
f(x)
0
5
10
x
15
20
0.00 0.02 0.04 0.06 0.08
自由度 m = 10
0.00 0.05 0.10 0.15 0.20
f(x)
自由度 m = 3
0
10
20
30
40
x
31
まとめ
確率変数 X を標準化した Z 
X  E X 
V X 
の期待値と分散は E  Z   0, V  Z   1 である。
連続型の確率変数 X について実現値をxとするとき,
Pr x  X  x   x 
確率密度関数 : f x  
x
を用いて確率を定義する。このとき,間 a, bにおける確率は Pr a  x  b  
b
a f x dx
より計算する。
連続型の確率変数の期待値および分散は次のように計算する。

E  X    x f x  dx , V  X   


x  E  X 2 f x  dx




平均 ,分散  2 の正規分布を N ,  2 と記述する。
32
Fly UP