...

数学の問題CM1

by user

on
Category: Documents
9

views

Report

Comments

Transcript

数学の問題CM1
統計学 講義
第 10 回
確率分布の基礎 Part-3
2016 年 5 ⽉ 20 ⽇(⾦)1 限
担当教員:
唐渡 広志(からと・こうじ)
研究室:
経済学研究棟4階432号室
email:
website:
[email protected]
http://www3.u-toyama.ac.jp/kkarato/
1
お知らせ

中間試験
ギリシャ⽂字 [⼩⽂字,⼤⽂字,読み⽅例]
 ⽇時と場所:5⽉31⽇(⽕)3 限,13:00 –
14:30, D11教室
 持ち込み:⾃筆のノート(A4の紙1枚,表
裏),電卓(平⽅根が計算できるもの)
 パソコンや通信機器の使⽤は禁⽌
 範囲:第 2 回から第 12 回まで

演習問題の回収期⽇と処分
 演習問題 #1−6 の提出締切は 5 ⽉ 20 ⽇(⾦)
まで。
 これ以降提出しても成績に反映されません。
 回収した演習問題(#1−6)は 6 ⽉ 3 ⽇まで預
かり,それ以降は処分します。

配布物と演習問題
 ホームページからダウンロード
2
講義の目的
 標準化された確率変数の特徴について学びます。
 実現値が連続的に変化する確率分布の特徴について学び
ます。
keywords: 連続型確率変数,離散型確率変数,確率密度,⼀
様分布,指数分布,正規分布,カイ2乗分布
参考書
 ⽩砂 pp.107 – 114
 ⿃居 pp. 77 – 92
 ⼤屋 pp. 102 – 134
3
確率変数の標準化
Z  aX  bについて,a 
Z

1
V X 
X
X  E X 
E X 
1
V X 
,b
E X 
V X 
とするとき
V X 
V X 
を標準化された確率変数とよぶ.
E  Z   E aX  b   aE  X   b 
1
V X 
E X  
E X 
V X 
0
2
 1 
 V X   V X   1
V  Z   V aX  b   a 2V  X   
 V X  
V X 


必ず E  Z   0, V  Z   1 が成立する。
4
標準化された確率分布 (1)
0.0
0.2
p
0.4
0.6
X の分布
-2
-1
0
1
2
3
2
3
x
0.0
0.2
p
0.4
0.6
Z の分布
-2
-1
0
1
z
確率変数を(1次式で)変換しても棒の⾼さ(確率)は変わらない
5
E  X   0 .7
V  X   0.61
0.3
-1
0
1
2
3
1
2
3
である確率は等しい.
V X 
の分布
0.0
X  E X 
0.3
0.6
0.61
-2
x
p
例.X  1 である確率と Z 
1  0. 7
0.0
X の分布
p
0.6
標準化された確率分布 (2)
-2
-1
0
z
6
「離散」と「連続」
ヴァイオリンで出せる⾳には「切れ⽬」がない.
出せる⾳は「連続的」
ミ E ファ F
ミとファの間には無数の⾳が存在する
ピアノで出せる⾳には「切れ⽬」がある.
出せる⾳は「離散的」
ミとファの間には出せる⾳がない
7
離散型確率変数と連続型確率変数
 離散型確率変数
 変数が特定の値をとる確率変数
 離散→実現値に切れ⽬がある
サイコロの⽬(離散⼀様分布)
⼆項分布(成功回数)
ポアソン分布(交通事故発⽣件数)
幾何分布,パスカル分布
など
 連続型確率変数
 変数の測定尺度をいくらでも細
かくできる確率変数
 連続→実現値に切れ⽬がない
離散の場合:実現値に切れ⽬がある
2
3
⾝⻑や体重の値の分布,株価の
変化率の分布,正規分布,指数
分布,連続⼀様分布,カイ2乗分
布など
連続の場合:実現値は2と3の間に無数にある
(いくらでも細かくできる)
2
3
8
離散型確率分布と連続型確率分布
曲線の⾼さは確率を⽰さない!?
0.3
0.2
0.2
0.0
0.1
0.1
0.0
確率
0.3
0.4
0.5
0.4
棒の⾼さが確率を⽰す
0
1
2
3
4
5
6
7
0
1
2
3
4
5
6
7
X
離散型確率分布
実現値に切れ⽬がある
連続型確率分布
実現値に切れ⽬がない
9
連続型確率変数の確率:Pr (160≦X<161)
0.03
幅 : 1cm
0.02
確率
0.04
0.05
⾝⻑の連続型確率分布
高さ
0.00
0.01
0.03
150
160
170
180
190
Pr 160  X  161  0.031  0.03 Pr 160  X  160.5  0.028 0.5  0.014
1cmの幅に3%の⼈がいる.
幅を狭くすると
幅がないと確率が定義できない
0.5cmの幅に1.4%の⼈がいる.
さらに幅を狭くすると
Pr  X  160  0.026 0  0
!?
10
長さ1単位あたりの「確率密度」の定義
 確率を定義するためには区間の幅が必要
 幅をゼロにすると,確率もゼロになってしまう。
160.0 cm 以上160.1 cm 未満の⼈はいるが,ちょうど160.000000000…cmの⼈はほとんどいない
 ある程度の範囲(幅)をとらないと確率は定義できない。
 そこで「確率密度」という概念を定義する。
確率密度
⾼さ


Pr x  X  x  1 cm 
⻑さ 1 単位 (1cm ) あたりの確率密度 
1 cm
X : 連続型変数(身長 ; 単位は cmとする)
x : X の実現値
1 cm : 確率を定義するための 範囲(幅)
11
確率密度関数
確率密度関数 : f x 
 確率密度は X の実現値 x に対応してさまざ
まな値をとる⾼さ f (x) を⽰している。
【重要】
確率  ⾯積
Pr x  X  x   x 
0.02
0.03
Pr  x  X  x   x 
x
0.01
f (x)
確率密度
(⾼さ)
・確率密度は確率そのもの
ではない。
・確率密度と確率は区別し
なければならない。
0.00
確率
f x  
 確率密度は微⼩な範囲の幅 x あたりの確
率に対応している。
150
160
170
 x:小さな範囲(幅)
12
確率密度関数 f (x) を用いて確率を定義
f x  
Pr x  X  x   x 
x
幅

確率 Pr x  X  x   x   
f x  x  面積
高さ
f x  : 確率密度関数  点 x における高さ 確率ではない 
 x : 小さな幅
Pr  : 確率  幅をもった面積
  高さ 幅 
【重要】連続型確率分布では,⾼さと幅,つまり⾯積によって確率を
定義する。
「確率」= ⾼さ × 幅
13
「極限」で考える確率密度関数
幅を狭くするとより正確に⾯積を計算で
intervals=0.5
きる。
0.4
例.  x1     x10  0.1
Pr 2  X  3
0.2
0.2
Density
0.4
intervals=1
幅 x = 0.5
 Pr 2.0  X  2.1    Pr 2.9  X  3.0 
0.0
 f  x1  x1    f  x10  x10
0.0
Density
極限x を 0 に近づけること
0
2
4
10
0
  f x i   x i
6
x
2
6
x
i 1
幅intervals=0.1
x = 0.1
0.2
0.0
0.0
0.2
Density
0.4
0.4
intervals=0.2
幅
x = 0.2
Density
4
0
1
2
3
4
x
5
6
7
0
1
2
3
4
5
6
7
x
14
確率を計算するために積分を利用する
a からb までの区間を n 等分して確率(面積) を計算
Pr a  X  b   f x1 x  f x 2 x   
n
f x n x   f x i x


i 1
n番目の棒の面積
和の記号の代わりにインテグラルを⽤いる
確率密度関数 f (x) の区間 [a,b) に敷き詰められた微細な⻑⽅形の総和は,
a 以上 b 未満の確率に等しい(関数 f (x) を区間 [a,b) で積分する)。
【注意】
・連続変数の合計は Σ ではなく ∫(インテグラル)を⽤いる。
・積分とは合計することである。
・Δx に代えて dx という記号を⽤いる。
・何等分したかは考えずに,⾯積の区間だけを⽰す。
15
確率変数 X が区間 (3, 4) に入る確率
0.5
f x 
0.3
f 1
0.2
 x の幅を⼩さくして ,
f xi  x をたくさん⾜す  積分をとる
0.1
⾼さ: 確率密度
Pr { 3 < X < 4 } = 0.0954
0.0
Density
0.4
X の確率密度関数 f (x)
0
1
2
3
4
5
6
7
X
16
連続型確率分布の特徴
・任意の実現値をとる確率は0以上である。
離散のときは P X  x i   0
・すべての実現値が起こる確率の合計は1である。

 離散のときは



 P X  x i   1
i 1

n
期待値
分散
17
例.確率の計算
2  2 x , 0  x  1
確率密度関数 f x   
x  0, x  1
0,
b
b
2.0
  1 
 1
  1
積分計算例.  x  dx  
x  
b 
a
 1
 1
a  1
a
1.5
例1
f x   2  2 x
0.5
1.0
0.75
例2
0.0
0.25
-1 .0
0 .0
1 .0
2 .0
18
例.連続型確率分布の期待値
期待値
2  2 x, 0  x  1
確率密度関数 : f x   
x  0, x  1
0,
19
例.連続型確率分布の分散
分散
実現値 x と期待値の差(偏差)の2乗に確率 f (x) dx をかけて合計する
20
連続型確率変数の期待値演算ルール
離散型と同じ結果
21
練習問題 (1)
 2 3
  x ,
確率密度関数 f x    5 10
0,

2x4
x  2, x  4
1. Pr 3  x  4  13  0.65
20
1.0
2. E X   16
0.2
0.4
0.6
3. V X  
4.
0.0
fx(x)
0.8
5
0
1
2
3
4
5
6
 
88
300
E X2 
 3.2
 0.29333...
158
 10.533
15
x
22
代表的な連続型確率分布 (1):正規分布
正規分布 (Normal distribution) の確率密度関数
E  X    ミュー,
正規分布の平均は ,
分散は  2 で与えられている V  X   
シグマ2乗
0.06
N (170,36)
の正規分布
平均 ,分散  2 の正規分布
0.02
0.04
釣鐘状の形
(Bell Shape)


を N ,  2 と表現する
  170
0.00
f(x)
2
140
150
160
170
x
180
190
200
正規分布に近い現象: ⾝⻑,株価の変化率
23
正規分布の確率密度関数 f (x)
 や e は数学的な定数
 や  の値が変わると f (x) の形が変わる.
 正規分布は  や  の⺟数(パラメータ)によって形を特徴づけることができ
る。
 平均  ,分散  の正規分布を N ( ) という書き⽅で表現する。
24
ネイピア数(自然対数の底)
N
1 

1   は N の値が十分に大きくなると,ある一定の値 e  2.718282 に近づく。
N

1.0
1.5
1 

1  
 N
N
N
のグラフ
0.0
0.5
(1+1/N)^N
2.0
2.5
e: exponential(指数),ネイピア数
0
5
10
15
20
25
150
N
2
2.25
2.370370
2.593742
2.653298
2.691588
2.704814
2.716924
2.718146
2.718268
2.718280
2.718282
0
50
y
100
y  e x のグラフ
1
2
3
10
20
50
100
1,000
10,000
100,000
1,000,000
10,000,000
-4
-2
0
2
4
e −1 = 0.3678794…
e0 = 1
e1 = 2.718282…
25
0.25
例. 3種類の正規分布
0.20
N 10, 2
0.15
N 0, 3
0.00
0.05
0.10
f(x)
N  10, 4
-20
-10
0
10
20
x
26
代表的な連続型確率分布 (2):指数分布
指数分布の確率密度関数
指数分布の平均および分散は
f x    e  x , x  0
の値によって与えられる.
1
1
E X   , V  X   2


0.5
Exponential Distribution
0.3
1
2
0.5
指数分布に近い現象:ある事柄が起きる
間隔の確率
0.1
0.2
E X  
機械の寿命,耐⽤年数,交通事故発⽣の
間隔
0.0
f(x)
0.4
(ラムダ)= 0.5 の指数分布
0
2
4
6
8
10
X
27
代表的な連続型確率分布 (3):一様分布
⼀様分布の確率密度関数
一様分布の平均および 分散は
区間 a, b のとり方によって決ま る.
ba
EX  
2
b  a 2
V X  
12
1.0
1.5
例.区間 [0,1] の⼀様分布
1 0
 0.5
2
0.0
0.5
E X  
-1.0
-0.5
0.0
a0
0.5
1.0
b 1
1.5
2.0
サイコロの出⽬は「離散型」の⼀様分布
28
練習問題 (2) 一様分布の平均と分散
1. 区間 [ 0,1] の一様分布の期待値と分散を求めなさい。
2. 区間 [  2, 2 ] の一様分布の期待値と分散を求めなさい。
29
離散型一様分布(例.サイコロの出目)
1
確率関数 : Pr  X  x   , X  1, 2,, n 
n
1 n
1 nn  1 n  1

E  X    x Pr  X  x    x  
2
2
n x 1
n
x 1
n
V  X   E X 2   E  X 
2
1 n 2  n 1
 x 

n x 1
 2 
2

1 nn  12n  1 n  1
n 2  1
 


6
4
12
n
2
例. 正十二面体サイコロの出目n  12
12  1
 6.5
EX  
2

12 2  1 143
V X  

 11.92
12
12
https://upload.wikimedia.org/wikipedia/commons/thumb/b/b4/D12_regular_dodecah
edron.JPG/220px-D12_regular_dodecahedron.JPG
30
代表的な連続型確率分布 (4):カイ2乗分布
m は自由度, は オイラーのガンマ関数
・自由度 m によって形が変わる分布
・m  2のカイ2 乗分布は指数分布に一致する
E X   m
V  X   2m
f(x)
0
5
10
x
15
20
0.00 0.02 0.04 0.06 0.08
自由度 m = 10
0.00 0.05 0.10 0.15 0.20
f(x)
自由度 m = 3
0
10
20
30
40
x
31
まとめ
確率変数 X を標準化した Z 
X  E X 
V X 
の期待値と分散は E  Z   0, V  Z   1 である。
連続型の確率変数 X について実現値をxとするとき,
Pr  x  X  x   x 
確率密度関数 : f  x  
x
a, b における確率は Pr a  x  b    f x  dx
を用いて確率を定義する。このとき,
b
a
より計算する。
連続型の確率変数の期待値および分散は次のように計算する。

E  X    x f  x  dx , V  X   

2

x  E  X   f  x  dx




平均 ,分散  2 の正規分布を N ,  2 と記述する。
32
Fly UP