数学の問題CM1

by user

on 28 марта 2017

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download 数学の問題CM1

Transcript

数学の問題CM1

統計学講義
第 10 回
確率分布の基礎 Part-3
2016 年 5 ⽉ 20 ⽇（⾦）1 限
担当教員：
唐渡広志（からと・こうじ）
研究室:
経済学研究棟4階432号室
email:
website:
[email protected]
http://www3.u-toyama.ac.jp/kkarato/
1
お知らせ

中間試験
ギリシャ⽂字［⼩⽂字，⼤⽂字，読み⽅例］
 ⽇時と場所：5⽉31⽇（⽕）3 限，13:00 –
14:30， D11教室
 持ち込み：⾃筆のノート（A4の紙1枚，表
裏），電卓（平⽅根が計算できるもの）
 パソコンや通信機器の使⽤は禁⽌
 範囲：第 2 回から第 12 回まで

演習問題の回収期⽇と処分
 演習問題 #1−6 の提出締切は 5 ⽉ 20 ⽇（⾦）
まで。
 これ以降提出しても成績に反映されません。
 回収した演習問題（#1−6）は 6 ⽉ 3 ⽇まで預
かり，それ以降は処分します。

配布物と演習問題
 ホームページからダウンロード
2
講義の目的
 標準化された確率変数の特徴について学びます。
 実現値が連続的に変化する確率分布の特徴について学び
ます。
keywords: 連続型確率変数，離散型確率変数，確率密度，⼀
様分布，指数分布，正規分布，カイ2乗分布
参考書
 ⽩砂 pp.107 – 114
 ⿃居 pp. 77 – 92
 ⼤屋 pp. 102 – 134
3
確率変数の標準化
Z  aX  bについて，a 
Z

1
V X 
X
X  E X 
E X 
1
V X 
,b
E X 
V X 
とするとき
V X 
V X 
を標準化された確率変数とよぶ．
E  Z   E aX  b   aE  X   b 
1
V X 
E X  
E X 
V X 
0
2
 1 
 V X   V X   1
V  Z   V aX  b   a 2V  X   
 V X  
V X 


必ず E  Z   0, V  Z   1 が成立する。
4
標準化された確率分布 (1)
0.0
0.2
p
0.4
0.6
X の分布
-2
-1
0
1
2
3
2
3
x
0.0
0.2
p
0.4
0.6
Z の分布
-2
-1
0
1
z
確率変数を（1次式で）変換しても棒の⾼さ（確率）は変わらない
5
E  X   0 .7
V  X   0.61
0.3
-1
0
1
2
3
1
2
3
である確率は等しい．
V X 
の分布
0.0
X  E X 
0.3
0.6
0.61
-2
x
p
例．X  1 である確率と Z 
1  0. 7
0.0
X の分布
p
0.6
標準化された確率分布 (2)
-2
-1
0
z
6
「離散」と「連続」
ヴァイオリンで出せる⾳には「切れ⽬」がない．
出せる⾳は「連続的」
ミ E ファ F
ミとファの間には無数の⾳が存在する
ピアノで出せる⾳には「切れ⽬」がある．
出せる⾳は「離散的」
ミとファの間には出せる⾳がない
7
離散型確率変数と連続型確率変数
 離散型確率変数
 変数が特定の値をとる確率変数
 離散→実現値に切れ⽬がある
サイコロの⽬（離散⼀様分布）
⼆項分布（成功回数）
ポアソン分布（交通事故発⽣件数）
幾何分布，パスカル分布
など
 連続型確率変数
 変数の測定尺度をいくらでも細
かくできる確率変数
 連続→実現値に切れ⽬がない
離散の場合：実現値に切れ⽬がある
2
3
⾝⻑や体重の値の分布，株価の
変化率の分布，正規分布，指数
分布，連続⼀様分布，カイ2乗分
布など
連続の場合：実現値は2と3の間に無数にある
（いくらでも細かくできる）
2
3
8
離散型確率分布と連続型確率分布
曲線の⾼さは確率を⽰さない!?
0.3
0.2
0.2
0.0
0.1
0.1
0.0
確率
0.3
0.4
0.5
0.4
棒の⾼さが確率を⽰す
0
1
2
3
4
5
6
7
0
1
2
3
4
5
6
7
X
離散型確率分布
実現値に切れ⽬がある
連続型確率分布
実現値に切れ⽬がない
9
連続型確率変数の確率：Pr (160≦X＜161)
0.03
幅 : 1cm
0.02
確率
0.04
0.05
⾝⻑の連続型確率分布
高さ
0.00
0.01
0.03
150
160
170
180
190
Pr 160  X  161  0.031  0.03 Pr 160  X  160.5  0.028 0.5  0.014
1cmの幅に3%の⼈がいる．
幅を狭くすると
幅がないと確率が定義できない
0.5cmの幅に1.4%の⼈がいる．
さらに幅を狭くすると
Pr  X  160  0.026 0  0
!?
10
長さ1単位あたりの「確率密度」の定義
 確率を定義するためには区間の幅が必要
 幅をゼロにすると，確率もゼロになってしまう。
160.0 cm 以上160.1 cm 未満の⼈はいるが，ちょうど160.000000000…cmの⼈はほとんどいない
 ある程度の範囲（幅）をとらないと確率は定義できない。
 そこで「確率密度」という概念を定義する。
確率密度
⾼さ


Pr x  X  x  1 cm 
⻑さ 1 単位 (1cm ) あたりの確率密度 
1 cm
X : 連続型変数（身長 ; 単位は cmとする）
x : X の実現値
1 cm : 確率を定義するための範囲（幅）
11
確率密度関数
確率密度関数 : f x 
 確率密度は X の実現値 x に対応してさまざ
まな値をとる⾼さ f (x) を⽰している。
【重要】
確率  ⾯積
Pr x  X  x   x 
0.02
0.03
Pr  x  X  x   x 
x
0.01
f (x)
確率密度
（⾼さ）
・確率密度は確率そのもの
ではない。
・確率密度と確率は区別し
なければならない。
0.00
確率
f x  
 確率密度は微⼩な範囲の幅 x あたりの確
率に対応している。
150
160
170
 x：小さな範囲（幅）
12
確率密度関数 f (x) を用いて確率を定義
f x  
Pr x  X  x   x 
x
幅

確率 Pr x  X  x   x   
f x  x  面積
高さ
f x  : 確率密度関数  点 x における高さ 確率ではない 
 x : 小さな幅
Pr  ：確率  幅をもった面積
  高さ 幅 
【重要】連続型確率分布では，⾼さと幅，つまり⾯積によって確率を
定義する。
「確率」＝⾼さ × 幅
13
「極限」で考える確率密度関数
幅を狭くするとより正確に⾯積を計算で
intervals=0.5
きる。
0.4
例.  x1     x10  0.1
Pr 2  X  3
0.2
0.2
Density
0.4
intervals=1
幅 x = 0.5
 Pr 2.0  X  2.1    Pr 2.9  X  3.0 
0.0
 f  x1  x1    f  x10  x10
0.0
Density
極限x を 0 に近づけること
0
2
4
10
0
  f x i   x i
6
x
2
6
x
i 1
幅intervals=0.1
x = 0.1
0.2
0.0
0.0
0.2
Density
0.4
0.4
intervals=0.2
幅
x = 0.2
Density
4
0
1
2
3
4
x
5
6
7
0
1
2
3
4
5
6
7
x
14
確率を計算するために積分を利用する
a からb までの区間を n 等分して確率（面積）を計算
Pr a  X  b   f x1 x  f x 2 x   
n
f x n x   f x i x


i 1
n番目の棒の面積
和の記号の代わりにインテグラルを⽤いる
確率密度関数 f (x) の区間 [a,b) に敷き詰められた微細な⻑⽅形の総和は，
a 以上 b 未満の確率に等しい（関数 f (x) を区間 [a,b) で積分する）。
【注意】
・連続変数の合計は Σ ではなく ∫（インテグラル）を⽤いる。
・積分とは合計することである。
・Δx に代えて dx という記号を⽤いる。
・何等分したかは考えずに，⾯積の区間だけを⽰す。
15
確率変数 X が区間 (3, 4) に入る確率
0.5
f x 
0.3
f 1
0.2
 x の幅を⼩さくして ,
f xi  x をたくさん⾜す  積分をとる
0.1
⾼さ：確率密度
Pr { 3 < X < 4 } = 0.0954
0.0
Density
0.4
X の確率密度関数 f (x)
0
1
2
3
4
5
6
7
X
16
連続型確率分布の特徴
・任意の実現値をとる確率は0以上である。
離散のときは P X  x i   0
・すべての実現値が起こる確率の合計は1である。

 離散のときは



 P X  x i   1
i 1

n
期待値
分散
17
例．確率の計算
2  2 x , 0  x  1
確率密度関数 f x   
x  0, x  1
0,
b
b
2.0
  1 
 1
  1
積分計算例.  x  dx  
x  
b 
a
 1
 1
a  1
a
1.5
例1
f x   2  2 x
0.5
1.0
0.75
例2
0.0
0.25
-1 .0
0 .0
1 .0
2 .0
18
例．連続型確率分布の期待値
期待値
2  2 x, 0  x  1
確率密度関数 : f x   
x  0, x  1
0,
19
例．連続型確率分布の分散
分散
実現値 x と期待値の差（偏差）の2乗に確率 f (x) dx をかけて合計する
20
連続型確率変数の期待値演算ルール
離散型と同じ結果
21
練習問題 (1)
 2 3
  x ,
確率密度関数 f x    5 10
0,

2x4
x  2, x  4
1. Pr 3  x  4  13  0.65
20
1.0
2. E X   16
0.2
0.4
0.6
3. V X  
4.
0.0
fx(x)
0.8
5
0
1
2
3
4
5
6
 
88
300
E X2 
 3.2
 0.29333...
158
 10.533
15
x
22
代表的な連続型確率分布 (1)：正規分布
正規分布 (Normal distribution) の確率密度関数
E  X    ミュー,
正規分布の平均は ，
分散は  2 で与えられている V  X   
シグマ2乗
0.06
N (170,36)
の正規分布
平均 ，分散  2 の正規分布
0.02
0.04
釣鐘状の形
(Bell Shape)


を N ,  2 と表現する
  170
0.00
f(x)
2
140
150
160
170
x
180
190
200
正規分布に近い現象：⾝⻑，株価の変化率
23
正規分布の確率密度関数 f (x)
 や e は数学的な定数
 や  の値が変わると f (x) の形が変わる．
 正規分布は  や  の⺟数（パラメータ）によって形を特徴づけることができ
る。
 平均  ，分散  の正規分布を N ( ) という書き⽅で表現する。
24
ネイピア数（自然対数の底）
N
1 

1   は N の値が十分に大きくなると，ある一定の値 e  2.718282 に近づく。
N

1.0
1.5
1 

1  
 N
N
N
のグラフ
0.0
0.5
(1+1/N)^N
2.0
2.5
e: exponential（指数），ネイピア数
0
5
10
15
20
25
150
N
2
2.25
2.370370
2.593742
2.653298
2.691588
2.704814
2.716924
2.718146
2.718268
2.718280
2.718282
0
50
y
100
y  e x のグラフ
1
2
3
10
20
50
100
1,000
10,000
100,000
1,000,000
10,000,000
-4
-2
0
2
4
e −1 = 0.3678794…
e0 = 1
e1 = 2.718282…
25
0.25
例. 3種類の正規分布
0.20
N 10, 2
0.15
N 0, 3
0.00
0.05
0.10
f(x)
N  10, 4
-20
-10
0
10
20
x
26
代表的な連続型確率分布 (2)：指数分布
指数分布の確率密度関数
指数分布の平均および分散は
f x    e  x , x  0
の値によって与えられる．
1
1
E X   , V  X   2


0.5
Exponential Distribution
0.3
1
2
0.5
指数分布に近い現象：ある事柄が起きる
間隔の確率
0.1
0.2
E X  
機械の寿命，耐⽤年数，交通事故発⽣の
間隔
0.0
f(x)
0.4
（ラムダ）= 0.5 の指数分布
0
2
4
6
8
10
X
27
代表的な連続型確率分布 (3)：一様分布
⼀様分布の確率密度関数
一様分布の平均および分散は
区間 a, b のとり方によって決まる．
ba
EX  
2
b  a 2
V X  
12
1.0
1.5
例．区間 [0,1] の⼀様分布
1 0
 0.5
2
0.0
0.5
E X  
-1.0
-0.5
0.0
a0
0.5
1.0
b 1
1.5
2.0
サイコロの出⽬は「離散型」の⼀様分布
28
練習問題 (2) 一様分布の平均と分散
1. 区間 [ 0,1] の一様分布の期待値と分散を求めなさい。
2. 区間 [  2, 2 ] の一様分布の期待値と分散を求めなさい。
29
離散型一様分布（例.サイコロの出目）
1
確率関数 : Pr  X  x   , X  1, 2,, n 
n
1 n
1 nn  1 n  1

E  X    x Pr  X  x    x  
2
2
n x 1
n
x 1
n
V  X   E X 2   E  X 
2
1 n 2  n 1
 x 

n x 1
 2 
2

1 nn  12n  1 n  1
n 2  1
 


6
4
12
n
2
例. 正十二面体サイコロの出目n  12
12  1
 6.5
EX  
2

12 2  1 143
V X  

 11.92
12
12
https://upload.wikimedia.org/wikipedia/commons/thumb/b/b4/D12_regular_dodecah
edron.JPG/220px-D12_regular_dodecahedron.JPG
30
代表的な連続型確率分布 (4)：カイ2乗分布
m は自由度， はオイラーのガンマ関数
・自由度 m によって形が変わる分布
・m  2のカイ2 乗分布は指数分布に一致する
E X   m
V  X   2m
f(x)
0
5
10
x
15
20
0.00 0.02 0.04 0.06 0.08
自由度 m = 10
0.00 0.05 0.10 0.15 0.20
f(x)
自由度 m = 3
0
10
20
30
40
x
31
まとめ
確率変数 X を標準化した Z 
X  E X 
V X 
の期待値と分散は E  Z   0, V  Z   1 である。
連続型の確率変数 X について実現値をxとするとき，
Pr  x  X  x   x 
確率密度関数 : f  x  
x
a, b における確率は Pr a  x  b    f x  dx
を用いて確率を定義する。このとき，
b
a
より計算する。
連続型の確率変数の期待値および分散は次のように計算する。

E  X    x f  x  dx , V  X   

2

x  E  X   f  x  dx




平均 ，分散  2 の正規分布を N ,  2 と記述する。
32