Comments
Description
Transcript
ZE現象
統計学 講義 第 11 回 確率分布の基礎 Part-3 2015 年 5 ⽉ 22 ⽇(⾦)1 限 担当教員: 唐渡 広志(からと・こうじ) 研究室: 経済学研究棟4階432号室 email: website: [email protected] http://www3.u-toyama.ac.jp/kkarato/ 1 お知らせ 中間試験 ギリシャ⽂字 [⼩⽂字,⼤⽂字,読み⽅例] ⽇時と場所:6⽉2⽇(⽕)3 限,13:00 – 14:30, 201教室 持ち込み:⾃筆のノート(A4の紙1枚,表 裏),電卓(平⽅根が計算できるもの) パソコンや通信機器の使⽤は禁⽌ 範囲:第 2 回から第 13 回まで 演習問題の回収期⽇と処分 演習問題 #1−11 の提出締切は 6 ⽉ 5 ⽇(⾦) まで。 これ以降提出しても成績に反映されません。 回収した演習問題(#1−11)は 6 ⽉ 19 ⽇まで 預かり,それ以降は処分します。 配布物と演習問題 ホームページからダウンロード 2 講義の目的 標準化された確率変数の特徴について学びます。 実現値が連続的に変化する確率分布の特徴について学び ます。 keywords: 連続型確率変数,離散型確率変数,確率密度,⼀ 様分布,指数分布,正規分布,カイ2乗分布 参考書 ⽩砂 pp.107 – 114 ⿃居 pp. 77 – 92 ⼤屋 pp. 102 – 134 3 確率変数の標準化 Z aX bについて,a Z 1 V X X X E X E X 1 V X ,b E X V X とするとき V X V X を標準化された確率変数とよぶ. E Z E aX b aE X b 1 V X E X E X V X 0 2 1 V X V X 1 V Z V aX b a 2V X V X V X 必ず E Z 0, V Z 1 が成立する。 4 標準化された確率分布 (1) 0.0 0.2 p 0.4 0.6 X の分布 -2 -1 0 1 2 3 2 3 x 0.0 0.2 p 0.4 0.6 Z の分布 -2 -1 0 1 z 確率変数を(1次式で)変換しても棒の⾼さ(確率)は変わらない 5 -1 0 1 2 3 1 2 3 x である確率は等しい. V X の分布 0.0 X E X 0.3 0.6 0.61 -2 p 例.X 1 である確率と Z 1 0. 7 0.0 E X 0 .7 V X 0.61 0.3 X の分布 p 0.6 標準化された確率分布 (2) -2 -1 0 z 6 「離散」と「連続」 ヴァイオリンで出せる⾳には「切れ⽬」がない. 出せる⾳は「連続的」 ミ E ファ F ミとファの間には無数の⾳が存在する ピアノで出せる⾳には「切れ⽬」がある. 出せる⾳は「離散的」 ミとファの間には出せる⾳がない 7 離散型確率変数と連続型確率変数 離散型確率変数 変数が特定の値をとる確率変数 離散→実現値に切れ⽬がある サイコロの⽬ {1,2,3,4,5,6} コイン { 表1点,裏2点 } ⼆項分布(成功回数) など 連続型確率変数 変数の測定尺度をいくらでも細 かくできる確率変数 連続→実現値に切れ⽬がない 離散の場合:実現値に切れ⽬がある 2 3 ⾝⻑や体重の値の分布,株価の 変化率の分布,正規分布,指数 分布など 連続の場合:実現値は2と3の間に無数にある (いくらでも細かくできる) 2 3 8 離散型確率分布と連続型確率分布 曲線の⾼さは確率を⽰さない!? 0.3 0.2 0.2 0.0 0.1 0.1 0.0 確率 0.3 0.4 0.5 0.4 棒の⾼さが確率を⽰す 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 X 離散型確率分布 実現値に切れ⽬がある 連続型確率分布 実現値に切れ⽬がない 9 連続型確率変数の確率:Pr (160≦X<161) 0.03 幅 : 1cm 0.02 確率 0.04 0.05 ⾝⻑の連続型確率分布 高さ 0.00 0.01 0.03 150 160 170 180 190 Pr 160 X 161 0.031 0.03 Pr 160 X 160.5 0.028 0.5 0.014 1cmの幅に3%の⼈がいる. 幅を狭くすると 幅がないと確率が定義できない 0.5cmの幅に1.4%の⼈がいる. さらに幅を狭くすると Pr X 160 0.026 0 0 !? 10 長さ1単位あたりの「確率密度」の定義 確率を定義するためには区間の幅が必要. 幅をゼロにすると,確率もゼロになってしまう。 160.0 cm 以上160.1 cm 未満の⼈はいるが,ちょうど160.000000000…cmの⼈はほとんどいない ある程度の範囲(幅)をとらないと確率は定義できない。 そこで「確率密度」という概念を定義する。 確率密度 ⾼さ Pr x X x 1 cm ⻑さ 1 単位 (1cm ) あたりの確率密度 1 cm X : 連続型変数(⾝⻑ ; 単位は cm とする) x : X の実現値 Pr 160 X 161 0.03 1cm Pr 160 X 160 .5 0.014 例2.区間160~160 .5cm の確率密度 0.028 0.5cm 0 .5 例1.区間160~161cm の確率密度 11 確率密度関数 確率密度関数 : f x 確率密度は X の実現値 x に対応してさまざ まな値をとる⾼さ f (x) を⽰している。 【重要】 確率 ⾯積 Pr x X x x 0.02 0.03 Pr x X x x x 0.01 f (x) 確率密度 (⾼さ) ・確率密度は確率そのもの ではない。 ・確率密度と確率は区別し なければならない。 0.00 確率 f x 確率密度は微⼩な区間の幅 x あたりの確 率に対応している。 150 160 170 x:幅(小さな区間) 12 確率密度関数 f (x) を用いて確率を定義 f x Pr x X x x x 幅 確率 Pr x X x x f x x 面積 高さ f x : 確率密度関数 点 x における高さ 確率ではない x : 小さな幅 Pr : 確率 幅をもった面積 高さ 幅 【重要】連続型確率分布では,⾼さと幅,つまり⾯ 積によって確率を定義する. 「確率」= ⾼さ × 幅 13 極限x を 0 に近づけること 「極限」で考える確率密度関数 intervals=1 幅 x = 0.5 0.4 0.0 0.2 Density 0.2 0.0 Density 0.4 intervals=0.5 0 2 4 6 0 x 2 6 幅intervals=0.1 x = 0.1 0.2 0.0 0.0 0.2 Density 0.4 0.4 intervals=0.2 幅 x = 0.2 Density 4 幅を狭くするとより正確 x に⾯積を計算できる。 0 1 2 3 4 x 5 6 7 0 1 2 3 4 5 6 7 x 14 連続型確率分布における確率の計算 intervals=0.1 0.5 区間の幅: x1 x1 x10 0.1 0.3 0.2 0.1 0.0 Density 0.4 ⼀定間隔で区切られた棒の⾯積 を合計すると確率が計算できる。 0 1 2 3 Pr 2 X 3 4 5 6 7 x Pr 2.0 X 2.1 Pr 2.1 X 2.2 Pr 2.9 X 3.0 f x1 x1 f x2 x2 f x10 x10 10 f x x i i i 1 【重要】 確率密度関数 f (x) × 幅 x の合計が確率になっている. 15 確率を計算するために積分を利用する a からb までの区間を n 等分して確率(面積) を計算 Pr a X b f x1 x f x 2 x n f x n x f x i x i 1 n番目の棒の面積 確率密度関数 f (x) の区間 [a,b) に敷き詰められた微細な⻑⽅形の総和は, a 以上 b 未満の確率に等しい(関数 f (x) を区間 [a,b) で積分する). 【注意】 ・連続変数の合計は Σ ではなく ∫(インテグラル)を⽤いる. ・積分とは合計することである. ・Δx に代えて dx という記号を⽤いる. ・何等分したかは考えずに,⾯積の区間だけを⽰す 16 確率変数 X が区間 (3, 4) に入る確率 0.5 f x 0.3 f 1 0.2 x の幅を⼩さくして , f xi x をたくさん⾜す 積分をとる 0.1 ⾼さ: 確率密度 Pr { 3 < X < 4 } = 0.0954 0.0 Density 0.4 X の確率密度関数 f (x) 0 1 2 3 4 5 6 7 X 17 連続型確率分布の特徴 ・任意の実現値をとる確率は0以上である。 離散のときは P X x i 0 ・すべての実現値が起こる確率の合計は1である。 離散のときは P X x i 1 i 1 n 期待値 分散 18 例.確率の計算 2 2 x , 0 x 1 確率密度関数 f x x 0, x 1 0, b b 2.0 1 1 1 積分計算例. x dx x b a 1 1 a 1 a 1.5 例1 f x 2 2 x 0.5 1.0 0.75 例2 0.0 0.25 -1 .0 0 .0 1 .0 2 .0 19 例.連続型確率分布の期待値 期待値 2 2 x, 0 x 1 確率密度関数 : f x x 0, x 1 0, 20 例.連続型確率分布の分散 分散 実現値 x と期待値の差(偏差)の2乗に確率 f (x) dx をかけて合計する 21 連続型確率変数の期待値演算ルール 離散型と同じ結果 22 練習問題 (1) 2 3 x , 確率密度関数 f x 5 10 0, 2x4 x 2, x 4 1. Pr 3 x 4 13 0.65 20 1.0 2. E X 16 0.2 0.4 0.6 3. V X 4. 0.0 fx(x) 0.8 5 0 1 2 3 4 5 6 88 300 E X2 3.2 0.29333... 158 10.533 15 x 23 代表的な連続型確率分布 (1):正規分布 正規分布 (Normal distribution) の確率密度関数 E X ミュー, 正規分布の平均は , 2 分散は 2 で与えられている V X シグマ2乗 の正規分布 平均 ,分散 2 の正規分布 0.02 0.04 釣鐘状の形 (Bell Shape) を N , 2 と表現する 170 0.00 f(x) 0.06 N (170,36) 140 150 160 170 x 180 190 200 正規分布に近い現象: ⾝⻑,株価の変化率 24 正規分布の確率密度関数 f (x) や e は数学的な定数. や の値が変わると f (x) の形が変わる. 正規分布は や の⺟数(パラメータ)によって形を特徴づけることができ る。 平均 ,分散 の正規分布を記号 N ( ) と書く。 25 0.25 例. 3種類の正規分布 0.20 N 10, 2 0.15 N 0, 3 0.00 0.05 0.10 f(x) N 10, 4 -20 -10 0 10 20 x 26 代表的な連続型確率分布 (2):指数分布 指数分布の確率密度関数 指数分布の平均および分散は f x e x , x 0 の値によって与えられる. 1 1 E X , V X 2 0.5 Exponential Distribution 0.3 1 2 0.5 指数分布に近い現象:ある事柄が起きる 間隔の確率 0.1 0.2 E X 機械の寿命,交通事故発⽣の間隔 0.0 f(x) 0.4 (ラムダ)= 0.5 の指数分布 0 2 4 6 8 10 X 27 ネイピア数(自然対数の底) N は N の値が十分に大きくなると,ある一定の値 e 2.718282 に近づく。 e: exponential(指数),ネイピア数 1.0 1.5 1 1 N N N のグラフ 0.0 0.5 (1+1/N)^N 2.0 2.5 1 1 N 0 5 10 15 20 25 150 N 2 2.25 2.370370 2.593742 2.653298 2.691588 2.704814 2.716924 2.718146 2.718268 2.718280 2.718282 0 50 y 100 y e x のグラフ 1 2 3 10 20 50 100 1,000 10,000 100,000 1,000,000 10,000,000 -4 -2 0 2 4 e −1 = 0.3678794… e0 = 1 e1 = 2.718282… 28 代表的な連続型確率分布 (3):一様分布 ⼀様分布の確率密度関数 一様分布の平均および 分散は 区間 a, b のとり方によって決ま る. E X 例.区間 [0,1] の⼀様分布 ba 2 1.5 b a 2 V X 1.0 12 1 0 0.5 2 0.0 0.5 E X -1.0 -0.5 0.0 a0 0.5 1.0 b 1 1.5 2.0 サイコロの出⽬は「離散型」の⼀様分布 29 練習問題 (2) 一様分布の平均と分散 1. 区間 [ 0,1] の一様分布の期待値と分散を求めなさい。 2. 区間 [ 2, 2 ] の一様分布の期待値と分散を求めなさい。 30 代表的な連続型確率分布 (4):カイ2乗分布 m は自由度, は オイラーのガンマ関数 ・自由度 m によって形が変わる分布 ・m 2のカイ2 乗分布は指数分布に一致する E X m V X 2m f(x) 0 5 10 x 15 20 0.00 0.02 0.04 0.06 0.08 自由度 m = 10 0.00 0.05 0.10 0.15 0.20 f(x) 自由度 m = 3 0 10 20 30 40 x 31 まとめ 確率変数 X を標準化した Z X E X V X の期待値と分散は E Z 0, V Z 1 である。 連続型の確率変数 X について実現値をxとするとき, Pr x X x x 確率密度関数 : f x x を用いて確率を定義する。このとき,間 a, bにおける確率は Pr a x b b a f x dx より計算する。 連続型の確率変数の期待値および分散は次のように計算する。 E X x f x dx , V X x E X 2 f x dx 平均 ,分散 2 の正規分布を N , 2 と記述する。 32