...

真値

by user

on
Category: Documents
14

views

Report

Comments

Description

Transcript

真値
2013/11/23
地域環境工学専門教育コース
小林範之
統計学入門 第7回
INTRODUCTION TO STATISTICS
第5章 統計的に推定する方法
1
2013/11/23
統計的に推定する方法
統計学の大切な応用分野の1つが推定です.
 標本から算出される値を用いて,母集団の分
布に関する正しい値を見抜きます.

用語のまとめ
用語
統計量
母数
推定量
推定値
意味
例と表記
標本を得ることで値が 平均値,分散,中央値,
確定する確率変数
最頻値
母集団の持つ特性値
母平均,母分散
母平均μに対する標本
母数を推定するために
平均 ,母分散σ2に対す
用いる統計量
る不偏分散
標本から得られた推定
平均値 ,不偏分散s2
量の値
母集団分布
母集団の個体の分布
正規分布
標本分布
推定量の分布
正規分布,2項分布,t
分布
2
2013/11/23
点推定と区間推定
推定法
意味
点推定
母集団に関する真の値を,ある1つの推定値で
予想する方法
区間推定
たとえば,「95%の確率で,この区間に母数が
入る」というような推定法.ある確率を与えて
母集団に関する真の値が入る区間を提示する推
定法
点推定
3
2013/11/23
点推定のための推定値の条件
標本から得られる1つの推定値を母数とする
のが点推定
 母集団に関する情報を,標本の情報から一意
的に決めてしまう大胆な方法
 点推定の好ましい条件.

 不偏性
 一致性
 有効性
点推定の条件
性質
意味
例
不偏性
推定量の期待値が母数に一致する性質.母数を中
標本平均
心に推定量がつり合い良くばらついていることを
標本比率
意味する.この性質を満たす推定量を不偏推定量
不偏分散
という.
一致性
標本の大きさを増すと,推定量が母数に収束して 標本平均
いく性質.この性質を満たす推定量を一致推定量 標本比率
という.
標本分散
有効性
推定量の分散が小さいこと.分散が小さいと,推
定量は母数の近辺に集中する.不偏性と一致性を 標本平均
備えた2つの推定量があるとき,その優劣を判断す 標本比率
る判断材料になる.特に,最小の分散値を持つ推
定量を最少分散性という.
4
2013/11/23
不偏性
一致性
5
2013/11/23
有効性
点推定の方法

点推定の代表的な方法
 モーメント法
 最尤法
6
2013/11/23
モーメント法


大きさnの標本{X1,X2,…,Xn}から算出され
る次の推定量をk次のモーメント
̂ k 
X1  X 2  X 3      X n
n
̂1 
X1  X 2  X 3      X n
n
ˆ 2 
X1  X 2  X 3    X n
n
1次のモーメント
k

2次のモーメント

k次のモーメントは計算が容易
2
k
2
k
2
k
2
モーメントから推定値を算出


一次のモーメントは母平均の推定量
X  ̂1
分散は?
X1  X 2  X 3      X n
n
2
2
2
  X 1  X    X 2  X       X n  X   2 X 1  X 2  X 3      X n X  nX 2 / n
X  X 2  X 2  X 2      X n  X 2  X 2
 1
n
ˆ 2 
2
2
2
2


ˆ 2  ˆ 2  ˆ12
7
2013/11/23
モーメント法
正規母集団から大きさ5の観測値(標本値)
が {175, 170, 169, 165, 164} と与えられた
 モーメント法による推定値は?
 平均値
175  170  169  165  164
X  ˆ1 
 168.6
5
 分散

1752  1702  169 2  1652  164 2
ˆ 2 
 28441.4
5
 2  ˆ 2  ˆ12  15.44
最尤法を利用した点推定
現象は起こりやすいもとで起こる
 母数θを含む尤度関数があるとき,その関数
が最大値を与えるように母数を決定する方法
を最尤推定法
 そこで得られた母数の値を最尤推定値

8
2013/11/23
区間推定
区間推定の考え方
点推定では知りたい母数をズバリ1つの数値
で言い当てる
 区間推定を利用すれば推定の正しさの度合い
が考慮できる

9
2013/11/23
標本から母数を推定する原理





ある都市の20男子からランダムに1人選んで体重Xを
測ったら58.5kg
その都市の平均体重を求めるにはどうしたらいいの
でしょうか?
「その都市の平均体重は58.5kg」と考えられます.
ですが,責任はもてません.
もし,その都市の住民の体重の分散が50の正規分布
だと分かっていれば,正規分布の性質から次のこと
が言える.
「その都市の住民の平均体重をμとし,住民からラン
ダムに1人抽出し,その人の体重をXとすれば,Xが
次の不等式を満たす確率は0.95である.
  1.96  50  X    1.96  50
標本から母数を推定する原理

不等式は「正規分布においては,平均値μを
中心として左右に,標準偏差の1.96倍の範囲
の確率が0.95である」
X  1.96  50    X  1.96  50
X=58.5を代入すると となり,「確率95%で
その都市の住民の平均体重は44.6~72.4kgの
間に入っている.」と言えます.
 確率95%のことを信頼度,
 求めた区間を信頼度95%に対する信頼区間

10
2013/11/23
母数Θを区間推定する手順
標本における統計量Tを決める.
 統計量Tの分布を求める.
 統計量Tが確率αでとる区間を決定.
 母数θを不等式の真ん中にする.
 統計量Tの推定値を不等式に入れる.
 信頼度αで母数θの取りうる信頼区間を算出
する.
 なお,信頼度に関する値1.96は付表1「標準
正規分布」の数表から読み取った.

母平均の推定
11
2013/11/23
分散既知の正規母集団における母平均の推定

区間推定は正規母集団において,分散が分
かっている場合の母平均の推定.
ため池の硝酸イオン濃度μを推定してみる.
 濃度の分布は正規分布で,分散については過
去のデータから3.
 ため池の硝酸イオン濃度μを推定するために,
大きさ10の標本から得られる標本平均 を利
用.

標本分布を調べる
標本平均 X は10.40ppm
 この標本平均 X の分布は中心極限定理から,
平均値μ,分散  2 / n の正規分布.

12
2013/11/23
信頼度を決め信頼区間を求める
推定区間の精度を表す信頼度を与える.
 95%を考えてみましょう.
 標本平均 X が,分散3/10の正規分布に従う
 X の値は次の区間に95%の確率で現れる

信頼度を決め信頼区間を求める
  1.96  3 / 10  10.40    1.96  3 / 10
/ n
X
/ n
10.40  1.96  3 / 10    10.40  1.96  3 / 10  9.33    11.47
13
2013/11/23
信頼度を決め信頼区間を求める


信頼度99%の場合は,
  2.58  3 / 10  10.40    2.58  3 / 10
10.40  2.58  3 / 10    10.40  2.58  3 / 10
 8.99    11.81
95%で判断したときよりも,推定区間が広
がる.
 より正しい判断をしようとすれば許容範囲を
広げる必要がある.

分散既知の正規母集団における母平均の推定

標本平均 X の分布を決める
 平均μ,分散σ2/n

の正規分布
信頼度αを決め,信頼区間を求める
  2 /n  X   2 /n
 βはαに対応するzの値(表より求める)

母平均μを不等式の真ん中にする
X   2 /n    X   2 /n
14
2013/11/23
分散未知の正規母集団における母平均の推定
~標本が小さいとき~

標本平均 X の分布を決める
 平均μ,分散σ2/n
分散既知の場合
平均値がμである正規分布をなす母集団から
抽出した大きさnの標本の標本平均を X ,不
偏分散s2,標準偏差をsとする.
 このとき,標本平均 からつくられる次の統
計量Tは自由度n-1のt分布に従う.

T
X 
s/ n
分散未知の正規母集団における母平均の推定
~標本が小さいとき~

信頼度αを決め,信頼区間を求める
 95%とすると,テキスト巻末のt分布パーセント
点より
X 
 2.26
s/ n
 母平均μを不等式の真ん中にする
 2.26  T  2.26   2.26 
X  2.26s / n    X  2.26s / n
15
2013/11/23
分散未知の正規母集団における母平均の推定~
標本が大きいとき~ 標本が30を超える場合

標本平均 X の分布を決める
 平均μ,分散σ2/nの正規分布
分散既知の場合

標本平均 X の分布は中心極限定理から,平均値μ,
分散 s2/nの正規分布になる

この先は,分散既知の場合と全く同じ.
    s2 / n  X      s2 / n
X    s2 / n    X    s2 / n
16
Fly UP