Comments
Description
Transcript
第 3章 仮説検定
環境基礎数学演習 2009 第 3 章 仮説検定 第 3 章 仮説検定 § 3.1 検定の原理 1. 問題の設定 ここでは、検定の元となる考え方を説明するために、次の例から具体的に考えていくことにする。 ある日 T 君たちは車で川釣りに出かけた。場所は 図 3.1 の C 地点である。 目的とする魚は、もともと C 地点の上 A湖 流の A 湖と B 湖に住んでおり、 この季節にはほぼ同数ず B湖 つ川を下ってくる。 さて、T 君たちは釣った魚を持ち帰って料理して食べる つもりなのであるが、実は B 湖の魚は周囲の開発が進んで いて味がよくない。だから本当は川の合流点より A 湖側で C 釣りたいのだが、適当な場所がないため仕方なく C 地点で 図 3.1 釣ることになったのである。 また、クーラーボックスに余裕はないので、釣った魚を 全部持ち帰るわけには行かず、A 湖の魚だけを持ち帰り、B 湖の魚はその場でリリースしてしまい たいのである。とはいえ外見はよく似ていて、味については食べてみるまでわからない。 幸い直前に A 湖で調査があり、それによれば A 湖の魚の体長は、平均が 10 cm、標準偏差が 1cm であった。また別の情報により、B 湖の魚の体長は、A 湖より大きいことがわかっている。そこで T 君たちは、この体長の差を利用して魚がどちらの湖からやってきたかを判断することにした。 ゆうど 2. 尤度に基づく判断 ひとつの合理的な方法は、双方の集団の分布から、釣り上 fA (x) fB (x) げた魚の体長が出現する確率を比較し、その確率の大きい方 に属していた、と判断することである。 A 湖の魚の体長の密度関数を fA (x)、B 湖の魚の体長の密度 関数を fB (x) とする。ここで、体長 xcm の魚を釣り上げると いう事象を E(x)、A 湖の魚であるという事象を FA 、B 湖の魚 であるという事象を FB として ベイズの定理を適用すれば、 µA xc µB x 図 3.2 釣った魚が A 湖の魚である確率 P(FA |E )(x) は、 P(FA |E )(x) = P(E(x)|FA ) P(FA ) P(E(x)|FA ) P(FA ) + P(E(x)|FB ) P(FB ) (3.1) と表される。ここで P(E(x)|FA ) = fA (x)、P(E(x)|FB ) = fB (x)、また下ってくる魚はほぼ同数としたから P(FA ) = P(FB ) = 1/2、したがって (3.1) 式は、 P(FA |E )(x) = fA (x) fA (x) + fB (x) (3.2) − 24 − 環境基礎数学演習 2009 第 3 章 仮説検定 と表される。同様に、釣った魚が B 湖の魚である確率 P(FB |E )(x) は次の式で表される。 P(FB |E )(x) = fB (x) fA (x) + fB (x) (3.3) (3.3) 式を具体的に計算するために、次の仮定を置く。 fA (x)、 fB (x) は、それぞれ平均 µA 、µB の正規分布をなしており、標準偏差 σ は等しいとする。 (3.2) 式および (3.3) 式より、2 つの確率が等しくなるのは fA (x) = fB (x) のときであり、そのときの x は、 µA + µB であることがわかる (図 3.2)。そこで、釣った魚の体長 x から次のように判断する。 xc = 2 ( x < xc ならば A 湖の魚 (3.4) x > xc ならば B 湖の魚 しきいち ここで、境界となる値 xc のことを閾値 (threshold) という。 このように、いくつかの可能性のある原因から、ある事象が生起する確率=尤度 (likelihood) をそれぞれ 計算して、その中で最も尤度が大きいものが実際の原因である、と判断する方法を最尤法 という。 3. 二種類の過誤 (3.4) 式の判断すべき文 (章) を 仮説 という。解析を行う者 fA (x) fB (x) β @ @ R α ¡ ª ¡ が行うべきことは、複数の仮説の中から一つの仮説を選択す ることであるが、この判断は常に正しいわけではなく、確率 的にしか当たらない。二つの仮説を、 仮説 A :この魚は A 湖からきた魚である。 仮説 B :この魚は B 湖からきた魚である。 xc x とすると、次の二種類の誤り (過誤) が起きる可能性がある。 図 3.3 第 1 種の過誤 :仮説 A が本当は正しいにもかかわらず、仮説 B を採択してしまう、という誤り。 第 2 種の過誤 :仮説 B が本当は正しいにもかかわらず、仮説 A を採択してしまう、という誤り。 第 1 種の過誤をおかす確率を α 、第 2 種の過誤をおかす確率を β とすると、α 、β はそれぞれ次の式で 表される。 Z ∞ α = fA (x) dx xc Z xc β = fB (x) dx (3.5 a) (3.5 b) −∞ これらは、図 3.3 で示した面積に相当する。 もちろん解析者としては、α も β も小さい方が望ましいが、 なかなかそうはいかない。図 3.4 は α 、すなわち A 湖の魚を fA (x) fB (x) 捨ててしまう確率を小さくするために、閾値 xc を大きめにず らした場合であるが、そうすると今度は β 、すなわち B 湖の 魚を持ち帰る確率が上昇してしまうのである。また、逆に閾 値 xc を大きめにずらして β を小さくしようと思えば、今度は α が大きくなってしまうのである。 β Q QQ s xc 図 3.4 − 25 − α ¤ ¤² x 環境基礎数学演習 2009 第 3 章 仮説検定 この α と β の関係は、両者の平均の差 ∆ µ = µB − µA ∆ µ /σ = 2 1 (3.6) β と、標準偏差によって変わってくる。 図 3.5 に ∆ µ が標準偏差 σ の 2 倍のとき、閾値 xc を変 えたときの α 、β の変化の様子を示す。この場合、最尤 法による判断をしたときに生じる過誤は、α = β = 0.16 α 0 µA である。 µB xc 図 3.5 ただし、実際には密度関数 fB (x)、この場合には ∆ µ (あるいは σB ) が未知であることが多い。その場合には β はこのようには計算できない。β の、未知の ∆ µ に対する変化の様子は、別に検討しなければならない。 4. 帰無仮説 最尤法によって検定するならば、釣った魚をいったんすべてプールし、その中央値を調べて閾値とする。 そして閾値より大きい魚は全部リリースする、ということになるが、T 君たちは最尤法によらず、α を自 分たちで小さめに設定することにした。その分輸送や料理にムダな手間がかかるが、全部の魚をプールす べき場所もないし、なによりせっかく釣った魚をリリースするのが惜しかったのである。 このような任意の α に対する、一般的な検定の手順は次のようになる。 α を優先して決定したことにより、2 つの仮説はすでに対等ではない。 そこでまず、判断すべき仮説を 一つ立てる。これを帰無仮説 という。 帰無仮説:この魚は A 湖の魚であり、平均 µA 、標準偏差 σ の正規分布をする。 帰無仮説に対して、これに対立する他の仮説を立てる。これを対立仮説 という。対立仮説は帰無仮説と 両立するものであってはならないが、帰無仮説の否定である必要はない。この場合でいえば、「この魚は A 湖の魚ではない」が否定であるが、C 地点には無関係な他の湖の魚であるはずがないので、「この魚は B 湖の魚である」を対立仮説としてよい。このように有用な情報を取り入れて対立仮説を立てることによ り、検定の精度を上げることができる。 対立仮説:この魚は B 湖の魚であり、平均 µA + ∆ µ (∆ µ > 0)、標準偏差 σ の正規分布をする。 次に x 軸上の実数の集合 R を、(帰無仮説の) 採択域 X0 と棄却域 X1 f (x) という 2 つの部分集合に分割する。通常それぞれの部分集合は、1 つ以 α 上の区間から構成される (図 3.6)。このとき X1 (したがって X0 ) と第 1 種の過誤 α は、次の関係を満たさなければならない。 Z α = f( x) dx °££ (3.7) X1 X0 観測値 x が x ∈ X0 であれば、帰無仮説を採択する。つまりこの場合 ならば「A 湖の魚である」と判断する。一方 x ∈ X1 であれば、対立仮説 £ -¾ -¾ X1 X0 x 図 3.6 を採択する (「帰無仮説を棄却する」という言い方をする方が多い)。このようにあやまって帰無仮説を棄 却してしまう、という意味で α を 有意水準 、あるいは 危険率 ともいう。 − 26 − 環境基礎数学演習 2009 第 3 章 仮説検定 5. 片側検定 上の手順で重要なのは、棄却域 (採択域) の決定である。(3.7) 式を満 Case:1 たすような棄却域はいろいろ考えられるが、その中で第 2 種の過誤、 Z Z β = fB (x) dx = 1 − fB (x) dx (3.8) X0 X1 ができるだけ小さくなるような棄却域を選ぶ必要がある。 µA 直感的には、µB > µA なのであるから、最尤法のようにある閾値 xc xc x 図 3.7 より大きい領域を棄却域とすればよいように思える (図 3.7)。そしてこ の場合はそれが確かに最良の棄却域となっているのである。このように棄却域として密度関数の片側の端 をとることを片側検定 という。 片側検定では、(3.7) 式は次の形になる。 Z ∞ α = xc fA (x) dx (3.9) したがって、与えられた α に対して、閾値 xc は (3.9) 式を満たす値として計算できる。 6. 検定力 片側検定では、(3.8) 式は次の形になる。 Z ∞ Z ∞ β = xc fB (x) dx = 1 − xc fB (x) dx (3.10) Pt の変化 α = 0.05 1 Case:1 xc は (3.9) 式で与えられるので、β は fB (x) によって 決まる。仮定によりこれは ∆ µ 、正確には ∆ µ と σ の 比によってきまる。 この場合 ∆ µ は不明である。そこで、∆ µ によっ て β がどのように変わるかを調べることにする。た α 0 Case:2 −2 だし、統計学では慣用的に β で表す代わりに、次の −1 0 2 ∆ µ /σ 1 図 3.8 Pt = 1 − β で定義される検定力 (検定力関数) で表すこ とが多い。 Pt = 1 − β = 1 − Z ∞ xc fB (x) dx (3.11) 検定力が大きいほど、第 2 種の過誤をおかす確率が低くなる。α = 0.05 の場合について、検定力で表した結果を図 3.8 に太線で示した。こ Case:2 の図の見方は、図 3.7 のような棄却域をとったときには、A 湖の魚を 5% 逃がしてしまう代わりに、もし B 湖の魚の平均体長が A 湖より σ だけ大きければ、不要な B 湖の魚を 26%、差が 2 倍ならば 64%、差が 3 倍ならば 91% リリースしてしまうことができる、ということである。 しかし万一見込みが違って、B 湖の魚の方が体長が小さければ、B 湖の µA x 図 3.9 魚の方をより多く持って帰るということになる。 なお参考のために、図 3.9 のように密度関数 fA (x) の中央部分に故意に棄却域を置き、そのときの検定 力を計算して図 3.8 に細線で示した。一見してわかるように、この検定力曲線はすべての ∆ µ で α より小 さい値をとり、つねに B 湖の魚の方をより多く持って帰るハメになる。 − 27 − 環境基礎数学演習 2009 第 3 章 仮説検定 7. 両側検定 方針を決めた T 君たちは釣りを開始した。ところが何匹か釣り上げたところで、今度は同行した W 君 がこんなことを言いだした。 『A 湖の調査は試験場が行ったもので、まずまず信用できるが、B 湖の方は近くの中学校の生徒が行っ た宿題を、釣り雑誌が転載しただけのもので、サンプル数などの点で問題がある。したがって B 湖の魚の 方が体長が大きいという情報は、信用することができない。』 この発言を受けて、T 君たちは問題を考え直さなければならなくなった。 この場合でも帰無仮説は不変である。 帰無仮説:この魚は A 湖の魚であり、平均 µA 、標準偏差 σ の正規分布をする。 しかし、∆ µ > 0 という情報が失われたため、対立仮説は次のように修正しなければならない。 対立仮説:この魚は B 湖の魚であり、平均 µA + ∆ µ (∆ 6= 0)、標準偏差 σ の正規分布をする。 次に、これらの帰無仮説・対立仮説のもとに、適切な棄却域を選び Case:3 直さねばならない。対立仮説が変わった以上、片側検定の棄却域図 3.7 は、もはや β を最小にするとは限らないからである。そこで対称性を 考慮して T 君たちが選んだ棄却域は図 3.10 である。これは両側に α /2 ずつの棄却域をおくものである。このように棄却域として密度関数の 両端をとることを、両側検定 という。 µA −xc α = 0.05 の場合について、図 3.11 に両側検定の検定力曲線を太線で xc x 図 3.10 示す。 検定力曲線は対称となり、∆ µ の絶対値が大きくな るほど検定の正確さは増加する。これは両群の平均値 の差が大きくなるほど、見分けやすくなるということ Pt の変化 α = 0.05 1 Case:3 を意味する。 Case:1 次に、片側検定と両側検定の検定力を比較するため に、図 3.11 に片側検定の検定力曲線を、細線で再掲 する。 これより、∆ µ > 0 の場合には、両側検定の方が片 側検定よりもすべての範囲にわたって検定力が減少し α 0 −2 −1 0 1 2 ∆ µ /σ 図 3.11 ていることがわかる。すなわち ∆ µ > 0 という情報を失ったため、検定力がその分失われた、と解釈する ことができる。 一方情報が誤っていて ∆ µ < 0 だった場合には、片側検定の検定力は大幅に減少が、両側検定はその対 称性より、どちらの場合も同じだけの検定力を示す。すなわち帰無仮説が同じでも、対立仮説の違いに よって検定の正確さは変わってくる。結局のところ、検定の有効性は、情報をどう利用するかによるので ある。 T 君たちの話はこれで終わりである。以後はこれらの原理に基づいて、具体的に判断を行うための手順 を述べていく。 − 28 − 環境基礎数学演習 2009 第 3 章 仮説検定 § 3.2 仮説検定の手順 1. 閾値を求める方法 以前から行われている方法である。まず、与えられた有意水準 α に対応する棄却域の境界となる閾値を 求める。求める方法は統計表を引くか、あるいは Excel などの表計算ソフトを利用する。その閾値と標本 から求められた統計値 X を比較して、X が棄却域にあるかどうか判断する。 密度関数を f (x) としたとき、(累積) 分布関数 S(x) を次の式で定義する。 Z X S(X) = f (x) dx (3.12) −∞ 片側検定 有意水準 α での右片側検定の場合の 閾値 X0 は、次の式を満たす値である。 S(X0 ) = 1 − α 右片側検定 左片側検定 (3.13) あるいは X0 = S−1 (1 − α ) α (3.14) 求められた閾値 X0 と、標本より得 µ X0 α X00 x µ x 図 3.12 られた統計値 X を比較し、X > X0 で あれば仮説は棄却され、X < X0 であれば仮説は採択される。 同様に左片側検定の閾値 X00 は、 S(X00 ) = α (3.15) あるいは X00 = S−1 (α ) (3.16) で計算される。求められた閾値 X00 と、標本より得られた統計値 X を比較し、X < X00 であれば仮説は棄却 され、X > X00 であれば仮説は採択される。 両側検定 有意水準 α での、両側検定の 2 つの閾値 X1 、X2 は、次の式を満たす 両側検定 値である (図 3.13)。 S(X1 ) = α α 、 S(X2 ) = 1 − 2 2 (3.17) すなわち、S(X) の逆関数を S−1 (x) とすれば、 X1 = S−1 ( α /2 α α )、 X2 = S−1 (1 − ) 2 2 (3.18) X1 より計算される。 α /2 µ X2 x 図 3.13 これらの閾値と、標本より得られた統計値 X を比較する。X < X1 あ るいは X2 < X であれば仮説は棄却され、X1 < X < X2 であれば仮説は採択される。 閾値を求める方法の利点は、いったん閾値を求めれば、次々に観測値が与えられても、すぐに検定でき ることである。反面、計算には分布関数の逆関数を求めなければならないので、関数形が複雑だと計算が 難しい。実際には統計表を引いて与えることになるが、この場合任意の有意水準 α に対する閾値を求める ことはできない。 − 29 − 環境基礎数学演習 2009 第 3 章 仮説検定 2. p 値を求める方法 閾値を求める方法と逆の発想で、得られた観測値 X から、仮に X が閾値であるとしたときの有意水準 の値を求める方法がある。この値を p 値 という。p 値が有意水準 α よりも小さければ、X は棄却域に含 まれると判断できる。 片側検定 , 右片側検定の場合の p 値は、図 3.14 p値 の左側の図の縦線で囲まれた部分の面 閾値 積に相当し、 p = 1 − S(X) (3.19) α p で与えられる。これと右側の閾値の図 µ とを比較すると、 X µ x 「 p< α ならば、X > X0 」 X0 x 図 3.14 であることがわかる。またこの逆も成り立つ。すなわち、 定理 3.1 p 値による判定 p< α ならば、X は棄却域に含まれ、p> α ならば、X は採択域に含まれる したがって、(3.19) 式により p 値を計算し、これを有意水準 α と比較することにより、仮説の判定を行う ことができる。 左片側検定の場合は、(3.19) 式の代 p = S(X) 両側検定 左片側検定 わりに、 (3.20) により p 値を計算することにより、全 p p/2 く同様に判定することができる。 両側検定 X µ µ x X x 図 3.15 両側検定の場合、X > µ ならば、 p/2 p = 1 − S(X) 2 (3.21) であるから、 p = 2(1 − S(X)) (3.22) より計算する。逆に X < µ ならば、次の式で与えられる。 p = 2 S(X) (3.23) この方法の利点は、p 値が閾値に比較して簡単に求められることである。また、有意水準 α を変更して も判断は容易である。一方、観測値が得られるたびにいちいち p 値を求めなければならないため、手作業 にはむかない。しかし、表計算ソフトを使うならば計算の手間は問題ではないので、現在はこちらの方法 が多く使われる。 − 30 − 環境基礎数学演習 2009 第 3 章 仮説検定 § 3.3 正規分布による検定 1. 正規分布 確率密度関数 次の関数、 1 2πσ f (x) = √ N(z) 0.4 (x−µ )2 − e 2σ 2 (3.24) を確率密度関数として持つ確率変数 x の分布を、平均 µ 、 分散 σ の 正規分布 といい、N(µ , σ ; x) と書く。これは z= x−µ σ (3.25) −2 という換算式により、 0 x 2 図 3.16 z2 1 N(0, 1; z) = √ e− 2 2π (3.26) と同一の形に変換される。(3.26) 式の分布を、標準正規分布 といい、単に N(z) とも書く。N(z) のグラ フを図 3.16 に示す。 累積分布関数 実際には、検定などではこの関数形を使うことは少なく、 er f c(z) 1 むしろその積分形が使われることが多い。このため、標準 正規分布 N(z) をある範囲で積分した関数を考え、その関 数あるいはその逆関数を扱うのが便利である。そのような 関数を 誤差関数 といい、er f c(x) などと書く。 ただし、正規分布の積分は初等関数として表すことがで きないので、誤差関数はそのまま N(z) の積分の形で定義 −2 しなければならない。 積分範囲としては、いくつかの種類があり、統計表など 0 2 図 3.17 に用いられている。代表的なものは次の 3 種である。 Z z (1) er f c1 (z) = N(t) dt ( 積分範囲 − ∞ < t < z ) −∞ Z ∞ (2) er f c2 (z) = N(t) dt ( 積分範囲 z < t < ∞ ) z Z z (3) er f c3 (z) = N(t) dt ( 積分範囲 0 < t < z ) (3.27) (3.28) (3.29) 0 最もよく使われる (3.27) 式のグラフを図 3.17 に示す。 Z ∞ Z ∞ また N(t) dt = 1、 N(t) dt = 1/2 であるから、これらは次のように簡単に換算できる。 −∞ 0 er f c2 (z) = 1 − er f c1 (z)、 er f c3 (z) = er f c1 (z) − 1/2 (3.30) 統計表には、このどれかの er f c(z) およびその逆関数が記載されているから、それにより求める値を得 ることができる。そのためには、まず元の x の値から (3.25) 式により対応する z の値を計算し、z につい て er f c(z) を使って値を求め、最後にまた x に換算する必要がある。現在ではパソコンの表計算ソフトが 使えるので、換算法さえ知っていれば計算の手間はほとんどない。 − 31 − 環境基礎数学演習 2009 第 3 章 仮説検定 2. 一個の標本の検定−母集団の分布が既知の場合 問題の設定 ある特定の標本が、正規分布であることのわかっている母集団に属するものか否かを判断するための検 定であり、T 君の例が正にこれにあたる。ここでは、次のような問題を例にとって説明する。 ¶例題 3-1 ³ ある会社の新品の電池の電圧を調べたところ、平均が 1.65V、標準偏差は 0.05 V であった。たま たま同じ種類の電池が 1 個見つかり、その電圧を調べたところ 1.55V であった。この電池は新品と みなしてよいか。 µ ´ 仮説の設定 電池は使用したり、長期間放置すれば電圧は下がるものであるから、仮説は次のように立てられる。 帰無仮説:この電池は新品である。 対立仮説:この電池は新品ではなく、電圧は下がっている。 確率密度関数の算出 帰無仮説が正しいとすれば、電池の電圧 x は N(1.65, 0.05; x) の正規分布にしたがうはずである。 棄却域の決定 対立仮説が正しいとすれば、電圧は低くなるという情報が得られているので、左片側検定を行う。 p 値の計算 p 値を求める方法で検定を行う。 Excel を起動し、どこか適当なセル を左クリックする。次に数式ウィン ドウ (図 3.18 の右上部分) をクリッ クし、「 fx 」のロゴのある関数を左 クリックする。分類リストが表示さ れるので、その中から「統計」を左 クリックし、さらに関数リストの中 から「NORMDIST」を左クリックす る。すると図 3.18 のような関数画 面に切り替わるので、数値ウィンド 図 3.18 ウの「x」 、 「平均」 、 「標準偏差」のカ ラムに、1.55、1.65、0.05 を順に入力する。「関数形式」のカラムには「TRUE」と入力する。 すると右中央部に計算された p 値が表示される。ここで右下の「OK」を左クリックすれば、計算値が 最初に指定したセルに入る。 判定 これより p 値は 0.023 と算出される。したがって、有意水準を 5%(= 0.05) にとれば、標本は棄却域に 含まれ、帰無仮説は棄却される。つまり新品ではないと判断される。 一方、有意水準を 1%(= 0.01) にとれば、標本は採択域に含まれ、帰無仮説は採択される。つまり新品 であると判断されることになる。 − 32 − 環境基礎数学演習 2009 第 3 章 仮説検定 3. 一回の抽出による複数個の標本の検定−母集団の分布が既知の場合 問題の設定 次に、1 回の標本抽出で、独立した複数の標本を得て、検定する場合を考える。 ¶例題 3-2 ³ ある湖での、化学物質 Q の存在量 x について、その平均は µ = 5、標準偏差は 2 であることが、こ れまでの長年の観測からわかっている。今回その量を測定したところ、16 回の観測の平均値は 6.2 であった。この湖の化学物質 Q の量は増加したと結論できるか。 µ ´ 仮説の設定 仮説は次のように立てられる。 帰無仮説:化学物質 Q の濃度は変化していない。 対立仮説:化学物質 Q の濃度は増加している。 確率密度関数の算出 帰無仮説が正しいとすれば、1 個のサンプルの Q の濃度は x は、N(5, 2; x) の正規分布にしたがうはず である。複数のサンプルの平均については、次の定理が使える。 定理 3.2 平均 µ 、標準偏差 σ の母集団から、無作為に N 個の標本を抜き出したとき、それら N 個の標本 σ の正規分布に従う。 N の平均値 X は、平均 µ 、標準偏差 √ この定理により、16 個の平均値の分布は平均 5、標準偏差 0.5 の正規分布となる。 棄却域の決定 対立仮説が正しいとすれば、Q の濃度は高くなるという情報が得られているので、右片側検定を行う。 p 値の計算 前問と同様に p 値を求める。ただ し、今回は右片側検定であるので、 fx ロゴをクリックして計算した後、 数式ウィンドウの「=」と関数の間に 「1 −」と半角で挿入しなければなら ない (図 3.19 右上)。 判定 下部左に、p 値は 0.0082 と算出さ れる。したがって、有意水準を 5%、 1% どちらにとっても、標本は棄却 図 3.19 域に含まれ、帰無仮説は棄却される。 すなわち濃度は上昇していると判断される。 − 33 − 環境基礎数学演習 2009 第 3 章 仮説検定 § 3.4 t-分布と検定への応用 1. Student の t-分布関数 t-分布の確率密度関数 実際には、多くの場合得られる標本数は少ない。しかも母分散は知られていないのが普通であり、この 場合母分散を標本から推定しなければならない。この場合、標本の平均はもはや正規分布には従わないの で、次の定理を使わなければならない。 定理 3.3 平均 µ 、分散 σ 2 の母集団から無作為に抽出された大きさ n の標本の平均を m、不偏分散を n s2 = ∑ (Xi − m)2 i=1 (3.31) n−1 とすると、 T = √ (m − µ ) n s (3.32) は、自由度 n − 1 の t 分布にしたがう。 ニユー ここで自由度 ν の t-分布とは、 Γ ( ν +1 t 2 − 1 (ν +1) 2 ) ) 2 (1 + ν π ν Γ ( ν2 ) f (t ; ν ) = √ 0.4 (3.33) 標準正規分布 - ¾ t 分布 という確率密度関数で表される分布である。(3.33) の関数 自由度 2 を Student の t 分布関数という。 自由度 2 のときの t-分布の密度関数を図 3.20 に示す。ほ ぼ標準正規分布に似た偶関数であり、自由度が大きくなる と正規分布に近づき、ν = ∞ で一致する。 −2 0 2 図 3.20 累積分布関数 正規分布の場合と同様に t-分布も確率密度関数よりも積分形の方が使われることが多い。 Excel で、p 値を求めるには関数「TDIST」を使う。測定 値から (3.32) 式により T を算出し、T と自由度を入力し、 「尾部」に 1 を指定すれば、図 3.21 の縦線部分の面積、す T DIST (T, µ , 1) なわち右片側検定の p 値が計算される。「尾部」に 2 を指 定すれば、前者を 2 倍した両側検定の p 値が計算される。 ただし左片側検定には対応していないので、T < 0 の場合 ? には | T | に対応する右片側検定の p 値を求めて、判断する 0 ことになる。 閾値を求める方法では、境界となる T の値は関数「TINV」 T 図 3.21 より求める。ただし、この関数の確率値は、両側検定用の有意水準であるので、片側検定の場合はその有 意水準を 2 倍した値を指定する (有意水準 5% なら、0.1)。そして、求めた T から (3.32) 式 により逆に m の境界値を求め、棄却域にあるかどうかを検定する。 − 34 − 環境基礎数学演習 2009 第 3 章 仮説検定 2. 平均が既知である正規分布する母集団からの小標本の抽出 問題の設定 ¶例題 3-3 ³ ある湖での、化学物質 R の量を測定したところ、9 回の観測の平均値は 5.9、不偏分散 s2 = 4 で あった。もし汚染がなければ、化学物質 R の平衡量は 5.0 であることが理論から推定できる。この湖 は汚染されていると結論できるか。 µ ´ 仮説の設定 仮説は次のように立てられる。 帰無仮説:湖は汚染されていない。すなわち母集団の R = 5.0。 対立仮説:湖は汚染されている。すなわち母集団の R > 5.0。 確率密度関数の算出 (3.32) 式より、観測の平均値 m は、 T = 3(m − 5) 2 (3.34) は自由度 8 の t 分布にしたがうことがわかる。 棄却域の決定 対立仮説が正しいとすれば、R の濃度は高くなるという情報が得られているので、右片側検定を行う。 p 値の計算 (3.34) 式に m = 5.9 を代入して、T = 1.35。TDIST(1.35, 8, 1) = 0.107。 判定 有意水準を 5%、1% どちらにとっても、標本は採択域に含まれ、帰無仮説は採択される。すなわち湖 は汚染されていないと判断される。 3. 対応のある 2 群の標本の平均値の差の検定 明確な対応関係のある n 組のデータの、平均値の差の検定するためにも、t-分布が使われる。 問題の設定 ¶例題 3-4 ³ 次のデータは、ある町の 5 カ所で測った平日と休日の交通量 (台/日) である。2 つの平均値に差が あるかどうかを検定せよ。 平日 休日 地点 A 121 130 地点 B 58 50 地点 C 88 95 地点 D 73 72 地点 E 95 102 µ ´ 仮説の設定 仮説は次のように立てられる。 − 35 − 環境基礎数学演習 2009 第 3 章 仮説検定 帰無仮説:平日と休日では交通量に差がない。 対立仮説:平日と休日では交通量に差がある。 差の計算 まず、各地点について両者の差を求める。 差 地点 A 9 地点 B -8 地点 C 7 地点 D -1 地点 E 7 確率密度関数の算出 上表の不偏分散は、(3.33) 式より s2 = 51.2 だから、平均を m として (3.34) 式より、 √ 5(m − 0) T = √ 51.2 (3.35) は自由度 4 の t 分布にしたがうことがわかる。 棄却域の決定 特にどちらが大きくなるという情報はないので、両側検定を行う。 p 値の計算 (3.35) 式に差の平均 m = 14/5 = 2.8 を代入して、T = 0.875。TDIST(0.875, 4, 2) = 0.431。 判定 有意水準を 5%、1% どちらにとっても、標本は十分採択域に含まれ、帰無仮説は採択される。すなわ ち両者の交通量に差はない、と判断できる。 Excel ツールによる計算 【1】まず元の例題 例題 3-5 の表を、Excel の適当な場所に入力する。 【2】「ツール」→「分析ツール」→「t 検定:一対の標本による平均の検定」を選択する。 【3】変数 1、変数 2 に 2 つのデータ列を指定する。 【4】帰無仮説の µ の値を入力する (この場合なら 0)。 【5】有意水準を指定する。5% ならば、0.05 【6】T の値、両側、片側検定に対する、p 値、閾値がそれぞれ表示される。あとはこの数字から判定を行 えばよい。 この検定は、2 組のデータに明白な対応があって、その差のみが問題になるときにのみ使える。たとえ データの数が等しくても、このような明白な対応がないときには使えず、他の検定法によらなければなら ない。 − 36 − 環境基礎数学演習 2009 第 3 章 仮説検定 § 3.5 F-分布と検定への応用 カイ 1. χ 2 -分布 対になっていない 2 つの標本群の平均値の差を比較するためには、両標本群の分散が同一かどうかを検 定しなければならない。 その検定を行う前に、まず次の定理からはじめる。 定理 3.4 平均 µ 、分散 σ 2 の母集団から無作為に抽出された大きさ n の標本の標本平均を X̄ 、標本分散を n S2 = ∑ (Xi − X̄)2 i=1 (3.36) n とすると、(↑ (3.31) 式との違いに注意) u= n S2 σ2 (3.37) は、自由度 n − 1 の χ 2 -分布にしたがう。 ここで自由度 ν の χ 2 -分布とは、 f (u;ν ) = 1 2 ν 2 Γ ( ν2 ) ν u u 2 −1 e− 2 (3.38) 0.3 χ 2 分布 自由度 3 という確率密度関数で表される分布である。 自由度 3 のときの χ 2 -分布の密度関数を図 3.22 に示す。(3.37) 式の定 義より、u の定義域は正の領域に限られ、原点に対して非対称な関数であ り、その形は自由度によって大きく変わる。また、この関数は u = ν − 2 のときに最大値となる。 0 1 2 3 図 3.22 2. Fisher の F-分布関数 次に 2 つの正規分布する母集団から、それぞれ標本を抽出することを考える。抽出する個数は異なって もよい。このとき以下の定理がなり立つ。 定理 3.5 2 つの正規分布する母集団から、それぞれ n1 個と n2 個の標本を抽出する。これらの標本から それぞれ (3.38) 式の χ 2 変数を計算し、それらを χ12 、χ22 とする。 定理よりこれらの変数はそれぞれ自由度 n1 − 1、n2 − 1 の χ 2 分布に従う。このとき、 χ / (n1 − 1) F = 12 2 (3.39) χ2 / (n2 − 1) とすると、 F は自由度 n1 − 1、n2 − 1 の F-分布にしたがう。 − 37 − 環境基礎数学演習 2009 第 3 章 仮説検定 ここで自由度 ν1 、ν2 の F-分布とは、 0.6 ν1 ν1 ν2 Γ ( ν1 +2 ν2 ) F 2 −1 2 2 f ( F ; ν1 、ν2 ) = ν1 ν2 ν1 ν2 1 Γ ( 2 )Γ ( 2 ) (ν2 + ν1 F) 2 (ν1 +ν2 ) (3.40) F 分布 自由度 (4,4) という確率密度関数で表される分布である。 自由度 ν1 = 4、ν2 = 4 のときの F-分布の密度関数を図 3.23 に示す。 F− 分布は 2 つの自由度を持つ分布であり、それらの値によって関数形 が変化する。 0 1 2 3 図 3.23 3. 等分散検定 問題の設定 ¶例題 3-6 ³ 次のデータは、2 つの森林地で測ったある昆虫の体長である。2 つの母集団が正規分布に従うとし て、その分散に差があるかどうかを検定せよ。 森林 1 森林 2 17 13 13 14 12 14 15 12 11 10 12 µ ´ 仮説の設定 帰無仮説:s21 = s22 である。 対立仮説:s21 6= s22 である。 確率密度関数 次の定理を利用する。 定理 3.6 F-分布 2 つの正規分布する母集団から、それぞれ n1 個、n2 個の標本を取り、その不偏分散 ( (3.31) 式 ) をそれぞれ s21 、s22 とするとき (ただし s21 > s22 とする)、 s2 F = 21 は、自由度 n1 − 1、n2 − 1 の F-分布に従う。 s 2 棄却域の決定 s21 > s22 としているので、右片側検定を行う。 p 値の計算 s21 = 5.8、s22 = 2.3 であるから、F = 2.52 である。自由度 (4,5) の F-分布の F = 2.52 に対する右片側検 定の p 値は、表あるいは Excel の FDIST 関数より、0.169 と計算される。 判定 − 38 − 環境基礎数学演習 2009 第 3 章 仮説検定 有意水準 5%、1% とも、p> α であるから帰無仮説は採択される。すなわち両者の分散には差がない。 Excel ツールでの計算 【1】まず元のデータを、Excel の適当な場所に入力する。 【2】「ツール」→「分析ツール」→「F 検定:2 標本を使った分散の検定」をクリックして反転させ、OK をクリックする。 【3】変数 1、変数 2 に 2 つのデータ列を指定する。 【4】F の値、両側検定に対する p 値が表示される。あとはこの数字から判定を行えばよい (両側検定と表 示されるが、実は上に述べたように右片側検定である)。 このように、まず 2 群に分散の差があるかどうかを検定した後に、2 群の平均値の差を t-関数を使って 検定することになる。その方法は、等分散検定の結果により異なる。 4. 対応のない 2 群の標本の平均値の差の検定−分散の等しい場合 分散の差を検定した例題を、引き続いてその平均値の差を検定する。 仮説の設定 帰無仮説:µ1 = µ2 である。 対立仮説:µ1 6= µ2 である。 確率密度関数 次の定理を使う。 定理 3.7 同一母分散を持つ 2 群の平均値の差 2 つの分散が等しい正規分布する母集団から、それぞれ n1 個、n2 個の標本を取り、その標本平 均を m1 、m2 、不偏分散をそれぞれ s21 、s22 とし、その合成分散を、 2 2 s (n1 − 1) + s2 (n2 − 1) s2 = 1 とするとき、 n1 + n2 − 2 m1 − m2 t= は、自由度 n1 + n2 − 2 の t-分布に従う。 s (1/n1 + 1/n2 ) 棄却域の決定 両側検定を行う。 p 値の計算 (Excel ツールによる計算) これを手計算で行うのはたいへん面倒なので、計算は Excel ツールで行う。 【1】まず元のデータを、Excel の適当な場所に入力する。 【2】「ツール」→「分析ツール」→「t 検定:等分散を仮定した 2 標本による検定」を選択する。 【3】変数 1、変数 2 に 2 つのデータ列を指定する。 【4】帰無仮説の µ の値を入力する (この場合なら 0)。 【5】危険率を指定する。5% ならば、0.05 これらの手続きにより、両側検定の p 値は 0.38 と計算される。 判定 有意水準 5%、1% とも、p> α であるから帰無仮説は採択される。すなわち両者の平均値には差がない。 − 39 − 環境基礎数学演習 2009 第 3 章 仮説検定 5. 対応のない 2 群の標本の平均値の差の検定−分散の異なる場合 もしも等分散検定で、分散が異なると判定された場合の手続きは以下のように変わる。 仮説の設定 帰無仮説:µ1 = µ2 である。 対立仮説:µ1 6= µ2 である。 確率密度関数 次の定理を使う。 定理 3.8 異なる分散を持つ 2 群の平均値の差 2 つの分散が異なる正規分布する母集団から、それぞれ n1 個、n2 個の標本を取り、その標本平 均を m1 、m2 、不偏分散をそれぞれ s21 、s22 とし、その合成分散を、 2 2 s (n1 − 1) + s2 (n2 − 1) とする。このとき、 s2 = 1 p= n1 + n2 − 2 2 s1 /n1 s22 /n2 、 q = s21 /n1 + s22 /n2 s21 /n1 + s22 /n2 p2 q2 として、 1 = + に対して、 df n1 − 1 n2 − 1 t= m1 − m2 は、自由度 d f の t-分布に従う。 s (1/n1 + 1/n2 ) 棄却域の決定 両側検定を行う。 p 値の計算 (Excel ツールによる計算) やはり計算は Excel ツールで行うが、前と【2】の部分が異なる。 【1】まず元のデータを、Excel の適当な場所に入力する。 【2’】 「ツール」→「分析ツール」→「t 検定:等分散に差があると仮定した 2 標本による検定」をクリック して反転させ、OK をクリックする。 【3】変数 1、変数 2 に 2 つのデータ列を指定する。 【4】帰無仮説の µ の値を入力する (この場合なら 0)。 【5】危険率を指定する。5% ならば、0.05 判定 これらの手続きにより計算された p 値より判定を行う。 − 40 − 環境基礎数学演習 2009 第 3 章 仮説検定 3 章 の 練 習 問 題 A 【 問題 3-1 】 ある湖での、化学物質 A の存在量 x について、その平均は µ = 6、標準偏差は 1 であることが、これま での長年の観測からわかっている。今回その量を測定したところ、100 回の観測の平均値は 6.19 であっ た。この湖の化学物質 A の量は増加したと結論できるか。 【 問題 3-2 】 25 個の標本を抽出したところ、その平均は 4.2、不偏分散 s2 は 8 であった。 帰無仮説:µ = 5 対立仮説:µ 6= 5 として t-検定せよ。 【 問題 3-3 】 次のデータは、あるクラスの 15 人を、A、B、二つのグループに分けたときの、試験の点数である。 A B 45 49 58 53 65 59 72 63 74 68 80 73 85 75 91 両グループ内での分散は等しいとして、平均点に差があるかどうか、検定せよ。 − 41 − 環境基礎数学演習 2009 第 3 章 仮説検定 3 章 の 練 習 問 題 B 【 問題 3-4 】 T 君の例で、A 湖の魚の体長の平均は 10cm、標準偏差は 1cm とする。 (1) 閾値を求める方法により、α = 0.05 のときの両側検定に対する棄却域を求めよ。 (2) 同じく、α = 0.01 のときの右片側検定に対する棄却域を求めよ。 (3) p 値を使う方法により、観測値 x = 11.5 に対する両側検定、右片側検定の p 値をそれぞれ求めよ。 【 問題 3-5 】 次のデータは、8 人の学生の休暇前と休暇後の体重である。 前 後 A 55 59 B 46 44 C 62 67 D 58 57 E 71 72 F 54 58 G 65 67 H 66 67 (1) まず両者の差を求め、Excel 分析ツールの「基本統計量」を使い、その平均と標準偏差 (この場合、普 遍分散の平方根) から、(3.32) 式より T を計算する。T DIST 関数を呼び出すことにより、休暇前後で平均 体重に差があるかどうかを検定せよ。 (2) Excel 分析ツールの、「一対の標本による平均値の検定」により p 値を求め、上と一致することを確か めよ。 【 問題 3-6 】 2 つのグループ A, B より、それぞれ 8 人、7 人をランダムに選び、その身長を測ったところ次のデータ が得られた (単位 cm)。 A グループ · · · 165,173,158,177,160,162,166,180 B グループ · · · 153,156,156,155,161,155,161 (1) 両グループの分散に差があるかどうかを検定せよ。 (2) 両グループの平均に差があるかどうかを検定せよ。 − 42 −