...

4.p%値の算出

by user

on
Category: Documents
7

views

Report

Comments

Transcript

4.p%値の算出
4.p%値の算出
1.パラメータが既知の場合(母集団扱い) ................................................................................. 1
1.1
1 確率変数 ............................................................................................................................ 1
1.2
相関のある 2 確率変数......................................................................................................... 2
1.2.1
X , Y が共に正規分布の場合 ......................................................................................... 2
1.2.2
非正規分布の場合.......................................................................................................... 6
1.2.3
算出例............................................................................................................................ 9
2.パラメータが未知の場合(標本扱い)................................................................................... 19
2.1
正規分布 ............................................................................................................................. 19
2.2
非正規分布 ......................................................................................................................... 24
2.2.1
対数正規分布 ............................................................................................................... 24
2.2.2
ワイブル分布 ............................................................................................................... 25
3.計算例...................................................................................................................................... 28
P%値の算出
1.パラメータが既知の場合(母集団扱い)
1.1 1 確率変数
パーセント点(percentile)とは確率 p の値のことで、本書では p % 値と呼ぶことにします。
文献1のように基準強度特性値として 5%値とする。2)基準弾性特性値は 50%値とする。など
と使用されます。50%値は分布形が対称の場合には平均値と同じ意味を持ちます。
5%値あるいは 50%値は、確率分布が既知であれば、クォンタイル関数(逆確率分布関数)か
ら算出できます。
例えば、平均値   10 、標準偏差   2.5 の母集団がある場合、5%値は下のようになります。
正規分布
5%値
xp  qnorm 0.05     
xp  5.888
対数正規分布
パラメータ

  ln 


 
2

ln 1  CV

2
 1  CV 
5%値
  2.272
  0.246
xp  qlnorm  0.05     
xp  6.471
2P ワイブル分布
パラメータ
2




  m  2    m  1  






  m 
 m    m  1  15
m  root CV  


m1
 







 m 


  10.952
 

m1
 

 m 
m  4.542
1
5%値
1
xp  ( ln ( 1  0.05) )
「木質構造設計規準・同解説
m

xp  5.695
許容応力度・許容耐力設計法」
4-1
日本建築学会
P%値の算出
このように、対数正規分布(6.471)>正規分布(5.888)>2P ワイブル分布(5.695)となっ
て、平均、標準偏差が同じでも仮定する分布形により 5%値は異なる値となります。
表-1 に変動係数の変化させた場合(0.1~0.5)の対数正規分布、正規分布、2P ワイブル分布の
5%値の比を示します。変動係数によらず対数正規分布の 5%値が最も高くなり、変動係数が 0.1
~0.3 程度ならば正規分布と 2P ワイブル分布の 5%値は近い値となることが分かります。
表- 1 対数正規分布、正規分布、2P ワイブル分布の 5%値の比
変動係数
対数正規分布
正規分布
2P ワイブル分布
0.1
101
100
98
0.2
106
100
96
0.3
117
100
98
0.4
144
100
109
0.5
232
100
155
“R”で p % 値を求めるための関数例は以下の通りです。
pcal<-function(μ,CV,p){#p%値を平均値、変動係数から求める関数
σ<-μ*CV#標準偏差
λ<-log(μ/(1+CV^2)^0.5)#対数正規分布パラメータ
ξ<-(log(1+CV^2))^0.5#対数正規パラメータ
f2p<-function(m){#2P ワイブルパラメータ算出関数
atai<-CV-(gamma(1+2/m)-gamma(1+1/m)^2)^0.5/gamma(1+1/m)
return(atai)
}
m<-uniroot(f2p,lower=1,upper=15)$root#2P ワイブルパラメータ m
η<-μ/gamma(1+1/m)#2P ワイブル分布パラメータη
normp<-qnorm(p,μ,σ)#正規分布 P%値
logp<-qlnorm(p,λ,ξ)#対数正規分布 P%値
weip<-qweibull(p,m,η)#2P ワイブル分布 P%値
c(" 正 規 "=normp," 対 数 正 規 "=logp,"2P ワ イ ブ ル "=weip," 対 数 正 規 / 正 規 "=logp/normp,"2P ワ イ ブ ル / 正 規
"=weip/normp)
}
1.2
相関のある 2 確率変数
相関のある 2 つの確率変数 X , Y の場合です。 X を MOE、 Y を MOR とすると、MOE による
等級区分材の下限値算出などに用いられます。
1.2.1
X , Y が共に正規分布の場合
2 つの確率変数 X , Y を正規分布、相関係数を  とし、 X , Y の平均および標準偏差をそれぞれ
4-2
P%値の算出
 x ,  x ,  y ,  y とすれば、同時確率密度関数(joint probability density function)は 1)式で表され
ます。
f xy ( x, y,  xy ) 
1
2     x   y  1   xy
2
 x   2
 x  x

x
 
  2   xy  
 x
  x 

1
 exp  
2
 2  (1   xy )
  y  x
  
  y
  y  y
  
  y



2
・・・ 1)




 x  10,  x  2.5,  y  40,  y  10 の各確率密度関数を描画すると、図-1のようになります。
(周辺密度関数(marginal density function)と呼ばれます。)
0.2
 y  10,  y  2.5
0.15
0.1
 x  40,  x  10
0.05
0
0
20
40
60
80
図- 1 周辺密度関数
各確率変数の 5%値をクォンタイル関数で算出すると下記のようになります。
x05  qnorm 0.05   x   x
x05  5.888
y05  qnorm  0.05   y   y
y05  23.551
同時確率密度は図-2 のようになり、4  x  5 の範囲の同時確率密度は図-3 のようになります。
(X=MOE、Y=MOR  xy  0.7 、  x  10,  x  2.5,  y  40,  y  10 )
すなわち、図-3 は MOE による区分材の確率密度を表すことになります。
4-3
P%値の算出
図- 2 同時確率密度
図- 3
4  x  5 の同時確率密度
X  x に お け る Y の p% 値 を 求 め る た め に は 、 X  x で の Y の 条 件 付 確 率 密 度 関 数


(conditional density function f x y y x )を知る必要があります。


同時確率密度関数( f xy  x, y  )、Y の確率密度関数( f y  y  )、条件付確率密度関数( f x y y x )
には 2)式の関係が成り立ちます。
f xy  x, y   f x y  x y   f x  x 
・・・ 2)
4-4
P%値の算出
1)式を変形すると 3)式となりますから 2)式を参照して、 X  x での Y の条件付確率密度関


数( f x y y x )は 4)式となります。
f xy  x, y  
1
2     y  1   xy
2
2


y

 

 y    y   xy    x   x    
x
 1 

 
exp    
 
2
2 
 y  1   xy
 


 



・・・ 3)
 1  x   2 
1
x

 exp    
 
2   y
 2   x  
fx y  y x 
1
2     y  1   xy
4)式は平均値が  y   xy 
2
2


y

 

 y    y   xy    x   x    
x
 1 

 
exp    
 
2 
 y  1   xy2
 


 




・・・ 4)
y
2
  x   x  、標準偏差が  y  1   xy の正規分布になっており、Y
x
軸に平行に切り取った分布は正規分布となることを示しています。また、重みなしの直線回帰式
を算出する仮定と同じになります。逆に言えば、重みなしの直線回帰は確率変数 X , Y を共に正規
分布と仮定していることになります。
x  5,10,15 における Y の条件付確率密度は図-4 となります。
0.06
x  10
x5
0.04
x  15
0.02
0
0
20
40
60
80
図- 4 条件付確率密度関数( x  5,10,15  x  10,  x  2.5,  y  40,  y  10 )
条件付確率密度関数(この場合は正規分布)が既知であるため、5%値は正規分布のクォンタイ
ルタイル関数を使って算出でき、 x  5,10,15 について算出すると以下のようになります。
4-5
P%値の算出

y

x
yp  x0  p  qnorm p   y  xy 
yp ( 5  0.05)  14.253
2
  x0   x   y  1  xy 

yp ( 15  0.05)  42.253
yp ( 20  0.05)  56.253
区分を行わない場合(周辺確率密度関数)の 5%値は y p  23.551 でしたが、この値と等しくな
る x を求めると x  8.321 となります。このため、 x  8.321 より小さい区分とした場合には y の
5%値が下がり、逆に x  8.321 より大きい区分とすると y の 5%値は上がることになります。
x0  0  20
60
5%値
40
20
0
0
5
10
15
20
x
図- 5 y の 5%値( y p )
1.2.2 非正規分布の場合
確率変数 X , Y が非正規分布であっても、何らか方法で正規分布扱いができれば 3)式に準じて
同時確率密度関数が定義できそうです。
このために等価正規分布パラメータという概念を導入します。等価正規分布パラメータとは非
正規分布確率変数 X , Y の任意の値において、確率と確率密度が等しい正規分布のパラメータのこ
とを言います。
(理論的には Rosenblatt 変換)
例えば、確率変数 X の x における正規分布のパラメータを  zx ,  zx とすると z x 
x   zx
は標準
 zx
正規分布となりますから 5)、6)式を満たすパラメータを見出すことができるということです。
 x   zx
  zx
確率が等しい: FX  x    

    zx 

4-6
・・・ 5)
P%値の算出
 x   zx 
    zx 
  zx 
確率密度が等しい: f X  x    
ここに
・・・ 6)
Fx  x  , f x ( x) :累積確率分布関数、確率密度関数

 ,    :標準正規分布の累積確率分布関数、確率密度関数
6)式、7)式を解いて  zx ,  zx は 8)式となります。
 zx  x   zx  
1
F  x 
x
,  zx 
  1  Fx  x  
fx  x
・・・ 7)
すなわち、非正規分布の同時確率密度関数は 3)式における  x ,  x ,  y ,  y を  zx ,  zx ,  zy ,  zy(等
価正規分布パラメータ)に置き換えることで定義できます。しかし、相関係数(  xy )と等価正
規分布空間における相関係数(  zxy )とは同じ値にはなりませんので、  zxy を  xy から算出する
必要があります。
相関係数(  xy )は平均値  x ,  y のまわりの結合二次積率(共分散 Cov  X , Y  )を標準偏差  x ,  y
で除したものとして 8)式で定義されます。
(  x ,  y ,  x ,  y は等価正規分布パラメータではありま
せん。
)
 xy 
ここに
   x      y     f  x, y,   dxdy
x
y
xy
zxy
 x  y
・・・ 8)
f xy  x, y,  zxy  :同時確率密度関数
8)式での定義域は仮定する確率分布形より異なりますので、標準正規化空間( Z 空間)で書
き換えると 9)式となります。これを解いて換算相関係数  zxy を算出することになりますが、非
線形の方程式を解くことになります。
4-7
P%値の算出
 FX 1   z x    x
 xy    

x
  
  FY

 
 
 
ここに
Fx
1
  z   
y
y
y

  f ZXY  zx , z y ,  zxy  dzx dz y ・・・ 9)


  , Fy 1   :確率変数 X , Y のクォンタイル関数
f zxy ( z x , z y ,  zxy ) 
zx 
1
1
2    1   zxy
2

1
2
2
 exp  
 zx  2   zxy  zx  z y  z y
2
 2  (1   zxy )




y   zy
x   zx
, zy 
、  zxy :換算相関係数
 zx
 zy
 zx ,  zx ,  zy ,  zy :等価正規分布パラメータ
以上のことから、非正規分布の同時確率密度関数は 10)式となります。
f xy  x, y  
1
2     zy  1   zxy
2
2


 zy

 

  x   zx    
 y    zy   zxy 
 zx
 1 

 
exp    
 
2
2 


1


 
zy
zxy


 




・・・ 10)
 1  x   2 
1
zx

 exp    
 
2

2     zy

zx

 
ただし、  zx ,  zx ,  zy ,  zy (等価正規分布パラメータ)、  zxy :換算相関係数


同様に X  x での Y の条件付確率密度関数( f x y y x )は 11)式となります。
fx y  y x 
1
2     zy  1   zxy
2
2


 zy

 

  x   zx    
 y    zy   zxy 
 zx
 1 

   ・・・ 11)
exp    
 
2
2 
 zy  1   zxy
 


 



すなわち、平均値が 0   zy   zxy 
 zy
2
  x   zx  、標準偏差が  0   zy  1   zxy の正規分布
 zx
になっていることが分かります。
4-8
P%値の算出
このため、 X  x での Y の 5%値( y p )は、クォンタイル関数( qnorm  p, 0 ,  0  )から求めら
れるように感じますが、 0 ,  0 が y の関数ですので、12)式を満たす y p を求める収束計算が必要
となります。( pnorm 
 :正規分布の確率分布関数)
pnorm ( y p , 0 ,  0 )  p
1.2.3
・・・ 12)
算出例
X :平均値  x  100 、変動係数 cv x  0.1 、 Y :平均値  y  35 、変動係数 cv y  0.2 、相関
係数  xy  0.7 の X の 25%値、50%値、75%値に対する Y の 5%値算出例を示します。
① X =正規分布、 Y =正規分布
パラメータ
 x  100
cv x  0.1
 x   x  cv x
 x  10
 y  35
cv y  0.2
 y   y  cv y
y  7
xy  0.7
相関係数
周辺密度関数(marginal density function)
f x ( x)  dnorm x   x   x
0.04
fx( x) 0.02
0
60
80
100
120
x
4-9
140
P%値の算出
Y(正規分布)
Y周辺密度関数(marginal density function)
f y ( y)  dnorm  y   y   y
Y周辺密度関数のp%値
ypm ( p)  qnorm  p   y   y
Y条件付確率密度関数(conditional density function)

y

x

y

x
f yxc  y  x0   dnorm y   y  xy 
2
  x0   x   y  1  xy 

Y条件付確率密度関数のp%値
ypc  x0  p  qnorm p   y  xy 
2
  x0   x   y  1  xy 

ypm ( 0.05)  23.486
Y周辺密度関数の5%値
Y条件付確率密度関数の5%値
x25  93.255
ypc  x25  0.05  23.472
x50  100
ypc  x50  0.05  26.777
x75  106.745
ypc  x75  0.05  30.082
確率密度
0.08
fy( y)
0.06
fyxc y  x25
fyxc y  x50
fyxc y  x75
0.04
0.02
0
10
20
30
40
y
4-10
50
60
P%値の算出
② X =正規分布、 Y =2P ワイブル分布
X(正規分布)
パラメータ
 x  100
 x  10
周辺(marginal)
f x ( x)  dnorm x   x   x
確率密度関数
x   x  3   x   x  3   x
0.04
fx( x) 0.02
0
60
80
100
120
140
x
確率分布関数
Fx ( x)  pnorm x   x   x
クォンタイル関数
qFx  px 
px  pmin if px  0
px  pmax if px  1
atai  qnorm px   x   x
atai
x25  qFx ( 0.25 )
x25  93.255
x50  qFx ( 0.5 )
x50  100
x75  qFx ( 0.75 )
x75  106.745
等価正規変換
 zx ( x) 
  q Fx ( x)  
f x ( x)
 zx ( x)  x   zx ( x)  q F x ( x) 
4-11
P%値の算出
Y(2Pワイブル)
パラメータ
 y  35
 y  35
y  7
y  7
Yの2Pワイブル分布パラメータ算出
mcal      
CV 


m1



m  root  CV 



 

m2
m1
  

m 
 m 
 
m1

 m 
2



 m



m1
 

 m 
 
 
m
 y  mcal   y   y 1
 y  37.801
my  mcal   y   y 2
my  5.792
周辺(marginal)
確率密度関数
my
 y my
my
y 

 
f y ( y)  
  y  exp    

 y
  y 
確率分布関数
 y my
 
F y ( y)  1  exp 
 y  
   
クォンタイル関数
qF y  py 
py  pmin if py  0
py  pmax if py  1
1
atai   ln  1  py 
my
y
atai
等価正規変換
 zy ( y) 
  q F y ( y)  
f y ( y)
 zy ( y)  y   zy ( y) q F y ( y) 
4-12
P%値の算出
Y周辺密度関数のp%値
Y周辺密度関数の5%値
ypm ( p)  qFy ( p)
ypm ( 0.05)  22.635
Y条件付確率密度関数(conditional density function)

f yxc  y  x0  zxy  dnorm y   zy ( y)  zxy 

 zy ( y)
 zx  x0 
2
  x0   zx  x0    zy ( y)  1  zxy 

Y条件付確率密度関数のp%値
ypccal  xyp  zxy  p 

y

x
yp  qnorm p   y  zxy 
2
  xyp   x   y  1  zxy 

atai  root  p  f yxc  yp  xyp  zxy  yp
atai
換算相関係数の算出
関数定義
x、y、z
x、z yの定義
x  zx  qFx    zx 
zx ( x)  q F x ( x) 
y  zy  qFy    zy 
zy ( y)  q Fy ( y) 
z空間同時確率密度関数
f z  zx  zy  zxy 
  zx2  2 zxy  zx  zy  zy2  


 exp  
2



2
2  1  zxy
2   1  zxy
 

1
a

a  10
XY空間相関係数定義

xycal  zxy  







a
a a
 x  zx   x   y  zy   y 

 
  f z  zx  zy  zxy d zx d zy
x
y



XY空間同時確率密度関数
f xy  x  y  zxy  f z  zx ( x)  zy ( y)  zxy 
4-13
f x ( x)  f y ( y)
  zx ( x)     zy ( y) 
P%値の算出
算出
精度
初期値
TOL  10
 10
zxy  xy
zxy  0.7
zxy  root  xy  xycal  zxy  zxy
zxy  0.70204
確認
xycal  zxy  0.7
xy  xycal  zxy  0
Y条件付確率密度関数(conditional density function)

f yxc  y  x0  zxy  dnorm y   zy ( y)  zxy 

 zy ( y)
 zx  x0 
2
  x0   zx  x0    zy ( y)  1  zxy 

Y条件付確率密度関数のp%値
ypccal  xyp  zxy  p 

y

x
yp  qnorm p   y  zxy 
2
  xyp   x   y  1  zxy 

atai  root  p  f yxc  yp  xyp  zxy  yp
atai
Y条件付確率密度関数の5%値
ypccal  x25  zxy  0.05  27.501
x25  93.255
ypccal  x50  zxy  0.05  30.929
x50  100
ypccal  x75  zxy  0.05  34.123
x75  106.745
確率密度
0.1
fy( y)


0.05
fyxc y  x50   zxy
fyxc y  x75   zxy
fyxc y  x25   zxy
0
10
20
30
40
y
4-14
50
60
P%値の算出
③ X =2P ワイブル分布、 Y =2P ワイブル分布
X(2Pワイブル分布 )
パラメータ
 x  100
 x  10
Xの2Pワイブル分布パラメータ算出
 x  mcal   x   x 1
 x  104.323
mx  mcal   x   x 2
mx  12.093
周辺(marginal)
mx
 x mx
mx
x 

 
f x ( x)  
  x exp     

 x
  x 
確率密度関数
x   x  3   x   x  3   x
0.06
0.04
fx( x)
0.02
0
60
80
100
120
140
x
確率分布関数
 x mx
 
Fx ( x)  1  exp 
 x  
   
クォンタイル関数
qFx  px 
px  pmin if px  0
px  pmax if px  1
1
atai   ln  1  px 
atai
x25  qFx ( 0.25 )
x25  94.11
x50  qFx ( 0.5 )
x50  101.209
x75  qFx ( 0.75 )
x75  107.179
4-15
mx
 x
P%値の算出
等価正規変換
 zx ( x) 
  q Fx ( x)  
 zx ( x)  x   zx ( x)  q F x ( x) 
f x ( x)
Y(2Pワイブル)
パラメータ
 y  35
y  7
Yの2Pワイブル分布パラメータ算出
 y  mcal   y   y 1
 y  37.801
my  mcal   y   y 2
my  5.792
周辺(marginal)
確率密度関数
my
 y my
my
y 

 
f y ( y)  
  y exp    

 y
  y 
確率分布関数
 y my
 
Fy ( y)  1  exp 
 y  
   
クォンタイル関数
qFy  py 
py  pmin if py  0
py  pmax if py  1
1
atai   ln  1  py 
my
 y
atai
等価正規変換
 zy ( y) 
  q F y ( y)  
f y ( y)
Y周辺密度関数のp%値
 zy ( y)  y   zy ( y)  q Fy ( y) 
Y周辺密度関数の5%値
ypm ( p)  qFy ( p)
ypm ( 0.05)  22.635
Y条件付確率密度関数(conditional density function)

f yxc  y  x0  zxy  dnorm y   zy ( y)  zxy 

 zy ( y)
 zx  x0 
4-16
2
  x0   zx  x0    zy ( y)  1  zxy 

P%値の算出
Y条件付確率密度関数のp%値
ypccal  xyp  zxy  p 

y

x
yp  qnorm p   y  zxy 
2
  xyp   x   y  1  zxy 

atai  root  p  f yxc  yp  xyp  zxy   yp 
atai
換算相関係数の算出
算出
精度
初期値
TOL  10
 10
zxy  xy
zxy  0.7
zxy  root  xy  xycal  zxy  zxy
zxy  0.70147
確認
xycal  zxy  0.699999999999315
xy  xycal  zxy   6.846  10
 13
Y条件付確率密度関数の5%値
ypccal  x25  zxy  0.05  27.506
x25  94.11
ypccal  x50  zxy  0.05  30.93
x50  101.209
ypccal  x75  zxy  0.05  34.121
x75  107.179
確率密度
0.1
fy( y)


0.05
fyxc y  x50   zxy
fyxc y  x75   zxy
fyxc y  x25   zxy
0
10
20
30
40
y
4-17
50
60
P%値の算出
X  Y の組み合わせとして、④正規分布-対数正規分布、⑤対数正規分布-対数正規分布、⑥
対数正規分布-2Pワイブル分布を付け加えて、算出結果を表-1、図に示します。
①正規分布-正規分布の場合が最も低い値となります。当然ながら Y の分布形の違いが Y の
5%値に影響し、2Pワイブル分布>対数正規分布>正規分布の順になっています。なお、換算相
関係数の差は少数点以下 3 桁目が異なるだけの結果となりました。
表- 2 5%値の算出結果
項目
X
Y
相関係数
X
Y
相関係数
X
Y
相関係数
X
Y
相関係数
X
Y
相関係数
X
Y
相関係数
36
X
分布形
正規分布
正規分布
0.7000
正規分布
2Pワイブル分布
0.7020
2Pワイブル分布
2Pワイブル分布
0.7015
正規分布
対数正規分布
0.7069
対数正規分布
対数正規分布
0.7038
対数正規分布
2Pワイブル分布
0.7068
34
%
25%
50%
75%
25%
50%
75%
25%
50%
75%
25%
50%
75%
25%
50%
75%
25%
50%
75%
34
34
34
33
31
32
Y
5%値
23.47
26.78
30.08
27.50
30.93
34.12
27.51
30.93
34.12
26.23
29.19
32.52
26.23
29.18
32.50
27.46
30.92
34.14
%値
93.26
100.00
106.75
93.26
100.00
106.75
94.11
101.21
107.18
93.26
100.00
106.75
93.03
99.50
106.43
93.03
99.50
106.43
33
31
31
30
5%値
30
28
27
28
29
29
26
26
28
27
26
24
23
X25%
X50%
X75%
22
20
正規-正規
正規-2P
2P-2P
正規-対数
対数-対数
正規:正規分布、 2P:2Pワイブル分布、対数:対数正規分布
図- 6 5%値の算出結果
4-18
対数-2P
P%値の算出
2.パラメータが未知の場合(標本扱い)
2.1
正規分布
標本平均値(  es 
n
1
2
   xi   x  )が得られてい
n  1 i 1
1 n
  xi es )、標本不偏標準偏差(  es 
n i 1
るものとすれば、u p を標準正規分布の p % 点として、変量 Tes  es  u p   es は確率変数となりま
す。
例えば、平均値   100 、標準偏差   20 とする母集団から大きさ n1  50 の乱数を発生させ、
es 、  es から、変量 Tes  es  u p   es (5%値: u p  1.644854 )を計算します。
そして、これを n  1000 回繰り返して真の 5%値(=67.103)より大きい個数( U n )と小さい個
数( Ln )を計算してみます。
( n  U n  Ln )
2000
1500
Frequency
2500
3000
3500
Histogram of tl
0
500
1000
> #5%値の実験(正規分布)
> n<-1000#繰り返し回数
> n1<-50#乱数発生回数
> μ<-100#平均値(母集団)
> σ<-20#標準偏差(母集団)
> Ln<-0
> Un<-0
> for (i in 1:n){
+ x<-rnorm(n1,μ,σ)#乱数発生
+ tl[i]<-mean(x)+qnorm(0.05,0,1)*sd(x)#5%値算出
+ if (tl[i]<qnorm(0.05,μ,σ)){Ln<-Ln+1}
+ if (tl[i]>qnorm(0.05,μ,σ)){Un<-Un+1}
+}
> c(n,Ln,Un,Ln+Un)
[1] 1000 463 537 1000
>hist(tl)
40
50
60
70
80
90
tl
変量 Tes  es  u p   es はヒストグラムから分かるように何らかの分布に従い、真の 5%値より
小さくなる個数は 463、大きくなる個数は 537 となることが分かります。
4-19
P%値の算出
発生回数を 100、150、200 回とした場合について表-4 に示します。いずれの結果も標本から求
めた 5%値は真の 5%値より大きい・小さい確率が 50%程度となることが分かります。
表- 3 5%値算出の実験結果(繰り返し数 1000 回)
発生回数
真の 5%値の対して
小さくなる個数
大きいなる個数
50
463
537
100
516
484
150
503
497
200
477
523
強度の 5%値を算出する際に、真の p % 値より変量 Ta   a  u p   a が小さくなる確率(  % )
を設定し算出する場合があります。
Pr 
 を確率を意味するものとすれば 13)式を満たす k p を使って、14)式から信頼水準が明
確な TL p が計算できることになります。
Pr  es  k p   es    u p     
・・・ 13)
ここに 、  :母集団(真)の平均、  :母集団(真)の標準偏差
n
1 n
1
2
 es :標本平均、  es :標本不偏標準偏差、 es    xi ,  es 
   xi  es 
n i 1
n  1 i 1
TL p  es  k p   es
・・・ 14)
TL p を正確に言うと、真の p % 値より下回る水準を信頼として、下側信頼水準  % の p % 値と
呼ぶことになります。逆の言い方をして、上側不信頼水準 1    % と呼んでも良いかも知れませ
ん。
この概念は図-7 となります。
4-20
P%値の算出
K・σ a
μ a -K・σ a
Up・σ
N(μ、σ)
1-α
μ a -K・σ a
図- 7
μ
Low Tolerance Limits with One-side confidence of Normal Distribution
k p 値の算出は式 13)式を変形して、15)式となることを利用します。
     es  k p   es  

  p
Pr  


 


 Pr    ( es  k p   es )  u p     Pr    u p    es  k p   es 
 n   es    /   n  u p

 Pr  es    U p    k p   es   Pr 
 n  kes 
 es / 


15)式における
n  ( es   ) /   n  u p
 es / 
・・・ 15)
は、自由度  n  1 、非心度λ= n  u p の非心 t 分
布に従いますので、個数 n と下側信頼水準  % 、 p % 値を与え、式 16)となるように、収束計算
をして k p 値を算出します。
Pr t  ,    n  k p   
ここに
 k p 
Pr t  ,   
・・・ 16)
n
t  ,   :非心 t 分布、 Pr t  ,    :非心 t 分布の確率積分値(=確率分布関数)
“R”には非心 t 分布の確率分布関数(pt(t 値、自由度、非心度))がありますので、16)式か
ら収束計算することができますが、非心 t 分布の確率分布関数がない場合には、自由度νが奇数の
4-21
P%値の算出
ときは A)式から、自由度νが偶数のときには B)式から求めることができます。
自由度νが奇数:
( 1) / 2
1 exp{ 2 B(1  x 2 ) / 2}
Pr [t ( ,  )]   ( B )  
dx  2   M 2i 1
 0
1  x2
i 1
A
A)
自由度νが偶数:
Pr [t ( ,  )]   ( )  2 
(  2) / 2

i 0
B)
M 2i
M i に関しては
i  0  M 0  A B   ( B )   ( A B )
A


i  1  M 1  B  AM 0 
  ( ) 
2


B
i  2  M 2    AM 1  M 0 
2
j 1
i jMj 
 B  a j  AM j 1  M j  2  ( j  3)
j
1
a2  1, a j 
( j  3, 4,・・・・  2)
( j  2)  a j 1
ここに

 :標準正規分布の確率密度関数
A
 :標準正規分布の確率分布関数
t

,B 
  t2

b  b2  a  c
t の初期値: t0 
a
ここで A 

t'

t ' の初期値は t ' 
B
2
1 
u
1


a  1    P , b   1 
 4  2 
 4

2
2
,c    up


であり、
  t '2
1
b  b 2  ac 


a
2
1  U
1


a  1    P , b   1 
 4  2 
 4
“R”で k p を算出する関数の一例は下記の通りです。
#k値算出
4-22

2
2
,c    up

P%値の算出
kcalc<-function(n,p,α){#k 値の算出関数
if (p<=0.5){p<-1-p}
v<-(n-1)#自由度
up<-qnorm(p,0,1)#標準正規分布のp%点
λ<-up*n^0.5#非心度
a0<-(1-1/4/v)^2-up/2/v#初期値
b0<-λ*(1-1/4/v)#初期値
c0<-λ^2-up^2#初期値
t<-(b0+(b0^2-a0*c0)^0.5)/a0
f<-function(t){pt(t,v,λ)-α}#非心t分布
t<-uniroot(f,c(0.1*t,2*t))$root#収束
c("n"=n,"k"=round(t/n^0.5,4))
}
この関数を使って p  0.05,   0.75 として n  50,100,150,200 について K 値を算出すると以
下のようになります。
> kcalc(50,0.05,0.75)
n
k
50.0000 1.8109
> kcalc(100,0.05,0.75)
n
k
100.0000 1.7576
> kcalc(150,0.05,0.75)
n
k
150.0000 1.7354
> kcalc(200,0.05,0.75)
n
k
200.0000 1.7225
この K 値を使って、上記と同様なシミュレーションを行うと下記のようになります。
> #5%値の実験(その 2)
> test2<-function(n,n1,μ,σ,p,α){
+ kcalc<-function(n,p,α){#k 値の算出関数
+ if (p<=0.5){p<-1-p}
+ v<-(n-1)#自由度
+ up<-qnorm(p,0,1)#標準正規分布のp%点
+ λ<-up*n^0.5#非心度
+ a0<-(1-1/4/v)^2-up/2/v#初期値
+ b0<-λ*(1-1/4/v)#初期値
+ c0<-λ^2-up^2#初期値
+ t<-(b0+(b0^2-a0*c0)^0.5)/a0
+ f<-function(t){pt(t,v,λ)-α}#非心t分布
+ t<-uniroot(f,c(0.1*t,2*t))$root#収束
+ atai<-round(t/n^0.5,4)
+ return(atai)
+}
+ K<-kcalc(n1,p,α)
+ Ln<-0
+ Un<-0
+ for (i in 1:n){
+ x<-rnorm(n1,μ,σ)#乱数発生
+ tl[i]<-mean(x)-K*sd(x)#5%値算出
+ if (tl[i]<qnorm(p,μ,σ)){Ln<-Ln+1}
+ if (tl[i]>qnorm(p,μ,σ)){Un<-Un+1}
+}
+ c(n,Ln,Un,Ln+Un)
+}
4-23
P%値の算出
> test2(1000,50,100,200,0.05,0.75)
[1] 1000 737 263 1000
> test2(1000,100,100,200,0.05,0.75)
[1] 1000 747 253 1000
> test2(1000,150,100,200,0.05,0.75)
[1] 1000 758 242 1000
> test2(1000,200,100,200,0.05,0.75)
[1] 1000 743 257 1000
真の 5%値を下回る個数が 750 前後になり下側信頼水準 75%に近いことが分かると思います。
表- 4 K 値を用いた 5%値算出実験結果(繰り返し数 1000 回)
真の 5%値の対して
発生回数
2.2
小さくなる個数
K値
50
737
1.8109
100
747
1.7576
150
758
1.7354
200
743
1.7225
非正規分布
2.2.1
対数正規分布
対数正規分布とはデータの対数値が正規分布に従うことですので、17)式で計算できることに
なります。
TL p  Exp(es  k p   es )
ここに
・・・ 17)
es , es :対数正規分布の平均値・標準偏差の推定値
なお、等価正規分布パラメータを使って 18)式としても表現できます。
TL p   es  k p    es
ここに
  es 
  1  p 
f log  x p 
x p  Flog
f log 
1
・・・ 18)
 es  x p    es   1  p 
 p, es , es 
 :対数正規分布の確率密度関数
4-24
P%値の算出
1
Flog

2.2.2
 :対数正規分布のクォンタイル関数
ワイブル分布
パラメータ  200, m  12 の 2P ワイブル母集団から大きさ n1  50,100,150,200 個の乱数を
発生させ、最尤法を用いてパラメータ  es , mes を推定し、そのパラメータから 5%値を計算します。
そして、これを n  1000 回繰り返して真の 5%値(= 156.148)より大きい個数( U n )と小さい個
数( Ln )を計算してみます。
( n  U n  Ln )
> #5%値の実験(その 3)
> test3<-function(n,n1,η,m,p,α){
+ Ln<-0
+ Un<-0
+ tl<-0
+ for (i in 1:n){
+ x<-rweibull(n1,m,η)#乱数発生
+ #2P ワイブル分布のパラメータ推定
+ LL2p<-function(para){#対数尤度関数の定義(2P ワイブル、完全)
+ atai<-sum(log(dweibull(x,para[1],para[2],log=FALSE)))
+ return(atai)
+}
+ fm<-function(mes){#m 関数定義
+ s1<-gamma(1+1/mes)
+ s2<-gamma(1+2/mes)
+ atai<-((n1-1)/n1)^0.5*sd(x)/mean(x)-(s2-s1^2)^0.5/s1
+ return(atai)
+}
+ mes0<-uniroot(fm,c(m/2,m*2))$root#m 初期値
+ ηes0<-mean(x)/gamma(1+1/mes0)#η初期値
+ para<-c(mes0,ηes0)#パラメータ初期値
+ para2p<-optim(para, LL2p, control=list(fnscale=-1))$par
+ ηes<-para2p[2]
+ mes<-para2p[1]
+ tl[i]<-qweibull(p,mes,ηes)#5%値算出
+ if (tl[i]<qweibull(p,m,η)){Ln<-Ln+1}
+ if (tl[i]>qweibull(p,m,η)){Un<-Un+1}
+}
+ c(n,Ln,Un,Ln+Un)
+}
> test3(1000,50,200,12,0.05,0.75)
[1] 1000 452 548 1000
> test3(1000,100,200,12,0.05,0.75)
[1] 1000 473 527 1000
> test3(1000,150,200,12,0.05,0.75)
[1] 1000 465 535 1000
> test3(1000,200,200,12,0.05,0.75)
[1] 1000 466 534 1000
結果を表-5 に示しますが、標本から求めた 5%値は真の 5%値より大きい・小さい確率がほぼ
50%となることが分かります。
4-25
P%値の算出
表- 5 2P ワイブルの 5%値算出実験結果(繰り返し数 1000 回)
発生回数
真の 5%値の対して
小さくなる個数
大きいなる個数
50
452
548
100
473
527
150
465
535
200
466
534
正規分布と同様に、何らかの下側信頼水準  % を設定手法について考えてみます。
ワイブル分布の p % 値を x p とすると x p における等価正規分布パラメータを使って x p は 19)式
で表現されます。
x p   m  u p    m
・・・ 19)
ここに、 u p :標準正規分布の p % 点
同様にして、標本データから求められたパラメータ( es , mes ,  es )からの推定 p % 値( x pes )
は 20)式で表現できることになります。
x pes   m es  u p    m es
ここに
・・・ 20)
 m es ,   m es : x pes における等価正規分布パラメータ
すなわち、下側信頼水準  % を設定すると正規分布と同様な 21)式を満たす k p が存在すること
になります。
Pr   m es  k p    m es   m  u p    m   
・・・ 21)
k p は正規分布の場合には非心 t 分布に従うことから算出できましたが、ワイブル分布の場合に
どのような分布に従うかは分っていません。
(筆者だけかも?)
4-26
P%値の算出
ここでは、ワイブル分布の下側信頼水準  %の p % 値を正規分布で求めた k p と等価正規パラ
メータを使って算出する 22)式について考えてみたいと思います。
TL p   m es  k p    m es
ここに
  m es 
  1  p 
f wei  x p 
・・・ 22)
1
 m es  x p    m es   1  p  、 x p   es  es   ln 1  p  mes
パラメータ  200, m  12 の 2P ワイブル母集団から大きさ n1  50,100,150,200 個の乱数を
発生させ、最尤法を用いてパラメータ  es , mes を推定し 22)式から 5%値を計算します。そして、
これを n  1000 回繰り返して真の 5%値(= 156.148)よりと小さい個数( Ln )を計算してみます。
> #5%値の実験(その 4)
> test4<-function(n,n1,η,m,p,K){
+ Ln<-0
+ Un<-0
+ tl<-0
+ for (i in 1:n){
+ x<-rweibull(n1,m,η)#乱数発生
+ #2P ワイブル分布のパラメータ推定
+ LL2p<-function(para){#対数尤度関数の定義(2P ワイブル、完全)
+ atai<-sum(log(dweibull(x,para[1],para[2],log=FALSE)))
+ return(atai)
+}
+ fm<-function(mes){#m 関数定義
+ s1<-gamma(1+1/mes)
+ s2<-gamma(1+2/mes)
+ atai<-((n1-1)/n1)^0.5*sd(x)/mean(x)-(s2-s1^2)^0.5/s1
+ return(atai)
+}
+ mes0<-uniroot(fm,c(m/2,m*2))$root#m 初期値
+ ηes0<-mean(x)/gamma(1+1/mes0)#η初期値
+ para<-c(mes0,ηes0)#パラメータ初期値
+ para2p<-optim(para, LL2p, control=list(fnscale=-1))$par
+ ηes<-para2p[2]
+ mes<-para2p[1]
+ xp<-qweibull(p,mes,ηes)#推定 5%値算出
+ σn<-dnorm(qnorm(pweibull(xp,mes,ηes),0,1),0,1)/dweibull(xp,mes,ηes)#等価正規分布パラメータσ
+ μn<-xp-σn*qnorm(pweibull(xp,mes,ηes),0,1)#等価正規パラメータμ
+ tl[i]<-μn-K*σn#5%値算出
+ if (tl[i]<qweibull(p,m,η)){Ln<-Ln+1}
+ if (tl[i]>qweibull(p,m,η)){Un<-Un+1}
+}
+ c(n,Ln,Un,Ln+Un)
+}
> test4(1000,50,200,12,0.05,1.8109)
[1] 1000 745 255 1000
> test4(1000,100,200,12,0.05,1.7576)
[1] 1000 768 232 1000
4-27
P%値の算出
> test4(1000,150,200,12,0.05,1.7354)
[1] 1000 758 242 1000
> test4(1000,200,200,12,0.05,1.7225)
[1] 1000 770 230 1000
計算結果を表-6 に示しますが、22)式から算出される 5%値は真の 5%値を下回る個数が 750
前後になり下側信頼水準 75%に近いことが分かると思います。
表- 6 K 値を用いたワイブル分布の 5%値算出実験結果(繰り返し数 1000 回)
発生回数
真の 5%値の対して
小さくなる個数
K値
50
745
1.8109
100
768
1.7576
150
758
1.7354
200
770
1.7225
3.計算例
データが得られた場合、①母集団パラメータを推定し、その後② TL 値を算出することになりま
す。
完全データ扱いのパラメータ算出し、 TL 値を算出する関数例を下記に示します。
#パラメータ及び TL 値の算出(完全データ扱い)
paraTLcalfull<-function(x,p,α){#最尤法によるパラメータ推定(完全データ扱い)
#x:データ
#p:p%
#α:下側信頼水準
n<-length(x)#データ大きさ
#k値算出
if (p<=0.5){p<-1-p}
v<-(n-1)#自由度
up<-qnorm(p,0,1)#標準正規分布のp%点
λ<-up*n^0.5#非心度
a0<-(1-1/4/v)^2-up/2/v#初期値
b0<-λ*(1-1/4/v)#初期値
c0<-λ^2-up^2#初期値
t<-(b0+(b0^2-a0*c0)^0.5)/a0
f<-function(t){pt(t,v,λ)-α}#非心t分布
t<-uniroot(f,c(0.1*t,2*t))$root#収束
K<-round(t/n^0.5,4)#K 値
#パラメータ算出
#正規分布
LL.norm<-function(para){#対数尤度関数(完全)
atai<-sum(dnorm(x,mean=para[1],sd=para[2],log=TRUE))
return(atai)
4-28
P%値の算出
}
μes<-mean(x)
σes<-((n-1)/n)^0.5*sd(x)
LLmax.norm<-LL.norm(c(μes,σes))#最大対数尤度
AIC.norm<-2*2-2*LLmax.norm
#対数正規分布
LL.lnorm<-function(para){#対数尤度関数(完全)
atai<-sum(dlnorm(x,meanlog=para[1],sdlog=para[2],log=TRUE))
return(atai)
}
lx<-log(x)#データ log 化
λes<-mean(lx)
ξes<-((n-1)/n)^0.5*sd(lx)
LLmax.lnorm<-LL.lnorm(c(λes,ξes))#最大対数尤度
AIC.lnorm<-2*2-2*LLmax.lnorm
#2P ワイブル分布
LL.weibull<-function(para){#対数尤度関数(完全)
atai<-sum(dweibull(x,para[1],para[2],log=TRUE))
return(atai)
}
fm<-function(mes){#fm 関数(2P ワイブル用)
s1<-gamma(1+1/mes)
s2<-gamma(1+2/mes)
atai<-((n-1)/n)^0.5*sd(x)/mean(x)-(s2-s1^2)^0.5/s1
return(atai)
}
mes0<-1
mes0<-uniroot(fm,c(1,15))$root#m 初期値
ηes0<-mean(x)/gamma(1+1/mes0)#η初期値
para<-c(mes0,ηes0)#パラメータ初期値
para<-optim(para, LL.weibull, method="SANN",control=list(fnscale=-1))$par#2P ワイブル分布のパラメー
タ推定"シミュレーテッドアニーリング法"
para<-optim(para, LL.weibull, method="BFGS",control=list(fnscale=-1))$par#2P ワイブル分布のパラメータ
推定"準ニュートン法"
mes<-para[1]
ηes<-para[2]
LLmax.weibull<-LL.weibull(para)#最大対数尤度
AIC.weibull<-2*2-2*LLmax.weibull
#最小 AIC
minAIC<-min(AIC.norm,AIC.lnorm,AIC.weibull)
if(minAIC==AIC.norm){fname<-"正規分布"}
if(minAIC==AIC.lnorm){fname<-"対数正規分布"}
if(minAIC==AIC.weibull){fname<-"2P ワイブル分布"}
#図化
hist(x,main="最尤法に よる推定(完全 データ扱い )¥n(正規:黒)(対数正 規:青)(ワイブル:赤) ",
freq=F,ylim=c(0,1.2*dnorm(μes,μes,σes)))
curve(dnorm(x,μes,σes),add=T,col="black",lwd=ifelse(minAIC==AIC.norm,2,1))
curve(dlnorm(x,λes,ξes),add=T,col="blue",lwd=ifelse(minAIC==AIC.lnorm,2,1))
curve(dweibull(x,mes,ηes),add=T,col="red",lwd=ifelse(minAIC==AIC.weibull,2,1))
#TL 値の算出
TLnorm<-μes-K*σes#正規分布 TL 値
TLlnorm<-exp(λes-K*ξes)#対数正規分布 TL 値
4-29
P%値の算出
#2p ワイブル
xp<-qweibull(p,mes,ηes)#推定 p%値算出
σn<-dnorm(qnorm(pweibull(xp,mes,ηes),0,1),0,1)/dweibull(xp,mes,ηes)#等価正規分布パラメータσn
μn<-xp-σn*qnorm(pweibull(xp,mes,ηes),0,1)#等価正規パラメータμn
TLweibull<-μn-K*σn#2P ワイブル TL 値
p0<-p
if (p>=0.5){p0<-1-p}
kekka<-c(
c("n"=n,"p"=p0,"α"=α,"K"=K),
c("μes"=μes,"σes"=σes,"AICnorm"=AIC.norm),
c("λes"=λes,"ξes"=ξes,"AIClnorm"=AIC.lnorm),
c("mes"=mes,"ηes"=ηes,"AICweibull"=AIC.weibull),
c("AIC 最小分布:"=fname),
c("TLnorm"=TLnorm,"TLlnorm"=TLlnorm,"TLweibull"=TLweibull)
)
return(kekka)
}
正規分布乱数(   100,   20 )を 1000 個発生させ、下側信頼水準   75% の 5%値の TL を
求めた例を下記に示します。
> x<-rnorm(1000,100,20)
> kekka<-paraTLcalfull(x,0.05,0.75)
> kekka
n
p
α
"1000"
"0.05"
"0.75"
K
μes
σes
"1.6784" "100.944079580483" "20.2931478713422"
AICnorm
λes
ξes
"8862.44363797644" "4.59292149201174" "0.213445695477769"
AIClnorm
mes
ηes
"8938.97438563091" "5.41592797533742" "109.17202743562"
AICweibull
AIC 最小分布:
TLnorm
"8895.33456294908"
"正規分布" "66.8840601932219"
TLlnorm
TLweibull
"69.0391846387337" "77.2049942552876"
0.010
0.000
Density
0.020
最尤法による推定(完全データ扱い)
(正規:黒)(対数正規:青)(ワイブル:赤)
50
100
x
4-30
150
Fly UP