...

統 計 的 推 測 理 論 の 現 状

by user

on
Category: Documents
51

views

Report

Comments

Transcript

統 計 的 推 測 理 論 の 現 状
日本統計学会誌
第22巻 ,第 3号
257頁 ∼312頁
(増 刊号),1993年
統 計 的 推 測 理 論 の 現 状
│1達 也 *,江 口 真 透 **,竹 村 彰 通 ***,小 西 貞 則 ****
久保チ
Recent]Developments of the Theory of Statistical lnference
Tatsuya Kubokawa*Shinto Eguchi**Akiinichi Takemura***
and Sadanori Konishi****
This paper consists Of four independent surveys on various aspects of the theory of
statistical inference. The flrst chapter by T.Kubokawa surveys recent developments in
decision theoretic estimation theory focusing on shrinkage type estilnation procedures.
Thё secOnd chapter by S.Eguchi treats statistical asymptotic theory frorn differential
geometrical viewpOint.
testing hypOtheses.
The third chapter by A. Takemura surveys various topics of
The flnal chapter by S. Konishi surveys recent developments in
Bootstrap methodo10gy.
統計的推測理論 は多方面 にわたって発展 して い るが,こ こで はこの発展 を,決 定論的観点か
らの推定論 ,微 分幾何的 アプ ロー チ による漸近理論 ,検 定論 ,ブ ー トス トラップ法っ の 4つ の
トピックにわ けそれぞれ の トピックに章 をあてて概 観 す る。全体 の内容 を調整 した後 ,第 1章
を久保川,第 2章 を江 口,第 3章 を竹 村 ,第 4章 を小西が それぞれ執筆 した。 トピックごとに
文献 もかな り明確 にわかれ るため,参 考文献 も各章 ごとに与 えてある.統 計的推測理論 の よ う
な大 きな分野 の発展 を概 観 す る際 には,そ の 中 で何 が重要 な発展 で あるかな どについてさまざ
まな観点 が あ りえる。 ここでの概観 も,そ れぞれの執筆者 の観点 にある程度引 き寄 せ た概観 と
なって い ることをお断 りしてお きた い.
1.統 計的推定理論の最近 の展開―縮小推定 を中心 に一
1。
1
は じ ど):こ
デー タか ら未知母数 についての推定・ 検定 を行 う,い わゆる統計的推測問題 において,推 測
方法 の良 さを危険関数で比較 しその性質 を論ず る学問を統計的決定理論 とい う.統 計的決定理
論 は Wald(1950)に 始 ま り, ミニ マ ックス性 や許容性 な どの基本的概念 の一般理論 が構築 され
1960年 代 にはほぼ完成 された.推 定理論 にお い ては,70年 代以降 は各論 に移 り,Stein identity
の導入 によって平均 ベ ク トル の同時推定 に関す る Stein問 題 の研究 が顕著な発展 を遂 げた。80
年代 には平均の Stein問 題 の拡張 と信頼領域 に関する議論や平均 が未知 の ときの分散 の 区間推
定 に関す る研究 が活発 に行われ,ま た Stein,Haffに よる Wishart identityの 導入 によって
共分散行 列 の推定問題 や行列平均の推定問題 についての研 究 が発展 して きた.そ して順序制約
,
論文受付 :1993年 1月 改訂受付 :1993年 2月 受理 :1993年 2月
ホ
東京大学 工 学部 ,〒 113東 京都文京 区本郷 7-3-1
・ *島 根大学 理 学部 ,〒 690島 根 県松江市西川津町 1060
***東 京大学
経済学部 ,〒 113東 京都文京区本郷 7-3-1
**Ⅲ *統
計数理研究 所 ,〒 106東 京都港 区南麻布 4-6-7
258
日本 統 計 学 会 誌
第 22巻 第 3号
(増 刊号)1993
で よ り複雑 な モ デ
下 で の母 数推定 ,変 量・ 混合線形 モ デ ルで の分散 成分 の推 定 な ど応 用上重 要
へ
が
ルで の推定 問題 とその理論 的解 明 に関 心 が 注 が れ て きた.こ う した応 用的現場 の関 心 の広
ます
が
ら今後
済学 ,医 学 ,工 学 等 の分野 か らの新 た な統計 的手 法 の 開発 要請 に応 えな
りは
,経
ます拡 大 し,そ の現場 に対 応 した推測 理論 の構 築 に 向 けて発 展 して い く と思 う.
本章では母数モデルの統計的推定理論のうち,平 均ベ ク トルの Stein問 題や分散,共 分散行列
の推定問題 など縮小推定 に関す る理論的展開 を中心 に報告する
興味ある母数 θはデータXに 基づいてその関数 δ(X)に よつて推定 されるわけであるが,そ
の推定量 を評価するために損失関数 ズ δ(X),θ )が とられる.δ (X)と θとのユークリッド距離
で定義 され る二 乗損失関数 が 用 い られ る こ とが 多 いが,Xの 密度関数 /(χ ,θ )に 対 して
.
log{/(′
Kullback‐ Leiblerの 距離 ∫
,δ )//(′ ,θ ))/(′ ,δ )冴
に基づいた損失関数が自然であり,エ
ン トロ ピー損失 と呼 ばれ る.推 定量 は危険関数 R(θ ,δ )=E[L(δ (X),θ )]に よつて評価 され る
*)=infδ Supθ R(θ
,δ )を み
この危険関数 に関 して最悪な場合 を最善 にす るもの,即 ち Sup沢 (θ ,δ
たす推定量 δ*を ミニマ ックス推定量 とい う.ミ ニマ ックス推定量 は,無 情報事前分布 に対 する
.
一般化 Bayes推 定量 に関係 してお り,Blythに よる Bayes推 定量 の極限 としての導出方法 と
Kudo,Kieferに よる変換群 に関 す る最良共変推定量 としての導出方法 が あ る.後 者 は共分散行
列 の ミニマ ックス推定 に関 して重要 で ある. ミニマ ックス推定量 は損失関数 の とり方 に強 く依
,
存 してお り,例 えば 2標 本 の共通平均 の推定問題 において は,損 失関数 の とり方 に応 じて第 1
ニ
標本 の標本平均,第 2標 本 の標本平均 ,全 標本平均 とい うように異 なった推定量 が ミ マ ック
スになって しまうことが起 こる (Zacks(1970),Kubokawa(1987)). ミニマ ックス推定 に関
す る最近 の興味深 い結果 は,正 規分布 の平均 が閉区間 に入 ってい る とい う制約条件 の下 で は平
均 の ミニ マ ックス推定量 は標本平均 で はな く,区 間 の両端 に 0.5の 確率 をもつ事前分布 に対す
る Bayes推 定量 で ある とい う事実 で,Casella‐ Strawderman(1981)に よって示 された
*を
ミニ マ ックス性 と並んで重要な概念 に許容性 が ある.あ る推定量 δが δ 改良す る とは,任
*)が
成 り立 ち,あ る 命 で真 に不等号 が成 立す る ことをいい
意 の θに対 して R(θ ,δ )≦ R(θ ,δ
.
,
このよ うな δが存在 しない ときに,δ
*は 許容的 であるとい う.推 定量 の許容性 の条件 は Stein,
Brown,Zidek等 によって与 えられ,Blythや
Hodges‐
Lehmannな どの証明方法 が ある
(Leh‐
mann(1983),Berger(1985)).ミ ニマ ックス推定 量な どの通常 の推定量 の多 くは一般化 Bayes
ー
推定量 になってお り,そ れ らの許容性 を示す には注意深 い議論 が必要 で あ る.例 えば タ 次元正
規分布 の平均ベ ク トル の推定 にお い て は,平 均 二乗誤差 に関 して通 常 の推定 量 が 少=1,2の と
き許容的 で あるに もかかわ らず 夕≧3で は非許容的 となって しまう.こ れ は Stein現 象 と呼 ばれ
理論的解明がなされて きた (詳 し くは 1.3節 参照).こ れに関連 して許容性 が マル コフ連鎖 の再
帰性 に関係 してい る とい う興味深 い結果 が BrOwn(1971),Eaton(1992)等 によって得 られて
いる
以下 の節 で は縮小推定 を中心 に理論的展開 を概説 す るが,そ れ以外 の推定理論 の最近 の発展
に関 して ここで若干 ふれてお く.推 定理論 において骨格 をなす ものは最尤推定 で あ り,そ れ は
一致性 ,漸 近有効性 が保証 され る故 である (2章 参照).最 尤推定量 を明示的 に求 める ことが困
.
難 な場合 には尤度方程式 の数値的解法 が行 われ るが,モ デルが複雑 になれば尤度方程式 を立 て
る こと自体 が大変 になって くる.不 完全 デー タの解析や混合分布 か らのデー タの解析 にお いて
は EMア ルゴ リズム とい う簡便 な方法があ り,そ の収束性 や加速法な どが研究 されてい る (宮
川 (1987),Eguchi(1991)).ま た母数 の順序制約下 での最尤推定量 の導出 のための isotonic回
帰法 (Robertson et al.(1988))や prior feedback法 (Robert(1991))な ど計算機 の発達 に
ともなって導出方法 に も様 々な広 が りをみせている.そ の他 ほんの一部 の紹介 になって しまう
が,Nile問 題や変動係数一定 の問題 な ど変換群 に関 して不変 な構造 をもつ推定問題 につ いて は
259
統計的推測理論の現状
Kariya(1989)等 に よって,多 変量 階層 モ デ ル にお い て長 さ固定 の 区間推定 を構 成 す るための
二 段 階標 本抽 出法 に つい て は Hyakutake‐ Siotani(1987)等 に よって様 々 な研 究 が な され て き
た。
1。
2
分散 の 推定
通 常 の推定量 が 非許容 的 とな る代 表 的 な例 の一 つ に,未 知 の平均 を もった正規分 布 の分散 を
推定 す る問題 が あ る.こ れ は分散 の不偏推定 量 が標 本平均 に含 まれ る情報 を用 い て改 良 され る
とい う もので ,Stein(1964)に よって示 され た興 味深 い結 果 で あ る.そ の後 ,Brewster‐ Zidek
(1974)は Brown(1968)の 方法 に基 づ い て滑 らか な一 般 化 Bayes推 定量 を求 めたe Steinと
Brewster‐ Zidekの 二 つ の方法 は分散 の 区間推 定 や 指数 分 布 の尺 度母 数 の推 定 な どに適 用 され
Kubokawa(1991b)は 新 たな統 一 的方法 を提 案 し改 良す る推定量 の クラス を
構 成 した.本 節 で は,分 散 の推定 に関す る こ う した決定理論 的 な歴史 的展 開 を概 説 しよ う.こ
て きたが ,最 近
の分野 につい ての優 れ た総合報 告 が Maatta‐ Casella(199o)に よ り書 かれ て い るので参 照 され
た い.
1.2.l Stein法 と Brown‐ Brewster‐ Zidek法
れ る次 な るモ デ ル を扱 うeSを スカ ラー ,Xを
実験 計 画 や 線 形 回帰 モ デ ル な どの標 準 形 に現
,一 次元 ベ ク トル とし互 い に独立 に
21p)
sた 2∼ χ
λ
,x∼ ハЪ
(θ ,σ
(1.1)
はσ2で
なる分布に従うとする.興 味ある母数
,x,sの 関数 δ=δ (X,S)に よって推定するわ
けであるが,そ の推定量の良 さを評価するためにエン トロピー損失 IjO/σ 2)=yσ 2_1。 g(δ /σ 2)
-1を 採用 しそれに関する危険関数 R(σ 2,θ ,δ )=EL(δ /σ 2)]を 考える.こ の他 にも二乗損失
2_1)2ゃ
2+σ 2ぉ _2な
(δ /σ
対称な損失関数 δ
どが扱われる
/σ
.
σ2の 最 も自然 な推定量 は不偏推定量 れ=% lSで ある.こ れ はまた次の意味で最適 となって
い る.夕 ×夕直交行列 の全体 を 0(p)で 表 す とき,ア フ ィ ン変換群 S→ ε2s,x→ ぼ X+グ ,σ 2→
σ2σ 2,θ →ε
Лθtt σ,ε ∈R,α ∈Rp,「 ∈ 0(。 ,に 関 して σ2の 推定問題 を不変 にす るために,δ (σ 2s,
X+グ )=ε 2δ (s,x)な
る共変推定量 を考 える.こ の とき共変推定量 は δ(S,X)=α S,α >0,
と表 され,こ のクラスの中で危険関数 を最小 にするもの,即 ち最良共変推定量 (BEE)が 存在
し れ で与 えられる
6「
.
自然 な推定量 れ がχ に含 まれ る情報 を用 い て改良 され る とい う興 味深 い結果 を最初 に示 し
たの は Stein(1964)で ある.彼 はアフ ィ ン変換群 の部分群 で あ る尺度変換群 S→ ο2s,x→
2→ 2σ 2,θ →
2/sに
c_「x,σ
σ
Γθに関して共変な推定量のクラスδ=Sφ
ε
X‖
φ (7),7=‖
注目した
2た 2を
ここでSは 共変量,7は 最大不変量である.‖ X‖ 2た2は 未知の非心母数 ス=‖ θ‖
もった非心
カイニ乗分布 Z(ス )に 従うのでδ
φの中に最良な推定量は存在しないが,れ を改良するものを見
つけることは可能である
Steinは アの条件付き期待値 Eλ L(φ (7)Sた 2)│″ ]を 最小にする関数 φ
λ
(″)を 求め,φ λ
(7)
1,(1+7)/(%
r(7)=min{π
≦φλ
=o(7)=(1+″ )/(π +沙 )を みたす ことを示 した.従 って φ
r(″
+沙 )}と お くとφ
λ
(″)<φ
)≦ % 1な る不 等式 が 成 り立 ち,損 失 関数 の 凸性 か ら
lSた 2)│″
r(7)sル
2)17]≦
島[L(φ
Eλ [L(π
]と なり,推 定量
.
.
Sr=δ
2)/(%+夕
δ
r=min{れ ,(S十 ‖
X‖
φ
)}
は れ を改 良す る こ とがわか る.こ うした改良方法 を Stein法 と呼び,こ れによって得 られた打
ち切 り型推定量 を Stein型 と呼 ぶ こ とにす る.δ STは 仮説 ″ :θ =O vs.κ :θ ≠0に 関 して,″ が受
容 され るときには (S+‖ X‖ 2)/(%+夕 ),棄 却 され るときには れ をとる とい う予備検定推定量 に
260
日本 統 計 学 会 誌
第 22巻 第 3号
(増 刊号)1993
な って い る.ま た Bayesの 観 点 か らは経験 Bayes推 定量 として 自然 に導 かれ る (Kubokawa et
al.(1992b)).%が 小 さい とき れ の分散 が大 き くな る こ とか ら,δ STの 有効 性 は πが 小 ,夕 が
大 の ときに顕著 に現 れ る ことが わ か る.
れ を改 良す る もう一 つ の流 れ は Brown(1968)に 始 まる.彼 は定数 γ>0で 半直線 [0,∞ )を
三分割 し,条 件付期待値 Eλ L(α Sた 2)│″ <γ ]を 最小 にする定数 α=α λ
(γ )≦
(γ )を 求 め,α λ
1な
αλ
る不 等式 をみ たす こ とを示 した. ここで αO(″ )は
=0(γ )=α O(γ )<π
針
″如十
が
"2″
1静
ao(r): %+タ
レ ■1+が …ク
(1.2)
2″
で与 え られ る.こ の事 実 と損 失 関数 の凸性 か ら,7<γ の ときに は αO(γ )S,7≧ γの ときに は
π
lSを
とる推定量 が あ を改 良 す る こ とが わ か る.Brewster― Zidek(1974)は こ う した BrOwn
の アイ デア に基 づ い て半直線 [0,∞ )を 無 限 に細 か く分割 す る こ とを考 え,そ の極 限 として δ“
=Sα O(7)な る滑 らか な推定 量 を求 め,れ を改 良 す る と ともに一 般化 Bayes推 定量 にな って い
る こ とを示 した.こ の一 連 の 方法 を BBZ(Brown_Brewster‐ Zidek)法 と呼 び,こ の 方法 で得
られ た推 定量 を BBZ型 と呼 ぶ こ とにす る.Brewster― Zidekは δ“ が δφの クラスで許 容 的 で
あ る こ とを示 し,Proskin(1985)は 推定量 全体 にお け る許容性 を証 明 した.
GBに
よる改善度 はほんのわ ず か にす ぎな い こ とが 指摘 され て い るが ,夕 が
夕=1の ときに は δ
大 き くなれ ば意味 のあ る改善度 が 得 られ る。δSTが ス=0で 最大 の改善度 を与 え るの に対 して,
δ"は ス=0で は改 良 されてお らず λが 0か ら少 し離 れ た ところで 最 大 の改 良 を与 え る.こ の
こ とと δω の形 の複 雑 さ とを考 慮 す る と応 用 上 は意 味 の はっ き りした簡 便 な Stein型 推 定 量
δSrが 望 ま しい と思 われ る.
正 規 分布以外 に も,未 知 の位 置母 数 を もった指 数 分布 の 尺度母 数 の点推 定 につ い て は Stein
型 ,BBZ型 が それ ぞれ Arnold(1970),Brewster(197・ 4)に よ り導 かれ ,ま た一 様 分布 ,逆 ガ
ウス分布 に対 して も Stein型 推定量 が 得 られ て きた.最 後 に点推定 で の改 良方法 に は Stein法 ,
BBZ法 以外 に Strawderman(1974)に
よる方法 が あ る こ とを注意 してお きた い.
2.2 区間推 定 分散 の 区間推定 につ い て も点 推 定 の場 合 と対 応 す る結 果 が 導 か れ る.Tate‐
Klett(1959)は Sの み に基 づ い た [α S,み S]な る形 の信頼 区間 を考 えた.こ こで α,bは 信頼 係
1。
0<1-γ <1に 対 し P[α S<σ 2<bs]=1-γ をみ たす正 の定 数 で あ るが ,一 意 に決 め るの に最
適規準 を導入す る必要 が ある.一 つ は比 み
ル を最小 にする最小比 信頼 区間,も う一 つ は長 さ ら
一αを最小 にす る最短信頼 区間 で ある.そ の ときの α, みのみたすべ き等式 はそれぞれ
数
α
1-み 1=%log(bル
),α
1-み 1=(π
+2)log(bル )
で与 えられ る.最 小比信頼 区間 は最短不偏 区間 に もなってい る
最短信頼 区間 をXを 用 いて改良す る試 みは Cohen(1970)に 始 まる.彼 は区間 の長 さを変 え
.
ず,真 の母数 を覆 う確 率 CP(Coverage Probability)を 大 きくす る意味 で改良 された信頼 区間
を BrOwnの 方法 で求めた.す ると点推定 との類似性 か ら分割 を無限 に細 か くす ることが考 え
られ る.Shorrock(1990)は こうした BBZ型 信頼 区間 を求めその一般化 Bayes性 を示 した
さらに区間 の長 さを短か くし CPを 大 き くす る とい う両方の意味で改 良す る BBZ型 信頼 区間
.
の導出 とその一般化 Bayes性 が Goutis― Casella(1991)に よって示 された
一 方,分 散 の信頼 区間 について は最短規準 よ りも最小比規準の方が 自然 で ある ことが指摘 さ
.
れてい る.Nagata(1989)は 簡便で応用上有用な立場 か らStein型 信頼 区間
統計的推測 理論 の現状
*(″
ISr=[min{1,φ す
)}bS],
(7)}α S,min{1,φ
1-み 1)(1+7)/{(π
*(И
φ り=(α
+夕 )log(bル ))
を提案 し最小比信頼 区間 を改良す る ことを証明 した.ま た信頼性 などで重要な指数分布 の場合
につ いて も簡便 な Stein型 信頼 区間 を導出 した (永 田 (1991)).
1。 2.3
新 たな統 一的方法 い ままで別 々 に得 られて きた Stein型 及 び BBZ型 推定量 を統 一 的
に導 く新 たな方法 が Kubokawa(1991b),Takeuchi(1991)に よって提案 された.こ の基本
的 アイデアは,危 険関数 の差 を積分表現す る ことで あ り,IERD(Integral Expression of Risk
Difference)法 と呼 ぶ ことにす る
い ま lim″ →
∞φ(ω )=% 1と 仮定す る と 心 と δφとの危険関数 の差 は定積分 によって
.
2)]稚
2)]=E[[L(φ グ
E[L(れ た2)]_E[L(δ φ
1]
た
(邦 )Sた
― 財{Ц 次″)Sた 勢凋
′
=E晰 :L〈 バ
′
″
7)庵た
)Sた り
〈
φ
El∫
2冴
]
と表現 で き,変 数変換 を行 うと φ(ω )に ついて改良す るための次 なる条件 を導 くこ とがで きる
.
(a)φ (ω )は 単調増加 でlim″ =∞ φ(ω )=π
19
(b)
φ(ω )≧ αO(ω ).
但 しα。
(の は (1.2)で 与 えられてい る.こ うして れ を改 良す るクラスが得 られたわ けで,α 。
(ω ),
r(ω
φ )が (a),(b)の 条件 を満 たす ことか ら δ",δ STは この クラスに入 る ことがわか り,別 々
の方法 で導 かれて きた二種類 の推定量 が IERD法 によ り統 一 的 に得 られ る。
IERD法 はその簡便 さ故 ,正 規 ,対 数正規 ,指 数,Pareto分 布 な ど単調尤度比 をもった分布
族 と Bowl型 損失関数の場 合 へ の一般化 を可能 にす る.ま た区間推定 に対 して も適用可能 で
(a)φ (ω )が 単調増加 で lim″ →∞φ(ω )=1,
一
+"― み
+妨
学ο
学θ
場。
場。
(b)1″ Iα 一
ン ≧0
な る条件 をみ た す φ(ω )に 対 して,最 小比 信頼 区間 は ら =[α φ(7)S,bφ (7)S]に よって CPを
大 き くす る意 味 で 改良 され る.こ の クラ スの 中 に は Stein型 区間 ISrゃ
れ て い る (Kubokawa(1991b)).
1.2。
4
多次 元 母 数 の 推定 へ の 拡 張
BBZ型 区間 為0が 含 ま
多 次元母 数 の推定 へ の拡 張 として 多 変 量 回帰 モ デ ル の共
分散行 列及 び一 般化分散 の推定 が 取 り上 げ られ る.そ の標 準形 は互 い に独 立 な り次 正 方行 列 S
と 夕×γ行 夕」
Xを 用 い て
S∼ %(%,Σ ),X∼ 馬 ×
r(0,Σ Θみ)
(1.3)
と表 わ され る.こ こで Иら(π ,Σ )は Wishart分 布 ,Θ は Kronecker積 を表 わ して い る.
一 般 化分散 IΣ Iの 点推定 に つ い て は Shorrock‐ Zidek(1976)が Zonal多 項 式 を用 い て Stein
型推定量 を導 出 し,Zonal多 項 式 を用 い な い別証 明 が
Sinha(1976)に よ り与 え られ た.最 近
Sugiura‐ Konno(1988)は 危 険 関数 の級 数表現 を与 えて改善度 を数 値 的 に調 べ た.一 方 Stein型
信頼 区間 な どが Sarkar(1989)に よって求 め られ た.し か し γ≧2の 場 合 BBZ型 推定量 を求 め
る こ とは容 易 で はな く,こ れ は最大不変量 が一 次元 で表 わ せ な い こ とに起 因 して い る.Rukhin―
Sinha(1991)は 一 般化 分散 の通 常 の推定量 が Xを 使 わ な くて も 夕≧4な ら非許容 的 とな る とい
う興 味深 い事 実 を証 明 して い る.
共分散行列 Σ の推定 につ い て は,Sinha‐ Ghosh(1987)に よって Stein型 推定量 が 導 かれ た。
262
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
特 に γ=1の 場合 に Perron(1990)は 尺度共変推定 量のクラスにおいて Stein法 による特徴付
けを与 え,Kubokawa et al。 (1992a)は Sinha‐ Ghosh推 定量 を改良す る経験 Bayes推 定量 を
導出 し,Kubokawa et al.(1990)は Σ の推定構造 を明 らかにし改良す る一般化 Bayes推 定量
を求 めた.し か し Σ の場合 と同様 γ≧2の ときの BBZ型 推定量等明 らか にす べ き多 くの問題
が残 されて い る。Xを 使 わな くて もS自 身 で改良可能 な ことについて は 1.4節 で扱 う
.
1.3 平均 ベ ク トルの 同時推定
統計的決定理論 にお いて最 も興味深 くそして驚 くべ き結果 は,Stein(1956)に よって発見 さ
れた平均ベ ク トル の同時推定 に関す る非許容性 の事実 で あろう.こ れは三つ以上 の推定問題 を
一緒 にす ると個 々 には改良で きない ものが改良 されて しまうとい うもので,Stein現 象 と呼 ば
れ Brown,Berger,Efron,Morris等 によ り理論的研究や応用 へ の可能性等 が論 じられて きた
1970年 代 か ら今 日に至 るまで この分野 が爆発的 に発展 しつづ けて きた理 由 の一 つ には,Stein
.
(1973)に よって開発 された部分積分 のアプ ロー チにより技術的取扱 いが平易 になった点 が挙 げ
られ るだ ろう.こ の節 で は,Stein問 題 の今 日までの歩みを概説す る.な お竹 内 (1979),篠 崎
(1991),Brandwein‐ Strawderman(1990)に よ り優れ た総合報告 が 出 されてい るので参照 され
たい
1.3.l Stein現 象 ター次元確率 ベ ク トル X=(Xl,… ,る が正 規 分布 ル (θ ,Ip)に 従 う とき平
.
)′
均ベ ク トル θ=(a,… ,ら をXの 関数 δ(X)で 同時推定す る問題 を考 えよう.こ こで は推定量 の
2に
δ(X)一 θ‖
良 さを評価す るのに二乗損失関数 ‖
関 す る危険関数 が とられ る
θの 自然 な推定量 は明 らかにχ 自身 で あ り,最 小分散不偏 ,最 尤 そして ミニマ ックスで ある
)′
.
.
また直交行列 Γ,ベ ク トル グに対 して,Ⅸ 十グ,Лθ十グなる変換群 に関 して推定問題 が不変 に
なるためには,推 定量 は共変性 δ⊂X+α )=ハ (X)十 グをみたさなければならない。 この共変
推定量 は δ(χ )=X+グ の形 で表わ されるが,Xは このクラスの中で最良なものになっている
Stein(1956)は Xの 許容性 に注目し,ク =1,2の ときには許容的であるが,夕 ≧3に 対 しては
非許容的 となることを証明した.事 実彼 は上の変換群 の部分群 rx,Л θに関 して共変 な推定量
.
-2}xの にXを
x‖
中
改良す るものが存在す ることを示し,James‐ Stein
パ
(1961)は ,δ ={1-(ρ -2)/‖ X‖ 2}xと ぃぅ形の改良型推定量の一つを明示的に与えた.こ の
手{1-φ
δ
φ
(‖
X‖
2)‖
Stein現 象 を説明す る議論 には竹内 (1979),Stigler(1990),Brandwein‐ Strawderman(1990)
等 が ある
.
James‐ Stein推 定量 はその形 か ら何 か奇異 な印象 をもたれ るか もしれないが,Bayes的 立場
か らは経験 Bayes推 定量 として 自然 に導 かれ る.い ま母数 θを確率変数 と考 え θが事前分布
馬 (0,rfp)に 従 うとす る.こ こで τは未知母数 で ある.こ の ときXを 与 えた ときの θの事後分布
は」
鴫(rX/(1+τ ),あ (1+τ ))と なるからθのBayes推 定量 は {1-(1+τ ) り Xで 与えられる
これは未知母数 τを含むので τをXの 周辺分布 馬 (0,(1+τ )」p)で 推定す ることが考 えられ
.
2の
る.‖ χ‖
周辺分布が (1+τ )形 であるから(1+τ ) 1の 不偏推定量はし-2)/‖ X‖ 2と なる.こ れ
パ
を上のBayes推 定量に代入して経験 Bayes推 定量 {1-(タ ー2)/‖ X‖ 2}xが 得られ,こ れがδ
に一 致 す る こ とが わか る.δ パ の こ う した動機付 け は Efron¨ Morris(1972)に よって な され た
が ,彼 は同時 に この経験 Bayesの 方法 に よって Stein現 象 の証 明 が 可能 で あ る こ とを示 した
.
Stein現 象 の証 明方法 に は,こ の他 に,非 心 カイニ 乗 分布 が 中心 カ イニ 乗分布 の Poisson混 合分
布 で表現 され る こ とを用 い た James― Stein(1961)の 最初 の 方法 と,部 分積分 を利 用 した Stein
(1973)の 方法 が あ る.後 者 は大 変簡便 で有 用 で あ るので 次 に紹介 してお こ う
.
よ リー 般 的 に δφが Xを 改 良 す るための φ につ い ての条件 を求 め る こ とか ら始 め よ う.絶 対
′
連 続 な 関 数 力(″ )と そ の 微 分 導 関 数 λ(″ )に 対 し て 部 分 積 分 に よ り E[(χ 一 a)力 (χ )]=
263
統計的推測理論の現状
′
E[力 (χ )]な る等式 が 成 り立 つ.こ れ は Stein identityと 呼 ばれ ,こ れ を用 い る と δφの危 険 関
数は
Rα
助
=馴 沙+絲 -2か χ 一の X¬
艤a「
]
+絲修ニ
ズ 劾―
■4
=」 夕
,一
となる.こ うして identityを 使 う ことによ り未知母数 の を消す ことが で き,E[・ ]の 中身 が危険
関数 の不偏推定量 にな るので あ る.R(θ ,X)=沙 だか ら,結 局 Xを 改良す るためには φ(′ )が
′
φ(′ ){φ (′ )-2(タ ー2)}ル ー4φ (ι )≦ 0な る微分不等式をみたせ ばよい.例 えば (1)φ が非減少か
つ (2)0<φ ≦2(タ ー2),で あればよい.こ うしてXを 改良する推定量のクラス δφが構成 され
る.φ (′ )=タ ー2は 明 らかに (1),(2)の 条件 をみたすので δパはこのクラスに入 り,そ の危
険関数はR(θ ,δ パ)=タ ー(タ ー2)2E[‖ χ‖2]で 与えられ,非 心度が0の とき最大の改善が得られ
る。Stein identityに よる方法の簡便 さと有能 さはその後 の この分野 の顕著な発展 を もた らして
い くことになった
.
X‖
James‐ Stein推 定量は‖
2<沙 _2の
とき縮小し過ぎてしまい各χ の符号を変えてしまう
.
+=max{0,1-(タ ー2)/‖ X‖ 2}χ
パを
そこでδ
なるpositive‐ part Stein推 定量が考えられ,実 際 δ
改良する こ とがわか る.δ +自 身,解析的でないため非許容的で ある こ とが一般論 か ら導 かれ る
δ+を 改良す る明示的 な推定量 を見 つ ける ことはここ十数年 の大問題 とされて きたが,最 近
.
Shao‐ Strawderman(1992)は
その導出 に成功 して い る.し かし彼 らの発見 した推定量 も滑 らか
でな く,そ の意味では非許容的な ままである.そ れではXを 改良す る許容的な推定量 はどのよ
-2。 o一 の″
2凌
うな形 をしてい るのだ ろうか。Strawderman(1971)は φ (′ )=沙 -2-2[∫
]-1
“
lzp′
に対 して δφ
Gβ なる形 の一般化 Bayes推 定量 を求 め,φ
“(′ )が 上の (1),(2)の 条件 をみたす
こ と,即 ち δφ がXを 改良す る こ とを示す とともにその許容性 を証 明 した.δ φ
GBは θの事前分
“
布 の中 の超母数 に対 して無情報事前分 布 を仮定 して得 られ る とい う意味で階層 Bayes推 定量
で あ る.Stein(1973,81)は /2=Σ ∂2ヵメ,7=(∂ /敵 1"。
力み に対 して,/が 超 調 和 条件
"∂
/2/(″ )≦ 0を みたせば δS=χ 十月 og/(X)な る推定量 がXを 改良する ことを示 し,ポ テ ンシ ャ
ル理論 との興味深 い関係 を暗示 した.ま た一般化 Bayes推 定量 は δSの 形 で表現 され,形 式的事
)′
前測度 が超調和 条件 をみたせ ばXを 改良す ることが示 された (Stein(1981),HaF(1991)).
一般化 Bayes推 定量 の許容性 と非許容性 との境界 を事前分布 によって特徴付 ける こともなさ
れて い る (Brown‐ Hwang(1982),Berger(1985)等
).
Kubokawa(1991a)は 分散 の推定 で使われた BBZ法 を この問題 に適用 し,δ φ が δパ を改
良す る BBZ型 推定量 になってい ることを示 した.さ らに Kubokawa(1991b)は “
IERD法 を用
いて,δ パ を改良す るクラス を明 らか にし
,
(a)φ
(b)φ
∞φ(′ )=タ ー2,
)は 単調増カロで,limι →
ω
(′ )≧ φ (′ ),
なる φ(′ )に 対 して δφは δパ を改良す る こ とを示 した.こ の こ とは,分 散 の推定問題 が δパの改
良 に関係 していることを暗示 してお り,δ 十が stein型 ,δ φ が BBZ型 に対応 している.ま た分
“
散 が未知 のモ デル (1。 1)に お いては,James‐ Stein推 定量 は分散 σ2の 最良共変推定量 d。2を 用
いて{1-∂ g(夕 _2)/‖ X‖ 2}で 与えられるが,∂ gの 代わりに改良型推定量を使用することが
(′
James‐ Stein推 定量 の改善 に通 ず る とい う結 果 も得 られ てい る (Kubokawa et al.(1993)).
1.3.2 拡 張 と新 た な展 開 Stein現 象 につ い て は様 々 な拡 張 等 が な され て きたが ,そ の 主 な も
の を正 規 分布 の場 合 について まず概 説 しよ う.
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
共分散行列 が未知 の場合 には,尺 度変換群 に関 して不変 な損失関数 を扱 う限 り未知 の共分散
Stein(1961),Lin‐ Tsai(1973)).し か し不変 で
行列 をその推定量 で置 き換 えればよい (Jame‐ ―
ない損失関数 に関 して は一様 な改良 を与 える推定量 の導出 は容易 でなかったが,そ の明快 な解
答 が Gleser(1986)に よって与 えられた
行列平均 の推定問題 は共分散行列 の推定 と関連 して い る点 で興味深 い.夕 ×γ確率行列 Xが
.
馬 ×7(0,ら Θみ)に 従 う とき,Efron‐ MOrris(1972)は 通常 の推定量Xが 経験 Bayes推 定量 趾
={rp― (タ ー1)(XX′ ) り Xに よって改良されることを示した.さ らにStein(1973)は 0許 の改
良を考え,EfrOn‐ MOrris(1976)は 経験 Bayesの 方法により 0′ ンの改良は逆共分散行列の推定
問題 に帰着できることを示し,σ ″ =0″ ―(メ 十ター2)(trXX′ ) lXな る推定量によって改良さ
れ る こ とを導 いた.Zheng(1988)は Stein(1981)の 行列平均 へ の拡張 を行 った.よ リー般的
な多変量回帰 モ デル (1.3)に お ける係 数行列 の推定問題 へ の展開 は Bilodeau‐ Kariya(1989),
Konno(1991),Honda(1991)等 によ りなされ,成 長曲線 モ デル での議論 が Kubokawa et al。
(1992b),Tan(1991)に よってなされた.成 長曲線 モ デル にお いて改良 のための一般的な条件
を求 めることは今後 に残 された課題 になってい る
θについて の事前情報 に基づ い て θが ある部分空間 アに入 って い る こ とが推察 され る とき
.
にはアの方向へXを 縮小す る Stein推 定量 δ(7)が 考 え られ,θ が アに近 い ときには大 きな改
善 を与 える.し か しその ような事前情報 はもっ と漠然 とした ものであるか もしれない.George
(1986)は θが存在す ると推察 される部分空間 の候補 が複数個 71,.."降 考 えられ るとき,そ れ
ぞれ に縮 小 す る Stein推 定 量 δ(И )の 重 み 付 きの和 として 表 わ され る適 応 型 推 定 量 Σに
ρKX)δ (И )を 提案した.こ こで ρKX)は 改良分の大きいと考えられるδ(り に対する重みが
大 きくなるよ うに作 られて い る
1
.
この他 に も,母 数 α,.."ら の間 に順序制約 が課 せ られて い る ときの Stein現 象 につ い て は
Chang (1982), Sengupta― Sen (1991)│こ よ り, 逐次解 析 で ζ
D Stein現 象 につい て は Takada
(1984),Ghosh et al.(1987)等 によ り,多 重回帰問題 での最尤推定量の非許容性 に関 しては
Baranchick(1973),Takada(1979),Zidek(1978)に よ り議論 された. また Stein現 象 が損
失 関数 の クラス にお い て一 様 に成 立 して い るか 否 か の 議 論 が Shinozaki(1980),Hwang
(1985)に よって,Pitman closenessな る規準 の下 での解明が Sen et al.(1989)に よってなさ
れた
.
1.3。
3
非正規分布での Stein現 象
正規分布以外 の離散型・ 連続型分布族 に対 して もStein現
象 の解明がなされて きた
.
連続型分布族 の うち,球面対称性 の仮定 の下 で は ,≧ 4の ときStein現 象 が生 ず ることが証明
され (Brandwein‐ Strawderman(1990)参 照 ),ま た コ ンパ ク トな集合上での一様性 を仮 定す
れば 夕=3の ときで もStein現 象 が生ずる ことが示 された.Elliptical Contoured(EC)分 布 に
おいて は,最 小 二乗推定量 を James‐ Stein推 定量 が改良す るための条件 は分布 の形 に依 らない
こと,即 ち改良 の頑健性が Cellier
et al。 (1989)に よ り示 された
連続型指数分布族 の場合 ,部 分積分 による identityが Hudson(1978)に よ り導 かれ,通 常 の
不偏推定量 を改良す る縮小推定量 を求 め るため微分不等式 の解法 が Hudson(1978),Berger
(1980),DasGupta(1986)に よ り求 め られた.特 に Bergcr(1980)は Gamma分 布 の尺度母
数 の同時推定 については損失関数 の と り方 によっては 2次 元以上で Stein現 象 が生ず る とい う
事実 を発見 した.そ の他 に Hudsonの identityの 多次元指数分布族 へ の拡張,エ ン トロ ピー損
失関数の下 での Stein現 象,指 数分布族での超調和条件等が議論 されている.Shinozaki(1984)
は一様分布,両側指数分布 ,′ 一分布 な どの一 次元の分布 について も合算する ことによ りStein現
.
象が生ず ることを示 した.ま た分布 の形 が明示的 にわか らな くて も 4次 の中心 モー メン トまで
265
統計的推測理論の現状
の情報 が あれば Stein効 果 が得 られ るとい う興味深 い結果 を与 えた.正 の母数 の同時推定 に関
する非許容性 の一般的結果 が DasGupta(1989)│こ よ り得 られて い る
離散型指数分布族 の場合 には,不 偏推定量 を改良す るための縮小推定量 を構成 す る ことは差
.
分不等式 の解 を見 つ ける こ とにな り,Poisson分 布,負 の二項分布 に対 して 4次 元以上 の ときに
解 が求 め られた (Hudson(1978)).一 方 Poisson分 布 の Stein現 象 が 2次 元以上 の とき生 ず る
ことを Clevenson‐ Zidek(1975)が 示 し,離 散分布 での Stein問 題 の研究 が活発 になされて きた
が,そ れ らが Ghosh et al。 (1983)に よって統 一 的 にまとめ られた
ノンパ ラメ トリックモ デル にお い て も L― ,M― ,R― 推定 量 の Stein効 果 による改良 が Sen_
.
Saleh(1987),Shiraishi(1991)等 によって示 された.確 率過程 や時系列 モ デルでの Stein現
象 について も調 べ られてい る
.
1.3。
4 信頼領域 1980年 代のStein問 題の展開の一つに信頼領域の問題が挙げられる.Xが
2≦
ε
馬 (θ ,IP)に 従うときの通常の信頼領域はCO(χ )={θ θ―χ‖
)で ぁり,ε は信頼係数 1-γ
2)=1_γ
≦
に対してP(ア ε
をみたす定数である
ある信頼領域 C(χ )が CO(X)を 改良す るとは,(I)鳥 {θ ∈ C(χ )}≧ 鳥 {θ ∈ C(X)}が すべ
ての θに対 して成 り立 つ ことと,(II)(C(χ )の 体積 )≦ (C° (χ )の 体積 )が ほ とん どすべ ての
Xに 対 して成 り立 つ ことである。Stein,Brown,JoShiら によって ,≧ 3の ときの α (χ )の 非許
;‖
.
容性 が示 されて きた.し か し実際改良 してい る信頼領域 を明示的に求めたのは Hwang‐ Casella
定量 鉗(X)=max{o,1-α X‖ 2}χ に対して Cα (X)={θ
2≦
θ―δ
。
オ
cな るαに対 して Cα (X)が
(X)‖
‖
}な る信頼領域を考えると,夕 ≧4で 0<α ≦α
め
こ
CO(X)を 改良する とを証明した.但 しα
。は方程式 {″τtt yσ +¢ c}p-3=(α c)ω ′ο CCの 解で
ある.さ らに Hwang― Casella(1984)で は ,=3の 場合 を含 むように αのみたす範囲を広 げた
そ して球面対称 な分布族 へ の拡張 や改良す る信頼領域 のクラスの構成 がなされて きた.尺 度母
一
数 が未知 の場合 の,区 間推定 での Stein現 象 につ いては Robert‐ Casella(1990)が 多変量 ′
分
布 を含 む球面対称分布族 に対 して証明 した.し か しその議論 には正規分布 が含 まれてお らず今
(1982)で あり,positive‐ part Stein推
/‖
;
Vα
.
後 の課題 とされてい る
以上述 べ て きた信頼領域 の改良 は,体 積 を等 し ぐしたまま (I)の 意味 で CPを 大 きくす る方
.
向でなされて きた.し か し区間推定 の本来 の意味 か らは CPを 一定 にした まま (II)の 意味 で体
積 のよ り小 さい信頼領域 を構成す る ことが望 まれ るe Shinozaki(1989)は 球 C° (X)全 体 を原
点 に向けて縮小す ることによって
とに成功 した。
(Ⅱ )の 意味 で一様 に改良す る信頼領域 を解析的 に与 える こ
1.4 共分散行列の推定
この節 で は統計的決定理論 の立場 か ら活発 に研究 されて きた,多 変量正規分布 の共分散行列
の推定問題 について報告す る
.
夕×夕確率行列 Sが 期待値 πΣ をもったWishart分 布 И
よっ
咋(π ,Σ )に 従うとし,Σ を
てエン トロピー損失 tの2 1-loglΣ ン11-夕 に関 して推定する問題 を考えよう.通常,不偏推定
'に
lsが
量 島=π
用いられるが,ふ の固有根がΣの固有根に比べ広がってしまい,こ の欠点を克
服するために 凡 の固有根を中央に向けて縮小する必要が生ずる.こ の方向の仕事には,Stein
(1977),Efron‐ Morris(1976),Haff(1980),Sugiura¨ FuiimotO(1982)等 が あ る.特 に Haff
(1979)は Wishart分 布 で の部分積 分 の公式 (Wishart identity)を 導 出 し,そ れ は共分散行 列
を含 んだ推測 問題 にお い て改 良型推定量 を求 め るための強力 な手段 とな って い る:
一般線形群はミニマックス性についてのKieferの 条件をみたさないので最良共変推定量 凡
266
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
はミニマ ックスでない.James‐ Stein(1961)は その部分群である下三角行列による変換群 G声
を考え,そ れに関する最良共変推定量がミニマ ックスであり,Σ ″="7,s=TTt T∈ G夢 ,D
=diag(4,… ,あ ),4=(π 十′+1-2グ ) 1,で 与えられることを示した.し かし
は座標系のとり
方に依存するので直交不変な ミニマックス推定量を構成することが望まれる
'″
直 交不 変 な ミニ マ ックス推定量 の導 出 に は二 つ の 方 向 が あ る.一 つ は Stein(1977),Dey‐
.
Srinivasan(1985)の アプ ロー チで あ り,直 交行列 R,対 角行列 L=diag(洗 ,… ,あ )に よって
肥
R′
S=
と表 わ され る とき,'″ が ,Sr=Rdiag(ム 乙,… ,ら あ )R′ に よって改良 され る.さ らに Dey
二
Srinivasan(1985)は
,≧ 3の
ときに
改良する推定量を導き,Sheena‐ Takemura(1992)
は打 ち切 り型 推定量 を考 えることによ
'Srを
って 少≧2で の ΣSTの ブト
許容性 を示 した。Haff(1991)は
Bayes推 定量の変分形 式 VFBE(Variational FOrm of Bayes Estimator)を 与 える一般論 を
展開し,Σ に対するVFBEを 求め,そ れが
り優れていることをシミュレーション実験に
よって示した.も う一つはTakemura(1984)の
'Srょ
アプローチで,直 交群 0(夕 )上 の一様分布 μ と
′
Tr写 =「 ′
SF,F∈ 0(夕 )に 対 して =∫ θ
ω)Fη OttΓ ″ (F)な る推定量 によって
は改良
され る.Σ υは 沙≦3の ときに は明示
'υ的表現 が与 え られ たが ,夕 ≧4で は困難 とされ て'π
きた (Ta‐
kemura(1984)).そ の困難 さ はあ る量 の比 の期 待値 を計 算 す る ところに あ るが ,PerrOn(1992)
,
はそれ を期待値 の比 に置 き換 えて近似 解 を陽 に求 め,そ れが 直交不変 ミニ マ ックス推定量 にな
つ て い る こ とを示 した.
共 分 散 行 列 に 関連 して 二 つ の 共 分 散 行 列 の 比 に 関 す る推 定 が DasGupta(1989),KonnO
(1992),Bilodeau― Srivastava(1992)等 に よって議論 され て きた.特 に Bilodeau‐ Srivastava
は比 に関 す るエ ン トロ ピー損 失 を導入 し,共 分散行 列 の場 合 と同様 な結果 が比 の
推定 にお い て
成立 す る こ とを示 した.
1.5 縮小 を要 す る推定 問題
以上述 べ て きた,分 散 ,共 分散行列 ,平 均 ベ ク トル の推定 は縮 小推 定 の代 表 的 な
問題 で あ る。
その他 に も通 常 の推定量 の縮 小 また は拡大 を必 要 とす る問題 は少 な くな い よ うに思
われ る
.そ
の ときどの程度縮 小 また は拡 大 す べ きかの指標 を与 える こ とが 重要 で あ るが
,1.2節 ,1.3節 で
ふ れ た IERD法 はその一 つ の有 用 な手段 で あ る と期 待 され る.そ の の い つか
く
例
を以 下 に紹 介
しよ う.
変量 模型 ,混 合模 型 にお け る分散 の群 間成 分 の推定 につ い て は,一 般 にその不偏
推定量 は正
の確 率 で 負値 を と りえて しまい,そ の非合理性 を排 除 す る為 に様 々 な みが
な され て きた
試
.二
次形式 の推 定 量 の うちで は非 負 な不偏 推定 量 は存在 しな い こ とや 非 負 な二 次形
式推 定量 は漸近
的 一 致 性 を持 た な い こ とが知 られ て い る.従 って,二 次形 式統 計量 の範 囲 を超 えて正 で一
致性
を もった改 良型推定 量 を求 め る こ とが 望 まれ る.IERD法 を用 い る と
,不 偏 推定量 を正 の 方 に縮
小 す る こ とに よって その よ うな推定量 を求 め る こ とがで きる.多 次元 へ の拡 として
張
,多 変量
混 合 モ デ ル に お け る共 分散行 列 の群 間成 分 の推 定 が Calvin‐ Dykstra(1991)に よ って
議論 さ
れ ,最 尤推定量 を求 め るアル ゴ リズ ム等 が 提案 され た.こ の よ うな
多次元 の場 合 に IERD法 を
い か に適 用 す るか は今後 の興 味 深 い課題 で あ る.
F分 布 の非 フ
い母 数 の推 定 につ い て も不 偏 推定 量 は負値 を取 りえて
い
しま ,そ の欠点 を排除 す るための手段 が 議論 され て きたが
,こ の場 合 に も不偏推定量 を改 良
す る合 理 的 な推定量 の導 出 に対 して は IERD法 が有効 で あ る こ とが わか る
.こ の問題 の多次元
化 も今後 の課題 で あ る (Leung‐ Muirhead(1987)).
順 序制約下 で の母 数推定 にお い て は,推 定量 が その母 数空 間 か らはみ 出 してい る ときに
はそ
の空 間 に縮 小 また は拡 大 す る必 要 が あ る.最 尤 推定量 はその よ うな
にな
ってい て,そ の導
手法
非 心 カ イニ 乗 分 布 や 非 心
267
統計的推測理論の現状
出のための isotonic回 帰法 を用 い たアルゴ リズム等 が提案 されて きた.IERD法 を用 い る と許
容的 ミニ マ ックス推定量 を含 んだ改良型推定量 のクラスを構成す る ことが で きる.ま た多変量
線形校正問題や統計的制御問題 にお ける古典的推定量 を改良す る一致推定量の構成 や分散比 の
二重縮小推定量 の導出 にお いて も IERD法 の使用 が有用 で ある ことが わかって きた.そ の他 に
も,決 定後 または検定後 の推定問題 (Dahiya(1974)),線 形回帰 モ デルで説明変数間 に多重共
線性 が存在す るときの安定な推定量 の導出,付 加的情報 の使用 による推定量 の改善 などにおい
て縮小 の考 え方が重 要 で あ り,一 般 に,推 定 が過大評価 または過小評価 してい る場合や,推 定
が あい まいで漠然 とした ものだった り不安定 な ものだった りした ときには,よ り安定 したよ り
確 かな方向へ縮小す ることが望 まし く,何 らかの意味 で よ り優れ た縮小推定量 を導 出する こ と
が大切であると思われ る
.
謝辞 :査 読者 の有益 な コメン トに感謝 します
.
参
[1]Akai,T.,(1986)。
考
文
献
SimultaneOus estimation of locatiOn parameters Of the distribution with inite
support. 24%%.fη sA s協″sム Ma′ λ.,38,85-99.
[2]Arnold,B.C.(1970).Inadmissibility of the usual scale estimate fOr a shifted exponential distribu‐
tion.ノ 4π ιた S″ ″s14ssοε
.,65,1260-1264.
[3]Baranchick,A.(1973).Inadmissibility of ma対
mum likelihood estimators in some multiple
regressiOn problems with three or mOre independent variables.
42η
.〔 ,ι ″
″sA,
1,312-321.
[4]Berger,Jo O.(1980).ImprOving on inadmissible estimators in continuous exponential families
with applicatiOns tO silnultaneous estilnation of garnina parameters. 4η
π. S滋 ″sム ,8,545-571.
[5]Berger,J.O.(1985).S滋 麻″ ′Iル θおあη 2磁 θοη απノBのcsあ %4η α′
ぉお.2nd Ed.,Springer―
`α
New York.
Verlag,
[6]Bi10deau,M.and Kariya,T.(1989). Minimax estimators in the nOrmal MANOVA model.ェ
ノ
;イ %′洗z4π α
ム, 28,260-270.
[7] Bi10deau,M.and Srivastava,M.S.(1992).EstimatiOn Of the eigenvalues of』 乳Σダ1.ェ ノ
Иπι
′
.
五παム,41,1-13.
[8]Brandwein,A.C.and strawderman,W.E。
case.S協 ″s′ Sa.,5,356-369.
(1990). Stein estimation:The spherically symmetric
[9]Brewster,J.F.(1974).Alternative estimators fOr the scale parameter of the exponential distribu‐
tion with unknown 10catiOn.4η η.Stα″s′ 。
,2,553-557.
[10] Brewster,J.F.and Zidek,J.V。 (1974).Impro宙 ng on equivariant estimatOrs.422.Sι
-38.
[11]BrOwn,L.D。
α″sム ,2,21
(1968).Inadmissibility of the usual estimators Of scale parameters in problems with
unknOwn 10catiOn and scale parameters. 24η π. Mα ι
力。Sね″sた ,39,29-48.
[12] Brown,L.D。 (1971).Admissible estimators,recurrent diffusions,and insolvable boundary value
problems. 24%η o Math.s滋″si′ 42,855-904.
[13]Brown,L.D.and Hwang,J.T.(1982).A unined admissibility pr00f.In Sttα
力
な虎ヒα′」
シθ
おあπ
η θη αηグ Rθ 滋彪グ さ
6s rr/,(s.s.Gupta and J.Berger,Eds.),Academic Press,New York.
ぃ′
[14] Calvin,J.A.and Dykstra,R.L.(1991).lⅥ aximum likelih00d estimation Of a set Of covariance
matrices under Lowner order restrictiOns with applications to balanced multivariate variance
ttθ
components mOdels. 4%η
. S″ ″sム ′19,850-869.
[15] Casella,G.and Strawderman,W.E.(1981).Estimating a bOunded mean.4π
879.
2.S滋 ″sム ,9,870-
[16] Cellier,D。 ,Fourdrinier,D.and Robert,C.P。 (1989).Robust shrinkage estimatOrs of the 10cation
parameter for elliptically symmetric distributions.ェ
』ィ%″ 4%α スタ29,39-52.
T.(1982).Stein_type estimators fOr parameters in truncated spaces.」
[17] Chang,Y。 ‐
R(グ 〉
., 35, 185-193.
κθ
あ
Sa.■ λ
.
`θ
[18] ClevensOn,M.L.and Zidek,J.V.(1975). Silnultaneous estimatiOn of the rnean 6f independent
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
Poisson laws.ェ 4π θκ S″ 麻 ム Assθ a,70,698-705.
[19] Cohen,A.(1972).Improved confldence intervals for the variance of a norinal distribution.エ
4ηzι ‰ Stα ι
なたz4ssο θ
., 67,382-387.
[20]Dahiya,R.C.(1974).Estimation of the mean of the selected population.工
4π θた S滋法 たAssθ
`.,
69, 226-230.
[21]DasGupta,A.(1986).Simultaneous estimation in the multiparameter Gamma distribution under
、
veighted quadratic losses. 4%η .Sttι おム, 14,206-219.
[22] DasGupta,A.(1989).A general theorem on decision theory for nonnegative functionals:with
appHcations. 74π π.Stα ″sム ,17,1360-1374.
π
[23]Dey,D.K.and Srinivasan,C.(1985).Estimation of covariance matrix under Stein's loss.4π
″sム
Sチ α
.
,13,1581-1591.
[24]Eaton,M.L.(1992).A statistical diptych:admissible inferさ nces一 recurrence Of symmetric
h/1arkov chains. 4π η. S協 ム
ぶム,20,1147-1179.
[25] Efron,B.and Morris,C.(1972).Empirical Bayes on vector observations:An extension of Stein'
s method.
Bう
″々α,
o,2zι ′
59,335-347.
[26]Efron,B.and Morris,C.(1976).Mult市 ariate empirical Bayes estimation of covariance matrices.
4η ηo S滋 ″sた ,4,22-32.
[27]Eguchi,S.(1991).A coniugate look at EM algorithm and its turbo form in exponential families.
Unpublished manuscript.
[28]George,E.I.(1986)。
Minimax multiple shrinkage estimation.4π π.≦ 彦α虎むた,14,188-205.
[29]Ghosh,M.,Hwang,」 .T.and Tsui,K.‐ W。 (1983).Construction ofimproved estimators in multipar‐
ameter estilnation for discrete exponential fanlilies.
■%π .S協 麻 ム,11,351-367.
[30]Ghosh,M.,Nickerson,D.M.and Sen,P.K。 (1987).Sequential shrinkage estimation.4%η
.
S滋″sA,15,817-829.
[31]Gleser,L.J.(1986).Minimax estimators of a normal mean vector fOr arbitrary quadratic loss and
unknown covariance matrix. 24π η. Sttα ″sた , 14,1625-1633.
[32] Goutis,C.and Casella,G.(1991). ImprOved invariant confldence intervals for a norrnal variance.
4η π.S滋 ″sた ,19,2015-2031.
[33] Haff,L.R.(1979).An identity for the Wishart distribution with applications.ェ
」
Иπ″ Aπ αム,9,
531-542.
[34]Haf,L.R。
(1980).Empirical Bayes estimation of the multivariate normal covariance matrix.
24η %.Sta″ sム ,8,586-597.
[35] Haff,L.R.(1991).The variational fOrm of certain Bayes estimators.4η %。 S姥麻 ι
.,19,1163-1190.
[36]Honda,T.(1991).Minimax estimators in the MANOVA mOdel for arbitrary quadratic loss and
「π″ ∠παム,36,113-120.
unknown covariance matrix.ェ ル
[37]Hudson,H.M.(1978).A natural identity for exponential families with applications in multipar‐
ameter estimation, 4η η.Stα ガsた ,6,478-484.
[38]Hwang,J.T.(1985).Universal domination and stochastic domination:Estimation simultaneous‐
ly under a broad class of loss functions. 24π
%。
Stα″sA, 13,295-314.
[39]Hwang,J.T.and Casella,G.(1982).Minimax conidence sets for the mean of a multivariate
norrnal distribution. 24η %.S協″sた ,10,868-881.
[40]Hwang,J.T.and Casella,G.(1984).Improved set estimators for a mult市 ariate normal mean.
S滋″sム αηグ Deε お′
θ%s,Supplement lssue l,3-16.
[41]Hyakutake,H.and Siotani,M.(1987).The multivariate heterOscedastic method:Distribution of
statistics and an application.五 %θ た ェ 』
物 厖。物 π θ
.Sθ ′
.,7,89111.
[42] Isogai, E。 (1987). The convergence rate of ixed‐ “width sequential confldence intervals for a
probability density function. Sccπ a22威α′4η αム,6,55-69.
[43]James,W.and Stein,C.(1961).Estimation with quadratic loss.In乃
S″″sム PЮ らαわ。
,1,361-379.
りθ
.イ ル Bθ ″θ
′
の シタ
″ .』 庖 ル
[44]Kariya,T.(1989).Equivariant estimation in a model with an ancillary statistic.4π
.
%.S滋 ″sた
920-928.
[45]Kon■ o,Y。 (1991).On estimation of a matrix of normal means with unknown covariance matrix.
工 〃π″ 4η αl,36,44-55.
17,
269
統計 的推 測 理 論 の現 状
[46]Konno,Y.(1992).On estimating eigenvalues of the scale matrix of the multivariate F distribu‐
tion.8zπ 力聰Q,4,54,241-251.
[47]Kubokawa,T.(1987).Admissible minimax estimation of a common mean of two normal popula‐
tions. 4π %。 S協ム
なム,15, 1245-1256.
[48]Kubokawa,T。 (1991a).An approach to impro宙
ng the James― Stein estimator.メ
JИ%′ ムスηα
l,36,
121-126.
[49]Kubokawa,T。 (1991b).A unined approach to impro宙 ng equivariant estimatOrs.METR 91-01,
Dept.Ⅳ lath.Engrg.Inf.Phys.,Univ.Tokyo.4π π.S協ム
なム (1993),to appear.
[50] Kubokawa,T。 ,Honda,T.,Morita,K.and Saleh,A.K.Md.E.(1990).Estimating a cOvariance
matrix of a normal distribution with unknown lnean.
METR 90-12,Dept.卜
〔ath.Engrg.Inf.Phys.,
Uni寺 .TOkyo.
[51] Kubokawa,T.,Morita,K.,lⅥ akita,S.and Nagakura,K。
its applications.ェ
S滋″Sた
.琢 ,tO
Pιαη
(1992a).EstimatiOn of the variance and
appear.
[52]Kubokawa,T.,Robert,C.and Saleh,A.K.Md.E.(1992b).Empirical Bayes estimation of the
covariance matrix of a normal distribution with unknown inean under an entropy loss.
Sι ttω
Sα η力聡Qぅ
24,54,402-410.
[53]Kubokawa,T.,Saleh,A.K.Md.E.and Morita,K。 (1992c).ImprO宙 ng on MLE of coemcient
matrix in a growth curve model.I SJa麻 ム Pιαπ.ル グ,31,169-177.
[54]Lehmann,E.L.(1983)。
つ
吻ω ッ グ ル 勿′Es″ πα滅,η .Wiley,Ney
York.
[55] Leung,P.L.and blluirhead,R.J.(1987). Estimation of parameter matrices and eigenvalues in
MANOVA and canonical correlation analysis. 4π π.S″ ″sム ,15, 1651-1666.
[56]Lin,P.― E.and Tsai,H.‐ L.(1973). Generalized Bayes minimax estimators of the multivariate
normal inean with unknown covariance matrix.∠ πη. S協 ″s″ ., 1, 142-145.
[57]Maatta,J.M.and Casella,G.(1990).Developments in dё
cisiOn― theoretic
variance estimation.
S滋′
ぶ′
.Sε ′
.,5,90-120.
[58]宮 川 雅 巳 (1987).EMア ル ゴ リズ ム とそ の周 辺 。 応 用統 計 学 ,16,1-19.
[59]Nagata,Y。 (1989).ImprOvements of interval estilhations for the variance and the ratio Of twO
variance.エ エψαπ S滋 ″si
[60]永 田
靖
Sθ ε
.,19,151-161.
(1991).指 数分 布 の尺 度 母 数 の改 良信 頼 区間 .品 質 ,21,5-10.
[61] Perron,F.(1990).Equivariant estimators of the covariance matrix.Cα
%α ググ
αηェ
S″″sム ,18,179-
182.
[62]Perron,F.(1992).Minimax estimators of a covariance matrix.工
1イ″ム4η α
ι
.,43,16-28.
[63]Proskin,H.M。 (1985).An admissibility theorem with applications to the estimation of the
variance of the normal distribution.
[64]Robert,C.(1991).PriOr feedback:A
Ph.D.dissertation,Dept.Statistics,Rutgers Univ.
Ёayesian approach to maximum likelih00d estimatiOn.
Unpublished manuscript.
[65] Robert,C.and Casella,G.(1990).ImprOved confldence sets for sphericany symrnetric distribu‐
tions.ェ ノ
И%′ ム4π αム,32,84-94.
[66]Robertson,T.,Wright,F.T.and Dykstra,R。
North‐ Holland,New
ガε″グ S滋麻 ″ι
(1988).Ottθ γ R“ ′
α′ J″ ″π
York.
[67]Rukhin,A.L.and Sinha,B.K。 (1991).Decision‐ theoretic estimatiOn of the product of Gamma
scales and generalized variance.
Unpublished manuscript.
[68]Sarkar,s.K.(1989).On imprOving the shortest length cOnndence interval for the generalized
variance.エ ノ
И%′ ム4η α1 31,136-147.
[69]Sen,P.K.,Kubokawa,T.and Saleh,A.K.Ⅳ
Pitman measure of closeness. 4π
.
“
[d.E。
(1989).The Stein paradox in the sense of the
πo S協 ″sl 17,1375-1386.
[70] Sen,P.K.and Saleh,A.K.Md.E.(1987).On preliminary test and shrinkage M_estimatiOn in
linear rnodels. 4η π. S協″s夕 ,15,1580-1592.
[71] Sengupta, D. and Sen, P. K。 (1991). Shrinkage estilnation in a restricted parameter space.
Sα η乃
聡Q)∠ ′53,389-411.
[72]Shao,P.Y.‐ S.and Strawderman.(1992).Impro宙 ng on the James― Stein
positive― part estimator.
Unpublished manuscript.
[73] Sheena,Y.and′ rakemura,A。 (1992). Inadnlissibility of non‐
Order‐ preserving Orthogonally invar‐
270
日 本 統 計 学 会 誌
第 22巻
第
3号
(増 刊 号 )1993
iant estilnators of the covariance matrix in the case of Stein's loss.
た■%α 洗41,117-131.
ェ 協 ′
[74]Shinozaki,N.(1980).Estimation of a mult市 ariate normal mean with a class of quadratic loss
functions. J. Amer. Statist. Assoc., 75,973-976.
[ZS] Shinozaki, N. (1984). Simultaneous estimation of location parameters under quadratic loss.
Ann. Statist., 12, 322-335.
[ZO] Shinozaki, N. (1989). Improved
confidence sets
for the mean of a multivariate normal distribu-
tion. Ann. Inst. Statist. Math.,41, 331-346.
[77]篠 崎 信 雄
(1991).Steinタ ィ プ の縮 小 推 定 量 とそ の応 用 。 応 用統 計 学 20,59-76.
(1991).On positive‐ part shrinkage R‐ and M‐ estimation in one‐ way
[78]Shiraishi,T。
ANOVA.エ
.,21,61-72.
ル α%S滋 ″Si Sθ θ
[79] Shorrock,G.(1990).ImprOved conidence intervals for a normal variance.4κ
πo S″ ″sム ,18,972
-980.
[80] ShorrOck,R.B.and Zidek,J,V.(1976).An improved estimator of the generalized variance.
五%η o S滋 ″sA 4,629-638.
[81]Sinha,B.K.(1976).On imprOved estimators of the generalized variance.工
Иπ″ 4%α 16,617」
626.
[82] Sinha,B.K.and Ghosh,M.(1987).Inadmissibility of the best equivariant estimators of the
variance‐ covariance matrix,the precision matrix,and the generalized variance under entropy loss.
S放″sム απグ Dθ sあ ηs 5,201-227.
“
[83]Stein,C.(1956).Inadmissibility of the usual estimator for the mean of a multivariate normal
distribution.In P/aθ .θ π′Bι ″θ′
ν 〔
シ綱夕.ル診厖.S滋 ″sム
P2・abα ら
。
,1197-206.
[84]Stein,C.(1964).Inadmissibility of the usual estimator for the variance of a normal distribution
with unknown mean. 4%π .Iη si S滋″stt Ma′ λ.16,155-160.
[85]Stein,C.(1973).Estimation of the mean of a multivariate normal distribution.In PЮ ι.P知 ♂zθ
.,345-381.
めの .ス ッ %)わ 姥 S滋麻 ′
[86] Stein,C.(1977).Lectures on lnultivariate estimation theory.(In Russian.) In」
vol.74)。
物υωι
な ″θη οπ
r.(zapiSki Nauchych Seminarov LOMIim.V.A.Steklova AN SSSR
S滋ガsticα ′I発 ″協形″θπ τttω η
Leningrad,4-65.
[87]Stein,C.(1981).Estimation of the mean of a multivariate normal distribution.4η πo
S歳 法 ム,9,
1135-1151.
.,5,147-155.
[88]Stigler,s.M.(1990).A Galtonian perspect市 e on shrinkage estimators.S滋 麻 ム ■ グ
[89]Strawderman.W.E.(1971).Proper Bayes minimax estimators of the multivariate normal mean.
4π π.ル物ル.S″ ″si′ 42,385-388.
[90]Strawderman,W.E.(1974).Minimax estimation of powers of the variance of a normal popula‐
tion under squared error loss.
4%%。
S協 力なム,2,190-198.
[91]Sugiura,N.and FuiimotO,M.(1982).Asymptotic risk comparison of improved estimators for
normal covariance rnatrix.asπ ヵπbα 工 ′
陶 厖。
,6,103-126.
[92] Sugiura,N.and Konno,Y。 (1988).Entropy loss and risk of improved estimators for the general―
ized variance and precision.
4π π.Iη sた Stα ″sム Mα′
λ 40,329-341.
.′
[93]Takada,Y.(1979).A family of minimax estimators in some multiple regression problems.五
%π
.
S滋″sム ,7,1144-1147.
[94]Takada,Y.(1984).Inadmissibility of a sequential estimation rule of the mean of a mult市
normal distribution.Sa9%θ %″α′4%α ム,3,267-271.
ariate
[95] Takada,Y。 (1992).A sequential procedure with asymptotically negatiVe regret for estimating a
normal lnean. 4%π .S滋 ″si,20,562-569.
[96]Takemura,A.(1983).An orthogonally invariant minimax estimator of the covariance matrix of
a multivariate normal population.
[97]竹 内
啓
(1979)。
7b%力 %bα
.ス
Ma′ λ 8,367-376.
.′
Stein推 定 量 の意 味 とそ の応 用 .応 用 統 計 学 8,81-95.
[98]Takeuchi,K.(1991).Personal communications.
[99]Tan,M.(1991).Improved estimators for the GMANOVA problem with application to Monte
Carlo simulation.ノ
」
Иπル 4π αス,38,262-274.
[100]Tate,R.F.and Klett,G.W。 (1959).Optimal confldence intervals for the variance of a normal
distribution.ェ スπθ‰ S滋″si 4ssο ε.,54,674-682.
統計的推測 理論 の現状
[101]Wald,A.(1950).S"″ s″
′Dι ″s′ ο%f磁 %ε ′
わπs.Wiley,New
York.
“
[102]Woodroofe,M.and Takahashi,M.(1982).Asymptotic
expansions for the error probabilities of
some repeated signiflcance tests.
24%π . SJa″ sl, 10,895-908
[103]Zacks,S.(1970).Bayes and nducial equ市 ariant estimators of the common mean of two normal
distributions. 4π η.Ma′ 力.S"ガsム ,41,59-69.
[104]Zheng,Z.(1986).0五 estimation of matrix of normal mean.ェ
〃πル 4π αム,18,70-82.
[105]Zidek,J。 (1978).Der市 ing unbiased risk estimators of multinormal mean and regression coemcient
eStiFnatOrs using zonal polynOnlials. 4π
2.統 計 的推 測 の漸 近理論
η. S協 ″sム ,6,769-782.
一 幾何 的 ア プ ロー チの展 開 か ら一
2.1 は じ め に
この章 で は統計 的推測 の漸近 理論 を幾何 的 アプ ロー チ を中心 にサ ーベ イ し,将 来 の展 開 へ の
萌芽 的研 究 も紹介 した い.Kass(1987)は 巻頭 の紹 介 の 中 で R.A.Fisherの こ とを “0%γ ποs″
θ
η′
α″ 望″ (我 々の不可思議 な大 いなる哲人 )"と 称 した。Fisherが 1925年 論文 の中で統
切つ
計的推測 の基本概念 となる一 致性 ,十 分性 ,有 効性 を提出 し,そ の三位一体 の枠組 の中で情報
の損失 とその回復 が彼 の推定理論 の核心 となってい る。彼 の一 言々に対 して多 くの優秀 な数理
統計学者 が長大 な数学的道具 を駆使 して理解 を完成 して行 ったのは 1980年 代 で ある.更 に驚 く
べ きこ とに彼 の業績 の対 を成す もう一 方 には集団遺伝学 が ある.自 然選択の Fisherの 基本定理
が集団遺伝学の中心 を形成 して い る.最 近 の成果 で ある進化的安 定戦略 (ESS)の 展開 もこの枠
組 にある。 (Fisherの 数理進化論 の貢献 の総説 は Karlin(1992)を ,ESSに ついて は Lessard
(1989)を 参照 されたい.)
2。
2
漸近有効性
T=T(X)へ の情報縮約 による情報損失 の尺度 をん (T)≡
こでπ
L(7)と
めた
はXの 標本サイズ,為 (X)と 為(T)は Xと Tの 持つ情報行列
HX)一
定
.こ
とする。Tが 十分統計量ならばる (r)は 任意の%に 対 して消える.Xの 従う分布が指数型なら
Fisherは 標本Xか ら統計量
ば,最 尤推 定量 は十分 だか ら情 報 損失 はな い こ とよ り,指 数型 で な い ときが 問題 とな った.最
尤推定量 は観測一 回当た りの損失 (1ル )∠ ″が %→ ∞ の極限 で消 える こ としか云 えない.こ の性
質 (1次 有効性 )を 満 たす推定量 のクラスの中で Fisherの 主張 は一般 に “
最尤推定量 は %の 極
限で情報損失 ∠πの下限 を与 える (2次 有効性 )"と 云 うものである
Fisher予 想 の最尤推定量 の 2次 有効性 の解決 の第 一歩 は Rao(1960,1962,1963)の 二部作
.
か ら始 まった.情 報損失 ∠″の扱 い易 い形 を与 え,多 項分布 のワ ンパ ラメー ター族 の場合,最 小
χ2推 定量 を含 む幾 つか の推定量 と共 に最尤推定量の情報損失の極限を求め,Fisherの 計算の一
部 を訂正 した.更 にバ イアス修正 の操作 をすれば推定量 の 2次 有効性 は分散 の 2次 までの項 を
最小 にす る ことを証明 した.第 二歩 は Efron(1975)に よって踏 み出 された.Xの 従 う分布 が指
数型分布 の非線型 ワンパ ラメー ター族 に広 げられ,推 定量 Tの 情報損失 の極限 は
lim″ →
∞∠″
(r)=γ ;十 (1/2)β :(T)
で与 えられ る.こ こで γθは θにお ける指数線型性 か らの乖離度 を表 す量で Efronは 統計 曲率
と呼 んだ.β θ
(T)は rに 依存す る量で Tが 最尤推定量の とき恒等的 に消 え,ゆ えにその損失の
極限 は下界 γθに到達する こ とが証明 された.最 終版 は,Amari(1982,1985)の 微分幾何 によ
る考察 で成 し遂 げ られた.確 率密度関数 の空間上で相異 なる 夕(″ )と ,(″ )を 結 ぶ測地線 の一組
272
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
Clと C2を
≦1},C2=(C(′ )夕 (″ )`σ (χ )1
Cl=(妙 (″ )十 (1-′ )σ (″ ):0≦ ′
`:0≦
≦1}
′
と定 める.こ こで C2の 中 の σ(′ )は 規格化定数 で ある.こ の Clと C2に よって誘導 され る線型
接続 を各 々, ミクスチ ュア接続 と指数接続 と呼 ぶ。 モ デル は指数型分布 の非線型 マル チパ ラメ
ー ター族″ に拡張 され,情 報損失行列 は
lim″ →
∞∠″
(T)=G2(〃 (の αイ))十 (1/2)G2(″ 〈T))
(″
と表 された.こ こで ″(の は″ の指数接続 に関す る第 2基 本形式 で,〃 (2)は 推定量 Tの 張 るア ン
シラ リィ空 間 の ミクスチ ュア接続 に関す る第 2基 本形成 で,α は Gram形 式 を表す.統 計曲率
γ:の 多次元版 は 〃 (の (〃 )の Gram形 式 で表現 された.こ の二つ の線型接続 は Fisher計 量 の下
で互 い に双対 で,統 計 モ デル と推定 を同時 に評価 で きる物差 の役割 を演 じ, 2次 有効性 理論が
完成 された.4節 にお いてその後 の発展 の 中で この双対構造 が 重要 な鍵 を担 う ことにな る
Eguchi(1983)は ,最 小 コ ン トラス ト推定 量 の情報損失 の公式 を与 え,最 尤推定量 を含 む 2次
有効 な推定量 のワ ンパ ラメータ族 を提出 した.こ れよ り 2次 有効 な推定量 のクラスの中で更 に
.
高次漸近挙動 の構造決定 が 問題 となるが これ は未解決 である
.
漸近有効性 の大 きな貢献 として竹 内 と赤平 の業績 が挙 げ られる.彼 等 による漸近有効性 の定
義 は,分 布 の集 中度 による ものである.推 定量 を中央値不偏 になるよ うに操作 し,真 値 の廻 り
での確率 を Neyman‐ Pearson検 定 によって得 られた上界 を基準 にして上ヒ
較す るもので ある。こ
れ らの結果 は Akahira and Takeuchi(1981)に まとめ られてい る.彼 らの結果 は曲指数族 を
越 えるよリー般 の正則 な分布族 について成 り立 つが,そ の結果 は甘利 と公文 による微分幾何学
を用 い る表現 と一致 してい る.ま た Pfanzagl(1985)も 分布 の漸近展開 の方法 によって漸近有
効性 を考察 してい る.Edgeworth展 開 の幾何公式 は Amari and Kumon(1983)に よって与 え
られてい る
.
Le Cam(1970)は 分布族 の正則性 につ いて解析的 に厳密 に考察 してい る.超 有効性 の問題 の
一解決 は Inagaki(1970)に よって与 えられた.こ の方向 をまとめた ものに Lauritzen(1988),
Torgerson(1991)が ある
.
2.3 その他 の漸近的性質
統計 曲率 のその他 の応用 は次 に挙 げ られ る.検 定 の漸近理論 にお い て Kumon and Amari
(1983)は 1次 ,2次 有効 な検定 の 3次 検 出力損失関数 を統計曲率 を用 いて具体的 に示 したe Le
Cam(1964)の 提案 した推定量 Tの 欠損量 は Skogaard(1985)に よって
lim″
→
∞
%supβ {鳥 (3)-2(3)}2≦ ィ
と表 された.こ こで 鳥 はXの 確率測度 ,Aは Tの 誘導す る確率測度 とす る.欠 損量 のよ り高度
な研究 は Akahira(1986)を 参照 されたい。Fu(1982)は 統計 曲率 の役割 を大偏差解析 による
推定の研究の中で次の形で明示 した
.
limε
-110g P{‖
→
Oε
4{β
(θ ,ε )一
β(T,ε }≧ (1/8)γ :
T一 θ‖2>ε },β (T,ε )=in/a椰 2(θ *,θ
2>ε
T一 θ‖
}.上 の 不
等 式 の 等 号 は Tが 最 尤 推 定 量 の と き成 立 す る,Fu and Kass(1984)も 参 照 .Eguchi(1984)
こ こ で B(θ ,ε )=lim π
):‖
は,回 帰 分 析 に お け る残 差 平 方 和 を上 の モ デ ル″ へ 拡 張 し,推 定 量 Tに 対 して″ の 余 次 元 が /
の とき
,
273
統計 的推測理論 の現状
1imπ
2_/≧
la10И
の И)― (1/2〉 り )0′ )〉
く
→
∞
π
Eθ ‖
π一η
(r)‖
(1/2)γ :一 Gげ
),(3/2〉 り α
(″
が成立 し,等 号 はや はりTが 最尤推定量 の とき成立す る.推 定 された残差 の最小化 によって得
られ る重 み付 け最小 自乗推定量 が提案 され極限損失 の計算 と集団遺伝学 の問題 に適用 された
(Eguchi(1986,1990)参 照).こ れ らの 3つ の不等式 は Raoや 竹 内 と赤平 によって工夫 された
バ イアス修正 の操作 が必要ない.こ れ は尺度 その ものがパ ラメータ効果 がないか らだ と思われ
る.EfrOn(1982)に 関連 した考察 が見 られ る.最 尤法 はパ ラメー タ推定 としてで はな くパ ラメ
ー タによって指定 された確率密度関数 の決定 (サ マ リー と呼 ばれ る)に 最適性 が あると云 う主
張 で ある.統 計 モ デル の中で最 も自然 と思われ る正規分布 の平均 パ ラメータの推定 にお いてさ
え も平均 自乗誤差 を損失 とす るとき最尤法推定量 は最適 でない.こ の様 な Stein現 象 は前章 を
参照
.
最尤推定値 θを求めるためのFisherス コアアルゴリズムはスコア関数をS(θ )と すると
き,反 復列 {仇 }た が初期値 aか ら仇+1=att」 -1(a)S(a)(ヵ =o,1,… )と 定められる.こ のとき
,
饉
∝ γ′
が成立する (Kass(1984),Eguchi(1985)参 照)。 最尤推定値 を求めるもう一つの Dempster,
Laird and Rubin(1977)に よる E″ アルゴ リズム は収束 は遅 いが大域収東性 を持 つ方法 とし
て有力である.最 尤推定値の存在性の考察 は Nakamura(1991)に ある。
Cox and Reid(1987)は パ ラメータ直交性 から近似条件付 き推測 の構成 を議論 している.条
件付 き推測の興味ある考察は YanagimOtO(1989)に ある.BarndOrff‐ Nielsen(1986a,b)は
条件付 き推測 に対 してもう一つの微分幾何的方法 を考えた。Riemann計 量 として Fisher情 報
量ではな くて観測値 に依存 した Fisher情 報量 を採用 した.即 ち,最 尤推定量 ′と漸近補助統計
量 αが存在 して観測 Fisher情 報量が 3′ (θ ,α )と 書ける とき計量の成分を θ(θ )≡ Sθ (θ ,α )に
よつて定義 した.こ れによ り観測値 に依存 した線型接続が定義 され,BarndOrr‐ Nielsen and
Cox(1979)で 得 られた最尤推定量の条件付 き密度関数の公式
夕(∂ )lα ,θ )=(t(θ )ん (′ )
(2.1)
が 拡 張 され た。 Efron and Hinkley(1978)及 びサ ドル ポイ ン ト法 との 関連 は Reid(1988)に
議論 され て い る.こ れ は ロ ケイ シ ョンモ デ ル にお け る Fisherの 公 式 の拡 張 に成 功 して い る.更
に BarndOrff_Nielsen,Bhsild and Eriksen(1989)は 変換 モ デ ル に対 して この枠組 の 中 で Lie
群論 を展 開 してい る.
Bartlett(1937)は 対数尤度比検定において帰無仮説の下での尤度比統計量の χ2分 布の近似
の為に定数倍する補正を提案した.そ れにより尤度比統計量の仮説の下での分布が 1ル のオー
ダーまで χ2分 布 に一致できる.こ の Bartlett補 正についてVos(1989)は 幾何的理論を展開 し
た.関 連文献に Barndorff‐ Nielsen and Cox(1984)が ある
.
2。
4
幾何 的 ア プ ロー チの 最近 の 展 開 につ い て
Fisherの 直観 を解 く有力 な鍵 は “幾何 的 アプ ロー チ "で はあ ったが ,あ る意味 で既 に予告 さ
れ てい るス トー リー を再解釈 した に過 ぎな い とい う批 判 もあ るだ ろう.し か しなが ら,1980年
代 後 半 か らこの方法論 が 漸近理論 の枠 を超 えて新 しい広 が りを見 せ るよ うにな った.ア メ リカ
数理統計 協会 が “統計科学 "と い うキ ー ワー ドと共 に新雑誌 を刊 行 した 同時期 で あ る.こ の微
分幾何 的展 開 に は二 つ の 方向が あ る :一 つ は新 しい幾何学 の建 設 を目指 す方 向 ,も う一 つ は方
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
法論 の対象 を統計学 に留 まらず数理諸分野 へ飛躍す る方向である。勿論 この内 なる方向 と外 な
る方向 は表裏一体 で数理統計 と離別 した ものでな く,よ り広 い翼 の統計科学 に含 まれ ると思わ
れる
.
前者 の方向 の萌芽 は Nagaoka and Amari(1982)に 見 られ る.そ れに刺激 を受 けた Laurit―
zen(1987)は 現代微分幾何 の コー ディネイ トフ リーの言葉 によって双対線型接続 を研究 した。
ア*)/2が に関する計量
アとア*を 平均接続
の
それはRiemann空 間 (〃 ,g)上 線型接続
θ
(/十
y,Z)が
y―
χ ,y,Zに 関
/姜
接続 にな る時 ,双 対 的 で あ る と呼 び,更 に T(X,y,Z)三 θ(7χ
*に 関す る Riemann曲 率 テ
して対称 で あ る とき (″ ,g,の を統計 多様 体 と呼 んだ.ア と ア
ン ソル をRと R*と す る とき
,
θ(R(X,y)z,7)=θ (Z,R*(y,X)7)
が成 立 す る こ とよ り″ の R平 坦 と R*平 坦 の 同値性 が示 され た.Lauritzenは
件を提出した.Amari(1985)は
R=R*の
同値条
R― 平坦な区間″上にLegendre変 換 :φ (η )≡ infθ {ι θ
η一蠍 θ))
か ら作 られ るダイバ ー ジ ェンス関数 Dに 関 して ピタ ゴラスの定理 を証明 した.即 ち,″上の三
点 夕,2,γ に対 して 夕か ら cへ 結 ぶ /― 測地線 とγか ら αへ結 ぶ ア*― 測地線 が点 αで θの意味
で直角 に交わ る時
,
D(夕 ,c)十 D(2,γ )=D(夕 ,γ )
となる.こ の様 に R― 平坦 な空 間〃 上 に双対 Euclid的 世界像 が連想 され る.こ れが Fisherプ ロ
グラムの “
十分性 "か ら派生 した指数型分布族 の数学的拡張 である.実 は R― 平坦な空間〃 を純
粋 に幾何的 な発想 か ら Shima(1976,1980,1986)は Hessian多 様体 と呼 んだ.実 際,″ 上で
θの成分 は座標 系 θと ηで各 々, ψ(θ )と φ(η )の Hessianで 表 され る./と θに対 す る La‐
placianと 自己共役な楕円型微分作要素 の関係 が明か にされてい る.ま た Kurose(1990)は ア
フ ァイ ン微分幾何 の立場 か ら双対接続 ア とア*を 研究 した.Eguchi(1985,1992)は 多様体上
の コ ン トラス ト関数 が,自 然 に計量 と双 対接続 を生 成 す る こ とを示 し,更 に反対称 部分 が
Riemann曲 率 となるテンソルの双対対称性 を研究 した。野水 も共同研究 の中で双対接続の考察
を始 めた (Nomizu and Pikall(1987)と Dilen,Nomizu and Vranken(1990)参 照 ).
Bamdorf‐ Nielsenの 研究 グ ループ の一 連 の論文活動 は条件付 き原理 か ら見 い 出 され た計
量 ,共 変微分 ,高 次微分の数学的性 質 を抽 出す る ことに成功 してい る。Barndor“ ‐
Nielsen and
Blasild(1987),Barndorff‐ Nielsen and Jupp(1988),Barndorff―
Nielsen and Blasild(1988),
Nielsen, Blasild and Eriksen (1989), BarndOrff‐ Nielsen and Jupp (1989),
‐
Barndor“ Nielsen(1990),Bttsild(1991)等 ,精 力的 な研究 がなされている.彼 らは微分 ス
トリング,不 変 Taylor展 開 な ど統計的推測 の応用 に現れ た数学的側面 を更 に抽象的 に考 え,ヨ
Barndorff‐
ー ク幾何 と呼 んで い る
.
この様 に統計的推測 を対称 にして生 まれた “幾何的 アプ ロー チ"は Riemann幾 何学 を超 えて
双対性 が本質的 な役割 を果 たす新 しい幾何学 に発展す る兆 しが見 えつつ ある.こ れ は数理物理
学 の世界 か ら眺 めれば 自然 な方 向 と思われる。Newton,Gauss,Einsteinの 例 を挙 げるまで も
な く数学 と物理学 は交互 に刺激 し,培 い合 った長 い歴史 が あ り,現 代 も数学 の一大主流 をな し
てい る。この 50年 近 く経 て Fisher予 想 の解決,統 計的推測論 の理解 に有効 だった方法論 が数学
的 に も興味 あるものを提供 す る と考 えておか し くない だ ろう.少 な くとも 1980年 代 まで幾何学
者 が全 く気 がつかなかった微分可能多様体 の豊 富 な例 に “
統計 モ デル"或 は “
統計 パ ラメー タ"
が ある ことは云 えるだろう
.
もう一 つの方向 は幾何化 の対象 の拡大 にある.最 初 に挙 げられ るのは上の流れ とは独立 に進
275
統計的推測理論の現状
め られ た Akin(1979,1982,1990)の 集 団遺伝 学 の幾何 化 が あ る.彼 は Shashahani(1979)
が提 案 した計量 に よって生 物 集 団 の多形性 ,性 比 ,適 応 度 ,エ ピス タ シス な ど世代 に関 す る生
物集団 の力学系の理論 を展 開 してい る.力 学系 を記述す るベ ク トル場 が Shashahani計 量 に関
す るグラジ ェン ト場 でな い とき Hopf分 岐 が起 こることを証 明 し進化ゲ ーム論 を展 開 して い
る。ところで,こ の計量 は多項分布 の Fisher計 量 その ものである.こ の様 に Fisherが 息吹 を与
えた統計学 と集団遺伝学 が独立 に幾何化 された ことは興味深 い
.
甘利 は共 同研 究 を通 し,脳 の神経 回路網 の機構 を微分 幾何 の方法 で挑戦 して い る.Boltz‐
mannマ シンの成 す多 様体 に双対 平 坦 性 が 自然 に導入 され て い る (Amari(1990),Amari
(1991),Amari,Kurata and Nagaoka(1992)Amari,Fuiita and sinomotoを 参照。)こ の研
究 に先駆 けて シス テム制御理論 と多元情報 コー ド理論の幾何化 に も成功 を収 めてい る (Amari
(1987,1989)と Amari and Han(1989),関 連す る文献 は Ravishanker,Melnick and Tsai
(1990)を 参照).
2.5
よ, オ)り に
この 60年 の歩 みの中で科学 は目 まぐるしい進展 を遂 げた.例 えば,Fisherた ちによって創 ら
れた集団遺伝学 の中で は遺伝子 とは単 なる数学的な記号 (■ ,3,… )に 過 ぎなかった.現 代 の
生物学 による と遺伝子 は塩基対配列 の化学物質 として観測 で きる.そ の 1次 構造 は各生物種 に
ついて Gen Bank,EMBLな どのデー タバ ンクか ら手軽 に利用 で きる時代 で ある.ア メ リカで
は ヒ トの全遺伝情報 を解析 す る計画
(HGP)が 国家的事業 として進 め られて い る。 Neyman
(1971)は 早 くか ら DNA列 の統計解析 の重 要性 を訴 えて い る。もしFisherな らばどんな解析 を
してい ただろ うか ? Flesenstein(1983)や Kishino and Hasegawa(1989)に よって進化系
統樹 の最尤法 が精力的 に研究 されている
気象学 か ら端 を発 したカオス理論 ,フ ラクタル次元論 ,フ ァジー推論 な ど統計科学の展 開 に
有力 なアプロー チが近 年盛 んに研究 され,我 々が解析 で きる現象が拡大 されつつ ある (カ オス
.
の統計的予測,制 御 に関 しては Casdagi(1992)な どェ Rtt S″ 麻ム助 ε
.の 第 54巻 に特集 を
フラ クタル次元 の推定 は Taylor and Taylor(1991),フ ァジー推論 は Toley and MantOn
,
(1992)な どを参照).
現代 にお ける統計学 の 目指す べ き方向 は科学 としての統計学 が ある と割 り切 る こ とに よっ
て,不 毛 な思想的な対立,極 端 な までの 自己完結性 の追求 ,そ の有用性 との葛藤 か ら飛躍 で き
るので はないか と思われ る.統計学会の会報 No.73に おいて竹 内啓氏が環境問題 について随筆
で述 べ た様 に,21世 紀 を迎 えつつ ある現代 の環境問題 は限 りな く地球惑星 その もの,或 はその
物質循環 の トー タル システム の構造 の同定 が解決 を急 ぐ大 きな問題 となってい ると思われる
このテーマ に対 して統計学 の貢献 が正 否 の鍵 を握 ってい るで はないだろ うか
.
.
謝辞 :査 読者 の有益 な コメ ン トに感謝 します
.
f+*ffi
Akahira. M. (1986) . The structure of asymptotic defi.ciency of estimators. Queen's Papers in pure
and Applied Math. 75, Queen's University Press, Kingston.
Akahira. M. and K. Takeuchi (1981) . Asymptoti.c efficienq of statistical estimators : Concepts and
higher order asymrttofic fficienqt. Lec. Note in Statist. Z, Springer-Varlag, New york.
Akin, E. (1979) . The geometry of PoPutation genetics. Lec. Note in Biomathematics 31, SpringerVarlag, New York.
Akin, E. (1982). Exponential families and game dynamics. Can. J. Math. 94,374-405.
276
日 本 統 計 学 会 誌
第
22巻 第 3号
(増 刊 号 )1993
[5] Akin,E。 (1990). The differential geometry of population genetics and evolutionary games. In
ηお げ ιυο滋″θηαη ttι οη ",ed.S.Lessard,NATO
α′ル υθ
′
πα″ ′απグ s″ 法 ″ε
物厖ι
″ πι
“
Series, 1-93.
i`ル
ASI
[6]Amari,S.(1982).Differential geometry of curved exponential families‐ Curvatures and informa―
ti6n loss. 4%π .S滋 ″sム 10,357-385.
[7]Amari,S.(1982).Geometrical theory of asymptotic anCillarity and conditional inference.
I〕 Jο 22zι
ι
れたα69, 1-17.
″
[8]Amari,S.(1985).瑚Q″ 燿物′
「gι θπθ
Varlag,New York.
J
“
πθttθ お 物 s滋 麻 ″ .Lec.Note in Statist.28,Springer‐
“
[9]Amari,S.(1987).Differential geometry of a parametric family of invertible linear systems‐
Riemannian metric,dual afnne connections and divergence.
Mα
′
あ.
夕
2z
Sys′ θ
[10]Amari,S.(1987).Differential geometrical theory of statistics.In鋤
7物 θ
θ..20,53-82.
η
″η″α′Gι οttθ ′
η ″
S歳麻 ″ ′′
ィルππ″,IMS,1994,California,
“
[11]Amari,S.(1989).Fisher information under restriction of ShannOn information in multiterminal
力.41623-648.
situations. 42η .Iπ sた S滋 ″si Mα″
[12]Amari,S.(1990).Mathematical foundations of neuro computingo Pη a rEEE 78,1443-1463.
[13]Amari,S.(1991).Dualistic geometry of the manifold of higher‐ order neurons.Nttπ JハワJttθ ″
4, 443-451.
[14]Amari,S.and Kumon,M.(1983).Differential geometry of Edgeworth expansion in curved
exponential fanlily.
スππ.
Iη sム
乃.35,1-24.
Sた ″sム Mα′
[15]Amari,S.and Kumon,M.(1988).Estimation in the presence of ininitely many nuisance
parameters‐ Geometry of estilnating functions. 24%π
[16]Amari,S.and Han,T.S.(1989)。
′
.S滋 ′
sム 16,1044-1068.
Statistical inference under multi‐ terminal rate restrictions‐
A
ι
οη 35,217-227.
differential geometric approach.」彊EE τzη s.Iψ ‰ ηち
[17]Amari,S.Kurata,K.and Nagaoka,H。
(1992).Informatiott geometry of Boltzmann machines,
IEEE 71γ απs. Neπ π′Nc虎〃ο″ 3,260-271.
%滋 ″οη 4,605
[18]Amari,S.,Fuiita,N.and SinOttOtO,s.Four types of learning curves.」 Ⅵ7π π′Cο 夕
″〉
-618.
[19] BarndOrff‐ Nielsen O.E.(1986a).Inference on fu1l or partial pararneters based on the standard‐
,唸 々
ized signed log likelihood ratio. Bto,7z″ ′
α73,307-322.
[20] Barndorff― Nielsen o.E.(1986b).Likelihood and observed geometris.4%η
o S滋 ″sム 14,856-873.
[21]Barndorff‐ Nielsen O.E.(1986c).Strings,tensOrial combinants,and Bartlett adiuStments.Pη
R9夕.Sθ θ
.五 οπグθπ 4 406,127-137.
[22] Barndorff‐
ε
Nielsen O.E.,Cox D.R.and Reid,N.(1986).The role Of differential geometry in
statistical theory.
Iη i Stガ sA Rι υ. 54,83-96
[23] Barndorff‐ Nielsen O.E.and Cox,D.R.(1979).Edgeworth and saddlepoint approxirnations with
statistical applications(with Discussion)。 工 Rり 。S滋 ″Sム Sθ ε.B41,279-312.
[24] Barndorff‐ Nielsen O.E.and Cox,D.R.(1984).Bartlett adiustments to likelihood ratio statistic
Ro S滋 ガsた Sθ θ.B46,483-495.
and the distribution of the maximum Hkelihood estimator.工
[25] Barndorff‐ Nielsen O.E.and Blasild,P,(1987).Strings:mathernatical theory and statistical
examples.PЮ θ.R9ノ .Sθ θ.ι θπJο η A 411,155-176.
[26] Barndorff‐ Nielsen O.E.and Blasild,P。
Rο ノ
.Sθ θ
.Lθ πグθπ A 411,421-444.
[27] Barndorff‐ Nielsen O. E. and Jupp, P.E。
(1987).Derivative strings i contravariant aspects.Pγ oθ
(1988). Differential geometry, proflle likelihood, L―
Aπ η. S協″sた 16,1009-1043.
sumciency and composite transformation models.
[28] Barndorff‐ Nielsen O.E.and Blasild,P.(1988).StringS:mathematical theory and statistical
examples.%ε R9ノ .Sθ θ.五 θπ″οπ A 411,155-176.
″θπ αηグ fπ υ
απαη
[29] Barndorff_Nielsen O.E。 ,Blasild,P.and Eriksen P.R。 (1989).Dι εθ綱沙 ′
πι ππs αηグ S滋麻 虎cα ′′
πηs/aη ηα″οπ ποαθ
“
York.
Js・
グ
“
“
.Lec.Note in Statist.58,Springer_Varlag,New
[30] Barndorff‐ Nielsen O.E.,(1990).Approximate interval probabilities.ェ
R.S″ 滅,A
Sο
ε.B52,485
-496.
[31] Barndorff‐ Nielsen O.E.,(1991). Modifled signed log likelihood ratio.
β′
θπι′
π々α78,557-563.
277
統 計 的推 測 理 論 の現状
[32]Blasild,P.(1991).Yokes and Tensors derived from yokes.4%η
.Iη si S滋 減sた 動し厖.43,95-113.
[33]Casdagi,M.(1992).Chaos and deterministic versus non‐ linear modeling.工 Rの .S滋 法 たま,a54,
303-328.
[34] Cox,Do R.and Reid,N.(1987).Pararneter orthogonality and approximate conditional inference
(with Discussion).工 Ro S滋 ″si
Sο ε.B49,1-39.
[35]Cook,R.D.(1986).Assessment of local innuence.(with DiscussiOn)。
工 R.S滋 麻 ムSθ ε.B48,133
-169.
[36]Dempster,A.P.,Laird,N.M.and Rubin,D.B.(1977) Maximum likelihood from incomplete data
via the EM algorithm(with DiscussiOn),工
R.Sι α″
なム Sθ θ.B39,1-38.
[37] Dilen,F.,Nomizu,K.and Vrankeni L.(1990).Coniugate cOnnections and Radon's theorem in
amne diferential geometry.Zθ ηαおグ フ ル物滋.109,221235.
[38] Efron,B.(1975).Deining the curvature of a statistical problem.4η π.Stα ′
お13,1189-1242.
[39]Efron,B。 (1982).Maximum likelihood and decision theory.五 ππ.S滋 ″sム 10,340-356.
[40]Efron,B.and Hinkley,D.V.(1978).Assessing the accuracy of the maximum likelihoOd
estimator:Observed vs.expected Fisher inforlnation,(with Discussion)Bう oπθ′
れた ,65,457-487.
[41]Eguchi,S(1983).Second Order emciency of minimum contrast estimators in a curved exponential
family. 24 ππ.Stα ″sた 11,793-803.
[42] Eguchi,S (1984). A characterization of second order efnciency in a curved exponential faFnily.
五ηπ.レ sた S滋″sl Mαι
λ.36A,199-206.
[43] Eguchi,S(1985). A differential geometric approach to statisticalinference on the basis on contrast
functionals.H′ ηsあ Jπ αェ 昴イα物.,341-391.
[44] Eguchi,S(1986).A proieCtion method of estimation for a subfamily of expOnential families.
4π π.助 Sl S滋 麻 ム 滋 z厖 .38A,389-398.
[45] Eguchi,S,and M.Matsuura(1990).Testing the Hardy‐
Weinberg equilibrium in the HLA system.
B=o,η ι
カヴε
s 46, 415-426.
[46]Eguchi,S.(1992).Geometry of minimum cOntrast.I′ ηsλ ′
παェ Zα ル.22,631-647.
[47]Fisher,R.A。 (1925).Theory of statistical estimation.Pη θ.Cα πみえ砲 0彫 ′
お.助 θ
.22,700-725.
[48]Fisher,R.A.(1934).TwO new properties of mathematical likelihood.Pγ
οθ
.R.Sθ θ.A144,285-
307.
[49] Flesenstein,J.(1983).Statistical lnference of phylogenies.ェ
R.S滋 グ
おム Sο ι
.A146,246-272.
[50] Fu,J.C.(1982). Large sample point estimation:A large deviation theory approach.
∠πη.Stα ″sム
10, 762-777.
[51] Fu,J.C.and Kass,R.E.(1984). A note on the interpretation of the Bahadur bOund and the rate
of convergence of the maximulln likeHh00d estimator. S滋 ″stt Jり っろαι.Lι ′
ム2,269-273.
[52] Inagaki,N.(1970).On the limiting distribution of a sequence of estimators with unifOrmity
property.
4π η.Iη sム S協 ″sA Mα′
ん。22,1-13
[53] Karlin,S.(1992).R.A.Fisher and evolutionary theory.Stα
′
なた Sθ ′7,13-33.
[54]Kass,R.E.(1984).Canonical paramatrization and zaro parameter effect curvature.工 Rω
.
Stα″sム Sθ θ
.46,86-92
[55]Kass,R.E.(1987).Introduction.In D教 ″πttα ′Gθ ο%θ ′η
ル S滋 麻 ″6α ′′
″ヵπη″,IMS,California,
[56]Kass,R.E.(1989).The geOmetry of asymptOtic inferenceo S″ 麻 15と グ
.4,188-234.
[57]Kishino,H and Hasegawa,H(1989).EvaluatiOn of the maximum likelihood estimate of the
evolutiOnary tree topologies frOm E)NA sequence data,and the branching order in Horninoidea.
ェ
ЛイοムEυ θ洗29, 170-179.
[58]Korose T.(1990).Dual connectiOns and amne geometry.動 し厖.Z203,115-121.
[59]Kumon,M.and Amari,S.(1983).Geometrical theory of higher‐
estilnator and cOnditional inference.
Jり っθ
. R. SOε .
order asymptotics of test,interval
Lθ πJθ %A387,429-458.
[60]Kumon,M.and Amari,S.(1984).Estimation of structural parameter in the presence of a large
number of nuisance parameters.
B=02ι ′
力乃α71,445-459.
[61]Le Cam,L.(1964).Sumciency and appro対 mate sufnciency.五
πη.物 ル.S滋 麻 ム 35,1419-1455.
[62]Le Cam,L.(1970).On the assumption used to prOve asymptotic normality of ma対 mum likelih00d
estilnates. 4η ηo Mα ′
λ.S協″sA 41,802-828.
[63] Lessard,S.(1989).Resource a1location in Mendelian populations:Further in ESS theOry.In
278
第 22巻
日本 統 計 学 会 誌
第 3号 (増 刊号 )1993
Mα′
λι
,7zα ttcα ′ι
υοJπ ″θπαηソ′
λι
θηソ
,197-246. Princeton Univ.Press,Princeton.
(1987).Statistical manifolds.In Iカル″ππα′Gθ θπι′
ηル″π″
η ル S滋 法″ ′′
[64]Lauritzen,S.L。
,
“
IⅣ IS,California,163-216.
[65]Lauritzen,S.L.(1988).蹄eπ αι力π′θS απグsys姥 %sげ
J′
49,Springer‐ Varlag,New
sttC力π′S滋 麻′
′
as.Lec.Note in Statist.
York.
[66]Nagaoka and Amari(1982).Differential geometry of smooth families of prObability distributions,
ル角E7R82-7,Univ.Tokyo.
[67]Nakamura,T。
(1991).E対 stence of ma対 mum likelihood estimates for lnterval‐ censored data
Rり ,S″ 麻ム助 θ.53,211-22.
from some three‐ parameter models with shifted origins.メ
[68]Neyman,J.(1971).Molecular studies of evolution i a source of novel statistical problems.In
S滋 法″ι
αιαθ
ε
おグ
οπttι θη α%グ π滋″グ ι
ε
S,ed.S,Guputa,1-27,Academic Press,New York.
″′
[69]Nomizu,K.and Pikall,O。 (1987).On the geOmetry of amne immersions.腕 ル.Z.195,165-178.
[70]Okamoto,I.,Amari,S.and Takeuchi,K。 (1991).Asymptotic theory of sequential estimation:
Differential geometric approach. 4η η.
[71]Pfanzagl,J.(1985),4り ″ わ″
S滋 ″sl 19,961-981.
η′S滋 麻″6α ′ποルお.Lec.Note in Statist.31,
%ρ α%Sあ η力 γttπ ι
Springer_Varlag,New York.
ηsι πゎαz%ι ι
πθ πθルお.Lec.Note in statist.63,Springer‐
[72]Pfanzagl,J.(1990).Es″ παガθη ′
Varlag,New York.
[73]Rao,C.R.(1961).Asymptotic emciency and limiting information.PЮ
MatL.Sね ガsム 物 b..1,531-545.
θ
.Д ,夕 ″乃 Bο ″ι′
の 3´
.
[74]Rao,C.R.(1962).Emcient estimates and Optimum inference procedures in large samples(with
discussion)。
ェ Rり 。S滋 漱,A
、
Sθ θ
.B24,46-72.
[75]Rao,C.R.(1963).Criteria of estimation in large samples.&ν π初 25,189-206.
[76]Ra宙 shanker,N.,Ⅳ Ielnick,E.L.and Tsai,C‐ L.(1990).Differential geometry of ARMA models.
s 4π αl ll,259-274.
工 ππι助 ガι
[77] Reid,N.(1988).Saddlepoint methOds and statistical inference.S勉 ″sA Sθ′
.,3,213-237.
[78]Shima,H.(1976).Symmetric spaces with invariant locally Hessian structures.工
施 厖.助 ε
.
ノ″ραη29,581-589・
[79]Shima,H.(1980).HomogeneOus Hessian manifolds.4%π .レs′ .長 ,%π θγ30,91-128.
[80]Shima,H.(1986).Vanishing theorems for compact Hessian manifolds.4π 2.Lsi Fθ ππθγ36,
183-205。
[81]Skogaard,I.M.(1985).A second‐ order investigation of asymptotic ancillarity.4π
πo
S滋 麻113,
534-551.
[82]Toley,D.H.and Manton K.G.(1992).Large sample properties of a discrete grade of membership
model. ィ
4η %.fη sた S協″sム Mαι
λ.44,85-95.
[83]TorgersOn,E.(1991).Comparison of statistical experiments.Encyclopedia of Mathematics and
its Applications,Cambridge.
[84] Taylor,c.C.and Taylor,S.J.(1991).Estimating the dimension of a fractal.ェ
Rり .S滋 ″sム
Sθ θ
.
53, 353-364.
[85] Vos, P.(1989). Fundamental equations for statistical submanifolds with applications tO the
bartlett correction. ィ
4π %. Iη sム Sttz″ sム Mαオ
カ.41,429-450.
[86]YanagimotO,T。 (1991).Estimating a model thrOugh the conditional MLE.4π π.レ 豆 s滋 麻ム
』イα′
λ. 43, 735-746.
統計的推測理論 の現状
3.検 定 論 の 最 近 の 展 開
3.1 は じ め に
ここでの 目的 は検定論 の最近 の研究 を概観す ることである.検 定論 は推定論 と並 んで数理統
計学 の中心的 な課題 で あ り,全 体 を詳細 に把握す る ことは困難 で あるので,以 下 で は国際的 に
重要 と思われ る事項 について触れ る とともに,日 本人 の業績 に重点 をお いて検定論 を概観する
.
統計的決定理論 の観点 か らの検定論 の理論 の枠組 みは Lttmann(1959)の 教科書 に代表 され
るように 1950年 代 に確立 された.こ の意味 で は検定理論のそれ以 降 の発展 は 50年 代 に確立 さ
れた枠組 みの中での精緻化 と言 って よい.実 際,検 定 の一 般理論 に関す る最近 の文献 はあまり
多 くない.し か しい くつか の分野 で は,検 定論 が活発 に研究 されてい る。例 えば分布 の適合度
検定,ノ ンパ ラメ トリック検定,多 変量解析 な どの分野 である.ま た,検 定 における漸近理論
の発展 も注 目され る.第 2章 で概観 されてい るように漸近理論 は主に推定論 において発展 した
ものであるが,漸 近理論 の道具 となる漸近展開 の手法 は検定論 の研究 にも有用 で ある.た だし
推定論 と比較 して見 ると,検 定論 にお ける漸近理論 の結論 は推定論 におけるほ ど明快 な もので
はない と思われ る
.
検定 の一般理論 の研究 が あま りさかんでない一つ の理 由 として,伝 統的 な検定 の考 え方 に対
す る疑間が あげられ る.伝 統的 な検定論 の枠組 みで は,第 1種 の過誤 と第 2種 の過誤が非対称
的 に扱われ て い る.ま た帰無仮説 も非常 に明確 に定義 された ものでなければな らない.こ のよ
うな検定 の考 え方 は非現実的 で ある として,検定 の問題 をより広 くモ デル選択 の問題 と考 える
立場 が有力 にな りつつ ある.モ デル選択 の問題 は多方面 で論 じられていることもあ り,こ こで
はモ デル選択の問題 にはこれ以上触れない.た だ し例 えば適合度検定 は,伝 統的な検定 とい う
よ りはモ デル選択 の方法 とい う側面が強 くモ デル選択 の考 え方 に近 い もの と言 う こと もで き
る。
以下 で は,検 定 の一般理論 について述 べ た後 ,不 変検定 ,順 序制約下 での検定 ,尤 度比検定
等 の漸近理論 ,適 合度検定 につ いて述 べ る。多変量解析 につ い ては別稿 にゆず り,ノ ンパ ラメ
トリック検定 に関 して もスペ ース等 の関係 で以 下 で は省略す る
.
3.2 検定 の一般理論
検定 の一般論 に関 しては現在 で も Lehmannの 教科書 (第 2版 :Lehmann(1986))が 最 もま
とまった ものであると思われる。1959年 の第 1版 と比較 して第 2版 は 2倍 近 くの厚 さとな りこ
の間 の検定論 の発展 を裏づ けてい るが,内 容 を比 較 して見 ると検定論 の枠組 みはほ とん ど変化
してお らず,個 別的 な内容 の充実 が主である.第 2版 で追加 された部分 として は,Lehmann自
身 の貢献 を多 く含 むノ ンパ ラメ トリック検定 の分野 の諸結果 ,多 変量線形 モ デル に関す る 1章
,
及び補助 統計量 (ancillary)に 基 づ く条件 つ き推測 に関する最終章があげ られ る.ノ ンパ ラメ
トリック検定及 び多変量線形 モ デル の分野 で は,60年 代 70年 代 を通 じて様 々の検定 の性質 が
一般的な検定論 の枠組 みの中で詳 し く調 べ られて来 てお り,そ れ らの結果 が盛 り込 まれてい る
.
統計量 スの分布 が関心 の あるパ ラメー タに依存 しない時 4を 補助統計量 とい う.補 助統計量が
存在す る場合 には,統 計的推測 を補助統計量 を与 えた時の条件 つ き分布 に基 づいて行 うべ きだ
とす る条件 つ き推測 の基準 はある程度 の説得性 を持 っているが,こ れを支持す る決定論的観点
か らの明快 な結果 は得 られていない よ うに思われ る.漸 近理論 の枠組みで は,第 2章 に触れ ら
れてい るように漸近的な補助 統計量 に基 づ く条件 つ き推測 の理論 が発展 しつつ ある
.
決定理論 の観点 か らの検定論 の基礎的研究 として Brown,Marden,Perlman,Cohenら の継
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
続的 な研究 (Marden(1982a,b),Cohen and Sackrowitz(1987),Brown and Marden(1989),
'Cohen and Marden(1989),Marden and Perlman(1990)等 )が 注 目され る.彼 らは,許容的
な決定方式 がベ イズ決定方式 の (汎 弱位相 に関す る)極 限 として得 られ る とい う一般的結果 を
応用す ることによって,様 々 な検定問題 について検定関数 の完全類 を与 えてい る.こ れにより
多 くの検定 の許容性 を示す とともに,い くつかの よ く知 られた検定 について はそれ らが非許容
的 で ある ことを示 してい る.非 許容性 の結果 は興味深 い.ま た検定 の不偏性 について も考察 し
ている。Marden(1982a)で は同一 の仮説 につ き複数 (η 個 )の 独立 な検定結果 が得 られ る場
合 に,各 検定 にお いて観測 された有意水準 (タ ー
=1,… ,π ,を 総合す る検定方式 の許容
値)沙 らグ
性 を議論 して い る.そ して例 えば -2Σ log p2・ を自由度 2π のカイニ乗分布 と比較 す る Fisher
の方式 が許容的 で ある ことを示 してい る.Cohen and Sackrowitz(1987)は 複数 (力 個 )の 母
集団 において対応す る母数 の が等 しい (島 :α =… =a)こ とを検定す る力標本 の等値性 の検定
の不偏性 を論 じ,指 数型分布族 で各母集団か らの標本数 が等 しい場合 につ いて,多 くの検定 が
不偏である ことを示 してい るeこ れ は正規分布等 に関す る個別 の結果 を一般化 した ものである
.
Cohen and Marden(1989)で は, 力個 の正規母集団の分散 の等値性 の 力標本問題 について各
母集団からの標本分散をs′ ,グ =1,… ,力 ,と する時,max s子 /Σ ずに基づ くCochranの 検定及び
max s′ /min s子 に基づ くHartleyの 検定が非許容的となることを示している
.
3.3不
変検定
検定 の不変性 は検定問題 が対称性 を持 つ場合 にしばしば前提 とされ る基準 で ある。数学的 に
は対称性 は群 の作用 とい う形で扱われ るので,不 変検定 を論 じる際 には群及 び群 の作用 にとも
な う不変測度 の概念 が用 い られ る.特 に多変量解析 の分野 で は群 の作用 として一般線形群や直
交群 な どの連続群 を考 えるので数学的 にやや高度 な議論 が必要 となる
.
多変量解析 等 で必要 とされ る不変性 の群及 び不変測度 に関す る数学的 な諸結果 は,R.A.
Wijsman,S.A.Andersson,刈 屋,M.L.Eatonな どによって整理 された。Eaton(1989)及
び Wijsman(1990)は 連続群及 び不変測度 の理論 に関する教科書 として有用 であるとともに
,
不変性 の観点 か ら様 々 な統計的問題 について整理 して議論 している.不 変検定の観点か ら特 に
重要なのは,最 大不変量 の尤度比 を密度関数の不変測 度 に関す る積分 の比 を用 い て表す Wtts‐
man(1967)の 定理 で ある.こ の定理 の導出 と証明 は Wijsman(1990),Andersson(1982),
Kariya(1985),Kariya and sinha(1988)に 与 えられて い る
.
Wijsmanの 定理 によ り最大不変量 の尤度比 が求 め らることか ら,こ れに Neyman‐ PearsOn
の補題 を応用す ることによ り最強力不変検定 を得 る こ とが考 えられ る.最 強力不変検定 は通常
対立仮説 に依存 す る.し か しなが ら刈屋 は,最 大不変量 の尤度比 の微係数 に対 して Neyman‐
PearsOnの 補題 を適用す ることによ り,多 変量解析 にお ける GMANOVA等 のい くつか の複雑
な検定問題 について,局 所最強力不変検定 が存在す る こ とを示 し明示的な形 で導出 した
(Kar‐
iya(1978,1981a),Eaton and Kariya(1983)等 ).局 所最強力不変検定 は,不 変検定の うちで
帰無仮 説 の近 くの対 立 仮説 に関 して最 も高 い検 出力 を持 った検 定 で あ る.GMANOVAは
MANOVA(多 変量分散分析 )の 母数 に制約 の加 わった複雑 なモデルであ り,局 所最強力検定
の よ うな最適性 を持 つ検定 が明示的 に得 られることは興味深 い.こ れ らの結果 について は Kar‐
iya(1985)で まとまった解説 が与 えられて い る
.
また刈屋 は不変検定 の方法 を用 いて「検定 の ロバ ス トネス」の問題 を系統的 に研究 してい る
すなわち正規分布 の もとで最適性 を持 つ通常 の検定 の標本分布や最適性 が,正規分布 を一般化
.
した elliptically cOntOured distribution(楕 円等高面分布 )に 関 して も保存 され るか,と い う
問題 で ある (Kariya(1981b,c),Kariya and Sinha(1985)等 )。 この うち正規分布以外で も帰
統計的推測理論 の現状
無仮説 の もとでの標本分布 が変わ らない場合 を null robustness,さ らに正規分布以外で も対立
仮説 に対 する最適性 が失われ ない場合 を nOnnull robustnessあ るい は optimality rObustness
とよんでいる.刈 屋 は elliptically contOured distributionに 関 しては非常 に多 くの場合 に null
robustnessが ,ま たい くつか のケースで は optimality robustnessが 成立する ことを示 した.検
定 の ロバ ス トネスについては Kariya and Sinha(1988)に まとまった解説 が与 えられて い る
.
不変検定 の手法 の応用 として興味深 い の は,正 規分布 の もとでの外れ値 に関す る Ferguson
(1960)の 結果 で ある.Fergusonは χ ,グ =1,… ,%が 互 い に独立 に正規分布 Ⅳ(μ ′
,ど )に 従 う時
に slippage型 の検定問題 ,す なわち対立仮説 の もとで い くつか の μJあ るい は σ子が他 の もの と
異 なるとする検定問題 ,に おいて標本歪度 と尖度 が局所最強力不変検定 となることを示 した
この Fergusonの 結果 は多変量 正規分布 の場合 (Schwager and Margolin(1982))及 び球面対
.
称分布 の場合 (Das and Sinha(1986))に 一般化 され,Mardia(1970)の 多変量尖度 に基 づ く
検定 が局所最強力不 変検定 で ある こ とが示 された.た だ し多変量 の場合 の結果 は対立仮説 の選
び方 に依存 した ものだ と思われる.Fergusonの 結果 は外 れ値 の検定 に関 してで あるが,こ れ は
正規分布 の適合度検定 の問題 とも考 えることがで きるので 3.6節 で再 びふれ る
.
3.4 順序制約下での検定
いわゆる順序制約下での検定問題 について もかな りの文献 が見 られ る.順 序制約下の検定問
題 とは,例 えば 力標本 の平均 の等値性検定 (帰 無仮説 島 :μ l=… =μ た
)で ,対 立仮説 の もとで は
平均 の大 きさの順序 が決 まって い る (対 立仮説 島 :μ l≦ …≦μた
)形 の検定問題である.対 立仮 説
として一 方向の順 序 のみ (島 :μ l≦ …≦μた
)を 考 える場合 を片側検定問題 ,両 方向の順 序 (島 :μ
≦…≦μたor μl≧ … ≧μた
)を 考 える場合 を両側検定問題 とい う.順 序制約下 の検定問題 は対立仮
説 が複数の線形不等式 によって表 わ され るよ リー 般 の凸錐 となる問題 に一般化 され る (Kudo
(1963)).す なわち対立仮説 として母数ベ ク トルが ある凸 錐 Cに 属する問題 を片側検定問題 ,C
∪(― C)に 属す る検定問題 を両側検定問題 とい う.順 序制約 の もとでは最尤推定量 や尤度比 検
定 が複雑 となるために,通 常 の検定問題 とは異 なった理論が必 要 とされ る.こ の問題 に関 して
l
は日本 か ら九州大学 のグルー プ及び東京大学 のグル‐ プの貢献 が顕著なので,以 下 で は主に こ
れ らの貢献 について紹介す る
.
序制約下での統計的推測 は Barlow,Barth01omew,Bremner and Brunk(1972)の 教科書
で分野 が確立 したが,そ の後 の発展 は Robertson,Wright and Dykstra(1988)の 教科書 にま
1頁
とめ られてい る.Robertsonら の貢献 につ いてはこの教科書 か ら知 ることがで きる.ま た広津
(1976)の 第 6章 及 び広津 (1992)の 第 3章 に も簡単 な解説 が ある
.
片側検定 問題 に関 して は Birnbaum(1955)以 来 の議論 によ り検定方式 の最小完全類 を求 め
ることがで きる (Eaton(1970),Hirotsu(1982),竹 内 (1979),Marden(1982b)参 照).広 津
(1982)に 従 って この結果 を多変量正規分布 Ⅳ(μ ,Σ )の 平均 ベ ク トル μ の検定 について述 べ れ
ば次のようになる.帰 無仮説及 び対立仮説 をそれぞれ
Jf。 :4′
′
μ=0, Jfl:ス μ≧0
とする.た だし 4′ μ≧oは 4′ μの各要素 が非負 で ある こ とを表す.″ ∼Ⅳ(μ ,Σ )と す る時
,許 容
的な検定 関数 は,そ の受容域が凸で,か つ (4′ ス) 1■ 2 1(″ 一EO(″ │ス *`″ ))の 各要素 について単
調増加 で ある.た だ し E。 は帰無仮 説 の もとで の期待 値 で あ り,4*は (4,ス *)が 正 則 か つ
ス′
24*=0と なるよ うに選ぶ。Σ=fの 場合 について述 べれば,C を 対立仮説 をなす凸錐 Cの
双対錐 とす る時,許 容的な検定関数 の受容域 は凸 で あ りか つ
CTの 内部 に向か う任意 の方向に
単調 で ある.順 序制約下での検定 につ いて は尤度比検定 をはじめい ろい ろな検定方式が提案 さ
282
日本 統 計 学 会 誌
第 22巻 第 3号
(増 刊号)1993
れてい るが,以 上 の結果 によ りこれ らの検定 の多 くは許容 的 であることが わかる.た だ し,帰
無仮説 について も順序制約 を課 した場合 には尤度上ヒ
検定 が非許容的 となる場合 のある こ とが知
られて い る (Warrack and Robertson(1984),Nomakuchi and Sakata(1987),Menё ndez
and Salvador(1991)).
順序制約下での検定方式 として よ く用 い られ るものには尤度比検定 ,Abelson‐ Tukey検 定,
田口玄一氏 による累積法 (田 口玄一 (1966)参 照 )お よびその精密化・ 一般化 で ある累積 カイ
ニ 乗検定 な どが あ る.た だ し累積 カ イニ 乗検 定 は両側検 定 問題 に適用 され る もので あ る
.
Abelson‐ Tukey検 定 はCの 中心方向 に向か う対立仮 説 に対 して高 い検 出力 を持 つ検定 で あ る.
また累積 カイニ乗検定 はCの 端辺方向 に対す るカイニ乗統計量 を各辺 につ いて累積 した もので
あ り,さ まざまな形 の対 立仮説 につい てある程度 の検 出力 を持 つ ように考 えられた検定 である。
広津,竹 内 は累積 カイニ乗検定 が実用的 で あ りまた検 出力 の観点 か らも良好 で ある ことに注
目 して,累 積 カイニ乗検定 の考 え方 を様 々 な形 に展開 してい る (Hirotsu(1978,1979,1982,
1986),Takeuchi and Hirotsu(1982)等 参照 )。 これにより累積 カイニ乗検定 の有用性 が理 論
統計家 の間 で もよ く知 られ る ところとなった.Hirotsu(1986)は 累積 カイニ乗検定統計量 の標
本分布 が 自由度 1の カイニ乗統計量 の加重和 となることを示 し,累 積 カイニ乗法 の意味 づ けを
明確 にした.ま た漸近分布 の形 が適合度検定 の一つで ある Anderson‐ Darling検 定 (3.6節 参照)
の場合 と同等 で ある とい う興 味深 い結果 も示 した
.
工藤 ,坂 田,笹 渕,野 間 口 らは特 に順序制約下の尤度比検定 に関 して多 くの結果 を出 してい
る.こ れ らの結果 の一部 は野間 口 (1992)で サ ーベ イされてい る.順 序制約下 での平均 ベ ク ト
ル の最尤推定量 は,1頁 序制約 を満 たさない推定値 を順 に加重平均 してい くPAVA(pool adia_
cent violator algorithm)と よばれ るアルゴ リズムで簡単 に求 め られ る。Sasabuchi(1980)で
は帰無仮説 が凸錐 Cの 境界 ,対 立仮説 が凸錐 Cの 内部 となる問題 について尤度比検定 を導 いて
い る。Sasabuchi et al。 (1983)で は検定問題 を複数 の多変量正規分布 の平均 ベ ク トル の
間 順序
制約 に拡張 した場合 の PAVAに よる最尤推定 を論 じてい る。 Nomakuchi and Shi(1988)で
は同 じ問題 について Abelson¨ Tukey型 の統計量 を提案 して い る
与 え られたデー タに対 して PAVAに より最尤推定 量が簡単 に計算 で きることか ら,尤 度比
.
検定統計量の値 を計算す る こ とも容易 で ある.し か しなが ら PAVAは 場合分 けを含 み,最 尤推
定量及 び尤度比検定 の標本分布 は複雑である.こ れが実用上 の尤度比検定 の欠点 となってい る。
尤度比検定統計量 χ2の 帰無仮説 の もとでの標本分布 はカ イニ 乗分布 の混合分 布 となる こ とが
知 られてお り,カ イバ ーニ乗分布 とよばれてい る.す なわち cを 自由度 プのカイニ乗分布 の累
積分布関数 とす る時,適 当な重み ωズωル 0,Σ ωづ
=1)を 用 いて帰無仮説 の もとで
P(χ 2≦
σ
JGJ(ε
)=二 ω
)
と表 わ され る.ω ゴは最尤推 定量 が 凸錐 Cの グ次元 の境 界 に落 ち る確率 に あた る
。野 間 口 (1992)
で論 じ られ てい るよ うに この重 み ωゴの計 算 が 満 足 な形 で 解 決 され て い な い こ とが
尤 度比 検 定
を用 い る際 の 障害 とな って い る.ち なみ に ωJに つ い て Σ縫0(-1)Jω ゴ
=0と い う等 式 が 成 り立
つ.こ れ は一 時 ShapirO(1987)の 予想 として話題 にな ったが
,多 面体 論 の分野 で す で に証 明 さ
れ て い た事 実 で あ った.
3.5 検 定 の漸 近理 論
ここで は検 定論 にお ける漸近 理 論 ,特 に尤度比 検 定 な どの漸近 にカ ニ
イ 乗分布 に従 う検 定
的
統計量 の漸近理論 につ い て述 べ る.帰 無仮 説 の もとで漸近 的 にカ イニ 乗 分布 に従 う検 定 として
統計的推測 理論 の現状
は,尤 度比検定 のほかに もワル ド検定 やス コア検定 が よ く用 い られ る.こ の中で尤度比検定 の
標本分布 の帰無仮説 の もとでの漸近展開が注 目を集 めて きた.他 の検定 と比較 して尤度比検定
の分布 の漸近展開が多 くの場合 に非常 に簡明 となることが知 られていた.こ の事実 は尤度比検
定統計量 のバ ー トレ ジ ト補正 とい う形で定式化 され一般的な形で示 された.こ こで はまず この
バ ー トレ ッ ト補正 について述 べ,そ の後他 の検定 との比 較 について述 べ る.検 定 の漸近理論 の
分野 で はこの他 に逐次検定 に関す る文献 や Bahadur efnciencyに 関す る文献 も見 られ るが こ
こで は省略す る
.
い ま 夕十σ次元の母数ベ ク トル θが θ=(α ,の の形の部分 ベ ク トル に分割 された とす る.た
だ し α は,次 元,の は ,次 元 とす る.こ こで αが 関心 の あるパ ラメー タであ り帰無仮説 が Jf。
:
α=00の 形 の複合帰無仮説である とす る.の は局外母数である.い まサ ンプルサイズ %の 標本
に基づ く尤度をズ θ)と し,対 数尤度を ′
(θ )=log L(θ )と 表す.対 数尤度比検定統計量の 2倍
を 4と お くと
,
ス=2(′ (∂ )― ′
(σ ))
〓
一
4
4
一動
と表わされる.た だし ∂は対立仮説のもとでの無条件の最尤推定量であり,σ =(0。 ,尻)は 帰
無仮説のもとでの最尤推定量である。帰無仮説のもとで 4の 極限分布 は自由度 夕のカイニ乗分
布であるが,こ こではスの分布の漸近展開を考える.い まスの期待値を漸近展開するとE(4)
=夕 (1+み ん)+ο(% 1)の 形 に漸近展開できる.こ こで期待値を補正して
(3。
1)
とお く.こ の補 正 をバ ー トレ ッ ト補 正 とい う.バ ー トレ ッ ト補 正 をお こなえば E(ズ)=ク
+0(% 1)と なるから,期 待値 に関する限 リカイニ乗分布 の近似がよ くなっている.と ころが こ
の補正によ り (期 待値 のみならず)分 布関数 に関 しても近似が改良されるのである.す なわち
の を自由度 夕のカイニ乗分布 の累積分布関数 とする時
P(ガ ≦σ
)=Gク (σ )+ο (% 1)
1)は
(3.2)
2)で
となるこ とが示 され る.ο (π
実際 は 0(π
ぁる (Barndorff‐ Nielsen and Hall(1988)).
この こ とを,尤 度比検定 はバ ー トレ ッ ト補 正 可能 で ある,と い う.複 合帰無仮説の場 には
(3.
合
1)式 で あの値 が局外母数の真 の値 に依存 じ b(a)と なる場合 もあるが,そ の場合 には 77の オ
ーダーの一 致推定量 を代入 して b(2)を 用 いればよい。バ ー トレ ッ ト補正後 の誤差 は % 2の
オ
ー ダー となるか らカイニ乗近似 が良好 で ある ことが期待 され る.実 際多 くの検定 について は
数
値計算 によ リバ ー トレ ッ ト補 正が有効 で ある こ とが示 されてい る.し か しなが ら,多 項分布 の
適合度 検定 の よ うな離散分布 の場 合 にはバ ー トレ ッ ト補 正 が 必 ず しも有効 で はない ことを
Frydenberg and Jensen(1989)は 指摘 して い る.尤 度上ヒ検定以外 の検定 では以上の ような期
待値 の補正 をお こなって もほ とん どの場合分布関数 の補 正 にはな らない
尤度比検定 のバ ー トレ ッ ト補 正 可能性 を一般的な形で扱 ったのは Lawley(1956)で ある
.
.し
か しなが ら,Lawleyの 計算 が非常 に複雑 で あった ことと尤度比 検定 の漸近展開 に関す る
結果
の蓄積 が少なかった ことか ら,Lawleyの 結果 にもかか わ らず 当時 はバ ー トレ ッ ト補 正が一
般
に可能であるとは認識 されなか った.そ の後 Hayakawa(1977)が 再 び膨大 な計算 を行 い
,単
純帰無仮説 (α =0)及 び指数型分布族 の 自然母数 に関す る検定 について はバ ー トレ ッ ト補正 が
可能 で あ る こ とを示 したが,一 般 の複合仮説 の場合 の証 明 に はい た らな い とした.そ の後
Hayakawa(1987)は Hayakawa(1977)の 結果 を再検討す る こ とによ り複合帰無仮 説 の場合
284
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
に もバ ー トレ ッ ト補 正 が 可能 で あ る こ とを確 認 した.ま た CordeirO(1987)も 複 合帰無仮説 の
場合 の証 明 を与 えた (Harris(1986)も 参 照 ).そ の後 Bickel and Ghosh(1990)が ベ イ ズ法
に よるバ ー トレ ッ ト補 正 可能性 の証 明 を与 え るな ど他 の証 明 も知 られ る よ うにな った.分 布 関
数 を反転 して,バ ー トレ ッ ト補 正 を Cornish― Fisher型 の確率 展 開 の形 で表 せ ば yを 自由度 夕の
カ イニ 乗分布 に従 う確 率変数 として
ス=y(1+わ ル)+ο (%
(3.3)
1)
となる.た だし二 は両辺の分布が等しいことを示す.Takeuchi and Takemura(1988)は 1
母数指数型分布族の場合について,(3.3)式 の右辺を1ル のベキに展開した時の一般項を明示
的に評価することによりBJを 多項式 とし4二 Xl+31(y)レ +L(y)滋 2+… )と cornish‐
Fisher展 開 した時 Bゴ が (グ ー1)次 の多項式 となることを示 した.31の 次数 が 0す なわち定数 で
ある ことがバ ー トレ ッ ト補 正で ある
尤度比検定 のバ ー トレ ッ ト補 正がなぜ可能 であるか は自明 な こ とではない.こ のためバ ー ト
レ ッ ト補 正 の意味 につい て い くつ かの論文 で論 じられ て い る.Barndorf‐ Nielsen and Cox
Nielsen and Cox(1979)で 得 られた漸近補助統計量 を与 えた時 の最尤
(1984)で は Bamdor∬ ‐
.
推定量 の密度関数 ((2.1)式 )の 基準化定数 σとバ ー トレ ッ ト補 正係数 (1+bル ) 1の 間 に簡単
な関係式 が成 り立 つ ことを主張 してい る.McCullagh and Cox(1986)で は尤度比検定及びそ
のバ ー トレ ッ ト補 正が母数 の変換 に関 して不変 で ある ことか ら,バ ー トレ ッ ト補 正係数 を母数
の変換 に関 して不変 な形で表現 し部分的 に幾何的な解釈 を与 えて い る
補助統計量 に基づ く条件 つ き推測 の基準 は,漸 近的な枠組 で は有意味 な結果 を導 くために有
.
用な基準 で ある と期待 されてお り,こ の観点 か ら漸近的補助統計量の構成 の問題及 び漸近的補
助統計量 を与 えた時 の条件 つ き分布 に関す る論文 が数多 く見 られ る.こ れ らについ て は Cox
(1988)が 包括的な説明 をしてい る.Cox and Reid(1987)は 関心 のある母数 が 1次 元 (夕 =1)
の場合 に通常 の尤度比 のかわ りに条件 つ き尤度上ヒを用 い る ことを提案 し,条 件 つ き尤度比 の (近
似的 な)形 を導 いた.Mukeriee and chandra(1991)は ,=1の 場合 に Cox and Reidの 条件
つ き尤度比 のバ ー トレ ッ ト補 正 を与 えて い る
.
尤度比検定 のバ ー トレ ッ ト補 正 に関連 して興味深 い トピックは標準化 された符号 つ き対数尤
度比 (standardized signed log likelihood ratio)で ある.関 心のある母 数 が 1次 元である時
γ=sgn(a― αO)ν 7
を符 号 つ き対 数尤度比 とい う. γは漸近 的 に標 準 正 規 分布 に従 う。4は バ ー トレ ッ ト補 正 に よ
って ο(% 1)の オ ー ダー まで 自由度 1の カ イニ 乗 分布 に一 致 す る ことか ら,γ も平均 と標 準偏差
1の
(の 漸近展 開 )で 標 準化 すれ ば標 準 正 規 分布 の近 似 が 改善 で きる と期待 され る.η
オー ダ ー
まで を考 えれ ば 1+み ″=E(4)=E(γ 2)=var(γ )十 (E(γ ))2と な るか らγ′
=(γ 一E(γ ))/
ν
/1+ι 滋―(E(γ ))2が 標準化 された符号つ き対数尤度上
ヒである.E(γ )は π 2の オーダーであ
l)で
る。BarndOr“ ‐
Nielsen(1986,1991)は γ′の形の統計量 について正規近似が ο
あるこ
(π
′
と,す なわちのを標準正規分布の分布関数 として P(γ ≦ε)=の (ε )+0(% 1)で あることを主張
して い る。Bamdorf‐ Nielsenの 導 出 は漸近補助 統計量 を用 い たわか りに くい もので あ り,通 常
の漸近 展 開 の手 法 に よる検 証 が 必 要 で あ る と思 われ る。1母 数指数型分布族 の場 合 につ い て は
Nishii and Yanagimoto(1991)が この主張 を確認 して い る
.
尤度比 検 定 の他 に漸近 カ イニ 乗検 定 統計 量 として よ く用 い られ る もの に はワル ドの統計量 ″
や ラオ のス コア検 定 Rが あ る.r11を フ ィ ッ シ ャー情 報行 列 Iの (1,1)ブ ロ ック,111を 」 1の
(1,1)ブ ロ ック として,こ れ らの統計量 は
統計的推測理論 の現状
″=バ a_α め
1ノ Kttl
a一
の,R→ 券 のL〈 鋼‐
券(の
で定義 され る.た だ し これ らは若干変形 されて用 い られ ることも多 い.ワ ル ド統計量 やラオの
ス コア検定 は多変量解析 の分野 や計量経済学 の分野 の数多 くの検定問題 について提案 され,こ
れ らの統計量 の漸近展開 の結果 も数多 く発表 されて い る.こ れ らの検定 を比較す るには,対 立
仮説 として ∞ntiguous alternativeす なわち 島 :α =00+″ ν
フ の形 の対立仮説 を考え Jflで の
検出力を比較する必要がある.そ の際 に帰無仮説 のもとでのサイズを必要なオーダーまでそろ
1)の
えてお く必要がある.よ り具体的 には帰無仮説 のもとでの各検定 のサイズを αtt ο
形に
(π
そろえ,そ の上で Jflの もとでの検出力の 1ル のオーダーまでの項を比較することになる.こ れ
を 3次 の検出力上ヒ
較 とい う.Kumon and Amari(1983)及 び Amari(1985)の 6章 では曲指
数族 の枠組 みで 1母 数 の場合 について,幾 何学的 な手法 を用 いて 3次 の検出力 の比較 をお こな
つた.そ の結果 は以上 の検定 の中で一様 に他 よりよい検定 はな く,検 出力 の優劣 は ′の値 に依
存する とい うものである.Eguchi(1991)も 幾何学的観点 か らの検定 の比 較 を扱 っている.一
般 の分布 族 の場 合 の 1ル7の オ ー ダ ー まで の検 出力 の比 較 は Peers(1971), Hayakawa
(1975),Harris and Peers(1980)で 扱われ て い る.ま た Mukeriee,Chandra,Joshiら は一連
の仕事 (Chandra and JOshi(1983),Mukeriee and chandra(1987),Mukeriee(1989,1990a,
1990b)等 )の 中で検 出力 の 3次 の上ヒ較 をお こなってい る.そ して ′が小 さい時 には一般 にス コ
ア検定 の検 出力 が よい ことを示 してい る。 この こ とは Amari(1985)の 枠組 みで も確認 されて
い る ことで ある
.
3.6 適合度検定
すでに述 べ たよ うに,分 布形 の適合度検定 に関 しては最近 で も多 くの文献が見 られる.例 え
ば,観 測値 が正規分布 に従 うとす る正規性 の検定 につ いて は非常 に多 くの検定方法 が提案 され
て い る.こ れ は,伝 統的 な検定論 の多 くが正規分布 の仮定 の もとに構成 されて い る ことへ の問
題意識 の現れで ある とも言 える.分 布形 の検定 の場合 には,対 立仮説 の次元 が無限次元である
こともあ り,対 立仮説 を特定 す ることが難 しい.こ のために 1母 数 の場合 の一様最強力検定 に
あたるものは存在 しない.こ の よ うな事情 もあ り正規性 の検定 について数多 くの提案がなされ
てい る.以 下 で は,主 に 1変 量正規性 の検定 を念頭 にお いて適合度検定 の研究 を概観す る.多
変量正規性 の検定 について も多 くの文献 が見 られ るが スペー スの関係 で以下で は省略す る
正規分布 に続 いて適合度検定 の対象 となるのが,信 頼性理論や生存時間解析 にお ける指数分
.
布 の仮定 で ある.指 数分布 は多 くの都合 の よい性質 をもって い るため,実 際 の分析 にお いて指
数分布 を仮定 で きるか どうかが問題 となる。生存時間解析 においては,生 存時間 の分布 がその
まま観測 されず,観 測値 が打 ち切 られ る (セ ンサ リング)こ とが多 い.セ ンサ リングの問題 は
生存時 間解析 の一 つ の主要な課題 で ある.こ のためセ ンサ リングの仮定 の もとでの適合度検定
も Biometrika,Biometrics等 の雑誌 の多 くの論文で議論 されてい る.こ れ につ いて も以下 では
省略す る
.
適合度検定 に関 して まとまった書物 として は D'Agostino and Stephens(1986)が あげ られ
る.こ の本 は論文集 の形態 を とってい るものの適合度検定 に関する教科書 と言 って もよ く,理
論応用の両面 の観点 か ら適合度検定 についての結果 をまとめてい る.ま た,適 合度検定 に用 い
られ る経験分布関数 の理論 は Shorack and Wellner(1986)の 大部 の教科書 にお いて詳細 に扱
われて い る
.
適合度検定 として最初 に考 えられる もの は,分 布 を区間 に区切 り多項分布 の確率 の検定 に帰
286
第 22巻
日本 統 計 学 会 誌
第 3号
(増 刊号)1993
着 させ るピア ソン型 のカイニ 乗適合度検 定 であ ろう.こ れ に関す る漸近 理論 は Moore and
Spruill(1975)に 整理 されて い るが,そ れ以降 の進展 は大 きな ものではない.特 に,検 出力 を
考慮 した時 に,区 間 や 区間数 をどのように とつたらよいか とい う簡単 か つ重要な問題 に対す る
明確 は答 えはあいかわ らず得 られてい ない ように思われ る (Quine and Robinson(1985)).
最 も盛 んに研究 されてい るの は,Kolmogorov‐ Smirnov検 定 ,Cramё r‐ Von Mises検 定
Anderson‐ Darling検 定等 の経験分布関数 凡 に基づ く検定 である.経 験分布関数 に基づ く検定
は帰無仮説 が単純仮説 ,す なわち帰無仮説 の もとでの分布 が特定 された場合 には,累 積分布関
数 を考 える ことによって一様分布 の場合 に帰着 で きる.従 うて この場合 の検定統計量 の標本分
,
布 は帰無仮説 の分布 に依存 しない (distribution free)な もの とな り,有 意点 なども標準的 な形
で与 える ことがで きる.し か しなが ら,分 布形 の検定 にお いて は当然 の ことなが ら位置母数及
び尺度母数 は未知 の ことが多 い.従 つて分布形 の検定 としては分布族 の未知母数 を推定 す るか
あるい は 3.3節 にお けるように不変性 により未知母数 に依存 しない検定 を考 える必要 が ある
,
.
経験分布関数 に基づ く検定 にお いて は,未 知母数 を推定す ると検定統計量の標本分布 が分布形
に依存 して しまい,漸 近理論 で考 えた場合 で も distribution freeと ならない ことが問題 となる
これ は Durbin(1973a,b)│こ よって示 された ように,経 験分布関数 の漸近共分散関数 が分布形
.
及 び未知母数 に依存 して しまうためであ る.従 つて未知母数 を含む場合 には経験分布関数 に基
づ く検定 の (漸近的)有 意点 は,分 布形及 び未知母数 の組 み合 わせ ごとに与 える必要 が ある
2を
正規分布 において は位置 μ及 び尺度 σ 未知母数 と考 えれば よい し,指 数分布 にお い て は尺
.
度母数 を未知 と考 えればよいであ ろう.こ れ らの場合の Cramё r― von Mises型 の検定 の漸近的
な有意点 は Stephens(1976)に 与 えられ て い る.回 帰分析 にお いては残差 の正規性 の検定 が問
D問 題 に対 して Pierceら (Pierce and Kopecky(1979),Pierce and Gray(1982),
題 となる. こθ
Pierce(1985)等 )は 次 の有用 な結果 を示 した.す なわち,定 数項 を含 む回帰分析及 び 自己回帰
過程 においては,残 差 の経験分布関数 の帰無仮説 の もとでの漸近的性質 は独立 同一分布 の場合
と同等 である.従 って回帰分析 の残差 に関 す る正規性 の検定 は,位 置及 び尺度母数 が未知 の場
合 の独立 同一分布 の場合 の正規性 の検定 と同様 に行 う ことがで き,有 意点 も同 じものを用 い る
ことがで きる
.
分布形 の検定 にお いて は対 立仮説 の次元 は無限次元 で あ るが,あ えて対立仮説 の分布族 を特
定化 し Neyman‐ Pearsonの 補 題 と同様 の考 え方 を用 い て特定 の対 立仮説 に対 して最適 な検定
を求 めるの も一つの行 き方 である.す でに 3.3節 でふれたように Ferguson(1960)は 標本歪度
と尖度 が 外 れ 値 型 の対 立仮 説 に対 して局所最強力 (位 置尺度 )不 変 で あ る ことを示 した
.
Spiegelhalter(1977)は 一様分布及 び両側指数分布 を対立仮説 として局所最強力不変検定 を導
いた.ま た Spiegelhalter(1983)で は標本歪度 が漸近的 には ′分布族 に対 する局所検定 となる
ことを示 し この意味 で標本 歪 度 の最良性 を示 した.Kuwana and Kariya(1991)は 密度関数 が
exp(―
│″
lθ
/2)の 形のベキ指数分布 において,正 規性の検定が仮説 〃:θ =2の 検定 となることに
注目して,多 変量正規性 に関する局所最強力不変検定を与 えた
.
適合度検定 で一 つ の興味 のある問題 は分布 の対称性 である.例 えばロバ ス ト推定 で は左右対
称 な分布 の中心 を推定す る問題 を考 える ことが多 い.こ の場 合分布 の対称性 を検定 す る意 味 が
ある.原 点 を中心 とす る左 右対称 で連続 な累積分布関数 は F(″ )十 F(― ″)=1と い う等式 がな
りたつ.従 って経験分布関数 を用 いて この関係 をチ ェ ックす る ことが考 えられ る.対 称 の中心
が 0で ある ことが既知 の場合 は分布形 によらない検定 が得 られる.Aki(1981)は Cramё r_von
Mises型 の統計量 につ いて,分布 の中心 が未知 の場合 を論 じ検定統計 量の標本分布 を評価 した。
この場合 の標本分布 は分布形 に依存す るもの となる.さ らに Aki(1987),Nabeya(1987)は よ
リー般化 された対称性 の検定 を与 えて い る
.
287
統計的推測理論の現状
経験 分布 関数 と並 んで適 合度検 定 に頻 繁 に用 い られ るのが順 序統計量 で あ る.順 序統計 量 は
経験 分布 関数 鳥 の逆 関数 ,す なわ ち分位 点 関数 (quantile function)の 値 で あ る.従 って順 序
統計量 に基 づ く検 定 は経験 分位 点 関数 FTlに 基 づ く検定 で あ る.経 験 分布 関数 に比 して,順 序
統計量 を用 い る こ とに よ り裾 の重 い分布 に対 す る検 出力 の 向上 が期待 で きる.経 験 分位 点 関数
に基 づ く検 定 と して は Shapiro¨ Wilk検 定 及 び そ の 変 形 が よ く知 られ て い る (ShapirO and
Wilk (1965),ShapirO and Francia(1972),de Wet and Venter(1972)).
こオ
■は Shapiro,支
び Wilk自 身 の モ ンテ カル ロ研 究 の結 果 に よ り Shapiro‐ Wilk検 定 の検 出力 が 良好 で あ る と理
解 され た こ とに もよる (た だ し PearsOn,D'Agostino and Bowman(1977)に よれ ば ShaplrO_
Wilk検 定 の検 出力 は標 本 歪 度 や 尖 度 に基 づ く検 定 に比 して 高 くはな い ShapirO― Wilk検 定
)。
統計 量 を計 算 す るため に は正 規 分布 の順 序統計量 の期待値 及 び共 分散行 列 が 必要 とな る.順 序
統計量 の期待値 はまだ しも,共 分散行列 を評価す るのは困難 で ある.こ のため,Shapiro‐ Wilk
検定 を変形 したい くつか の検定 が提案 され る こととなった.こ れ らの変形 された統計量 は漸近
分布 の取 り扱 い も容易 で あるが,も ともとの Shapiro‐ Wilk検 定 の漸近分布 の厳 密 な導 出 は
Leslie,Stephens and Fotopou10s(1986)に よって与 えられた.経 験分位点関数の漸近理論 と
Shapiro‐ Wilk型 の統計量 べ の応用 は LaRiccia
and Mason(1986)で 扱 われてい る。 また
Verrill and Johnson(1987)で はセンサ リングを含 む場合 につ いて Shapiro‐ Wilk型 の統計量
の漸近分布 を与 えてい る
.
適合度検定 にお けるもう一 つ の興味深 い アプ ローチは,経 験分布関数の特性関数,す なわち
経験特性関数 を用 いて検定 を行 う こ とで ある.正 規分布 は簡単 な特性関数 を有す るので,経 験
特性関数 を正規分布 の特性関数 と比較 する ことに よって正規性 の検定 を行 うこ とがで きる.変
数 ′を固定すれ ば経験特性 関数 φ″
(′ )=(lμ )Σ ■lexp(″ 0に は中心極限定理 を応用す る こ と
がで きるので,こ れを用 いて有意点 を計算する ことがで きる.経 験特性関数 に基 づ く検定 は単
純帰無仮説 ,す なわち帰無仮説 の分布 が特定 された場合 について Feigin and Heathcote(1976)
で扱われ たが,Murota and Takeuchi(1981)に おいて確率変数 を標準化する ことによ り,位
置母数及 び尺度母数 に依存 しない分布形 の検定 として具体的 に検討 され,正 規性 の検定 として
有効 で ある ことが示 された.Koutrouvelis and Kellermeier(1981),Epps and Pulley(1983)
も同様 のアプ ローチで ある。Murota and Takeuchiの 結果 は Csё rgё (1986)に よって数学的
にも精緻 な形 で多変量 の場合 に拡張 された
.
謝辞 :査 読者 の有益 な コメン トに感謝 します
.
参
考
文
[1]Aki,S.(1981).Asymptotic distribution of a Cramё
when the center is estimated.
4π
献
r‐
von Mises type statistic for testing symmetry
π.Iη sA S滋 l Mα ′
あ.,33,1-14.
[2]Aki,S.(1987).On nonparametric tests for symmetry.4π
[3]Amari.S.(1985).第 2章 参 照
%.レsi
S滋 洗 爵物厖.,39,457-472.
[4]Andersson,S.(1982).Distribution Of maximal invariants using quotient measures.4η
π.S″ ″sム
,
10,955-961.
[5] Barlow,R.E.,Bartho10mew,J.III。 ,Bremner,D.J.,and Brunk,H.D.(1972).S滋 法 ″ ′f勿″″πθι
“
%π グι
γ Oだoγ Rω ttc″ θηs. Wiley.
[6]Barndor“ _Nielsen,O.E.and Cox.Do R。 (1979).第 2章 参 照
[7]Barndor∬ _Nielsen,O.E.and Cox,D.R.(1984).第 2章 参 照
[8]Barndor任 ―Nielsen,O.E.(1986).第 2章 参 照
[9]BarndOrr‐ Nielsen,0.E.(1991).第 2章 参 照
[10] BarndOrff‐ Nielsen,0.E.and Hall,P.(1988). On the level‐ error after Bartlett adiuStment of the
第 22巻
日本 統 計 学 会 誌
πι
likelihood ratio statistic.B′ θ
第 3号 (増 刊号 )1993
ら 75,374-378.
"蔵
[11]Bickel,P.J.and Ghosh,J.K.(1990).A decomposition for the likelihood ratio statistic and the
むム,18,1070-1090.
Bartlett correction一 A Bayesian argument. ■π%。 S協力
[12]Birnbaum,A.(1955).Characterization of complete classes of testS of some multiparametric
hypotheses,with applicatiOn to likelihood ratio tests. 4%%. Ma′ ん。Sι α″sム ,26,21-36.
[13] Brown,L.D.and Marden,J.I.(1989).Complete class results for hypothesis testing problems with
,17,209-235.
simple null hypotheses.4%π o S″
"Sム
[14]Chandra,T.K.and JOShi,S.N。 (1983).Comparison of the likelihood ratio,Rao's and Wald's tests
and a coniecture of C.R.Rao.Sα π力わり,Series A,45,226-246.
[15] Cohen,A.and h/1arden,J.I.(1989).On the adnlissibility and consistency of tests for homogeneity
of variances. 4%%。 S滋 ″sム ,17,236-251.
.S協 ″sた ,15,
[16]Cohen,A.and Sackrowith,H.B。 (1987).Unbiasedness of tests for homogeneity.4%π
805-816.
′
πれ 74,265′
θπθ
[17]CordeirO,G.M.(1987).On the correction to the likelihood ratio statistics.β
274.
[18]Cox,D.R.and Reid,N。 (1987).第 2章 参照
ew.Sα π々わり
[19]CoX,D.R.(1988).Some aspects of conditional and asymptotic inference:A re宙
Series A,50,314-337.
,
π,S″ 麻ム,14,708-723.
λπ″πω.Marcel
θ
θノπass‐ 昴 J πθ
[20]CsOrgё ,S.(1986).Testing for normality in arbitrary dimension: 4π
[21]D'Agostino,R.B.and Stephens,M.A.(editors)(1986).Gθ
Dekker.
[22]Das,R.and Sinha,B.K.(1986).Detection of multivariate outliers with dispersion slippage in
elliptically syFnlnetric distributions. 24π
πo
Stαtts′ .,14,1619-1624.
[23]de Wet,T.and Venter,J.H.(1972).Asymptotic distribution of certain test criteria for normality.
滋ノ
3フ π
写π π S滋 麻ムエ,6,■ 35-149.
“
function when parameters are
Weak convergence of the sample distribution
[24] ]Durbin,J.(1973a)。
eStiFnated.4η π.S滋 ″sム ,1,279-290.
%1%θ θη 力 γ Sな 3“ ιグ
%″ ο
み
[25]Durbin,J。 (1973b).Dヴ s″′
`ル
SIAM,Philadelphia.
Oπ ttι
Sam\le Astuibution Function.
[26]Eaton,M.L.(1970).A complete class theorem for multidimensional one‐
sided alternat市
es.
■ηπ.1`診 厖。S滋″sム ,41,1884-1888.
s.Regional Conference Series in
グ 滅,2S Jη S滋 法 ″θ
ι 4″ ′
υα%α πι
″
[27]Eaton,M.L.(1989).Gη
'レ
Probability and Statistics,vol.1,IMS‐
[28]Eaton,M.L.and Kariya,T。
AMS.
“
(1983).MultiVariate tests with incomplete data.4%π .S滋 ″sム ,11,
654-665.
[29]Eguchi,S.(1991).A geometric look at nuisance parameter effect of local powers in testing
.Ma′ れ 43,245-260.
hypothesis.4η %.Iπ s′ .S滋 ′
[30] Epps,T.W.and Pulley,L.B.(1983).A test for normality based on the empirical characteristic
πあら 70,723-726.
function.&oη zι ′
[31] Feigin,P.D.and Heathcote,C.R。
Von Mises statistic,動 π力筏
(1976).The empirical characteristic function and the Cramё
r‐
38,309-325.
″ιι
[32]Ferguson,To S.(1960).On the reiectiOn Of outliers.In PЮ θ.4厖 βι の
.1,253287.
(シ 綱夕
[33] Frydenberg,M.and Jensen,J.L.(1989). Is the`irnproved likelihood ratio statistic'reany in._
proved in the discrete case?
[34]Harris,P.(1986)。
夕
zttα , 76, 655-661.
2zι ′
Ittο 夕
″′
れ 73,735A note on Bartlett adiustments to likelihood ratio tests.2θ πι洗
737.
[35] Harris, P.and Peers, H.W.(1980).The 10Cal power of the efncient scores test statistic.
πれ
B′ θ
πθ′
67,525-529.
[36] Hayakawa,T.(1975).The likelihood ratio criterion for a composite hypothesis under a local
alternative.
Lo,2zθ ″滋.62,451-460.
[37] Hayakawa,T.(1977).The likelihood ratio criterion and the asymptotic expansion of its
distribution. z4π %.∬ ηs′ .S滋 ″sム Ma′力.,29,359-378.
[38] Hayakawa,T。 (1987).Correction to“ The likelihood ratio criterion and the asymptotic expansion
289
統計的推測理論 の現状
4π η.Iη si S協′
おムMa′ 乃.,39,681.
of its distribution"。
[39]広 津千尋
(1976)。
分散分析 .教 育 出版
[40] Hirotsu,C.(1978).Ordered alternatives for interaction effects.Bう
[41]Hirotsu,C.(1979).The cumulat市
e chi‐
method for testing an ordered alternative in a one‐
S滋 ″ダ菱ι′勒
o2θ ′
万盪ち65,561-570.
squares method and a studentized ma対 mal contrast
way analysis of variance model.
R`ク θ%′ S び
″α減あπ Rの α″τれ ノιSE 26,12-21.
[42]Hirotsu,c.(1982).Use of cumulat市 e efncient scores for testing ordered alternat市 es in discrete
models.3′ οπι′
π力
名 69,567-578.
[43]Hirotsu,c.(1986).Cumulat市 e chi_squared statistic as a tool for testing goodness of it.B′
θπθ
″
π
_
たの 73, 165-173.
[44]広 津千尋 (1992)。
実験 データの解析 一分散分析 を超 えて一 .共 立 出版
[45]Kariya,T.(1978).The general MANOVA problem.4η π.S滋 麻ム,6,200-214.
[46]Kariya,T。 (1981a).Tests for the independence between two seemingly unrelated regression
equations. 4η π.S滋″sl,9,381-390.
[47]Kariya,T。 (1981b).A robustness property of Hotelling's T2_teSt.24 ππ.S滋 ガsム ,9,211-214.
[48]Kariya,T。 (1981c).Robustness of multivariate tests.4π π.S″ 麻ム,9,1267「 1275.
[49]Kariya,T.(1985).1ル s″ηg勿 滋ι″%ι ″υαπαtt Gι πθz′ 二′
π γZθ ルι
.Kinokuniya,TOkyo.
“ robustness of some tests.4%π
[50]KaFiya,T.and Sinha,B.K。 (1985).Nonnull and optimality
.
S筋 ″sl,13,1182-1197.
[51]Kariya,T.and Sinha,B.K。
(1988).7'ι Rθ ら郷″assゲ S滋 法″6α ′7ンsな 。 Academic Press,New
York.
[52]KOutrouvelis,I.A.and Kellermeier,J。
(1981).A goodness‐ of‐ ■t test based on the empirical
characteristic function when parameters must be estimated.工
[53]Kudo,A.(1963).A multivariate analogue of the one‐
[54]Kumon,M.and Amari,S.(1983).第 2章 参照
R.S滋 ″si Sο θ,B,43,173-176.
sided test.3グθπι
′
滝れ ,50,403-418.
.
[55]Kuwana,Y.and Kariya,T。 (1991).LIB tests for multivariate normality in expOnential power
distributions.ェ
JИ %'り ″万α
ル スηα夕sな 。39,117-134.
[56]LaRiccia,V.and Mason,D.M.(1986).CramOr_von Mises statistics based on the sample quantile
function and estimated parameters.メ 」
И%″υ
απα″ 4%α ″Sも 18,93-106.
[57]Lawley,D.N。
(1956).A general methOd Of approxirnating to the distribution of likelihood ratio
criteria. &οηzι 力″
た ,43,295-303.
[58]Lehmann,E.L.(1959).1%s′ ′
ηg S滋 法″θ
α′Jfpθ ttω ω.lst.ed.Wiley.
[59]Lehmann,E.L.(1986).Tas″ ηg Sι α麻″6α ′Jfmθ 滋 o.2nd ed.Wiley.
“
[60]Leslie,J.R., Stephens,M.A.,and Fotopou10s,S.(1986)。
Asymptotic distribution of the
ShapirO‐ Wilk lク
r for testing for norrnality.
4η
π.S協廃ム,14,1497-1506.
[61] Marden,J.I.(1982a).Combining independent noncentral Chi squared or F tests. 4π
π.Stαガsム
,
10, 266-277.
[62]Marden,J.I.(1982b).Minimal complete classes of tests Of hypotheses with mult市
alternatives. 24π π.Staガ sム ,10,962-970.
[63]Marden,J.I.and Perlmen,M.D.(1990).On the inadmissibility of step‐
ariate one‐ sided
down procedures for the
Hotelling r2 prOblam. 24η π.S協′
なた,18,172-190.
[64]Mardia, K.V。 (1970).Measures of multivariate skewness and kurtosis with applications.
B′ θ
πι無
〕57,519-530.
[65] McCullagh,P.and COx,D.R。 (1986).Invariants and likelihoOd ratio statistic.4π π.S勉 ″sム ,14,
1419-1430.
[66]Menё ndez,J.A.and Salvador,B。
(1991).Anomalies of the likelihood ratio test for testing
restricted hypotheses. 4π π.S滋 ″sA,19,889-898.
[67]Moore,Do S.and Spruill,M.C。
(1975).Unifled large‐ sample theory of general chi‐ squared
statistics for tests Of it.4π π.S滋 ″sム ,3,599-616.
[68]Mukeriee,R。 (1989).Third_Order comparison of unbiased tests:a simple fomula for the power
difference in the one‐
[69]Mukettee,R.(1990a)。
parameter case.
助 π力ゎり,Series A,51,212-232.
Comparison of tests in the multiparameter case I.Second‐
ルrπ 腕 απα彪 4η α″sち 33,17-30.
order power.ェ
290
日本 統 計 学 会 誌
第 3号
第 22巻
(増 刊号 )1993
(1990b).Comparison of tests in the multiparameter case.H.A third‐ order
[70]Mukettee, R。
Иπι
″%夕 π″ 4%α 夕sち 33,31-48.
optimality property of Rao's test.エ ノ
[71] Mukeriee,R.and Chandra,T.K.(1987).Comparison between the locally most powerful unbiased
Иπι
`ιπα″ 4η αJysら 22,94-105.
and Rao's tests.エ ノ
[72] Mukeriee,R.and Chandra,T.K。 (1991).Bartlett‐ type adiuStment for the conditional likelihood
π力ら 78,365-372.
ratio statistic of C6x and Reid.Bグθ%ι ′
[73]Murota,K.and Takeuchi,K.(1981).The studentized empirical characteristic function and its
application to test for the shape of distribution.
夕
′
πたら 68,55-65。
ηι
Bうο
[74]Nabeya,S.(1987).On Aki's nonparametric test for symmetry.4%π .LsA S滋 ム■物物.,39,473482.
[75] Nish五 ,R.and Yanagimoto,T.(1991).Asymptotic expansions on the signed log likelihood ratio.
θ
αιO″ πηε
θ4″ αS協 病″ε
〃 乃 めε
To appear in物 ιグれ♂ グ ルι7カ ′
“
dimensional normal mean.五 %π
.
[76] Nomakuchi,K.and Sakata,T.(1987).A note on testing two‐
Iη stt
.
ん. 39,489-495.
S極″sム Mα′
(1988).A test for a multiple isotonic regression problem.
[77] Nomakuchi, K.and Shi, N.Z。
B′ θ ι
πノ
′
275,181-184.
"唸
[78]野 間 口謙太郎 (1992).線 形不等式制約条件下 での正規分布 の平均 に関す る尤度上ヒ検定。1992年 春季 日本
数学会特別講演
.
[79]Peers,H.W。 (1971).Likelihood ratio and associated test criteria.B′ θttθ 薦 )58,577-587.
[80]Pierce,D.A。 (1985).Testing normality in autoregress市
πι れ 72,293-298.
e mode・ ls.3グ θ
`笏
(1979).Testing goodness of flt for the distribution of errors in
[81] Pierce,D.A.and Kopecky K.J。
regression models.3ο ttα カルα 66,1-5.
[82]Pierce,Do A.and Gray R.J.(1982).Testing normality of errors in regression models.3Jθ
れれ
πι
69, 223-236.
[83]Pearson,E.S.,D'Agostino,´ R.B.and Bowman,K.O.(1977).Tests for departure from normality:
Comparison of powers.3o%α 力滋Ъ64,231-246.
[84] Quine,M.P.and Robison,J.(1985).Emciencies of chi‐ square and likelihood ratio goodness‐ of‐ it
tests.4η η.S滋 ″sた ,13,727-742.
icα ιlη ●
γRω ttcカ グ S滋 ′
πηθ
θ
ι
たし
[85] Robertson,T.,Wright,F.T.and Dykstra,R.L.(1988).Oπ ′
.
Wiley.
[86]Sasabuchi,S.(1980).A test of a mult市 ariate normal mean with composite hypotheses determined
by linear inequalities.B=o%θ ′
面 〕67,429-439.
[87]Sasabuchi,S.,Inutsuka,M.and Kulatunga,D.D.S.(1983).A multivariate version of isotonic
″′
regression.B′ θπθ
洗
れ 70,465472.
[88] Schwager,S.J.and Margolin,B.H.(1982).Detection of mult市
Sttz力
ariate normal outliers.4π η
.
な′
.,10,943-954.
[89] ShapirO,S.S.and Francia,R.S.(1972). An approxilnate analysis of variance test for norrnality.
。
た S滋 あた■ssθ ε
,67,215-216.
工 Aπ θ
[90] Shapiro,S,S.and Wilk,ヽ 4.B.(1965).An analysis of variance test for normality(complete
ηθ
″滋ら 52,591-611.
samples).3ο 夕
[91]Shapiro,A.(1987).A conieCture related to chi‐
bar‐ squared
κ Лイ
α滋.Zθ π励貌
distributions.ス πι
94,46-48.
[92] Shorack,G.R.and Wellner,J.A.(1986).E″
ル 4Йク
誡cα ″θπ わ S筋 ″s″ ι
′
元cc′ PЮθ
ass“ ω′
s.
Wiley.
[93]Spiegelhalter,D.J.(1977).A test for normality against symmetric alternat市
θπι
れれ
es.β ′
64,
415-418.
ι
し
偽 ,70,401-409.
ι
[94] Spiegelhalter,D.J.(1983).Diagnostic tests of distributional shape.B=oη
[95]Stephens,M.A。 (1976).Asymptotic results for goodness― of‐ ■t statistics with unknown parame‐
ters. 五ηπ.Stα ″sl,4,357-369.
[96]田 口玄一 (1966).統 計解析 .丸 善
[97]竹 内 啓 (1979)。 制約条件 のある対立仮説 ,仮 説 の下 での推定・ 検定問題。経済学論集 45,2-10.
′
squares inethod against ordered alterna‐
[98] rakeuchi,K_and Hitotsu,C.(1982). The cumulative chi‐
,台 ρ
t市 es in two‐ way contingency tables.R″ θ
/S放 麻″θα′助 ″6α ″θπ Rω ″κれ ノιSE 29,No.3,
.
統計 的推測理論 の現状
1-13
Takeuchi, K and Takemura, A. (1988). On Cornish-Fisher type expansion of likelihood ratio
statistic in one parameter exponential family. in Proceedings of Fifth Japan-USSR Symposium on
Probability Theory and Mathernatical Statictics, Springer.
Verrill, S. and Johnson, R. A. (1987). The asymptotic equivalence of some modified Shapiro-Wilk
statistics-complete and censored sample cases. Ann. Statist., 15, 413-419.
Warrack, G. and Robertson, T. (1984). A likelihood ratio test regarding two nested but oblique
order-restricted hypotheses. J. Amer. Statis. Assoc.,79, 881-886.
Wijsman, R. A. (1967). Cross-sections of orbits and their application to densities of maximal
invariants. Proc. Fifth BerkelEt Sym|. on Math. Statist. and Prob.,1, 389-400. Univ. of California
Press.
Wijsman, R. A. (1990). Inaariant Measures on Groups and Their Use
Notes-Monograph Series, vol. 14.
in Statistics. IMS
Lecture
4.プ ー トス トラ ップ法 とその応 用
4。
1
は じ ど):こ
1979年 に B.Efronに よって提唱 されたブー トス トラップ法 は,従 来,理 論 や数式 に基 づ く解
析的 アプ ローチが難 しかつた問題 に対 して,有 効 な解 を与 える ことがで きるとい う ことで注 目
を集 めて きた.そ の特徴 は,ブ ー トス トラ ップ法 の実行 プ ロセ スの中で,解 析的導出 をコ ンピ
ュー タを用 いた大量 の反復計算 で置 き換 えてい るところにある.こ れによって,極 めて緩 やか
な仮定 の もとで,よ り複雑 な問題 に適用 で きる柔軟 な統計手法 となった
この コ ンピュー タの利用 を前提 とした統計的数値計算法 は,多 くの研究者 の興味 を引 き,こ
.
こ約 15年 の間 に理論的・実際的両側面 に渡 って集中的 に研究 が行われ,数 多 くの論文 が発表 さ
れて きた.こ れ らの研究 を通 して,ブ ー トス トラップ法の理論構造 が明 らか とな り,そ の有用
性 と共 に問題点 も指摘 されて きた.本 稿 は,ブ ー トス トラップ法 に関 して行われ て きた様 々な
分野 の研究 を,そ の基本的 な考 え方 と共 に紹介 す る ことを目的 とす る
4.2節 で は,Efron(1979,1982)に よるブー トス トラ ップ法 の基本的 な実行 プ ロセス と,適
用上 のい くつか の留意点 を中心 に述 べ る.4.3節 で は回帰 モデルヘ の応用研究 を,4.4節 で は
.
,
判別分析 に於 ける誤判別 率推定,情 報 量規準 AICに 於 ける対数尤度 のバ イアス補 正 へ の応用 を
紹介す る。4.5節 で は,こ れ まで最 も研究 が進 め られて きた,ブ ー トス トラップ分布 と信頼 区間
の構成 に関する研究 を概 観す る.4.6節 で は,ブ ー トス トラップ シ ミュレーシ ョンの誤差 に関す
るい くつか の研究 を紹介す る
.
現在 までに発表 された膨大 な量 の研究論文 を網羅的 に紹介す る ことはで きないので,こ れ ま
での研究成果 を集 めた著書 (Beran and Ducharme(1991),Han(1992a),Mammen(1992)),
総合報告 (Hinkley(1988),DiCiccio and Romano(1988),/Jヽ 西 (1990),Swanepoel(1990),
Lё ger θ
′α′
.(1992),小 西 0本 多 (1992))等 を併 せて参照 して いただ きたい
.
4.2 ブー トス トラップ法
4.2.1 実行のプロセス
={Xl,… ,Й 傷}と する.θ
未知の確率分布Fを もつ母集団からの大きさπの無作為標本を,χ ″
をFに 関するあるパラメータとし,こ れを一つの推定量 a=∂ (Xl,… ,」 L)を 用いて推定する
ただし,推 定量 は標本の並べ替えに対 して不変であるとする.観 測値 Xl=″ 1,… ,為 =″ たが採
・,″ ″
られたとき,推 定値 ∂=θ (″ 1,・・
)を もって θに関する推論を行なうと共に,推 定の信頼度
.
292
第 22巻
日本 統 計 学 会 誌
第 3号
(増 刊号)1993
を併 せ て評 価 す る こ とが 統計 的分析 を行 う上 で重 要 とな る.推 定 の誤差 を提 え る基 本 的 な一 次
元評価 尺度 が ,次 の推定 量 のバ イ ア スお よび標 準誤差 で あ る.
(4.1)
み(F)=EF[a
θ
], s。 (F)={EF[(a
EF[a])2]}1′
ここで,期 待値 は確率分布 Fに 関 して とるもの とす る。 さらに, 推定量の標本分布 が解 れば
確率 あ るい は信頼度 を用 い て推定値 とパ ラメー タ との誤差 をよ り明確 に述 べ る ことがで きる
,
し,パ ラメー タ θの信頼 区間 の構成 が可能 となる
.
)の 分布およびその100α
このような観点から必要となるのは,多 くの場合 TsD=ν 7(a― θ
%点 (パ ーセ ンタイ ル
)
(4.2)
L(″ ,F)=PF{ν 7(a一
D)=inf{″ J島
θ)≦ ″}, ″が
(″
,F)≧
α)
2が
2に して
対
,何 らかの推定量 ∂ 求まれば,ス チユーデ
である.ま た,77λ の(漸 近)分 散 σ
ント化された統計量 ■7=π(a― θ
)/δ の分布とその100α %点
(4.3)
KX″ ,F)=PF{Ⅳ 砺 (λ 一 θ)/δ
r)=inf{″ :ん
≦ ″), ″が
(″
,F)≧
α}
を用 い る こ とが で きる.
推定 量 の統計 的誤差 を計 るバ イア ス,標 準誤 差 ,標 本分布 は,い づれ も確 率分布 Fに 依存 す
る未知 の量 で あ り,デ ー タ に基 づ い て どの よ うに推 定 す るかが 問mi_と な る.ブ ー トス トラ ップ
法 は, これ らの量 の推定 を解析 的 に行 な う代 わ りに,計 算機 の上 で数値 的 に実行 す るための一
つ の統計手法 で ,基 本 的 に は次 のステ ップ を通 して実行 され る。
(1)未 知の母集団確率分布Fを 経験分布関数 Fで 推定する.こ
こで,Fは ,π 個の観測値
・,″ π
)の 各点で確率 1ル をもつ分布である
(2)既 知の確率分布 Fを もつ母集団からの大 きさ%の 無作為標本 (ブ ー トス トラップ標
本)を χ芳={XIX,… ,x丹 とし, 身 =∂ (X鰤 ,… ,ジ9)と する.こ のとき,(4。 2)式 の推定量の分
布 島L(″ ,F)お よび 100α %点 ″r)は ,標 本 χ″が与 えられたもとで各々
{“ 1,¨
(4.4)
.
″ズχ,F)=砕 {y万 (み 一∂)≦ ″), ″r)=inf{広 島 (″ ,F)≧ α
}
と推定 され,ま た,(4.3)式 の分布 Й傷(″ ,F)と その 100α %点 ″Fr)は
(4.5)
Xl(″ ,F)=2ρ {yπ (θ オーθ)/δ *≦ ″), ″FT)=inf{″
:ノ
0(″ ,F)≧
α}
*は ,ブ ー トス トラ ップ標本 χ芳に基 づ く推定 量 とす る.
と推定 され る.た だ し, ∂
(3)(4.4),(4.5)式 の値は,経 験分布関数 Fが 既知の確率分布であることを利用して
,
モンテカルロ法によって数値的に近似する。すなわち,Fか ら大きさ%の ブー トス トラップ標
あを計算し,観 測データに基づ く推定値 θに対
本をB回 反復抽出し,各 標本に対する推定値 θ
して ?sD(グ )=輌 Ⅸθ
)と お く. このとき,(4.4)式 は
清
)― θ
ル 仲7(`け ―θ)≦ ″}∼ {B個 の 9sD(グ )の 中で″以下の個数}/3,
(4.6)
″
)∼
{¢ sD(グ );′
=1,… ,3)の 100α %点
`ギ
と近似される。(4.5)式 のブートストラップ分布 とそのパーセンタイルに対 しても同様である。
すなわち, グ番目のブー トス トラップ標本に対する推定値 と分散の値 {∂ あ,δ 誇 対 して
')に
)/δ 誇
,と 置 き換えればよい
)一 θ
9sT(グ )=ル (θ 満
同様 に して ,(4。 1)式 のバ イア ス,標 準誤差 のブ ー トス トラ ップ推 定値 はそれ ぞれ
,
.
統計的推測理論 の現状
{自
︵
θ
])句 }V2∼
一
お
錯
︵
B
ΣH
[(砕 一 E■ み
ミ
^
θ
一
"(F)={勝
〓
(4.8)
錯
︵
助
︵
b
^
F
(4.7)
(碑 )一
砕 ))2/(B_1)}V2
で与 えられ る.た だ し,砕 )=Σ た1碑 )β とす る
以上 が,ブ ー トス トラップ法 の基本的 な実行 プ ロセスで ある.ブ ー トス トラップ法 の手法紹
介 と,様 々な分野 の問題 へ の応用 を総合的 に述 べ たのが,Efron(1982),Efron and Gong
.
(1983),Efron and Tibshirani(1986)で ある.そ の他,手 法 を極 めて平易 に紹介 した Diaconis
and Efron(1983),だ ヽ
西 (19889 8章 )が ある. また,Efron(1992a)は ,ブ ー トス トラップ
法 の研究 を通 して生 じたい くつか の問題 を上 げ,Efron自 身 の これ までの研究 の流れ の 中で こ
れ らの問題 を検討 してい る。
(モ
ンテ カル 回アル ゴ リズム)ブ ー トス トラップ法 が,複 雑 な推測問題 に対 して幅広 く適用
(3)の モ ンテカルロ法 に基 づ く数値計算法 を実行 で きる点 にあ
で きるのは,上 述 のステ ップ
る。 これ は,バ イアス,分 散 ,確 率分布 のブー トス トラップ推定値 は,結 局 ,ブ ー トス トラッ
プ標本の同時分布 (π″
=lF)に 関する期待値の計算であり,こ れをFが 既知の分布であること
を利用してモンテカルロ法による数値近似を行っている.す なわち,経 験分布関数からの大 き
さ%の 標本の反復抽出とは,観 測データ{″ 1,・・。
,″ ″
}か らの大 きさπの標本の復元抽出と同値で
あ る こ とを利 用 して い る.も し,独 立 ,同 一 分布 に従 う標 本 で な けれ ば,こ の よ うな標 本 の反
復抽 出 は基 本 的 に は実行 で きな い こ とが 分 か る.
(反 復 抽 出の 回数 )モ ンテカ ル ロ法 に よる数値 近似 の誤 差 は,ブ ー トス トラ ップ反復抽 出 の
回数 Bを 無 限大 とす る と無視 で きる もので あ る.実 際 に は反 復抽 出 の 回数 は,バ イ ア スお よび
標 準誤差 の推定 に対 して は,B=50∼ 200,こ れ に対 して パ ー セ ンタイ ル の推定 で は,B=1000
∼2000は 必 要 で あ る こ とが Efron(1987, 9節
)で 報 告 され て い る.そ の他 ,Hall(1986a)
の 区間推 定 に於 け る反 復 回数 の理 論研 究 が あ る。4.6節 で は,モ ンテカ ル ロ シ ミュ レー シ ョンに
よる近 似誤差 を減 少 させ るための各種 手法 を紹介 す る。
(ス チ ュー デ ン ト化 され た統計量
)も
し推定量 の分散 が 有効 に推定 で きれ ば,ス チ ュー デ ン
ト化 され た統計量 の利 用 は,近 似 精度 を改善 す る とい う意 味 で有 用 で あ る (4.5節 を参照 )。 ノ
。(1985,p.88),
′α′
ンパ ラメ トリックモ デ ル での分散 の推 定法 として は,デ ル タ法 (Siotani θ
Hall(1992a,p.76)),ジ ャ ックナイ フ法 (QuenOuille(1949,1956),Tukey(1958),Miller
(1974)),ブ ー トス トラ ップ法等 の利 用 が 考 え られ る.た だ し,ブ ー トス トラ ップ分散推 定法 を
用 い る場 合 ,二 段 階 ブー トス トラ ップ法 (例 えば,小 西 (1990,p.149)を 参 照 )を 実行 す る必
要 が あ る.
ス チ ュー デ ン ト化 され た統計 量 に基 づ く方法 が 有効 に働 くの は,分 散 の安 定 した推定値 が 得
られ る ときで あ る.分 散 の安 定 した推定 が 難 しい標本相 関係 数 の よ うな場 合 ,4.5。 3節 で検 討 す
る有効 な変換 を行 うか,あ るい はブー トス トラ ップ反復 法 の適 用 が 考 え られ る.
(他 の 手法 との関係 )推 定量 のバ イア ス,標 準誤 差 の ブー トス トラ ップ推定 と,統 計 的 リサ
ンプ リング手 法 として古 くか ら用 い られ て い るジ ャ ックナ イ フ法 との関係 ,さ らに は影響 関数
′α′
.(1986,p.84)),デ ル タ法 に も とづ く推定 法 ,無 限小 ジ ャ ックナ イ フ
(例 えば,Hampel θ
法 (Jaeckel(1972))と の関係 が ,Efron(1982),Efron and Gong(1983),Parr(1983),高 橋
(1985)な どで 明 らか に され た.ま た,ブ ー トス トラ ップ リサ ンプ リング法 と Hartigan(1969,
1971,1975)の
S%み s%ゅ ル 法
との 関係 につ い て は,Efron(1979,p.24)で 論 じ られ てお り,そ
第 22巻
日本 統 計 学 会 誌
第 3号
(増 刊号 )1993
の他 Babu(1992)の 研究 が ある
4。 2.2 確率分布 の推定
.
ブー トス トラップ法 の基本的 な考 え方 は,未 知 の確率分布 Fか らの標本 に基づ く推測過程 を
既知 の経験分布関数 Fか らのブー トス トラ ップ標本 に基 づ く設定 へ と置 き換 えて い るところ
,
にある.し たがって,確 率分布 Fと してパ ラメ トリックモ デル を想定 した場合 ,あ るい は他 の
何 らかの方法で未知 の確率分布 を推定 した場 合 に も,ブ ー トス トラップ法 は実行 で きる
(パ ラメ トリックブー トス トラ ップ法 )母 集団 の変動 を表す確率分布 として,パ ラメ トリッ
.
クモ デル /(″ lη )を 想定 で きる もの とす る.こ のようなモ デル設定 では,未 知 の母集団確率分布
は,例 えば,分布 を規定す るパ ラメー タベ ク トル ηをその最尤推定量 で置 き換 えた /(″ │つ )で 推
定す ることがで きる.こ の とき,ブ ー トス トラップ標本 は /(″ │ブ )に 従 って取 り出され,4。 2.1
節 と同様 のプ ロセ ス を適用で きる
.
想定 したモ デル あるい は推定量 の複雑 さにもよるが,推 定量 のブー トス トラップ分布 を,解
析的 に陽 に現す ことも可能 で ある (小 西 (1990,p.142)).解 析的 アプ ロー チが難 しい場合,既
知 の分布 /(″ lη )に 従 う乱数 を反復 発生 させ る ことに よって,モ ンテカルロ近似 を行 う ことも
で きる. これが,パ ラメ トリックブー トス トラップ法 と呼 ばれ る手法 で ある
.
(平 滑化 ブ … トス トラ ッ プ法 )基 本 的 な ブー トス トラ ップ法 は,経 験分布 関数
Fに よって未
知 の確 率分布 Fを 推定 した.こ れ に対 して,適 当 な平 滑化 を行 った分布 関数 几 で 推 定 したの
が ,平 滑化 ブー トス トラ ップ法 で あ る.Efron(1982,p.30)は
,標 本相 関係 数 に対 す る Fisher
の z一 変換 の標 準誤差 推定 の 問題 を取 り上 げ,数 値 的 に Fよ り 凡 に基 づ くブー トス トラ ップ推
定 の 方 が 良 い場 合 が あ る こ とを示 した。 Silverman and Young(1987)は ,核 関数 に よる平滑
化 法 (Silverman(1986))に 基 づ い て,推 定量 の平均 二 乗誤差 の推定 問題 を考察 した.Young
,標 本相 関係 数 に対 す る z一 変換 の標準誤差推 定 につ
い て,ま た Han θ
′α′
。(1989)は ,推 定 パ ー セ ンタイ ル の分散 の推定 につ い て,ブ ー トス トラ
(1988),De Angelis and Young(1992)は
ップ法 と平 滑化 ブー トス トラ ップ法 の比 較検 討 を行 った.
もし,適 当 に平 滑化 パ ラメ ー タ を選 ぶ こ とに よって,Fよ り 几 に基 づ くブー トス トラ ップ法
の 方 が あ る意味 で 良 い とい う こ とが 言 えれ ば,平 滑化 ブー トス トラ ップ法 の有 用性 は増 す .し
か し,推 定量 の誤差評価 の 問題 に対 して は,一 般 に平 滑化 パ ラメー タ は汎 関数 とFに 依存 し,
その決 め方 につ い て は種 々 の 問題 が あ り今後 の研 究課題 で あ る。
の 他 の 手法 )Rubin(1981)は ,ブ ー トス トラ ップ標本 に含 まれ る各観測 デ ー タの割 合 を,
デ ィ リク レ分布 で制御 したベ イズ 的 ブー トス トラ ップ法 を提 唱 した.関 連研 究 に,Lo(1987,
(そ
1988),Banks(1988)等 が あ る.有 限母 集 団 ,層 別抽 出法 に対 す るブ ー トス トラ ップ法 の研 究
は, Bickel and Freedman(1984),Chao and Lo(1985),Rao and Wu(1988),Sitter(1992)
。(1985),Fisher
等 が あ り,ま た方 向性 デ ー タ に基 づ く統計 的推測 へ の応 用 は,Ducharme θ′α′
and Hall(1989a,b)に よって研 究 され た
.
4.3 回帰 モ デ ル
目的変数 ク と 夕個 の説 明 変 数 ″=(″ 1,・・。
,trp)′ に関 して,π 個 の 観 測 値 {(yら ″J);グ =1,… ,π }
が 得 られ た とす る.こ の とき,ク と ″ の関係 を表 す モ デル として グJ=/0巧 β)十 εJ(グ =1,一 ,π )
を仮 定 す る.た だ し,″ Jは 事 前 に設定 され た既知 の定 数 ベ ク トル,β は未知 のパ ラメー タベ ク
・,ε ″
トル ,/の 関数形 は既知 とす る.ま た,誤 差項 ε=(ε l,ε 2,・・
い に独立 に同 一 の未知
)は
'互
の確 率分布 Fに 従 う もの とし,E[ε J]=0,E[ε :]=σ 2と 仮 定 す る.
未知 のパ ラメー タベ ク トル β を,例 えば最小 二 乗 法 を用 い て推定 し,こ れ を β と置 く.推 定
量 β の統計 的誤差 をブー トス トラ ップ法 に、
よって推 定 す る とき,モ デ ル の構 造 を反映 す る とい
295
統計的推測理論の現状
う立 場 に立 て ば ,以 下 の プ ロ セ ス を通 して 実 行 され る.
=yJ― /(″ 弓
(1)各 点の残差 δ」
β
)(グ
=1,… ,π )を 求め,そ の平均を εO=Σ 縫 εJル とおく
l
.
J=ε :一 δ)と おき,{a,… ,ο ″
)
残差の平均は必ずしも0で はないから,平 均を補正した残差をθ
に基づいて経験分布関数 Fを 構成する
(2)Fか らの大きさ%の 標本 θr,… ,θ 芳に対して,y芦 =/Cttβ )+0す =1,… ,%)と おき
ブートストラップ標本 {(グ ま
,″ J);′ =1,… ,%)を つくる
.(2),(3)の プロセスを例えばB回 繰り
(3)minβ Σ輿1{グ ー/し 再
β)}2の 解をβさ
)と おく
い
づ
て,推 定量 βに関する誤差評価を行うこ
こと
によって得られるβあ,β あ,… ,β あ)に 基
返す
ジできる
とカ
(。
.
(グ
,
.
.
回帰モデルにおいて,大 きさ%の 標本 zづ =(yJ,″ )(グ =,… ,π )は ,互 いに独立で同一の し+1)
・,zπ }
次元確率分布Fか ら観測 されたと考えることもできる.こ の場合,経 験分布関数 は {zl,・ ・
ロセ
スは
4.2.1節
で
の通 り ある
によって構成され,ブ ー トス トラップ誤差推定のプ
J=″ ttε ズグ
=1,… ,%)の 回帰係数 β=(β l,¨ 。
(線 形重回帰モデル)線 形重回帰 モデル ク
トス トラップ標本 か ら構成す るとβ*=
ん の最小二乗推定量 を,ス テップ (2)の ブー`β
.
,
)′
とお き,π ×夕行 列 Xの 階数
は ,(≦ π)と す る.定 数項 を含 む線形 重 回帰 モ デ ルで,説 明変数行 列 Xの 第 一 列 の要素 をす べ
て 1と した場合 ,ス テ ップ (1)の 残差 の平均 は 0と な り残差 の補 正 は必 要 な い こ とに注意 す
(X′ X)
lX′ y*と な る.た だ し,y*=(yr,… ,y芳
)′
,x=(″ f,… ,″
1)′
,Bickel and Freedman(1983)は 残 差 の {π /(π 一 夕)}V2補 正
(1985)は ス チ ュー デ ン ト化 され た残 差 の利 用 を提 案 して い る
る。 な お
を ,Weber(1984),Stine
.
線形重回帰モデルヘのブー トス トラップ法の応用,特 に,(X′ X)12(β 一β)た に対するブー ト
ス トラップ分布の有効性,漸 近理論の研究は,Freedman(1981),Bickel and Frё edman(1983)
による ところが大 きい。 さらに,Freedman(1984),Freedman and Peters(1984a,b)で は
一般化最小二乗推定量 ,ダ イナ ミック線形 モ デルにお ける二段階最小 二乗推定量 な どに対する
,
ブー トス トラップ法の適用研究 が行 なわれた.Peters and Freedman(1984)に は,こ れ らの
研究 を通 して得 られた適用上 の留意点 が簡潔 にまとめられてい る.な お,回 帰係数 の推定 に 〃
―
推定量 を用 いた場合 (Shorack(1982),Lahiri(1992),よ リー般 には Arcones and Ginё
(1992)),L― norm推 定量 を用 い た ときの種 々の数値比較 (Stangenhaus(1987),Dielman and
Pfaffenberger(1988))の 研究 が ある
回帰係数 に対 す る信頼 区間 の構成 へ の応用 は,Robinson(1987),Han(1989a)の 研究 が
.
,
リッヂ 回帰 にお ける リッヂパ ラメータの推定 へ の応用 は,Delaney and Chatteriee(1986)に
み られ る.Wu(1986)は ,誤差項 に対す る仮定 の一 つで ある等分散性 が満 たされない場合 ,β
のブー トス トラップ分散推定 の漸近的一致性 は成立 しない ことを示 し,種 々の対処法 を提唱 し
た.関 連研究 として Shao(1988)な どが ある
.
将来観測 され るデー タ 釣=璃 β+ε Oに 対 す る予測域 を構成 す るに は,蜘 の予測値 ′0=璃 β
との差 R(y,F)=約 ― ク。の分布 を推定す る必要がある.ブ ー トス トラップ法で は,Fか らのブ
*と
ー トス トラップ標本 {ο r,… ,。 芳
ガ =漏 β+イ を求める.こ のと
}ぉ よびイ を抽出して,β
き,基 本的 にはR(y*,F)=ガ ー璃β*の 分布 の 100α %点 ″αを用 いて,[璃 β十″α
,璃 β
十″1_α ]と 構成 され る.予 測域 の構成 につ いては Stine(1985)を ,ま た同時信頼領域 の構成 に
関 しては Hall and PittelkOw(1990)を 参照 されたい.予 測誤差 のブー トス トラップ推定 に関
しては,Efron(1983,1986),Bunke and DrOge(1984),Kipnis(1992)な
どの研究 が ある。
パ
(ノ ン ラメ トリック回帰,密 度関数の推定 )核 関数 を用 いたノンパ ラメ トリック回帰 お よ
び密度関数 の推定 に於 ける共通 の問題点 は,平 滑化 パ ラメータの決め方 にある.確 率密度関数
/か らの大 きさ %の 無作為標本 χ″に基 づ く,核 関数 を利用 した密度関数 の推定量 は /″ (″ ;力 )=
296
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
力
) lΣ 縫lκ {(″ ―χ )ル }で 与えられる.た だし,λ は平滑化パラメータとする.平滑化パラメ
ータは,E∫ {九 (″ ;力)一 /(″ )}2″ を最小にするように選択される場合が多い.平 均二乗誤差は
推定量のバイアスと分散に分解され,そ の推定にブートス トラップ法の適用が考えられる
(π
,
.
経験 分布 関数
Fに 基 づ く通 常 の ブー トス トラ ップ法 を適 用 す る とき,ブ ー トス トラ ップ標本
χ方か ら /オ (″ ;力 )=(%力 ) lΣ 他lκ {(″ ―X→ ル)を も と め,{ノ1(″ ;力 ),/(″ )}を 各 々 {/オ (″ ;力 ),
/″ (″ ;λ )}で 置 き換 えて実行 す る.と こ ろが ,一 般 に核 関数 に基 づ く推定量 に対 して は,こ の よ
うな方 法 で はブー トス トラ ップバ イ ア ス推 定 は有効 に働 か な い (例 えば,Hall(1992a, p.
205)).こ れ は,推 定量 が π個 の標 本 の線形 関数 とな って い るた め,期 待値 を とる と EF[/オ (″
;
力)]=/″ (″ ;力 )と な り,理 論上 バ イ アス を 0と 推定 して しまう こ とに よる.
ブー トス トラ ップ法 を適 用 す るに当 た って,こ の点 を克服 す るための い くつか の 方法 が提 唱
され て きた。 Taylor(1989),Faraway and Jhun(1990)は
,経 験分布 関数 に代 えて平 滑化 ブ
,大 きさが πよ リイヽさい ブー トス トラ ップ標本 に
基 づ く手法 を提 案 した.こ れ らの手 法 の概 説 は,Han(1992a,4.4節 ),Marron(1992)│こ み
ー トス トラ ップ法 を適 用 し,Hall(1990a)は
られ る.
核 関数 を利 用 した ノ ンパ ラメ トリック回帰 へ の ブー トス トラ ップ法 の応 用 は,Hardle and
BOwman(1988),Hardle θ′α′.(1988),Dikta(1990),Faraway(1990),Cao‐ Abad(1991),
Hardle and Marron(1991)等 が あ り,こ の 分 野 の 研 究 は Hall(1992a,4.5節 ),Mammen
(1992)に ま とめ られ て い る.そ の他 ,Romano(1988a,1988b)の モー ド推定 へ の応 用 な どが
あ る.
4。
4
予測誤差推定
ブー トス トラ ップ法 を予測誤 差 の推定 に応 用 す る こ とに よって,従 来解析 的 アプ ロー チが難
しか った複雑 な問題 に対 して,有 効 な解 を与 え る こ とが 可能 とな りつつ あ る.こ の よ うな例 と
して,判 別分析 にお ける誤 半J別 率 の推定 ,情 報 量 規準 AIC(Akaike(1973))に 於 ける対 数尤
度 のバ イアス補 正 の 問題 を取 り上 げ,そ の基 本 的 な考 え方 と関連研 究 を紹 介 す る.
1
判別分析 にお け る誤判別 率推定
二 つ の母集 団 (群 )Π l,Π 2が あ り,各 々 未知 の 夕次元確率分布 Fl(″ ),F2(″ )を もつ とす る.
群Πl(Π 2)か らの標本が %1(%2)個 観測されたとし,こ れらをχ″
={″ ∫
=1,2}(π =
驚α=1,… ,%弓 グ
4。 4。
πl+π 2)と お く.こ こで は,各 群 か ら観測 されたデー タを通 して得 られる情報 を基 に確率分布 モ
デル を想 定 し,こ れ らを θJ(″ lθ J)(グ =1,2)と す る.ま た,標 本 χ″に基 づいて,何 らかの方法 で
推定された確率分布モデルを σ【″lχ ″
)と お く.こ のとき,例 えば,判 別関数をあ
(″ lχ π
)=
σl(″ lχ ″
)/σ 2(″ lχ ″
)と 置 くと,標 本空間 を三分する判別領域 ■1={″ :λ (″ lχ ″
)>ε },2={″
力
(″ lχ ″
)≦ σ
}が 構成され,新 たに観測されたデータ蒟に対して,蒟 ∈pJの とき蒟 は群Πjへ 属
すると判別を実行することができる。
判別分析 に於 ける予測誤差 とは,初 期標本 χ″とは独立 に群 ΠJか ら採 られたデー タ,す なわ
ち確率分布 Eに 従 って取 り出 されたデータを,誤 って群 ΠJ(プ ≠グ
)か らの もの と予測 して しま
:
う確 率
瀕
R(→
薇E;χ D=猟 メ
(ら
≠
=1,と ′
ノ
力
で あ り,一 般 に実際の誤判別 率 または条件付 き誤判別率 と呼 ばれてい る
.
実際の誤判別率 の一つの推定法 は,上 式 に含 まれ る未知 の確率分布 几 を群 Πがか らの初期標
本 に基 づ く経験分布関数 几 で置 き換 えた推定量
統計的推測理論 の現状
クズ几 ;χ D=%′ 晟 (→ =∫ ズ司鳥 )晟 (→ =券 ム ズ硼 鳥 )
を用いることである.こ こで,Iは ,I(″ 1鳥 )=1(″ ∈鳥 );=0(rC鳥 )で 与 えられる定義関数 と
する.こ れは,群 ΠJか らの初期標本 のうち,判 別領域 鳥 へ入った結果誤半J別 された標本 の割
合であり,よ く知 られた見かけ上の誤判別率 に他 ならない
.
ブ ー トス トラ ッ プ 法 は,実 際 の 誤 判 別 率 を見 か け上 の 誤 半J別 率 とい う一 つ の 推 定 量 で 推 定 し
た と きの バ イ ア ス bJ(Fl,F2)=EFl,F2['【 ∴ ;χ ″
)― ■(几 ;χ ″
)]の 推 定 に 用 い られ た .ブ ー トス トラ
ッ プ 法 を適 用 す る と, こ の バ イ ア ス は
麟
︿
″
f
︲
西マん〓
α
1 一幼
1
ヽ
ノ
麟.
︵
″
f
︲
〓
″﹁
んα
幼
1一
r
L
=
斜
翻
島
〓
︵
几
︵
几
︵
ろ
と推定 され,経 験分布関数の同時分布 に関す る期待値 は,モ ンテカルロ法 によって数値的 に近
似 され る.こ の とき,見 かけ上 の誤半J別 率 のバ イアス を補 正 した ,K几 ;χ ″
)一 εJ(A,几 )を ,実
際 の誤半J別 率 の推定量 とす る (詳細 な実行 プ ロセス は,McLachlan(1992,10節 ),小 西 0本 多
(1992, 3節 )を 参照 されたい).
判別分析 に於 ける誤判別率推定 へ のブー トス トラップ法の応用 は,Efron(1979,1983,1986)
の研究 によるところが大 きい.Efronは ,バ イアス補 正 を施 した見 かけ上の誤判別率 は,交 差検
証法 (Lachenbruck and Mickey(1968),Stone(1974),Geisser(1975))と 上ヒ
較 して,変 動 の
小 さい推定量 としてその有効性 を示 した.し か し,母 集団 の設定 によっては,ブ ー トス トラッ
プバ イアス補正 は十分 に働 かない ことも指摘 された (Efron(1983),Chattettee and Chattettee
(1983)).Davison and Hall(1992)は 両母集団 の平均間 の差 が % 12の オ ー ダーで 0に 収東す
るとき,ブ ー トス トラップバ イアス補 正 を交差検証法 との比較 に於 いて理論的 に検討 した
Efron(1983)は ,実 際 の誤判別率 に対す る推定量の平均二乗誤差 に基づ く評価 か ら出発 して
.
,
様 々 な改良法 を提唱 した.こ れ らは,確 率化 ブー トス トラップ法 (Randomized bootstrap),
二段階 ブー トス トラップ法 (Double bootstrap),0.632推 定量 と呼 ばれ,中 で も 0.632推 定量
の有効性 を数値的 に示 した
ブー トス トラップ法 に基づ く推定法 を含 めた種 々の誤判別率推定法 の有効性 ,問 題点 は,主
.
として数値実験 を通 して検証 されつつ ある.正 規母集団か らの標本 に基づ いて線形判別分析 を
′α′
。(1985,1986),Wernecke
実行 した ときの手法 の様相 は,McLachlan(1980),Chernick θ
θ
′α′
.(1991)等 で研究 された
Snapinn and Knoke(1988),Ganeshanandam and Krzanowski(1990),Konishi and Honda
and Kalb(1987),Sanchez and Cepeda(1989),Fitzmaurice
.
(1990)等 で は,非 正規 モ デル の もとで も合わせて検討 され,Wang(1986)は 多項分布 モ デル
の もとで検討 して い る。Jain ο
′α′
。(1987)は 二 次半J別 分析 における様相 も調 べ てい る
.
変数選択 へ の応用 は,Honda and Konishi(1988),Snapinn and Knoke(1989)が 線形半J別
に基づ いて,Efron and Gong(1983),Gong(1986)が ロジステ ィック判別 (回 帰 )へ の適用
を通 して検証 してい る.ま た,各 種推定法 を総合的 に報告 した論文 ,著 書 として は,McLachlan
(1986,1987,1992;10節 ),Hand(1986),小 西 0本 多 (1992)が ある
.
2 情報量規準
この節 で は,予 測誤差 を確 率分布 に基 づ きグ ローバ ル な観 点 か ら捉 えた情報量規準 AIC
(Akaike(1973))を 取 り上 げ,ブ ー トス トラップ法 の枠組 みの中で,推 定量のバ イアス補 正 に
ついて検討す る.は じめに,Akaike(1973,1974),竹 内 (1976),坂 元 他 (1983),Shibata(1989)
4。 4。
などを参考 に,情 報量規準 の基本的 な考 え方 を簡単 に整理す る
.
298
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
未知 の確率 分布 関数 F(″ )か らの大 きさ πの無作為標 本 を χ″とす る.確 率分布 関数 F(″ )の
密度 関数 を /(″ )と し,こ れ に対 して想定 した モ デ ル の密度 関数 を θ(″ lθ )と す る.モ デ ル に含
まれ る未知 のパ ラメ ー タ θ(∈ 0)は ,′ 次元 パ ラメー タベ ク トル とす る.こ の よ うな設定 の も と
で,将 来観測されるデータzに 対する(予 測)確 率分布 σ(Jχ ″
)を 構成したいとする.一 つの方
パ
モ
法 は,想 定 した デルの確率分布 θに含 まれる ラメータ θを何 らかの方法で推定 し,求 めた
推定値 ∂で置 き換えた σ(zlχ ″
)=θ (21θ )を 用 いる方法である.そ の他,ベ イズ的方法 による予
測分布,ABIC最 小化事後 モー ド法 (Akaike(1980))な ど様々な方法が提案 されている
大 きさπの標本 に基づいて推定 された一つの予測確率分布 σ(zlχ ″
)と ,こ の標本 を生成 した
真 の確率分布 /(2)と の距離を Kullback‐ Leibler情 報量で測るとする。このとき,標 本 χ″によ
つて推定 される種々の予測確率分布の違 い は,平 均対数尤度 と呼 ばれる項
.
η″
)=∫ /(2)10g σ
(dχ ″
)“ =∫ 10g σ
(4.9)
(zlχ ″
)(力 F(2)
(F;χ
が関係 する.平 均対数尤度 は,真 の確率分布 Fと 予測確率分布 の推定 を通 して標本 χ″に依存す
る未知 の量で ある.そ こで,平 均対数尤度 の一 つの推定量 として,(4.9)式 に含 まれる未知 の
確率分布 Fを ,標 本 χ″に基づ く経験分布関数
,(aχ D=∫ bg
(4.10)
Fで 置 き換 えた
bgズ ん″
σ″
)´ (z)=場 自
lZlχ
lχ
)
を用 い る こ とが で きる.
予測確率分 布 を構 成 す るた め に用 い たデー タ を再 び利 用 して,未 知 の確 率分布 F(2)を 推定
して い る こ とか ら,推 定量 (4。 10)は 見 か け上 の推 定量 で あ る とい える.判 別分析 に於 ける見
か け上 の誤判 別率 のバ イ アス を補 正 した と同様 に,対 数尤度 と呼 ばれ る一 つ の推定量 で平均対
数尤度を推定したときのバイアス ι(F)=EF['(F;χ ″
)一 η
(F;χ ″
)]の 補正が必要 となる.し たが
って,こ のバイアスを何 らかの方法で推定できれば,対 数尤度のバイアスを補正した一つの情
報量規準
IC(F;χ ″
)=場
自
bg
σ(為 lχ ″
)一 b(F)の 推 定量
AICは ,基 本 的 に は,こ の よ うに対 数尤度 で平均対 数尤度 を推定 した
ときの漸近 的 なバ イ アス を補 正 した推 定量 として与 え られ た.
ブー トス トラ ップ法 を適 用 す る とバ イ ア ス は
が も とまる.情 報 量 規 準
∂(F)=Eバ ,(Ftχ 芳)一 η(F;ガ 湖=膀
[券 ム
bg
σ(若 lχ 芳)―
,自 bg
σ(‰ lχ 芳)]
と推定される.た だし,χ 芳は大きさ%の ブー トス トラップ標本,F*は ブー トス トラップ標本
の各点に確率 1ル をもつ経験分布関数 とする.期 待値は,モ ンテカルロ法によって数値的に計
算される
.
ブー トス トラ ップ法 は極 めて緩 やか な仮 定 の もとで,解析 的 に煩雑 な手 続 きな しで適 用 で き
る.し か し,ブ ー トス トラ ップバ イアス推定 に は,標 本 変動 とシ ミュ レー シ ョンに よる変動 (4.
6節 を参 照)が あ り,そ の大 きさに は十 分注意 を払 う必 要 が あ る.こ れ に対 して,最 尤推定 量 を
AICは ,漸 近 的バ イ アス評 価 に関 して解析 的導 出 の困難 さ も推定 に よる変動
も取 り除 かれ ,実 際 問題 へ の適 用上極 めて有 用 な手法 とい える.
用 い た情報量規 準
299
統計的推測理論の現状
ブー トス トラ ップ法 を適 用 して対 数尤度 のバ イ ア ス を補 正 す る方法 は,Wong(1983),EfrOn
(1986)に よって暗 に示 され ,後 に石黒 ,北 川 ,坂 元 が その重 要性 を指摘 した.こ の 方法 は EIC
と名 づ け られ ,Ishiguro and Sakamoto(1991),石 黒 他 (1992),北 川 (1991),北 川 他 (1992),
坂 元 他 (1992)に よって,そ の有 用性 が 検 討 され つつ あ る.小 西 (1992a,1992b)│ま ,想 定
した確 率分布 モ デ ル を規 定 す るパ ラメー タ を,統 計 的汎 関数 で 定義 され る推定 量 で推定 した と
き,対 数尤度 のバ イ アス は,推 定 量 の影響 関数 とモ デル のス コ ア関数 で表 され る こ とを示 した.
漸 近理論 に基 づ く解析 的 アプ ロー チ とブー トス トラ ップ法 に よる数値 的 アプ ロー チ との 関係 に
つい て は,小 西 (1992b)を 参 照 され た い.
ここで は,ブ ー トス トラ ップ法 の応 用 とい う立場 か ら,標 本 は独立 同分布 に従 う と仮 定 した.
この仮定 を取 り除 い た場 合 ,回 帰 モ デ ル ,時 系列 モ デ ル にお けるブー トス トラ ップ法 の応 用 で
研 究 されつつ あ る よ うに,モ デル の構 造 を反映 す る ように手法 の修 正 が 必要 で あ る.時 系列 モ
デ ル にお けるブー トス トラ ップ法 の応 用 に関 して は,Freedman(1984),
Swanepoel and van Wyk(1986),Bose(1988),Ktinsch(1989),Basawa
Findley(1986),
。(1989),Stoffer
θ′α′
and Wall(1991),Franke and Hardle(1992)等 の研 究 が あ る.こ れ らの論文 の い くつ か に関
して は,Lё ger θ′α′
。(1992, 3節 )の 中 で ,実 際 の デー タの分析例 を含 めて簡 潔 に ま とめ られ
て い るので参照 され た い.
最近 ,Kotz and Johnson(eds.)(1992)に , ここ約 100年 の間 に発表 され た統計 学 に関 す る
論 文 の 中 で ,そ の発 展 に著 し く寄与 した論文 39編 が 選 ばれ た。Akaike(1973)と Efron(1979)
AIC,統 計 的数値計 算法 としての ブー トス トラ ップ
が
い
法 ,極 めて適 用範 囲 の広 柔軟 な手 法 で あ る こ とを うかが わ せ る.こ れ らの方 法 は,よ り複
の論文 は共 にその 中 に選 ばれ ,情 報量規準
雑 な問題 に対 して有効 な解 を与 え る統計手 法 としての潜在性 も十分 に残 して い る.
4.5 近似信 頼 区間 の構成
ブー トス トラ ップ法 を適 用 して推 定量 の分布 お よびパ ー セ ン タイ ル を推定 した とき,そ の近
似精 度 は どの様 に評価 した らよい で あ ろうか .ま た,従 来 の推定量 の漸近 正 規性 に基 づ く手 法
と比 べ て,そ の有効 性 は保証 され るので あ ろ うか .本 節 で は,こ の よ うな問題 か ら出発 して,
種 々 の近 似 信頼 区間 の提 唱 へ と展 開 して行 った ブー トス トラ ップ法 の理 論研究 を概 観 す る.さ
らに,近 似信頼域 の構成 ,検 定 問題 へ の応 用 につ い て簡 単 にふれ る.
4.5.1 ブー トス トラ ップ分布 の 近似精 度
ブー トス トラ ップ分布 の近 似精 度 を評 価 す るため に は,真 の分布 とそのブー トス トラ ップ分
布 との差 ,あ るい は真 のパ ー セ ン タイ ル とその ブー トス トラ ップ推定値 との差 を,何 らか の方
法 で 陽 に表 す必 要 が あ る.そ の ため に用 い られ た基 本 的 な道具 が ,エ ッジワー ス展 開 と呼 ばれ
る漸 近 展 開式 と,パ ーセ ンタイ ル の展 開式 で あ る コー ニ ッ シュ・ フ ィ ッシ ャー (逆 )展 開 で あ
った.こ れ らの展 開式 について は,竹 内 (1975),Petrov(1975),清 水 (1976),Bhattacharya
and RaO(1976),Pfanzagl(1985),Barndorff…
Nielsen and Cox(1989),Hall(1992a)を 参 照
され た い.
例 えば,ス チ ュー デ ン ト化 され た統計量 ar=ル (a― θ)/δ に基 づ くブー トス トラ ップ分布
の精 度 は,有 効 な エ ッジ ワー ス展 開 (Bhattacharya and Ghosh(1978),Hall(1992a,2章 ))
が 可能 で あ る とい う仮 定 の も とで ,次 の よ うに評価 され る.
統計量 arの 分布のエ ッジワース展開は,極 限分布である標準正規分布関数 の(″ )を 第一項
として,1ん %の 巾のオーダーで展開された式で与 えられる。各項 は,標 準正規密度関数 とその
係数が母集団確率分布Fの モーメン トの関数 (キ ュムラント)と して与えられる多項式 との積
となっている. この各係数のモーメントを標本モーメントで置 き換えた式が,ブ ー トス トラッ
300
第 22巻
日本 統 計 学 会 誌
第 3号 (増 刊号 )1993
プ分布 Fい (得 ≦″)の エ ッジワース展開であり,経 験エ ッジワース展開 と呼ばれている.こ こ
で, 欝 =√万(θ オー′)/∂ *と する。
これによって,ス チ ューデン ト化 された統計量 の分布 を,ブ ー トス トラップ分布 で近似 した
ときの誤差 のオーダー は,砕 (2じ ≦″)― PF(■ r≦ ″)=C(% 1)と 評価 され る.こ れ は,籍 の
ブー トス トラップ分布 が,推 定量 の漸近的なバ イアス,歪 み を,自 動的 にある程度捉 えてい る
ことを意味する.一 方,■ D=ル (a一 θ
)に 対するブートス トラップ分布に関しては,乃 (2Ъ
≦″) PF(■ D≦ ″)=C(π V2)と な り,近 似誤差 のオ ー ダー を通 して近 似精 度 の違 い が 明 か と
な る.推 定量 の漸近 正 規性 に基 づ く近似誤 差 のオー ダ ー も % 12で あ るか ら,ス チ ュー デ ン ト化
され た統計量 に対 す るブー トス トラ ップ分布 の有効 性 をみ る こ とがで きる.た だ し,確 率分布
Fが 格子 点分布 の場 合 ,エ ッジワー ス展 開 の % 12の 項 に含 まれ る連 続補 正 項 の ブー トス トラ
ップ近 似 は有 効 に働 か ず ,こ の よ うな議 論 は成 り立 た な い の で 注 意 が 必 要 で あ る (Singh
(1981),Hall(1987a,1992a:p.90)).な お ,言己号 0,め につ い て は,例 えば,ガ ヽ
西 (1990,p.
144),Hall(1992a,p.88)を 参 照 され た い
.
ブー トス トラ ップ分布 の近 似誤差 のオー ダー を,エ ッジ ワー ス展 開 を道 具 として評価 す る方
法 は,Bickel and Freedman(1981),Singh(1981)に よって行 われ ,そ の後 の ブー トス トラ
ップ法 の理 論研 究 に大 きな影 響 を与 えた.ス チ ュー デ ン ト化 され た統 計 量 を含 め た研 究 は,
Babu and Singh (1983, 1984, 1985), Beran (1982, 1984a, 1984b), Hall(1986b, 1988a,
1990b),Bhattacharya and Qumsiyeh(1989),Bickel(1992)等 に よって幅広 く研 究 され た
.
この よ うな研 究 に関 して は,レ ビュー論文 DiCiccio and Romano(1988, 3節
(1992a, 3章 )を 参照 され た い.
)お よび Hall
ブー トス トラ ップ 法 に よ る分 布 推 定 が 有効 に作 用 しな い場 合 も検 討 され た.Bickel and
Freedman(1981)は ,υ 一統 計 量 ,極 値 統 計 量 に基 づ い て構 成 され た反例 を上 げ,Mammen
(1992,2章 )は ,ノ ンパ ラメ トリック回帰 に於 ける例 を述 べ た.そ の他 ,DiCiccio and Romano
(1988,3.3節 )に い くつ か の反例 が ま とめ られ て い る。
4.5。
2
近 似信頼 区間の 精度
4.2節 (4.3)式 のスチューデント化された統計量 arの 真の 100α %点 ″fr)が ,仮 に求まっ
たとする.こ のとき,信 頼係数 1-α の片側信頼区間は,驀 ダ)=(― ∞,a― π-1′ ∂
″がT)]あ るいは
2∂
ン
_が
ぶり,∞ )で 与えられる.ま た,パ ラメータθがこの片側信頼区間に含まれる確率
[島
r)が
は,点 ″が 真の 100α %点 であることから正確に 1-α になる
.
実際には,″ がr)の 値 は未知 で あるか ら,ブ ー トス トラップ法で推定 された (4.5)式 の推定値
-1′
分がT)を 用いて,近 似片側信頼区間 fさ ダ)=(一 ∞
ttfr)]あ
い
,a_%-12δ
る は[a一 π ∂″fり
∞)を 構成す る.こ の とき,θ が この区間 に含 まれ る確率 は
,0<α <1に 対 して
(4.11)PF{θ
,
≦a π -1′ δ″がrり =1-PF僣 7(2-θ )/δ <″ frり =1-α 十(誤差項)
と表わせ る.誤差項 は被覆誤差 (Coverage error)と 呼 ばれ,近 似誤差 を評価す るための一 つ
の 目安 とな る.ま た,近 似信頼限界 とその真 の信頼限界 を直接比較 して
(4.12)
a_%1″ ∂″fr)― {2-%― W2∂ ″frり =(確 率的誤差項)
を評価 す る こ ともで きる.ブ ー トス トラ ップ法 に基 づ く近似 信頼 区間 の精 度 は,π →∞ の とき
,
誤差 の項 が 0に 収東 す るオー ダー を評 価 す る こ とに よって捉 える こ とが で きる.こ の分野 の
研
究 は,特 に,Hall(1988a,1992a;3章 )に よる ところが 大 きい.実 際 ,(4.11),(4.12)両
式 の誤差項 のオ ー ダ ー はそれ ぞれ
統計的推測理論 の現状
PF{θ
301
∈f `ダ ))=1-α +0(π 1),a― η-1/2δ ″がr)一 {θ″
一π1/2∂ ″fr)}=0ズ π3/2)
とな る こ とが 示 され る (Hall(1988a)).特 に後 半 の式 は,ス チ ュー デ ン ト化 され た統計量 の分
1=(π V2)2の
布 に基 づ く理論 信頼 限界 とブー トス トラ ップ信頼 限界 が ,η
項 まで 一 致 して い る
こ とを示 し,こ の とき,近 似 信頼 限界 は二 次 の精 度 を もつ と定義 す る.
これ に対 して,統 計量 ■∂=ル (a― θ)に 基 づ く 4.2節 (4.6)式 の 100α
%点 のブー トス ト
V2)と
ラ ップ推 定 値 ″r)を 用 い た 1-α 片側 信頼 区間 に対 して は,そ の被 覆 誤 差 は 0(π
なる
1)と
こ とが 示 され る.ま た,ブ ー トス トラ ップ信頼 限界 と理 論信頼 限界 の差 は 0(π
な り,こ
れ は一 次 の精度 しか もたな い こ とを意 味 す る.両 側信頼 区間 に対 して は,基 準量 ■ D,arど ち
1)で
らに基 づ い て も共 にその被覆誤差 は 0(π
あ り,片 側 信 頼 区間 の場 合 と収 束 のオ ー ダーが
変 わ る こ とに注意 す る.
ブー トス トラ ップ法 に基 づ く区間推 定 の近 似 精度 の評価 は, この よ うに標 本 数 に関 して漸近
的 な様 相 を調 べ ,一 つ の 目安 を与 え る こ とで行 われ て きた.ス チ ュー デ ン ト化 され た統計量 を
基準 量 として 用 い る こ とに よっ て 近 似 精 度 の 改 善 が 計 られ る とい う こ とは,Efron(1982),
Babu and Singh(1983),Hinkley and Wei(1984)等 に よって示 唆 され ,区 間推定 に関 して
は,Hall(1988a)に よって包括 的 な研 究 が 行 われ た.そ こで は,例 えば PF(│`聯 │≦ ″α
)の パ ー
セ ンタイ ル を用 い た対称信頼 区間 (Hall(1988b)),区 間 の長 さを考慮 した信頼 区間 に対 す る近
似精 度 も研 究 され た。
有効 な エ ッジ ワー ス展 開 に基 づ く上述 の議論 を行 うた め に は,パ ラメー タ θの推定量 に制 約
を置 く必 要 が あ る.ブ ー トス トラ ップ法 の理 論研 究 で しば しば用 い られ たのが ,多 変量 ベ ク ト
ル平均 の十分 滑 らか な関数 として表 され る推定量 で あ る (Bhattacharya and Ghosh(1978),
その他 ,小 西 (1990,p.157),Hall(1992a,p.52)).ま た,十 分 滑 らか な統計 的汎関数 で 定義
され る推定量 も用 い られ た (Sen(1988),Akahira and Takeuchi(1991),Konishi(1991)他 ).
統計 的汎関数 の エ ッジワー ス展 開 につ い て は,von Mises(1947),Reeds(1976),Withers
(1983),Beran(1984a),Pfanzagl(1985),Takahashi(1988)等 を参 照 され た い。
4.5。
3
近似精度 の 改善
ブー トス トラ ップ法 の近似 精度 は,エ ッジ ワー ス展 開 を通 して捉 える こ とが で き,有 効 に基
準量 を設 定 すれ ば精度 の改善 が 計 られ る こ とが 分 か る。本節 で は,近 似精度 改善 のため に提 案
され て きた い くつか の手 法 を紹介 す る.
(変 換 に基 づ く方法 )Abramo宙 tch and Singh(1985)は
,ス チ ュー デ ン ト化 され た統計量
ニ
コー
に対 して
ッ シュ・ フ ィッ シ ャー 展 開 を適 用 す る こ とに よ り,二 次 の 多項 式 で与 え られ る
基準 量 (■ s)を 提 案 した.こ の基 準量 の分布 を正 規 近似 した場合 ,誤 差項 のオ ー ダ ー は π
1で
あ
るの に対 して,■ sに 基 づ くブー トス トラ ップ分布 を用 い れ ば,よ り高次 の精度 が 得 られ る こ と
を示 した.し か し,こ の方法 は多項 式変換 に基 づ くこ とか ら,歪 みの大 きな推 定量 に対 して は,
■ sの 定義域 内 で単調性 が くずれ適 用 で きな い場 合 が あ る こ とか ら利 用上 注意 を要 す る.こ れ
に対 して,Konishi(1991)は ,正 規化 変換 の理 論 (Konishi(1981,1987))に 基 づ い て, この
欠点 を克服 した単調性 を有 す る基 準量 を提 唱 し,近 似精度 に関 して も ■ sと 同様 の精 度 を もつ
こ とを示 した.Hall(1992b)は ,二 次 の 多項 式変換 を用 い て単調性 を有 す る基 準量 を提 唱 した.
で は,例 えば標 本相 関係 数 の よ うに,有 効 な分 散推定 が 難 しい場 合 に は ど うすれ ば よい か。
一 つ の方法 は,推 定量 を変換 して,そ の分散 が で きるだ け未知 の確 率分布 Fに 依 存 しな い よ う
にす る方 法 が 考 え られ る.Tibshirani(1988)は ,二 段 階 ブー トス トラ ップ法 と平 滑化 法 を併 用
して,分 散安 定 化 変 換 を数 値 的 に求 め るア ル ゴ リズ ム を提 案 した.関 連 研 究 と して DiCiccio
302
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
and Romano(199o)が あ る.し か し,ノ
ンパ ラメ トリックモ デル の もとで ,変 換形 を どの よ
うに推定 す るか は今後 の研 究課題 で あ る.な お,Davisonグ α′
。(1992)は ,Tibshirani(1988)
の提 唱 した もの と基 本 的 に は同 じアル ゴ リズム に よって,部 分尤度
関数 の推定 を試 みて い る
.
(Efronの 方法 )EfrOn(1981,1982)に よって提 唱 され た近似 信頼 区間 は,当 初 ブー トス ト
ラ ップ分布 ε(″ )=砕 (み ≦χ)の 100α %点 を用 い る もので あ った
.そ の近 似精度 は,推 定量 の
バ イ アス,歪 みの大 きさに影響 され ,精
度 の点 で 問題 が あ る こ とが 指摘 され た.こ れ に対 して
Efron(1981,1985,1987)は ,そ の一 連 の論文 の 中 で ,基 本 的 に は変換 に基 づ
くが ,他 とは異
なる観点から近似信頼区間の精度の改良を試みてきた.な お,身 のブートス トラップ分布を
用
いた場合と/万 (み 一∂)の 分布を用いた場合 とでは,異 なる信頼限界を
与えることに注意する
(Hall(1988a,p。 933;1992a,p.95)).
Efron(1981,1985)は ,ま ず バ ィ アスの修正 を数値 的 に取入 れ る方法 を
提 唱 し,次 に Efron
(1987)で ,バ イアス と解析 的 に求 めた歪 み の修 正 を同時 に取 り入 れ た近 似信
頼 区間 を提 唱 した.
EfrOnの 提 唱 した この近 似 信頼 区間 は,BC区 間 (Accelerated bias‐ cOrrected percentile
interval)と 呼 ばれ ,そ の理論 的基礎 を推定量 の変換理論 にお い て い
る.そ の特徴 は,変 換 の た
めの 関数 を具 体 的 に導 出す る過 程 を,ブ ー トス トラ ップ反 復抽 出 で き えて い
置 換
る点 に あ る.
Konishi(1991)は ,統 計 的汎 関数 の枠組 み の 中 で ,こ の変換 が 分散安
定化 変換 と正 規 化変換 の
合成 関数 で表 され る こ とを示 した。 その他 EfrOnの 方法 に基 づ く区間 推定法 として は
,DiCic_
cio and Tibshirani(1987),DiCicciO and Rornano(1989a)等 が あ る
た
.ま
,Efron(1992b)
で は,パ ーセ ン タイ ル ,バ イ アス等 の ブー トス トラ ップ推定値 が
,個 々 の観 測 デー タの影響 を
どの程度 受 けて い るか を診 断す る方法 が提 案 され て い る。
(プ ー トス トラ ッ プ反 復法 )パ ー セ ン タイ ル の推定値 の精 度 を逐 次改善 す る
観 点 か ら捉 えた
手 法 が ,Loh(1987,1991)の Calibrated methodで あ る。 い ま,大 きさ %の
標本 χ″に基 づ い
て構成された信頼係数 1-α の近似信頼区間を(― ∞,∂ (α ,χ ″
)]と する.こ の区間がパラメータ
θを含む確率 π(α )=PF(θ ≦′[α ,χ ″
1-α
,近
似的に
で
]}は
ある.そ こで,信 頼限界 θ(α ,χ ″
)を
構成 したときのαあるいはパーセンタイルをうまく修正すれば,π (β α
)=砕 {θ ≦∂(β α
,χ ″
)}=1
-α とできると考えられる
関数π )は 未知であるから,こ れをブートストラップ法で推定し″(β α
)=砕 {∂ ≦θ(β α
勝)}=1-α を満たすβαを求め,初 めの信頼限界を修正した∂(β α
,χ π
)を 新たな信頼限界とす
.
(。
,
る.こ のプ ロセス を繰 り返す ことによって,理 論上 は θに対 する被覆確率 を
限 りな く 1-α に近
づ ける こ とがで きる
.
これ を分布関数の観点 か らみ ると,ブ ー トス トラップ分布の近
似精度 は,そ の分布がで きる
だけ未知 の確率分布 Fに 依存 しないよ うな基準量 (漸 近 的枢軸変量 )を
構成す ることによって
改善が可能となる.言 い換えると,何 らかの基準量 P(χ ″
,T(F))に 対して,PF{R(χ ″
,T(F))≦
J/2)が
″}=の (″ )+0(π ―
き
るだ
,で
け大きなノに対して成り立てばよい.ス チューデント化され
た統計量 に対 して は,ノ =1で あ る.Beran(1987)は ,こ の よ うな基
準量 を分布 関数 に よる変
換 を逐 次行 って求 め る方 法 を提 唱 した.同 様 な考 え方 に基 づ く方法 として
,Hall(1986b)の
Additive correctiOn,DiCicciO and Rornano(1989a)の Autornatic percentile rnethodが
あ
り,ブ ー トス トラ ップ反復 法 の理論 研 究 として は,Hall and Martin(1988),Martin(1990)
が あ る.
DiCicciO θ
′α′
。(1992)は ,ブ ー トス トラ ップ反復 法 の実行 プ ロセス の 中 に鞍
点近似 法 (Sadd_
lepOint approximatiOn;Daniels(1954),Reid(1988))を 組 み入 れ る こ とに
よって,計 算量 を
減 少 させ る方 法 を提 案 した。ブー トス トラ ップ分布 を解析 的 に近似 す るための
鞍 点法 の利 用 は,
DavisOn and Hinkley(1988),Daniels and Young(1991)等
に よって研 究 され た.
統計的推測理論の現状
303
ブー トス トラ ップ反復 法 に よって理 論 的 に精 度 の 改善 が 計 られ た として も,実 行上 ,多 段 階
ブー トス トラ ップ標 本 ,す なわ ち枝 分 かれ 的 にブー トス トラ ップ反復抽 出 を行 う必 要 が あ り,
膨 大 な計 算時 間 を必 要 とす る.ま た,反 復 の プ ロセ ス を どの段 階 まで 実行 すれ ば よい か とい う
問題 も残 る.数 値 的 に これ らの 方法 が 有効 で あ るか ど うか は,今 後十分 に検 討 す る余地 が あ る.
ブー トス トラ ップ反復 法 は,解 析 的 アプ ロー チ に基 づ く Hall(1983),Withers(1983,1984),
Peers and lqbal(1985),Abramovitch and Singh(1985)等 の研 究 に対 応 す る.す なわ ち,エ
ッジ ワー ス,コ ー ニ ッ シユ・ フ イ ッシ ャー 展 開 に基 づ い て,推 定 量 の高次 の キ ュム ラ ン トを推
定 し,逐 次取 り入 れ てい くこ とで達成 で きる.実 際 には,高 次 の キ ュム ラ ン トを陽 に表 す こ と
は難 しい場 合 が ほ とん どで , これ を数値 的 に実行 す るア ル ゴ リズ ムが ブー トス トラ ップ反復 法
で あ る とい える.
4。
5.4 近 似信 頼域 の構 成 と検 定
夕次元パラメータベクトル θのある推定量を θとする.も し,推 定量の分散共分散行列の有
効な推定量が存在すれば,こ れを
お く.基 準量 として JsD=77(∂ 一θ)あ るいは なr=v7
2(∂ _θ
ν
,一
)を 用いて,PF(女 。
)∈ Rα'と
)=1-α となる最小の領域を何らかの方法で推定し,こ れを
pl。 )と
ぉ く.こ のとき有意水準 1-α の信頼域は,{∂ 一πV2″ ;″ ∈prり または{θ 一% ン 2,1″ ″
″∈prTり で与えられる
Hall(1987b)は ,反 復抽出されたブー トス トラップ標本 に基づ く発rの 値 に,密 度関数の推
定法を適用し
推定 した.し かし,同 時に種々の問題点があることも指摘 した.同 時信頼
'fr)を
と
区間 を含 め た研
して
は,標 本 分 散 共 分 散 行 列 の 関 数 と して 与 え られ る推 定 量 に対 す る
究
;
.
Beran and Srivastava(1985)の 研 究 ,因 子分析 にお け る因子 負荷量 に対 す る Ichikawa and
Konishi(1992)の 研 究 ,そ の他 Beran and Millar(1986),Beran(1988α
)の 理論 研 究 な ど
が あ る.
信頼 区問 ,信 頼域 を構成 す るた めの手法 として は,Owen(1988)の 提 唱 した経験尤度 法 が あ
る.こ の手 法 につ い て は,Owenの 論 文 と共 に,そ の基本 的 な考 え方 を手短 に述 べ た小 西 (1990,
p.155)お よび Hall and Scala(1990)を 参 照 され た い.経 験 尤度法 の漸近 的 な性質 を中心 と
した研 究 は,Owen(1990),DiCiccio θ′α′
。(1991)で 行 われ ,ま た,DiCiccioグ α′
。(1989)
は,あ るパ ラメ トリックモ デ ル の尤度 関数 と経験 尤度 関数 の比較 を行 って い る.さ らに,符 号
付 き経験 尤度比 統計 量 の被覆誤差 の改 良法 (DiCiccio and Romano(1989b)),経 験 尤度 に基
づ く信頼 域 の精度 の改善 法 (Hall(1990c)),経 験 尤度法 の 回帰 モ デルヘ の応 用 (Owen(1991))
が それ ぞれ研 究 され て い る.
ブー トス トラ ップ法 の検 定 問題 へ の応 用研 究 も行 なわれ た。 一 つ の 方法 は,構 成 した近似 信
頼 区間 あ るい は信頼域 へ ,設 定 したパ ラメ ー タの値 が 含 まれ るか否 か に よって検 定 で きる.あ
るい は,ブ ー トス トラ ップ法 の考 え方 を応 用 して ,仮 説 の も とで検 定統計量 の分布 を近似 した
り,夕 値 の推定 を行 う こ とも基本 的 に は可能 で あ る.し か し,複 雑 な 問題設定 に対 して は種 々
の工 夫 が 必 要 とな る.各 種検 定 問題 へ の応 用 につ い て は,Beran and Srivastava(1985),Beran
(1986),Beran(1988b),Rornano(1988c),Boos and Brownie(1989),Hall and Hart(1990),
Hall and Wilson(1991),Nagao and Srivastava(1992),Zhang and Boos(1992)箸 雲を参照ヨさ
れ た い.
4.6 有 効 な プー トス トラ ッ プシ ミュ レー シ ョン
例 えば,大 きさ %の 標 本 χヵに基 づ く推定量 θ″のパ ラメー タ θに対 す るブー トス トラ ップバ
イ アス推定 は,次 の よ うに実行 され る (4.2節 (4.1),(4.7)式 ).
日本 統 計 学 会 誌
10
。
第 22巻
第 3号 (増 刊号 )1993
← 推 定 ― ε(F)=勝 [努 一 a l∼ εB=告
θ
自 砕 )一
b(F)=EF[a 列
“
すなわち,バ イアス b(F)は ,モ ンテカルロ法 によって数値的 に近似 された εBで もって推定さ
れる.近 似値 εβは,標 本 χ″が与 えられた とい う条件 のもとで,ブ ー トス トラップ反復回数を
無限大 にすると,確 率 1で ε(F)に 収東する.従 つて,有 限なBに 対 してはシミュレーション
誤差が生 じ,こ の誤差を制御す るための種々の方法が研究 されてきた.有 効 なブー トス トラッ
プシミュレーション法 (Efflcient bootstrap simulation)と は,標 本 χ″が与 えられたもとで
εBの 分散 を可能な限 り小 さくするための手法 と考 えることができる.分 散,確 率分布,パ ーセ
,
ンタイルの推定 に対 しても同様である
有効 なブー トス トラップシミュレーション法を適用すれば,通 常 の経験分布関数からリサ ン
プリングを行 う方法 (一 様 リサ ンプ リング)と 比較 して,相 対的にブー トス トラップ標本 の反
復抽出の回数 を減 らす ことも可能 となる.こ れは,4.5.3節 で述べた多段階のブー トス トラップ
標本 の抽出を必要 とするような,ブ ー トス トラップ反復法を適用す る際 に特 に有効 となる
.
.
これ まで に提 唱 され た い くつか の手 法 の 中 で ,最 も実用性 が 高 い と思 われ るのが ,Davison θ′
。(1986)に よる釣 合 い型 ブー トス トラ ップ (Balanced bootstrap)で あ る.こ れ は,π 個 の
α′
観 測 デ ー タの各 々が ,B回 の リサ ンプ リングの中 で 同 じ回数 だ け現 れ るよ うに した もので ,簡
単に述べると次のようにしてブー トス トラップ標本を抽出する。例えば,大 きさ3の 標本 {″
均,χ 3)に 対 して,仮 に3回 の反復抽出を行うとする.ま ず,デ ータの添え字のコピーを3組作 り
1,
並べる.次 に,こ れをランダムに並べ替え,そ の結果 {2,1,1,3,2,1,3,2,
3)と なったとする.釣 合い型ブートストラップでは,{め ,″ 1,″ 1},{銑 ,め ,″ 1},{銃 ,め ,娩 }を ブー
トストラップ反復標本とする
この釣合型 ブー トス トラ ップ法 に対 して,計 算実行 上 の異 な る 3通 りのア ル ゴ リズ ムが
。(1990)に は,高 次 の釣合 い型 ブロ ック計画 と
Gleason(1988)で 与 えられた.Graham θ′α′
の関係 が述 べ られて い る.Hall(1989b,1990d)は ,推 定量 が多変量平均 ベ ク トル の滑 らかな
関数 として与 えられ るとき,釣 合型 ブー トス トラップの漸近的性質 を明 らかにした
。(1986)は ,統 計 的汎 関数 で定義 され る推 定 量 aに 対 して, 努 一 ∂か ら線
Davison θ′α′
形項 ,す なわ ち (経 験 )影 響 関数 の項 を引 き去 った統計 量 に,通 常 の ブー トス トラ ップ法 の適
用 を提 案 した.こ れ は,線 形近似 法 (Linear appro対 mation method)と 呼 ばれ て い る.Efron
{1,2,3,1,2,3,1,2,3}と
.
.
(1990)は ,線 形項 を他 の方法 で置 き換 える方法 を提案 し,こ れ は,中 心化 法 (Centring method)
と呼 ばれ て い る (Hall(1992c, 4節 ),Do and Hall(1992)を 参照 ).Hall(1989b)は ,推 定
量 が 多変 量平均 ベ ク トル の滑 らか な関数 として与 え られ る とき,釣 合 型 ブー トス トラ ップ,線
形近似 法 ,中 心化 法 の三 つ の手法 は,漸 近 的 に は同値 で あ る ことを示 した.
一 般 に,平 均 ,分 散 が 共 に等 し く,共 分散 が 負 の二 つ の推 定量 を等 ウエ イ トで合 わ せ る と,
新 たな推定 量 の平均 は も との推 定量 に等 しいが ,分 散 は小 さ くな る.Hall(1989c)は ,こ の性
質 を利 用 して リサ ンプ リ ングの ア ル ゴ リズム を提 案 し,Antithetic resamplingと 名 づ けた.Do
(1992)は ,釣 合 型 お よび Antitheticリ サ ンプ リング法 を数 値 的 に比較検 討 し,釣 合 型 ブー トス
トラ ップ法 の有効性 をま
旨摘 した.
Johns(1988)は ,Hammersley and Handscomb(1964)の Importance samplingを 応用
した リサ ンプ リング法 を提 唱 し,パ ーセ ンタイ ル の推定 に於 い て,一 様 リサ ンプ リング を基準
として,反 復抽 出 の 回数 を一 ケ タ減 らす こ とが で きる こ とを示 した.基 本 的 なブ ー トス トラ ッ
プ法は, π個の観測値の各点に一様に確率 1ル を付与した経験分布関数を用いた.こ れに対し
て,各 観 測値 に あ るウ ェイ トをお い た確率分布 を構成 し,そ こか ら標本抽 出 を実行 す る.直 感
305
統計的推測理論 の現状
的 に は,推 定量 の分布 の裾 の部 分 のパ ーセ ンタイ ル の推定 に有効 な標 本 の抽 出確率 を高 くす る
よ う,観 測値 に基 づ い て新 た な分布 関数 を再 構 成 した とい え る.基 本 的 な考 え方 の説 明 は,例
えば小 西 (1990,p.156),Hall(1992a,p.298)を 参 照 され た い.
Hinkley and Shi(1989)は ,Importance samplingの 考 え方 を,Beran(1987)の 信頼 区間
の構 成 法 へ 応 用 し,二 段 階 ブー トス トラ ップ法 の 反復 回数 を減 少 させ る方法 を提 示 した.Do
and Hall(1991)は
,一 様 リサ ンプ リング を用 い て Importance samplingの 基 本 とな るウエ イ
トの一 つ の決 め方 を提 示 した.
謝 辞 :査 読者 の有益 な コメ ン トに感 謝 します
.
参 考 文 献
[1] Abramovitch,L.and Singh,K。 (1985). Edgeworth corrected pivotal statistics and the bootstrap.
4π 2.S″ ″s′ .13,116-132.
[2]Akahira,M.and Takeuchi,K.(1991).Bootstrap method and empirical process.4π η.Lsム
Stα力
なたMa′ 力.43,297-310.
[3] Akaike,H。 (1973).Information theory and an extension of the maximum likelihood principle.In
Rの ι
ttη 邸 グ 2π グ ル ″綱α
″ο%α ′助 ηゥ
ο
π f〃 ♭γ
s″ π θ
%α ″θ
ηl%ι θη (PetrOv,B.N.and Csaki,F.
“
eds.),Akademiai
Kiado,Budapest,pp.267-281.
[4]Akaike,H.(1974).A new look at the statistical model identincation.夏 彊E≫ απs.■ %ゎ π
.
Cθ π″.,AC-19,716-723.
[5]Akaike,H.(1980).Likelihood and the Bayes procedure(with discussion).In gω ぁあ%S滋 ″s″ ε
s
(BernardO,J.M.,De Gr00t,NII.H.,Lindley,D.U.and Smith,A.F.Ⅳ l.eds.),University Press,
Valencia,Spain,pp.143-166,pp.185-203.
[6]Arcones,M.A.and Ginё ,E.(1992).On the b00tstrap of』
functiOnals.In l)ψ わガηg″ ι
π′
θι′
たグ
Bθ θ
おヽ
ぃ )(R.LePage
イ‐
estimators and other statistical
and L.Billard eds.),Wiley,pp.13-
47.
[7]Babu,G.J.(1992).Subsample and half‐ sample methods.4η π.ルsム S滋 騰ムZα 物.44,703-720.
[8] Babu,G.J.and Singh,K。 (1983).Inference on means using the bootstrap.4%π .S診 ″sl ll,9991003.
[9] Babu,G.J.and Siigh,K。
(1984). On one term Edgeworth correction by EfrOn's b00tstrap.
Sα η
力均彦 Sθ ‰ A46,219-232.
[10] Babu,G.」 .and Singh,K.(1985).Edgeworth expansions for sampling withOut replacement from
anite pOpulations.ェ 」
Иπ筋″παル 4η αl 17,261-278.
[11]Banks,D.L.(1988).Histospline smoothing the Bayesian bootstrap.B′
[12]Barndor“ _Nielsen,O.E.and Cox,D.R。
Chapman and Hall,London.
ο%ι ″滋 75,673-684.
(1989).4ッ ″ わた ル 磁%脅 π6カ γ
1/sι
ル S滋 法″ι
s.
[13] Basawa,I.V.,ヽ 4allik,A.K.,NIIcConnick,W.P.and Taylor,R.L.(1989).BOotstrapping explosive
autoregressive processes. 24%π .Stα ″sl 17,1479-1486.
[14] Beran, R。 (1982).Estimated sampling distributions: The bootstrap and competitors.4π
S協″sl 10,212-225.
π
[15]Beran,R。 (1984a).Bootstrap methods in statistics.ノ
bθ た
πおル .Zα ル._レ υ″物 86,14-30.
'ι
[16] Beran,R.(1984b).Jackknife apprOximations to bootstrap estimates.4η
π.Sた πsA 12,101-118.
[17]Beran,R。 (1986).Simulated power functions.4η π.S滋 ″sl 14,151-173.
[18] Beran,R.(1987).Prepivoting tO reduce level error of cOnfldence sets. Bう
ηttα
o紗 zθ ′
74,457-468.
[19]Beran,R.(1988a).Balanced simultaneous conndence sets.ェ スπθ‰ S″ 施ムスssθ a 83,679-686.
[20] Beran,R.(1988b).Prepivoting test statistics:A bootstrap view of asymptotic reflnements.ェ
スタ
,zι κ Sね″
s洗 五ssο ε
.83,687-697.
[21]Beran,R.and Ducharme,G.R。
(1991).4ッ ″ わ″ 動 ιθη 力 /βθοお′
ψ Zθ ttθ あ 勿 S滋 麻″as.
Centre de Recherches Mathё matiques,Universitё de Montrё al,Canada.
[22] Beran,R.and Millar,P.W.(1986).Confldence sets fOr a multivariate distribution.4π η.S滋 ″sム
.
日本 統 計 学 会 誌
第 3号 (増 刊号 )1993
第 22巻
14, 431-443.
[23] Beran,R.and Srivastava,1/1.S.(1985). B00tStrap tests and confldence regions for functions of a
covariance lnatrix.Aπ π.S協 ″sた 13,95-115.
[24]Bhattacharya,Ro N.and Ghosh,J.K.(1978).On the validity of the formal Edgeworth expansion.
五%π o
S姥 ″s洗 6,434「 451.
[25] Bhattacharya,R.N.and Qumsiyeh,M.(1989).SeCOnd order and Lp_comparisons between the
■ηπo Stα″s″ .17,160-169.
bootstrap and empirical Edgeworth expansion rnethodologies.
ηηα′/リ ク知筋%α ″θπ απグ Aw″ わ″εEψ α%S′ θ%s.
ο
[26]Bhattac,arya,R.No and Rao,R.R.(1976).r√
Wiley,New York.
[27] Bickel, P・
J。
′cOnfldence bounds. In
(1992). TheOretical comparison of different bootstrap
後ψ,(R.LePage and L.Billard eds.),Wiley,pp.65-76.
おて
Lグ %り ′
√ Bο θお′
η
Eψ わガηg ttθ
[28]Bickel,P・ J.and Freedman,D.A。
(1981).
Some asymptotic theory for the bootstrap. Aπ
.
S滋 ″sム 9,1196-1217.
[29]Bickel,P.J.and Freedman,D.A。 (1983).B00tStrapping regression models With many parameters.
In A Fcstsε λ″ ′,γ Ettε あL.Lι λttα %π (Po J・ BiCkel,K.A.Doksum,and J.C.HOdges,Jr.,edS.),
Wadsworth,Bellnont,pp.28-48.
[30] BiCkel,P.J.and Freedman,D.A。 (1984).AsymptotiC normality and the bootstrap in stratined
sampling. 4%η .Stαガsた 12,470・ 482.
[31] BoOS,D.D.and Brownie,C.(1989).B00tStrap methods for testing hornogeneity of variances.
力πθ77zι
7診 θ
S 31,69-82.
′
πε
[32]Bose,A.(1988).Edgeworth COrrection
by bootstrap in autoregre.ssions' Ann' Statis'' 16' 1709-
1722.
t33]
t34]
estimaters of the prediction error
Bunke, o. and Droge, B. (1gg4). Bootstrap and cross-validation
1400-1424'
L2'
Stat/st'
Ann'
for linear regression models'
in nonparametric regression'
cao-Abad, R. (1gg1). Rate of convergence for the wild bootstrap
Ann.
tss]
Statist.
t9,
2226-2231.
chao, M. T. and Lo, s.-H.
(iggs). A bootstrap
method for finite population
.
sanklrya ser' A
47
'
399-405.
probabilities by bootstrap
chatterjee, S. and chatterjee, s. (1gg3). Estimation of misclassification
methods. Cθ 7η 7η ππo S滋 ″si B 12,645-656.
Application of bootstrap and other
[37]CherniCk,M.R.,Murthy,V.K.and Nealy,C.D。 (1985).
perfOrmance. Pattem Recognition Letters 3, 167-
t36l
resampling techniques:evaluation of classiner‐
178.
[38]ChemiCk,M.R.,Murthy,V.K.and Nealy,C.D.(1986).Correction note tO
'Application of
Pattem Recog'
bootstrap and Other resampling techniques:evaluation of classifler performance'.
姥寄 4,133-142.
πブ
″θ%Lθ ′
五%π .カレル.S″ 減sム 25,631-650.
[39]Daniels,H.E.(1954).Saddlepoint approximations in statisticζ
[40]Daniels,H.E.and Young,G.A.(1991).Saddlepoint approximation for the studentized mean,with
an appliCation to the bootstrap.
B=077oθ
π々α78,169-179.
′
[41]Davis6n,A.C.and Hall,P。 (1992).On the bias and variability of boOtstrap and crOSS‐
estilnates of error rate in discrilninant problems.
validation
″乃α79,279-284.
πθ′
グ
正〕
θ夕
[42]Davison,A.C.and Hinkley,D.V.(1988).Saddlepoint approximations in resampling methods.
η々α75,417-431.
77zι ′
B′ θ
[43]Davison,A.C.,Hinkley, D.V.and SChechtman,E.(1986).Ettcient b00tstrap simulation.
屹力α73,555-566.
B=oηzι 力
[44]Davison,A.C.,Hinkley,Do V.and WortOn,B.J.(1992).
Bootstrap likelihoodS.
Bt072ι 力屹たα79,113
-130.
[45] De Angelis,D.and Young,G.A.(1992).BootStrapping the correlation coettcient:A comparison
Of smoothing strategies.工 S放 麻 i Cο ゆ%た
“
Sπ πι
・40,167-176.
validation in ridge
[46] Delaney, N.J.and Chatteriee, S.(1986).Use Of the bootStrap and Cross‐
regression.工 B多 6.Ecoπ .S滋 ″s14,255-262.
.4π θた248,116
intensive methods in statistics.Sθ ′
[47]Diaconis,P,and Efron,B。 (1983).Computer‐
エ
58-75).
ンス
イ
い
,13,頁
-130(松 原 望訳 (1983): コンピユー ターがひ らく新 し 統計学 ,サ
統計的推測 理論 の現状
307
[48]DiCiccio,T.J.and Romano,J.P.(1988).A re宙 ew of bootstrap conndence intervals.ェ R.S滋 ″SA
Sθ
`.Sι
‰ B50,338-354.
[49] DiCiccio,T.J.and Romano,J.P.(1989a).The automatic percentile method:accurate conndence
limits in parametric models.Cα παグ′
αηェ S滋 減Sム 17,155-169.
[50] DiCiccio,T.J.and Romano,J.P.(1989b).On adiuStments based on the signed root of the
empirical likelihood ratio statistic.
れたα76,447-456.
2zι 力
ο夕
Nonparametric conndence limits by resampling methods
′
. Sι α
ムRι υ.58,59-76.
Bう
[51]DiCiccio,ToJ.and Romano,J.P.(1990)。
and least favorable fanlilies.
Iπ
[52]DiCiccio,T.」 .and Tibshirani,R。 (1987).Bootstrap confldence intervals and bootstrap approxima―
た S滋 麻ムAssθ ε
.82,163-170.
tions.ェ スπθ
[53]DiCiccio,T.J.,Hall,P.and Romano,J.P.(1989).Comparison of parametric and empirical
likelihood functions. I〕 ′
′
万々α76,465-476.
θ,η θ
[54]DiCiccio,T.J.,Hall,P.and Romano,J.P.(1991).Empirical likelihood is Bartlett‐
24π %。 Sta″ sム
correctable.
19,1053-1061.
[55] DiCiccio,T.J.,Martin,M.A.and Young,G.A.(1992).Fast and accurate approximate double
bootstrap confldence intervals.
B=o22zθ
洗 α79,285-295.
"乃
[56] Dielrnan,T.E.and Pfaffenberger,R.C.(1988). Bootstrapping in least absolute value regression:
An application to hypothesis testing. COη zttzπ η.S協 ″sム ‐S′ ηz%ム Cο ″ πl 17,843「 856.
[57]Dikta,G。 (1990).Bootstrap approximation of nearest neighbor regression function estimates.エ
〃πル.4π α洗32,213-229.
[58]Do,K.‐ A。 (1992).A simulation study of balanced and antithetic bootstrap resampling methods.
.3π ″.40,153-166.
工 S滋 麻 10%ク π″
η物 78,161A.and
Hall,P。
(1991).On importance resampling for the bootstrap.2θ πι′
[59]Do,K.‐
167.
[60] Do,K.‐ A.and Hall,P.(1992).Distribution estimation using concomitants of order statistics,with
application to Monte Carlo silnulation for the bootstrap.
メ R.Stα″S′ .Sο
`.B54,595-607.
[61] Ducharme,G.R.,Jhun,M.,Romano,J.P.,and Tnlong,Ko N.(1985).Bootstrap conndence cones
for directional data.
Bう
o夕
ηι
力
屹ルα72,637-645。
[62]Efron,B。 (1979).Bootstrap methods:Another look at the jackknife.■ %π .S滋 麻
`.7,1-26.
[63] Efron,B.(1981).Nonparametric standard errors and confldence intervals(with discussion).
Cα η
α滅 ェ
S″ ″s洗 9,139-172.
ι工 ルカπ姥 励ιBθ θお″ψ απグ Ottθ γRι sα ″ ″ηg P滋 %S.SIAM,Philadelphia.
[64]Efron,B.(1982).例 を
zε
[65]Efron,B.(1983).Estimating the error rate of a prediction rule:Improvement on cross‐
工 五%ι た S滋 法ムAssθ a 78,316-331.
[66]Efron,B.(1985).Bootstrap confldence intervals for a class of parametric problems.B′
validation.
θπι
′
πルα
72,45-58.
た″
[67]Efron,B.(1986).How biased is the apparent error rate of a prediction rule?.工 4π ι‰ Sι α′
.
ノ
lssθ ε
. 81, 461-470.
[68]Efron,3.(1987).Better bOotstrap cOnfldence intervals(with discussion).工
4π θた S″ 麻た4ssο θ
.
82, 171-200.
.85,79-89.
[69]Efron,B。 (1990).More emcient bootstrap computations.ェ 4π ιた S滋 法ムAssθ θ
お 9/Bθ οお ,(R.
[70]Efron,B.(1992a).Six questions raised by the bootstrap.In Eψ わ万ηg ttθ L′ πグ
=ゅ
LcPage and L.Billard eds.),Wiley, pp.99-126.
[71] Efron,B。 (1992b). Jackknife‐ after‐ bootstrap standard errOrs and inauence functions(with discus‐
sion).工 Ro S滋 ″S′ .Sθ θ
.B54,83-127.
[72] Efron, B. and Gong, G.(1983).A leisurely look at the bootstrap, the iackknife, and cross‐
validation. 4夕 ν
zθ た S協′
おム37,36-48.
[73] Efron,B.and Tibshirani,R。 (1986).Bootstrap methods for standard errors,confldence intervals,
and other measures of statistical accuracy.
S″
ι
%ε θl,54-77.
″3魔総′Sθ ′
[74] Faraway,J.J。 (1990). Bootstrap selectiOn of bandwidth and conidence bands for nonparametric
regression.ェ S″ ″SA Cθ ″ πたSJ″ %ム 37,37-44.
[75] Faraway,J.J.and Jhun,M.(1990).Bootstrap choice of bandwidth for density estimation.ェ
4%θ ‰ S滋 麻洗Assο
`.85,1119-1122.
308
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
[76]Findley,D.F.(1986).On b00tStrap eStimates of forecast mean square errors for autoregressiVe
ι (D.M.Allen ed.),Elsevier Science
ιfπ 厖´ ε
θ
η απ″ S滋 ″sttCs f:Ⅳ り
processes.In COη ψ%″ γSθ ′
“
Pub。 ,pp.11-17.
[77]Fisher,N.I.and Hall,P.(1989a).BoOtStrap confldence regions for directional data.工
4π ι筵
.84,996-1002.
Sta″ si Assο θ
θπ
ι tt
[78]Fisher,N.I.and Hall,P。 (1989b).BoOtStrap methOdS for directional data.In PЮ “
グ ′」笏 ηπαttθ η,Institute of Statistical Mathematics,Tokyo,
怒′
′
π%θ πttι 4π α″Sお 0/Sた 力
5ン か
ttη
“
tZg]
[80]
pp.275-299.
Fitzmaurice, G. M., Krzanowski, W' J' and Hand, D' J' (1991).A Monte Carlo study of the 632
bootstrap estimator. J. of Cl'assif'cation 8,239-250'
Ann. Statist. 20,
Franke, J. and H2irdle, w. (1992). on bootstrapping kernel spectral estimates.
121-145.
η.S滋 麻 ム9,1218-1228.
[81]Freedman,D.A.(1981).BootStrapping regression models.4η
squares estimates in stationary linear
[82] Freedman,D.A.(1984).On b00tStrapping two‐ stage least‐
models. 4%κ .S協 ″sた 12,827-842.
[83] Freedman,D.A.and Peters,S.C.(1984a).BoOtStrapping a regression equation:SOrne empirical
results.工 ■%θ た S滋法 ム AsSθ ε.79,97-106.
[84]Freedman,D.A.and Peters,S.C。 (1984b).BootStrapping an econometric model:Some empirical
results.工 Bお 。Ecoπ .S滋 ″s′ .2,150-158.
[85]Ganeshanandam, S.and Krzanowski, W.J。
(1990).Error‐ rate estimation in tWo‐ group di‐
工 S診″Sム Cθ ″夕πi
scrirninant analysis using the linear discrilninant function.
[86]Geisser,S.(1975).The predictive sample reuse method with applications.工
70,320-328.
[87]Gleason,J.R。 (1988).Algorithms for balanced bootstrap simulations.42θ
%%136,157-175.
S′ 夕
4π ι‰S滋 ″sム
Assθ θ
.
κ S滋 麻 た42,263-266.
[88] Gong,G.(1986).CrosS‐ Validation,the iackknife,and the bootstrap:Excess error estimatiOn in
forward logistic regression.工 4π θκ S滋 麻 ム AsSθ ε.81,108-113.
[89]Graham,R.L。 ,Hinkley,D.V.,John,Po W.M.,and Shi,S.(1990).Balanced design of bOotstrap
simulations.工 R.S滋 ″Si
.Sa‰
Sθ ε
B52,185-202.
[90] Hall,P.(1983).Inverting an Edgeworth expansion.4η
η.S協 ″sl ll,569-576.
[91] Hall, P.(1986a). On the number of b00tstrap simulationp required to construct a confldence
なた 14,1453-1462.
interval. 24π η.S滋 洗
%。
S滋″sl 14,1431-1452.
.Sθ ‰ B49,82-89.
Sθ θ
[92] Ha11,P.(1986b).On the bootstrap and COnfldence intervals.4η
R.S滋 激SA
[93] Hall,P.(1987a).On the bootstrap and continuity correction.工
[94] Hall,P.(1987b).On the bootstrap and likelihood‐
493.
[95]Hall,P.(1988a).TheOretical comparison of
π々α74,481based confldence regions.3′ οπι′
bootstrap confidence intervals (with discussion)
Aη π.S滋 ″sl 16,927-985。
t96] Hall, P. (1988b). on symmetric bootstrap confidence intervals.
t97] Hall, P. (1989a). unusual properties of bootstrap confidence
Probab. Th. Fields 81,247-273.
[98]Hall,P.(1989b).On emcient bootstrap simulation.30%θ
工 R.S放 滅Sム
'
‰ B50,35-45.
Sθ
`.Sθ
intervals in regression problems.
婉滋 76,613-617.
協物 76,713-724.
ι
[99]Ha11,P。 (1989c).Antithetic resampling for the bootstrap.30π
[100] Han,P.(1990a).Using the bootstrap to estimate mean squared error and select smoothing
「πJ″ υ
α″αル.Aπ α′32,177-203.
ル
parameter in nonparametric problerns.ノ
[101] Hall,P.(1990b).On the relative performance of b00tstrap and Edgeworth approximations of a
″。4π αJ.35,108-129.
工 ″π′
Pseudo‐ likelihood theory for empirical likelihood. 4π
distribution function.
[102] Hall,P.(1990c)。
%.S″ ″Sた 18,121-140.
[103] Han, P.(1990d). PerfOrmance of balanced bootstrap resampling in distribution function and
ι
ο″ソRι ム ■oJJs.85,239-260.
1「 乃
ωο″んE″ )α πSあ η
・ Springer‐ Verlag,New york.
ι
%の
απグ Eぬθ
θ
お
ι
Bθ
Ha11,P.(1992a).動
たムS9θ .&猛 鳥 54,221
R.S″ ι
quantile problems.
[104]
Iり つbα b.
[105]Hall,P.(1992b).On the removal of skewness by transformation.工
-228.
71ψ ,(R.LePage
θお′
π′
お Q/βθ
あ万ηg ttθ ι′
[106]Hall,P.(1992c).Efncient b。 。tstrap simulation.In Eψ
統計的推測 理論 の現状
and L.Billard eds.),Wiley,pp.127-143.
(1990).Bootstrap test for difference between means in nonparametric
.85,1039-1049.
regression.工 4π ι
4 S滋 麻ム4ssθ θ
Oπ グ″物 75,661-671.
[108]Hall,P.and Martin,M.A。 (1988).On bootstrap resampling and iteration.β ′
[107] Hall,P,and Hart,J.D。
エ
[109] Hall,P.and Pittelkow,Y.E.(1990). Silnultaneous bootstrap confldence bands in regression.
.37,99-113.
S協″si Cο ″ψ%ム SJ夕 23π ′
[110] Hall,P.and Scala,B.L.(1990).lⅥ ethodology and algorithms of empirical likelihood.」 吻ムS姥 ム
Rι υ
. 58, 109-127.
カ
[111]Hall,P.and Wilson,S.R.(1991).Two guidelines for bootstrap hypothesis testing.B′ θ%θ リ
47,
“
757-762.
η.S滋麻″
[112]Hall,P.,DiCiccio,T.J.,and Romano,J.P.(1989).On sm00thing and the bootstrap.4π
.
17,692■ 704.
[113]Hammersley,I.M.and Handscomb,D.C.(1964).ノ Иθπル Cα θZθ ttθ ゐ。 Wiley,New York.
z′
[114]Hampel,F.R。 ,Rousseeuw,P.J"Ronchetti,E.M.and Stahel,W.A.,(1986).Rθ 多郷′S勉 法″6s ρttι
λら ι
η ルι
ηθ
″οπtt Wiley,New York.
グ οπ ′
″
ノπι
″´ηαθ
“
“
[115] Hand,D.J.(1986).Recent
advances
in error rate estimation.Л
ηa
α
′
ι
θ
Rι ε
解
′
″θπLι ′
ι
ι
冬 4,335
-346.
[116]Hardle,w.and Bowman,A.W。
(1988).Bootstrapping in nonparametric regression:Local
adaptive smoothing and conndence bands。
た S協 ″S′ .4ssο ε
.83,102-110.
工 4π θ
[117]Hardle,w.and Marron,J.S.(1991).Bootstrap simultaneous error bars for nonparametric
regression. 4π π.
Sta″s′ . 19,778-796.
[118]Hardle,w.,Hall,P.and Marron,J.S.(1988).How far are autOmatically chosen regression
.83,86-101.
smoothing parameters from their optimum? 工 4π θた S滋 麻ム4ssθ θ
ス解ι
‰ S滋 法ム4ssθ θ
.64,1303
[119]Hartigan,」 .A.(1969).Using subsample values as typical values.ェ
-1317.
[120] Hartigan,J.A.(1971).Error analysis by replaced samples.工
[121]Hartigan,J.A。
(1975)。
R.S滋
Sθ ε
.Sθ κ B
33,98-110.
"Sム ioint nOrmality of a
Necessary and sumcient conditions for asymptotic
statistic and its subsample values.
4π π.
″s13,573・ 580.
Sムα
[122]Hinkley,D.V.(1988).Bootstrap methods.工 R.S滋
`.Sθ
‰ B50,321-337.
"sithe
Sθ nested bootstrap.Btottι
[123] Hinkley,D.V.and Shi,S.(1989).Importance sampling and
ι
力滋
76,
435-446.
・
[124] Hinkley,D.V.and Wei,B.‐ C.(1984).Improvements of iackknife conndence limit methods.
7z々 α71, 331-339.
B=θ πι
″
[125]Honda,M.and Konishi,S.(1988).Comparison of variable selection procedures in discriminant
analysis under nonnormal populations,In S勉 庵 Ecα ι り
ι
θη απグ 」り滋 4η α夕sお ff(Ko Matusita,
`Ⅳ
ed。 ),North‐ Holland,Amsterdam,337-347.
[126]Ichikawa,M.and Konishi,S.(1992).Application of the bootstrap methods in factor analysis.
Fokyo.
Research Memorandum No.457,Institute of Statistical Mathematics,「
free
information
criterion.Research
WIC:An
Estimator‐
[127]IshigurO,M.and Sakamoto,Y.(1991)。
Memorandum No.410,Institute of Statistical Nllathematics,′ rokyo.
[128]石 黒真木夫 ,坂 元慶行 ,北 川源 四郎 (1992).ベ イズモ デル と EIC.第 60回 日本統計学会講演予稿集,頁
264-266.
[129]Jaeckel,L.(1972).The ininitesimal Jackknife.Bell Lab Memorandum MM 72-1215-11.
[130] Jain,A.K。 ,Dubes,R.C.and Chen,C.‐ C.(1987).Bootstrap techniques for error estimation.助
物 ηs.′し″ 4η α′
.Ma滋 .Iη ″ム PAMI-9,628-633.
[131]Johns,V.(1988).Importance sampling for bootstrap coI面 dence intervals.ェ 42ι κ S″ 麻ム4ssθ ι
.
83, 709-714.
´
[132]北 川源四郎 (1991).対 数尤度 のブー トス トラ ップについて。統数研共同研究 レポー ト31,時 系列 に関す
る推測 の理論 と応用 ,175-179.
[133]北 川源四郎 ,石 黒真木夫,坂 元慶行 (1992).EICに よるモ デル の予測評価。第 60回 日本統計学会講演
予稿集 ,頁 258-260.
[134]Kipnis,V.(1992).Bootstrap assessment of prediction in exploratory regression analysis.In
πψ,(R.LePage and L.Billard eds.),Wiley,pp.363-387.
助 わ万れg ttι L′ %′ お (√ Bθ θお′
310
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
[135] Konishi,S.(1981).Normalizing transformations of some statistics in multivariate analysis.
B′θ
夕
2zι ι
れたα68,647-651.
[136] Konishi, S.(1987).Transformations of statistics in multivariate analysis.In 4グ
υ
απε
η
ω ′
ルrπ ′
″″万αた s滋 法厖cα J∠ πα夕Sお (Ed.A.K.Gupta).D.Reidel,Dordrecht,213-231.
[137]小 西貞則 (1988).ブ ー トス トラ ップ法 による推定量 の誤 差評価 .赤 池弘次監修 :パ ソコンによるデータ
解析 ,朝 倉書店 ,頁 123-142.
[138]小 西貞則 (1990).ブ ー トス トラ ップ法 と信頼 区間 の構成 ,応 用統計学 19,137-162.
[139]Konishi, S.(1991)。
α
Sι ttsム
Normalizing transformations and bootstrap conndence intervals.4π
%.
19, 2209-2225.
[140]小 西貞則 (1992a).対 数尤度 のバ イアス補 正 と情報量規準。第 60回 日本統計学会講演予稿集 ,頁
[141]小 西貞則 (1992b).ブ ー トス トラ ップ法 と予測誤差推定 .東 京大学統計学輪講資料
39-40.
.
[142] Konishi,S.and Honda,M.(1990).Comparison of procedures for estimation of error rates in
discrinlinant analysis under nonnorrnal populations.
工 S協″Sム
η%ム
Cθ ″ゅ%た S′ 夕
36,105-115.
[143]小 西貞則 ,本 多正幸 (1992).判 別分析 にお ける誤判別率推定 とブー トス トラ ップ法。応用統計学 21,67
-100.
π S滋 にSttcs,Vol.I:Foundations and
[144]Kotz,S.and JohnsOn,N.L.(eds.)(1992).B名 残励ηは た ′
Basic′ rheory,VOl.II:〕 4ethodology and Distribution,Springer‐ Verlag,New
York.
%.
[145] Ktinsch,H.R。 (1989). The iackknife and the bootstrap for general stationary observations. 4π
Sι α
ι
グ
sム 17, 1217-1241.
[146]Lachenbruch,P.A.and Mickey,M.R。
2磁 πθπι′ガ610,1-11.
(1968).Estimation of error rates in discriminant analysis.
[147]Lahiri,S.N.(1992).Bootstrapping ir‐ estimators of a multiple linear regression parameter.4π
%.
′
S協′
s″ .20,1548-1570.
[148] Lё ger,C., Politis,D.N.and ROmanO,J.P.(1992).Bootstrap technology ahd applications.
力6s34,378-398.
2ελπθ,%θ ′
π.S滋 滅〕
た15,360-375.
[149] Lo,A.Y.(1987).A large sample study of the Bayesian bootstrap.4π
[150]Lo,A.Y.(1988).A Bayesian bootstrap for a inite population.4π π.S滋 麻ム16,1684-1695.
4π ιた S滋 ″sA 4ssθ ε.,82,155-162.
[151]Loh,W.‐ Y。 (1987).Calibrating conndence coettcients.ェ
[152] Loh, W.‐ Y.(1991). Bootstrap calibration for confldence interval construction and selection.
S滋 ″s″ σ
αS′ η;ca l,477-491.
π滋″θπs.Springer‐
γ
[153]Mammen,E.(1992).T`物 ι%Dθ ● Bθ θお′
″ Иわ″ P 4w″ わた R6%′おαηグ
'解
Verlag,New York.
[154]Martin,M.A.(1990).On bootstrap iteration for coverage correction in conidence inteⅣ als.エ
4π ι‰ S滋 庵ム4ssο θ.85,1105-1118.
[155]Marron;J.S.(1992).Bootstrap bandwidth selection.In Eψ あ万ηg
ttι
ι′
%′ お げ
Bθ θ
お′
71ψ ′(R.
LePage and L.Billard eds.),Wiley,pp.249-262.
[156] McLachlan,G.J.(1980).The emciency Of Efron's“ bootstrap''approach applied to error rate
estimation in discriminant analysis.工 S″ 滅Sム
Cθ %ψ π
i S′ ππム11,273-279.
[157]McLachlan,G.J.(1986).Assessing the perforrnance of an allocation rule.Cθ ″
4″ お.12A,261-272.
.&Zα ′
た。
厖
"′
[158] NIIcLachlan,G.J。 (1987). Error rate estimation in discrinlinant analysis:recent advances. In
ysた (A.K.Gupta,ed.),D.Reidel,233-252.
4ヽαηθιs′ π ノИπι
ttaπ α″ S滋 法露cα ′∠πα」
q“ ′
ガ
4η
″″ Rι ε
″θη.John Wiley,
Zsθ
π″α
π
′
α′
[159]McLachlan,G.J.(1992).」
鉢お αηグ S滋 濃,″ ′ル ム
“
New York.
婉物 61,1-17.
[160]Miller,R。 (1974).The jackknife‐ a review.B′ θπθ
[161] Nagao,H.and Srivastava,M.S.(1992).On the distributions of some test criteria for a covariance
matrix under local alternatives and bootstrap approxilnations. ェ ノ
И%′ ″υ
απα″ 4η α1 43,331-350.
[162]Owen,A.B.(1988).Empirical likelihood ratio confldence intervals for a single functional.
B′θ
タ
ル
屹力α75,237-249.
zι 力
[163]Owen,A.B。 (1990).Empirical likelihood ratio conidence regions.五
[164]Owen,A.B.(1991)。
%π o S滋 ″sム 18,90「 120.
Empirical likelihood for linear models.4π π.S""5119,1725-1747.
[165]Parr,WoC.(1983).A note on theiaCkknife,the bootstrap and the delta method estimators of bias
and variance. B=o72oθ ′
″乃α70,719-722.
311
統計的推測 理論 の現状
[166] Peers,H.W.and lqbal,M.(1985).Asymptotic expansions for conidence lirnits in the presence of
.Sθ た B47,547-554.
Sθ θ
Ro S滋
nuisance parameters,with applications.工
"5た
[167]Peters,S.C.and Freedman,D.A.(1984).Some nOtes on the bootstrap in regression problems.エ
』レs.Ecoη .S協 ″sた 2,406-409.
ω.Springer‐ Verlag,Berlin.
[168]Petrov,V.V。 (1975).`揚 77徳 グ ル グのι%ル %′ Rα πあ 解 均 παιι
[169]Pfanzagl,G。
(1985).A吻 わ″
α′豚0ルた.Lecture Notes in
助 α%sグ θπS力 γG7%ιπ′ S滋 麻″ε
Statistics 31,Springer,Berlin.
[170]Quenouille,M.H.(1949).Appro対
mate tests of correlation in time series.工
R.S滋 法ム3,θ .87‰
β ll, 18-84.
[171]Quenouille,M.H.(1956).Notes on bias in estimation.B′ θπι加物 43,353-360.
[172]Rao,J.N.K.and Wu,C.F.J.(1988).Resampling inference with complex survey data.工
S滋″sム
24ssθ
A%θ κ
ε
.83,231-241.
[173]Reeds,J.A.(1976).On the Deinition of von Mises Functionals.Ph.D.thesis,Harvard Univer―
sity.
.3,
[174]Reid,N.(1988).Saddlepoint methods and statistical inference(with discussion).S滋 法J.■′
213-238.
[175] Robinson,J.(1987).
Nonparametric conndence intervals in regression:′ 「 he bootstrap and ran‐
21%ω π″ ′αηグ 4″ 滅ガ S滋 麻″ (M.L.Puri,」 .P.
ε
″υ グ
domization methods.Inハ ワω &η ρθ
“
“
“
Vilaplana,and W.Wertz,eds.),Wiley,New
York,pp.243-255.
[176]Romano,J.P。 (1988a).On weak convergence and optimality of kernel density estimates of the
mode. 4η πo S滋 ″sl 16,629-647.
[177]Romano,J.P.(1988b).Bootstrapping the mode.Aη π.レ ↓ S滋 麻ム Zα 厖.40,565-586.
[178]Romano,J.P.(1988c).A bootstrap revival of some nonparametric distance tests.工
五%ι ‰
.83,698-708.
4ssθ θ
S協″sた 」
[179] Rubin,D.B.(1981).The Bayesian bootstrap.4η
πo
S滋 ″s19,130-134.
[180]坂 元慶行 ,石 黒真木夫 ,北 川源四郎 (1983)。 情報量統計学 .共 立 出版
[181]坂 元慶行 ,石 黒真木夫,北 川源四郎 (1992).ABIC最 小化法 と EIC.第 60回 日本統計学会講演予稿集
.
,
頁 261-263.
[182] Sanchez,J.M. P. and Cepeda,X.L.O.(1989). The use Of smooth bootstrap techniques for
estilnating the error rate of a prediction rule.
COttz夕
η%%.
Sttα ″
sム ー
S′ ,2π 滋. Cθ ″
πム18,1169-1186.
π.S滋 ″sl 16,
[183] Sen,P.K.(1988). Functional jackkniflng:Rationality and general asymptotics. 4η
450-469.
[184]Shao,J.(1988).On resampling methods for variance and bias estimation in linear models.4π π
.
S協″sた 16,986-1008.
[185]Shibata,R.(1989).Statistical aspects of model selection.In F″
ed.),Springer_verlag,pp.215-240.
[186]清 水良一 。 (1976).中 心極 限定理。教育 出版
π Iン ″ わ 彪θル ち (J.C.Willems
.
[187]Shorack,GoR.(1982).Bootstrapping robust regression.COπ 協%%.S滋 麻ムー ■力ιθ4 M′ 厖.11,961972.
物 滋 4πα夕sお .Chapman and Hall.
[188]Silverman,B.W。 (1986).Dι %s′ ″ EMπ α″θ%力 γS勉 麻″の απグ」
[189]Silverman,B.W.and Young,G.A。 (1987).The bootstrap:To smooth or not to smoothP.
Bをo夕 2zι 力
唸たα74,469-479.
[190] Singh,K。
(1981).On the asymptotic accuracy of Efron's bootstrap.4%π .S″ 滅sム 9,1187-1195.
励 αttα ″ S滋 病″ ′五%α が お r4
[191]Siotani,M.,Hayakawa,T.and FuilkoShi,Y。 (1985).ZOル 観 〃π′
)αグ%α た Cο π6θ απグ Hαπグみθοた。American Sciences Press,Columbus.
[192]Sitter,R.R.(1992).A resampling procedure for complex survey data.工
“
.87,
Attθ ‰ S滋 麻た■ssθ θ
755-765.
[193] Snapinn,s.M.and Knoke,J.D.(1988).Bootstrapped and smoothed classiflcation erFor rate
estimators.Cθ ,%解 π%.S協 ″sl‐ Siπ π滋.Cθ %ゅ πム17,1135-1153.
[194]Snapinn,s.M.and Knoke,J.D。 (1989).Estimation of error rates in discriminant analysis with
s 45,289-299.
θη 力屹ι
selection of variables. I〕 ′
[195] Stangenhaus,G。 (1987).Bootstrap and inference prOcedures for Ll regression.In S滋 ″sttcα ι五滋滋
ysお Ba,ι グ 0%′ ね夕ι Abη %α πグ Rθ 滋″グ Mcttθ グs(Y.Dodge ed.)i Elsevier Science Publishers
4%α 」
ttι
l‐
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
B.V.(North‐ Holland),pp.323-332.
.80,1026
た S滋 麻ム4ssο θ
ス″θ
[196]Stine,R.A。 (1985).BootStrap prediction intervals for regression.エ
-1031.
[197]Stoffer,D.S.and Wall,K.D.(1991).B00tStrapping state‐ space models:Gaussian ma対
likelihood estimation and the Kalman ilter.エ
[198]Stone,M.(1974)。
.I'36,111-147.
Sθ θ
ス%ι tt
mum
.86,1024-1033.
S滋 麻ムAssθ θ
CrosS‐ Validation choice and assessment of Statistical predictions.工
R.S滋 麻′
・
%S協 法ムエ 24,1-34.
[199]SWanepoel,J.W.H。 (1990).A re宙 ew of bootstrap methods.助 π滋 炒 “
[200]SwanepOel,J.W.H.and van Wyk,J.W.J.(1986).The b00tStrap applied to power spectral
正財θηzθ 力電々α73,135-141.
―.一 橋論叢
一 (1985).Bootstrap推 定量 の多項 式近似 ―ノ ンパ ラメ トリック統計学 の話題 か ら
density function estimation.
[201]高 橋
,
94, 44-65.
[202]Takahashi,H.(1988).A note on Edgeworth expansions for the von Mises.functionals.エ
″υ
απα″ 4π αλ24,56-65.
〃π′
啓 (1975).確 率分布 の近似 .教 育 出版
内
[203]竹
[204]竹 内 啓 (1976).情 報統計量 の分布 とモ デルの適切 さの規準 .数 理科学 153,12-18.
.
[205] Taylor,c.C.(1989).BootStrap choice of the smoothing parameter in kernel density estimation.
′
π力α76,705-712.
Blo,多 ι
ι″激α 75,433-444.
[206] Tibshirani,R.(1988).Variance stabilizatlon and the bootstrap.Btoπ
.ル 磁厖.S滋 ″sム
[207] Tukey,J.(1958).Bias and conndence in not quite large samples.Abstract,4%π
29,614.
%.
[208] vonヽ [iSes,R。 (1947).On the asymptotic diStribution of differentiable statistical functions.4π
Ma物 .S″ ″sl 18,309-348.
[209] Wang, h/1‐ C。 (1986). Re‐ sampling procedures for reducing bias of error rate estimation in
multinomial classincatiOn.Cθ ″ πム S″ ″Si α%グ Dα 滋 五παみSお 4,15-39.
[210]Weber,NoC.(1984).On resampling techniques for regression models.S滋
麻ム′bbα b.Lθ ″.2,275
-278.
[211]Wernecke,K.‐ D.and Kalb,G.(1987).Estimation of error rates by means of simulated bootstrap
distributions.B′ο解.工 29,287-297.
[212] Withers,c.S.(1983). Expansions for the distribution and quantiles of a regular functional of the
%π・S協 ″sム 11,
empirical distribution with applications to nonparametric confldence intewals・
・
577-587.
[213]Withers,c.S.(1984).Asymptotic expansions for distributions and quantiles with power series
cumulants.工 R.S滋 ″S′ .Sο θ.Sι ‰ B46,389-396.
[214]Wong,W.‐ H.(1983).A note on the modined likelihood for density estimation.工
Aπ ιた S滋 ″s′
.
。78,461-463.
Assθ ε
[215] Wu,C.F.J。 (1986). Jackknife,bootstrap and other resampling methods in regression analysis
(with discussion).4η π.S滋 ″Sム 14,1261-1350.
[216] Young,G.A.(1988).A note on bootstrappimg the correlation coemcient.B′
π々α75,370-373.
οttι ′
[217]Zhang,J.and B00s,D.D。 (1992).Bootstrap critical values for testing homogeneity of covariance
.87,425-429.
matrices.工 4π ι‰ S滋 法ムAssο θ
Fly UP