多変量線形回帰モデルにおける一致性を持つ Cp 型規準が真の変数を

by user

on 28 марта 2017

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download 多変量線形回帰モデルにおける一致性を持つ Cp 型規準が真の変数を

Transcript

多変量線形回帰モデルにおける一致性を持つ Cp 型規準が真の変数を

多変量線形回帰モデルにおける一致性を持つ Cp 型
規準が真の変数を選択する確率の収束オーダー∗
広島大学・理学研究科数学専攻† 原宏和
Hirokazu Yanagihara
Department of Mathematics, Graduate School of Science
Hiroshima University
2016 年 5 月 16 日
§1. 序
本論文では, 正規性を仮定した多変量線形回帰モデル (ここでは正規多変量回帰モデル
と呼ぶ) において, 変数選択規準を最小にする変数の組を最適なものとする, 変数選択規
準最小化に基づく変数選択問題を取り扱う. この選択法の場合, どの変数選択規準を用
いるかが重要な問題となり, それを決める 1 つの重要な特性として, 変数選択規準が一致
性を持つかどうかと言うことがある. 本論文での一致性とは, 厳密に言えば弱一致性の
ことであり, モデル選択規準によって真の変数が最適な変数として選択される確率が漸
近的に 1 になる特性のことを言う. 一致性は, 多くの場合, 標本数 n のみを無限大とす
る漸近理論である, 大標本漸近理論により評価されている. 一方で, 近年, ハードウェア
の発展により, 蓄積・解析できるデータの数が爆発的に増大し, 目的変数の次元数 p が大
きいデータである, 高次元データの解析の需要が高まっている. 本論文で取り扱う高次元
データとは, 次元数 p は大きいが標本数 n よりも小さいとする適度な高次元 (moderately
high-dimensional) データ (Yao et al. [5] 参照) である. このような高次元データでは, 大
標本漸近理論ではなく, 次元数 p も p/n が 1 未満の定数に収束するという条件の下で n
と共に無限大とする, 高次元大標本漸近理論により一致性を評価した方が妥当である.
本研究は科学研究費補助金, 挑戦的萌芽研究 (課題番号:25540012) の助成を受けたものである.
〒739-8626 広島県東広島市鏡山 1-3-1
1
近年, Yanagihara [4] で, 以下のような漸近理論に基に, 高次元性を調整した一致性を持
つ一般化 Cp (High-dimensionality-adjusted Consistent Generalized Cp : HCGCp ) 規
準が提案された.
n → ∞,
p/n → c0 ∈ [0, 1).
(1)
上記の漸近理論は, 次元数 p を無限大にしてもしなくてもよいため, 大標本漸近理論と高
次元大標本漸近理論の両方を特別な形として含むものになっている. HCGCp 規準は, (1)
式に基づく漸近理論で一致性を保証しているが, 残念ながら, どのようなオーダーで真の
変数を選ぶ確率が 1 に近づくかは議論されていない. そこで, 本論文では, HCGCp 規準
が真の変数を最適な変数として選択する確率の 1 への収束オーダーを求めることを目的と
する.
以下本論文では, 第 2 章で, 正規多変量線形モデルと HCGCp を紹介する. 第 3 章で,
主定理である, 真の変数を選ぶ確率の収束オーダーを求める. 数学的な証明は付録に記載
した．
§2. 高次元性の下でも一致性を持つ Cp 型規準量
n 個の個体に対して, p 個の目的変数を並べた目的変数ベクトル, y1 , . . . , yn と k 個の
説明変数を並べた説明変数ベクトル x1 , . . . , xn が観測されたとし, それらを並べた n × p,
n × k 行列をそれぞれ Y = (y1 , . . . , yn ) , X = (x1 , . . . , xn ) とする. ここでは, 推定量
の存在を保証するために, n > p + k + 1 とする. 以下, k 個の説明変数のから一部を用い
た正規多変量線形回帰モデルを考えるが, どの変数を用いたかを以下の集合の元によって
表現する.
j ⊆ ω = {1, . . . , k},
kj = #(j).
このとき, X から j の元に対応した列を抜き出し並べた n × kj 行列を Xj とする. 例え
ば, j = {1, 2, 4} であれば, Xj は X の第 1, 2, 4 列を抜き出して並べた行列である. この
Xj を使って, 考える候補のモデルを以下のように記述する.
Y ∼ Nn×p (Xj Θj , Σj ⊗ In ).
(2)
ただし, Θj は未知回帰係数を並べた kj × p 回帰係数行列, Σj は p × p 分散共分散行列で
正定値性を仮定する. (2) 式は, j により定式化されるので, (2) 式を候補のモデル j と呼
ぶことにする. 特に, j = ω のときはフルモデルと呼ぶ. このとき, Xω = X である.
真の説明変数は以下の集合の元により表現する.
j∗ ⊆ ω,
k∗ = #(j∗ ).
2
ここで, Xj∗ = X∗ とし, 真のモデル j∗ を以下のように記述する.
Y ∼ Nn×p (X∗ Θ∗ , Σ∗ ⊗ In ).
(3)
ただし, Θ∗ は真の回帰係数を並べた真の k∗ × p 回帰係数行列, Σ∗ は真の p × p 分散共分
散行列である. ここで, Σ∗ は正定値行列とし, Θ∗ の各行ベクトルには少なくとも 1 つ以
上零でない値があることを仮定する.
以下に, (2) 式のモデル j における HCGCp は以下のようになる (Yanagihara [4] 参
照). ただし, 定義 1 内の limn→∞,p/n→c0 は, (1) 式の漸近理論での極限を表す.
定義 1 Sj をモデル j における分散共分散行列の不偏推定量,
Sj =
1
Y (In − Pω )Y ,
n − kj
とする. ただし, Pj は Xj の列ベクトルで張る空間への射影行列で,
Pj = Xj (Xj Xj )−1 Xj ,
である. このとき, モデル j における HCGCp は,
HCGCp (j|α) = (n − kj )tr Sj Sω−1 + pkj α,
(4)
である. ただし, α は以下を満たす正の数である.
α=
n
+ β,
n−p
β > 0 s.t.
√
lim
n→∞,p/n→c0
pβ = ∞,
lim
n→∞,p/n→c0
p
β = ∞.
n
(5)
J を候補のモデルを集めた集合とし, J を真の説明変数を含んでいる過多に記述された
(overspeciﬁed) モデルを集めた集合 J+ と真の説明変数を含んでいない過少に記述された
(underspeciﬁed) モデルを集めた集合 J− に分ける. 過少に記述されたモデルは過多に記
述されたモデルでないモデルとも言えるので, J+ と J− は以下のように定義できる.
J+ = {j ∈ J | j∗ ⊆ j},
J− = J+c ∩ J .
(6)
ただし, Ac は集合 A の補集合を示す. さらに, 以下のような非心パラメータ行列を定義
する.
−1/2
Δj = Σ∗
−1/2
Θ∗ X∗ (In − Pj )X∗ Θ∗ Σ∗
.
(7)
ここで, j ∈ J+ のときは, Δj = On,n となり, j ∈ J− ならば, Δj は, dj = rank(Δj ) と
すると, dj = 0 で dj ≤ min{p, kj c ∩j∗ } となる半正定値行列である. ただし, On,n はすべ
3
ての成分が 0 である n × n 行列である. ここで, HCGCp (j|α) によって選ばれた変数を
ĵα とする, つまり,
ĵα = arg min HCGCp (j|α),
j∈J
(8)
とする. このとき, 以下の仮定,
仮定 A1. j∗ ∈ J ,
仮定 A2.
∀
j ∈ J− に対して,
1
tr(Δj ) > 0,
(a,b)∈N2 n≥a,p≥b n
sup
inf
が成り立つとき,
lim
n→∞,p/n→c0
P (ĵα = j∗ ) = 1,
となる (証明は, Yanagihara [4] 参照). なお, j ∈ J− のとき, tr(Δj ) は n > k ならば常
に正であるので, その結果に仮定 A2 を加えると,
1
tr(Δj ) > 0,
n>k,p≥1 n
inf
(9)
が言える.
§3. 選択確率の収束オーダー
本章では, (4) 式で定義した HCGCp が j∗ を最適な組み合わせとして選択する確率が 1
に収束するときの収束オーダーを調べる. ここで, 候補のモデルとして, すべての組み合わ
せを考えることにする. つまり, J = ℘(ω) である. さらに,
n
n + kp
n−k
=
+
,
n−k−p−1
n − p (n − p)(n − k − p − 1)
であることから, (4) 式の HCGCp の罰則項 α を,
α=
n−k
+ β,
n−k−p−1
(10)
と書き換える. ただし, β は (5) 式と同じ正の数である.
今,
P (ĵα = j∗ ) = 1 − P (ĵα =
j∗ ) = 1 − P ∪j∈J \{j∗ } {ĵα = j} ,
であるので, 目的を達成するためには, P (∪j∈J \{j∗ } {ĵα = j}) のオーダーを求めれば良い
4
ことがわかる. ここで, {ĵα = j} (∀ j ∈ J ) は互いに素であることに注意すれば,
P ∪j∈J \{j∗ } {ĵα = j} =
P (ĵα = j)
j∈J \{j∗ }
=
P (ĵα = j) +
j∈J+ \{j∗ }
P (ĵα = j),
(11)
j∈J−
となる. ここで, 以下にオーダー評価に必要な補助定理を与える (証明は付録 A.1 参照).
補助定理 1
m = n − k − p + 1 とし, r は r > m/4 を満たす正の整数とする. U と V を
互いに独立な確率変数で, U ∼ χ2p , V ∼ χ2m とする. このとき, j ∈ J+ であれば,
P (ĵα = j) ≤
n−k
√
pγ
2r
E
が成り立つ. ただし γ は,
γ=
√
p
U
−
V
m−2
2r ,
pβ,
(12)
(13)
である. また, j ∈ J− のとき, qj = kj c ∩j∗ とし, Ui (i = 1, . . . , qj ) を V と独立な,
Ui ∼ χ2p (δj,i ) である確率変数とする. ここでの δj,i は, δj,1 + · · · + δj,qj = tr(Δj ) であり,
δj,i ≥ λj,1 /qj を満たし, λj,1 は Δj の最大固有値とする. このとき,
P (ĵα = j) ≤
2r
qj n−k
i=1
δj,i
が成り立つ. ただし,
ρ=
E
2r p + δj,i
Ui
−
−ρ
,
V
m−2
p
β,
n−k
(14)
(15)
である.
さらに, (12), (14) 式内の期待値のオーダーを評価するため, 以下の補助定理を与える
(証明は付録 A.2 参照).
補助定理 2
m = n − k − p + 1 とし, δ を
lim
n→∞,p/n→c0
δ = ∞,
δ
> 0,
n>k,p≥1 n
inf
p
= O(1),
δ
を満たす正の数とする. さらに, U1 , U2 と V は互いに独立な確率変数で, U1 ∼ χ2p ,
5
U2 ∼ χ2p (δ), V ∼ χ2m とする. このとき, 任意の自然数 r に関して, 十分 n が大きければ,
2r U1
p
E
−
(16)
= O(pr n−2r ),
V
m−2
2r p+δ
U2
−
−ρ
(17)
= O(δ r n−2r ),
E
V
m−2
が成り立つ. ただし, ρ は (15) 式で定義された正の数である.
(5) 式の β の条件から,
lim
n→∞,p/n→c0
γ = ∞,
lim
n→∞,p/n→c0
ρ = 0.
また,
δ = min
j∈J−
λj,1
,
qj
と定義すると, λj,1 ≥ tr(Δj )/qj より,
δ ≥ min
j∈J−
tr(Δj )
.
qj2
(18)
また, (9) 式から,
inf
min
n>k,p≥1 j∈J−
tr(Δj )
= φ > 0,
n
(19)
となる下限が存在し, maxj∈J− qj ≤ k であるので, これら結果と (18), (19) 式から,
p
p
pk 2
c0 k 2
p/n
≤
≤
→
< ∞,
=
δ
minj∈J− tr(Δj )/qj2
minj∈J− tr(Δj )/(nqj2 )
nφ
φ
となるので, p/δ = O(1) であることがわかる. さらに, 仮定 A2 より, limn→∞p/n→c0 tr(Δ) =
∞ であるので, limn→∞,p/n→c0 δ = ∞ が言える. よって補題 A1・A2 より, 任意の自然
数 r に対して,
P (ĵα = j) =
O(γ −r )
O(δ −r )
(j ∈ J+ \{j∗ })
.
(j ∈ J− )
(20)
最後に, O(γ −r ) と O(δ −r ) のどちらの収束速度が速いかを判定する. β の定義式 (5) から
√
pβ/n = (pβ/n)/ p → 0. この結果と (19) 式より,
√
√
pβ/n
pβ k 2
γ
≤
≤
·
→ 0.
δ
minj∈J− tr(Δj )/(nqj2 )
n
φ
pβ/n → 0 であるので,
√
よって, O(δ −r ) の方が O(γ −r ) よりも 0 に収束する速度が速いことがわかる. 以上の結
果と, (11), (20) 式により, 以下の定理を得ることできる.
6
定理 1 仮定 A1・A2 の下で, HCGCp が真の変数を選択する確率は以下のようになる.
P (ĵα = j∗ ) = 1 + O(p−r/2 β −r ).
ただし, r は任意の自然数である.
A. 付録
A.1. 補助定理 1 の証明
まず，j ∈ J+ \{j∗ } のときを考える. このとき, j− = j\{a}, a ∈ j ∩ j∗ とおくと,
J = ℘(ω) であるので j− ∈ J である. よって,
P (ĵα = j) = P ∩∈J \{j} {HCGCp (|α) − HCGCp (j|α) > 0}
≤ P (HCGCp (j− |α) − HCGCp (j|α) > 0) ,
(A.1)
となる. ここで, kj− = kj − 1 であり,
(n−kj )tr(Sj Sω−1 ) = (n−k)p+(n−k)tr Y (Pω − Pj )Y {Y (In − Pω )Y }−1 , (A.2)
であることに注意すれば,
D1 (j) = HCGCp (j− |α) − HCGCp (j|α)
= (n − k)tr Y (Pj − Pj− )Y {Y (In − Pω )Y }−1 − pα,
となる. ここで,
−1/2
W1 = Σ∗
とおくと,
−1/2
Y (Pj − Pj− )Y Σ∗
−1/2
W2 = Σ∗
,
−1/2
Y (In − Pω )Y Σ∗
,
D1 (j) = (n − k)tr(W1 W2−1 ) − pα,
(A.3)
である. 今, (In − Pω )(Pj − Pj− ) = On,n なので, ウィッシャート分布の性質より,
W1 ⊥⊥ W2 ,
W1 ∼ Wp (1, Ip ),
W2 ∼ Wp (n − k, Ip ),
が成り立つ. ここでさらに, ウィッシャート分布の性質より, 0p をすべての成分が 0 であ
る p 次元ベクトルとし, z ∼ Np (0p , Ip ) とすると, W1 = zz と書き換えることができ,
それらを用いると,
z W2−1 z =
zz
,
{(z z)−1/2 z W −1 z(z z)−1/2 }−1
7
と書くことができる. 上式の右辺の分母分子は独立でそれぞれ, χ2p , χ2m に従うことから,
tr(W1 W2−1 ) =
U
,
V
と書き換えることができる. ただし, U と V は補助定理 1 で定義した確率変数である. こ
の式と (A.3) 式を用いれば,
P (D1 (j) > 0) = P ((n − k)U/V − pα > 0) = P (U/V > pα/(n − k)) .
ここで, (13) 式で与えられた γ を用いると,
√
pγ
p
p
pβ
α−
=
=
,
n−k
m−2
n−k
n−k
となるので, U/V − p/(m − 2) ≤ |U/V − p/(m − 2)| に注意すれば,
√
√
U
pγ
pγ
p
p U
−
>
⇒ −
>
.
V
m−2
n−k
V
m−2
n−k
よって, 上記の関係式とマルコフの不等式を用いれば,
√
pγ/(n − k))
√
≤ P (|U/V − p/(m − 2)| > pγ/(n − k))
√
= P |U/V − p/(m − 2)|2r > { pγ/(n − k)}2r
2r 2r p
U
n−k
−
E
.
≤ √
pγ
V
m−2
P (U/V > pα/(n − k)) = P (U/V − p/(m − 2) >
よって, (12) 式が示せた.
次に，j ∈ J− のときを考える. 今, j+ = j ∪ j∗ とおくと, J = ℘(ω) から j+ ∈ J が言
え, (A.1) 式と同様な手法により,
P (ĵα = j) ≤ P (HCGCp (j+ |α) − HCGCp (j|α) > 0) ,
が言える. kj+ = kj + kj c ∩j∗ であることと (A.2) 式を用いれば,
D2 (j) = HCGCp (j+ |α) − HCGCp (j|α)
= −(n − k)tr Y (Pj+ − Pj )Y {Y (In − Pω )Y }−1 + pqj α,
となる. ただし, qj = kj c ∩j∗ である. ここで,
−1/2
W1 = Σ∗
−1/2
Y (Pj+ − Pj )Y Σ∗
−1/2
W2 = Σ ∗
,
8
−1/2
Y (In − Pω )Y Σ∗
,
とおくと,
D2 (j) = −(n − k)tr(W1 W2−1 ) + pqj α,
(A.4)
となる. 今, (In − Pω )(Pj+ − Pj ) = On,n なので, ウィッシャート分布の性質より,
W1 ⊥⊥ W2 , W1 ∼ Wp (qj , Ip ; Δj ), W2 ∼ Wp (n − k, Ip ),
(A.5)
が成り立つ. ただし, Δj は (7) 式で与えられた非心パラメータ行列である. (A.5) 式に付
録 A.3 の補助定理 A.1 を適用すれば, (A.4) 式より,
P (D2 (j) > 0) =
P (tr(W1 W2−1 )
< qj pα/(n − k)) ≤
qj
P (Ui /V < pα/(n − k)),
i=1
となる. ただし, Ui は補助定理 1 で定義した確率変数である. ここで, (15) 式で与えられ
た ρ を用いると,
p
p + δj,i
pβ
δj,i
δj,i
α−
=
−
=ρ−
,
n−k
m−2
n−k m−2
m−2
であるので,
Ui
p + δj,i
p
+
δ
Ui
j,i
+ ρ ≤ −
− ρ ,
− +
V
m−2
V
m−2
となることに注意すれば,
Ui
δj,i
p + δj,i
δj,i
p + δj,i
Ui
+ρ>
⇒ −
− ρ >
.
− +
V
m−2
n−k
V
m−2
n−k
よって, 上記の関係式とマルコフの不等式を用いれば,
P (Ui /V < pα/(n − k))
= P (−Ui /V + (p + δj,i )/(m − 2) + ρ > δj,i /(n − k))
≤ P (|Ui /V + (p − δj,i )/(m − 2) − ρ| > δj,i /(n − k))
= P |Ui /V + (p − δj,i )/(m − 2) − ρ|2r > {δj,i /(n − k)}2r
2r 2r n−k
p + δj,i
Ui
≤
−
−ρ
E
.
δj,i
V
m−2
よって, (14) 式が示せた.
9
A.2. 補助定理 2 の証明
B = 1/V とし, ξ1 = E[U1 ], ν = E[B] とおく. このとき, p/(m − 2) = ξ1 ν であるので,
U1
p
−
= U1 B − ξ1 ν = (U1 − ξ1 )(B − ν) + ξ1 (B − ν) + ν(U1 − ξ1 ),
V
m−2
が成り立つ. よって,
E
p
U1
−
V
m−2
=
a+b+c=2r
0≤a,b,c≤2r
=
a+b+c=2r
0≤a,b,c≤2r
(A.6)
2r (2r)! b c
E ξ1 ν (U1 − ξ1 )a+c (B − ν)a+b
a!b!c!
(2r)! b ξ1 E (U1 − ξ1 )a+c ν c E (B − ν)a+b .
a!b!c!
(A.7)
ここで, 付録 A.4 の補助定理 A.2 の (A.13) 式より,
⎧
(a = 0)
⎨ 1
0
(a = 1) ,
E[(U1 − ξ1 )a ] =
⎩
[a/2]
) (a ≥ 2)
O(p
を得る. ただし, [
] はガウス記号である. また,
a 1
1
a
−
E [(B − ν) ] = E
V
m−2
a−i i a
1
1
a!
−
=
E
i!(a − i)!
m−2
V
i=0
a−i a
a
i
a!
1
1
1
−
+ −
=
i!(a
−
i)!
m
−
2
m
−
2d
m−2
i=1
d=1
a a
1
1
= −
1+
m−2
m − 2d
d=1
a−1
a−i
a!
{−(m − 2)}i
{m − 2a + 2(d − 1)} .
i!(a
−
i)!
i=0
d=1
ここで, T ∼ χ2m−2a とすると,
E[T
a−i
]=
1
a−i
d=1 {m
− 2a + 2(d − 1)}
10
(i = a)
(i ≤ a − 1)
(A.8)
となるので, h = {−(m − 2)}−a
E [(B − ν)a ] = h
a
a
i=0
d=1 (m
− 2d)−1 とおけば,
a!
{−(m − 2)}i E[T a−i ]
i!(a − i)!
= hE [{T − (m − 2)}a ]
=h
a
i=0
a!
(−2a)i E {T − (m − 2a)}a−i .
i!(a − i)!
ここで, m − 2d = O(n) より, h = O(n−2a ). また, 補助定理 A.2 の (A.13) 式から,
⎧
(i = a)
⎨ 1
a−i
0
(i = a − 1) ,
E {T − (m − 2a)}
=
⎩
[(a−i)/2]
) (i ≤ a − 2)
O(n
を得る. i = 0, 1, . . . , a であるので, 上記の式の最大オーダーは O(n[a/2] ) となり, この結
果から,
⎧
⎨ 1
0
E[(B − ν)a ] =
⎩
O(n−2a+[a/2] )
(a = 0)
(a = 1) ,
(a ≥ 2)
(A.9)
を得る. ξ1 = O(p), ν = O(n−1 ) より, (A.8), (A.9) 式を用いると, (A.7) 式内の最大オー
ダーは, a = b = 0, c = 2r のときなので, (16) 式を得ることができる.
また, L = U2 /V , μ = E[T ] とおくと,
2r
E (L − μ − ρ)2r =
i=0
(2r)!
E (L − μ)2r (−ρ)2r−i .
i!(2r − i)!
(A.10)
ただし, ρ は (15) 式で与えられた正の数であり, (5) 式から ρ = o(1) が言える. ξ2 = E[U2 ]
おくと, μ = ξ2 ν なので, (A.6) と同様な変形を行い, (A.7) 式と同様な展開により,
E[(L − μ)a ] のオーダーを求める. 仮定より, p/δ = O(1) なので, 補助定理 A.2 の (A.14)
式より,
⎧
⎨ 1
a
0
E[(U2 − ξ2 ) ] =
⎩
O(δ [a/2] )
(a = 0)
(a = 1) ,
(a ≥ 2)
(A.11)
よって, ξ2 = O(δ) より, (A.9), (A.11) 式より,
⎧
(a = 0)
⎨ 1
a
0
(a = 1) ,
E [(L − μ) ] =
⎩
O(δ [a/2] n−a ) (a ≥ 2)
(A.12)
を得ることができる. ρ = o(1) であるので, (A.10), (A.12) 式より, (17) 式を得ることが
できる.
11
A.3. 補助定理 A.1 とその証明
補助定理 A.1
Δ を p × p 半正定値行列とし, d = rank(Δ) ≤ min{p, q}, d = 0 と
する. 今, W1 と W2 を互いに独立な p × p 確率変数行列で, W1 ∼ Wp (q, Ip ; Δ),
W2 ∼ Wp (n − k, Ip ) とし, さらに, Ui と V を互いに独立な確率変数で, Ui ∼ χ2p (δi ),
V ∼ χ2n−k−p+1 (i = 1, . . . , q) とする. ただし, δ1 + · · · + δq = tr(Δ) で, λ1 を Δ の最大
固有値とすると, δi ≥ λ1 /q を満たすものとする. このとき,
P (tr(W1 W2−1 ) < τ ) ≤
q
P (Ui /V < τ /q),
i=1
が成り立つ.
証明) Q を Δ を対角化する p 次直交行列とする. つまり, λi を Δ の i 番目に大きい固有
値とし, Λ = diag(λ1 , . . . , λp ) とすると, Q ΔQ = Λ である. ただし, 仮定より, λ1 > 0
で, λd+1 = · · · = λp = 0 である. ここで, B1 = Q W1 Q, B2 = Q W2 Q とおくと,
ウィッシャート分布の特性より,
B1 ⊥⊥ B2 ,
B1 ∼ Wp (q, Ip ; Λ),
B2 ∼ Wp (n − k, Ip ),
となる. 今, Λ0 = diag(λ1 , . . . , λd ), E ∼ Nq×p (Oq,p , Ip ⊗ Iq ),
Γ=
1/2
Λ0
Op−d,d
Od,p−d
Op−d,p−d
,
とし, G = E +Γ とおく. このとき, B1 の分布と G G の分布は同じものになるので, 以下,
√
G G の分布を調べる. H = (h1 , . . . , hq ) を q 次直交行列とし h1 = 1q / q とする. ただ
し, 1q はすべての成分が 1 である q 次元ベクトルである. このとき, (η1 , . . . , ηq ) = HΓ
とおけば,
(η1 , . . . , ηq ) = H
1/2
Λ0
Op−d,d
Od,p−d
Op−d,p−d
=
λ1 h 1 , . . . ,
λd hd , Oq,p−d ,
であるので, δi = ηi 2 とすると, δi ≥ λ1 /q を満たす. さらに, Z = (z1 , . . . , zq ) = HE
とおくと, z1 , . . . , zq ∼ Np (0p , Ip ) であるので,
G G = G H HG = (HE + HΓ) (HE + HΓ) =
q
i=1
12
(zi + ηi )(zi + ηi ) .
以上により,
tr(W1 W2−1 )
=
=
q
i=1
q
i=1
=
q
(zi + ηi ) W2−1 (zi + ηi )
zi + ηi 2
{zi + ηi −1 (zi + ηi ) W2−1 (zi + ηi )zi + ηi )−1 }−1
Ti .
i=1
ここで, 上記の式の二段目の右辺の分母分子は互いに独立で, それぞれ χ2p (δi ), χ2m に従う
ことから, Ti = Ui /V と書き換えることができる. ここで,
q
{Ti ≥ τ /q} ⇒
i=1
なので,
q
Ti ≥ τ,
i=1
Ti < τ ⇒
i=1
q
q
i=1
{Ti < τ /q},
i=1
となり, その結果,
P(
q
Ti < τ ) ≤
q
P (Ti < τ /q),
i=1
が言える. よって題意が示せた.
A.4. 補助定理 A.2 とその証明
補助定理 A.2
X1 ∼ χ2f とすると,
⎧
⎨ 1
a
0
E [(X1 − f ) ] =
⎩
O(f [a/2] )
(a = 0)
(a = 1) ,
(a ≥ 2)
(A.13)
となる. また, X2 ∼ χ2f (δ), f /δ = O(1) とすると,
⎧
⎨ 1
a
0
E [{X2 − (f + δ)} ] =
⎩
O(f [δ/2] )
となる.
13
(a = 0)
(a = 1) ,
(a ≥ 2)
(A.14)
証明) a = 0, 1 のときは明らか. Stuart & Ord [2] の 3.14 節より, a1 + · · · + ad = a,
2 ≤ a1 , . . . , ad ≤ 2r とすると, 平均周りの a 次モーメントは, a1 , . . . , ad 次キュムラント
の積の線形結合で表現できる. Lancaster [1] より, X1 − f の a 次キュムラントは,
κa,1 = 2a−1 (a − 1)!f,
であり, Tiku [3] より, X2 − (f + δ) の a 次キュムラントは,
κa,2 = 2a−1 (a − 1)!(f + aδ),
である. f /δ = O(1) であることに注意すれば, κa,2 = O(δ) である. よって, それぞれの
a/2
平均周りの a 次モーメントの最大次数の項は, a が偶数であれば, κ2,i であり, a が奇数で
(a−1)/2−1
あれば, κ2,i
κ3,i となる (i = 1, 2). よって, 題意を得る.
引用文献
[1] Lancaster, H. O. (1982). Chi-square distribution. In Encyclopedia of Statistical
Sciences, Vol. 1 (eds. S. Kotz & N. L. Johnson), 439–442, John Wiley & Sons,
New York.
[2] Stuart, A. & Ord, J. K. (1994). Kendall’s Advanced Theory of Statistics. Vol. 1.
Distribution Theory (6th ed.). Edward Arnold, London; distributed in the United
States of America by Oxford University press, New York.
[3] Tiku, M. (1985). Noncentral chi-square distribution. In Encyclopedia of Statistical
Sciences, Vol. 6 (eds. S. Kotz & N. L. Johnson), 276–280, John Wiley & Sons,
New York.
[4] Yanagihara, H. (2016). A high-dimensionality-adjusted consistent Cp -type statistic for selecting variables in a normality-assumed linear regression with multiple
responses (submitted for publication).
[5] Yao, J., Zheng, S. Bai, Z. (2015). Large Sample Covariance Matrices and Highdimensional Data Analysis. Cambridge University Press, New York.
14

多変量線形回帰モデルにおける一致性を持つ Cp 型 規準が真の変数を

Comments

Description

Transcript

多変量線形回帰モデルにおける一致性を持つ Cp 型規準が真の変数を