Comments
Description
Transcript
分割表における行の多重比較法について
応用統計学 Vol. 36, No. 2 (2007), 1–17 覚 え 書 分割表における行の多重比較法について 明星大学大学院理工学研究科 広津千尋 要 旨 棚瀬,松田論文 (2006) は分割表における多重比較法とその評価という表題 の下に,実際は行の対比較の問題のみを扱っている。ところが,その第 4.1 節で ‘広 津 (1992) の Scheffé 法’ と紹介されているのが実は 1983 年の旧版であり,また,確 率計算の近似法や検出力の評価についても,不正確な表現や不適切な取り扱いが見 られる.そこで,この覚書では正確を期すために,2元配置分散分析において交互 作用多重比較のために提案された方法 (Hirotsu, 1991) を,改めて2次元分割表解析 に定式化して具体的に示すと共に,確率近似精度の新しい評価結果について報告す る.また,Scheffé 法と要因分析を目的とする多重比較法との考え方の違いについて も言及する. 1. 2次元分割表における多重比較法概観 2次元分割表の連関解析は構造的には2元配置交互作用解析と同等であり,同様の統計量が提 案されている.今,2次元分割表を {yi j }a×b と表し,Ri = yi· (行和),C j = y· j (列和),N = y.. (総 和) とする.分割表ではいろいろなサンプリング方式に対応して,様々な確率分布が想定される が,ここでは生起確率 {pi j | p·· = 1} の多項分布を想定する.興味ある帰無仮説は H : pi j = pi· p· j である.ただし,推論は {Ri }, {C j } を与えた多項超幾何分布に基づく. 例えば,2元配置分散分析モデルで,各セルの無交互作用モデルからの乖離を測る統計量とし て Stefansky の統計量があるが,その分割表版として maxi, j ei j )/ √ ( ) ( Cj RiC j RiC j ( Ri ) 1− 1− , ei j = yi j − N N N N が提案されている (広津, 1982, 参照).しかしながら,このタイプの統計量では1つのセルの外れ が他のセルの乖離度に影響すること,また,そもそも,行,列の水準がある程度大きいと,この ように自由度1まで分解した多重比較は検出力が極めて低くなることから,むしろ行,あるいは 列を単位とした多重比較法が提案されてきた (例えば, 広津, 1977; Hirotsu, 1983b).とくに,行が 要因に対応し,その各水準で多項分布が観測されている場合には,行の多重比較は概念的に1元 配置分散分析法における Tukey,Scheffé,Dunnett 等の多重比較法に対応し,極めて自然に導入 される.この要因分析モデルの場合は行数はそう大きくならないが,問題によっては行数が10 0を超える2元表解析も必要となる.その場合は自由度1交互作用の評価はほとんど意味が無く, 1 分割表における行の多重比較法について 益々,行あるいは列の多重比較が要望される (例えば, Hirotsu, 1991; Hirotsu et al., 2003 参照).ま た,この場合多くは,要因分析のセンスではなく,モデリングやクラスタリング目的のアプロー チとして提案されている (Gilula, 1986; Greenacre, 1988, 2006 等). 2. 行の Scheffé 型多重比較法 最初に,Hirotsu(1983b) に従って次の記法を導入する. r = N −1/2 (√ R1 , · · · , √ )′ (√ √ )′ Ra , c = N −1/2 C1 , · · · , Cb r′ c′ ただし,プライムは行列の転置を表す.次に ′ および ′ が,それぞれ a 次元および b 次元 R C /√ ′ ′ 直交行列となるように Ra−1×a および Cb−1×b を導入する.今,zi j = yi j RiC j /N を添字に関して 辞書式に並べたベクトルを z とすると,(R′ ⊗ C ′ )z の帰無仮説 H の下での,Ri ,C j を与えた条件 付期待値と分散は E {(R′ ⊗ C ′ ) z} = O(a−1)(b−1) N I(a−1)(b−1) V {(R′ ⊗ C ′ ) z} = N−1 (1) となり,極めて扱い易くなる.ただし,On , In はそれぞれ n 次元零ベクトルと単位行列,⊗ は Kronecker 積を表す.N が十分大きいときには,(1) 式の係数 (N/(N − 1)) を無視することが多 いが,N が小さいときそれは分散の過小評価を招くことに注意する.以下では簡単のため,係数 (N/(N − 1)) は1として扱う.ここで, 2 χ2 = (R′ ⊗ C ′ )z は帰無仮説 H に対する適合度 χ2 に他ならず,(R′ ⊗ C ′ )z の各要素はその自由度1への直交分解 を与えている.ただし,∥ · ∥2 はベクトルの二乗ノルムを表す.例えば,行 i と i′ を比較する χ2 統計量は R′ の1行として ( 1 1 r (i; i ) = + R i R i′ ′ ′ )−1/2 ( ) 0 · · · 0R−1/2 0 · · · 0 − R−1/2 0···0 i i′ を採用することにより, ( 2 ) χ2 (i; i′ ) = r′ (i; i′ ⊗ C ′ )z (2) で定義される.これを行間の二乗距離と呼ぶ.行間の二乗距離は直に群間の二乗距離に拡張され る.今,一般性を失うことなく2群を G1 = {1, · · · , q1 },および G2 = {q1 + 1, · · · , q1 + q2 } とする. このとき,群間の二乗距離が 2 χ2 (G1 ; G2 ) = (r′ (G1 ; G2 ) ⊗ C ′ )z , √ √ √ )−1/2 √ ( R1 Rq1 Rq1 +1 Rq1 +q2 1 1 ′ + ··· − ··· − 0 · · · 0 , r (G1 ; G2 ) = T1 T2 T1 T1 T2 T2 2 応用統計学 Vol. 36, No. 2 (2007) T1 = ∑ i∈G1 Ri , T2 = ∑ Ri i∈G2 で定義される.棚瀬,松田論文ではこの2群間の二乗距離までを,後述の Wishart 行列の最大根で評 価する方法を ‘広津 (1992) の Scheffé 法’ と呼んでいる.しかしながら実はそれは,Hirotsu(1983b) で述べられている方法である.2 行,あるいは2群比較の対比は,r に対する直交条件と規準化条 件から一意に定まるのに対し,3群以上の対比では未知パラメータが残り,それをどう最適に決 定するかが当時未解決であった.一方,Wishart 行列の最大根はあらゆる行対比に対する上限を与 える統計量なので,それをこれら限定した行比較に適用すれば当然保守的な評価を与えることに なる.その問題は Hirotsu(1991) で,一般の m 群に対し群間の一般化二乗距離が定義されたこと により解決し,評価に Wishart 行列最大根を使うことによる検出力損失は解消されている.ただ し、Hirotsu(1991) は ANOVA モデルで記述されているので,以下にそれをアンバランスなケー スに拡張し,分割表の記法で記述する. 一般性を失うことなく行の m 群への分割を G1 = {1, · · · , q1 }, G2 = {q1 + 1, · · · , q1 + q2 }, · · · , Gm = {q1 + · · · + qm−1 + 1, · · · , q1 + · · · + qm } とする.このとき,群間の一般化二乗距離を 2 χ2 (G1 ; · · · ; Gm ) = max (γ′ ⊗ C ′ )z (3) で定義する.ただし,max は γ = (γ1 , · · · , γa )′ に関する次の条件下での最大化を意味する, γ′ r = 0, ∥γ∥ = 1, γi ≡ λk (Ri /T k )1/2 , i ∈ Gk , ∑ Tk = Ri , k = 1, · · · , m. i∈Gk ′ 従って,実際は λ = (λ1 , · · · , λm ) に関する条件 m √ ∑ T k λk = 0, m ∑ k=1 k=1 λ2k = 1 (4) の下での最大化となる.この基本的な考え方は,一つの群内では一定の係数を与え,最大化に寄 与しないようにすることである.ここで, Yk j = ∑ yi j , k = 1, · · · , m, i∈Gk と定義する.つまり,Yk j は行をプールした m × b 2元表の要素を表し,T k はその行和である.な お,列和 C j に変化はない.このとき (3) 式は χ2 (G1 ; · · · ; Gm ) = max ∥λ1 w1 + · · · + λm wm ∥2 λ (∑ )′ (∑ ) = max λk wk λk wk λ ′ w1 . = max λ′ .. (w1 · · · wm )λ λ w′m 3 (5) 分割表における行の多重比較法について と表される.ただし, ( )′ wk = (T k /N)−1/2 C ′ C1−1/2 Yk1 , · · · , Cb−1/2 Ykb である.とくに (w1 · · · wm ) √ (√ √ )′ ∑ √ T1, · · · , Tm = T k wk = NC ′ c = 0 k √ T m )′ が零固有値に対する固有ベクトルであることから,最大化 問題は行列 {w µ wν }m×m の最大固有値問題に帰着し,(4) 式の前半の条件は自動的に満たされる. 結局,群間の一般化二乗距離は次の b × b 行列の最大固有値として求められる: である.すなわち,( T 1 , · · · , ′ χ2 (G1 ; · · · ; Gm ) = m ∑ wk w′k の最大固有値. (6) k=1 なお,場合によっては λm = 0 とすることに興味があるかも知れない.そのときは,固有値問題 ではなく,制約付き最大化問題を解かなくてはならない.その場合も含めて,行間,2群間,お よび,一般化二乗距離はすべて ′ 2 (γ ⊗ C ′ )z max γ′ r=0, ∥γ∥=1 (7) で上から押さえられる. z に関する漸近正規性の仮定の下に,(7) 式は帰無仮説 H の下で Wishart 行列 W(Imin(a−1,b−1) , max(a − 1, b − 1)) の最大根の分布に従う.とくに,一般化二乗距離において 各群が1行から成る特別な場合を考えれば,この Wishart 行列最大根による群分けの評価におい て検出力の損失は生じないことが分かる.なお (5) 式は,行をプールした m × b 2元表に関する (7) 式と同値な統計量である.これは,次節で述べる累積 χ2 統計量に基づく Scheffé 法でもまっ たく同じように成り立つ. この分布論は行,列の関連度に応じたクラスタリングを行う2進木において,枝を切り離す線引 きの水準を決めるのにも有効に応用される.とくに Greenacre (1988) では任意の2群を分離する 有意性検定として用いられているが,今回の結果は3群以上の不均一性を測る尺度を提供したこ とになる.なお,そこでは,Gilula(1986) の方法が本質的に Hirotsu(1983b) の方法に帰着し,よ り保守的であると説明されている.ところで,棚瀬,松田論文の表 5 で行っている Scheffé 法の検 定の大きさの評価は,この一般化二乗距離はもとより,2群間の二乗距離すら用いず,行間の二 乗距離(2)のみを対象としており,極めてミスリーディングな保守的評価である.Scheffé 法は 対比較で終わることはなく,正当な使い方をすれば水準数がいくら大きくなっても検定の大きさ は所与の水準に保たれているのである.実際,分散分析モデルの場合であるが,Hirotsu(1991) お よび Hirotsu et al.(2003) では正にこの Scheffé 法が,行数 200 前後で有効に用いられている.な お,分散分析モデルで 2 max (a′ ⊗ b′ )z , a′ j = 0, ∥a∥ = 1; b′ j = 0, ∥b∥ = 1 (8) 型の統計量が Wishart 行列の最大根の分布に従うことは,かなり以前から知られている(例えば, Johnson and Graybill,1972).ただし, j = (1, · · · , 1)′ である.列の自由度を一杯に使った (7) 式 の最大化でも,(8) 式と同じ最大で押さえられるという結果は Hirotsu(1983a) で得られた. 4 応用統計学 Vol. 36, No. 2 (2007) 3. 行あるいは列の水準に自然な順序がある場合の行比較 列が例えば重症度のような順序応答の場合には,順序を考慮しない一般的な χ2 統計量に基づ く方法は効率が悪い.順序効果を考慮する最も簡単な方法は,線形スコア統計量を用いることで あるが,より頑健な方法として累積 χ2 統計量(χ∗2 ),max χ2 統計量などの提案もある(Hirotsu, 1982, 1983b; 広津, 1992 等).これらの特質もある程度議論されてきているが,棚瀬,松田論文 では累積 χ2 統計量のみを対象としている.前節で述べた Scheffé 法の χ∗2 型への拡張は容易で, ′ 単に C ′ の各行を累積型基準化対比に書き換えた C ∗ (Hirotsu, 1983b 参照) で置き換えればよい. ′ a ≥ b の場合に参照分布は,漸近正規性の仮定の下に Wishart 行列 W(C ∗ C ∗ , a − 1) の最大根の分 ′ 布として与えられる.そして例えば,C j が揃っているときには,C ∗ C ∗ の最大根の第2根に対す る比が3となることから,次の χ2 近似が最大根の分布の大変良い近似を与える, ρ(1) χ2a−1 . (9) ′ ただし,ρ(1) は C ∗ C ∗ の最大根であり,ρ(1) = b/2 がバランストケースに当たる(Hirotsu, 1991). ところで,棚瀬,松田論文の 4.1 節では,C j 不揃いのときに (9) 式の近似が使えないと述べられて いる.それは誤りであり,実際は以下に述べるように,近似精度を決めるのは C j の不均一度では ′ なく,C ∗ C ∗ の最大根の第2根以下に対する相対的な大きさである.例えば,3水準の場合,C2 に対し,C1 ,C3 が大きくなるような不揃いは最大根を大きくし,その結果近似精度を高めること になる.因みに,表4では C2 が大きく,ρ(1) = 1.17(最大根の第2根に対する比は 1.41)となっ て近似精度が落ちる場合に当たる.b = 3, 4 のいくつかの場合に会田,広津(1983)が分布関数 の Zonal 多項式展開の数値計算による5%および1%点を与えている.そこで,表1に b = 3 の 場合のそれらパーセント点と (9) 式による近似の比較を与える.ρ(1) ≥ 1.5 では極めて近似精度の よいこと,また,a が20前後位になれば,ρ(1) = 1.3 程度でも相対誤差は2∼3%であることが 分かる.表2に b = 4 のバランストケースの比較を与えるが,表1の傾向と大きな差は見られな い.また,バランストケースについて MCMC 法による simulation 結果も与えた.χ2 近似はその simulation 結果とよく類似している.なお,simulation 誤差は SE で 0.03∼0.19 程度であり,分 割表のサイズが大きくなるほど,また,5 %点よりは1%点で大きい. 行の水準に自然な順序がある場合は Scheffé 法や Tukey 法のように,すべての行を対称に扱う 方法にあまり意味がなく,替わりに Williams 法や max acc.t 法が提案され,その特性が調べられ ている(例えば,広津,1992).とくに列も順序応答の場合に,行・列の両方に max χ2 型統計量 を構成する方法は max max χ2 法と命名され,ある程度の大きさの分割表に対し正確な数え上げ 法が得られている(5節の例2参照).その方法は 2 × J × K 分割表における3因子交互作用解析 にも拡張されている(Hirotsu, et al., 2001).なお,棚瀬,松田論文では行・列両方向に順序があ る場合に,2重累積 χ2 (χ∗∗2 )法(Hirotsu, 1982)の応用に言及されている.ここで,χ∗∗2 は総 括的検定として極めて検出力が高く有用性が期待されるが,多重比較法ではないことを注意して おく. 4. Tukey 法について 処理間の対比較のみに限定するなら,Tukey 法が Scheffé 法より効率の良いことは良く知られ 5 分割表における行の多重比較法について ている(Scheffé, 1959).ただし,Tukey 法は対比較に主眼を置く方法なので水準数が多くなると 効率は低下し,また,あまり有益な情報は得られない.実際,臨床試験等の応用では3水準が主 で,4水準以上の例はあまり多くない.なお,4水準以上では厳密な閉手順方式を導くのが難し いことから,保守的な方法である Tukey-Welsh 法がよく用いられる(例えば,永田,吉田,1997 参照). 累積 χ2 統計量に基づく Tukey 法に関し,広津 (1992) の (5.173) 式は,Bonferroni の不等式に よる p 値評価のための公式を与えている.Bonferroni の公式を用いる時は,不等式の幅が不合理 に大きくないこと,下限値は上限値より正確であるが,やや liberal(過小評価)であることに注 意する必要がある.棚瀬,松田論文の simulation で,a = 3 の場合に,有意水準 α = 0.05 に対し 僅かにそれを上回る値が得られているのは当然で,この程度 liberal であることを知って使い分け るのが本来である.例えば,下限値が有意水準と一致したら,それは本来有意でない結果を示し ているのである. 一方,表 3 のような2元表に公式を適用し,下限値が負になったから4水準では公式が使えな いという結論ははなはだ短絡的である.simulation(MCMC 法)によると,表 3 に対する Tukey 法の p 値は約 0.96 である.この Bonferroni の公式は本来,興味のある p 値 0.05,0.01 を想定し て与えられたものであり,それを p 値 0.96 附近で評価すれば,上限が1を超え、下限が0を下回 るのは当然である.例えば興味あるp値を 0.05 前後とすると,4 水準の場合,6 通りの各組合せ に対するp値では 0.01 辺りに興味があることになり,それらの同時確率はあまり大きくないこと が期待される.いずれにせよ,この公式は本来不等式として提案されており,上限や下限の単独 の使用は勧められない.この Bonferroni の公式で判断がつかないときには,MCMC 法等他の手 法を用いればよい. 5. 応 用 例 ここでは,行ごとの多重比較法をクラスタリング・モデリングに応用した例1と,3種類の用 量の厳密な比較を行った要因分析の例2について述べる. 例1. 国立癌センターにおける職業別初診時重症度 表 4 は広津(1977)で解析されて以来,多くの論文でいろいろな解析がなされている.と くに3節の χ∗2 に基づく Scheffé 法の適用では,極めて高度に有意な群分け G1 = {10, 5, 4, 8}, G2 = {7, 9, 2, 1, 6, 3} が得られている(例えば,広津、2004 参照).参考までに行間の二乗距離は 表 5 のようであり,群内の均一性が見て取れる.一方,列は H1 = {1},H2 = {2, 3} に群分けされ, その結果,ブロック交互作用モデル pi j = pi· p· j δlm , i ∈ Gl , l = 1, 2; j ∈ Hm , m = 1, 2 (10) が示唆される.交互作用モデル (10),および独立モデル pi j = pi· p· j をあてはめた結果は,それぞれ 表 4 括弧内の上段,下段に与えられている.自由度1の交互作用パラメータ δlm (l = 1, 2; m = 1, 2) を追加することにより,データへの適合が大きく改善されていることが分かる.ここで,独立モ デルに対する適合度 χ2 = 96.39(自由度 18)に対し,モデル (10) 式をあてはめた後の適合度 χ2 は自由度 17 に対し 8.68 であり,そこからさらに有意な変動を見出すことはあまり考えられない. モデル (10) の示唆するところは,職業が初診時重症度によって2群に分類されるということであ 6 応用統計学 Vol. 36, No. 2 (2007) る.表 4 に各行(職業)毎の軽症率を斜体で示した.この数値を一直線上にプロットすると明確 に2群 G1 ,G2 の差とその特徴付けが見て取れる.この結果は当時,職業分類におけるガン早期 発見システムの差と解釈された.このデータに対して,例えば,柳本,清水 (1983) では,列依存 変数を導入した比例ハザードモデルによって行がこの2群に分類されること,そしてそれが軽症 対中・重症の割合の差であることが追認されている.一方,棚瀬,松田論文は対比較閉検定手順 で有意となった組合せとして表 6 に示した対を与えているのみで,データの解釈は何も与えてい ない.これは既にそれ以前の論文で明らかにされてきたことに対し,とくに新しい知見を与えて いるわけではない.そもそもこのような対比較は,やはり臨床試験のように少水準で厳密な処理 比較を要する場合の手法であり,10水準を超えるようなデータの解釈には不向きであろう.ち なみに,棚瀬,松田 (2006) の表7,表8によれば,有意水準5%検定に対し10水準での対比較 閉検定手順 Type FWE(検定のサイズ)は,χ2 閉検定で 0.007,累積 χ2 閉検定で 0.012 程度 であり,5%検定と称するには過度に保守的と思われる. 例2. 要因分析の例 モデリングやクラスタリングではなく,要因分析に興味が持たれる例として表 7(広津, 2004) を 挙げておく.これは実際の第 相臨床試験(用量設定試験)で得られたものである。この例では, 用量 3mg または 6mg がプラセボと比較して,有意な有効用量であるか否かを検討することが目 的になる.そこで,行比較の多重比較法が要請されるが,行に自然な順序があるため Tukey 法よ り,Williams 法または max acc. t 法が適切である.後者は表 8 のように行をプール(累積)した 二つの補助表で,それぞれ適切な2群比較の統計量を構成し,その大きい方を検定統計量とする ものである.2群比較の統計量としては,例えば,Wilcoxon の順位和統計量,累積 χ∗2 統計量, max acc. χ2 等が考えられ,それぞれ max wil,max χ∗2 ,max max χ2 等と呼ばれている(例えば, 広津,2004 参照).とくに max max χ2 法はこの程度の例数の場合,正確な数え上げ p 値が得ら れる.表 7 の場合,max max χ2 =10.3 で,その p 値は 0.0077(片側)である.すなわち,AF3mg 以下と AF6mg の間に高度な有意差が観察される. 終 6. り に 分割表における行の多重比較法について概観し,とくに行または列に順序がある場合の行の多 重比較法について詳しく述べた.多重比較法は,とくに日本において未だ認知度が低いように思 われるが,解析目的に応じて実に様々な手法が提案されている.多重比較法はときに,開発者の 名前を関して呼ばれる狭義の手法を指すと取られがちであるが,実際はそれに留まらず,ランキ ング,クラスタリング,スクリーニング,変化点解析,信号検出,逐次解析,適応的方法等々を包 括し,極めて広範囲な応用を持っている.応用に当たっては開発の意図を知り,適用条件に配慮 して適切に手法を選ぶことが肝要である.一方,1元配置における膨大な研究に比べ,交互作用 に関する多重比較法はその重要性の割に十分研究が進んでいないように思われる.本小論が当該 分野への関心を喚起することになれば幸いである. 謝 辞 原稿に関し種々コメントを頂いた二人の査読者に感謝申し上げます. 7 分割表における行の多重比較法について 参 考 文 献 会田雅人, 広津千尋. (1983). 順序制約下での多項分布比較の一方法と数表. 応用統計学, 12, 101-110. Gilula, Z. (1986). Grouping and Association in Contingency Tables: An Exploratory Canonical Correlation Approach. Journal of American Statistical Association, 81, 773-779. Greenacre, M. J. (1988). Clustering the Rows and Columns of a Contingency Table. Journal of Classification, 5, 39-51. Greenacre, M. J. (2006). Tying up the loose ends in simple, multiple, joint correspondence analysis. Proceedings in Computational Statistics, Physica Verlag, Rome, 163-185. 広津千尋 (1977). 分割表における多重比較と水準の群わけ. 品質, 7, 27-33. 広津千尋 (1982). 離散データ解析. 教育出版, 東京. 広津千尋 (1992). 実験データの解析−分散分析を越えて−. 共立出版, 東京. 広津千尋 (2004). 医学薬学データの統計解析−データの整理から交互作用多重比較まで−. 東京大学出版会, 東京. Hirotsu, C. (1982). Use of cumulative efficient score for testing ordered alternatives in discrete models. Biometrika, 69, 567-577. Hirotsu, C. (1983a). An approach to defining the pattern of interaction effects in a two-way layout. Ann. Inst. Statist. Math, 35, Part A, 77-90. Hirotsu, C. (1983b). Defining the pattern of association in two-way contingency tables. Biometrika, 70, 579-589. Hirotsu, C. (1991). An approach to comparing treatments based on repeated measures. Biometrika, 75, 583-594. Hirotsu, C., Aoki, S., Inada, T. and Kitao, Y. (2001). An exact test for the association between the disease and alleles at highly polymorphic loci with particular interest in the haplotype analysis. Biometrics, 57, 148-157. Hirotsu, C., Ohta, E., Hirose, N. and Shimizu, K. (2003). Profile analysis of 24-hours measurements of blood pressure. Biometrics, 29, 125-138. Johnson, D. E. and Graybill, F. A. (1972). An analysis of a two-way model with interaction and no replication. Journal of American Statistical Association, 67, 862-868. 永田靖, 吉田道弘. (1997). 統計的多重比較の基礎. サイエンティスト社. 東京. Scheffé, H. (1959). The analysis of variance. Wiley, New York. 棚瀬貴紀, 松田眞一. (2006). 分割表における多重比較法とその評価. 応用統計学, 35, 179-194. 柳本武美, 清水央子. (1983). 2次元分割表における比例ハザードモデルの適用. 応用統計学, 12, 17-29. (2007 年 8 月 7 日受付 10 月 11 日最終修正 11 月 1 日採択) 著者連絡先:[email protected] 8 応用統計学 Vol. 36, No. 2 (2007) 表 1. 最大根の分布のパーセント点 (b = 3) ρ(1) 1.2 1.3 1.4 1.5 1.6 1.7 5 15.005 13.284 15.618 14.391 16.397 15.498 17.274 16.605 17.22 18.205 17.712 19.165 18.819 10 23.777 21.972 25.050 23.803 26.543 25.634 28.140 27.465 27.82 29.789 29.296 31.470 31.127 20 39.578 37.692 42.116 40.833 44.908 43.974 47.807 47.115 47.16 50.761 50.256 53.749 53.397 5 19.719 18.108 20.765 19.617 21.982 21.126 23.280 22.635 23.10 24.621 24.144 25.988 25.653 10 29.524 27.852 31.354 30.173 33.373 32.494 35.476 34.815 34.76 37.624 37.136 39.800 39.457 20 46.819 45.084 50.058 48.841 53.496 52.598 57.024 56.355 55.69 60.586 60.112 a−1 5%点 1%点 1. 上段が会田,広津 (1983) の Zonal 多項式展開,中段が χ2 近似 (9) による値,下段が MCMC 法(10 万回 ×10) による値. 2. ρ(1) = 1.5 が C j が等しい場合に当たる. 9 分割表における行の多重比較法について 表 2. 最大根の分布のパーセント点 (b = 4, ρ(1) = 2) a−1 5%点 1%点 5 23.41 22.14 22.97 31.42 30.18 30.52 10 37.91 36.62 37.01 45.27 46.42 46.25 62.82 62.94 75.14 74.45 20 1. 上段が会田,広津 (1983) の Zonal 多項式展開,中段が χ2 近似 (9) による値,下段が MCMC 法(10 万回)に よる値. 2. 漸近展開の項が空欄は,会田,広津 (1983) で与えられていない場合. 10 応用統計学 Vol. 36, No. 2 (2007) 表 3. 棚瀬,松田 (2006) で Bonferroni 法の評価に用いられている 4x3 分割表 列 1 2 3 行 1 115 92 107 2 97 82 96 3 100 86 85 4 88 91 84 11 分割表における行の多重比較法について 表 4. 国立癌センター初診時重症度と職業分類 症状 職業 1. 専門的・技術的職業 (土木技術者,教員,医師等) 2. 管理職 3. 事務専従者 (会計事務,タイピスト等) 4. 販売従事者 5. 農林,漁業,採鉱従事者 6. 運輸,通信従事者 7. 技能士 (製鉄工,自動車修理工等) 8. 生産工程従事者,単純労働者 9. サービス業 10. 無職 計 軽症 148 148.5 .218 123.3 111 112.1 .217 93.11 645 631.4 .224 524.6 165 160.7 .156 191.9 383 384.3 .152 458.9 96 95.5 .220 79.39 98 106.4 .202 88.41 199 187.1 .162 223.4 59 63.1 .205 52.46 262 276.9 .144 330.7 2166 12 中症 444 452.4 473.9 352 341.6 357.9 1911 1924.4 2015.7 771 764.0 737.4 1829 1827.2 1763.4 293 290.9 304.7 330 324.3 339.7 874 889.3 858.3 199 192.2 201.3 1320 1316.6 1270.7 8323 重症 86 77.1 80.8 49 58.2 60.0 328 328.1 343.7 119 130.3 125.7 311 311.5 300.6 47 49.6 52.0 58 55.3 57.9 155 151.6 146.3 30 32.7 34.3 236 224.5 216.6 1419 計 678 512 2884 1055 2523 436 486 1228 288 1818 11908 応用統計学 Vol. 36, No. 2 (2007) 表 5. 行の多重比較のための補助表 (行を並べ替えてあることに注意) 行番号 10 10 0 5 4 8 7 5 4 8 7 9 2 1 6 3 0.85 2.52 1.67 8.93 7.72 18.6 18.3 15.3 50.1 0 0.88 0.65 6.86 5.79 15.2 15.9 12.5 47.8 0 1.10 4.71 3.73 9.41 11.4 8.51 23.5 0 3.83 3.95 10.5 9.29 8.35 23.2 0 9 0.41 1.71 0.68 0.82 1.48 0 2 0.30 1.24 0.30 0.85 0 1 6 2.7 0.35 1.48 0 0.92 1.01 0 3 0.16 0 13 分割表における行の多重比較法について 表 6. 棚瀬,松田論文で有意水準 0.05 または 0.01 で有意とされた対 (1,5), (1,10), (2,5), (2,10), (3,4), (3,5),(3,8), (3,10), (6,10) 14 応用統計学 Vol. 36, No. 2 (2007) 表 7. 有用度に関する用量比較臨床試験の例 薬剤 データ Placebo y′1 AF3mg/kg AF6mg/kg y′2 y′3 1. 好ましくな 2. やや好まし 3. どちらとも 4. やや有用 5. 有用 6. 極めて有用 い くない 言えない 3 6 37 9 15 1 7 4 33 21 10 1 5 6 21 16 23 6 15 分割表における行の多重比較法について 表 8. max max χ2 の計算 (1) 1. y′1 y′2 3 6 12 10 + y′3 2. 4. 5. 6. 計 37 9 15 1 71 54 37 33 7 153 3. (max χ2 )1 = 4.47 計 (2) 1. 2. 3. 4. 5. 6. y′1 y′3 10 10 70 30 25 2 147 5 6 21 16 23 6 + y′2 (max χ2 )2 = 10.03 max max χ2 = max(4.47, 10.03) = 10.03 16 77 Japanese J. Appl. Statist. 36 (2) (2007), 1–17 Row-wise multiple comparisons in a two-way contingency table Chihiro Hirotsu Graduate School of Science and Technology, Meisei University Abstract The paper by Tanase and Matsuda (2006) is dealing only with the pair-wise comparisons of rows under the title of ‘ Multiple Comparison Procedures for Contingency Table and their Evaluation’. However, ‘the Scheffé type method of Hirotsu (1992) ’ introduced in Section 4.1 of their paper is actually the old version of the year 1983 and there is also something wrong or inappropriate in the evaluation of the probability approximation method and also the power. In the present note we therefore try to make it precise by giving a new formulation of the Scheffé type method for the rowwise multiple comparisons proposed for analyzing interaction effects in two-way ANOVA model specifically to a contingency table and as well as a new result of the probability approximation. The difference of the two approaches of the Scheffé type method and the method comparing a few limited contrasts is also mentioned. Key words: analysis of variance, clustering rows, ordered columns, Scheffé type method, Wishart distribution E-mail address: [email protected] Received August 7, 2007; Received in final form October 11, 2007; Accepted November 1, 2007. 17