大規模臨床試験における統計学【PDF形式】

by user

on 28 марта 2017

Category: Documents

>> Downloads: 4

views

Report

Comments

Description

Download 大規模臨床試験における統計学【PDF形式】

Transcript

大規模臨床試験における統計学【PDF形式】

大学院講義
学会論文発表のための統計学
学会論文発表のための統計学
大規模臨床試験における統計学
大規模臨床試験における統計学
自治医科大学・医学情報学
岸浩一郎
１．メディアンと箱ヒゲ図の利用
２．有意水準と検出力の問題
３．多重性の問題（多重比較の手法）
４．オッズ比とロジスティック回帰の問題
５．ログランク検定とCox回帰の利用
ーーーーーーーーーーーーーーーーーーーーーーー
６．非劣性（noninferiority）あるいは
同等性（equivalence）の概念
７．複数の類似研究を統合解析するメタアナリシスの概念
８．遺伝情報に関する統計手法
総合領域・情報学（日本学術振興会）
情報学基礎
計算機システム・ネットワーク
ソフトウエア
認知科学
知覚情報処理・知能ロボティクス
知能情報学
感性情報学・ソフトコンピューティング
統計科学
メディア情報学・データベース
生体生命情報学
情報図書館学・人文社会情報学
数学
数理統計学
生物医学統計学
（これらの関係は実は微妙な関係にある。）
統計学は科学的検証の手段である。
統計学は数学の学問体系の中では，甚だ
応用的，世俗的である。
統計学の基本を理解することは、科学研究
者としての生存条件である。
「新版医学への統計学」序より引用
統計学の果たす役割（１）
（結果の解釈を客観化・標準化する。）
要約統計量の計算（平均値、S.D.等）
グラフ表示（散布図、箱ヒゲ図等）
検定（t 検定、Dunnett 検定等）
統計学の果たす役割（２）
（実験を計画する上での統計学的な考慮）
例数の決定（統計学的な例数設計）
群の設定と適切な統計解析手法の適用
環境の変化
１．WindowsPCの普及と統計パッケージの普及によっ
て、高度な統計手法を簡単に使えるようになった。
２．医学雑誌のレフリーに統計の専門家が参加するよう
になった。
医学研究者の正しい対応
ある程度、統計学的なものの考え方を身に付けてから、
統計パッケージに複雑な計算をさせる。
統計手法の誤用を避ける！
1979年の比較
1996年の比較
Gore,S.M. et al. (1992) : The Lancet’s statistical review
process. LANCET, 340, 99-102.
（浜田改変）
記述統計学 descriptive statistics
推測統計学 inferential statistics
記述統計学：
収集したデータを整理要約し、そのデータが表す統計集
団の性質を簡潔かつ明確に記述すること
（例）統計表やグラフ表示。平均・分散・中央値などの記
述統計量の計算。
推測統計学：
母集団から無作為に抽出した標本に基づいて、母集団
についての推測を行うこと
（例）母集団の平均値を推測する。母集団の発症率を
推定する。母集団の平均値や発症率の差の統計的検
定を行う。
メディアン（中央値）と箱ヒゲ図
（box and whisker plots）
（平均値と標準偏差、誤差の代わりに）
「学会・論文発表のための統計学」、浜田著、1999
「学会・論文発表のための統計学」、浜田著、1999
平均値：26.3, 標準偏差：10.9
平均値：35.4, 標準偏差：35.8
「新版医学への統計学」より引用
中央値
中央値
「新版医学への統計学」より引用
「新版医学への統計学」より引用
mean
mean
「新版医学への統計学」より引用
有意水準（α）と検出力（１－β）の問題？
対照群
2群の母平均に
有意差がある
検定群
帰無仮説の棄却
帰無仮説「2群の母
平均に差はない」
対照群と検定群で
平均値に差がある
検定の考え方
高木廣文 NICU, 2(3), 39-44, 1989を改変
一般論（有意水準）
例えば、Ａ群とＢ群の血糖値の平均値を比較する場合、
統計学的検定法ではまず帰無仮説というものを立てる。
これは、”Ａ群とＢ群の血糖値は等しい”と仮定すること
である。 p<0.05 とは“Ａ群とＢ群の血糖値が等しい”とい
う帰無仮説のもとでは，血糖値の差が観察されたもの
よりも大きくなる確率が有意水準α（５％）未満というこ
とで、かなり珍しいことと考え、帰無仮説を棄却し有意
差ありとするわけである。αを 0.05 に仮定する確かな
根拠はないが一般には p<0.05 を”有意差あり”としてい
る。αが 0.01 であればその確率が１％ということでさら
に有意な差と考えられる。
両側検定の考え方（t-分布を例に）
頻度
2.5％
2.5％
ＨＯ
高木廣文講義録より
一般論（有意水準）
有意水準（危険率）をα（α＝0.05）で表し、
有意確率をp（p = 0.0xx, p＜0.05）で表すことが多い。
p値のpはprobabilityのpである。
通常統計学的有意とは p<0.05 の時と仮定すること
が多いが、これは何を意味するのか？
一般論（有意水準）
統計的有意差と臨床的有意差
p<0.05だったから有意差ありで何でも説明していいかと
いうとそうではない。統計学的検定では、同じ差でもサ
ンプル数を増やせば有意差がでることがある。ある薬
物で血糖値が平均10mg/dl下がったとして、サンプル数
を増やして有意差を出しても臨床的には意味のない薬
ということもある。その点をよく考えて考察する必要が
ある。
一般論（有意水準）
統計的有意差と臨床的有意差
統計的解釈を行う上では、有意水準、サンプル
数、検出力、臨床的有意性などを考えてから結
論を出すことが重要である。
「学会・論文発表のための統計学」、浜田著、1999
一般論（有意差検定）
本当は差がない
本当は差がある
有意差なしと判定
正しい判定
第2種の過誤
（確率β）
有意差ありと判定
第1種の過誤
（確率α）
正しい判定
1. 有意差あれば、有意水準α（α＝0.05）：有意確率p（p＜0.05）
2. 有意差なしとする場合は確率β（第2種過誤率、TypeII
Error）を示す必要がある。（普通はβ＝0.1～0.2）
1－βを検出力（power）と呼び必要なサンプル数に関係する
α：あわて者のエラー
β：ぼんやり者のエラー
例数の決定
（統計学的な例数設計）
（2群間の平均値の差の検定の場合の近似式）
「学会・論文発表のための統計学」、浜田著、1999
一般論（有意差検定）
1.有意差ありの場合には、臨床的有意性があるかどうか
の検討が必要
2.有意差なしの場合には、βエラーまたは検出力を示し、
症例数が充分であったかどうかの検討が必要
（有意差なしの場合に帰無仮説を採択するには、あらか
じめ設定したサンプル数のデータを得ることが必要であ
る）
有意差なしならば等しいか？
α＝0.05
P=0.015
A
B
βエラーの提示
P=0.250 検出力の提示
サンプル数の提示
C
D
検定の多重性の問題？
一般論（検定の多重性）
検定の多重性の理解は重要である！
多重比較 multiple comparison
なぜ、多重比較が必要か？
多群の比較を行う場合に、例えば２標本t-検定を
繰り返すと有意水準が甘くなってしまう。
例えば同じ母集団からのA,B,C３群の平
均値について、A-B, A-C, B-C のすべて
について２標本t-検定を行うと、それぞれ
については有意水準５％で判定していて
も、全体としては有意水準が14％になって
有意差が出やすい検定をしていることに
なってしまう。
有意水準５％であるから、有意差が出ない
確率は、(1-0.05)となる。
３つの組み合わせ全てで有意差が出ない
確率は、(1-0.05)x(1-0.05)x(1-0.05)となり、
逆にどれかで有意差が出る確率は、
1- (1- 0.05)3 = 0.142 となる。
一般論（検定の多重性）
どんな場合に多重性が問題となるか？
(a) 多群を対比較で検定する場合
(b) 多項目を検定する場合（ex,白血球数、GPT,GOT,ALPなどの
多項目で検定を繰り返す場合）
(c) 経時的ﾃﾞｰﾀの輪切り検定（例えば、Ａ、Ｂの２群間の降圧作用
の差を各時点について順次比較し検定する場合）
(d) 多種検定する場合（例えば、あるデータにt 検定、U検定、
χ2検定などの複数の検定を適用する場合）
(e) サブグループ解析の場合（性、年齢、病型、重症度別に結果
を分類して検定を繰り返す場合）
(f) 中間解析の場合
多重比較の例
「学会・論文発表のための統計学」、浜田著、1999
Dunnett検定（多重比較）
「学会・論文発表のための統計学」、浜田著、1999
2元配置分散分析
したがって、A薬剤とB薬剤の効果は相加的であり、
相乗的ではない。
「学会・論文発表のための統計学」、浜田著、1999
オッズ比とロジスティック回帰
（相対リスクとχ2検定の多用の代わりに）
「学会・論文発表のための統計学」、浜田著、1999
「学会・論文発表のための統計学」、浜田著、1999
変数１のみの条件を変えた2群でのオッズ比は、exp（β１）になる。
「学会・論文発表のための統計学」、浜田著、1999
単純例
「学会・論文発表のための統計学」、浜田著、1999
複雑例
「学会・論文発表のための統計学」、浜田著、1999
「学会・論文発表のための統計学」、浜田著、1999
「学会・論文発表のための統計学」、浜田著、1999
ログランク検定とCox回帰
（Cox比例ハザードモデル）
SHEP（1991）
↓
ALLHAT（2002）
↓
臨床的な意義：低用量の利尿薬の評価↑
医療経済的な意義：利尿薬は薬価が非常に安い
医療費の抑制
米国の代表的な大規模臨床試験
ＳＨＥＰ trial
SHEP study group.:Prevention of stroke by
antihypertensive drug treatment in older persons
with isolated systolic hypertension. Final results
of the systolic hypertension in the elderly
program (SHEP). JAMA, 265, 3255～3264(1991)
ALLHAT (The Antihypertensive and LipidLowering Treatment to Prevent Heart Attack Trial)
ALLHAT Collaborative Research Group
JAMA 2002:288: 2981-2997
クロルタリドン：12.5～25mg/日（利尿薬）
アムロジピン：2.5～10mg/日（Ca拮抗薬）
リシノプリル：10～40mg/日（ACE阻害薬）
1次評価項目（致死的冠動脈疾患，非致死的心筋梗塞）
対象は55歳以上の高血圧（140～180/90～110 mmHg）で、高血圧以外
の冠動脈疾患の危険因子を1つ以上有する（心筋梗塞・脳卒中の既往、
血行再建術歴、動脈硬化性心血管疾患、2型糖尿病、喫煙、HDL-コレ
ステロール低値例、左室肥大）ハイリスク群とした。
札幌厚生病院循環器科資料を改変
ALLHAT
3種類の比較：両側検定でα=0.0178
１－β：検出力８３％
累積イベント発生率：Kaplan-Meier法
累積イベント曲線間の差：log-rank検定
Cox比例ハザード回帰モデル
生存時間解析とは
ある基準の時刻から目的の反応が起きるまでの時間を
対象とする解析手法の総称をいう。
一般化して生存時間解析と呼ばれているが、癌の再発
までの時間やイベントが起きるまでの時間なども同様
に扱える。
Cox回帰（比例ハザードモデル）やカプラン・マイヤー曲
線、ログランク検定などは、いずれも生存時間解析の
手法である。
「道具としての統計学」、奥田著、2001
２群の生存率の差の検定
ログランク検定
全期間を通じての生存曲線の差を比較するノンパラ
メトリック検定である。
「学会・論文発表のための統計学」、浜田著、1999
「学会・論文発表のための統計学」、浜田著、1999
比例ハザード性
「学会・論文発表のための統計学」、浜田著、1999
Cox回帰（Cox比例ハザードモデル）とは
比例ハザードモデルを前提として、リスク因子がエンド
ポイントの発生確率を何倍引き上げるのかを示す推定
値（ハザード比）を算出する多変量解析モデル。エンド
ポイント発生までの期間がモデルに組み込まれている。
Cox回帰のモデル
瞬間死亡率（hazard rate）h(t)
log{h(t)/h0(t)} = β1x1+β2x2+ ------ +βnxn
Cox回帰のモデル
瞬間死亡率（hazard rate）：h(t)
h(t)= h0(t) exp（β1x1+β2x2+ ------ +βnxn）
Ｘ１=１, A治療群
Ｘ１=０, B治療群
h(t, A治療群)
h(t, B治療群)
＝ exp(β１）
Cox回帰とロジスティック回帰の比較ー共通点
リスク因子がエンドポイントの発生確率を何倍引き上
げるのかを示す推定値を算出する。
この推定値は、基準となる群との相対的な比として表
される。（ロジスティック回帰ではオッズ比、Cox回帰
ではハザード比）
オッズ比やハザード比はリスク因子間の影響力の大
きさを比較するのに便利。
Cox回帰とロジスティック回帰の比較ー相違点
ロジスティック回帰では、観察開始後一定期間以内に
起きたエンドポイント発生の有無のみが情報として用い
られるため、エンドポイント発生までの期間の長短は結
果を左右しない。
Cox回帰では、エンドポイント発生までの期間がモデル
に組み込まれているため、観察期間全体を通しての比
較が行われる。
医学統計学へのガイド
オーソドックスな医学
統計学が詳しく解説さ
れている。
医学医療で必要とさ
れる統計手法のほと
んどすべてがバランス
よく解説されている。
将来の必要時に役立
つ。
医学統計学の専門家用ハ
ンドブックである。
とくに数学的背景も詳しく
解説されている。
現代的な生物医学統計
学の解説書である。
生物医学統計学という
分野の固有性を主張し
ている。
きわめて平易に医学統計
学を解説している。
単に医学統計学の概要の
みを知るには便利である。
統計パッケージの活
用を通して、生物医
学統計を学ぶ。
正に実用的である。
環境の変化
１．WindowsPCの普及と統計パッケージの普及によって、
高度な統計手法を簡単に使えるようになった。
２．医学雑誌のレフリーに統計の専門家が参加するよう
になった。
医学研究者の正しい対応
ある程度、統計学的なものの考え方を身に付けてから、
統計パッケージに複雑な計算をさせる。
統計手法の誤用を避ける！