臨床試験のための生物統計学入門

by user

on 28 марта 2017

Category: Documents

>> Downloads: 15

108

views

Report

Comments

Description

Download 臨床試験のための生物統計学入門

Transcript

臨床試験のための生物統計学入門

臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
2003FEB08
目標

臨床試験のための生物統計学入門
「オンコロジストのための統計学」を読む上で必要なエッセンス
を話す
このテキストのレヴェルは実は高い
「よく分かる」という授業・本の印象は既知の知識の量による
結局、（その場では分かったつもりになっても）一回聞いただけではな
かなか分からない。繰り返し接するか、一度本格的に勉強するか
全部理解しようとは思わないこと。重要な概念だけで十分
乳がん臨床研究支援事業 CSPOR運営委員長
NPO日本臨床研究支援ユニット J-CRSU理事長
東京大学医学系研究科生物統計学

大橋靖雄

Q and A
統計パッケージデモ（休憩時間に、伊藤陽一先生）
SAS：製薬会社や FDAで使われている業界標準、敷居高い・値段も高い
JMP：研究者向けの使いやすいソフト、教育用に適
1
2
なぜ生物統計 ?
内容

Design
Design
Design
Design
Design
Design
Design
Design
なぜ統計学が必要か
統計学を理解するために
プロトコルを読むために必要な最低知識
検定とランダム化
NSAS-BC02プロトコルから：生存時間解析入門
Design
Design
Design
Design
Design
Design
Design
Design
Design Design
Design Design
Design Design
Analysis
Design Design
Design Design
Design Design
Design Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
Design
+ Interpretation and Communication
3
なぜ統計学が必要か？
なぜ生物統計？
推論・判断の際にバラツキが無視できないから
バラツキの存在下での判断
バラツキの存在下で正しく推論・判断するためにデータをどうとるか？
バラツキのもとでの客観的な推論・判断をどう行うか？
例題：５円玉と１円玉はどちらが重いか？
SCLCで（CPT11+CDDP）と（VP-16+CDDP）の
どちらの予後が良いか？
バラツキを如何に小さくするか、如何に効率的にデータを得るか？
（品質管理、データマネージメントの範疇でもある。）
SCLC: 小細胞肺癌
CPT11:塩酸イリノテカン
CDDP:シスプラチン、 VP16:エトポシド
5
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
6
1
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
ある臨床試験（小細胞肺癌）の成績：生存曲線
５円玉と１円玉：ヒストグラム（密度関数）
Count
平均 0.9998 ｇ
10
平均 3.7686 ｇ
0.0080
SD
SD
１円玉
5
0.0197
５円玉
1.0 049（g ）
0. 9926
3.7 584（g ）
3.76 24
0.9 945
1.00 46
3.7 631
3.7633
0.9 945
0.99 56
3.7 708
3.8173
0.9 933
0.99 56
3.7 653
3.7776
1.0 175
1.00 51
3.7 399
3.7682
0
1.00
1.50
2.00
2.50
Weight (g)
3.00
3.50
4.00
7

8
バラツキの存在下での判断
バラツキの存在下での判断（続き）
なぜ「5円玉の方が１円玉より重い」と判断するか？
なぜ「5円玉の方が１円玉より重い」と判断するか？
ともにバラツイている：「分布」の概念の導入
バラツキを客観的・定量的に扱うために「確率論」を応用

先験的な知識・常識（externalな証拠）の活用と一般化
実際の測定値の分布の比較 internalな証拠
比較してよいか、不公平な比較ではないか
５円玉
「日本中５円玉、１円玉はどれも同じ」
無作為（ランダム）抽出したとみなして良い
同じ測定方法
先験情報
対象選択
SCLC
選択に偏り？しかし
ランダム化
同じ測定・追跡方法
一般化
５円玉
SCLC
これまでの「持った感じ」
第 II相の結果
「日本中５円玉、１円玉はどれも同じ」
選択に偏り？
無作為（ランダム）抽出したとみなして良い
×
確率的な不確実さがあるものの可能
？
群内のバラツキと群間の違いを比較：シグナルとノイズの比較
9
10
ある臨床試験（小細胞肺癌）の成績：密度関数
５円玉と１円玉：ヒストグラム（生存関数）
1- (distribution function)
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
1.00
11
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
1.50
2.00
2.50
Weight (g)
3.00
3.50
4.00
12
2
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
一般化可能性のために

患者背景の解析

部分集団の解析
ITT?（ワイス：医療の疫学第 4章）
ランダム化比較試験
化学療法 50名
手術療法 50名
結果の差異の説明
部分集団における効果の差、交互作用の検討

再試験

メタアナリシス

緩い選択条件

ITT（ Intentiont-to-treat)解析
全員治療
36名治療
9名拒否で化学療法
5名悪化で化学療法
FDAの方針
複数の独立な研究結果の統計的併合
どの群とどの群とを比較すべきか？
50 vs 36, 59 vs 36, 64 vs 36, 50 vs 50 ….
large-scale-rando mized-evide nce
13
14
ITT?
ITT?
古今東西喧嘩のたね
治療しようとする意思に基づく解析
割付け後、何が起きようともその群として解析
実は人によって異なるいくつかのレベル、曖昧
なぜ？解析対象選択に伴うバイアス避ける
ランダム化によって保証される comparability保つ
統計解析の基礎（ｐ値の根拠）を作る
臨床家
気持ちが悪い
医学的に意味がない
統計家
その通り
そうかもしれない
しかし統計的に Valid
そもそもなぜランダム化したのか？
差は有ると思い込んでいる
差有りのもとでの検出力重視
差は有るか懐疑的である
差無しのもとでの第一種の過誤α 重視
15
16
ITT? 何を評価するのか
処方しようとする意思
実際の処方
服薬
血中濃度
組織内濃度
ITT? 有名な実例
Coron ary Drug Project Researc h Group (19 80) NE JM 30 3 1038-10 41
ITT
per-protocol
PK-guided study
ALL
5-years cumulative mortality
Compliance > 80%
< 80%
Clofibrate
18.0%
15.7%
22.5%
Placebo
19.5
16.4
25.8
環境（副作用軽減対策などの）変化によって
ITTの意義が薄れることもあり
17
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
18
3
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
統計ガイドライン（E9) ：解析対象の規定
検証的な試験において、主たる解析は
ITTの考え方に従って行われる。
解析の役割り
双方の解析を計画：さらに探索することも望ましい
同等性・非劣性試験ではランダム化された全被験者の解析は問題
バイアスを除くことが第一に重要であるからである。
プロトコル不遵守、脱落などによる質の低下は、
試験の感度を下げ、医学的意義を損なう結果となる。
無作為化した全症例
明らかな組み入れ違反例
組み入れ基準適合例
未投与例、投与後未観測例
Full-analysis set
最大の解析対象集団
Per-protocol set
試験計画適合例
違反例、脱落例
19
20
内容

臨床研究の報告：ガイドライン
なぜ統計学が必要か
統計学を理解するために
プロトコルを読むために必要な最低知識
検定とランダム化
NSAS-BC02プロトコルから：生存時間解析入門

Lang T A an d Secic M: How to Report Statistics in Medicine Ann otated Guidelines fo r Auth or s, Editors and Reviewer s, American
College of Physicians, 1997.

Fuk uda H an d Oha shi Y: A g uideline for reporting result s of
statistical analy sis in JJ CO, Japan. J. Clinical Oncology 27, 121127, 1997 (http://w w winfo. ncc.go.jp/jjco/ 英文・日本語とも )

CON SOR T stateme nt
Consolidation of Standard for Reporting Trials
21
22
臨床研究の報告：ガイドライン
CONSORT statement
定評のある教科書

丹後俊郎：新版医学への統計学、朝倉書店、1993．
吉村功編著：毒性・薬効データの統計解析、サイエンティスト社、
1987．（改訂中）
Altman DG：Practical Statistics for Medical Research, Chapman
and Hall,1991． (佐久間昭監訳：「医学研究における実用統計学」、
サイエンティスト社、1999)
Armitage P and Berry G：Statistical Methods in Medical
Research, 3rd ed., Blackwell, 1994．(椿美智子・椿広計共訳：
「医学研究のための統計的方法」、サイエンティスト社、2001)
浜田知久馬：学会・論文発表のための統計学、真興交易医書、1999．
23
使用目的を研究者の自己学習用に限り、その他への転用を禁じる

70を超える医学雑誌編集者の合意
ランダム化試験が対象
文献
Begg C et al. : Improving the q uality of reporting of ran domized
controlled trials, JAMA 276, 637-63 9, 1996.
(別府・津谷「コクラン共同計画資料集」サイエンティスト社に翻訳あり）
Meinert C: Beyon d CON SOR T, JAMA 27 9, 1487-1489, 1998.
Moher D: CO NSO RT: A n evolving tool to help impr ove the
quality of reports of ra ndo mized controlled trials, JAMA 279,
1489-149 1, 1998.
24
4
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
臨床研究の報告：ガイドライン
CONSORT statement：報告項目の規準

抄録
構造化
はじめに
方法
結果

データや論文を理解するための３原則

正しい用語を正確な理解のもとに使うべし
統計手法は要約手法、要約は適切か（手法の前提は満
たされているか）に注意すべし
どこまで結論は一般化できるか、に留意すべし

番外：良い統計家の教師・友達を持つべし

設定仮説、臨床的な目的、計画した部分集団・共変量解析
プロトコル、割付け、盲検
被験者の内訳（図表示）
解析主要・副次評価変数に対する介入の推定効果
（点推定と区間推定）
再解析に必要な詳細な要約統計量
群毎の予後因子の記述と（試みられれば）調整解析
プロトコルからの逸脱とその理由

コメント
バイアスと精度低下の原因を含む結果の具体的解釈
可能なら外的妥当性に対する議論
25
26
正しい用語を
正しい用語を
検査の特性
When doctors meet numbers
Berwick et al.(1981), Am J Med 71： 991-998.
Disease
Q1: 偽陽性 false positive-rate とはどれか？
Disease
+
test +
A
B
C
D
a: B/(A+B)
Test +
-
+
-
True-Positive False-Positive
False-Negative True-Negative
100%
感度 Sensitivity = TP/(TP+FN)
特異度 Specificity = TN/(FP+TN)
b: B/(A+B+C+D) c: C/(A+C) d: (B+C)/(A+D) e: B/(B+D)
PiD
NiH
医師研究者の半分は誤って覚えている！
27
28
ついでに： When doctors meet numbers
正確な用語を
Berwick et al.(1981), Am J Med 71： 991-998.

Q2:人口 100万人の都市に X病に罹患している患者が
1000人いる。A検査を行うと罹患している患者の95%が
陽性となる。一方、罹患していない人が陰性となる確率
も95%である。ランダムに住民に検査を行ったところ検査
は陽性となった。この人が罹患している確率はいくつ
か？
許せない誤用
これら不適格患者を母数から除くと …
二つの治療群に無作為抽出によって割り付け...
A薬については２用量、 B薬については有・無の階乗実験で…

一般会話ではまあ許せるが
基準物質の測定結果は表示どおりで、この測定系の精度は高い …
層別解析をおこなったところ、重症例では ...
a:1-3% b: 10-25% c: 50-60% d: 80-94% e: 95%
29
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
30
5
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
参考
参考
実験法と解析：多因子要因実験
N-SAS BC02
研究代表者渡辺亨
Design of experiments and analysis:Factorial experiments

2×2
A

noA
B
noB
ホルモン療法低感受性、n+ 症例に対する術後補助療法
エンドポイント
無病生存期間
神経毒性を中心とした HRQOL

Bの効果effect of B

Aと Bの間に交互作用無ければ、２つの実験分の情報量
Inform ation of 2 inde pen dent experime nts if there is no interaction
n個数
HER2
腫瘍径
術式
施設
動的割付
Randomize
Aの効果 effect of A
ACの有無、Taxaneの種類に関する 2×2要因実験
AC有無に関する非劣性non-inferiority試験、1200例
AC× 4 Paclitaxel× 4
AC× 4 Docetaxel× 4
Paclitaxel× 8
Docetaxel× 8
31
32
正しい理解
要約は適切か？
標準偏差と標準誤差
standard deviation vs standard error
標準誤差＝標準偏差/n1/2 ではない
50 ± 100 ???

標本分布の概念

「「統計量の標準偏差」の推定値」＝標準誤差

推定値±1.96（推定値の標準誤差）＝95%信頼区間
実験・試行の仮想的繰り返し
極端な歪か外れ値
均質な集団ならCVは20-40%程度
（増山元三郎「準恒常性仮説」）
33
34
参考
誤差的バラツキをどうやって測るか？
要約は適切か？
偏差値の解釈
n
平均 X = ∑ Xi / n
Q1: ある学生Tの試験成績は中学では 70 (平均=63.3)
高校では 30 (平均=33.0)であった。
成績は落ちたのか？
i =1
n
分散Variance = SD2 = ∑ ( Xi − X )2 /( n − 1)
Q2: 偏差値の上限は？
偏差値= (raw value-mean)/SD× 10 + 50
i =1
標準偏差Standard Deviation SD
変動係数 Coefficien t of Variation CV ＝SD/ X
35
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
36
6
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
要約は適切か？
要約は適切か？
分布の歪みと平均
偏差値と順位
ひずんだ分布(skewed distribution)では、
central value ≠ mean value
左に歪む left-skewed
正規分布なら
平均値と標準偏差による分布の要約が適切
(十分統計量：それ以上の情報は必要ない )
右に歪む right-skewed
正規分布なら
偏差値
mean median mode
mode median mean
60
70
80
up per 15.9%
2.3%
0.13%
median- mean: mea n-mo de = 1:2
37
38
要約は適切か？
要約は適切か？
正規分布の密度関数（ヒストグラムの）極限
標準偏差（ばらつきの大きさ）σ
なぜ正規分布

実際のデータの分布？？？

「統計量」の漸近（ぜんきん）分布 asymptotic distribution
ちりも積もれば正規分布
Σ（重み）（データ） − −− ＞正規分布
(x - µ )
1
)
exp(2σ 2
2π σ
2
ある程度の独立性があれば
パチンコのモデル
中心極限定理
central-limit theorem
平均（真ん中）μ
40
39
統計モデル
要約は適切か？
要約は適切か？
直線モデルのあてはめとモデル診断
全てのモデルは誤っている。ただし役に立つモデルも存在する。
y
(GEP Box)
モデルの意義
データの要約 summarizatio n
予測内挿・外挿
異常データ・問題点の摘出 exposure

直線モデルの意義
表現の一意性

前提は正しいのか？
y = xの線形関数＋誤差的変動
y=a+bx
x
誤差的変動：平均は０、分散等しく、独立でほぼ正規
ある因子の効果（影響）の定量的評価
医学統計では

現象（自然史）の理解
研究計画への利用
比較の際の偏りの除去・軽減
個々の患者への適用、とくに治療法の選択
41
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
回帰診断
残差の検討（残差プロット）と影響力の解析
42
7
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
回帰式もR2 もすべて出力は同じ！
要約は適切か？

要約統計量
平均、標準偏差は正規分布のもとでは完璧な要約
しかし外れ値、極端な歪みに対しては不適切（ロバストではない）
分布の変換あるいは他のロバストな手法

統計モデルのあてはめ
モデルの妥当性の検討：線形回帰の場合は残差プロット
他の手法の場合も類似の方法
ランダム化臨床試験の場合はあくまで補助的手法
43
44
内容

これだけは理解しておきたい統計基礎概念

なぜ統計学が必要か
統計学を理解するために
プロトコルを読むために必要な最低知識
検定とランダム化
NSAS-BC02プロトコルから：生存時間解析入門

正確度と精密度
accuracy and precision
無作為抽出とランダム化 random sampling vs randomization
臨床試験の目標
一般化可能性
generalizability
45
精密度と正確度 Precision and accuracy
46
臨床試験の目標
観測値＝真の値＋バイアス＋誤差的バラツキ
observed
true
bias
error
true value
accuracy
precision
○
○
○
×
×
○
×
×
47
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
バラツキを小さくすること（精度を高くすること）
Clarity
偏り (バイアス）を小さくすること
Comparability
広い対象に適用できる結論を得ること
G eneralizability
48
8
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
なぜバラツキ？
誤差的バラツキとバイアス
Random Variation and Bias
進行・再発大腸癌患者に対する５ FUの成績
authors
# of patients respon se (%)
Sharp and Benefeil
Hall and Good
Rochlin et al.
Allaire et al.
Cornell et al.
Every
Field
Bell
Weis s and Jacks on
Fergus on and Humphrey
Hurley
ECOG
Talley
Hyman et al.
Moore et al.
Ans field
Mayo
Ellis on
Kennedy
Knoepp et al.
Ols on and Green
13
19
47
17
13
12
37
22
37
12
150
48
271
30
80
141
358
87
22
11
12

85
63
55
47
46
41
41
36
35
33
31
26
21
20
19
17
17
12
9
9
8
さまざまな理由によるバラツキ
たとえば進行癌に対するある化学療法の奏効率
患者全身状態（ＰＳ）と ADMEの違い、
腫瘍の性質（病理・分子生物学的）、
dose-in tensit yとコース、評価部位と評価方法、出版バイアス,…
施設差

モデルとしての「誤差」
バラツキの理由は同定できない、あるいはあえてしない
確率変数としてのモデル化：確率論の応用が可能となる

49
誤差的バラツキとバイアスの相対性
知識が深まれば／情報が得られれば、
誤差的バラツキは制御可能なバイアス要因に転化
誤差的バラツキ Random variation
50
誤差的バラツキ Random variation
無作為抽出 random sampling : 同一確率で独立に
n=1
population 母集団
0%
sample 対象集団
20% responder
10%
14%
25%
30%,.....
each result is not equ al to
the true value
51
100%
Mean is 20% !
unbiased
n=4
0%
100%
0%
100%
n=200
52
信頼区間 Confidence interval
真値に収束する
大数の法則
分布の形が正規分布に収束する
中心極限定理
1/5 ≠ 4/20 ≠ 20/100 ≠ 200/1000
情報量（precision）の差
95% 信頼区間 confidence interval
(正確な計算あるいは正規近似)
1/5:
0.005-0.72
p ± 196
. × p( 1 − p ) / n
4/20:
0.06-0.44
正規近似
20/100:
0.12-0.28
200/1000: 0.18-0.22
53
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
54
9
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
医学研究におけるバイアス
Bias in medical res earch
選択バイアス Selection bias
どちらの病院を選びますか？ Which hospital to select?
主なバイアスの原因
対象選択
情報収集
（デザイン含む）
交絡
5-year survival
Surgery
Radiation
Selection of study population
Gathering information
(including design)
Confounding
Hospital A
B
80%
60%
25%
20%
55
患者選択のバイアス
がん第 II相試験における患者選択
選択バイアス Selection bias
In total: Hospital A 36%
56
MVAC for urothelium cancer
B 36%
50%
5-year survival
Surgery
Radiation
Survival Death T otal
Hospital A
B
16
24
4
16
20
40
36%
13%
Survival Death Total
20
12
60
48
80
60
Treatment selection (Treatment by indication)
Sternberg CN et al. (1985), J. Urology
12/24 CR
Sternberg CN et al. (1989), Cancer 44/121 CR
Loehrer PJ Sr. et al. (1992), JCO
RCT of MVAC
vs
single CDDP
17 CR 32 PR/ 126 4 CR 10 PR/ 120
57
58
交絡 Confounding
がんの臨床試験においては、反応（奏功率）の大きさは
患者選択によって大きく変化する。
（歴史対照と比較した有効性のある程度の評価は可能であるが。）
したがって、相対的な有効性の評価のためには
一般薬と同様に比較が必要となる。
原因系
処置・曝露
treatment/expo sure
?
結果・反応
respon se
関連 association
因果 causal effect
他の要因
交絡因子
confou n ding factor
それでは正確な比較はどうやって行うか？
患者選択と交絡によるバイアスの制御が必要
例：重度な患者に強い治療
59
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
60
10
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
交絡 Conf ounding
Random sampling vs randomization
無作為割付け（無作為化） randomization 内的妥当性の確保
無作為抽出
random sampling 外的妥当性
target pop ulation
Stage 1
施設の限定・安全性の配慮
stu dy po pulatio n
解析で無視すると
Stage 1+2
偶然・同意
無作為抽出：多くの統計理論において理論上重要な概念であるが、臨床試験に
おいてはほとんど現実味をもたない。私見であるが、不用で誤解を招く概念
Stage 2
Senn, S(1 997), Statistical Iss ues in D rug Development,Wiley: glossary
61
62
ランダム化の意義
ランダム化の意義
Byar D. et al. : Rando mized Clinical Trials, NEJM 29 5: 74-80, 1976
治療割付けに伴うバイアスの除去
予後要因の分布の均等化（平均的に）
個人差・バイアスを確率化
交絡を小さく
信憑性の向上
ｐ値の根拠
ランダム化に基づくdesign-basedな解析
母集団そして(仮想的）無作為抽出に基づくmodel-basedな解析
例：仮想的な10人の患者
治療に対する潜在的反応
A B
＋
＋
−
−
ランダム割付け
この分布は？
＋
−
＋
−
2人
推定したい奏効率の差
3人
(3-1)/10= 20%
1人
4人
10C5 =252ﾊﾟﾀｰﾝ最良は 100-20=80%、最悪は 0-40=-40%
真の値 20%からのﾊﾞｲｱｽは 0、誤差的ﾊﾞﾗﾂｷは大
誤差的ﾊﾞﾗﾂｷを小さくするには？ｻﾝﾌﾟﾙｻｲｽﾞ大きく
並べ替え分布
幸いに？簡単な問題では両者の結果は近似的に等しい
63
64
-40 -20 0 20 40 60 80
ランダム化の意義： Fisherの実験計画法
1930年代ロザムステッド農事試験場
新品種、肥料などの評価のための実験？
真値に収束する
大数の法則
分布の形が正規分布に収束する
中心極限定理
ﾌﾞﾛｯｸ
品種A
B
A B
B A
信憑性の高い評価になるか
ﾊﾞｲｱｽ（交絡）：水はけ、日当たり、地味、・・・
ﾌﾟﾛｯﾄ
均質に近いﾌﾞﾛｯｸ
最後はﾗﾝﾀﾞﾑ化
65
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
11
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
Fisherの実験計画法
技術評価のための実験
ランダム化の意義： Fisherの実験計画法
科学的精密実験
くり返し・反復
局所管理
ランダム化
repetition・ replication
local control
randomization
法則発見
易
可能な限り排除
０であるべき
要因組み合わせ factorial experiment
技術評価のための実験
目的
普及したときの有用性の評価
実験の制御
難
未知要因の影響ランダム化
誤差
存在を前提
研究(計画・実施）に要求される条件
臨床研究への実験計画法の応用
生物統計学の制度への組み込み
英国MRCによるストレプトマイシンの評価（1947）
倫理と科学の幸運なる一致
アメリカへの伝播：大規模予防研究、がん共同研究ｸﾞﾙｰﾌﾟ
新薬認可のシステム確立（FDA)
国際ﾊｰﾓﾅｲｻﾞｰﾘｮﾝ
E9ｶﾞｲﾄﾞﾗｲﾝ統計的原則
E3
治験の総括報告書
E5
人種要因（bridging研究）
Clarity
サンプルサイズ大きく
Comparability
ランダム化・マスキング（盲検化）
Generalizability
研究の繰り返し・メタアナリシス
施設・背景によるsubgroup解析
（交互作用の検討）など
プロトコル遵守（適格条件、治療、観察、報告）
データ管理
70
仮説検定の論理
内容

透視実験超能力を信じるか？ (ESP experiment)
つぼの中のサイコロの目を当てると主張する「超能力」は本物か？
なぜ統計学が必要か
統計学を理解するために
プロトコルを読むために必要な最低知識
検定とランダム化
NSAS-BC02プロトコルから：生存時間解析入門
1回の試行で当たったら？
2回の試行で当たったら？
・・・10回なら？
トランプなら？
71
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
72
12
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
仮説検定の論理
仮説検定の論理
数学での「背理法」
reductive abs urdity
K.Popperの科学哲学「反証できない命題は科学的ではない」
多少のリスクはあるが帰無仮説は真実とは考え難い
帰無仮説：「超能力者の言うことはまったくでたらめである」
しからば？
その下で観察事象あるいはそれ以上に仮説からずれた事象がおきる
確率は？
ｐ値 p-values
1回の試行であたったら？
2回の試行であたったら？
・・・ 10回なら？
1/6=0.17
1/36=0.028
0.00000002
トランプなら？
1/52=0.019
P ＜ 0.05 :
statistically significant
＜ 0.01 :
highly statistically significant
対立仮説： alternative hypothesis
超能力を信ずる
あるいは
何かインチキがあるのではないか
73
仮説検定の原理：一種の背理法
74
仮説検定の原理：一種の背理法
帰無仮説「新薬は効かない、標準薬と同等かそれ以下」
p値が基準の値（5%）以下なら
帰無仮説を棄却する（「新薬は効く」と判断する）
対立仮説を選択する
あるいは何かインチキ？と判断する
そのもとで、
現実に得られたデータ以上に新薬に有利な結果
が得られる確率を計算
Ｐ値
例：新薬とプラセボのクロスオーヴァー 2重盲検比較試験
エンドポイント :どちらが効いたか？患者の選択
10人中 10人が新薬選択Ｐ値は（ 1/2） 10=1/1024=0.00 098
9人なら 10人と 9人の分を加えて（ 1/2） 10+10 （ 1/2） 10=0.011
75
ＧＣＰ（品質保証）による排除
工業における抜き取り検査sampling inspectionの抽象化
繰り返しプロセスにおける平均的特性の確保
(Neyman-Pearson）
それは科学か？（ Fisherの批判）
76
仮説検定と２種類の過誤
α(第１種 )と β (第2種）
事実
意思決定
承認
（仮説を捨てる）
承認しない
新薬は効く
仮説検定と２種類の過誤
α(第１種 )と β (第2種）
効かない
1-β
検出力 power
sensitivity
α
false-positive
β
false-negative
1-α
specificity
（仮説を捨てない）
行政側： α の維持
ｽﾎﾟﾝｻｰ：資源の制約下でβを小さく（症例数増やす、誤差的バラツキ小さく）
検定の繰り返し（多重性：多エンドポイント、多サブグループ、多時点での検
77
定、複数の検定手法）、症例の除外：αの増加
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
事実
検査結果
陽性
（病気の診断）
陰性
病気
1-β
検出力 power
sensitivity感度
β
false-negative
アワテ者
健康
α
false-positive
1-α
specificity特異度
（健康の診断）
ボンヤリ者
78
13
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
仮説検定と２種類の過誤
必要サンプルサイズの計算
仮説検定と２種類の過誤
必要サンプルサイズの計算
Time-to-eventの場合、情報量はイベント数

ハザード（発生率）半減することを証明するために必要な
イベント数 = 95
（ α =0.05 両側、 β =0.10）
（累積）発生率
ｺﾝﾄﾛｰﾙ群治療群
1%
0.5%
5%
2.5%
20%
100%
10.6%
100%
効く薬を
精密なエンドポイントを
サンプルサイズを増やす
各群に必要 Number-Nee ded-to -Ttreat
な症例数
（ 1件のｲﾍﾞﾝﾄ減に対して）
6330
200
1260
40
310
48
薬効評価ではαは一定（両側5%が標準）
βを減らすには？
必要サンプルサイズの計算（ 2群： α =0.05, β =0.10）
連続量なら
各群 21×（群内 SD/群平均差） 2
割合なら
各群 21×（平均 p(1-p）） /差 2
10.6
--79
80
仮説検定と２種類の過誤
必要サンプルサイズの計算

優越性試験と非劣性試験
治療効果の差と信頼区間 : 標準治療 /試験治療の効果の差をδ
優越性： Superior
差とは何か？
非劣性の場合はホットな問題
信頼区間
（通常 95%）
これが 0を含まなければ
「統計的に（ 5%）有意」
優越性の場合：
期待したい差
（新薬開発の場合）
臨床的に意味のある（最小）差
（標準治療確立の場合）
可能な症例数である程度の検出力が保証される差
非劣性： Non-inferior
同等： Equivalent
判断できず : Indeterminate
Lower
(upper：通常0)
試験治療優れる
慣習による設定
δをどう選択するか？
Smallest effect size
There is little published experience
臨床的な有意差と統計的な有意差
81
モデルに基づく検定
割合の比較
リューマチに対する多施設共同プラセボ対照２重盲検無作為化比較試験
反応：改善あり（著名、やや）、無し
重要な共変量：性別、年齢、施設
test
placebo
response: yes( marke d, some), none
covariates: gender, age, center
improvement
some or marked
none
n11=28
n12= 13
n21= 14
n22= 29
n+1= 42
n+2 = 42
前提：それぞれの母集団での改善割合 ρ T ρ P
無作為抽出 random sampling
n1+ sampling
ρT
total
n1+ = 41
n2+ = 43
n=8 4
Koch et al. :From Peace ed. (1988),
Biopharmaceutical statistics for drug development , Dekker, 翻訳有り（サイエンティスト社）
83
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
ρP
n11● n12○
n11 follow s Binomial distrib ution
n21
pT= n11/ n1+ ,
estimator）
n2+ sampling
n21● n22○
(n1+ ,ρ T)
(n2+ ,ρ P)
ρ Tの推定値 estiamte（あるいは推定量
pp= n21/ n2+ ρ P
仮説 H0： ρ T = ρ P
84
14
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
標準正規分布（平均０、分散１）の密度関数
モデルに基づく検定
検定統計量 test statistics :
z=
Signal / Noise
pT − pP
S tan dard − Error − of − Numerator − UnderH 0
1 
n + n 12
 1
SE = 
+
 p (1 − p ), p = 11
n

n 1+ + n 2 +
 1+ n 2 + 
仮説の下、ｎ大でｚは標準正規に従う
z=3.274
正規分布の表からｐ値を計算
1.96:これを超えれば5%有意
Z= 0.3573/0.1091 =3.274 p=0.0005 4 (片側）
85
検定と推定の関連

ランダム化に基づく検定 Design-based test
検定
シグナル／ノイズ
（差の推定値／差の標準誤差）
正規分布のパーセント点と比較
絶対値が 1.96を超えれば 5%有
意

86
推定
95%信頼区間：興味のあるパラメータの推定値± 1.96×標準誤差
前提:ランダム化のみ
反応に個人差を考えてもよい
仮説H0：介入による反応に差はない
response of i-th individual by test=XiT placebo XiP
XiT= XiP
仮説の下で、ランダム化は n+1個の黒玉と n+2個の白玉をランダムに n1+と n2+に分
ける作業に対応
興味のあるパラメータが差の場合、
その95%信頼区間が0を含まなければ5%有意
87
ランダム化に基づく検定 Design-based test
得られたパターンの出現確率
probability of the observed pattern
プログラムと出力 Program and output (SAS)
TABLE O F TR EAT BY I MPROV E
● ● ● … n+1
○ ○ ○ … n+2
TR EAT
I MPRO VE
Fr equen cy￨
Ro w Pct ￨y es
n+1 Cn11・ n+2 Cn12 / nCn1+
より極端なパターンの出現確率を加える：片側
n11=28 確率 0.00082258
29,30,…41
88
合計 0.001
確率が同じかそれ以下のパターンを加える (13以下か 28以上）：両側
0.002
￨
To tal
-- ----- --+- ---- ---+ ---- ----+
t
￨
28 ￨
13 ￨
￨ no
41
￨ 68. 29 ￨ 31 .71 ￨
-- ----- --+- ---- ---+ ---- ----+
p
￨
14 ￨
29 ￨
43
￨ 32. 56 ￨ 67 .44 ￨
-- ----- --+- ---- ---+ ---- ----+
To tal
42
42
84
Fisherの直接確率検定 Fisher’s Exact test
89
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
90
15
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
プログラムと出力 Program and output (SAS)
プログラムと出力 Program and output (SAS)
STATIS TICS FOR TABL E OF TRE AT B Y IMP ROVE
Column 1 R isk Estim ates
Sta tist ic
DF
Valu e
Prob
--- ---- ---- ----- ---- ---- ---- ---- ----- ---- ---- ---- -----
R isk
A SE
95% Conf iden ce Bo unds
(A symp totic )
95 % Co nfide nce Boun ds
(Exa ct)
Chi -Squ are
Lik elih ood Ratio Chi -Squ are
1
1
1 0.72 0
1 0.96 2
0.001
0.001
---- ----- ---- ---- ---- ----- ---- ---- ---- ---- ----- ---- ---- ---- ----- ---- ---- -Row 1
0. 683
0. 073
0.5 40
0.8 25
0. 519
0. 819
Con tinu ity Adj. Chi- Squa re
Man tel- Haen szel Chi- Squa re
Fis her' s Ex act T est (Lef t)
1
1
9.33 9
1 0.59 3
0.002
0.001
1.000
Row 2
Tota l
(Rig ht)
(2-T ail)
1.0 3E-03
2.0 6E-03
Phi Coe ffic ient
Con ting ency Coef fici ent
Cra mer' s V
0. 326
0. 500
0. 071
0. 055
0.1 86
0.3 93
0.4 66
0.6 07
Diff erenc e
0. 357
(Row 1 - Row 2)
0. 102
0.1 58
0.5 57
0. 191
0. 389
0.35 7
0.33 6
0.35 7
91
92
仮説検定の原理
検定にはさまざまな種類
治療Aと治療Bの反応率の比較

データの型の違いと原理
型
A
B
反応ありなし
mA
nA-mA
mB
nB -mB
0. 485
0. 611
計
nA
nB
model-b ased
0-1
連続
time-to-event
帰無仮説のもとでは反応は固定していると考えてよい
並べ替えによって、現実のデータ以上に極端なパ
ターンが得られる確率を計算
design-based： Fisherの直接確率
反応率 p=n/mによって母集団の反応率を推定、差の正規近似
model-based： Zあるいはχ２乗検定

design- ba sed
割合の差の Z（ Z2=χ 2） Fisher
ｔ
並べ替え検定、順位和検定
Log-ran k検定
正確な検定が困難な場合の近似の違い
対立仮説として何を想定するかの違い
典型は用量反応を調べる場合
直線的な用量反応、プラセボとの最大用量の差、
プラセボとの最小用量の差、どこかの差、．．．

解析者の趣味の違い
93
94
正しい理解：高級課題
検定に対する誤解
Model based vs Design based
幸いにも、単純な問題では二つの（検定）結果はほぼ等しい

ランダム化試験の主たる解析はdesign-basedであるべき
計算能力が向上したので手間のかかる design-basedも実施可能
95
使用目的を研究者の自己学習用に限り、その他への転用を禁じる

ノンパラ検定＝順位を使う検定
分散が異なるかどうかF検定でチェックして、異なればWelch
サンプルサイズが小さくて正規性が確認できないときはノンパラ
正規分布に従わないときはｔ検定を使ってはならない
96
16
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
正しい理解：高級課題
検定に対する誤解
内容

ノンパラ検定＝順位を使う検定

分散が異なるかどうかF検定でチェックして、異なればWelch

順位検定はノンパラの一つ

群の大きさがそろっていれば Welch不要、むしろ検定の選択が問題

サンプルサイズが小さくて正規性が確認できないときはノンパラ

サンプルサイズ小さいとき（１０以下）は、順位検定の検出力小さい

なぜ統計学が必要か
統計学を理解するために
プロトコルを読むために必要な最低知識
検定とランダム化
NSAS-BC02プロトコルから：生存時間解析入門
正規分布に従わないときはｔ検定を使ってはならない
ｔ検定は design-b ase dな並べ替え検定の近似と解釈できる
したがってαは保たれる（criterion-robust nes s成立）
ただし外れ値や歪が大きいと β大きくなる（ efficiency-robust nes s問題）
97
98
がん臨床試験プロトコルを読むために
NSAS-BC02から

がん臨床試験プロトコルを読むために
これを理解できれば完璧！
試験計画とくに割り付け方法
7-3-1(p.21)層別化因子に基づいて動的割り付け法を用いて割り付ける。

症例数の設定根拠
15-1-1(p.46）同等とみなせる幅Δ これをハザード比に換算して 1.30

割り付け方法
必要性具体的手法（おおよそ）
解析集団
集団の違いによるバイアス、ITTの考え方
統計的推測の方法
推定・検定そして信頼区間の概念
α 、β、検出力
具体的手法（どこまで？）
α、β、Shoenfeld-Richterの式（正規近似）

統計解析
15-6(pp.50-51）群間の均衡性について、..分割表χ2検定、Wilcoxon検定、
Mantel検定
intent-to-treat principleに基づきKaplan-Meier法により無再発率を推定し、
log-rank検定を適用..信頼区間の計算にはGreenwoodの公式..予後因子の
影響の調整と治療効果の推定のためCoxの比例ハザードモデル...

中間解析
15-7(p.52） Lan&DeMetsの方法で多重性を調整..ベイズ流予想確率99
優越性か非劣性か、その他か（選択、用量反応の解析など）
生存時間解析の「 3種の神器」
Kaplan-Meier推定、 Log-rank検定、 Cox回帰（比例ハザードモデル）

症例設定の根拠
中間解析
原理
必要性多重性の必要性
100
品質管理と品質保証
ランダム化手法が不適切であった例
割り付け方法

目的・目標
既知の因子はもちろん、未知の因子についても群間で均衡
偏りの防止、感度の向上
盲検化できない場合には予見性を小さくする
一方で過度に複雑な手続きは避けたい

具体的手法
盲検下をどこまで
中央登録かそれ以外か（封筒法は一般には×）
層別するか
背景因子を考慮した動的割り付けを行うか
施設をどうするか
割り付け比率は？
2群なら通常は1:1、ときに2:1など
101
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
102
17
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
割り付け方法（続き）

割り付け方法（続き）
実際に用いられている方法
盲検可能な治験の場合
施設毎の置換ブロック法 permuted-block
2群ブロックの大きさ4の場合、AAPP,… PPAAの６通りを
施設毎にランダムに順次発生
ブロックの大きさはプロトコルに通常記載しない
盲検を行わないがん臨床試験の場合
層別を行うこともあり
通常は2-4程度の因子を用いた動的割り付け法
どの時点でもバランス取れるように割り付け確率変化させる
施設は因子に含める場合とアンバランス程度の制約を与える
場合あり（Zelenの方法）
A BBA
性
年齢
重症度
A A BB
….
置換ブロック法
群A
20
10
11
19
5
25
男
女
<50
>=5 0
III
IV
群B
19
11
10
20
3
27
次患者（男 <50 III) どちらに割り振ればバランスとれるか
A:20+11+5=3 6 B:19+10 +3 =32
Bに割り振る確率大とする
最小化法
103
Prospective studies and retrospective studies
前向き研究と後ろ向き研究
Cohort study コホート研究
exposure
control
n0
Follow-u p
Risk ratio リスク比
＝
Prospective studies and retrospective studies
前向き研究と後ろ向き研究
Case-control studyケースコントロール研究
disease
no-disease
m1
n1 -m1
m0
n0 -m0
n1
104
disease（case）
n1
n0
Survey
exposure yes
no
m1 /n1
m0 /n0
no-disease
（control）
m1
n1 -m1
m0
n0-m0
m1 /(n1 -m1)
m0 /(n0 -m0 )
Odds-ratio オッズ比＝
105
106
正しい理解
Prospective studies and retrospective studies
前向き研究と後ろ向き研究
オッズ比と相対危険
ある薬剤 Z服用によって疾患 Xの死亡オッズが 10倍になった
In rare disease :
新聞報道「 Zによって死亡が 10倍になる！」
Z無
Z有
0.01
0.05
0.10
0.20
0.092
0.345
0.526
0.714
O DDS-RATIO = RISK-RATIO
オッズ = p/(1-p)
107
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
オッズ比＝曝露群のオッズ /対照群のオッズ
108
18
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
オッズ比一定（10）の場合のリスク比（相対危険）
ハザード

発症率罹患率
死亡率

ハザード hazard

morbidity, incidence rate
mortality, death rate
ともにこれまで起きていない事象（イベント）が新たに起きるスピードとして
が用いられる
109
110
打ち切り
ハザードとその推定
event, failure：目標の事象
打ち切りcensoring

×
?
×
脱落 drop-out, lost-to-f ollow- up
発症率、死亡率
ハザードhazard
[time]-1
単位時間あたりの新たなイベントの発生
ハザードの直接推定（保険統計法） actuarial method
国の人口動態統計など
観測打ち切り termination of follow- up
初期故障型
*打ち切りはランダムか？
non-informative censoring
time

打ち切りとその後の予後が独立
informative censoring
摩耗故障型
偶然故障型
time
time
臨床では、サンプルサイズ不足のため（累積）生存率推定
通常 Kaplan-Meier法
111
112
ハザードと（累積）生存率
保険統計法
ハザードと(累積）生存率の関連 hazard vs survival function
一定
指数 exponential関数
λ(t)= λ
2倍になれば
hazard =
number of deaths
size of risk set - 0.5(deaths+dropout s)
113
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
1
S(t) = exp(- λt)
2乗
0.9 -> 0.81
0.8 -> 0.64
0.6 -> 0.36
微分方程式
微分と積分の関係
速度と到達距離の関連数学的には１：１であるが統計的には？
114
19
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
オッズ、ハザード、リスク
生存時間解析の3種の神器
t
リスク（累積発症率）
p (t ) = 1− exp( − ∫ λ ( u) du)

λが小さく一定なら ≈ λt
オッズ
p
1− p
p 小さければ
Kaplan-Meier法
Log-rank検定
Cox回帰

u =0

ランダム化試験なら基本的解析はログランク検定
しかし、
≈ p
単なる有意性有無だけでなく、治療効果を推定したい
（割付に用いた）予後因子の予後予測性を知りたい
治療効果予測因子の予測性（治療との交互作用）知りたい
多数の因子の影響を同時に考慮したい
慢性疾患では（イベント発生少ないがん再発でも）
オッズ比∼ ハザード比∼ リスク比
このときモデル（ Cox回帰が代表選手）が有用
115
生存関数の推定と比較
116
Kaplan-Meier法：積極限product-limit法
生存関数の推定
打ち切り無ければ単純で生存割合をプロット
打ち切りあれば Kaplan-Meier法誤差は Greenwoodの公式
打ち切りはヒゲで示すことが多い
生存関数の比較
打ち切り無ければふつうの連続データの解析
ただし歪み大きいので変換、ないしノンパラメトリック検定
3年、 5年等の生存割合の比較
death1
時点選択の問題、情報のロス
10
ハザードの比較
順位を用いるノンパラメトリック検定
1
death1
9
1× (1 -1/1 0)
censor1 death1
8
7
6
1× (1 -1/10 )× (1 -1/9 )
1× (1-1 /10 )× (1-1 /9)× ( 1-1 /7)
117
グラフの見方：
( 念のため）グラフが上にある方が生存成績が良い
端の方は信頼性が低い
グラフの下の面積が平均生存期間
MSTは50%の線と交わる時点
118
ハザードの違いのノンパラメトリック検定
time
群１
2
群1
2
10
death 1
death 1
10
death 1
死
1
0
1
生存
9
10
19
10
10
20
群1
2
死
1
0
1
生存
8
10
18
9
10
19
ハザード等しければ
O-E = 1 - 1×10/20
1- 1×9/19
0- 1×10/20
0- 1×10/19
O: observed, E: expected
119
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
120
20
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
ハザードの違いのノンパラメトリック検定
多変量解析＝統計モデルのあてはめ

検定統計量
χ =
2
モデルの意義
データの要約 summarization
予測内挿・外挿
異常データ・問題点の摘出expos ure
(∑ weight (O − E )) 2
Variance
ある因子の効果（影響）の定量的評価
医学統計では
これが大きくなればなるほど群間差あり
Variance分散の式は省略
3.84より大のとき5%有意
重み 1
risk-setの大きさ
全てのモデルは誤っている。ただし役に立つモデルも存在する。
現象（自然史）の理解（予後因子・予測因子）
研究計画への利用（層別因子、調整因子）
比較の際の偏りの除去・軽減
個々の患者への適用、とくに治療法の選択
Log-rank検定
Generalized Wilcoxon検定
122
121
比例ハザードモデル Proportional hazard model
= Cox回帰 regression
血管新生（Micro Vessel Count）と乳癌患者(n0 )の予後
Heimann R. et al. JNCI 1996; 88:17 64-9
hazard (t , x) = hazard (t ) ×ψ ( x )
ψ ( x ) = exp(β 1x1 + β 2x 2 + ...β k xk )
= exp(β1 x1 ) exp(β 2 x2 )L exp( β k x k )

ハザードを時間に関する部分と共変量の部分に分解
x=1(試験治療）=0(対照群）とすれば（ダミー変数という）
β <0 効果あり、 =0 効果なし
（ β/標準誤差） 2 > 3.84 なら

exp(β）：ハザード比
5%有意
因子の寄与は掛け算（対数線形性）
時間依存性共変量も扱うこと可能
比例ハザード性・対数線形性（前提）を検証すること好ましい
123
血管新生（Micro Vessel Count）と乳癌患者(n0 )の予後
Heimann R. et al. JNCI 1996; 88:17 64-9
ログランク検定結果
Cox回帰結果
124
比例ハザードモデル Proportional hazard model
= Cox回帰 regression

x ：共変量 covariates
人口学的変数（性、年齢）、手術・病理・ゲノム情報、
治療法、施設（変量モデルとして扱うこと多い）・時代
コード化の問題、とくにステージなど順序変数どうするか
可能ならダミー変数
相関の高い変数（多重共線性） 0.8くらいなら問題なし

変数の数はどこまで
情報量はイベント数１変数 5イベント以上欲しい

変数選択
交互作用

125
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
減少法の方が安全、全ての組み合わせの実施も可能
掛け算の項をモデルに導入
126
21
臨床試験のための生物統計学入門（大橋靖雄）
第6回CSPOR･CRCｾﾐﾅｰ（2003/2/8∼9）
予後因子と予測因子
目標：どこまで達成できたか？
hazard (t , x) = hazard (t ) × ψ (x)
ψ ( x) = exp( β 1 x1 + β 2 x2 + ...β k xk )

予後因子モデル βT×Treatment＋βG× Factor
このテキストのレヴェルは実は高い
「よく分かる」という授業・本の印象は既知の知識の量による
結局、（その場では分かったつもりになっても）一回聞いただけではな
かなか分からない。繰り返し接するか、一度本格的に勉強するか
全部理解しようとは思わないこと。重要な概念だけで十分
Treatment =0
Treatment =1
Log-h azard
Factor=0
1

予測因子モデル β P×Factor×Treatment

Q and A
統計パッケージデモ（休憩時間に、伊藤陽一先生）
SAS：製薬会社や FDAで使われている業界標準、敷居高い・値段も高い
JMP：研究者向けの使いやすいソフト、教育用に適
Treatment =0
Log-h azard
「オンコロジストのための統計学」を読む上で必要なエッセンス
を話す
Treatment =1
Factor=0
1
127
128
重要な概念

Q and A
デモ
正確度と精密度
無作為抽出とランダム化
ランダム化とITT
一般化可能性
検定と信頼区間の構成
必要な情報量とサンプルサイズの計算
多重性によるαの上昇、中間解析
割り付け法の実際
ハザード比、オッズ比、リスク比
生存時間解析の３種の神器
129
使用目的を研究者の自己学習用に限り、その他への転用を禁じる
130
22