Comments
Description
Transcript
p値と臨床的な効果(061227)
ROCKY NOTE p値と臨床的な効果(061227) p値が大きいと何だか薬の効果もありそうな気もするが実際は全く関係ない。MR が「p=0.01 で すから、結構効きます。」などといっても全く耳を貸してはいけない。この表現の前後には全く関連 がなく、それぞれ独立して評価しなければならない。「統計的な差」のありなし、「臨床的効果」のあ りなしを指標にして、4 分割表を作ることが出来る。臨床的にはそれに加えて、試験がまだ行われ ていないというカテゴリーもあるであろう。合計 5 つぐらいが想定できる。 臨床的効果 あり 統計学的な差 なし 大きい 小さい A 臨床的効果が大きくて統 B 臨床的効果が小さくて統計 計学的に有意差あり 学的に有意差あり C 臨床的効果が大きいが統 D 臨床的効果が小さくて統計 計学的に有意差はない 学的に有意差もない E 試験が行われていない 臨床的な効果が大きくて、統計学的に有意差があればいうことは無い(例えば胃潰瘍に対する PPI 投与とか)。臨床的な効果は小さいが、統計学的な差があるものは使用に注意が必要である (高脂血症治療薬の脳卒中予防効果など)。統計学的な差(有意差)が出なければ、偶然の影響 を否定できないわけなので、臨床的効果が大きかろうが小さかろうが「偶然かもしれない・・・」で終 わってしまう気がする。nを増やせば理論的にはどんな小さな差でも有意差は出せると思うが、n を極端に増やさないといけない研究は、裏を返せば臨床的効果が小さいということを意味するの で、逆に副作用や金銭面での問題のほうが目立つ場合もある。このあたりは大規模臨床試験の 項目を参考にしたい。 p値 p値のpとは probability のpである。帰無仮説(差はないとする仮説)が正しい場合に得られるデ ータに関する偶然性の確率の大きさで、噛み砕いて言うと、実際には効果がないにもかかわらず、 偶然に差がありと判断される確率のことである。このp値が 5%以下ならば偶然の影響はないだろ うとして、帰無仮説(差はないとする仮説)を棄却する。ここで 5%という数字は有意水準と呼ばれ ているもので、帰無仮説を棄却するための目安となるものである。設定は恣意的な数字であるが、 一般的には 5%または 1%とされる。5%や 1%であれば十分小さいでしょ。みたいなのりで勝手に 決めているわけである。別にそうでなくてもいいが、なるべく大多数の人から文句の出ない数字で 設定するのがよい。「私は有意水準 15%で設定しました。」とか、「今回だけ有意水準 0.1%を適用 ROCKY NOTE ROCKY NOTE しました。」などといってもなかなか通用しないと思われる。こう考えると、統計学的に有意といって も、1%と 5%のどちらを有意水準とするかによって統計学的な差の明暗が分かれる場合もある。 まあ、この程度のものでしかない。 ここで、簡単な占い師 A、B の例を考えてみる。占い師 A は、箱の中身がリンゴなのかミカンなの かをあてることが出来る。占い師 A に本当に予言の能力があるのかどうかを検証してみる。占い 師には予言の能力が無いと仮定する(帰無仮説)。占い師は 6 回連続で箱の中身がリンゴなのか ミカンなのかを言い当てたとしよう。そうすると、偶然当たった確立は以下のようになる。 1 回成功 1/2=0.5 2 回連続成功 (1/2)2=0.25 3 回連続成功 (1/2)3=0.125 4 回連続成功 (1/2)4=0.0625 5 回連続成功 (1/2)5=0.03125 6 回連続成功 (1/2)6=0.0009765625 5 回連続して成功した時点で、偶然にリンゴかミカンか当たった確立が 5%をきっている。6 回連続 で当てれば偶然の確率は 1%以下である。どれくらい偶然の影響が少なければ本当に能力があ ると判断してよいだろうか?この値を有意水準といって、5%か1%が良く用いられる。有意水準 5%と設定すると、5 回連続して成功した時点で統計学的に偶然の影響は少ないと判断して、帰無 仮説を棄却する。つまり、予言の能力が無いという帰無仮説を捨て去るわけである。(*) しかし、よく考えてみると、箱の中身がリンゴかミカンかは重要なイベントであろうか。日常生活 で、箱の中身がリンゴかミカンか悩むようなことは皆無といってよい。統計学的に差があるといって も実際の効果としてのインパクトは全く別問題であることが分かる。ちなみに、占い師 B はルーレ ットの赤と黒を予言できたとしたらどうであろうか?こうなると実際のインパクトとしては非常に大き くなる。こんな友達なら何人でも作りたい。(細かいことを言うと赤と黒と緑だが、ここでは 細かい ことは言わない)MR の紹介している薬剤が、統計学的に有意差があるのかどうかという視点は重 要である。しかし、同様に、リンゴとミカンの話なのか、それともルーレットの話なのかという切り口 つまり、イベントの重要性についても注目すると面白い。(真のアウトカムについては PECO の項 目も参照) (*)この方法は片側検定と呼ばれるもので、医学論文では通常両側検定を行うので危険率は 2 倍となり、6 回成功して有意水準が 0.05 より小さくなる。 参考文献 1. 名郷直樹.EBM キーワード.東京,中山書店,2005. ROCKY NOTE