...

統計処理の概要(PDF

by user

on
Category: Documents
3

views

Report

Comments

Transcript

統計処理の概要(PDF
医療情報学:参考資料
統計処理の概要
1/13(統計処理の概要)
<標本抽出>
マスコミにしばしば登場する「世論調査」を例に説明します。ご存じのように、世論調査は悉皆
調査(=母集団全員を隈無く調査する)ではありません。国民の一部を対象に実施されます(通常
は、3 千人程度です)
。対象となった集団を標本、標本を選ぶ作業を、標本抽出と呼んでいます。政
権与党の集会で調査しても、民意が反映されない(”正しい”内閣支持率が得られない)ように、
抽出方法を誤ると、結果の信頼性が失われてしまいます。この意味では、標本抽出は世論調査の生
命線と言っても過言ではありません。
統計学的には、無作為抽出(random sampling、ランダムサンプリング)という方法を使うべき
である、とされています。耳慣れない用語かも知れませんが、公平にくじ引きで選ぶ方法と思って
いれば間違いがありません。この方法が原則とは言っても、偏りのない標本を保証するものではあ
りません(この点もしっかり認識しておいて下さい)。なぜならば、公平にくじを引くので、運が
悪いと(良いと?)
、男女半々であっても、
「選ばれたのは全員男性」という可能性があるからです。
そこで、重要な要因については、あらかじめその要因のカテゴリー別にグループ化し(層別と呼ぶ)
、
その層から無作為に選ぶという方法を採ることがあります。これを層別抽出法と呼んでいます。こ
うすることにより、層別した要因に関しては偏りが生じなくなります。通常の世論調査では、年代、
居住地域、性別、などで層別を行っているようです。
ここまでは、標本や標本抽出に関する基本的事項ですのでぜひ覚えておいて下さい。ただし、実
際の看護研究で利用することあまり多くはないと無いと思います。標本抽出できるほど、多くの標
本に恵まれることは稀だからです。入手可能なデータ全て取り込んでもまだ足りない、というのが
実情ではないでしょうか。
それでは、このような統計的な配慮が要らないかというと、そうではありません。しばしば、対
象を2群に分けて実験あるいは調査を行うことがあります。このとき、この2群に分ける方法を誤
ると、先に上げた政権与党集会での調査になってしまいます。この点について具体的に説明しまし
ょう。
例えば、退院後の生活指導として、定期的に指導書を送る方法と、運動教室に参加して貰う方法
のいずれが有効かを検証する調査を企画したとします。対象を2群に分ける必要があります。「対
象の意向で決める」とか「対象者の属性で判断して決める」という方法を採りがちですが、これは
いけません。なぜならば、活動傾向の強い人が教室群に偏る可能性が高く、運動量が教室群の方が
多くても、教室による効果と断定することができないからです(教室に参加しなくても運動量が多
くなる可能性を否定できないため)。どうすれば良いのでしょうか。対象者に意図や計画を十分に
説明し承諾を取った上で(インフォームドコンセントは看護研究においても大切です)、くじ引き
により2群に分けるのが理想です。理想通り実施できないことも多いと思いますが、できるだけこ
の理想に近い、すなわち、選別による偏りが可能な限り小さくなるような工夫を忘れないください。
<統計的データ>
調査の企画段階で統計的データというと、何かピンとこないかもしれませんが、実はとても大切
な意味を持っています。この点を中心に説明しましょう。
通常の看護研究において、標本数はあまり多くは望めません。100 集まれば良い方で、500 を超
える、あるいは 1000 を超えるなどは望外と言わざるを得ません。ところが、カテゴリカルデータ
の場合、100 名のデータでは、2群の間に 20 パーセント程度の差がないと統計的には有意とはなり
ません。すなわち、○○群では 20%の発生率(該当率)、××群では 40%の発生率(該当率)とな
2/13(統計処理の概要)
らないと、差があるという結論が得られないのです。標本数が 100 以下になれば、さらに大きな差
が必要となります。この説明で分かるように、通常のレベルの標本では、かなり明確な差がない限
り統計的な裏付けが得られません。少ない標本でも有意差、すなわち統計的裏付けを得るためには、
取るデータを工夫する必要があります。この工夫について説明する前に、基本的なことを説明して
おきます。
統計的データは大きくは2種類に分類されます。質的データと量的データです。質的データはカ
テゴリカルデータとも呼ばれます。性別や血液型のように属性(カテゴリー)として分類されるの
が質的データで、年齢、血圧、身長、体重のように、数値として測定されるのが量的データです。
質的データは、さらに、カテゴリー間に順序がある場合とない場合に分類されます(前者を順序尺
度、後者を名義尺度と呼んでいます)
。量的データも同様に、比例尺度と間隔尺度に分類されます。
ゼロが絶対的な無を意味し、マイナスの値が意味を持たないのが比例尺度(例えば身長や体重)で、
摂氏で表された温度の様に、ゼロが相対的な規準点としての意味しか持たないものが間隔尺度です。
量的データは、カテゴライズという操作を通じて、質的データに変換することができます。たと
えば、収縮期血圧(mmHg)を 100 未満を低い、100∼130 を普通、130 以上を高い、と分類することに
当たります。逆の操作、例えば、血液型の A 型を 1、B 型を 2、O 型を 3、AB 型を 4 と表すことをコ
ード化と呼んでいます。先のカテゴライズと異なり、コード化を行っても、量的データにはなりま
せん。間違えないようにしてください。数字で表されたデータが質的か量的かを見分けるのは簡単
です。単位があれば量的、単位がなければ質的です。
さて、少ない標本でも有意差(統計的裏付け)を得やすくする工夫ですが、一言で言うと「情報
量を多くする」ということです。健康状態を調査するときに、「良い・悪い」という2段階で質問
するよりは「かなり良い、やや良い、やや悪い、かなり良い」と4段階で質問した方が、情報量が
多くなり、有意差が得やすくなります。さらに、4段階よりは5段階、7段階、あるいは 10 段階
の方が情報量は多くなります。ただし、あまり細かくすると回答者に真意が伝わらなくなる恐れが
あるので注意してください。この段階分けを究極まで押し進めたのが、VAS(バス)という方法で
す。痛みの評価などで良く利用されています。「かなり痛い、やや痛い、
・・・」で回答して貰う代
わりに、紙に書かれた 10cm 程度の線上のある場所を、痛みの程度(左端が全く無し、右端が死ぬ
ほど痛い)に応じて指し示して貰い、その長さを痛みの尺度とする方法です。これにより、情報量
が飛躍的に増大します。
次に、量的なデータをカテゴライズして調査するときがあります。年齢などを「10 代、20 代、
30 代・・・」とすることにあたります。これは上の意味で、あまり賢い方法とは言えません。この
ようにして尋ねてしまうと、平均値すら計算することができなくなるからです。年齢などは
「
(
歳)」のように、そのまま値を記入して貰うべきです。同じ事が、他の変数(例えば、身長
や兄弟の数)でも言えますが、一寸注意が必要な場合があります。喫煙状況や睡眠時間に関する質
問が典型的な例です。例えば、喫煙状況は、1日の喫煙本数を「(
本)」のように尋ねれば良い
ような気がしますが、実際に調査してみると、「10∼20」の様な回答が結構多く帰ってきます。日
常的に変動する可能性がある変数を調査するときは、すべてこのような問題が発生します。これは、
カテゴリカルで尋ねても同様です(この場合は複数のカテゴリーに○が付きます)。
「10∼20」のよ
うに回答されてしまうと後の処理が大変困ってしまいます(このようなとき、統計的にこうしなさ
いという指針は一切ありません)。このような問題を避けるためには、例えば、今日1日の本数を
問うとか、最近1ケ月の平均的本数を問うなどの工夫をする必要があります。
ただ、このような工夫は、対象者に真意が伝わるか、目的に合っているか、さらには、統計処理
上どの程度の効果が望めるか、を十分吟味してから取り入れてください。とくに、対象に理解して
3/13(統計処理の概要)
貰えるか、あるいは、対象者に対して適切かは、予備調査などを通じて入念に検討しておく必要が
あります。
今、説明した工夫は、データを取ってからでは意味がありません。統計的考察はデータを取る前
にも必要であることを肝に銘じておいてください。なお、情報量を増やすことによりどれだけの効
果を望めるか、という点に関しては、統計的仮説検定も含めいくつかの準備が必要となりますの、
次回以降とさせて頂きます。
〈データのまとめかた〉
次に、データのまとめ方について説明しましょう。
データは前回説明したように、質的なデータと量的なデータに区分されます。実験を行った場合は
量的なデータ、すなわち、数値で測定されたデータがメインとなりますが、アンケート調査などで
は、量的なデータはごく一部で、大半は質的なデータ、すなわち、カテゴリーとして表されるデー
タになります。いずれのデータがメインであるかによって、処理が変わってきます。タイプによる
処理の違いも含め、まず、統計的処理の流れについて見ておきましょう。
〈統計的な処理の流れ〉
統計的な処理は概ね次のような流れで進めていきます。
(1) 解析データの固定
(2) 欠損値の固定
(3) 基礎的集計
(3-1)頻度集計(全体)
(3-2)記述統計(全体)
(3-3)グループ別集計
(3-4)グラフ化
(4) 各種データ変容
(4-1)カテゴリーの統合:5段階を3段階に
(4-2)新変数の計算
:身長と体重から肥満度を求める
(4-3)分類変数の作成 :肥満度より肥満の程度を分類
(5) 関連性の検討
(5-1)クロス集計を用いたカイ二乗検定
(5-2)t 検定や分散分析による平均値の比較
(5-3)各種ノンパラ検定
(5-4)相関・回帰分析
(6) 差の構造の分析
(7) 多変量解析等を用いたモデルの構築
どのような処理が必要になるか、項目別に順次説明していきます。
(1)解析データの固定
第1回に説明しましたが、データの整理や解析には、必ずコンピュータを利用してください。以
降、コンピュータの利用を前提に進めます。なお、自由記述などのように、コード化できない項目
4/13(統計処理の概要)
に対する集計には触れません。
統計的な処理を行うデータは、必ず数字で入力します。回答を a、b、c で求めた場合であっても、
a=1、b=2、c=3 のように、数字に置き換えてください。このとき、コンピュータの置換機能を利用
すると簡単に置き換えることができます。ただし、簡単に置き換えられるからといって、数字以外
の文字を安易に利用してはいけません。実際に試してみれば直ぐにわかりますが、入力に何倍もの
手間がかかります。特別な事情が無い限り、回答肢に付ける記号は数字にしてください。これは調
査用紙を設計するときの大切なポイントです。なお、入力の有無によらず、回答肢には記号(でき
るだけ数字)を付けましょう。
入力が終了したら、必ず読み合わせ等の確認作業を行います。確認・訂正作業が終了したら、次
にデータの選別を行います。成人の外来患者を解析対象にするのであれば、付き添いや見舞いでの
来院、あるいは、18 歳未満は除外します。このような属性による選別以外に、例えば、性別欄の未
記入者やある項目群の不完全回答者なども除外します。全ての質問に正しく回答した者のみに制限
することが望ましいのですが、多くの場合困難です。というのは、このような制限をすると、解析
対象が半減してしまうからです。重要な基本属性項目(年齢や性別)、あるいは、研究上重要な役
割を果たす項目に不備がある者のみを除外するのが普通です。当然ですが、調査の計画段階で、こ
のような不備がおこらないよう、十分配慮する必要もあります。
このような選別の結果、残ったデータが解析対象となります。この一連の作業を解析データの固
定と呼んでいます。この作業に誤りがあると、以後の処理が全て無駄になりますので、慎重の上に
も慎重に行ってください。
(2)欠損値の固定
回答や測定の不備は、通常欠損値として処理されます。また、「その他」の回答も場合によって
は欠損値とすることがあります。解析データを固定したら、次に、項目ごとに欠損値が有るか、有
るとしたらどのような値かを整理しなくてはなりません。
エクセルなどの表計算ソフトで統計処理を行う場合、欠損値は「空欄」としておくのが無難です(通
常、空欄は欠損値扱いされます)。「ゼロ」などの具体的な数値を欠損値としても悪くはないのです
が、平均値などを求める際に、工夫(ある種の操作)をしないと、「ゼロ」を含んだ計算結果を得
るといったミスを犯してしまいます。この点、統計専用ソフトは、変数ごとに欠損値の指定ができ
るので便利です。
(3)基礎的集計
解析データや欠損値を固定したら、いよいよ統計処理に入ります。頻度集計と記述統計は、基本
中の基本です。すべての研究で実施すると言っても過言ではありません。
まず、頻度集計は質的データに対する集計で、カテゴリー別に頻度(該当者数、統計の用語では度
数と呼ばれる)とその割合(パーセント)を求めます。性別で言うと、男性○○人(○○%)、女
性△△人(△△%)という集計を行うことに当たります。パーセントは特別な事情が無い限り、小
数第1位までで表します。なお、エクセルでは、ピボットテーブルという機能を利用すると頻度集
計を実施できます。
次に、記述統計は、量的データに対する集計で、平均値、標準偏差、最大値、最小値などの分布
の特徴を示す指標を求めます。歪度、尖度、中央値、パーセンタイル値などの指標を追加すること
もあります。エクセルでは、分析ツールの基本統計量を適用すると、でパーセンタイル値以外の指
標を求めることができます。ここでは標準偏差についてのみ補足説明しますが、その他の指標につ
5/13(統計処理の概要)
いては適当な解説書を参考にしてください。
標準偏差は分布の広がりを示す指標で、大きくは、一人当たりの平均値からのズレを表します。
正規分布(統計学上最も重要な分布です)は、平均値とこの標準偏差で定まります。このようなこ
ともあり、平均値や標準偏差は単独で表示されることは稀で、「52.5±3.5」のようにペアで表記さ
れます(前者が平均値で後者が標準偏差です、念のため)。
「平均値を示した場合は標準偏差も併記
する」、このことはぜひ覚えておいてください。
なお、量的なデータに対しては、適当な範囲化を行い質的に変換し、頻度集計を行うこともめずら
しくはありません。例えば、身長を 5cm 間隔に区切り、それぞれの区間の頻度やパーセントを求め
るなどはその一例です。
このような集計は、全体で行う以外に、男女別とか年代別とかのように、主要な属性別にも行う
必要があります。さらに、男性の 30 歳代、40 歳代、女性の 30 歳代、40 歳代のように、両者を組
み合わせたグループ化が必要になることもしばしばです。なお、このようなグループ化した集計は
表計算ソフトでは荷が重いため、統計専用ソフトを利用した方が、間違いも少なく効率的に進める
ことができます。
基礎的な集計の主な目的は、「データのチェック」と「データの概略を把握する」ことにありま
す。読み合わせで見つからなかったデータの異常が基礎集計で発見されることはよくあることです
(最大値が1桁違っていたとか、あり得ないカテゴリーの頻度が集計された等)。概略の把握も兼
ねて、よくその内容をチェックしましょう。さらに、概略把握という意味では、数値的な集計以外
にグラフ化も試みる必要があります。「百聞は一見にしかず」のたとえ通り、グラフの効果は絶大
です。表計算ソフトや統計グラフ専用ソフトなどを利用すると、驚くほど簡単に綺麗なグラフを作
成することができます。色彩やデザインなどの変更も一瞬です。なお、ソフトにより、グラフの種
類や変更できるグラフの要素(軸の太さ、目盛り数値の書体、等々)が異なっています。表計算ソ
フトよりは、統計グラフ専用ソフト(例えば、ザ・グラフ)のほうが、グラフ機能に関しては優れ
ています(例えば、縦軸の一部を波線で省略したグラフを描くことができる等)。しかし、一般的
なグラフで良ければ表計算ソフトでも十分です。とても簡単ですので、ぜひ一度、チャレンジして
みてください。
(4)各種データ変容
(4-1)カテゴリーの統合・再編
たとえば、病気の告知に関して「1.絶対反対、2.かなり反対、…、7.絶対賛成」と、7段階で調
べとところ、1や7の意見がほとんど無かったとします。1 と 7 のカテゴリーに固執する必要が無
く、告知に対する大まかな傾向を知りたい場合、1と2、あるいは、6と7を統合し5段階(さら
に統合し3段階)とした方が「分かりやいまとめ」となります。
また、総合尺度などを求めるときに、1,2,3 で表していたコードを、逆に、3,2,1 と付け直さな
くてはならなくなることもあります。例えば、健康に関する質問で、「胃が痛くなることがありま
すか:1.しばしば、2.ときどき、3.ない」と「食欲はありますか:1.常にある、2.ときどき無いと
きがある、3.常にあまり無い」は内容が逆転しています。このため、このままの数値を加えると訳
の分からない指標になってしまいます。。
さらに、数量化分析などを適用する場合、極端に回答頻度が低い項目は分析結果を歪める可能性
があります。また、カテゴリー数が多いと、解釈も複雑になりまります。このようなことを避ける
6/13(統計処理の概要)
ため、通常は2段階、あるいは3段階に再構成して利用しています。
このように、カテゴリーの統合・再編は常に発生します。利用するソフトでの処理方法を確認す
ると同時に、操作方法も繰り返し練習し、しっかりマスターしておいてください。ここで、処理上
のポイントですが、カテゴリーの再編結果を同じ変数に格納すると、元に戻せなくなってしまいま
すので注意してください。必ず、別な変数に格納しましょう(統計専用ソフトを利用する場合も同
様です)。さらに、このような変容処理を行う際は、データの予備(バックアップ)を作成してお
くことを忘れないでください。操作にミスは付きものです。
「注意一秒、けが一生」のたとえ通り、
用心するに越したことはありません。
(4-2)新変数の計算
カテゴリーの統合・再編以外に、身長と体重から肥満度を求めるように、新たな変数を作り出す
ことも珍しいことではありません。誕生日から年齢を求めるとか、○時間○分で調査した項目(例
えば、睡眠時間、通勤時間、運動時間、他)を時間単位、あるいは分単位に換算するなどはよく見
かける処理です。いずれも、間違いが発生しやすいので注意してください。
たとえば、年齢の算出においては、基準日、すなわち、いつの時点における年齢かを明確にする
必要がありますし、
18 歳以上 19 歳未満を通常 18 歳と表していることにも注意する必要があります。
このような計算は案外面倒なので、誕生日に特別な関心がない限り、年齢はそのままズバリ「何歳
ですか」と質問するのが賢明です。次に、時間に関する調査についてですが、6 時間 30 分を"6.30"
と換算する人はいないと思いますが、これとは別の意味で、"6.5"のように時間単位に変換するの
は考えものです。例えば、6 時間 20 分は"6.3333…"と割り切れません。分単位に換算しましょう。
なお、分単位で四捨五入し時間単位に丸めるのは、30 分単位での回答が多くなることが予想される
ため適切な処理とはいえません。
実験系のデータにおいては、変数変換が必要になることがあります。例えば、対数変換は分布の
歪みを補正したり、桁違いのデータを扱う場合に良く利用されます。幾何平均とか幾何標準偏差と
いう指標がありますが、これは、対数変換したデータに対し平均値あるいは標準偏差を求め、逆変
換(=指数変換)で戻した値を意味しています。なお、このような指標を利用する場合は、データ
自体も対数変換して見直しておく必要もあります。これ以外にも、変数変換が必要になる場合があ
りますが、社会調査ではそれほど多くはありません。
(4-3)分類変数の作成
カテゴリーの統合と、ある意味では同じですが、分類指標を作成することもしばしばです。例え
ば、肥満度より、体型を「1.やせ型、2.標準型、3.肥満型」と分類したり、血圧より患者を「1.低
血圧、2.正常、3.高血圧」と分類するなどは一例です。このような処理は一見簡単そうですが、
実は、判定基準をどのように決めるかという問題を含んでおり、一筋縄ではいきません。たとえば、
肥満度にしても血圧にしても、判定の際に、年齢や性別を加味するかどうかは、判断に迷うところ
です。ただし、基準(判定方法)さえ決まれば、その後の処理はそれ程難しくはありません。ただ
一つ気を付けなくてはならないのが、境目の値の取り扱いです。たとえば、血圧 100mmHg 未満を低
血圧とするのか、100mmHg 以下を低血圧とするのかを明確にしておく必要があります。ここをうっ
かり間違えると、どこにも分類されないデータが生じたり、二重に分類されるデータが発生したり
して、データ総数が合わないという不思議な現象が起こってしまいます。
7/13(統計処理の概要)
〈今回の説明の要点〉
それでは、今回の説明の要点をまとめておきましょう。
基礎的な統計処理の流れとしては、
(1) 質的なデータに対しては頻度集計を行う。
(2) 量的なデータに対しては記述統計を行い、要約統計量(最低でも、平均値、標準偏差、最大・
最小値、歪度)を求める。
(3) 量的データに対しては、範囲化し、頻度集計を実施する。
(4) 必要に応じて、カテゴリーの統合、新変数や区分変数の作成を行い、それらに対しても頻度集
計、記述統計を実施する。
(5) 上記結果をグラフ化する。
パソコンでのデータ処理としては
(1) 利用するソフトの機能や操作方法をマスターする。
(2) データのチェックは入念に実施する。
(3) データの予備を必ず作成する(処理段階ごとに)
。
このような、基礎的集計の後に、関連を調べるためのクロス集計や各種仮説検定あるいは、多変
量解析等のような、より高度な解析法の適用と進んでいきます。最近は、探索的データ解析と呼ば
れる、コンピュータをフルに活用した、システマティックな分析法が脚光を浴びています。その分
析法に、今回の基礎的集計が全て含まれています。すなわち、ここで説明した事項は基本中の基本
と言っても過言ではありません。これで十分という訳ではありませんが、この程度は確実に実行で
きるようになっていないと、満足できる研究は実施できないと思います。
(5)関連性の検討
要因間に関連があるかないかを調べる場合、要因の型、すなわち、質的であるか量的であるかに
より使う手法が異なってきます。基本的には、両方の要因が質的な場合は「カイ二乗検定」、一方
の要因が質的で他方が量的な場合は「t 検定あるいは順位和検定」
、両方が量的な場合は「相関・回
帰分析」を適用します。ただし、この使い分けは絶対的という訳ではありません。例えば、量的要
因同士の場合、相関・回帰分析以外に、一方をカテゴライズして「t 検定あるいは順位和検定」
、あ
るいは両方をカテゴライズして「カイ二乗検定」を適用した方が適切な処理になることもあります。
基本や原則をマスターすることは大切ですが、それらに縛られ過ぎないよう気を付けてください。
それでは、順にそれぞれの手法を見ていきましょう。なお、紙面の都合で概略のみを紹介します。
詳細は、統計の解説書(例えば拙著「パソコンと統計処理の基礎知識」日本看護協会出版会)を参
照してください。また、以下で紹介する計算例は、全て架空のものですので、その点ご承知置きく
ださい。
<ワンポイント>
統計的仮説検定を適用し、有意差が得られた場合は、「関連あり」の解釈が許されますが、非有
意となった場合に「関連なし」と解釈しないよう気を付けてください。この解釈は特別な状況(例
えば、データ数が桁違いに多い場合)以外には許されません。実際の看護研究でもときどきこの誤
用を目にします。正しくは、「このデータからは、関連性を主張できない」、あるいは、「この標本
8/13(統計処理の概要)
数では、関連があるとも無いとも判断できない」と解釈すべきです。「関連なし」とかなり意味合
いが異なっていることを理解してください。
(5-1)カイ二乗検定
カテゴリカルな要因同士の関連を調べると
きは、まず表1のようなクロス表に集計し
スポンジ タオル
そば殻
計
ます。次に仮説「要因間に関連はない」を
快適
10
15
20
45
たて、この仮説に基づき、それぞれのセル
不快
12
5
4
21
の期待値を求めます。期待値は周辺和の積
計
22
20
24
66
を総度数で割った値として計算されます。
例えば、太枠のセルの期待値は「45×22/66=15」となります。そして、実際に観察された度数と
期待値のズレを
χ2=Σ(観察値−期待値)2/期待値
として集約します。この値と、自由度「(列数-1)(行数-1)」のカイ二乗分布の水準値(多くの場合
5%)と比較し、求めた値が水準値以上の場合に仮説を棄却し、有意差あり(p<0.05)、すなわち「関
連が認められた」と結論します。逆に、水準値以下であった場合は、非有意(p>0.05)、すなわち「関
連を認めなかった」と結論付けることになります。表1のデータでは、χ2=8.21 となり、自由度 2
の 5%に対応した水準値 5.99 より大きいため、
「有意差あり(p<0.05)」
、すなわち、材質と快適性に
関連ありとの結論を導きます。
表1 枕の材質と快適性
<ワンポイント>
2×2 表に対するカイ二乗検定は最も利用頻度の高い検定と言っても過言ではありません。これを
利用するとき、100 人程度の標本数(両群合わせて)では、比率の差が 20%以上ないと有意(p<0.05)
とはならないこと、10%以下の差を検出するためには、400 人以上の標本数が必要になることはぜひ
覚えておいてください。このように、比率の差を裏付けるためには、思った以上の標本数が必要に
なります。
(5-2)t 検定、一元配置分散分析
表2の様に睡眠快適度をグループ(群)別に比較するときに利用されているのが t 検定です。具
体的には、仮説「両群での平均値は等しい」をたて、それぞれの群での平均値と標準偏差からt値
を計算します(計算式は省略します)
。この t 値と自由度「総標本数-2」の t 分布での水準値とを
表2 材質別の快適度(VASによる測定、単位:mm、n=10)
タオル
78
65
81
72
66
60
58
73
70
77
そば殻
84
91
70
74
80
81
94
69
80
77
比較し、結論を導きます(結論の導き方はカイ二乗検定と同じです)。この例では、t=2.82 となり
ます。自由度 18 の 5%水準値 2.10 より大きいため「有意差あり(p<0.05)」となり、
「そば殻の方が
タオルより快適度を上げる傾向がある」との解釈が許されます。
上の計算例は「タオルとそば殻」の2群で比較しています。さらに、スポンジあるいは他の材質
も含めた場合はどうしたら良いのでしょうか?
比較する群が 3 つ以上の場合は、一元配置分散分析を利用します。
「タオルとそば殻」「タオルとス
ポンジ」
「スポンジとそば殻」と 2 群ずつ組み合わせてt検定適用してはと思うかもしれませんが、
9/13(統計処理の概要)
これは許されません。検定を繰り返すことにより危険率が上昇するためです。かつて、このような
手法が利用されたこともありましたが、最近では誤用として厳しく指弾されますので注意してくだ
さい。なお、一元配置分散分析で有意差が得られた場合、どこに差があるか問題となります。この
ようなときは、分散分析に含まれる多重比較とばれる手法から適切な手法を選択しなくてはならな
くなります。このような手法の理解は容易ではないので、必要になったときは、専門家のアドバイ
スを仰ぐようにしてください。
<ワンポイント>
t 検定も一元配置分散分析も各群での分布が正規分布であることが前提となっています。また、
通常の対応のない t 検定では 2 つの群の標準偏差が等しいことも仮定されています。これらの前提
や仮定が成り立たない場合、これら手法の適用は誤用となります。次のノンパラメトリック検定を
利用するか、適当な変数変換(例えば対数変換)を適用し、条件が満たされるようデータを再構成
する必要があります。
(5-3)ノンパラメトリック検定
t 検定はデータの正規性(すなわち、データが正規分布をする)が前提になっています。しかし
医学や看護学で扱うデータの多くは正規分布から乖離しています。例えば、肥満度や白血球数など
はその典型です。
肥満度を示す指標は沢山ありますが、代表的な指標の多くは、平均値以下、すなわち痩せている方
向に大きく偏った値は観察されませんが、平均値以上すなわち太っている方向にはかなり大きな値
が観察されます。白血球数も同様です。正規分布の大きな特徴として、平均値を軸に左右対称とい
う性質がありますが、肥満度も白血球数も左右対称とはならず、かなり正に歪んだ分布となります。
査読者が統計手法に関してもかなり目を光らせるようになってきたこともあり、最近の医学・看護
学関連の研究では t 検定の利用が激減しつつあります。このとき、t 検定の代替手法として利用さ
れているのが、ウィルコクソン検定、あるいはマン・ホイットニー検定、あるいは単に順位和検定
と呼ばれる検定です。この検定には「正規分布をする」等の前提や仮定が一切ありません。このよ
うに、分布に関する制約がない検定(手法)をノンパラメトリック検定(手法)と呼んでいます。
ここではその中から、利用頻度の高い検定についてのみ説明します。
①ウィルコクソン検定、クラシュカル・ワリス検定
表2のデータに対して、両方の群を合わせて、大きさの順に順位を付けます。その順位を群ごと
に平均し、その差を用いて、分布のズレを検出しようとするのがウィルコクソン検定です。外れ値
が無く、データ数が多い場合は、ほぼ t 検定と同じ結果になります。先述した通り、看護研究で扱
うデータの多くは正規性が疑わしいため、この検定の利用が無難な選択となります。ちなみに、表
2のデータに対するウィルコクソン検定結果も有意(p<0.05)となります。
群の数が 3 つ以上の場合は、クラシュカル・ワリス検定を利用します。
②符号検定
10/13(統計処理の概要)
表3 材質別の快適度(同一人による判定、VAS、単位:mm、n=10)
タオル
そば殻
符号
78
79
−
84
86
−
72
70
+
65
67
−
54
55
−
60
64
−
40
42
−
75
68
+
71
77
−
68
70
−
表3のような対(同一人に対する複数回測定)になったデータを比較し、一方が他方より大きな
値となる傾向があるかないかを検証しようとするのが符号検定です。具体的には、等しい場合を除
き、大きい場合に「+」、小さい場合に「−」を付け、
「+」
(あるいは「−」)の出現頻度が 1/2 と
見なせるかを二項分布を用いて検定します。
差が小さくても大小関係が偏る場合、例えば、6 組のデータであっても全て「+」であれば、そ
の確率は 2×1/64=1/32=0.031 となり、有意(p<0.05)となります。ちなみに、表3のデータは対
応のない t 検定では有意となりませんが、符号検定では有意(p<0.05)となります。
<ワンポイント>
通常、データをペアにすることにより検出力(有意差を見つける力)を上げることができます。
t 検定にもペアになったデータに対して適用される「対応のあるt検定」と呼ばれる手法が含まれ
ています。多くの場合、対応のない t 検定より検出力が飛躍的に高くなります。すなわち、少ない
標本で有意差を導くことができます。なお、表3のデータは対応のある t 検定でも有意とはなりま
せん。
(5-4)相関・回帰分析
量的変数同士の関連を調べる場合、散布図を描き相関係数を求めます。相関係数は-1 から 1 まで
の値をとり、その符号が相関の正負を、絶対値が強さを示します。また、必要に応じて、回帰直線
を求め、散布図に併記します。さらに、相関係数や回帰係数(=回帰直線の傾きや y 切片)の有意
性を検定したり、回帰直線と実際の値との差(残差)を詳細に検討したりもします。このような一
連の手法を回帰分析と呼んでいます。特に、相関係数の有意性検定が関連性を判断するときの決め
手となります。
図1は睡眠の快適度(VAS)と睡眠の深度(100 点満点に換算)との関係を図示した例です。
100
睡 90
眠
80
深
度 70
ρ= 0 .9 6
60
50
40
30
40
50
60
70
80
90 100
快適度
図1 睡眠の快適度と深度の関係
図中に記載してある数値(0.96)が相関係数で、描かれている直線が回帰直線です。この例では、
相関係数の有意性検定結果は、1%レベルで有意となります。
11/13(統計処理の概要)
<ワンポイント>
相関係数も回帰分析も直線的な関連が背景にあることは熟知しておく必要があります。曲線的な
関連を扱う場合は、変数変換を用いて直線的関連に帰着するか、区間を分割し折れ線で近似するか、
ノンパラメトリックな手法を適用するか、何らかの措置を講ずる必要があります。ここでは、紙面
の都合上、ノンパラメトリック手法についてのみ補足しておきます。一方の変数をカテゴライズし
ウィルコクソン検定、両方をカテゴライズしカイ二乗検定を利用するのも有効な方法ですが、この
ような手法にはどのようにカテゴライズするかという問題が生じます。また、カテゴライズにより
情報が失われるため検出力も下がるという別の問題も発生します。カテゴライズという煩わしさも
なく、情報の損失も少ない有効な手段に順位相関係数の適用があります。特に異常値やはずれ値が
懸念されるときは、通常の相関係数より順位相関係数の方が適切な指標になります。
(6)差の構造
有意差が得られた場合、分散分析のときと同様に、カイ二乗検定においてもどこに差があるかが
問題となります(ただし、2×2 より大きい表の場合)
。その構造を解析するときの手法としては、
一元配置分散分析の場合、多重比較と呼ばれる手法が基本となりますが、カイ二乗検定の場合は残
差解析が基本となります。残差解析とは、観察度数と期待度数の差を統計的に処理する手法で、特
に調整済み残差と呼ばれる指標が重要な役割を果たします。
差の構造を検討することも大切ですが、差の大きさを評価することも忘れてはいけません。例え
ば、水銀体温計と電子体温計での測定結果が 0.1℃異なっていたとしても、問診の参考にする程度
であればほとんど問題となりません。ところが、一定の標本数で検証すれば統計的に有意となりま
す。統計的に有意という結果のみで電子体温計の利用差し控えたとすると問題です。差の大きさに
関する評価が欠けているからです。
差の大きさを評価するためには、推定という手法が必要となります。通常は、区間推定と呼ばれる
手法がこの目的で利用されます。平均値の差や比率の差に関する区間推定は、ほとんどの参考書に
記載されていますし、ほとんどの統計ソフトで計算することができます。
<ワンポイント>
検定結果からは差の有無のみが判断できますが、区間推定からは差の有無以外に差の大きさの情
報も得られます。すなわち、区間推定は検定結果を含んでいます。このため最近は、検定ではなく、
推定の利用を求める学術誌も増えつつあります。
(7)多変量解析
上で説明した手法は、2 要因間の関連を調べるものでした。問題としている要因が多い場合、2
要因ずつ検定や推定を繰り返していたのではキリがありません。また、個別に扱っていたのでは本
質を見誤る恐れもあります。例えば、より快適な枕の試作を目的にしている場合、枕の高さと材質
(柔軟性、吸湿性)を別々に検討していたのでは、満足の行く結果は得られないと思われます。複
数の要因を同時に考慮した手法が必要になります。
実験計画法や分散分析と呼ばれる手法が、このような問題に効率的にアプローチするための代表
的手段です。しかし、この手法は、ある程度対象をコントロールできなる状況でないと適用できま
せん。人間を対象とし、アンケート調査に頼らざるを得ない状況では、その利用が限られてしまい
ます。このようなときに助けとなるのが多変量解析と呼ばれる手法です。
重回帰分析、主成分分析、因子分析、判別分析、クラスター分析などが代表的な多変量解析法で
12/13(統計処理の概要)
す。これら以外にも多くの手法が開発されています。また、一つ一つの手法に多くのバリエーショ
ンが存在します。このため、どの手法も、一冊の本が必要になるほどの内容を含んでいます。わず
かな紙面で意を尽くすことは不可能です。このため、入門の手がかりを示すにとどめ、後は皆さん
の熱意にお任せしたいと思います。
すべての多変量解析は重回帰分析が基本になっています。多変量解析について勉強しようと思う
のなら、重回帰分析から入るのが本筋です。重回帰分析は、回帰分析の横軸に当たる変数(説明変
数とか、独立変数と呼ばれる)を複数個に拡張した手法になっています。回帰分析に関する基本的
事項が理解できていれば、ほぼ重回帰分析の概略は容易に把握することができます。ただし、適切
に適用するためには、直線関係を仮定しているための限界や、説明変数間に関連がある場合の共線
性と呼ばれる問題などについての理解も必要になります。
多変量解析全般に言えることですが、簡単そうに見えても、使いこなすのは容易ではありません。
ただ、怯えて手をださずにいるといつまでたっても利用することができないのも事実です。経験を
積み重ねることも大切です。適切なアドバイザーの協力を仰ぎ、ぜひ積極的にチャレンジしてみて
ください。
<ワンポイント>
例えば、睡眠の深度を、枕の高さ(両端部分と中央部分)、材質の柔軟度、室温、湿度、対象者
の年齢、etc、で説明しようと重回帰分析を適用したとします。説明しようとする変数内に相関が
なければ問題は無いのですが、例えば、枕の両端と中央部分の高さなどはかなり相関がありそうで
す。このような、説明変数内の相関を共線性と呼んでいます。
変数間に共線性が認められる場合、重回帰分析の解釈には細心の注意が必要となります。この共
線性の問題を解消するための手法に、主成分分析があります。この手法の適用により、相関のある
変数群より、互いに無相関な代表変数を抽出することができます。この意味では、主成分分析は、
重回帰分析の壁を乗り越えるために開発された手法とみなすことができます。
このように、多変量解析法の多くは、ある手法の壁(限界)を乗り越えるために開発されてきて
います。その基本となっているのが重回帰分析であり、全ての多変量解析法はローマならぬ重回帰
分析につながると言っても過言ではありません。
最後に、看護研究を成功に導くための大切なポイントを上げておきます。
・計画段階から統計手法を意識する。
・研究目的を絞り込み、できるだけ具体的に表現する。
・適切なアドバイザーを確保する。
・調査・実験に際しては、できるだけ詳細に情報を収集する。
・データの吟味・チェックは入念に行う。
・パソコンや統計ソフトに慣れておく。
・さまざまな角度から結果を検討する。
・裏付け(統計的有意性)のない結果は過大評価しない。
・統計用語や図表を適切に利用する。
13/13(統計処理の概要)
Fly UP