Comments
Description
Transcript
統計学実習課題(レポート) 2003/04/24 学生証番号 氏名 今日の実習
2003/04/24 統計学実習課題(レポート) 学生証番号 氏名 今日の実習内容 ① HalWin(本実習で用いる統計解析ソフト)の開始、終了の仕方を学ぶ。 ② 「計算に用いるファイル(今回の実習ではHAL.HAL)」、「分析方法」、「分析に用いる変数」の 指定方法を学ぶ。 ③ 実際にグラフを描いてみて、得られた結果について考察する。 ④ グラフを描く際、および読みとる際に注意すべき点を学ぶ。 以下の課題を行いなさい。下線を引いてある課題については、各自のコメントをレポートとして提出 すること。この用紙に記載すること。裏面も使って構わない。 課題1. 最高血圧について度数分布表および度数分布図を作成しなさい。階級幅をいろいろ変えてみて、 どの幅が良いと思うかを書きなさい(判断の理由を添えること)。 課題2. 「図の種類」を変えて度数分布図を描き、それぞれのグラフを理解しなさい。 課題3. 最高血圧について幹葉表示を描きなさい。度数分布図と見比べてなさい。 課題4. 変数指定画面にある「制御変数」、「層別変数」の役割(考え方)を、度数分布表作成やグラ フを描くことを通して理解しなさい(課題5とも関係しています)。 課題5. 男女別に最高血圧の分布を描き、男女間での血圧分布の違いについて、自由に考察しなさい。 2003/05/15 統計学実習課題(レポート) 学生証番号 氏名 以下の課題を、HalWinを用いて行いなさい。そして、課題1、2で求めた種々の尺度(数値)、課題 2での考察、および課題4の結果をレポートとして提出しなさい(裏面も使ってかまわない)。 本日の実習では、「1.基礎統計量の計算」「2.項目別カテゴリ度数」「4.幹葉表示の作成」「16.箱ヒゲ図 の作成」を使用する。 課題1.HAL.HALの中の最高血圧、および最低血圧について、 (1)次の値を求めなさい。 ①平均値、分散および標準偏差 ②第1、第2、第3四分位数 (2)これまでの復習も兼ねて幹葉表示、箱ヒゲ図を描きなさい。その際、区間(幹葉表示)や、 表示の縦横(箱ヒゲ図)を変えて、グラフの形状の変化などを調べなさい。さらに、(1) の結果も参照して、これらのグラフが何を表したものであるか理解(復習)しなさい。 課題2.男女別に平均値や中央値、さらにはばらつきの尺度を求め、また幹葉表示や箱ヒゲ図を描き、 男女の分布の違いについて自由に(ただし何らかの根拠に基づき)考察しなさい。検討は最高 血圧、最低血圧のどちらか一方でよい。グラフを提出する必要はない。 課題3.平均年齢以上の人についてのみ(平均年齢も求めることが必要)、最高血圧に関する幹葉表示 および箱ヒゲ図を描きなさい、さらには男性でかつ平均年齢以上の人について、最高血圧に関 する幹葉表示と箱ヒゲ図を描きなさい。 課題4.男女どちらの方が喫煙者が多いか調べなさい(性別に喫煙者数および割合を書くこと)。また 飲酒者の割合はどうであるか。 統計学実習課題 2003/5/29 学生証番号 氏名 以下の設問に答え、レポートとして提出しなさい。裏面を使って構わない。本日の実習で使用する方 法は基礎統計学の方法の中の「7.相関係数の計算と検定」および「8.相関図の作成」である。 課題1. 「IRIS.HAL」のデータを用い、「がくの長さ」「がくの幅」「花弁の長さ」「花弁の幅」 の変数間それぞれについて、ピアソンの積率相関係数、およびスピアマンの順位相関係数 を求めなさい。ピアソンの積率相関係数とスピアマンの順位相関係数の間に違いが認めら れるか。 課題2. 上記の4変数に対して、相関図を描きなさい(相関図自体はレポートとして提出する必要 はない)。課題1で求めた値と、実際にグラフを描いたイメージとは異なっていたかを自 由にまとめなさい。 課題3. 「がくの長さ」から「がくの幅」を予測する、あるいは「花弁の長さ」から「花弁の幅」 を予測する式(回帰式)を作成しなさい(相関図を作成することで計算できる)。さらに、 決定係数を求めなさい。 課題4. 「群」により層別して、課題1と課題2を実施しなさい。どのような違いが認められたか。 なお、3つのグループに層別されることに注意すること。 2003/06/12 統計学実習課題 学生証番号 氏名 以下の設問に答え、この用紙をレポートとして提出しなさい(復習課題は提出不要)。裏面も使って 構わない。復習課題はIRIS.HALを、それ以外はHAL.HALのデータを使用するす。 復習課題.「がくの長さ」「がくの幅」「花弁の長さ」「花弁の幅」の変数間それぞれについて、「群」 によって層別した場合、および層別しない場合について、ピアソンの積率相関係数を求め、 相関図を描きなさい。そして層別した場合としなかった場合の違いを確認しなさい(群によ ってどのように異なっているか、また異なる群をまとめてしまうとどのようになってしまう かを確認しなさい)。なお、ここで「群」とはあやめの種類を表している。群は3つあり、 1:Setosa、2:Versicolor、3:Virginicaである。 課題1.クロス表を利用して、男女別に飲酒割合、および喫煙割合を求めなさい。 課題2. HAL.HALのデータが疾病Aの原因を探るために計画された研究の結果であるとして、喫煙と 疾病Aの関連性の大きさを示す尺度を求めなさい。また、その数値の意味を解釈しなさい。 なお、 ① 要因の有無別に、発症の有無を調べた場合(たとえば、喫煙者のうちどのくらいの人が病 気にかかるかを現時点から将来に向けて調べていく場合で、このような研究のことを「前 向き研究」と呼ぶ)、 ② 発症の有無別に、要因の有無を調べた場合(たとえば、病気にかかっている人のうちどの くらいの人がタバコをすっていたかを、現時点からさかのぼって調べていく場合で、この ような研究のことを「後向き研究」と呼ぶ)、 それぞれの研究デザインについて検討しなさい。 注意事項:パーセントの求め方、関連性の尺度の選び方 課題3. 男女別々に、喫煙と疾病Aに関連性があるかどうかを調べ、関連性の尺度を求めなさい。さ らに、男女別にもとめた関連性の尺度の値と、課題2で求めた関連性の尺度の値を比較検討 しなさい。もし値が異なっている場合、なぜ異なっているか考えてみなさい。 2003/07/03 統計学実習課題(レポート) 学生証番号 氏名 以下の設問に答え、レポートとして提出しなさい。裏面を使って構わない。 課題1. (1)HAL.HALのデータを用い、母集団における喫煙者の割合を推定しなさい(点推定およ び区間推定を行い、本実習では一次近似式を使用しなさい)。本課題は「方法の指定」 の中の「キーボード入力による分析」も利用する。 (2)95%信頼区間と99%信頼区間が表示されるが、どちらの幅が広くなっているか、また それは何故か? (3)喫煙者の割合は同じまま対象者数を100人、1000人のように増やすと、結果はどうな るか? 課題2. (1)HAL.HALのデータを用いて、喫煙(縦方向の変数)と疾病A(横方向の変数)に関連 があるかどうかを χ2 検定(フィッシャーの直接確率を使用)を用いて調べなさい。 (2)このデータが前向き研究から得られたものとすると、母集団における関連性の大きさ はどの程度であるか調べなさい(区間推定も行いなさい)。 (3)「方法の指定」で「キーボード入力による分析」を利用して、自らクロス表を作成す ることができる。この機能を利用して、課題1と同じように人数を10倍、100倍にした 場合、検定や推定の結果がどのように変化するのか調べなさい。 2003/07/17 統計学実習課題(レポート) 学生証番号 氏名 先週配布した資料などを参照しながら以下の設問に答え、レポートとして提出しなさい。裏面を使っ て構わない。 課題1.HAL.HALを使用して、疾病Aの有無によって、身長および体重の母平均値に差があるかどうか の検定を行いなさい。 注:今日の実習での出力結果のレイアウトは、先週の授業で用いた資料とは若干異なっている。 ただし、違うのはあくまでレイアウトのみであり、出力内容に変化はない。 課題2.最高血圧と最低血圧に関するピアソンの積率相関係数を求め、相関係数が有意かどうかの検定 を行いなさい(帰無仮説は「母相関係数=0」であることに注意)。さらに相関係数の95%信 頼区間を求めなさい。 課題3.変数名「最高血圧」は何らかの治療(健康教育)を行う前の最高血圧を意味し、「最高血圧①」 は治療後(健康教育実施後)の血圧を意味する。治療(健康教育)の前後で最高血圧の値が異 なるか(変化するか)どうかの検定を、飲酒の有無別に行いなさい(対応のある母平均値の差 の検定)。 平成15年度 1. 統計学レポート課題 HAL.HALについて、これまで学習した種々の知識や手法を利用して(試みて)、健康に影響を及 ぼす要因と考えられる体重、最高血圧、飲酒、喫煙といった変数間の関係や、疾病発生との関係を 自由に検討しなさい。 注:単に要因と疾病との関連を調べて下さい、と言っているのではありません。要因間の関係、い わば楽屋裏の検討をした上で、要因と疾病との関連を調べてみて下さいと言うことです。それ ぞれの人の観点で解析方針も変わってくるかと思います。レポートでは、単に結果(数値)を 示すだけではいけません、何の目的のためにどの変数とどの変数の関係を調べたのか、また得 られた結果からどのようなことが考えられるのかなどを整理して書いて下さい。HAL.HALは 架空データなので、一般的な(常識的な)傾向とは異なっている可能性があることにも注意し て下さい。 なお「HAL.HALはもう使い飽きた」ということであれば、他のデータを使用して検討を試み ても構いません。HAL.HAL以外にコンピュータに保存されているファイルの説明は、図書館 にある「HALWINによるデータ解析」に載っています。 2. 将来、看護師や保健師等の仕事に就いた場合(他の職種でも構わない)、どのような場面で統計学 の知識や手法が必要になってくると考えるか、またどのように活用していきたいと考えるか。レポ ート用紙1/2∼1枚程度の長さで、各自の意見を自由に書きなさい(必要ない、というのも立派な 意見であるが、何故必要でないかの理由をきちんと書くこと)。 締め切り: 平成15年8月11日(月) 提出場所: 事務室 備考: レポート本文の体裁は自由であるが、表紙をつけた上で、本文はA4で3枚以内程度(最 長でも5枚以内)にすること。ワープロでも手書きでも構わない。 他人と相談しながら検討して構わないが、レポートには自分自身の意見・考察を書くこ と。結果の部分を除き、単に他人のレポートを写すことは認めない(写した方も、写さ せた方も同罪として扱います)。