Comments
Description
Transcript
多変量解析ソフトウェアマニュアル (PDF 431KB)
JUSE-StatWoks 試用版資料 2005/06/01 JUSE-StatWorks試用版を使ってみよう (株)日本科学技術研修所 本資料は試用版をダウンロードしてくださった方を対象に,データ入力から解析までの JUSE-StatWorks の操作の一連の流れを説明し, JUSE-StatWorks の機能や考え方,魅力な どを知っていただくためのものです. JUSE-StatWorks による統計解析を体験してみてくだ さい. 0 章.最初に ある材料をもとに加工機械を使い製品を作った際の製造データがあります(表 1). 表 1 は 4×18 のデータ表です.1 列目はサンプルの識別子(サンプル名)です.2 列目は材料の硬度であ り,3 列目はできあがった製品の硬度です.4 列目は製造段階で使った加工機械の種類で,A,B,C の 3 つの種類がありますが,これは数値ではありません. サンプル名 材料硬度 製品硬度 加工機械 1 66.09 77.83 加工機 A 2 66.36 78.16 加工機 B 3 66.77 78.15 加工機 B 4 66.84 78.20 加工機 A 18 5 67.39 78.25 加工機 C 個 6 66.30 78.10 加工機 A 7 66.98 78.24 加工機 C の 8 66.74 77.90 加工機 A サ 9 66.85 78.20 加工機 C ン 10 67.16 78.00 加工機 B プ 11 67.50 78.40 加工機 C 12 66.26 78.10 加工機 A ル 13 67.66 78.50 加工機 C 14 66.16 78.23 加工機 A 15 66.63 78.20 加工機 B 16 66.89 78.11 加工機 B 17 66.76 78.14 加工機 B 18 66.53 77.94 加工機 A 表1 このデータから多変量連関図を描いて,データの特徴を探ってみましょう. 多変量連関図 指定した変数のすべての組み合わせについて,適切なグラフを 一覧表示したものです.データ全体の特徴を視覚的に把握する 上で大変便利な表示形式です. 1 JUSE-StatWoks 試用版資料 2005/06/01 さて,JUSE-StatWorks での解析の流れですが,通常,以下のようになります.本説明では 1.データ入 力の箇所を中心に,一通りの流れを紹介していきます. 1.データ入力(1 章) 最初にデータ表を入力します.※1 2.手法選択(2 章) 解析手法を選択します. 3.変数の指定(3 章) ここで解析に使う変数を指定します. 4.解析結果の表示(4 章) 解析結果が表示されます. それでは実際に JUSE-StatWorks 試用版を使ってみましょう. ⓒThe Institute of JUSE ※1:データ入力の箇所を飛ばして進めたい場合,ソフトに入っているサンプルデータを読み込んで使ってください.サ ンプルデータはインストールフォルダ内の Juse¥sw4¥trial¥Data の中に存在しています サンプルデータの例)Juse¥sw4¥trial¥Data¥BaseData¥G2_1.DD7 サンプルデータの読み込み方法)JUSE-StatWorks の初期画面のメニューバーから[ファイル]-[開く]で既存のサンプル データを読み込みます. 1 章.データ入力 1-1.JUSE-StatWorks 試用版の起動 インストールフォルダにできた StatWorks アイコンを(デスクトップにショートカットを作っていればデ スクトップの StatWorks アイコンを)ダブルクリックしてソフトを起動します. ダブルクリック! も し く は ス タ ー ト メ ニ ュ ー か ら [ ス タ ー ト ]-[ す べ て の プ ロ グ ラ ム ]-[JUSE-StatWorks/V4.0 ( 試 用 版)]-[StatWorks]を選びクリックしてソフトを起動します.JUSE-StatWorks の初期画面は Excel に似た 表形式になっており,これをワークシートと呼びます. プログラムの中から[JUSE-StatWorks/V4.0(試用 版)]-[StatWorks]をクリックしてソフトを起動 します. 拡大 クリック! 起動! 2 JUSE-StatWoks 試用版資料 2005/06/01 JUSE-StatWorks の初期画面に出てくる表 のことを「ワークシート」といいます. JUSE-StatWorks 初期画面 1-2.変数の属性 最初にワークシートの上部に注目してください. 左から S1, N2, N3, N4,‥とな っています. S や N といった記号は変数の属性を表しています.JUSE-StatWorks では変数の属性が3種類あり,ここ が Excel と違う点です.変数属性を簡単に説明すると,以下のようになります. S:サンプル名‥個々のサンプルに付けられた名前 N:量的変数‥通常の数値データ C:質的変数‥サンプルをグループ分けする(層別する)時に使う変数 変数ごとに属性を分けて入力しておくと,解析手法に入った時,変数属性に応じた解析をスムーズに進め ることができます. 1-3.サンプル名の入力 表 1 の「サンプル名」のデータをワークシートの1列目に入力しましょう.既にワークシートの1列目(S1) の変数の属性がサンプル名(S)となっています.よって属性は変更せずにこのまま入力して OK です. 1列目(S1)の 1 行目のセルをクリックし色を反転させます.その状態で「1」と入力し enter を押すとセ ルに「1」が入ります.同様に 2 行目から 18 行目までにサンプル名を入力していきましょう. ①1 列目の 1 行目をクリック! ②セルが黒く反転した状態で入力項 目の箇所に「1」と入力します.※2 その後 enter を押します. ※2:数字の入力は半角英数字でおこなっ てください. 3 JUSE-StatWoks 試用版資料 2005/06/01 ④同様の手順で 2 行目から 18 行 目までのデータ も入力していき ③セルに「1」が入りました. ます. 1-4.量的変数の入力 表 1 の「材料硬度」のデータをワークシートの 2 列目に入力しましょう.材料硬度は通常の数値データに なりますので,変数の属性は量的変数(N)となります.既にワークシートの 2 列目(N2)の変数の属性 は量的変数(N)となっています.よって属性は変えずにこのまま入力して OK です. サンプル名の入力と同様に,2 列目(N2)の 1 行目のセルをクリックし色を反転させます.その状態で「66.09」 と入力し enter を押すとセルに「66.09」が入ります.同様に 2 列目の 2 行目から 18 行目までにも表 1 の 材料硬度のデータを入力していきましょう. ②セルが黒く反転した ①2 列目の 1 行目をクリック! 状態で「66.09」と入力 します.その後 enter を押します. ④同様の手順で 2 行目から 18 行目 ③セルに「66.09」が入りました. のデータも入力し ていきます. 1-5.変数名の編集 次に変数名を編集します.2 列目(N2)の変数は初期設定では「変数 2」となっています.これを「材料 硬度」という名前に変えます. まず,2 列目(N2)上部の灰色の部分をダブルクリックして変数情報一覧のダイアログを表示させます. 変数情報一覧ダイアログの「名称」に「変数 2」と入っていますので,それを「材料硬度」に変更します. 4 JUSE-StatWoks 試用版資料 2005/06/01 ③「名称:変数 2」が青く反転されている状態で,一番上の ①N2 列の灰色部分を 入力 BOX に「材料硬度」と入力し,ダイアログを「閉じる」 . ダブルクリック! ②変数情報一覧 ダイアログが表 ④変数名が「材料硬度」に 示されます. 変わりました. 1-6.量的変数の入力(2) 今度は表 1 の「製品硬度」のデータをワークシートの 3 列目に入力しましょう.製品硬度は通常の数値デ ータになりますので,変数の属性は量的変数(N)となります.既にワークシートの 3 列目(N3)の変数 の属性は量的変数(N)となっています.よって属性は変えずにこのまま入力して OK です. 以下,手順は 4.量的変数の入力の場合と全く同じになります. ②セルが黒く反転した状態で「77.83」と 入力します.その後 enter を押します. ③セルに「77.83」が入りました. ①3 列目の 1 行目をクリック! ④同様の手順で 2 行目から 18 行目 ⑤次に変数名を変えま のデータも入力し す.N3 列の灰色部分を ていきます. ダブルクリック! ⑥変数情報一覧 ダイアログが表 示されます. ⑦「名称:変数 3」が青く反転 されている状態で,一番上の入 ⑧変数名が「製品硬度」に 力 BOX に「製品硬度」と入力し, 変わりました. ダイアログを「閉じる」. 5 JUSE-StatWoks 試用版資料 2005/06/01 1-7.質的変数の入力 表 1 の加工機械のデータをワークシートの 4 列目に入力しましょう.加工機械のデータは通常の数値のデ ータではなく,どの加工機械(加工機 A,B,C の中から 1 つ)を使ったかという層別のためのデータにな ります.よって変数の属性は質的変数(C)となります.ワークシートの 4 列目(N4)の変数の属性が量 的変数(N)となっていますので,これを質的変数(C)に変えましょう. まず,4 列目(N4)上部の灰色の部分をワンクリックすると 4 列目全部が黒く反転されます.ワークシー トの左上の「入力項目」の箇所が「量的変数」となっていますので,▼ボタンを押して「質的変数」を選 択してください. ③入力項目右の ▼ボタンを押す. ①N4 列の灰色部分を ワンクリック! ②N4 列全体が選択 された状態になる. ④ポップアップメニューが表示されるので,選択肢から「質的変数」を選びます. ⑤確認のメッセージが表示され るので,「はい」を押します. ⑥4 列目の属性が質的変数(C) に変わりました. 次に「加工機械」のデータの入力ですが,JUSE-StatWorksでは質的変数(サンプルデータをグループ分 けする時に使う変数)の入力時には,直接,文字データを入力せずに,グループ名すなわちカテゴリ名と カテゴリ番号を対応付けして,まず「カテゴリ番号」の 1,2,3,‥を入力するのをおすすめします. 今回,「加工機械」のカテゴリは ・ 加工機 A ・ 加工機 B ・ 加工機 C の三種類ですが,これを カテゴリ名 対応 カテゴリ番号 加工機 A ←→ 1 加工機 B ←→ 2 加工機 C ←→ 3 と対応付けることにします. 今回のデータは以下のように対応付けされます.ワークシートの 4 列目(C4)にカテゴリ番号を入力しま しょう. 6 JUSE-StatWoks 試用版資料 カテゴリ名 対応 加工機 A ←→ 1 加工機 B ←→ 2 加工機 B ←→ 2 2005/06/01 カテゴリ番号 加工機 A ←→ 1 加工機 C ←→ 3 加工機 A ←→ 1 加工機 C ←→ 3 加工機 A ←→ 1 るカテゴリ番号を 加工機 C ←→ 3 一つずつ入力して 加工機 B ←→ 2 加工機 C ←→ 3 量的変数の入力と 同じ手順で,対応す いきます.※3 加工機 A ←→ 1 加工機 C ←→ 3 加工機 A ←→ 1 加工機 B ←→ 2 で入力するようにし 加工機 B ←→ 2 てください. 加工機 B ←→ 2 加工機 A ←→ 1 ※3:全角英数字は使 わず,必ず半角英数字 カテゴリ名とカテゴリ番号の対応表 次にカテゴリ名を設定します.4 列目(C4)のセル(白い部分)をダブルクリックするとカテゴリ一覧ダ イアログが表示するので,ダイアログ上でカテゴリ名を編集します. ③「1:c1」が青く ①4 列目のセル(白い部 反転されている状 分)をダブルクリック. 態で,一番上の入力 ②カテゴリ一覧 BOX に「加工機 A」 ダイアログが表 と入力. 示されます. ⑤「3:c3」の箇所をクリ ④「2:c2」の箇所を ックし,青く反転された クリックし,青く反転 状態にして,一番上の入 された状態にして,一 力 BOX に「加工機 C」と入 番上の入力 BOX に「加 力し, 「OK」ボタンを押す. 工機 B」と入力. ⑥ワークシートに戻るの ⑦ 4 列 目 で,ツールボタン「カテゴ (C4)にカテ リ表示形式変更」 ゴリ名が表 示されまし を押します. た. 7 JUSE-StatWoks 試用版資料 2005/06/01 最後に変数名も「加工機械」に変えておきましょう. ②変数情報一覧ダイアログが表示されるので「名称: 変数 4」が青く反転されている状態で,一番上の入力 ①C4 列の灰色部分を BOX に「加工機械」と入力し,ダイアログを「閉じる」. ダブルクリック! ③変数名が「加工機械」に 変わりました. おつかれさまでした. 以上で,データの入力は 終わりです. 2 章.手法選択 2-1.多変量連関図の起動 それでは多変量連関図を描いて, メニューバーの[基本解析]をクリックすると ・ 材料硬度と製品硬度に相関はありそうか ・ 使う加工機械によって製品硬度に違いが出そうか ポップアップメニューが表示されるので,選択 肢から[多変量連関図]を選びます. 上記について調べてみます. 多変量連関図は,0 章でも説明した通り,指定した変数のすべ ての組み合わせについて,適切なグラフ(ヒストグラムや散 布図,層別ヒストグラム,度数グラフ)を行列形式で一覧表 で示した連関図です.データ全体の特徴(分布やはずれ値,変 数間の相関,カテゴリ間の比較など)を視覚的に把握する上で 便利な表示形式です. まず画面上のメニューバーから[基本解析]-[多変量連関図]を 起動します. 3 章.変数の指定 3-1.解析に用いる変数の指定 手法を起動した後,解析に用いる変数をサンプル名,量的変数,質的変数の中から指定します.変数の指 8 クリック! JUSE-StatWoks 試用版資料 2005/06/01 定ダイアログ上にて変数をクリックすると,変数が青く反転し選択された状態になります.また, 「全」と いうボタンを押すとその属性の全変数が選ばれた状態になります. (例えば,量的変数の「全」ボタンを押 すと,そこに表示されている量的変数が全て選択されます.) ここではサンプル名 S の「サンプル名」 ,量的変数 N の「材料硬度」 , 「製品硬度」,質的変数 C の「加工機 械」の全ての変数を用いて多変量連関図を作成しますので,全変数を選択してください. クリック! クリック! クリック! ②ワークシート上に入力し た全変数を使うので,「全」 を押して,サンプル名と量的 変数,質的変数の全変数を選 択します. ①変数の指定ダ イアログを表示 ③「次へ進む」 させます. を押します. 4 章.解析結果の表示 4-1.多変量連関図を見て分かること 変数の指定が終わると多変量連関図が表示されます.多変量連関図を見て以下のようなことが分かります. ①材料硬度のヒストグラム ②材料硬度と製品硬度の散布図 ほぼ山形の分布をしています. 材料硬度が高くなるについて製品硬度は高くなっています. 目立った外れ値はなさそうです. 材料硬度と製品硬度には正の相関があるようです. ③製品硬度のヒストグラム ① ほぼ山形の分布をしています. 目立った外れ値はなさそうです. ② ③ ④加工機械別の度数グラフ 上から加工機 A,加工機 B,加工機 C の度数グ ラフです.加工機 A のグラフが一番長いので, 加工機 A が最も使われているようです. ⑥ ⑤ ④ ⑤加工機械別の製品硬度のヒストグラム 赤線はデータの平均値を示しています.最 下段のヒストグラムの赤線が一番右側に ⑥加工機械別の材料硬度のヒストグラム あるので加工機 C を使った製品硬度が最 赤線はデータの平均値を示しています.最下段のヒ も高くなっているようです. ストグラムの赤線が一番右側にあるので加工機 9C を使った材料硬度が最も高くなっているようです. 8 JUSE-StatWoks 試用版資料 2005/06/01 まとめると ① 材料硬度に目立った外れ値はない. ② 材料硬度と製品硬度には正の相関がある. ③ 製品硬度に目立った外れ値はない. ④ 加工機械は加工機 A が最もよく使われており,次に加工機械 B が使われている. ⑤ 加工機 C を使った製品硬度が一番高くなっている. ⑥ 加工機 C を使った材料硬度が一番高くなっている. ⑤だけ見ると,使う加工機械によって製品硬度に違いが出そう(加工機 C を使うと製品硬度が高くなりそ う)ですが,⑥より,材料硬度も加工機 C を使ったものが一番高くなっています.材料硬度と製品硬度に 正の相関があるので,単純に「加工機 C を使うと製品硬度が高くなる」ということにはならないようです. 故意に材料硬度の高いものに対して加工機 C を使っているのか,また,使っているとすればその狙いはど ういったものなのか,担当者に確認する必要があるようです. 以上で,解析は終わ りです. 次は自分で取得し たデータを使って 解析をしてみてく ださい. 10