...

Excel で学ぶ 多変量データ処理入門

by user

on
Category: Documents
18

views

Report

Comments

Transcript

Excel で学ぶ 多変量データ処理入門
Excel で学ぶ
多変量データ処理入門
講義補助テキスト
太成学院大学
坂
元
保
経営学部
秀
著
ま
え が き
本テキストは,種々の分野で収集された多変量データを Microsoft Excel を用いて処理す
る方法を述べたものである.特に,収集した多変量データを処理するために Software がな
く断念した,また Software を購入するまでに至らなかった等,初期の目的を達成できなか
ったとの意見を聞いたことがあり Excel の基本関数を用いて解析を試みた.
多変量統計解析の理論を理解するためには,かなり統計学の基礎知識や数学的基礎知識
を理解しておく必要があるが,それぞれのデータ処理法が何を目的としたデータ処理なの
かを理解して解析の方法論を修得して欲しいと願っている.
本テキストでは,時間さえ十分にかければ Microsoft Excel を用いて多変量データの処理
は可能であることをポイントとしている.各章に Excel 演習問題ワークシートおよび Excel
演習問題解答を配置し,
また固有方程式の解法には Excel VBA を用いてプログラムを Excel
シートに作成した.いくつかの章に対しては,Excel 演習問題ワークシート No.1 と No.2
または No.3 の三つを提示しているので,応用として No.2 または No.3 のワークシートにも
挑戦していただきたいと願っている.演習問題で扱ったデータは,表示用として少ない変
数およびサンプルとして提示してあるが,本来の多変量データは多変数および多サンプル
となるので,本書では処理方法に重点をおいている.さらには統計的な解析については言
及していない.
本テキストで示した Excel 演習問題ワークシートおよび Excel 演習問題解答については
ホームページで公開した.公開先のURLは,
http://page.sannet.ne.jp/yo-skmt/demuva.html
である.
また本書で扱っている
(1)重回帰分析
(2)主成分分析
(3)因子分析
(4)判別分析
(5)正準相関分析
(6)クラスター分析
(7)数量化理論Ⅰ類
(8)数量化理論Ⅱ類
(9)数量化理論Ⅲ類
(10)数量化理論Ⅳ類
の処理方法については,Windows 用アプリケーションソフトとして開発作成しているので
公開しインストールを WindwsXP/7/8/8.1 まで対応させた.本書については大学の講義・演
習,社内教育等でご使用いただきご意見を賜れば幸いである.
2015 年 2 月 12 日
坂 元 保 秀
E-mail:[email protected](学外用)
[email protected](学内用)
目
次
第1章 行列の基礎
1.1 ベクトル表現・・・・・・・・・・・・・・・・・・・・ 1
1.2 行列表現・・・・・・・・・・・・・・・・・・・・・・ 1
1.3 ベクトルの演算・・・・・・・・・・・・・・・・・・・ 2
1.4 行列の演算・・・・・・・・・・・・・・・・・・・・・ 2
1.5 逆行列・・・・・・・・・・・・・・・・・・・・・・・ 3
第1章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・ 4
第1章 Excel 演習問題ワークシート・・・・・・・・・・・・・・ 5
第2章 統計的処理の基礎
2.1 データの分布・・・・・・・・・・・・・・・・・・・・
2.1.1 ヒストグラムの作成法・・・・・・・・・・・・・・
2.1.2 散布図の作成法・・・・・・・・・・・・・・・・・
2.2 データの基本統計量・・・・・・・・・・・・・・・・・
2.2.1 分布の中心的傾向・・・・・・・・・・・・・・・・
2.2.2 分布の散らばり的傾向・・・・・・・・・・・・・・
2.2.3 二つの特性間の関係・・・・・・・・・・・・・・・
2.3 正規分布・・・・・・・・・・・・・・・・・・・・・・
2.3.1 正規分布の確率・・・・・・・・・・・・・・・・・
2.3.2 多変量正規分布・・・・・・・・・・・・・・・・・
第2章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・
第2章 Excel 演習問題ワークシート・・・・・・・・・・・・・・
7
7
8
9
9
9
10
11
11
12
14
16
第3章 多変量データとは
3.1 多変量データの行列表示・・・・・・・・・・・・・・・ 19
3.2 データの種類・・・・・・・・・・・・・・・・・・・・ 20
3.3 多変量データの基本統計量・・・・・・・・・・・・・・ 21
3.3.1 全変数が定量的データのとき・・・・・・・・・・・ 21
3.3.2 変数に定性的データが含まれるとき・・・・・・・・ 22
第3章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・ 23
第3章 Excel 演習問題ワークシート・・・・・・・・・・・・・・ 24
第3章 Excel 演習問題ワークシート・・・・・・・・・・・・・・別 24
第4章 重回帰分析
4.1 重回帰分析とは・・・・・・・・・・・・・・・・・・・
4.2 重回帰モデルと偏回帰係数の推定・・・・・・・・・・・
4.3 重回帰式の妥当性・・・・・・・・・・・・・・・・・・
4.4 推定した回帰式による予測・・・・・・・・・・・・・・
4.5 変数間の分散共分散の推定・・・・・・・・・・・・・・
4.6 変数間の相関行列の推定・・・・・・・・・・・・・・・
4.7 変数間の偏相関行列の推定・・・・・・・・・・・・・・
第4章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・
第4章 Excel 演習問題ワークシート・・・・・・・・・・・・・・
−i−
27
27
30
30
30
31
31
33
34
第5章 主成分分析
5.1 主成分分析とは・・・・・・・・・・・・・・・・・・・ 36
5.2 主成分の導出・・・・・・・・・・・・・・・・・・・・ 36
5.2.1 変数が2個の場合の主成分の導出・・・・・・・・・ 37
5.2.2 変数がp個の場合の主成分の導出・・・・・・・・・ 39
5.2.3 寄与率・・・・・・・・・・・・・・・・・・・・・ 40
5.2.4 因子負荷量・・・・・・・・・・・・・・・・・・・ 40
5.2.5 主成分得点・・・・・・・・・・・・・・・・・・・ 40
5.3 標準化したデータを用いる主成分分析・・・・・・・・・ 41
5.3.1 主成分の導出・・・・・・・・・・・・・・・・・・ 41
5.3.2 寄与率・・・・・・・・・・・・・・・・・・・・・ 43
5.3.3 因子負荷量・・・・・・・・・・・・・・・・・・・ 43
5.3.4 主成分得点・・・・・・・・・・・・・・・・・・・ 43
5.4 ラグランジュの未定乗数法・・・・・・・・・・・・・・ 44
5.5 固有方程式・・・・・・・・・・・・・・・・・・・・・ 44
5.6 固有値,固有ベクトルを求めるプログラム使用手順・・・ 44
第5章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・ 47
第5章 Excel 演習問題ワークシート・・・・・・・・・・・・・・ 49
第5章 Excel 演習問題ワークシート・・・・・・・・・・・・・・別 49
第6章 判別分析
6.1 判別分析とは・・・・・・・・・・・・・・・・・・・・ 54
6.2 説明変数1個の場合の判別分析・・・・・・・・・・・・ 54
6.2.1 線型判別関数による判別・・・・・・・・・・・・・ 54
6.2.2 分散の推定・・・・・・・・・・・・・・・・・・・ 55
6.2.3 誤判別の確率・・・・・・・・・・・・・・・・・・ 55
6.3 説明変数2個の場合の判別分析・・・・・・・・・・・・ 56
6.3.1 線型判別関数による判別・・・・・・・・・・・・・ 56
6.3.2 分散共分散行列の推定・・・・・・・・・・・・・・ 58
6.3.3 誤判別の確率・・・・・・・・・・・・・・・・・・ 59
6.4 説明変数p個の場合の判別分析・・・・・・・・・・・・ 59
6.4.1 p変数k群による線型判別関数による判別・・・・・ 59
6.4.2 誤判別の確率・・・・・・・・・・・・・・・・・・ 61
6.5 行列表示・・・・・・・・・・・・・・・・・・・・・・ 61
6.5.1 基本統計量・・・・・・・・・・・・・・・・・・・ 61
6.5.2 線型判別関数・・・・・・・・・・・・・・・・・・ 62
6.5.3 誤判別の確率・・・・・・・・・・・・・・・・・・ 62
第6章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・ 63
第6章 Excel 演習問題ワークシート・・・・・・・・・・・・・・ 64
第6章 Excel 演習問題ワークシート・・・・・・・・・・・・・・別 64
第7章 正準相関分析
7.1 正準相関分析とは・・・・・・・・・・・・・・・・・・ 67
7.2 正準変量および正準相関係数の求め方・・・・・・・・・ 67
− ii −
7.3 第2番目以降の正準変量および正準相関係数・・・・・・ 72
第7章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・ 74
第7章 Excel 演習問題ワークシート・・・・・・・・・・・・・・ 75
第7章 Excel 演習問題ワークシート・・・・・・・・・・・・・・別 75
第8章 因子分析
8.1 因子分析とは・・・・・・・・・・・・・・・・・・・・ 78
8.2 因子分析モデルと因子行列・・・・・・・・・・・・・・ 79
8.3 共通性の推定・・・・・・・・・・・・・・・・・・・・ 82
8.4 非反復法による因子行列の推定・・・・・・・・・・・・ 82
8.5 反復法による因子行列の推定・・・・・・・・・・・・・ 84
8.6 因子得点の推定・・・・・・・・・・・・・・・・・・・ 85
8.7 固有方程式・・・・・・・・・・・・・・・・・・・・・ 87
【参考】因子分析による因子得点の推定法(回帰推定法)
・・・・ 87-1
第8章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・ 88
第8章 Excel 演習問題ワークシート・・・・・・・・・・・・・・ 90
第8章 Excel 演習問題ワークシート・・・・・・・・・・・・・・別 90
第8章 Excel 演習問題ワークシート(SMC規準)・・・・・・・ 別 90
第9章 クラスター分析
9.1 クラスター分析とは・・・・・・・・・・・・・・・・・ 95
9.2 クラスター構成法・・・・・・・・・・・・・・・・・・ 95
9.3 類似性を測る統計量・・・・・・・・・・・・・・・・・ 95
9.4 クラスター間の類似性を測る統計量・・・・・・・・・・ 96
9.4.1 クラスター間の類似性を測る最短距離法・・・・・・ 96
9.4.2 クラスター間の類似性を測るウォード法・・・・・・ 98
9.5 クラスターのデンドログラム・・・・・・・・・・・・・100
第9章 Excel 演習問題・・・・・・・・・・・・・・・・・・・・101
第9章 Excel 演習問題ワークシート・・・・・・・・・・・・・・103
第 10 章 数量化理論Ⅰ類
10.1 数量化理論Ⅰ類とは・・・・・・・・・・・・・・・・・108
10.2 ダミー法・・・・・・・・・・・・・・・・・・・・・・108
10.3 数量化理論Ⅰ類回帰モデルとカテゴリ数量の推定・・・・110
10.4 カテゴリ数量の基準化・・・・・・・・・・・・・・・・113
10.5 回帰式の妥当性・・・・・・・・・・・・・・・・・・・114
10.6 推定した回帰式による予測・・・・・・・・・・・・・・114
10.7 アイテム間の分散共分散の推定・・・・・・・・・・・・115
10.8 アイテム間の相関行列の推定・・・・・・・・・・・・・115
10.9 アイテム間の偏相関行列の推定・・・・・・・・・・・・115
第 10 章 Excel 演習問題 ・・・・・・・・・・・・・・・・・・・117
第 10 章 Excel 演習問題ワークシート ・・・・・・・・・・・・・118
第 11 章 数量化理論Ⅱ類
11.1 数量化理論Ⅱ類とは・・・・・・・・・・・・・・・・・122
−iii−
11.2 ダミー法・・・・・・・・・・・・・・・・・・・・・・122
11.3 アイテム数2個の場合の数量化理論Ⅱ類・・・・・・・・122
11.3.1 線型判別関数による判別・・・・・・・・・・・・・122
11.3.2 分散共分散行列の推定・・・・・・・・・・・・・・124
11.3.3 誤判別の確率・・・・・・・・・・・・・・・・・・126
11.4 アイテム数p個の場合の数量化理論Ⅱ類・・・・・・・・126
第 11 章 Excel 演習問題 ・・・・・・・・・・・・・・・・・・・127
第 11 章 Excel 演習問題ワークシート ・・・・・・・・・・・・・128
第 12 章 数量化理論Ⅲ類
12.1 数量化理論Ⅲ類とは・・・・・・・・・・・・・・・・・132
12.2 ダミー法・・・・・・・・・・・・・・・・・・・・・・132
12.3 数量化変数の推定・・・・・・・・・・・・・・・・・・132
12.4 一般的なデータ表に基づく数量化変数の推定・・・・・・136
第 12 章 Excel 演習問題 ・・・・・・・・・・・・・・・・・・・139
第 12 章 Excel 演習問題ワークシート ・・・・・・・・・・・・・140
第 13 章 数量化理論Ⅳ類
13.1 数量化理論Ⅳ類とは・・・・・・・・・・・・・・・・・146
13.2 数量化変数の推定・・・・・・・・・・・・・・・・・・147
13.3 分析対象物の数量化・・・・・・・・・・・・・・・・・149
13.4 行列 H の求め方 ・・・・・・・・・・・・・・・・・・150
13.5 固有値と固有ベクトル・・・・・・・・・・・・・・・・153
第 13 章 Excel 演習問題 ・・・・・・・・・・・・・・・・・・・157
第 13 章 Excel 演習問題ワークシート ・・・・・・・・・・・・・159
第 14 章 クロス表を応用した数量化理論Ⅰ類
14.1 クロス集計表・・・・・・・・・・・・・・・・・・・・162
14.2 偏差積和行列・・・・・・・・・・・・・・・・・・・・163
14.3 カテゴリ数量の推定・・・・・・・・・・・・・・・・・164
第 14 章 Excel 演習問題・・・・・・・・・・・・・・・・・・・ 165
第 14 章 Excel 演習問題ワークシート・・・・・・・・・・・・・ 166
第 15 章 クロス表を応用した数量化理論Ⅱ類
15.1 クロス集計表・・・・・・・・・・・・・・・・・・・・173
15.2 偏差積和行列・・・・・・・・・・・・・・・・・・・・173
15.3 線型判別関数の推定・・・・・・・・・・・・・・・・・175
15.4 誤判別の確率・・・・・・・・・・・・・・・・・・・・176
第 15 章 Excel 演習問題・・・・・・・・・・・・・・・・・・・ 177
第 15 章 Excel 演習問題ワークシート・・・・・・・・・・・・・ 178
【付録】Excel 関数を用いた基本統計量の求め方・・・・・・・・・・ 187
∼関数の使用法いろいろ データ表から直接求める方法を規準として∼
− iv −
Excel 演習問題解答
第1章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 1
第2章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 3
第3章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 6
Excel 演習問題解答・・・・・・・・・・・・・・・・・別解 6
第4章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 9
Excel 演習問題解答・・・・・・・・・・・・・・・・・別解 9
第5章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 11
Excel 演習問題解答・・・・・・・・・・・・・・・・・別解 11
第6章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 16
Excel 演習問題解答・・・・・・・・・・・・・・・・・別解 16
第7章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 19
Excel 演習問題解答・・・・・・・・・・・・・・・・・別解 19
第8章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 22
Excel 演習問題解答・・・・・・・・・・・・・・・・・別解 22
Excel 演習問題解答(SMC規準)・・・・・・・・・・・別解 22
第9章 Excel 演習問題解答・・・・・・・・・・・・・・・・・解 27
第 10 章 Excel 演習問題解答 ・・・・・・・・・・・・・・・・解 33
第 11 章 Excel 演習問題解答 ・・・・・・・・・・・・・・・・解 37
第 12 章 Excel 演習問題解答 ・・・・・・・・・・・・・・・・解 41
第 13 章 Excel 演習問題解答 ・・・・・・・・・・・・・・・・解 47
第 14 章 Excel 演習問題解答 ・・・・・・・・・・・・・・・・解 50
第 15 章 Excel 演習問題解答 ・・・・・・・・・・・・・・・・解 57
【付録】Excel 関数を用いた基本統計量の求め方・・・・・・・・解 66
∼関数の使用法いろいろ データ表から直接求める方法を規準として∼
参考文献
−v−
Fly UP