Comments
Description
Transcript
Guide to Using - Palisade Corporation
ユーザー ガイド StatTools Microsoft Excel 用統計アドイン ® バージョン 7 2016 年 6 月 Palisade Corporation 798 Cascadilla St Ithaca, NY 14850 USA +1-607-277-8000 http://www.palisade.com 著作権表記 Copyright © 2016, Palisade Corporation. 商標について Microsoft、Excel、Windows は Microsoft, Inc. の登録商標です。 IBM は International Business Machines, Inc. の登録商標です。 Palisade、TopRank、BestFit、RISKview は Palisade Corporation の登録商標です。 StatTools for Excel へようこそ ようこそ StatTools を利用すると、業界標準のデータ分析・モデル化ツールで ある Microsoft Excel に一連の強力な統計ツールを追加できます。 Microsoft Excel 用の統計アドインとして機能する StatTools では、 使い慣れた Microsoft Office の作業環境を離れることなく Excel ワークシートに設定されたデータの分析を行うことができます。現在 市販されている中で最も優れた統計ツール パッケージに匹敵する高 度な分析機能に強力なデータ マネージャーを組み合わせた StatTools を使用すれば、Microsoft Office の使いやすさと優れた レポート機能に加え、堅牢な統計機能のすべてが手に入ります。 使い慣れた作業環境 Excel に慣れているユーザーなら StatTools を使った作業も簡単で す。StatTools の使い方は Excel とまったく同じです。ツールバー、 メニュー、カスタム ワークシート関数のすべてが Excel アプリケー ション内に表示されます。StatTools はスタンドアロンの統計ソフト ウェアと異なり、使い慣れた Excel と同じ方法で作業できる ので、 簡単に習得でき事前のトレーニング費用もかかりません。使用するデ ー タや変 数は Excel スプ レッド シー トに入 って います 。標 準の Excel 式による計算や変換だけでなく、並べ替え機能やピボット テ ーブルも利用できます。また、統計分析からのレポートやグラフは標 準の Excel 形式で作成されるので、Excel に備わっている書式機能 をすべて利用することができます。 StatTools for Excel へようこそ i 堅牢な統計分析を Excel 内で実行 StatTools は Excel の組み込み統計機能を、独自の堅牢な高速計算 関数で置き換えます。Excel の組み込み統計計算は正確さに欠けるこ とがあるため、StatTools ではこれらを一切使用しません。さらに STDEV() などの Excel のワークシート統計関数の一部も、StatTools 独 自 の StatSTDEV() な ど の 堅 牢 な 関 数 で 置 き 換 え ら れ ま す 。 StatTools の統計計算は最高の精度を誇り、マクロ計算の代わりに C++ .DLL を使用するので、そのパフォーマンスは最適化されていま す。 StatTools の分析機能 StatTools では最もよく使われる統計処理を行うことができ、新しい カスタム分析を追加するための従来にない優れた機能が備わっていま す。多岐にわたる 36 の統計処理と 8 つの組み込みデータ ユーティ リティを使って、一般的な統計分析のほとんどを実行できます。付属 の統計関数としては、記述統計関数、正規性検定、グループ比較、相 関関数、回帰分析、品質管理、予測、その他が用意されています。さ らに社内スタッフや当該分野の専門家が作成したカスタム処理のライ ブラリを加えれば、Excel 内で直接実行できる、包括的かつカスタマ イズ可能な統計ツールセットが手に入ります。 StatTools には「ホットリンク」を用いたライブ統計計算機能も用意 されています。Excel で値を変更すると、ワークシートが自動的に再 計算されて新しい結果が表示されますが、StatTools もこれとまった く同じように機能します。データセットの値を変更すると、統計レポ ートがこれに応じて自動的に更新されます。StatTools では、レポー トに表示される統計結果に常に最新のデータを反映させるために一連 の強力なカスタム ワークシート関数が採用されています。 StatTools のデータ管理機能 StatTools では、スタンドアロンの統計パッケージに用意されている ような包括的なデータセットと変数の管理機能を Excel 内で直接使 用できます。Excel にあるデータから、分析の対象となる変数を指定 したデータセットをいくつでも直接定義できます。StatTools がデー タのブロックをインテリジェントに分析した上で、変数の名前とデー タの位置を提案してくれます。データセットと変数は複数のブックや ワークシートに保存が可能なので、必要に応じて自由にデータを整理 できます。変数を定義したら、これらを参照する統計分析を行います。 したがって Excel でデータを何度も選択する必要はありません。 ii ようこそ また、StatTools の変数は 1 つの Excel ワークシートの特定列に限 定されません。1 つの変数に対して複数のワークシートにわたり同じ 列を使用することが可能です。Excel の 2007 以上のバージョンは 1 つのワークシートに 100 万を超える数の行があり、また 1 つのブッ クに設定できるワークシートの数に制限がありません。したがって、 StatTools インダストリアル版で分析できるケースの数は、使用可能 なメモリ容量によってのみ制限されます。StatTools プロフェッショ ナル版は 10,000 ケースに制限されています。 StatTools のレポート機能 StatTools では Excel の優れたレポートやグラフ機能をフルに活用 できます。StatTools のグラフは Excel 形式なので、新しい色やフ ォントを設定したりテキストを追加したりして、簡単にカスタマイズ できます。レポートのタイトルや数値のフォーマットやテキストなど も一般の Excel シートと同じ方法で変更できます。StatTools で作 成したレポートからテーブルやグラフをほかの文書やアプリケーショ ンにドラッグ&ドロップすることも可能です。グラフやテーブルから Excel 内データへのリンクは維持されるので、分析に変更があった場 合でも文書が自動更新されます。 データのアクセスと共有 Excel の優れたデータ インポート機能を利用して、既存のデータを StatTools で 簡 単 に 使 用 で き ま す 。 Excel の 標 準 機 能 を 使 っ て Microsoft SQL Server、Oracle、Microsoft Access、またはその他の ODBC 対応データベースからデータを読み込むことができます。テキ スト ファイルやほかのアプリケーションからデータを読み込むこと も可能です。Excel に読み込めるデータならすべて StatTools でも 使用できます。 StatTools ではすべての結果とデータが Excel ブックに保存されま す。ほかのすべての Excel ファイルと同じく StatTools の結果やデ ータも世界のどこにでも送信することができます。同僚とデータを共 有するのもこの上なく簡単です。 StatTools for Excel へようこそ iii iv ようこそ 目次 第 1 章: StatTools 活用の基礎 1 はじめに ................................................... 3 このバージョンについて .....................................3 ご利用のオペレーティング環境での作業 .......................3 サポートについて...........................................3 StatTools システム必要条件 .................................5 インストール手順 ........................................... 7 一般的なインストール手順 ...................................7 StatTools アイコンおよびショートカットの設定 ...............7 DecisionTools Suite ........................................8 ソフトウェアのアクティベーション (ライセンス認証) .......... 9 第 2 章: StatTools の概要 11 概要 ...................................................... 13 StatTools のメニューとツールバー ..........................13 データセットとデータ マネージャー .........................13 StatTools のレポートとグラフ ..............................16 第 3 章: StatTools リファレンス ガイド 19 はじめに .................................................. 27 StatTools VBA マクロ言語とデベロッパー ツールキット .......27 リファレンス: StatTools アイコン 29 StatTools ツールバー ...................................... 29 目次 v リファレンス: StatTools メニューのコマンド 31 はじめに .................................................. 31 コマンド一覧 .............................................. 33 StatTools メニュー - データセット .......................... 43 [データセット マネージャー] コマンド ..................... 43 [データ ユーティリティ] メニュー ........................... 49 [スタック化] コマンド .................................... 49 [スタック解除] コマンド .................................. 51 [変換] コマンド .......................................... 52 [遅延] コマンド .......................................... 54 [差] コマンド ............................................ 56 [相互作用] コマンド ...................................... 58 [組み合わせ] コマンド .................................... 60 [ダミー] コマンド ........................................ 62 [ランダム標本] コマンド .................................. 64 [サマリー統計] メニュー.................................... 67 [1 変数サマリー] コマンド ................................ 67 [相関と共分散] コマンド .................................. 70 [サマリー グラフ] メニュー ................................. 73 [ヒストグラム] コマンド .................................. 73 [散布図] コマンド ........................................ 76 [箱ひげ図] コマンド ...................................... 78 [統計的推定] メニュー ..................................... 81 [信頼区間 - 平均値 / 標準偏差] コマンド .................. 81 [信頼区間 - 比率] コマンド ............................... 84 [仮説検定 - 平均値 / 標準偏差] コマンド .................. 87 [仮説検定 - 比率] コマンド ............................... 90 [標本サイズの選択] コマンド .............................. 93 [一元配置 ANOVA] コマンド ................................ 95 [二元配置 ANOVA] コマンド ................................ 98 [カイ二乗独立性検定] コマンド ........................... 100 [カイ二乗適合度検定] コマンド ........................... 102 [正規性検定] メニュー .................................... 105 [カイ二乗検定] コマンド ................................. 105 vi ようこそ [リリフォース検定] コマンド ..............................109 [正規 Q-Q プロット] コマンド .............................111 [時系列と予測] メニュー .................................. 113 [時系列グラフ] コマンド ..................................113 [自己相関] コマンド......................................116 [ランダム性の連検定] コマンド ............................118 [予測] コマンド..........................................120 [回帰と分類] メニュー .................................... 125 [回帰] コマンド..........................................126 データへのリンク - 元のデータへのリンクはありません。データ が変更された場合、分析を再実行する必要があります。 .......135 [ロジスティック回帰] コマンド ............................136 [判別分析] コマンド......................................140 [品質管理] コマンド ...................................... 145 [パレート図] コマンド ....................................146 [X-R 管理図] コマンド ....................................149 [P 管理図] コマンド......................................153 [C 管理図] コマンド......................................156 [U 管理図] コマンド......................................159 [ノンパラメトリック検定] メニュー ........................ 163 [符号検定] コマンド......................................165 [ウィルコクソン符号順位検定] コマンド ....................168 [マンホイットニー検定] コマンド ..........................171 [クラスカル・ウォリス検定] コマンド ......................175 多変量解析 ............................................... 179 [主成分分析] コマンド ....................................179 [クラスター分析] コマンド ................................183 [ユーティリティ] メニュー ................................ 191 [アプリケーション設定] コマンド ..........................191 [データセットの削除] コマンド ............................197 [ダイアログ メモリの消去] コマンド .......................197 [StatTools アドインのアンロード] コマンド ................197 [ヘルプ] メニュー ........................................ 199 ヘルプ ..................................................199 マニュアル...............................................199 目次 vii [ライセンス認証] コマンド ............................... 199 [StatTools について] コマンド ........................... 200 リファレンス: StatTools 関数 201 はじめに ................................................. 201 StatTools 関数と Excel 関数 ............................. 201 分布関数 ................................................ 202 「ライブ」レポート ...................................... 203 リファレンス: 静的関数の一覧 .............................. 205 利用できる関数の一覧表 .................................. 205 関数の詳細な説明 ........................................ 209 索引 viii 223 ようこそ 第 1 章: StatTools 活用の基礎 はじめに ................................................... 3 このバージョンについて .....................................3 ご利用のオペレーティング環境での作業 .......................3 サポートについて...........................................3 StatTools システム必要条件 .................................5 インストール手順 ........................................... 7 一般的なインストール手順 ...................................7 StatTools アイコンおよびショートカットの設定 ...............7 @RISK 4.5 Help System Palisade Corporation, 1999 1 2 はじめに こ の セ ク シ ョ ン で は 、 StatTools 製 品 パ ッ ケ ー ジ の 内 容 と 、 StatTools をインストールしてお使いの Microsoft Excel と連携さ せる方法について解説します。 このバージョンについて このバージョンの StatTools は Microsoft Excel 2007 およびそれ 以降で実行できます。 ご利用のオペレーティング環境での作業 このユーザー ガイドは、Windows オペレーティング システムおよび Excel についての一般的な知識がある読者を対象としています。特に 以下の知識が必要です。 • ご利用のコンピューター、およびマウスの使い方に精通している こと。 • アイコン、クリック、ダブルクリック、メニュー、ウィンドウ、 コマンド、およびオブジェクトといった用語に精通していること。 • ディレクトリ構造やファイルの命名といった、基礎的な概念を理 解していること。 サポートについて テクニカル サポートは、有効なメンテナンス プランをお持ちの StatTools 登録ユーザーのお客様に対して無償で、あるいはインシデ ントごとに有償で提供しております。StatTools 登録ユーザーになる には、http://www.palisade.com/support/register.asp にてオンラ イン登録を行ってください。 電話でのお問い合わせの際には、あらかじめ製品のシリアル番号とユ ーザー ガイドをお手元にご用意ください。また、コンピューターで 作業できる状態でご連絡いただければ、さらに効果的なテクニカル サポートを受けることができます。 第 1 章: StatTools 活用の基礎 3 お問い合わせの 前に Palisade へのお 問い合わせ テクニカル サポートへのお問い合わせの前に、次の事柄をご確認く ださい。 • オンライン ヘルプを参照しましたか? • 本ユーザー ガイドを確認し、オンライン マルチメディア チュ ートリアルの内容を参照しましたか? • 「お読みください」(README.WRI) ファイルを読みましたか?こ のファイルには、マニュアルに収録されていない最新の StatTools 製品情報が記載されています。 • 問題となっている障害は再現することが可能ですか?また、別の コンピューターやモデルでも、問題点を再現することは可能です か? • 弊社の Web サイトをご覧になりましたか?弊社サイトの URL ア ドレスは http://www.palisade.com です。このサイトのテクニ カル サポートのセクションには、最新の FAQ (テクニカル サポ ートに寄せられた質問とその回答を集めた検索可能なデータベー ス ) 、 お よ び StatTools の パ ッ チ が 掲 載 さ れ て い ま す 。 StatTools およびその他の Palisade ソフトウェアの最新情報を いち早く入手できるよう、弊社のサイトには定期的にアクセスさ れることをお勧めします。 Palisade 社では、StatTools に関するご質問、ご意見、およびご提 案をお待ちしております。テクニカル サポートには、以下のいずれ かの方法でご連絡いただけます。 • 電子メール: [email protected] • 電話: +1-607-227-8000 (米国)、米国東海岸時間平日午前 9 時 から午後 5 時まで。テクニカル サポートへの電話案内の指示に 従ってください。 • ファックス: +1-607-227-8001 (米国) • 郵便: Technical Support Palisade Corporation 798 Cascadilla St Ithaca, NY 14850 USA Palisade Europe へのお問い合わせ: 4 • 電子メール: [email protected] • 電話: +44 1895 425050 (英国) • ファックス: +44 1895 425051 (英国) • 郵便: Palisade Europe 31 The Green West Drayton Middlesex UB7 7PN United Kingdom Palisade Asia-Pacific へのお問い合わせ: • 電子メール: [email protected] • 電話: +61 2 9252 5922 (オーストラリア) • ファックス: +61 2 9252 2820 (オーストラリア) • 郵便: Palisade Asia-Pacific Pty Limited Suite 404, Level 4 20 Loftus Street Sydney NSW 2000 Australia いずれの方法でお問い合わせいただく場合でも、必ず製品名、正確な バージョン番号、およびシリアル番号をご連絡ください。正確なバー ジョンは、Excel の StatTools メニューから [StatTools について] コマンドを選択することで確認できます。 ステューデント 版 ステューデント版の StatTools に対する電話でのサポートは提供し ておりません。サポートが必要な場合は、以下の方法をご検討くださ い。 ♦ 担当の教授または教育助手に相談する。 ♦ http://www.palisade.com にアクセスして FAQ を参照する。 ♦ 電子メールまたはファックスで弊社のテクニカル サポート部 門に連絡する。 StatTools システム必要条件 StatTools for Microsoft Excel、Windows 版のシステム必要条件は 以下の通りです。 • Microsoft Windows XP またはそれ以降 • Microsoft Excel 2007 またはそれ以降 第 1 章: StatTools 活用の基礎 5 6 インストール手順 一般的なインストール手順 StatTools のセットアップ プログラムは、ユーザーが指定したハー ドディスク上のディレクトリに StatTools システム ファイルをコピ ーします。Windows XP またはそれ以上でセットアップ プログラムを 実行するには、次を行います。 1) ダウンロードした、またはインストール CD にある StatTools Setup.exe をダブルクリックして、画面に表示されるセットアッ プ手順に従います。 StatTools のインストール中に問題が発生する場合は、インストール 対象のドライブに十分な空きスペースがあることを確認してください。 十分な空きスペースが確保できたら、再度、インストール手順を実行 してください。 StatTools のコ ンピューターか らの削除 ご利用のコンピューターから StatTools を削除する場合は、[コント ロールパネル] の [プログラムの追加と削除] ユーティリティを起動 して StatTools のエントリを選択してください。 StatTools アイコンおよびショートカットの設定 Windows タスク バーでのショー トカットの作成 StatTools のセットアップ プログラムは、タスクバーのプログラム メニューに StatTools コマンドを自動的に作成します。ただし、セ ットアップ作業中に問題が発生した場合、あるいは、別の機会に手動 でこのコマンドを作成したい場合は、以下の手順に従います。以下は Windows XP プロフェッショナル版の手順です。それ以外のオペレー ティング システムでは手順が若干異なる場合があります。 1) [スタート] ボタンをクリックし、[設定] を選択します。 2) [タスク バーと [スタート] メニュー] をクリックし、[[ス タート] メニュー] タブをクリックします。 3) [カスタマイズ] をクリックし、[参照] をクリックします。 4) 「StatTools.EXE」というファイルを見つけてクリックし、 [OK] をクリックします。 5) [次へ] をクリックし、プログラムのショートカットを保存す るメニューをダブルクリックします。 6) 名前として「StatTools」と入力し、[完了] をクリックしま す。 第 1 章: StatTools 活用の基礎 7 7) すべてのダイアログで [OK] をクリックして閉じます。 DecisionTools Suite StatTools は、Palisade 社が提供しているリスク分析・意思決定分 析のためのセット製品 DecisionTools Suite の一部です。デフォル トの StatTools インストール手順では、メイン ディレクトリである 「Program Files\Palisade」のサブディレクトリに StatTools がイ ンストールされます。これは、「Microsoft Office」ディレクトリの サブディレクトリに Excel がインストールされるのと同じ要領です。 Program Files\Palisade ディレクトリに作成されるサブディレクト リ の 1 つ が 、 StatTools デ ィ レ ク ト リ ( デ フ ォ ル ト 名 「StatTools7」) です。このディレクトリには、StatTools アドイン プログラム ファイル (STATTOOLS.XLA) に加えて、サンプル モデル および、StatTools を実行するために必要な関連ファイルが含まれて います。Program Files\Palisade には、SYSTEM というサブディレク トリも作成されます。このディレクトリには、共通のヘルプ ファイ ルやプログラム ライブラリなど、DecisionTools Suite のすべての プログラムで必要とされるファイルが含まれています。 8 ソフトウェアのアクティベーション (ライセンス 認証) アクティベーション (ライセンス認証) とは、お手元の Palisade ソ フトウェアを完全なライセンス版製品として実行するために必要な、 一度限りのライセンス認証手続きです。ライセンス認証コードは 「DNA-6438907-651282-CDM」などのハイフン (-) で区切られた文字 列で、印刷版または電子メールでお送りしたインボイスに記載されて います。インストール手続き中にライセンス認証コードを入力した場 合は、インストールの完了時にソフトウェアのアクティベーションが 行われるため、ほかのユーザー操作が必要になることはありません。 インストール手続きの完了後にソフトウェアのアクティベーションを 行いたい場合は、[ヘルプ] メニューの [ライセンス マネージャー] コマンドを選択します。 ライセンス マネージャーを使用して、ソフトウェア ライセンスのア クティベーション、認証、認証解除、および移行を行うことができま す。また、ライセンス マネージャーによってネットワーク インスト ール用のライセンスを管理することも可能です。目的のライセンス操 作を実行するには、ライセンス マネージャーの画面やダイアログの 指示に従ってください。 第 1 章: StatTools 活用の基礎 9 10 第 2 章: StatTools の概要 概要 13 StatTools のメニューとツールバー ..........................13 データセットとデータ マネージャー .........................13 複数範囲のデータ ...................................15 スタック データと非スタック データ .................15 未知の値の処理 .....................................15 StatTools のレポートとグラフ ..............................16 数式の使用と値の使用 ...............................16 セル内のコメント ...................................18 第 2 章: StatTools の概要 11 12 概要 StatTools は、使い慣れた Microsoft Excel の作業環境で直接実行 できる、強力な統計分析ツールを提供します。散布図の作成、変数の 正規性検定、回帰分析の実行など、StatTools の処理は Excel 内に あるデータに対して実行することができ、分析結果のレポートやグラ フも Excel で作成されます。 StatTools のメニューとツールバー また、StatTools ツールバーも Excel に表示されます。Excel 2007 以降では、StatTools リボンが表示されます。 データセットとデータ マネージャー StatTools は、変数を基盤とする一般のスタンドアロン統計ソフトウ ェア パッケージと似ています。ほとんどの分析問題ではデータセッ ト (つまり統計変数のセット) を使用する必要があり、データセット は各列の 1 行目に変数名が指定された、連続した列で構成されてい ます。データセットと変数の定義には StatTools のデータセット マ ネージャーを使用します。その後、定義したデータセットを使って統 計分析を行います。分析に使うデータを何度も繰り返し選択する必要 はありません。 第 2 章: StatTools の概要 13 データセット内の変数にはそれぞれ名前と Excel セル範囲が関連付 けられています。変数は各列ごとに 1 つの変数を配置するのが通常 ですが、変数を行ごとに配置することもできます。データセットに複 数のセル ブロックを含めて、同じブックの異なるシートにデータを 保存することも可能です。 データセットを定義する場合、StatTools は現在 Excel で選択され ている項目の周りのセル ブロックにある変数を認識しようとします。 これにより、最初の行に変数名が指定され、各列ごとに変数が配置さ れたデータセットの設定を素早く簡単に行うことができます。 データセットの列の長さを均等にする必要はありません。例えば「体 重_男性」と「体重_女性」という 2 つの変数に、それぞれ異なる数 の観察値を持たせることができます。ただし多くの分析問題では、短 い列の空白のセルが StatTools によって未知のデータとして処理さ れます。 14 複数範囲のデー タ 変数にこれより多くの値があり、Excel 2007 を使用しない場合には、 StatTools で 1 つのデータセットに複数のセル範囲を割り当てるこ とができます。例えば、データセットを複数のシートにわたって繰り 返すことにより、異なるワークシートの同じ列に 1 つのデータセッ トのすべての値を保存することができます。この機能を利用して、同 じワークシート上にあるセルの異なるブロックを 1 つのデータセッ トに割り当てることもできます。これは 1 つのワークシート上のさ まざまな場所に散在しているデータを 1 つのデータセットにすべて まとめたい場合に便利です。 スタック データ と非スタック デ ータ StatTools ではスタック形式のデータと非スタック形式のデータの両 方がサポートされます。統計処理によって、スタック データを使用 した方が処理しやすい場合と、非スタック データの方が処理しやす い場合があります。例えば、さまざまな地区の 1 世帯当たり平均収 入を比較するために非スタック形式のデータを使用する場合、各地区 につき個別の「収入」変数 (つまり列) を設定します。これがスタッ ク形式のデータでは、「収入」という値変数と、各世帯がどの地区に 属するかを示す「地区」というカテゴリ変数の両方を設定します。 StatTools のスタック化ユーティリティを利用して、変数を値列 (こ こでは「収入」) とカテゴリ列 (ここでは「地区」) の 2 列のスタ ックとして構成することができます。分析のタイプによっては、スタ ック形式のデータセットの方が非スタック形式のデータセットよりも 作業が行いやすくなります。 未知の値の処理 統計分析ではよくあることですが、データセットから値が抜けている 場合、StatTools はタスクに応じてこれらの値を適宜処理します。例 えば平均や標準偏差などの集約尺度ではこうした未知の値が無視され ます。これに対して、3 つの変数を使用する回帰分析の場合、3 つす べての変数の値がわかっているデータセット行のみが使用されます。 (このような方法を「リストワイズ」または「ケースワイズ」除去と 呼びます。) さらに、2 つの変数がある散布図の場合には、この両方 の変数の値がわかっている点のみが使用されます。 注意: 一部の StatTools 処理では未知の値が許可されません。各処 理での未知の値の扱いについては、このマニュアルの「リファレン ス」セクションを参照してください。 第 2 章: StatTools の概要 15 StatTools のレポートとグラフ StatTools で回帰分析のレポートやサマリー統計テーブルなどの数値 出力が作成されると、そのレポートを配置するためのオプションが表 示されます。次のオプションがあります。 • [新規ブック] - 必要に応じて新規ブックが作成され、各レポ ートがそのブックの個別のシートに配置されます。 • [アクティブなブック] - 各レポートがアクティブ ブック内 の新しいシートに配置されます。 • [アクティブなシートの最後の使用列の後] - 各レポートがア クティブなシートの最後の使用列の右に配置されます。 • [開始セルを確認する] - このオプションでは、レポートまた はグラフの左上隅を配置するセルを選択できます。 StatTools で作成されたグラフはすべてレポートに表示されます。こ 数式の使用と値 の使用 れらのグラフは Excel 形式で作成され、標準の Excel グラフ コマ ンドを使ってカスタマイズすることができます。 StatTools はデフォルトでは分析結果をできる限り「ライブ」で報告 しようとします。したがって、レポートには実用的である限り元のデ ータにリンクしている式が使われます。例えば「Weight (重量)」と いう変数について平均や標準偏差などの集約尺度を求めたいとします。 するとサマリー統計処理では重量の範囲に「Weight (重量)」という 名 前 が 付 け ら れ 、 出 力 セ ル に 「 =StatMean(Weight) 」 と 「=StatStdDev(Weight)」という数式が入力されます。StatMean と StatStdDev は、平均値と標準偏差を計算するための StatTools の組 み込み関数です。これらの関数はそれぞれ相当する Excel の標準関 数を置き換えます。 16 レポートで数式が使用される理由は 2 つあります。まず、統計処理 および Excel で使用される StatTools 関数について理解しやすくな ります。これは単に数値の結果が表示されるのではなく、その計算方 法を確認できるからです。そして、データが変更されるとその分析結 果も自動的に更新されるので、処理を再実行する手間が省けるという 実用的なメリットがあります。 ただし、数式を使用するのが実用的でない場合もあります。回帰分析 はその典型的な例です。StatTools には回帰分析の出力を生成するた めの数式が用意されておらず、数値の結果のみが出力されます。この 場合には、データが変更されると処理を再実行する必要があります。 StatTools にはライブ更新を無効にするオプションもあります。これ は、データの変更に伴い Excel の再計算に時間がかかり過ぎる場合 には便利です。 第 2 章: StatTools の概要 17 セル内のコメン ト Excel にはすべてのセルにポップアップ式のコメントを付ける機能が あります。コメントが指定されているセルは右上隅に小さい赤い三角 形が表示されます。コメントを読むには、そのセルにカーソルを合わ せます。StatTools は、このコメント機能を利用して状況依存のヘル プを適宜挿入します。これはオンライン ヘルプの中でも最も「オン ライン」なヘルプ機能です。 コメントが常にデータの手前に表示されて非表示にすることができな い場合には、[Excel のオプション] - [詳細設定] の [表示] で [イ ンジケータのみ。ただしポイント時にコメントを表示] を選択します。 18 第 3 章: StatTools リファレン ス ガイド はじめに .................................................. 27 StatTools VBA マクロ言語とデベロッパー ツールキット .......27 リファレンス: StatTools アイコン 29 StatTools ツールバー ...................................... 29 リファレンス: StatTools メニューのコマンド 31 はじめに .................................................. 31 コマンド一覧 .............................................. 33 StatTools メニュー - データセット ......................... 43 [データセット マネージャー] コマンド ......................43 データセットと変数の定義 ...........................43 [データセット マネージャー] ダイアログ ボックス ....44 [変数] オプション ..................................46 データセットと変数のデータ容量 .....................47 [データ ユーティリティ] メニュー .......................... 49 [スタック化] コマンド .....................................49 スタック変数と非スタック変数 .......................49 [スタック化ユーティリティ] ダイアログ ボックス .....50 カテゴリ変数と値変数 ...............................50 分析用に選択するスタック形式の変数の数 .............50 [スタック解除] コマンド ...................................51 [スタック解除ユーティリティ] ダイアログ ボックス ...51 [変換] コマンド...........................................52 第 3 章: StatTools リファレンス ガイド 19 [変換ユーティリティ] ダイアログ ボックス........... 52 変換された新規変数のあるデータセット............... 53 [遅延] コマンド .......................................... 54 [遅延ユーティリティ] ダイアログ ボックス........... 54 元のデータセットの右に表示された遅延変数........... 55 [差] コマンド ............................................ 56 [差ユーティリティ] ダイアログ ボックス............. 56 差変数のあるデータセット .......................... 57 [相互作用] コマンド ...................................... 58 [相互作用ユーティリティ] ダイアログ ボックス....... 58 相互作用変数の作成方法 ............................ 59 相互作用変数のあるデータセット .................... 59 [組み合わせ] コマンド .................................... 60 [組み合わせユーティリティ] ダイアログ ボックス ..... 60 組み合わせ変数のあるデータセット .................. 61 [ダミー] コマンド ........................................ 62 [ダミー ユーティリティ] ダイアログ ボックス........ 62 [ランダム標本] コマンド .................................. 64 [ランダム標本ユーティリティ] ダイアログ ボックス ... 64 [サマリー統計] メニュー.................................... 67 [1 変数サマリー] コマンド ................................ 67 [1 変数サマリー統計] ダイアログ ボックス........... 67 1 変数サマリー レポート ........................... 68 未知のデータとデータへのリンク .................... 69 [相関と共分散] コマンド .................................. 70 [相関と共分散] ダイアログ ボックス ................ 70 相関と共分散レポート .............................. 71 未知のデータとデータへのリンク .................... 72 [サマリー グラフ] メニュー ................................. 73 [ヒストグラム] コマンド .................................. 73 [ヒストグラム] ダイアログ ボックス ................ 73 単一変数のヒストグラム ............................ 75 未知のデータとデータへのリンク .................... 75 [散布図] コマンド ........................................ 76 [散布図] ダイアログ ボックス ...................... 76 散布図の例 ........................................ 77 未知のデータとデータへのリンク .................... 77 [箱ひげ図] コマンド ...................................... 78 [箱ひげ図] ダイアログ ボックス .................... 78 箱ひげ図の例 ...................................... 79 20 未知のデータとデータへのリンク .....................80 [統計的推定] メニュー ..................................... 81 [信頼区間 - 平均値 / 標準偏差] コマンド ...................81 [平均値 / 標準偏差の信頼区間] ダイアログ ボックス ..81 信頼区間レポート ...................................83 未知のデータとデータへのリンク .....................83 [信頼区間 - 比率] コマンド ................................84 [比率の信頼区間] ダイアログ ボックス ...............84 信頼区間レポート ...................................86 未知のデータとデータへのリンク .....................86 [仮説検定 - 平均値 / 標準偏差] コマンド ...................87 [平均値 / 標準偏差の仮説検定] ダイアログ ボックス ..87 仮説検定レポート ...................................89 未知のデータとデータへのリンク .....................89 [仮説検定 - 比率] コマンド ................................90 [比率の仮説検定] ダイアログ ボックス ...............90 仮説検定レポート ...................................92 未知のデータとデータへのリンク .....................92 [標本サイズの選択] コマンド ...............................93 [標本サイズの選択] ダイアログ ボックス .............93 標本サイズの推定レポート ...........................94 未知のデータとデータへのリンク .....................94 [一元配置 ANOVA] コマンド .................................95 [一元配置 ANOVA] ダイアログ ボックス ...............95 一元配置 ANOVA レポート ............................96 未知のデータとデータへのリンク .....................97 [二元配置 ANOVA] コマンド .................................98 [二元配置 ANOVA] ダイアログ ボックス ...............98 二元配置 ANOVA レポート ............................99 未知のデータとデータへのリンク .....................99 [カイ二乗独立性検定] コマンド ............................100 [カイ二乗独立性検定] ダイアログ ボックス ..........100 カイ二乗独立性検定レポート ........................101 未知のデータとデータへのリンク ....................101 [正規性検定] メニュー .................................... 105 [カイ二乗検定] コマンド ..................................105 [カイ二乗正規性検定] ダイアログ ボックス ..........106 カイ二乗正規性検定レポート ........................107 未知のデータとデータへのリンク ....................108 [リリフォース検定] コマンド ..............................109 第 3 章: StatTools リファレンス ガイド 21 [リリフォース検定] ダイアログ ボックス............ 109 リリフォース検定レポート ......................... 110 未知のデータとデータへのリンク ................... 110 [正規 Q-Q プロット] コマンド ............................ 111 [正規 Q-Q プロット] ダイアログ ボックス........... 111 正規 Q-Q プロット レポート ....................... 111 未知のデータとデータへのリンク ................... 112 [時系列と予測] メニュー................................... 113 [時系列グラフ] コマンド ................................. 113 [時系列グラフ] ダイアログ ボックス ............... 114 2 つの変数の時系列グラフ ......................... 115 未知のデータとデータへのリンク ................... 115 [自己相関] コマンド ..................................... 116 [自己相関] ダイアログ ボックス ................... 116 自己相関レポート ................................. 117 未知のデータとデータへのリンク ................... 117 [ランダム性の連検定] コマンド ........................... 118 [ランダム性の連検定] ダイアログ ボックス.......... 118 ランダム性の連検定レポート ....................... 119 未知のデータとデータへのリンク ................... 119 [予測] コマンド ......................................... 120 [予測] ダイアログ ボックス ....................... 121 [予測] ダイアログ ボックスの [予測の設定] オプション121 [予測] ダイアログ ボックスの [時間の尺度] オプション122 [予測] ダイアログ ボックスの [表示するグラフ] オプシ ョン ............................................. 123 予測レポートの例 ................................. 123 未知のデータとデータへのリンク ................... 124 [回帰と分類] メニュー .................................... 125 [回帰] コマンド ......................................... 126 回帰ウィザード ................................... 126 使用できる回帰のタイプ (変数の選択方法)........... 127 [回帰] ダイアログ ................................ 128 [回帰] ダイアログ – [変数] タブ .................. 129 [派生変数の追加] ダイアログ ...................... 130 [回帰] ダイアログ – [パラメーター] タブ........... 131 [回帰] ダイアログ – [グラフ] タブ ................ 132 回帰レポート ..................................... 134 未知のデータとデータへのリンク ................... 135 22 データへのリンク - 元のデータへのリンクはありません。データ が変更された場合、分析を再実行する必要があります。 .......135 [ロジスティック回帰] コマンド ............................136 [ロジスティック回帰] ダイアログ ボックス ..........137 ロジスティック回帰レポート ........................139 未知のデータとデータへのリンク ....................139 [判別分析] コマンド......................................140 [判別分析] ダイアログ ボックス ....................140 [誤分類コスト] ダイアログ ボックス ................141 判別分析レポート ..................................142 未知のデータとデータへのリンク ....................143 [品質管理] コマンド ...................................... 145 [パレート図] コマンド ....................................146 [パレート図] ダイアログ ボックス ..................147 未知のデータとデータへのリンク ....................148 [X-R 管理図] コマンド ....................................149 [X バーおよび R 管理図] ダイアログ ボックス .......150 X バー管理図の例 ..................................151 未知のデータとデータへのリンク ....................152 [P 管理図] コマンド......................................153 [P 管理図] ダイアログ ボックス ....................153 P 管理図の例 ......................................155 未知のデータとデータへのリンク ....................155 [C 管理図] コマンド......................................156 [C 管理図] ダイアログ ボックス ....................156 C 管理図の例 ......................................158 未知のデータとデータへのリンク ....................158 [U 管理図] コマンド......................................159 [U 管理図] ダイアログ ボックス ....................159 U 管理図の例 ......................................161 未知のデータとデータへのリンク ....................161 [ノンパラメトリック検定] メニュー ........................ 163 順序データ ........................................164 用途のまとめ ......................................164 [符号検定] コマンド......................................165 [符号検定] ダイアログ ボックス ....................165 符号検定レポート ..................................166 未知のデータとデータへのリンク ....................167 [ウィルコクソン符号順位検定] コマンド ....................168 [ウィルコクソン符号順位検定] ダイアログ ボックス ..168 第 3 章: StatTools リファレンス ガイド 23 ウィルコクソン符号順位検定レポート ............... 170 未知のデータとデータへのリンク ................... 170 [マンホイットニー検定] コマンド ......................... 171 [マンホイットニー検定] ダイアログ ボックス........ 171 マンホイットニー検定レポート ..................... 173 未知のデータとデータへのリンク ................... 174 [クラスカル・ウォリス検定] コマンド ..................... 175 [クラスカル・ウォリス検定] ダイアログ .............. 175 クラスカル・ウォリス検定レポート ................. 177 未知のデータとデータへのリンク ................... 178 多変量解析 ............................................... 179 [主成分分析] コマンド ................................... 179 [主成分分析] ダイアログ .......................... 179 スコア プロット .................................. 181 主成分のあるデータセット ......................... 182 未知のデータとデータへのリンク ................... 182 [クラスター分析] コマンド ............................... 183 [クラスター分析] ダイアログ ...................... 184 [クラスター分析] ダイアログ - [オプション] タブ ... 187 クラスター分析レポート ........................... 189 クラスター メンバーシップのあるデータセット....... 190 未知のデータとデータへのリンク ................... 190 [ユーティリティ] メニュー................................. 191 [アプリケーション設定] コマンド ......................... 191 レポート ......................................... 192 ユーティリティ ................................... 194 データセットのデフォルト ......................... 195 分析 ............................................. 195 [データセットの削除] コマンド ........................... 197 [ダイアログ メモリの消去] コマンド ...................... 197 [StatTools アドインのアンロード] コマンド ............... 197 [ヘルプ] メニュー ........................................ 199 ヘルプ .................................................. 199 マニュアル .............................................. 199 [ライセンス認証] コマンド ............................... 199 [StatTools について] コマンド ........................... 200 24 リファレンス: StatTools 関数 201 はじめに ................................................. 201 StatTools 関数と Excel 関数 ..............................201 分布関数 ................................................202 返すことのできる統計 ..............................202 「ライブ」レポート.......................................203 リファレンス: 静的関数の一覧 ............................. 205 利用できる関数の一覧表 ...................................205 関数の詳細な説明.........................................209 AUTOCORRELATION ...................................209 AVEDEV ............................................209 BINOMIAL ..........................................209 CATEGORYINDICIES ..................................209 CATEGORYNAMES .....................................210 CATEGORYOCCURRENCECOUNT ...........................210 CHISQ .............................................210 CORRELATIONCOEFF ..................................210 COUNT .............................................211 COUNTCATEGORIES ...................................211 COUNTCELLSBYTYPE ..................................211 COUNTRANGE ........................................211 COVARIANCE ........................................212 COVARIANCEP .......................................212 DESTACK ...........................................212 DURBINWATSON ......................................212 F .................................................213 GETCELLVALUES .....................................213 KURTOSIS ..........................................213 KURTOSISP .........................................213 LN ................................................214 MAX ...............................................214 MEAN ..............................................214 MEANABS ...........................................214 MEDIAN ............................................215 MIN ...............................................215 MODE ..............................................215 NORMAL ............................................216 PAIRCOUNT .........................................216 PAIRMEAN ..........................................216 PAIRMEDIAN ........................................217 第 3 章: StatTools リファレンス ガイド 25 PAIRSTDDEV ....................................... 217 PERCENTILE ....................................... 218 PRODUCT .......................................... 218 QUARTILE ......................................... 219 RAND ............................................. 219 RANGE ............................................ 219 RUNSTEST ......................................... 219 SKEWNESS ......................................... 220 SKEWNESSP ........................................ 220 STANDARDIZE ...................................... 220 STDDEV ........................................... 220 STDDEVP .......................................... 220 SUM .............................................. 221 SUMDEVSQ ......................................... 221 SUMSQ ............................................ 221 STUDENT .......................................... 221 VARIANCE ......................................... 222 VARIANCEP ........................................ 222 26 はじめに この「StatTools リファレンス ガイド」の章では、StatTools のア イコン、コマンド、および統計関数について説明します。この章は次 の 4 つのセクションで構成されています。 1) リファレンス: StatTools アイコン 2) リファレンス: StatTools の処理の概要 3) リファレンス: StatTools コマンド 4) リファレンス: StatTools 関数 StatTools VBA マクロ言語とデベロッパー ツールキ ット StatTools に用意されている強力な VBA ベースのマクロ言語を使用 して、次のことが行えます。 1) StatTools 分析の自動化。 2) StatTools のデータセット マネージャー、レポート、および グラフを使用する、新しい統計分析機能の開発。カスタムの 計算機能によって、StatTools に組み込まれている処理では 行えない分析を実行できるようになります。これらの分析機 能は必要に応じて StatTools メニューやツールバーに表示す ることもできます。 StatTools VBA マクロ言語とデベロッパー ツールキットに関しては、 付属のオンライン マニュアルを参照してください。 第 3 章: StatTools リファレンス ガイド 27 28 リファレンス: StatTools アイコ ン StatTools ツールバー StatTools アイコンを使用して、データセットを定義してそれらの変 数に対する統計処理を実行します。 Excel 2007 では StatTools リボンに次のアイコンが表示されます。 アイコン 実行される機能と対応コマンド データセットと変数を定義、または既存のデータセッ トと変数を編集または削除 対応コマンド: [データセット マネージャー] コマン ド データ ユーティリティを実行 対応コマンド: [データ ユーティリティ] コマンド サマリー統計処理を実行 対応コマンド: [サマリー統計]コマンド 変数のサマリー グラフを作成 対応コマンド: [サマリー グラフ] コマンド 統計的推定処理を実行 対応コマンド: [統計的推定] コマンド 変数に対する正規性検定を実行 対応コマンド: [正規性検定] コマンド 時系列または予測処理を実行 リファレンス: StatTools アイコン 29 対応コマンド: [時系列と予測] コマンド 回帰または分類処理を実行 対応コマンド: [回帰と分類] コマンド 品質管理処理を実行 対応コマンド: [品質管理] コマンド ノンパラメトリック検定を実行 対応コマンド: [ノンパラメトリック検定] コマンド StatTools ユーティリティを表示 対応コマンド: [ユーティリティ] コマンド StatTools ヘルプ ファイルを表示 対応コマンド: [ヘルプ] コマンド 30 リファレンス: StatTools メニュ ーのコマンド はじめに ここでは [データセット マネージャー] コマンドから開始して、メ ニューに表示されるのと同じ順序で各コマンドについて解説していき ます。これらのコマンドの多くは StatTools アイコンを使っても実 行できます。各 StatTools アイコンに対応するコマンドについては、 この章の「リファレンス: StatTools アイコン」セクションを参照し てください。 一部の StatTools コマンドは、Excel を右クリックすると表示され るポップアップ メニューからもアクセスできます。 リファレンス: StatTools メニューのコマンド 31 32 コマンド一覧 StatTools で使用できる処理は、その特性によりいくつかのグループ に分かれています。StatTools メニューではこれらの各グループが 1 つのアイテムとして表示されます。グループに複数のアイテムがある 場合、そのグループのサブメニューに各アイテムが表示されます。こ のセクションでは、各グループの各処理について概要を説明します。 各処理の詳しい情報は、この章の「リファレンス: StatTools コマン ド」セクションを参照してください。 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 平均値、メジアン、標準偏 差などの一般的尺度およ び、四分位やパーセンタイ ルなどのオプションを含む サマリー統計を生成しま す。 データの冒 頭、途中、 および末尾 で使用可能 ライブ スタック デー タおよび非ス タック データ ○ 無視 1-100 選択した変数セットに対し て相関や共分散のテーブル を作成します。 データの冒 頭、途中、 および末尾 で使用可能 ライブ ○ 無視 1-250 選択した各変数に対して 1 つのヒストグラムを作成し ます。オプションでヒスト グラムのカテゴリ (値域) を定義できます。 データの冒 頭、途中、 および末尾 で使用可能 一部ライブ - グラフの X 軸範囲内 にあるデー タが変わる とグラフが 更新されま す。 スタック デー タおよび非ス タック データ ○ 無視 1-100 選択した変数の各対につき 1 つの散布図を作成しま す。 データの冒 頭、途中、 および末尾 で使用可能 ライブ 非スタック デ ータのみ × 不許可 1-10 単一の箱型図 (1 つの変数 を選択した場合) または複 数の並んだ箱型図 (複数の 変数を選択した場合) を作 成します。 データの冒 頭、途中、 および末尾 で使用可能 ライブ × 無視 1-10 サマリー統計 [1 変数サマリ ー] コマンド [相関と共分散] コマンド 1,600 万ケー スまで使用可 能 非スタック デ ータのみ 1,600 万ケー スまで使用可 能 サマリー グラフ [ヒストグラム] コマンド [散布図] コマ ンド [箱ひげ図] コ マンド リファレンス: StatTools メニューのコマンド 1,600 万ケー スまで使用可 能 32,000 ケース まで使用可能 スタック デー タおよび非ス タック データ 1,600 万ケー スまで使用可 能 33 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 単一の変数の平均値と標準 偏差の信頼区間、または変 数の対の平均値間の差の信 頼区間を計算します。信頼 区間の計算には 1 標本分 析、2 標本分析、または対 標本分析が使用されます。 データの冒 頭、途中、 および末尾 で使用可能 ライブ スタック デー タおよび非ス タック データ ○ 無視 1-250 (1 標本 分析) 1 標本内にある、特定カテ ゴリに属する項目の比率を 分析 (1 標本分析) する か、特定カテゴリ内の項目 の比率について 2 つの標 本を比較 (2 標本分析) し ます。 データの冒 頭、途中、 および末尾 で使用可能 ライブ 1 つの変数の平均値と標準 偏差、または変数の対の平 均値間の差について仮説検 定を実行します。仮説検定 には 1 標本分析、2 標本 分析、または対標本分析を 使用できます。 データの冒 頭、途中、 および末尾 で使用可能 ライブ 1 標本内にある、特定のカ テゴリに属する項目の比率 を分析するか (1 標本分 析)、特定のカテゴリ内の 項目の比率について 2 つ の標本を比較 (2 標本分 析) します。 データの冒 頭、途中、 および末尾 で使用可能 ライブ 指定した半分長を持つ信頼 区間を取得するために必要 な標本サイズを判断しま す。この判断は、平均値、 比率、2 つの平均値間の 差、および 2 つの比率間 の差の信頼区間について行 われます。 該当なし 該当なし 統計的推定 [信頼区間 - 平 均値 / 標準偏 差] コマンド [信頼区間 - 比 率] コマンド [仮説検定 - 平 均値 / 標準偏 差] コマンド [仮説検定 - 比 率] コマンド [標本サイズの 選択] コマンド 34 1,600 万ケー スまで使用可 能 スタック デー タおよび非ス タック データ 2 つ (2 標本分 析また は対標 本分析) ○ 無視 1,600 万ケー スまで使用可 能 スタック デー タおよび非ス タック データ 2 つ (2 標本分 析また は対標 本分析) ○ 無視 1,600 万ケー スまで使用可 能 スタック デー タおよび非ス タック データ 1-250 (1 標本 分析) 2 つ (2 標本分 析また は対標 本分析) ○ 無視 1,600 万ケー スまで使用可 能 該当なし 1-250 (1 標本 分析) 1-250 (1 標本 分析) 2 つ (2 標本分 析また は対標 本分析) 該当な し 該当な し 該当な し 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 [一元配置 ANOVA] コマン ド 2 標本分析を拡張したもの で、2 つの母平均を比較し ます。2 つ以上の平均値が すべて等しいかどうかを検 定します。 データの冒 頭、途中、 および末尾 で使用可能 ライブ スタック デー タおよび非ス タック データ ○ 無視 2-50 二元配置分散分析を実行し ます。通常は、それぞれが 複数の処理レベルで設定さ れた 2 つの要因がある実 験設計のコンテキストにお いて行われます。 不許可 ライブ ○ 不許可 2 つの カテゴ リ変 数、1 つの値 変数 該当な し 該当な し 該当な し [二元配置 ANOVA] コマン ド 1,600 万ケー スまで使用可 能 スタック デー タ 1,600 万ケー スまで使用可 能 バランスの取 れた実験が必 要 [カイ二乗独立 性検定] コマン ド カイ二乗検定を使用して分 割表の行と列の属性が統計 的に独立しているかどうか を検査します。 なし ライブ (た だしテーブ ル サイズ が一定して いること) カイ二乗適合度検 カテゴリ変数の度数分布につ データの冒 ライブ 定 いて適合度の仮説検定を実行 頭、途中、お します。 よび末尾で使 用可能 リファレンス: StatTools メニューのコマンド 該当なし 非スタック デー タのみ 無視 1 35 正規性検定 [カイ二乗検定] コマンド [リリフォース 検定] コマンド [正規 Q-Q プロ ット] コマンド 36 選択した任意の変数につい て正規性のカイ二乗検定を 実行します。 データの冒 頭、途中、 および末尾 で使用可能 一部ライブ (値域の配 置は更新さ れず、値域 内標本数と グラフが更 新されま す) スタック デー タおよび非ス タック データ カイ二乗適合度検定よりも 強力な正規性検定を実行し ます。(強力とは、非正規 性が存在する場合に検出さ れる可能性が高いという意 味です。) データの冒 頭、途中、 および末尾 で使用可能 ライブ スタック デー タおよび非ス タック データ 選択した 1 変数の正規分 位点 (Q-Q) プロットを作 成します。非公式な正規性 検定として使用できます。 データの冒 頭、途中、 および末尾 で使用可能 ライブ ○ 無視 1 ○ 無視 1-10 × 無視 1 1,600 万ケー スまで使用可 能 1,600 万ケー スまで使用可 能 スタック デー タおよび非ス タック データ 1,600 万ケー スまで使用可 能 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 1 つ以上の時系列変数につ いて、同じチャート上に 1 つの時系列プロットを作成 します。 データの冒 頭、途中、 および末尾 で使用可能 ライブ 非スタック デ ータ × 不許可 1-100 時系列変数について任意数 の自己相関を計算し、うち 有意的にゼロでないものは どれかを示します。オプシ ョンとして自己相関のバー グラフ (相関曲線) を作成 します。 データの冒 頭と末尾で 使用可能 ライブ × 不許可 1-10 [ランダム性の 連検定] コマン ド 連検定を行って変数 (通常 は時系列変数) のランダム 性を検査します。 データの冒 頭と末尾で 使用可能 ライブ ○ 不許可 1 つ以 上 [予測] コマン ド 移動平均法、シンプルな指 数平滑法、トレンドを考慮 するホルト指数平滑法、お よび季節性を考慮するウィ ンターズ指数平滑法を使用 して、時系列データの予測 を行います。 データの冒 頭のみで使 用可能 ライブ ○ 不許可 1 つ以 上 複数、段階的、前方、後 方、ブロックの各方法を含 む、さまざまな回帰分析を 実行します。 データの冒 頭、途中、 および末尾 で使用可能 静的 ○ 不許可 1 つの 従属変 数、1250 の 独立変 数 データセットに対してロジ スティック回帰分析を実行 します。これは基本的に、 応答変数が 0 か 1 のバイ ナリ値である、非線形タイ プの回帰分析です。 データの冒 頭、途中、 および末尾 で使用可能 静的 ○ 不許可 1 つの 従属変 数、1250 の 独立変 数 時系列と予測 [時系列グラフ] コマンド [自己相関] コ マンド 32,000 ケース まで使用可能 非スタック デ ータ 32,000 ケース まで使用可能 非スタック デ ータ 1,600 万ケー スまで使用可 能 非スタック デ ータ 32,000 ケース まで使用可能 回帰と分類 [回帰] コマン ド [ロジスティッ ク回帰] コマン ド リファレンス: StatTools メニューのコマンド スタック デー タ 1,600 万ケー スまで使用可 能 スタック デー タ 1,600 万ケー スまで使用可 能 37 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 [判別分析] コ マンド データセットに対して判別 分析を実行します。各観測 が 2 つ以上のグループの うちどれに属するかを指定 する「カテゴリ」変数が 1 つと、グループのメンバー シップを予測するための説 明変数が 1 つ以上必要で す。 データの冒 頭、途中、 および末尾 で使用可能 静的 非スタック デ ータ ○ 従属変 数を除 いては 不許可 1 つの 従属変 数、1250 の 独立変 数 分類されたデータの相対重 要度を判断するためのパレ ート図を作成します。 データの冒 頭、途中、 および末尾 で使用可能 静的 ○ 無視 1 つの カテゴ リ変 数、ま たは 1,600 万ケー スまで使用可 能 品質管理 [パレート図] コマンド 非スタック デ ータ 1 つの 値変数 と 1 つの カテゴ リ変数 [X-R 管理図] コマンド [P 管理図] コ マンド [C 管理図] コ マンド [U 管理図] コ マンド 38 工程が統計的管理状態にあ るかどうかを判断するため の X - R 管理図を作成し ます。 不許可 工程が統計的管理状態にあ るかどうかを判断するため の P 管理図を作成しま す。 不許可 工程が統計的管理内にある かどうかを判断するための C 管理図を作成します。 不許可 工程が統計的管理状態にあ るかどうか判断するための U 管理図を作成します。 不許可 静的 非スタック デ ータ × 不許可 2-25 × 不許可 1 つの 変数 32,000 ケース まで使用可能 静的 非スタック デ ータ 1 つの サイズ 変数 32,000 ケース まで使用可能 静的 非スタック デ ータ × 不許可 1 × 不許可 1 32,000 ケース まで使用可能 静的 非スタック デ ータ 32,000 ケース まで使用可能 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 1 つの変数のメジアン、ま たは変数の対の差のメジア ンについて仮説検定を実行 します。 データの冒 頭、途中、 および末尾 で使用可能 ライブ スタック デー タおよび非ス タック データ ○ 無視 1-250 (1 標本 分析) 符号検定による仮説検定を 実行しますが、対称の確率 分布を仮定条件とします。 データの冒 頭、途中、 および末尾 で使用可能 ライブ データの冒 頭、途中、 および末尾 で使用可能 ライブ 各グループにつき個別の列 に個別の変数を持つデータ セットを、「カテゴリ」列 と「値」列に「スタック 化」します。分析のタイプ によっては、スタック形式 のデータセットの方が非ス タック形式のデータセット よりも作業が行いやすくな ります。 変数内の任 意の箇所で 使用可能 静的 スタック化の正反対の処理 を実行します。 変数内の任 意の箇所で 使用可能 該当なし ノンパラメトリック検定 [符号検定] コ マンド [ウィルコクソ ン符号順位検 定] コマンド [マンホイット ニー検定] コマ ンド 2 つの標本について仮説検 定を実行します。 1,600 万ケー スまで使用可 能 スタック デー タおよび非ス タック データ 2 つ (2 標本分 析また は対標 本分析) ○ 無視 1,600 万ケー スまで使用可 能 スタック デー タおよび非ス タック データ 1-250 (1 標本 分析) 2 つ (2 標本分 析また は対標 本分析) ○ 無視 1,600 万ケー スまで使用可 能 1-250 (1 標本 分析) 2 つ (2 標本分 析また は対標 本分析) データ ユーティリティ [スタック化] コマンド [スタック解除] コマンド リファレンス: StatTools メニューのコマンド 非スタック デ ータのみ × 該当な し 1-100 ○ 該当な し 1-32 65,535 ケース まで使用可能 スタック デー タのみ 1,600 万ケー スまで使用可 能 39 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 [ダミー] コマ ンド 既存の変数に基づきダミー (0-1) 変数を作成します。 変数内の任 意の箇所で 使用可能 ライブ 非スタック デ ータのみ ○ 該当な し 1 数値変数の対、カテゴリお よび数値変数、または 2 つのカテゴリ変数から新し い変数を作成します。 変数内の任 意の箇所で 使用可能 ライブ ○ 不許可 同じデ ータセ ットか らの 232 の変 数 1 つ以上の変数の積、和、 平均、最小、最大、または 最小-最大範囲から新しい 変数を作成します。 変数内の任 意の箇所で 使用可能 ライブ ○ 該当な し 2 つの 値変 数、ま たは [組み合わせ] コマンド [相互作用] コ マンド 1,600 万ケー スまで使用可 能 非スタック デ ータのみ 1,600 万ケー スまで使用可 能 非スタック デ ータのみ 1,600 万ケー スまで使用可 能 1 つの 値変数 と 1 つ のカテ ゴリ変 数、ま たは 2 つの カテゴ リ変数 [遅延] コマン ド [変換] コマン ド [差] コマンド 40 既存の変数に基づいて、新 しい遅延変数を作成しま す。遅延変数とは、元の変 数を遅延に等しい行数だけ 下げたバージョンのことで す。 変数内の任 意の箇所で 使用可能 ライブ 自然対数、二乗、平方根、 逆数の 4 つの非線形変換 のいずれかをユーザーが選 択した任意の変数に適用し て、新しい変数を作成しま す。 変数内の任 意の箇所で 使用可能 ライブまた は静的 元の変数から任意数の差変 数を作成します。 変数内の任 意の箇所で 使用可能 ライブ 非スタック デ ータのみ ○ 無視 1 ○ 無視 1-100 ○ 該当な し 1 1,600 万ケー スまで使用可 能 非スタック デ ータのみ 1,600 万ケー スまで使用可 能 非スタック デ ータのみ 1,600 万ケー スまで使用可 能 処理 説明 未知のデー タ ライブ vs 静的レポー ト データ要件 複数範 囲のデ ータ 無効な データ 変数の 数 [ランダム標本] コマンド 置換あり、または置換なし の抽出法を使って、特定の データセットから任意数の ランダム標本を生成できま す。 変数内の任 意の箇所で 使用可能 静的 スタック デー タのみ ○ 無視 1-32 リファレンス: StatTools メニューのコマンド 1,600 万ケー スまで使用可 能 41 42 StatTools メニュー - データセット [データセット マネージャー] コマンド StatTools データセットと変数を定義、または既存のデータセットと 変数を編集または削除 [データセット マネージャー] コマンドを使って、データセットと変 数を定義します。定義したデータセットと変数は、StatTools 処理を 使って分析することができます。[データセット マネージャー] ダイ アログ ボックスでは、データセットの追加と削除、データセットの 名前の指定、データセット内変数のレイアウトおよび名前の指定を行 うことができます。 データセットと 変数の定義 StatTools は、変数を構成基盤とする一般のスタンドアロン統計ソフ トウェア パッケージと似ています。ほとんどの分析問題ではデータ セット (つまり統計変数のセット) を使用する必要があり、データセ ットは各列の 1 行目に変数名が指定された連続した列で構成されて います。その後、定義したデータセットを使って統計分析を行います。 分析に使うデータを何度も繰り返し選択する必要はありません。 データセット内の変数にはそれぞれ名前と Excel セル範囲が関連付 けられています。選択したレイアウトによって、データセット内の変 数の配置が決まります。変数の典型的な配置は各列につき 1 変数で すが、変数を行ごとに配置することもできます。データセットに複数 のセル ブロックを含めて、同じブックの異なるシートにデータを保 存することもできます。 データセットを定義する場合、StatTools は現在 Excel で選択され ている項目の周りのセル ブロックにある変数を認識しようとします。 これにより、最初の行に変数名が指定され、各列ごとに変数が配置さ れたデータセットの設定を素早く簡単に行うことができます。 データセットの列の長さを均等にする必要はありません。例えば「体 重_男性」と「体重_女性」という 2 つの変数に、それぞれ異なる数 の観察値を持たせることができます。ただし多くの分析問題では、短 い列の空白のセルが StatTools によって未知のデータとして処理さ れます。 リファレンス: StatTools メニューのコマンド 43 [データセット マネージャー] ダイアログ ボッ クス [データセット マネージャー] ダイアログ ボックスの [データセッ ト] オプションには次が含まれています。 • [新規]、[削除] - 新しいデータセットを追加するか、既存の データセットを削除します。 • [名前] - データセットの名前を指定します。 • [Excel 範囲] - データセットに関連付ける Excel 範囲を指 定します。1 つのデータセットに複数のセル範囲が割り当て られている場合、このエントリの前に [複数] というラベル が表示されます。 • [セル書式を適用する] - データセットを識別するグリッドと 色を追加します。 • [複数] - [データセット マネージャー] ダイアログ ボック スの [複数] ボタンをクリックすると、[複数範囲の選択] ダ イアログが表示されます。このダイアログで複数セル範囲の データセットを構成する個々のセル範囲を入力できます。 • 44 [データセット マネージャー] ダイアログ ボックスの [変数] オプ ションには次があります。 • • [レイアウト] - データセットが保管されている Excel 範囲 の変数の構造を指定します。[レイアウト] では次のオプショ ンを使用できます。 - [列] - これは典型的なレイアウトで、データセットの Excel 範囲内の各列に 1 つの変数のデータが含まれま す。多くの場合、各列の一番上に変数の名前を含めます。 - [行] - このレイアウトでは、データセットの各行に 1 つの変数のデータが含まれます。このレイアウトは通常、 Excel の時系列に使用されます。 [1 列 (行) 目に名前を含める] - データセット内の変数の名 前を、列の一番上 ([行] レイアウトを選択した場合は行の一 番左) に含めるには、このオプションを選択します。 リファレンス: StatTools メニューのコマンド 45 [変数] オプショ ン [データセット マネージャー] ダイアログ ボックスにあるグリッド 内の各行に、1 つのデータセット内の変数が一覧表示されます。これ には各変数の名前、変数のデータ ポイントが入っている Excel 範囲、 お よび Excel 式 でこ の変 数のデ ータ を識別 する ために 使わ れる Excel 範囲名が含まれます。 • [Excel 範囲名] - ここに表示される範囲名が、StatTools レ ポートとグラフで作成される Excel 式に使用されます。これ らの数式により、変数のデータが変わるとレポートが自動更 新される「ライブ」機能を利用できるようになります。わか りやすい範囲名を付けると、後で数式が解釈しやすくなりま す。 • [出力書式] - StatTools 分析で作成されるレポート内の変数 値の表示に使用する書式を指定します。[自動] を指定すると、 この変数の値を含む Excel セルに適用される数値書式に基づ いて、StatTools が最適な書式を自動的に選択します。また は [出力書式] エントリの隣にある矢印をクリックして、特 定の書式を選択することもできます。 [標準] は、Excel の「標準」数値書式に相当します。[固定] を選択すると、[小数点以下桁数] に入力した値に基づいて表 示精度が設定されます。[通貨] は、Excel の「通貨」数値書 式と同じですが、[小数点以下桁数] に入力した値を使って表 示精度が設定されます。 注意:「書式(小数点以下桁数)」という表記 (例: 「Currency(4)」) を使用して、必要な出力書式を [データセ ット マネージャー] ダイアログに直接入力することもできま す。 46 データセットと 変数のデータ容 量 StatTools では各セッションにつき次の使用が許可されます。 • 1 つのブック内にある最大 256 個のデータセット。 • 各データセットにつき最大 256 個の変数。1 つのデータセッ トにある全データが同じブック内にあること。 • 各変数につき最大 16,777,216 個のデータ ポイント。 実際のデータ容量は、お使いのシステム構成や Excel のバージョン によって上記より少なくなる場合があります。StatTools の分析処理 によっても制限が異なります。Excel 自体のメモリ制限によりデータ 容量が影響を受ける場合もあります。 注意: [データセット マネージャー] ダイアログ ボックスには、ア クティブなブック (このダイアログ ボックスのタイトルに表示され るブック) 内のすべてのデータセットと変数が表示されます。ほかの ブックのデータセットを表示するには、まず Excel で該当するブッ クをアクティブにしてから、[データセット マネージャー] ダイアロ グを表示します。 リファレンス: StatTools メニューのコマンド 47 48 [データ ユーティリティ] メニュー [スタック化] コマンド 一連の変数を非スタック形式からスタック形式に変換 [スタック化] コマンドを使用して、データセットに 2 つ以上の値変 数が含まれる「非スタック」形式のデータを、データセットに 1 つ のカテゴリ変数と 1 つの値変数が含まれる「スタック」形式のデー タに変換することができます。例えば、非スタック形式のデータを使 用してさまざまな地区の 1 世帯当たり平均収入を比較している場合、 各地区につき個別の「収入」変数 (つまり列) が設定されます。これ らの列は長さが均等である必要はありません。したがって、各地区ご とに異なる標本サイズを指定することが可能です。これがスタック形 式のデータでは、「収入」という値変数と、「地区」というカテゴリ 変数を設定することで各世帯がどの地区に属するかを示します。 この処理を利用して、変数を値列 (ここでは「収入」) とカテゴリ列 (ここでは「地区」) の 2 列のスタックとして構成することができま す。分析のタイプによっては、スタック形式のデータセットの方が非 スタック形式のデータセットよりも作業が行いやすくなります。 スタック変数と 非スタック変数 リファレンス: StatTools メニューのコマンド 49 [スタック化ユー ティリティ] ダ イアログ ボック ス 変数のスタック化には [スタック化ユーティリティ] ダイアログ ボ ックスを使います。 スタック化を行うには少なくとも 2 つ以上の変数が選択されている 必要があります。選択したデータセットは、最初は常に非スタック データとして扱われます。異なるデータセットからの変数を使用でき ます。 [スタック化ユーティリティ] ダイアログでは次のオプションを使用 できます。 • [スタック変数名] - 2 つの変数から成るスタック データセ ットを構成する、カテゴリ変数と値変数の名前を指定します。 これらの名前はカテゴリ変数と値変数の列の一番上に表示さ れます。 [OK] をクリックすると、変数がスタック化されてスタック データ用 に新しいデータセットが作成されます。 カテゴリ変数と 値変数 スタック形式のデータセットにはカテゴリ変数と値変数が必要です。 カテゴリ変数 (「コード」変数とも呼ばれます) は、関連のある一連 の値変数を識別するための ID です。多くの場合、カテゴリ変数はテ キスト ラベルです。これに対して値変数 (「測定」変数とも呼ばれ ます) は、統計的処理で分析が可能な標準の数値変数です。 分析用に選択す るスタック形式 の変数の数 StatTools の処理により分析用に選択できる変数の数が制限され、そ の変数がスタック形式である場合、この制限はカテゴリ変数における カテゴリの数に適用されます。 スタック形式では通常 1 つのカテゴ リと 1 つの値変数を選択するので、分析用にそのカテゴリ変数に含 まれる各カテゴリに対応する複数の変数が指定されることになります。 50 [スタック解除] コマンド 一連の変数をスタック形式から非スタック形式に変換 [スタック解除] コマンドは、[スタック化] コマンドの正反対の処理 を実行します。例えば、「性別」というカテゴリ変数と「体重」とい う値変数に対してこのコマンドを実行すると、「体重_男性」と「体 重_女性」という個別の非スタック形式の列に変換されます。 [スタック解除ユ ーティリティ] ダイアログ ボッ クス 変数のスタック解除には [スタック解除ユーティリティ] ダイアログ ボックスを使います。 選択したデータセットは、最初は常にスタック データとして扱われ ます。スタック解除を行うには少なくとも 2 つ以上の変数が選択さ れている必要があります。これらの変数のうち 1 つをカテゴリ変数 として指定し ([カテ] をチェックします)、1 つ以上を値変数として 指定します ([値] をチェックします)。異なるデータセットからの変 数を使用できます。 [OK] をクリックすると、変数のスタック形式が解除されて非スタッ ク データ用に 1 つ以上の新しいデータセットが作成されます。 リファレンス: StatTools メニューのコマンド 51 [変換] コマンド 1 つ以上の変数を、入力された変換関数に基づき新しい変数と値に変 換 [変換] コマンドを使用して、自然対数、二乗、平方根、逆数の 4 つ の変換手法のいずれかを用いて任意の変数を変換できます。また、変 換後の変数値を計算するために使用する数式を入力することもできま す。 変換後の変数の基になった変数に未知の値がある場合、変換後の変数 にもこれに対応する未知の値が含まれます。 [変換ユーティリ ティ] ダイアロ グ ボックス 変数の変換には [変換ユーティリティ] ダイアログ ボックスを使い ます。 選択されたデータセットは、常に非スタック データです。1 度に変 換できるのは、1 つのデータセットからの変数のみです。 52 [変換ユーティリティ] ダイアログでは次のオプションを使用できま す。 • [変換] - 新しい変換値を生成する際に、選択された変数の各 値に対して実行する数学演算です。組み込みの変換関数には、 自然対数、二乗、平方根、および逆数があります。数学的表 現に基づいて新しい変数値を計算する、次のようなカスタム の数式を入力することもできます。 (Variable*1.5)^2 この等式の「Variable」というキーワードは、実際に変換さ れる変数の値の代わりにプレースホルダとして使われている 点に注意してください。 変換された新規 変数のあるデー タセット リファレンス: StatTools メニューのコマンド 53 [遅延] コマンド 既存の変数に基づいて遅延変数を作成 [遅延] コマンドを使用して、既存の変数に基づいて遅延変数を作成 できます。遅延変数とは、元の変数を遅延に等しい行数だけ下げたバ ージョンのことです。例えば、1998 年 11 月付け売上データを 3 つ 遅延したバージョンは、その 3 か月前の 1998 年 8 月付けデータに なります。 [遅延ユーティリ ティ] ダイアロ グ ボックス 変数を遅延させるには [遅延ユーティリティ] ダイアログ ボックス を使います。 選択されたデータセットは、常に非スタック データです。1 度に遅 延できる変数の数は 1 つだけです。 変数の [遅延ユーティリティ] ダイアログ ボックスでは次のオプシ ョンを使用できます。 • 54 [遅延の数] - これは変数を新規作成する際に値を遅延させる 周期の数です。入力した遅延の数だけ、各遅延につき新しい 変数が作成されます。 元のデータセッ トの右に表示さ れた遅延変数 リファレンス: StatTools メニューのコマンド 55 [差] コマンド 元の変数から任意数の差変数を作成 [差] コマンドを使用して、元の変数から任意数の差変数を作成でき ます。このコマンドは主に時系列変数に使用されます。このコマンド では差変数を作成する元の変数および、その回数 (通常は 1 または 2) をユーザーが選択します。すると、指定した数の差変数が新規作 成されます。各差変数には、選択した変数の差が含まれています。例 えば月次データの場合、1997 年 3 月の差分値は元の 1997 年 3 月 から 1997 年 2 月の値を引いたものです。これと同様に、2 回目の 差変数の作成を指定した場合には、これに最初に求めた差間の差が含 まれます。 差分計算は通常、元の変数が時間の経過に伴い変化する (つまり定常 的でない) 場合に時系列分析で使われます。例えば、上昇傾向のある 時系列は定常性に欠けています。その場合は差分を使うことによって 定常性を確保できます。2 回目の差分取得が役立つこともありますが、 あまり頻繁には使われません。また、3 回目以降の差分取得が必要に なることはほとんどありません。 [差ユーティリテ ィ] ダイアログ ボックス 差変数の作成には [差ユーティリティ] ダイアログ ボックスを使い ます。 選択されたデータセットは、常に非スタック データです。差変数の 作成に 1 度に使用できる変数は 1 つだけです。 56 [差ユーティリティ] ダイアログでは次のオプションを使用できます。 • [差の数] - 作成する差の数を指定します。 差変数のあるデ ータセット リファレンス: StatTools メニューのコマンド 57 [相互作用] コマンド 1 つ以上の元の変数から 1 つの相互作用変数を作成 [相互作用] コマンドを使用して、1 つ以上の元の変数から 1 つの相 互作用変数を作成できます。相互作用変数は、2 つの数値変数、1 つ の数値変数と 1 つのカテゴリ変数、または 2 つのカテゴリ変数から 作成できます。 両方の変数が数値 (つまりカテゴリでない) の場合、それらの積が作 成されます。一方の変数が数値でもう片方がカテゴリの場合、数値変 数および、カテゴリ変数のカテゴリに対応する各ダミー変数の積が作 成されます。両方の変数がカテゴリの場合、これらのカテゴリ変数か らのダミーのすべての対の積が作成されます。 [相互作用ユーテ ィリティ] ダイ アログ ボックス 相互作用変数の作成には [相互作用ユーティリティ] ダイアログ ボ ックスを使います。 選択されたデータセットは、常に非スタック データです。相互作用 変数の作成には 1 度に 1 つ以上の変数を使用できます。 [相互作用ユーティリティ] ダイアログでは次のオプションを使用で きます。 • 58 [次の項目間の相互作用] - 選択する各変数のタイプを指定し ます。[2 つの数値変数]、[1 つの数値変数および 1 つのカ テゴリ変数]、または [2 つのカテゴリ変数] を選択できます。 相互作用変数の 作成方法 相互作用変数は、ダイアログで指定された 2 つの変数から作成され ます。この 2 つの変数には 3 つの基本的な組み合わせがあります。 最初の組み合わせは、両方の変数が数値の「測定」変数である場合で す。その場合、相互作用変数はこれらの変数の積となります。2 番目 の組み合わせは、1 つの変数が数値の「測定」変数で、もう 1 つが カテゴリ変数の場合です。その場合、StatTools がカテゴリ変数の各 カテゴリにつき内部的にダミー変数を作成し、その各ダミー変数に数 値変数を掛け合わせます。3 番目の組み合わせは、両方の変数がカテ ゴリ変数である場合です。その場合、StatTools がそれぞれのカテゴ リ変数の各カテゴリにつき内部的にダミー変数を作成し、最初のカテ ゴリ変数の各ダミー変数に、2 番目の変数の各ダミー変数を掛け合わ せます。例えば、カテゴリがそれぞれ 2 つと 5 つあるカテゴリ変数 を 2 つ指定した場合、StatTools によって合計 10 個 (2x5) の相互 作用変数が作成されます。 相互作用変数の あるデータセッ ト リファレンス: StatTools メニューのコマンド 59 [組み合わせ] コマンド 1 つ以上の元の変数から 1 つの組み合わせ変数を作成 [組み合わせ] コマンドを使用して、1 つ以上の元の変数から 1 つの 組み合わせ変数を作成できます。組み合わせ変数は、1 つ以上の変数 の積、和、平均、最小、最大、または最小-最大範囲を求めることに より作成されます。 [組み合わせユー ティリティ] ダ イアログ ボック ス 組み合わせ変数の作成には [組み合わせユーティリティ] ダイアログ ボックスを使います。 選択されたデータセットは、常に非スタック データです。組み合わ せ変数の作成には 1 度に 1 つ以上の変数を使用できます。 [組み合わせユーティリティ] ダイアログでは次のオプションを使用 できます。 • 60 [組み合わせのタイプ] - 組み合わせ変数を作成する際に、選 択された変数に対して実行する数値演算を指定します。積、 和、平均値、最小、最大、または最小-最大範囲のいずれかを 指定できます。 組み合わせ変数 のあるデータセ ット リファレンス: StatTools メニューのコマンド 61 [ダミー] コマンド 既存の変数に基づいてダミー (0-1) 変数を作成 [ダミー] コマンドを使用して、既存の変数に基づくダミー (0-1) 変 数を作成します。次の 2 つのオプションがあります。 カテゴリ変数の各カテゴリにつき 1 つのダミー変数を作成します。 例えば、自動車の「製造国」というカテゴリ変数があり、そのカテゴ リが「米国」、「ヨーロッパ」、「アジア」である場合、このコマン ドにより「製造国_米国」、「製造国_ヨーロッパ」、「製造国_アジ ア」という 3 つのダミー変数が作成されます。 1 つの数値変数から、ユーザーが指定するカットオフ値に基づく 1 つのダミー変数を作成できます。例えば、「重量」という変数がある 場合、「重量 <= 160」という条件を満たすダミー変数を作成するこ とができます。すると「重量 > 160」の場合に値が 0 となり、「重 量 <= 160」の場合に値が 1 となる、1 つの変数が新規追加されます。 [ダミー ユーテ ィリティ] ダイ アログ ボックス ダミー変数の作成には [ダミー ユーティリティ] ダイアログ ボック スを使います。 選択されたデータセットは、スタック データと非スタック データの 両方の場合があります。ダミー変数の作成に 1 度に使用できる変数 は 1 つです。 62 [ダミー ユーティリティ] ダイアログでは次のオプションを使用でき ます。 • [オプション] - ダミー変数の作成方法を選択します。1) カ テゴリ変数の各カテゴリに対してダミー変数を作成するか、 2) 数値変数から 1 つのダミー変数を作成するかを指定でき ます。[条件] は、0-1 のダミー変数に数値を割り当てる際に 使用されるカットオフ (境界値) を指定します。 ダミー変数のあ るデータセット リファレンス: StatTools メニューのコマンド 63 [ランダム標本] コマンド 選択された変数から任意数のランダム標本を生成 [ランダム標本] コマンドを使用して、選択した変数から任意数のラ ンダム標本を生成できます。各標本につき標本の数とサイズを指定す ると、選択された変数から StatTools が標本を生成します。複数の 変数から独立または依存的に標本を抽出したり、置換の有無を指定し て標本抽出を行うこともできます。 [ランダム標本ユ ーティリティ] ダイアログ ボッ クス ランダム標本の作成には [ランダム標本ユーティリティ] ダイアログ ボックスを使います。 選択されたデータセットは、常に非スタック データです。ランダム 標本の生成には 1 度に 1 つ以上の変数を使用できます。 64 [ランダム標本ユーティリティ] ダイアログでは次のオプションを使 用できます。 • [標本数] と [標本サイズ] - 選択した各変数につきここで指 定した数の標本が生成され、各標本に標本サイズに等しい数 の要素が含められます。 • [置換を使って抽出する] - 標本抽出後に値を元の母集団に 「戻す」ことで、標本を再度抽出できるように指定します。 [置換を使って抽出する] を選択しない場合 (つまり置換を使 わずに抽出する場合)、値が元の母集団に戻されないため標本 を再抽出できなくなります。 • [複数の変数を独立して抽出する] - 各変数の各標本を独立し て抽出するよう指定します。このオプションを選択しない場 合、各標本値につきすべての変数で同じ抽出インデックス (1 から変数内の値数の間の数) が使用されます。 生成されたラン ダム標本 リファレンス: StatTools メニューのコマンド 65 66 [サマリー統計] メニュー [サマリー統計] メニューのコマンドを使用して、単一の変数または 対になった変数の数値集約尺度を計算できます。StatTools の処理に は分割表がない点に注意してください。この機能は Excel のピボッ ト テーブルにすでに備わっています。 [1 変数サマリー] コマンド 変数のサマリー統計を計算 [1 変数サマリー] コマンドは、任意数の選択された数値変数に関す るサマリー データを提供します。このデータには、平均値、メジア ン、標準偏差、分散、最小、最大、範囲、第 1 四分位、第 3 四分位、 四分位範囲、平均絶対偏差、歪度、尖度、カウント、和、および選択 されたパーセンタイルが含まれます。 [1 変数サマリー 統計] ダイアロ グ ボックス この分析を設定するには [1 変数サマリー統計] ダイアログ ボック スを使います。 分析対象として 1 つ以上の変数を選択できます。選択されたデータ セットは、スタック データと非スタック データの両方の場合があり ます。異なるデータセットからの変数を使用できます。 リファレンス: StatTools メニューのコマンド 67 [1 変数サマリー統計] ダイアログでは次のオプションを使用できま す。 • 1 変数サマリー レポート 68 [レポートするサマリー統計] - レポートに含める統計を選択 します。パーセンタイルは必要な値を入力することで追加で きます。 1 変数サマリー レポートは、StatTools の統計関数 (StatSkewness など) を用いてデータにホットリンクされています。レポートは、 [アプリケーション設定] コマンドで指定した場所に配置されます。 未知のデータと データへのリン ク • 未知のデータ - この処理では未知のデータがケースごとに許可 されます。つまり、集約尺度を計算する際、各変数につきその変 数の未知のデータが無視されます。(これは Excel のデフォルト の処理方法です。例えば、範囲に対して AVERAGE 関数を使用す る場合、その範囲内の数値のみが平均されます。) • データへのリンク - すべての集約尺度が、データにリンクされ ている数式を使って計算されます。したがって、データが変更さ れると集約尺度も自動的に更新されます。 リファレンス: StatTools メニューのコマンド 69 [相関と共分散] コマンド 変数間の相関テーブルまたは共分散テーブルを作成 [相関と共分散] コマンドは、選択された数値変数の任意のセットの 間に存在する相関または共分散のテーブルを作成します。両方のテー ブルが対称 (X と Y の相関が Y と X の相関に等しいこと) なので、 (1) 対角線の下にある相関 (または共分散) のみを表示する、(2) 対 角線の上にあるもののみを表示する、または (3) 対角線の上下両方 にあるものを表示する、のいずれかを選択できます。 [相関と共分散] ダイアログ ボッ クス この分析の設定には [相関と共分散] ダイアログ ボックスを使いま す。 分析対象として 2 つ以上の変数を選択する必要があります。選択さ れたデータセットは、非スタック データでなければなりません。異 なるデータセットからの変数を使用できます。 70 [相関と共分散] ダイアログでは次のオプションを使用できます。 相関と共分散レ ポート • [作成するテーブル] - 作成する相関テーブルまたは共分散テ ーブルを選択します。 • [テーブル構造] - 作成するテーブルの構造を指定します。 - [対称] - 対角線の上下両方にある相関 (または共分散) を表示します。 - [対角線の上のエントリのみ] - 対角線の上にある相関 (または共分散) のみを表示します。 - [対角線の下のエントリのみ] - 対角線の下の相関 (ま たは共分散) のみを表示します。 相 関 と 共 分 散 レ ポ ー ト は 、 StatTools の 統 計 関 数 ( 例 え ば StatCorrelationCoeff) を使用してデータにホットリンクされていま す。レポートは [アプリケーション設定] コマンドで指定した場所に 配置されます。 リファレンス: StatTools メニューのコマンド 71 未知のデータと データへのリン ク 72 • 未知のデータ - 未知のデータが許可され、対単位で処理されま す。つまり、任意の変数の対の間の相関 (または共分散) を求め る場合、2 つの変数のどちらかに未知データのある全ケースが無 視されます。 • データへのリンク - 相関と共分散が、データにリンクされてい る数式により計算されます。したがって、データが変更されると 集約尺度も自動的に更新されます。 [サマリー グラフ] メニュー [サマリー グラフ] メニューのコマンドを使用して、Excel のグラフ ウィザードでは生成するのが困難な、統計分析に非常に役立つさまざ まなグラフを作成することができます。ただし、Excel にも多岐にわ たるグラフ機能が用意されているため、StatTools では Excel には ないグラフ機能を主にカバーしています。 [ヒストグラム] コマンド 変数のヒストグラムを作成 [ヒストグラム] コマンドは、選択した各変数について 1 つのヒスト グラムを作成します。オプションでヒストグラムのカテゴリ (「値 域」とも呼ばれます) を定義して、グラフ上に明示することができま す。また各ヒストグラムの基準となる頻度テーブルも作成できます。 [ヒストグラム] ダイアログ ボッ クス このタイプのグラフの設定には [ヒストグラム] ダイアログ ボック スを使います。 グラフの対象として 1 つ以上の変数を選択できます。選択されたデ ータセットは、スタック データと非スタック データの両方の場合が あります。異なるデータセットからの変数を使用できます。 リファレンス: StatTools メニューのコマンド 73 [ヒストグラム] ダイアログでは次のオプションを使用できます。 74 • [値域数] - グラフの範囲内で計算されたヒストグラムの間隔 の数を設定します。入力する値は 1~200 の範囲内でなけれ ばなりません。[自動] を選択すると、内部ヒューリスティク スに基づいてデータに最適な値域の数が計算されます。 • [ヒストグラムの最小] - ヒストグラムの値域が開始する最小 値を設定します。[自動]を選択すると、StatTools がグラ フの対象データの最小値に基づいてヒストグラムの値域を自 動的に開始します。 • [ヒストグラムの最大] - ヒストグラムの値域が終了する最大 値を設定します。[自動]を選択すると、StatTools がグラ フの対象データの最大値に基づいてヒストグラムの値域を自 動的に終了します。 • [X 軸] - [カテゴリ] または [数値] を選択します。カテゴ リの X 軸は、値域のラベルとしてその中央値を使用します。 数値の X 軸には「読み取り可能」な X 軸最小値と最大値が あり、Excel 標準のスケール変更オプションを使って再スケ ールすることができます。 • [Y 軸] - Y 軸に使用する尺度の単位として、[頻度]、[相対 頻度]、または [確率密度] を選択します。頻度は 1 値域内 の実際の観測数です。相対頻度は、値域の範囲内で値が発生 する確率 (値域内の観測数÷合計観測数) です。密度は相対 頻度の値を値域の幅で除算したもので、値域の数が変化して も Y 軸の値を一定に保つ役割を果たします。 単一変数のヒス トグラム 未知のデータと データへのリン ク • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知データがあるすべての行が無視されます。 • データへのリンク - ヒストグラムは一部データにリンクされて います。データが変更され、新しい値が元のヒストグラムの値域 範囲内にある場合には、グラフが自動的に更新されます。データ 変更の結果、値域の再設定が必要になった場合、グラフは更新さ れません。 リファレンス: StatTools メニューのコマンド 75 [散布図] コマンド 変数の対について散布図を作成 [散布図] コマンドは、選択した変数の各対につき 1 つの散布図を作 成します。散布図は Excel の XY グラフ オプションでも作成できま すが、Excel では最初 (一番左) の変数が自動的に横軸に配置されま す。ただし、場合によってはこれが適さないこともあります。 StatTools ではどの変数を横軸に配置するかをユーザーが選択できま す。各散布図は、2 つの変数間の相関をそれぞれ対応するプロットで 示します。 [散布図] ダイア ログ ボックス このタイプのグラフの設定には [散布図] ダイアログ ボックスを使 います。 グラフの対象として 2 つ以上の変数を選択できます。少なくとも 1 つの X 軸変数と 1 つの Y 軸変数が必要です。3 つ以上の変数を選 択した場合、複数の散布図が作成されます。選択されたデータセット は、非スタック データでなければなりません。異なるデータセット からの変数を使用できます。 76 [散布図] ダイアログでは次のオプションを使用できます。 • [相関係数を表示する] - グラフ上の変数間の相関係数を表示 するよう指定します。 • [管理図のタイプ] - 生成するグラフのタイプを選択します。 次のオプションがあります。 [シンプルな XY グラフ] - 一般的な Excel 風の散布図を生 成します。 [カテゴリ変数で分類] - 散布図に表示されるデータ ポイン トが、追加のカテゴリ変数での指定どおり所属カテゴリに応 じて色分けされます。 散布図の例 未知のデータと データへのリン ク • 未知のデータ - 未知のデータが許可されます。任意の対にある 選択された 2 つの変数のいずれかで未知データがあるすべての 行が無視されます。 • データへのリンク - 散布図は一部元のデータにリンクされてい ます。データが変更されると、散布図も更新されます。ただし、 選択された変数の範囲が大幅に変わる場合には、軸のスケールを 手動で更新する必要があります。 リファレンス: StatTools メニューのコマンド 77 [箱ひげ図] コマンド 変数の箱ひげ図を作成 [箱ひげ図] コマンドは、単一の箱ひげ図 (1 つの変数を選択した場 合) または複数の並んだ箱ひげ図 (複数の変数を選択した場合) を作 成します。また、箱ひげ図の作成に使用されるサマリー統計 (四分位 や四分位範囲など) が含まれたシートも作成します。 [箱ひげ図] ダイ アログ ボックス このタイプのグラフの設定には [箱ひげ図] ダイアログ ボックスを 使います。 グラフの対象として 1 つ以上の変数を選択できます。選択されたデ ータセットは、スタック データと非スタック データの両方の場合が あります。異なるデータセットからの変数を使用できます。 78 [箱ひげ図] ダイアログでは次のオプションを使用できます。 • • • [図の要素を説明するキーを含める] - グラフの下に図の各要 素を説明する個別のキーを表示するよう指定します。 [データセットにおける外れ値の特定] - データセットに追 加の列を挿入し、観測値が外れ値であるかどうか、および外 れ値の場合にはそのタイプを示します。 [方向] - 次の 2 つのオプションを使用できます。 [横] オプション (デフォルト設定) は、箱を X 軸の方向に 沿って表示します。 [縦] オプションは、箱を Y 軸の方向に沿って表示します。 箱ひげ図の例 リファレンス: StatTools メニューのコマンド 79 未知のデータと データへのリン ク 80 • 未知のデータ - 未知のデータが許可されます。グラフの対象と して選択された変数のいずれかに未知のデータがある、すべての 行が無視されます。 • データへのリンク - 作成された箱ひげ図は元のデータにリンク されています。データを変更すると、箱ひげ図も更新されます。 ただし、データのスケールが大幅に変わる場合には、横軸のスケ ールを手動で更新する必要があります。 [統計的推定] メニュー [統計的推定] メニューのコマンドは、最もよく使われる統計的推定 分析を実行します。これには信頼区間と仮説検定、および一元・二元 配置 ANOVA が含まれます。 [信頼区間 - 平均値 / 標準偏差] コマンド 変数の平均値と標準偏差の信頼区間を計算 平均値 / 標準偏差の信頼区間コマンドは、1 つの変数の平均値と標 準偏差の信頼区間、または変数の対の平均値間の差の信頼区間を計算 します。信頼区間の計算には 1 標本分析、2 標本分析、または対標 本分析が使用されます。 [平均値 / 標準 偏差の信頼区間] ダイアログ ボッ クス この分析の設定には [平均値 / 標準偏差の信頼区間] ダイアログ ボ ックスを使います。 選択する変数の数は [分析のタイプ] の選択内容により異なります。 1 標本分析には 1 つ以上の変数が必要ですが、2 標本分析および対 標本分析には 2 つの変数が必要です。選択されたデータセットは、 スタック データと非スタック データの両方の場合があります。異な るデータセットからの変数を使用できます。 リファレンス: StatTools メニューのコマンド 81 [信頼区間] ダイアログでは次のオプションを使用できます。 • [分析のタイプ] - 実行する分析のタイプを選択します。次の オプションがあります。 - [1 標本分析] - 単一の数値変数の信頼区間を計算しま す。 - [2 標本分析] - 2 つの独立母集団からの平均値の間の 差の信頼区間を計算します。 - [対標本分析] - 2 標本分析と基本的に同じですが、2 つの変数が自然な対 (ペア) を成す場合に適しています。 対の間の差に対して 1 標本分析を実行します。 [入力タイプ] - 分析の実行に使用できる情報のタイプを選択します。 次のオプションがあります。 • [データセット] - データセットがある場合に選択します。 • [サマリー統計] - データセットがなく、データセットに関す る何らかの統計情報を使用できる場合に選択します。 [既知の母標準偏差] - 母集団の標準偏差がわかっている場合に選択 します • 82 [計算する信頼区間] - 選択した変数について計算する信頼区 間を指定します。使用できるオプションは、選択した分析の タイプによって異なります。 - [1 標本分析] - 平均値または標準偏差、あるいはその 両 方 の 信 頼 区 間 お よ び 、 そ れ ぞ れ の 信 頼 水 準 (0 ~ 100%) を計算します。 - [2 標本分析] または [対標本分析] - 2 つの変数の平 均値間の差の信頼区間を計算し、必要な信頼水準 (0 ~ 100%) を指定します。 信頼区間レポー ト 未知のデータと データへのリン ク • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更される と、出力も自動的に変更されます。 リファレンス: StatTools メニューのコマンド 83 [信頼区間 - 比率] コマンド 比率の信頼区間を計算 [信頼区間 - 比率] コマンドを使用して、1 標本内にある、特定のカ テゴリに属する項目の比率を分析 (1 標本分析) したり、特定のカテ ゴリ内の項目の比率について 2 つの標本を比較 (2 標本分析) する ことができます。この処理でサポートされるデータ タイプは、母集 団の標本、カウント付きサマリー テーブル、および比率付きサマリ ー テーブルの 3 つです。 [比率の信頼区 間] ダイアログ ボックス この分析の設定には [比率の信頼区間] ダイアログ ボックスを使い ます。 選択する変数の数は [分析のタイプ] の選択内容により異なります。 1 標本分析を行うには 1 つ以上の標本が必要ですが、2 標本分析を 行うには 2 つの標本が必要です。数 (カウント) または % (比率) という列を使って標本情報のある変数を選択するか、母集団の標本デ ータ タイプの場合はラベルなしの列を使用します。(母集団の標本デ ータがスタック形式の場合、C1 と C2 というラベルの列で標本を選 択します。ここで C1 にはスタック形式のカテゴリが含まれます。) 84 データがカウントまたは比率付きのテーブル形式の場合、カテゴリ名 のある変数を 1 つ選択するための [カテ] という列もあります。 母集団の標本データ タイプの変数では、異なるデータセットからの 変数を使用できます。 [信頼区間] ダイアログでは次のオプションを使用できます。 • [分析のタイプ] - 実行する分析のタイプを選択します。次の オプションがあります。 - [1 標本分析] - 特定のカテゴリに属する 1 標本内の項 目の比率の信頼区間を計算します。 - [2 標本分析] - 特定のカテゴリにある項目の比率につ いて 2 標本の信頼区間を計算します。 • [データ タイプ] - 分析するデータのタイプを母集団の標本、 カウント付きサマリー テーブル、および比率付きサマリー テーブルのいずれかに指定します。 • [オプション] - 使用できるオプションは、[分析のタイプ] と [データ タイプ] の選択内容によって異なります。次のオ プションがあります。 - [信頼水準] - 分析の信頼水準 (0 ~ 100%) を選択しま す。 - [第 1 標本サイズ] と [第 2 標本サイズ] - データ タ イプが [比率付きサマリー テーブル] の場合、第 1 標 本と第 2 標本 (2 標本分析のみ) のサイズを選択しま す。 リファレンス: StatTools メニューのコマンド 85 信頼区間レポー ト 未知のデータと データへのリン ク 86 • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更された 場合、出力も自動的に変更されます。 [仮説検定 - 平均値 / 標準偏差] コマンド 変数の平均値と標準偏差の仮説検定を実行 [仮説検定 - 平均値 / 標準偏差] コマンドは、1 つの変数の平均値 と標準偏差の信頼区間、または変数の対の平均値間の差の仮説検定を 実行します。仮説検定には 1 標本分析、2 標本分析、または対標本 分析が使用されます。 [平均値 / 標準 偏差の仮説検定] ダイアログ ボッ クス この分析の設定には [平均値 / 標準偏差の仮説検定] ダイアログ ボ ックスを使います。 選択する変数の数は [分析のタイプ] の選択内容により異なります。 1 標本分析には 1 つ以上の変数が必要ですが、2 標本分析および対 標本分析には 2 つの変数が必要です。選択されたデータセットは、 スタック データと非スタック データの両方の場合があります。異な るデータセットからの変数を使用できます。 リファレンス: StatTools メニューのコマンド 87 [平均値 / 標準偏差の仮説検定] ダイアログでは次のオプションを使 用できます。 • • 88 [分析のタイプ] - 実行する分析のタイプを選択します。次の オプションがあります。 - [1 標本分析] - 単一の数値変数について仮説検定を実 行します。 - [2 標本分析] - 2 つの独立母集団からの平均値の間の 差について仮説検定を実行します。 - [対標本分析] - 2 標本分析と基本的に同じですが、2 つの変数が自然な対 (ペア) を成す場合に適しています。 対の間の差について 1 標本分析を実行します。 [入力タイプ] - 分析の実行に使用できる情報のタイプを選 択します。次のオプションがあります。 - [データセット] - データセットがある場合に選択し ます。 - [サマリー統計] - データセットがなく、データセッ トに関する何らかの統計情報を使用できる場合に選 択します。 • [既知の母標準偏差] - 母集団の標準偏差がわかっている場 合に選択します • [実行する仮説検定] - 選択した変数について実行する仮説検 定を指定します。使用できるオプションは、選択した分析の タイプによって異なります。1 標本分析では、平均値または 標準偏差についての仮説検定を選択します。2 標本分析また は対標本分析では、2 つの変数の平均値間の差についての仮 説検定を選択します。選択した各タイプの仮説検定について 次のオプションがあります。 - [帰無仮説値] - 帰無仮説下での母集団パラメーターの 値です。 - [対立仮説のタイプ] - 分析中に評価される、帰無仮説 値に対立する値です。対立仮説のタイプは「片側」(帰 無仮説を上回るか下回る) または「両側」(帰無仮説に 等しくない) のどちらかです。 仮説検定レポー ト 未知のデータと データへのリン ク • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更された 場合、出力も自動的に変更されます。 リファレンス: StatTools メニューのコマンド 89 [仮説検定 - 比率] コマンド 比率の仮説検定を実行 [仮説検定 - 比率] コマンドは、1 標本内にある、特定のカテゴリに 属する項目の比率を分析 (1 標本分析) するか、特定のカテゴリ内の 項目の比率について 2 つの標本を比較 (2 標本分析) します。この 処理でサポートされるデータ タイプは、母集団の標本、カウント付 きサマリー テーブル、および比率付きサマリー テーブルの 3 つで す。 [比率の仮説検 定] ダイアログ ボックス この分析の設定には [比率の仮説検定] ダイアログ ボックスを使い ます。 選択する変数の数は [分析のタイプ] の選択内容により異なります。 1 標本分析を行うには 1 つ以上の標本が必要ですが、2 標本分析を 行うには 2 つの標本が必要です。数 (カウント) または % (比率) という列を使って標本情報のある変数を選択するか、母集団の標本デ ータ タイプの場合はラベルなしの列を使用します。(母集団の標本デ ータがスタック形式の場合、C1 と C2 というラベルの列で標本を選 90 択します。ここで C1 にはスタック形式のカテゴリが含まれます。) データがカウントまたは比率付きのテーブル形式の場合、カテゴリ名 のある変数を 1 つ選択するための [カテ] という列もあります。 母集団の標本データ タイプでは、異なるデータセットからの変数を 指定できます。 [比率の仮説検定] ダイアログでは次のオプションを使用できます。 • [分析のタイプ] - 実行する分析のタイプを選択します。次の オプションがあります。 - [1 標本分析] - 特定のカテゴリに属する 1 標本内の項 目の比率について仮説検定を実行します。 - [2 標本分析] - 特定のカテゴリにある項目の比率につ いて 2 標本の仮説検定を実行します。 • [データ タイプ] - 分析するデータのタイプを母集団の標本、 カウント付きサマリー テーブル、および比率付きサマリー テーブルのいずれかに指定します。 • [比率に関する仮説] - 選択した比率について実行する仮説検 定を指定します。使用できるオプションは、選択した分析の タイプによって異なります。次のオプションがあります。 • - [帰無仮説値] - 帰無仮説下での母集団パラメーターの 値です。 - [対立仮説のタイプ] - 分析中に評価される、帰無仮説 値に対立する値です。対立仮説のタイプは「片側」(帰 無仮説を上回るか下回るか) または「両側」(帰無仮説 に等しくない) のどちらかです。 [第 1 標本サイズ] と [第 2 標本サイズ] - データ タイプ が [比率付きサマリー テーブル] の場合、第 1 標本と第 2 標本 (2 標本分析のみ) のサイズを選択します。 リファレンス: StatTools メニューのコマンド 91 仮説検定レポー ト 未知のデータと データへのリン ク 92 • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更された 場合、出力も自動的に変更されます。 [標本サイズの選択] コマンド 信頼区間の計算に必要な標本サイズを判断 [標本サイズの選択] コマンドは、事前指定した半分長を持つ信頼区 間を取得するために必要な標本サイズを判断します。この判断は、平 均値、比率、2 つの平均値間の差、および 2 つの比率間の差の信頼 区間について行われます。標本サイズはデータ収集の前に必要となる 情報なので、データセットや変数は必要ありません。信頼水準、必要 な半分長、および標本サイズの決定に必要なその他すべてのパラメー ターを指定する必要があります。 [標本サイズの選 択] ダイアログ ボックス この分析の設定には [標本サイズの選択] ダイアログ ボックスを使 います。 [標本サイズの選択] ダイアログでは次のオプションを使用できます。 • [推定するパラメーター] - サイズを判断しようとしている標 本から推定されるパラメーターのタイプを選択します。[平均 値]、[比率] (0 ~ 1 の間の値)、[平均値の差]、[比率の差] のオプションから選択します。 • [信頼区間の指定] - これらのオプションは [推定するパラメ ーター] で選択した内容により異なります。 - [推定するパラメーター] が [平均値] および [平均値 の差] の場合: まず必要な [信頼水準] (通常は 90% ~ 100%) を入力し、[区間の半分] (区間の +/- 部分) と 母集団の [推定標準偏差] を入力します。注意: 信頼 水準と区間長は相互に関連しています。信頼水準が高い ほど信頼区間長が長くなります。 - [推定するパラメーター] が [比率] および [比率の差] の場合: まず必要な [信頼水準] (通常は 90% ~ 100%) を入力し、[区間の半分] (区間の +/- 部分) と [推定 リファレンス: StatTools メニューのコマンド 93 比率] (0 ~ 1 の値) を入力します。[比率の差] を推 定する場合、各母集団の [推定比率] を入力します。 標本サイズの推 定レポート 未知のデータと データへのリン ク 94 • 未知のデータ - 該当しません。 • データへのリンク - 該当しません。 [一元配置 ANOVA] コマンド 変数の一元配置 ANOVA を実行 [一元配置 ANOVA] コマンドは、2 つの母集団間の平均値を比較する 2 標本分析処理を総括したものです。一元配置 ANOVA では少なくと も 2 つ (通常は 3 つ以上) の母集団が比較されます。比較を行うに は ANOVA (分散分析) テーブルが使用されます。このテーブルは、各 母集団内の変動と、異なる母集団からの標本平均値の間の変動の 2 種類の変動を互いに比較します。F 検定の結果後者の変動が前者より も大きい場合、母集団の平均値間に差があることを示しています。 ANOVA テーブルでは P 値が重要な役割を果たします。低い P 値は母 集団の平均値に差があることを示します。ANOVA テーブルのほかに、 平均値の対の間のすべての差の信頼区間からも有用な情報が得られま す。信頼区間に 0 が含まれない場合、平均値が等しくないことがわ かります。StatTools では、それぞれが若干異なる方法で求められる、 数種類の信頼区間から選択できます。 [一元配置 ANOVA] ダイアロ グ ボックス この分析を設定するには [一元配置 ANOVA] ダイアログ ボックスを 使います。 分析対象として 2 つ以上の変数を選択する必要があります。選択さ れたデータセットは、スタック データと非スタック データの両方の 場合があります。異なるデータセットからの変数を使用できます。 リファレンス: StatTools メニューのコマンド 95 [一元配置 ANOVA] ダイアログでは次のオプションを使用できます。 • [信頼区間法] - 個々の変数の信頼区間を補正する方法を次か ら 1 つ以上選択します。[補正なし] (補正を実行しません)、 [ボンフェローニ補正]、[テューキー補正]、[シェッフェ補 正] の各方法を指定できます。 • [信頼水準] - すべての変数の結果についての「同時」信頼水 準です。これは、すべての信頼区間にそれぞれの母集団平均 値差が含まれる信頼度の望ましい水準です。技術上の理由か ら、実際の全体的な信頼水準は通常この「補正なし」の信頼 区間の指定水準を下回ります。上記の補正付きの方法を使用 するのはそのためです。これにより信頼区間の長さを補正 (拡張) して、全体的な信頼水準が指定どおりになるようにし ます。 一元配置 ANOVA レポート 上記の一元配置 ANOVA レポートの一番上には各母集団 (ここでは各 工場) のサマリー統計が表示されています。そしてサマリー統計の下 に各変数の標本統計のテーブルがあります。ANOVA テーブルはその下 96 に表示されます。この例では P 値が非常に小さいため、5 つの工場 の平均値スコアが絶対的に等しくないことを示します。どの平均値間 に差があるかは、レポートの一番下にある信頼区間から判断できます。 値が太字で表示されている対の平均値間には有意差があります。 未知のデータと データへのリン ク • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更される と、出力も自動的に変更されます。 リファレンス: StatTools メニューのコマンド 97 [二元配置 ANOVA] コマンド 変数の二元配置 ANOVA を実行 [二元配置 ANOVA] コマンドは二元配置分散分析を実行します。これ は通常、それぞれが複数の処理レベルで設定された 2 つの要因があ る実験設計のコンテキストにおいて行われます。例えばゴルフボール のパフォーマンスを調査する場合、ブランドと屋外気温の 2 つの要 因が考えられます。ブランドの処理レベルを「A」から「E」とし、気 温の処理レベルを「低」、「中」、「高」とします。値変数は「飛距 離」とし、各ブランドと気温の組み合わせに該当するボールについて この変数の観測値を収集します。この調査の目的は、さまざまな処理 レベルの組み合わせ間に平均値の有意差があるかどうかを判断するこ とです。 二元配置 ANOVA のデータはスタック形式でなければなりません。つ まり、2 つの「カテゴリ」変数 (ここでは「ブランド」と「屋外気 温」) および、1 つの「値」変数 (ここでは「飛距離」) が必要です。 また、データセットのバランスが取れている必要があります。これは 処理レベルの各組み合わせで収集される観測数が一定している必要が あることを示します。バランスの取れていない設計を分析することも 可能ですが、そのような場合にはダミー変数を使用した回帰による分 析を行うのが最適です。 [二元配置 ANOVA] ダイアロ グ ボックス この分析を設定するには [二元配置 ANOVA] ダイアログ ボックスを 使います。 分析対象として 2 つのカテゴリ変数 ([C1] と [C2]) および、1 つ の値変数 ([値]) を選択する必要があります。選択されたデータセッ トは、スタック データでなければなりません。 98 二元配置 ANOVA レポート 上から 3 つのテーブル (標本サイズ、標本平均値、標本標準偏差) は、さまざまな処理レベルの組み合わせの集約尺度です。ANOVA テー ブルはその下に表示されます。このテーブルには 2 つの「主要効 果」と 1 つの「相互作用」の、3 つの重要な P 値があります。主要 効果は、一方の要因の各レベルについて、もう片方の要因のレベルを 平均した値に有意差があることを示します。例えば「気温」の主要効 果は、セル範囲 B17 ~ D17 の値に有意差があるかどうかを示します。 (ここでは ANOVA テーブルの「気温」の P 値が非常に小さいことか ら、有意差があることがわかります。) 未知のデータと データへのリン ク • 未知のデータ - バランスの取れた設計が必要条件であるため、 未知データは許可されません。 • データへのリンク - ANOVA 数式はすべてデータにリンクされて います。データが変更されると、結果も自動的に更新されます。 分析の実行時に実験のバランスが検証されます。データの変更が バランスに影響し、結果が無効になる可能性があるためです。 リファレンス: StatTools メニューのコマンド 99 [カイ二乗独立性検定] コマンド 分割表の行と列の属性の独立性を検定 [カイ二乗独立性検定] コマンドは、分割表の行と列の属性の独立性 を検定します。例えば分割表に、異なる飲酒・喫煙カテゴリに属する 人数が一覧されている場合、この検定により喫煙習慣と飲酒習慣が互 いに独立しているかどうかを判断できます。分割表 (クロス集計表と も呼ばれます) には Excel のピボット テーブルを使用できます。 この処理は大半の StatTools 処理と若干異なり、必要なのは行と列 から成る分割表のみです。このテーブルの各セルには特定の行と列の 組み合わせ (例えば無飲酒の愛煙家など) の観測数が含まれます。テ ーブルには行と列のラベル (見出し) や、行と列の集計を含めること もできますが、これらは StatTools のレポートを理解しやすくする ためのもので、必須ではありません。 [カイ二乗独立性 検定] ダイアロ グ ボックス この分析の設定には [カイ二乗独立性検定] ダイアログ ボックスを 使います。 [カイ二乗独立性検定] ダイアログでは次のオプションを使用できま す。 • 100 [行と列の見出しとタイトル] - 次から 1 つ以上を選択しま す。 - [テーブルに行と列の見出しを含める] - テーブルの 1 列目と 1 行目に見出しを表示します。 - [列タイトル] - テーブルの列のタイトルを表示します。 - [行タイトル] - テーブルの行のタイトルを表示します。 カイ二乗独立性 検定レポート 上記のレポートには検定の基本結果である P 値が表示されています。 この例のように P 値が低い場合、行と列の属性は独立していないと 結論付けることができます。このシート上の数値に基づいて喫煙と飲 酒の関連性を把握できます。 未知のデータと データへのリン ク • 未知のデータ - 分割表のセルでは未知のデータが許可されませ ん。 • データへのリンク - カイ二乗独立性検定レポートの数式はデー タにリンクされています。したがって元の分割表のカウントが変 化すると、このシートの出力が変更されます。 リファレンス: StatTools メニューのコマンド 101 [カイ二乗適合度検定] コマンド カテゴリ変数の度数分布について適合度の仮説検定を実行します この検定は、カテゴリ変数の度数分布が特定のパターンに一致するか どうかを判断するために適用します。これには観測値と期待値の 2 つの値が使用されます。観測値は標本からのカテゴリの頻度であり、 期待値は指定の分布に基づいて計算されます。 一様分布 (各カテゴリの比率が等しい場合) または特定の分布を仮定 して、仮説検定を実行できます。 [カイ二乗適合度 検定] ダイアロ グ この分析の設定には [カイ二乗適合度検定] ダイアログを使います。 検定の対象となる変数を 1 つ選択してください。選択したデータセ ットは、常に非スタック データとして扱われます。 [カイ二乗適合度検定] ダイアログでは次のオプションを使用できま す。 102 [分析のタイプ] - 実行する分析のタイプを選択します。次のオプシ ョンがあります。 • [等しい比率] - 帰無仮説は変数の度数分布が一様であるこ とを提唱し、各カテゴリの比率が等しいことを意味します。 • [特定の比率] - この場合、帰無仮説が変数の度数分布は一 様分布ではないことを提唱するため、ユーザーが期待値をユ ーザーが指定する必要があります。 [入力タイプ] - 分析の実行に使用できる情報のタイプを選択します。 次のオプションがあります。 • [データセット] - データセットがある場合に選択します。 • [サマリー統計] - データセットがなく、データセットに関 する何らかの統計情報を使用できる場合に選択します。 [未知のデータセット] - データセットが使用できず、代わりに度数 分布表を使用できる場合に選択します リファレンス: StatTools メニューのコマンド 103 仮説検定レポー ト このレポートには検定の基本結果である P 値が表示されます。この P 値が小さい場合、帰無仮説が棄却されます。観測値と期待値の棒グ ラフも表示されます。 未知のデータお よびデータとの リンク付け 104 • [未知のデータ] - 未知のデータが許可されます。選択され た変数の、未知のデータがあるすべてのセルが無視されます。 • [データとのリンク付け] - データにリンクされた数式を使 ってレポートが生成されます。選択した変数の値が変更され た場合、レポートの値も自動的に変更されます。ただし、デ ータに新しいカテゴリを含めた場合には分析を再実行する必 要があります。 [正規性検定] メニュー 多くの統計的処理では一連のデータが正規分布に従うことが前提とな るため、この仮定を確認する方法があると便利です。StatTools では、 よく使われる 3 つの検定方法が用意されています。このセクション ではこれらの各検定について説明します。 [カイ二乗検定] コマンド 変数の観測データが正規分布に従うかどうかを検定 [カイ二乗検定] はカイ二乗適合度検定を使用して、指定された変数 にある観測データが正規分布に従っているかどうかを検定します。こ の処理では、該当する変数のヒストグラムを作成し、ユーザーが指定 したカテゴリを使用してデータからのヒストグラムに正規分布のヒス トグラムを重ね合わせます。2 つのヒストグラムが基本的に同じ形で ある場合、正規分布の帰無仮説を棄却できないことになります。 正式な検定は、さまざまなカテゴリの観測数を正規性の仮定に基づく 推定カウントと比較することで行われます。実際には、この処理によ り複数の変数の正規性を個別に検定することが可能です。選択した各 変数につきヒストグラムが作成され、それぞれに対してカイ二乗検定 が実行されます。 カイ二乗正規性検定の唯一の要件は、少なくとも 1 つの数値変数が 必要な点です。また、観測値が多いほど優れた結果が得られるため、 大半の分析者は少なくとも 100 個の観測値を 収集することを推奨し ます。 リファレンス: StatTools メニューのコマンド 105 [カイ二乗正規性 検定] ダイアロ グ ボックス この分析の設定には [カイ二乗正規性検定] ダイアログ ボックスを 使います。 検定の対象として 1 つの変数を選択できます。選択されたデータセ ットは、スタック データと非スタック データの両方の場合がありま す。 [カイ二乗正規性検定] ダイアログでは次のオプションを使用できま す。 106 • [値域数] - 値域の固定数を指定するか、値域の数を自動的に 計算するように指定します。 • [最小] と [最大] - [自動] を選択すると、データセットの 最小値と最大値を使用して、等間隔値域の最小値と最大値を 自動的に計算するよう指定されます。ただし最初と最後の値 域は、[負の無限大に拡張] オプションと [正の無限大に拡 張] オプションを使用して追加できます。[自動] を選択しな い場合、特定の最小値と最大値を入力して値域の開始値と終 了値を指定できます。これによりデータセットの最小値と最 大値に関係なく、値域の計算が行われる特定の範囲を入力す ることができます。 • [負の無限大に拡張] - 使用される最初の値域を指定した最小 値から負の無限大まで拡張するように指定します。ほかのす べての値域は均等長になります。状況によっては、これによ り不明な下限境界を持つデータセットの検定が改善されます。 • [正の無限大に拡張] - 使用される最初の値域を指定した最大 値から正の無限大まで拡張するように指定します。ほかのす べての値域は、均等長になります。状況によっては、これに より不明な上限境界を持つデータセットの検定が改善されま す。 カイ二乗正規性 検定レポート 上記のレポートは検定の結果を示しています。0.4776 という P 値は、 データが正規分布に従うことを示すのに十分な証拠となります。これ は図 4 のヒストグラムおよび頻度データにも表れています。ただし、 注意を要する点が 2 つあります。まず、観測値が少なすぎる (例え ば 100 を大幅に下回る) 場合、カイ二乗検定を使って正規性を検定 するのは適していません。そのような場合は通常、正規性の仮説を棄 却するのに十分な小さい P 値が得られません。基本的に、データセ リファレンス: StatTools メニューのコマンド 107 ットが小さいとほぼすべてのデータが正規分布を持つように見える傾 向にあります。これに対して、データセットが非常に大きい (例えば 数百の観測値がある) 場合、通常は P 値が小さくなり、非正規性を 示します。これは、大きいデータセットでは曲線上の小さな隆起によ って P 値が小さくなる可能性が高いからです。こうしたケースでは、 実用的なテストの方が役に立ちます。すべての実用面でヒストグラム に十分な差が見られるかどうかが重要となります。 未知のデータと データへのリン ク 108 • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - ヒストグラムとすべての数式が元のデータ にリンクされています。したがってデータが変更されると、検定 結果も自動的に更新されます。 [リリフォース検定] コマンド 変数の観測データが正規分布に従うかどうかを検定 [リリフォース検定] では、よく使われるカイ二乗適合度検定よりも さらに強力な正規性検定を実行できます。(強力とは、非正規性が存 在する場合に検出される可能性が高いという意味です。)「経験的 CDF」と正規分布の CDF (CDF は「累積分布関数」の略) との比較に 基づいており、特定の値を下回る、またはこれに等しくなる確率を示 します。 経験的 CDF はデータに基づいています。例えば 100 個ある観測値の うち 13 番目に小さい値が 137 である場合、137 で評価した経験的 CDF は 0.13 となります。リリフォース検定は経験的 CDF と正規分 布の CDF との間の最大垂直距離を求め、この最大値をテーブルの値 (これは標本サイズに基づきます) と比較します。全体的な最大垂直 距離が十分大きい場合には、データが正規分布から取得されないこと の証拠となります。 [リリフォース検 定] ダイアログ ボックス この分析の設定には [リリフォース検定] ダイアログ ボックスを使 います。 検定の対象として 1 つ以上の変数を選択できます。選択されたデー タセットは、非スタック データでなければなりません。異なるデー タセットからの変数を使用できます。 リファレンス: StatTools メニューのコマンド 109 リリフォース検 定レポート 上記のレポートは検定の結果を示しています。大半の仮説検定と異な り P 値はありませんが、最大垂直距離が十分大きいことから正規性 の仮定が疑わしいことがわかります。チャートに含まれている CDF を見ると、状況がさらに明らかになります。実際には 2 曲線間のフ ィットが「かなり適合している」ように見え、実用的な目的には十分 だと言えます。したがって、これらのデータは実用上は正規分布に 「十分近い」と結論付けることができます。 未知のデータと データへのリン ク 110 • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - CDF とすべての数式が元のデータにリンク されています。したがってデータが変更されると、検定結果も自 動的に更新されます。 [正規 Q-Q プロット] コマンド 変数の観測データが正規分布に従うかどうかを検定 [正規 Q-Q プロット] コマンドは、1 つの変数の正規分位点 (Q-Q) プロットを作成します。これは非公式な正規性検定として使用できま す。この検定の詳細は多少複雑ですが、目的はごく単純です。この検 定はデータの四分位 (またはパーセンタイル) を、正規分布の四分位 と比較します。データが基本的に正規分布である場合、Q-Q プロット 上のポイントは 45 度線に近くなるはずです。ただし、プロットが明 らかに湾曲している場合は何らかの非正規性 (歪度など) が見られる ことを示します。 [正規 Q-Q プロ ット] ダイアロ グ ボックス この分析の設定には [正規 Q-Q プロット] ダイアログ ボックスを使 います。 プロットの対象として 1 つの変数を選択できます。選択されたデー タセットは、非スタック データでなければなりません。 [正規 Q-Q プロット] ダイアログ ボックスには次のオプションがあ ります。 • [標準化した Q 値を使ってプロットする] - グラフの Y 軸に Q-Q データの代わりに標準化された Q 値を使用するよう指定 します。これにより、正規 Q-Q プロット間の Y 軸値の比較 が可能になります。 正規 Q-Q プロッ ト レポート リファレンス: StatTools メニューのコマンド 111 すでに説明したように、これは正規性の非公式な検定です。プロット が 45 度線にどれほど近い場合に正規性の仮定を受け入れられるかを 断定するのは困難です。一般にはプロットに明らかな湾曲がないかど うかを確認します。上記のプロットには見当たりません。 未知のデータと データへのリン ク 112 • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - プロットとすべての数式が元のデータにリ ンクされています。したがってデータが変更されると、プロット も自動的に更新されます。 [時系列と予測] メニュー [時系列と予測] メニューの処理は、一定の期間にわたり収集された データを分析します。このタイプの分析は予測や品質管理に適用でき ます。移動平均法、シンプルな指数平滑法、トレンドを捕らえるホル ト指数平滑法、および季節性を捕らえるウィンターズ指数平滑法など の予測機能が用意されています。 [時系列グラフ] コマンド 変数の時系列グラフを作成 [時系列グラフ] コマンドは、1 つ以上の時系列変数につき 1 つの時 系列プロットを同じチャート上に作成します。2 つの変数を選択した 場合、Y 軸に各変数で同じスケールを使用するか、異なるスケールを 使用するかを指定できます。後者のオプションは、2 つの変数の値の 範囲が大幅に異なる場合に便利です。ただし 3 つ以上の変数をプロ ットする場合には、すべての変数で縦軸のスケールを同じにする必要 があります。 データセット内に少なくとも 1 つの数値変数が必要です。また、 「日付」変数も含めることができますが、チャートの横軸のラベルと して使用する場合にはこれを「ラベル」変数として選択する必要があ ります。 リファレンス: StatTools メニューのコマンド 113 [時系列グラフ] ダイアログ ボッ クス このタイプのグラフの設定には [時系列グラフ] ダイアログ ボック スを使います。 グラフの対象として 1 つ以上の変数を選択できます。選択されたデ ータセットは、非スタック データでなければなりません。異なるデ ータセットからの変数を使用できます。「ラベル」変数 ([ラベル] チェックボックスで指定) は X 軸に表示されます。 [時系列グラフ] ダイアログでは次のオプションを使用できます。 114 • [1 つのグラフにすべての変数をプロットする] - 1 つのグラ フにすべての変数をプロットする場合に選択します。 • [2 つの Y 軸を使用] - 2 変数のグラフで変数ごとに個別の Y 軸を表示する場合に選択します。このオプションでは各変 数の単位と値をグラフに表示することができます。 2 つの変数の時 系列グラフ 未知のデータと データへのリン ク • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - グラフがデータにリンクされているので、 データが変更されるとグラフも自動的に更新されます。 リファレンス: StatTools メニューのコマンド 115 [自己相関] コマンド 変数の自己相関を計算 [自己相関] コマンドは、選択された任意の数値変数の自己相関を計 算します。一般的にはこの変数は時系列変数ですが、StatTools では あらゆる変数の計算を行うことができます。計算の必要な自己相関の 数 (つまり遅延の数) を選択できます。また、相関曲線という自己相 関のグラフを作成するようにも指定できます。出力には、どの自己相 関に 0 との有意差があるかどうかが示されます。 [自己相関] ダイ アログ ボックス このタイプのグラフの設定には [自己相関] ダイアログ ボックスを 使います。 分析対象として 1 つ以上の変数を選択できます。選択されたデータ セットは、非スタック データでなければなりません。 [自己相関] ダイアログでは次のオプションを使用できます。 116 • [遅延の数] - 自己相関を計算する際に、遅延させる時系列の 数を指定します。[自動] を選択すると、検定を行う適切な遅 延数が StatTools で自動的に決定されます。特定の遅延数を 入力する場合、最大で時系列の観測数の 25% の遅延を指定で きます。例えば 80 個の月次データがある場合、最大で 20 の遅延を要求できます。 • [自己相関チャートを作成する] - 各バーの高さがそれぞれ対 応する自己相関に等しいバー グラフを作成します。 自己相関レポー ト 上記は自己相関レポートの例です。このレポートには各遅延に対応す る自己相関に加えて近似標準誤差が表示されます。 未知のデータと データへのリン ク • 未知のデータ - この処理では時系列の冒頭で未知のデータが許 可されますが、時系列の途中や末尾では一切許可されません。 • データへのリンク - StatTools はこの出力をデータにリンクし ます。したがってデータが変更されると、自己相関と相関曲線も 自動的に更新されます。 リファレンス: StatTools メニューのコマンド 117 [ランダム性の連検定] コマンド 連検定を実行して変数のランダム性を検査 [ランダム性の連検定] コマンドを使用して、変数 (通常は時系列変 数) の値のシーケンスがランダムであるかどうかを検査できます。こ れはシーケンスに含まれる「連」の数、つまり何らかのカットオフ値 (シーケンスの平均値やメジアンなど) の片側に値が連続して起こる 数を示します。ランダムなシーケンスの場合、連の数が少なすぎたり 多すぎることはありません。連検定は連の数をカウントし、検定の P 値を報告します。この P 値が小さい場合、シーケンスがランダムで はない (つまり連の数が多すぎるか少なすぎる) と結論付けることが できます。 [ランダム性の連 検定] ダイアロ グ ボックス この分析の設定には [ランダム性の連検定] ダイアログ ボックスを 使います。 分析対象として 1 つ以上の変数を選択できます。選択されたデータ セットは、非スタック データでなければなりません。異なるデータ セットからの変数を使用できます。 [ランダム性の連検定] ダイアログでは次のオプションを使用できま す。 • 118 [連を定義するためのカットオフ値] - 連検定は常に何らかの カットオフ値を上回るまたは下回る値の連に基づいています。 カットオフ値には [時系列の平均値] または [時系列のメジ アン] を指定するか、その他の [カスタム カットオフ値] を 入力することもできます。 ランダム性の連 検定レポート 上記のレポートにはランダム性の下で期待される連の数 E(R) が報告 されています。20 は 24.8333 よりも明らかに低いので、この時系列 は完全にランダムではありません。したがって、売上はランダムな時 系列のように無作為には変化しません。 未知のデータと データへのリン ク • 未知のデータ - この処理では時系列の冒頭と末尾で未知のデー タが許可されますが、時系列の途中では一切許可されません。 • データへのリンク - StatTools はこの出力をデータにリンクし ます。したがってデータが変更されると、レポートも自動的に更 新されます。 リファレンス: StatTools メニューのコマンド 119 [予測] コマンド 時系列変数の予測を生成 [予測] コマンドを使用して、さまざまな方法で時系列変数の予測を 行うことができます。予測の手法としては、移動平均法、シンプルな 指数平滑法、トレンドを捕らえるホルト指数平滑法、および季節性を 捕らえるウィンターズ指数平滑法などが用意されています。[予測] コマンドでは、移動平均比率方法と季節性乗法モデルを使って、まず データから季節性を排除することもできます。その後、予測方法のい ずれか (ただしウィンターズ法は除く) を使って季節性を排除したデ ータを予測してから、最後に再び季節性を加えることができます。 予測レポートには、さまざまな計算値 (例えばホルト法の場合は平滑 化されたレベルとトレンド、移動平均法の場合は季節要因など)、予 測、および予測誤差を示す一連の列が含まれています。また観測デー タへのモデルの適合度を追跡するための集約尺度 (MAE、RMSE、MAPE) も含まれます。(指数平滑法を使用する場合、最適化を使って RMSE が最小になる平滑定数を見つけるオプションも利用できます。) 最終的には、元の時系列のプロット、予測を重ね合わせた時系列プロ ット、および予測誤差のプロットを含む、いくつかの時系列プロット が生成されます。季節性を排除する場合、元の時系列と季節性を排除 した時系列の両方についてこれらのプロットが生成されます。 120 [予測] ダイアロ グ ボックス 予測の設定には [予測] ダイアログ ボックスを使います。 分析の対象として 1 つの変数を選択できます。選択されたデータセ ットは、非スタック データでなければなりません。 [予測] ダイアロ グ ボックスの [予測の設定] オ プション このダイアログの [予測の設定] のオプションでは、使用する予測法 とその設定を指定します。次のオプションがあります。 • [予測数] - 予測を計算する将来の周期の数を指定します。 • [保留数] - 予測モデルで「保留」する (つまり使用しない) 観測の数を指定します。予測モデルの推定にすべての観測を 使用 (保留数ゼロ) するよう指定するか、検証用にいくつか 保留することができます。すると保留されていない観測から モデルの推定が行われ、保留されている観測の予測に使用さ れます。 • [パラメーターを最適化する] (指数平滑法のみ) - 保留され ない周期の RMSE を最小化する平滑定数を見つけます。最適 化を行うにはダイアログ内のすべてのパラメーターが 0 ~ 1 の間でなければなりません。パラメーター値を予測レポート で直接編集する場合には、必ずこの範囲内の値を入力してく ださい。 • [方法] - 使用する予測法を [移動平均]、[指数平滑法]、[指 数平滑法 (ホルト)]、[指数平滑法 (ウィンターズ)] のいず れかから選択します。 リファレンス: StatTools メニューのコマンド 121 • [パラメーター] - 選択した予測法で使用するパラメーターを 指定します。 - [スパン] パラメーター (移動平均法のみ) は、各異動 平均で使われる連続観測の数を指定します。 - [レベル] パラメーター (すべての指数平滑法) は、0 ~ 1 の間の任意の値を取ることのできる平滑化パラメ ーターです (デフォルト値は 0.1 です)。 - [傾向] パラメーター (ホルトおよびウィンターズ指数 平滑法) は、0 ~ 1 の間の任意の値を取ることのでき る 2 番目の平滑化パラメーターです (デフォルト値は 0.1 です)。 - [季節性] パラメーター (ウィンターズ指数平滑法のみ) は、0 ~ 1 の間の任意の値を取ることのできる 3 番目 の平滑化パラメーターです (デフォルト値は 0.1 です)。 注意: [パラメーターを最適化する] を選択した場合、[レベル]、 [傾向]、[季節性] の各パラメーターを設定することはできません。 これらのパラメーターの値は最適化により求められます。 [予測] ダイアロ グ ボックスの [時間の尺度] オ プション 122 [時間の尺度] オプションは、分析対象となる変数のタイミングと時 間の尺度のラベルを指定します。次のオプションがあります。 • [周期] - 時系列データのタイプを [年次]、[四半期]、[月 次]、[週次]、[日次]、[なし] のいずれかに指定します。こ れはデータの季節性の追加とラベルに使用されます。 • [季節性を排除する] - 予測を行う前にデータの季節性を排除 する場合に選択します。季節データ、つまり季節的な変動要 因があると思われるデータを処理する場合、2 つのオプショ ンがあります。季節性に直接対処するウィンターズ法を使用 するか、またはこのオプションを選択して移動平均法により データから季節性を排除します。すると、任意の方法を使っ て季節性を排除した時系列の予測を行うことができます。 • [ラベル スタイル] - 生成したグラフで時間の尺度に付ける ラベルの設定を指定します。 • [開始ラベル] - グラフ上の最初の時間尺度ラベルのエントリ を指定します。 [予測] ダイアロ グ ボックスの [表示するグラ フ] オプション [表示するグラフ] オプションは、生成する予測グラフを指定します。 生成できるグラフには次があります。 1) [予測オーバーレイ] - 予測で生成されたデータ値の時系列グラ フ。 2) [元の時系列] - 実際のデータの時系列グラフ。 3) [予測誤差] - 予測と実際の値との誤差。 4) [季節性を排除した予測オーバーレイ] - 元のデータの季節性を 排除した後に予測で生成されたデータ値の時系列グラフ。 5) [季節性を排除した元の時系列] - 季節性を排除した後の、実際 のデータの時系列グラフ。 6) [季節性を排除した予測誤差] - 元のデータの季節性を排除した 後の予測と実際の値との誤差。 予測レポートの 例 リファレンス: StatTools メニューのコマンド 123 未知のデータと データへのリン ク 124 • 未知のデータ - 時系列の冒頭で未知のデータが許可されますが、 時系列の途中や末尾では許可されません。 • データへのリンク - 大量の計算が必要となるため、予測はデー タにリンクされていません。元のデータが変更された場合、処理 を再実行する必要があります。 [回帰と分類] メニュー [回帰と分類] メニューのコマンドは、回帰分析および分類分析を実 行します。複数、段階的、前方、後方、およびブロックなどの方法に よる回帰分析を使用できます。また、このメニューから判別分析やロ ジスティック回帰を実行することもできます。 リファレンス: StatTools メニューのコマンド 125 [回帰] コマンド 一連の変数について回帰分析を実行 回帰分析では、ダミー変数回帰 ( 回帰モデルがサポート されます。オプショ ンの [回帰ウィザード] を使用して、これらのモデルのセット アップを行うことができます。 カテゴリ変数を使う これらのモデルでは、方程式に含める変数を選択する各種の方法を使用できます。これを「 回帰タイプ」 と呼び、多重、ステップワイズ、前方、後方、およびブロックの各タイプがあ ります。各回帰のレポート には、集約尺度、 A N OVA テーブル、および推定回帰係数、その標準誤差、 t 値、p 値、95% 信頼区間のテーブルがそれぞれ含まれます。 また、 2 つの新規変数(フィット 済み値と残差) を作成するオプショ ンや、いく つもの診断散布図を作成するオプショ ン、および以下に説明 するその他のオプショ ンも使用できます。 回帰ウィザード 回帰ウィザードを使用して、ダミー変数回帰や多項式回帰などの回帰モデルを簡単に作成で きます。これらのモデルでは分析に変数の変換 (つまり「 派生変数」 ) を含める必要がありますが、ウィザードによって変換を含める作業が簡単になります。 ウィザードでは次の 4 つのステップに従って作業します。 ステップ 1: モデルの選択。作成するモデルのタイプを指定します。次のオプショ ンがあります。 126 • [標準回帰モデル] - 多重回帰モデル。 • [ダミー変数回帰モデル] - カテゴリ独立変数を含む多重回帰 モデル。カテゴリを 0/1 にコード化する処理は自動的に行わ れます。 • [多項式回帰モデル] - 独立変数のべき乗を含む多重回帰モデ ル。元の変数の間に存在し得るすべての可能な相互作用も含 めることができます。 • [変数間の相互作用を用いた回帰モデル] - 独立変数間に存在 し得るすべての可能な相互作用を含む多重回帰モデル。 • [非線形変数変換を用いた回帰モデル] - 変数に非線形の変換 が適用された回帰モデル。次のオプションがあります。 モデル 指数 逆数 対数 累乗 回帰方程式 log(y) = b0 + b1x1 + b2x2 + … + bpxp 1/y = b0 + b1x1 + b2x2 + … + bpxp y = b0 + b1log(x1) + b2log(x2) + … + bplog(xp) log(y) = b0 + b1log(x1) + b2log(x2) + … + bplog(xp) ステップ 2: 独立変数の選択。1 つ以上の独立変数と、必要な場合は変数の変換を選択します。 ステップ 3: 従属変数の選択。従属変数を選択します。モデルのタイプによっては従属変数の変換も選択 します。 ステップ 4: 選択方法の指定。「 回帰のタイプ」 を多重、ステップワイズ、前方、後方、ブロックのいず れかに指定します。 ウィザードを完了した後、 [回帰] ダイアログで設定を調整できます。 使用できる回帰 のタイプ (変数 の選択方法) 使用できる回帰のタイプ (つまり変数の選択方法) には多重、ステップワイズ、前方、後方、ブロックがあります。 多重回帰処理は、選択された独立変数を使ってすべての式を一度に構築します。 (これ 「 シンプル」 回帰と呼ばれる、単一の独立変数を用いた処理を含みます。 )それ以外の処理 は、複数の変数 (または変数のブロック) を式に順次投入したり除去することができます。このうちステップワイズ回帰では一度に つの変数の投入が許可されます。次に投入する変数には、従属変数の説明されない部分との 相関が最も高い変数が使用されます。 ただし、ステップワイズ オプショ ンでは、いったん投入した変数の貢献度が有意でなく なると、これを除去すること もできます。前方回帰はステップワイズ回帰と同じですが、いったん投入された変数を除去 できない点で異なります。後方回帰はすべての可能な独立変数を使って式を開始し、その後 貢献度が有意でないものから 1 つずつ除去していきます。 リファレンス: StatTools メニューのコマンド 127 そしてブロック回帰では、独立変数のブロックを所定の順序でブロックとして投入する、ま たは投入しないよう指定できます。あるブロックに有意性がないため投入されない場合、そ の後のブロックは投入が考慮されません。 これらの分析の設定には[ [回帰] ダイアロ グ 128 回 ダイアログを使 帰] 用します。 [ 回帰 ] ダイアログでは次のオプショ ンを使用でき • [ウィザードを使用したセットアップ] - このオプションを 選択した場合、一連のダイアログに従って各種の回帰モデル を作成します。 • [回帰のタイプ] - 変数の選択方法として多重、ステップワ イズ、前方、後方、ブロックのいずれかを選択します。 • [独立変数の固定] - このオプションを選択した場合、変数 の選択グリッドに F 列が追加されます。F 列では「固定」さ れた変数を選択できます。これは、変数の選択プロセスで方 程式から除外されることのない変数です。 [回帰] ダイアロ グ – [変数] タ ブ ブロック回帰の場合を除き、分析の対象として 1 つの従属変数(従) と 1 つ以上の独立変数 ( 独) を選択する必 個の独立変数ブロック (B1 ~B7) を選択する必要があります。 カテゴリ変数は回帰分析で使用する前に変換が必要となるため、選択した変数が「 カテゴリ 」 変数と「 数値」 変数のどちらであるかを指定しなければなりません。選択するデータセッ ト は、非スタック形式でなければなりません。異なるデータセット からの変数を組み合わせ リファレンス: StatTools メニューのコマンド 129 て使用できます。ただし、複数のデータセット を用いる場合、派生変数のオプショ ンは使用 できません。 派 チェックボ 生変数を含 ックスが める オンの ] 場合、変数を 2 [ 追加 ボ タンをクリックす ] ると 乗するなどの変数変換を分析に追加できます。[ 派 ダイアログが 生変数の追加 表示され ] ます。 [ [派生変数の追 加] ダイアログ 派生変数の追加 ] [ ダイアログを使用すると、元の変数を変換して新しい変数を簡単に作成できます。次のオプ ショ ンがあります。 130 • [累乗] - 変数に累乗変換を適用するにはこのオプションを選択 します。 • [対数] - 変数に対数変換を適用するにはこのオプションを選択 します。 • [カテゴリ変数なしの相互作用] - 複数の数値変数の積である 相互作用項を含めるにはこのオプションを選択します。 • [カテゴリ変数のある相互作用] - 1 つ以上の数値変数と 1 つの カテゴリ変数に基づく相互作用項を含めるにはこのオプショ ンを選択します。 [回帰] ダイアロ グ – [パラメー ター] タブ 次のパラメーター オプショ ンがあります。 • [P 値を使用する] - 回帰方程式の変数を追加したり削除し たりする方法に影響を与えます。これを選択すると、使用し ている回帰法に応じて、投入する p 値や除去する p 値を入 力できます。p 値が低いほど、回帰方程式への投入や除去に はより有意な変数が必要となります。通常はデフォルトで表 示されている値を受け入れて問題はありません。ただし次の 点に注意してください。まず、投入する p 値は除去する p 値を超えることができません。そして、変数を投入しやすく (または除去しづらく) するには、p 値を大きくします。同様 に、変数を投入しづらく (または除去しやすく) するには、p 値を小さくします。一般に p 値は 0.01 ~ 0.1 の範囲内に あります。 • [F 値を使用する] - p 値の場合と同様に、回帰方程式の変 数を追加したり削除したりする方法に影響を与えます。使用 している回帰法に応じて、投入する F 値や除去する F 値を リファレンス: StatTools メニューのコマンド 131 入力できます。一般にこの値は 2.5 ~ 4 の範囲内にありま す。 • [定数をゼロ (原点) に設定する] - 回帰方程式が原点を通 るよう強制します。 • [数値の独立変数を標準化する] - 各変数から平均値を差し 引き、その結果を標準偏差値で除算します。これは独立変数 の大きさが非常に異なる場合に便利です。 [回帰] ダイアロ グ – [グラフ] タブ ここで選択されている [グラフ] のオプショ ンにあるように、StatTools でオプショ ンの散布図をいく つか作成することができます。次のオプショ ンがあります。 • • • • • • • 132 フィット済み値 vs 実際の Y 値 フィット済み値 vs X 値 残差 vs フィット済み値 残差 vs X 値 残差 vs 順序インデックス 残差のヒストグラム [グラフにおける外れ値の特定] - 各散布図にある回帰の外 れ値を強調表示します 一般にこれらのプロット は、回帰の仮定条件が満たされているか確認するために「 残差分析 」 で使用されます。 [回帰] ダイアログ – [オプション] タブ 回帰分析の高度なオプショ ンには次があります。 • [回帰方程式を表示する] - レポートに回帰方程式の詳細を 表示します。カテゴリ変数が 1 つ以上ある場合に便利です。 カテゴリの各組み合わせに対する個別の方程式が表示されま す。 • [多重共線性を確認する] - レポートに各独立変数の分散膨 張係数 (VIF) を含めます。VIF の値が大きい場合、多重共線 性を示します。相関行列も含めることができます。 • [詳細なステップ情報を含める] - 回帰の各中間ステップに おける R 二乗と標準誤差の統計を報告します (ただし、多重 回帰を使用する場合を除きます)。 リファレンス: StatTools メニューのコマンド 133 回帰レポート 134 • [データセットの予測を含める] - 2 番目のデータセットの 独立変数値に対して従属変数の予測値を生成します。この予 測データセットには、回帰分析の対象となる元のデータセッ トと同じ変数名が含まれている必要があります。一般に予測 データセットには、予測したい従属変数の値に対応する独立 変数の値のセットが含まれています。予測は最初のデータセ ットから計算された回帰方程式を使用して行われます。従属 変数の予測値が予測データセットに直接入力され、従属変数 の列 (または行) に予測値が表示されます。また、予測区間 と (平均値の) 信頼区間も含められます。 • [データセットにおける外れ値の特定] - データセットに追 加の列を挿入し、観測値が回帰の外れ値であるかどうかを示 します 予測を含むデータ セット 未知のデータと データへのリン ク [ データセット の予測を含める ] オプショ ンを選択すると、選択したデータセット の右側に予測値が表示されます。レポート には予測値 (1 列)、予測区間(2 列)、および信頼区間(2 列) がそれぞれ含まれます。 • 未知のデータ - 未知の値がある場合、すべての選択変数に ついて未知の値を含む行は無視されます。 データへのリンク - 元のデータへのリンクはありま せん。データが変更された場合、分析を再実行する 必要があります。 リファレンス: StatTools メニューのコマンド 135 [ロジスティック回帰] コマンド 一連の変数についてロジスティック分析を実行 [ロジスティック回帰] コマンドは、一連の変数に対してロジスティ ック回帰分析を実行します。これは基本的に、応答変数が 0 または 1 のバイナリである、非線形タイプの回帰分析です。各観測が「成 功」か「失敗」かを示す、0 か 1 の値を持つ応答変数が 1 つと、成 功確率の推定に使用できる 1 つ以上の説明変数が必要です。 ロジスティック回帰の 2 番目のオプションとして、説明変数の各組 み合わせで観測される「試行」の数を指定する、「カウント」変数を 使うこともできます。その場合、応答変数は「成功」につながる試行 の数を示します。ロジスティック回帰の結果は、通常の多重回帰方程 式に類似した回帰方程式です。ただし下記に説明するように、解釈が 若干異なります。 StatTools のロジスティック回帰処理は、最適化を使って回帰方程式 を求めます。この最適化処理は複雑な非線形アルゴリズムを用いるた め、コンピューターの処理速度によっては長い時間がかかります。 136 [ロジスティック 回帰] ダイアロ グ ボックス この分析の設定には [ロジスティック回帰] ダイアログ ボックスを 使います。 分析の対象として 1 つの従属変数 (従) (つまり応答変数) と、1 つ 以上の独立変数 (独) を選択する必要があります。データは次の要件 を満たさなければなりません。 1) データが「スタック形式」であり、各観測が「成功」か「失 敗」かを示す、0 か 1 の値を持つ応答変数が 1 つあること。 この分析タイプを [カウント変数のない標本] と呼びます。 2) 「カウント」変数が 1 つと、整数の応答変数が 1 つあるこ と。この分析タイプを [カウント変数のある標本のサマリー] と呼びます。 異なるデータセットからの変数を使用できます。分析タイプが [カウ ント変数のある標本のサマリー] に設定されている場合、追加のカウ ント変数を 1 つ選択する必要があります。 リファレンス: StatTools メニューのコマンド 137 [ロジスティック回帰] ダイアログでは次のオプションを使用できま す。 • 138 [分析のタイプ] - 実行するロジスティック回帰のタイプを [カウント変数のない標本] と [カウント変数のある標本のサ マリー] のどちらかに指定します。 - [カウント変数のない標本] - 各観測が「成功」か「失 敗」かを示す、値が 0 か 1 の応答変数が 1 つと、成 功確率の推定に使用できる 1 つ以上の説明変数を持ち ます。 - [カウントの変数のある標本のサマリー] - 説明変数の 各組み合わせで観測される「試行」の数を指定する、 「カウント」変数を持ちます。この場合、応答変数は 「成功」につながる試行の数を示します。この分析タイ プでは、個別の変数選択画面に C 列が表示され、カウ ント変数を選択することができます。 • [分類サマリーを含める] - 回帰レポートに分類サマリーを含 めます。 • [分類結果を含める] - 回帰レポートに分類結果を含めます。 • [予測を含める] - 2 番目のデータセットの独立変数値に対し て従属変数の予測値が生成されます。この予測データセット には、回帰分析の対象となる元のデータセットと同じ変数名 が含まれている必要があります。一般に予測データセットに は、従属変数の値を予測しようとしている、独立変数の値の セットが含まれています。予測には最初のデータセットから 計算された回帰方程式が使用されます。従属変数の予測値は 予測データセットに直接入力され、従属変数の列 (または行) に予測値が挿入されます。 ロジスティック 回帰レポート 上記のレポートには元のデータと分類に使われたデータの両方が含ま れています。E 列の予測された分類は、D 列の「成功」推定確率がカ ットオフ値の 0.5、つまり 50% を上回るか下回るかに基づいていま す。このレポートには回帰のサマリー統計 (多重回帰の R 二乗統計 に似ています)、回帰方程式についての詳細情報、および分類処理の サマリー結果が一覧されています。(結果を解釈するのに役立つセル コメントも数多く含まれています。) この例では観測の 90.5% が正 しく分類されたことがわかります。この率をできるだけ高くするのが 目標です。一般に、この結果を改善するにはより多くの (またはより 優れた) 説明変数を使う必要があります。通常 H 列 [指数 (係数)] の値は回帰方程式を解釈するために使われます。これは、いずれかの 説明変数が 1 単位増えた場合の「成功」確率の推定変化量を示しま す。 未知のデータと データへのリン ク • 未知のデータ - 未知のデータがある場合、選択された変数のい ずれかの値が欠けているすべての行が無視されます。 • データへのリンク - 元のデータにリンクされていません。デー タが変更された場合、分析を再実行する必要があります。 リファレンス: StatTools メニューのコマンド 139 [判別分析] コマンド 一連の変数について判別分析を実行 [判別分析] コマンドは、データセットに対して判別分析を実行しま す。この分析では各観測が 2 つ以上のグループのうちどれに属する かを指定する「カテゴリ」変数が 1 つあるほか、グループのメンバ ーシップを予測するための説明変数が 1 つ以上あります。所属グル ープを予測するには 2 つの方法があります。任意数のグループに使 用できる全般的な方法では、各グループの各観測値と平均値との間の 「統計的距離」を計算し、最小の統計的距離に基づいて観測を分類し ます。2 番目の方法は 2 つのグループに使用されます。この方法で は判別関数 (説明変数の線形式) を計算し、各観測の判別値が何らか のカットオフ値を下回るか上回るかによって、観測を分類します。後 者の方法では、所属グループの前回の確率および、誤分類のコストを 指定できます。この場合の分類処理は、誤分類の予想コストを最小化 する処理と同じと捕らえることができます。 [判別分析] ダイ アログ ボックス この分析の設定には [判別分析] ダイアログ ボックスを使います。 分析の対象として 1 つの従属変数 (従) および、1 つ以上の独立変 数 (独) を選択する必要があります。データは「非スタック」形式で なければなりません。異なるデータセットからの変数を使用できます。 140 [判別分析] ダイアログでは次のオプションを使用できます。 [誤分類コスト] ダイアログ ボッ クス • [分類サマリーを含める] - 回帰レポートに分類サマリーを含 めます。 • [分散と共分散を含める] - 回帰レポートに分散と共分散を含 めます。 • [分類結果を含める] - 回帰レポートに分類結果を含めます。 • [誤分類テーブルを使用する] - 前回の確率や誤分類コストを 変更する場合に選択します。 • [予測を含める] - 2 番目のデータセットの独立変数値に対し て従属変数の予測値が生成されます。この予測データセット には、回帰分析の対象となる元のデータセットと同じ変数名 が含まれている必要があります。一般に予測データセットに は、従属変数の値を予測しようとしている、独立変数の値の セットが含まれています。予測には最初のデータセットから 計算された回帰方程式が使用されます。従属変数の予測値は 予測データセットに直接入力され、従属変数の列 (または行) に予測値が挿入されます。 この例のように従属カテゴリ変数となりうるグループが 2 つあり、 [誤分類テーブルを使用する] オプションが選択されている場合、前 回の確率や誤分類コストを指定するためのダイアログ ボックスが表 示されます。デフォルト設定では各グループの確率および誤分類コス トが等しくなっていますが、これらの設定は上書きできます。 リファレンス: StatTools メニューのコマンド 141 判別分析レポー ト 判別分析レポートには元のデータと分類に使われたデータの両方が含 まれています。予測された分類は、表示された判別値がカットオフ値 を下回るか上回るかに基づいています。前回の確率と誤分類コストを デフォルト設定のままにした場合、この分類処理は、2 つの統計的距 離のうち小さい方に基づいて分類を行うのと同じことになります。3 つ以上のグループがある場合には、判別値が表示されず、最小の統計 的距離に基づいて分類が行われます。レポートには、グループの記述 統計と判別関数の係数 (グループが 2 つある場合のみ)、前回の確率、 誤分類コスト、誤分類のカットオフ値 (同じくグループが 2 つの場 合のみ)、および分類処理のサマリー結果 (解釈に役立つセル コメン ト付き) もそれぞれ表示されます。この例では観測の 89% が正しく 分類されたことがわかります。この率をできるだけ高くするのが目標 です。一般に、結果を改善するにはより多くの (またはより優れた) 説明変数を使う必要があります。 142 未知のデータと データへのリン ク • 未知のデータ - 未知のデータがある場合、選択された変数のい ずれかの値が欠けているすべての行が無視されます。 • データへのリンク - 元のデータにリンクされていません。デー タが変更された場合、分析を再実行する必要があります。 リファレンス: StatTools メニューのコマンド 143 144 [品質管理] コマンド [品質管理] メニューの処理は、ある期間にわたり収集されたデータ を分析します。このタイプの分析は品質管理に適用できます。 パレート図には、カテゴリに分類されたデータの相対的な重要度が表 示されます。 4 種類の管理図では、時系列データをプロットして工程が統計的管理 状態にあるかを判断できます。チャート上のデータが管理限界内に収 まっているかを確認したり、中心線の上下に長い連がないかなど、ラ ンダムでない傾向を検査することもできます。 リファレンス: StatTools メニューのコマンド 145 [パレート図] コマンド カテゴリ化された変数のパレート図を作成 パレート図はカテゴリ化されたデータのグループ内にある有意な項目 を判断したり、これら項目の相対重要度を視覚的に表したりする場合 に便利です。一般にパレート図は品質保証の分野において、最も有意 ないくつかの要因を判断するために使用されます (パレートの 80:20 の法則)。 例えば機械部品の製造業者が、特定の製品が顧客から返品される理由 を調べることにしたとします。その場合、返品された各バッチにつき 返品理由 (サイズの誤り、表面加工の誤り、など) を入力していきま す。数か月分のデータを収集した後でパレート図を作成し、最も重大 な問題に対処することができます。 StatTools では、カテゴリのみ、またはカテゴリと値、のどちらかの 形式でパレート図を作成できます。カテゴリのみの変数には通常各読 み取りにつき 1 つの項目が含まれます。上記の例では、各セルが部 品の返品理由に対応します。セルの値は例えば「表面加工の誤り」と なり、多くのセル値が重複すると予想されます。StatTools が変数で 変数内に各項目が使用される回数をカウントし、これに対応するパレ ート図を作成します。カテゴリと値の組み合わせを選択した場合、カ テゴリおよび、各カテゴリに対応するカウントの変数を指定します。 パレート図には次の軸があります。 146 • カテゴリ - 横軸に配置されます。 • 頻度 (カウント) - 左の縦軸に配置されます。 • 累積比率 - 右の縦軸に配置されます。 [パレート図] ダ イアログ ボック ス [パレート図] ダイアログでは次のオプションを使用できます。 • [データ タイプ] - パレート図の作成に使用するデータのタ イプを [カテゴリと値] または [カテゴリのみ] のいずれか に指定します。 [パレート図] ダイアログの [カテゴリのオプション] には次のもの があります。 • [なし] - パレート図に個別の各カテゴリが 1 つのバーとし て表示されます。 • [次の固定値を持つ追加のカテゴリを含める] - パレート図の 右端に「その他」というバーが 1 つ追加され、ここに指定し た値に等しい頻度が割り当てられます。 • [次の値以下のすべてのカテゴリを結合する] - 指定した値以 下の頻度を持つすべてのカテゴリが「その他」という 1 つの カテゴリに結合され、パレート図の右端に配置されます。 リファレンス: StatTools メニューのコマンド 147 未知のデータと データへのリン ク 148 • 未知のデータ - 未知のデータがある場合、選択された変数のい ずれかの値が欠けているすべての行が無視されます。 • データへのリンク - 元のデータにリンクされていません。デー タが変更された場合、分析を再実行する必要があります。 [X-R 管理図] コマンド 時系列変数の X バー管理図および R 管理図を作成 この分析は、時系列データの X バー管理図および R 管理図を作成し ます。データは一定期間にわたり小さいサブ標本として収集したもの と仮定されます。例えば、無作為に選択された 4 つの部品の幅につ いて、作業員が 30 分ごとに測定値を収集する場合などがこれに該当 します。この場合、サブ標本サイズが 4 になります。30 分の周期で 50 回にわたりデータを収集したとすると、このデータは連続した 4 列×50 行のテーブルに配置され、データの 1 行目に変数の見出しと して SubSamp1 ~ SubSamp4 というテキストを使用できます。 この処理の目的は、データの取得対象である工程が統計的管理状態に あるかどうかを検査することです。この処理ではまずデータセットの 各行について X バーと R を計算します。X バーはその行の観測値の 平均値、R はその行の観測値の範囲 (最大から最小を引いたもの) で す。 X バーと R が中心線の周りに個別の時系列プロットとして描かれま す。X バー図の中心線は X バーの平均 (X 2 バーとも呼ばれます) であり、R 図の中心線は R バー、つまり R の平均です。工程が統計 的管理状態にあるかどうかを手早く確認するには、X バーまたは R のいずれかの値がそれぞれの上限限界 (UCL) および下限限界 (LCL) を超えていないかどうかを調べます。これらの限界は通常、中心線か ら両側に 3 標準偏差にあります。これらの図には管理限界が表示さ れるので、極端な値を簡単に見つけることができます。 また、この処理では管理状態にない動作があるかどうかを確認できま す。例えば、中心線から上部 / 下部に連続 8 点以上あるか、上方 / 下方に連続 8 点以上あるか、連続 5 点のうち少なくとも 4 点が中 心線から 1 標準偏差より遠くにあるか、連続 3 点のうち少なくとも 2 点が中心線から 2 標準偏差より遠くにあるか、などを確認できま す。 リファレンス: StatTools メニューのコマンド 149 [X バーおよび R 管理図] ダイア ログ ボックス これらのグラフの設定には、[X バーおよび R 管理図] ダイアログ ボックスを使います。 分析対象として 2 つ以上の変数を選択できます。選択されたデータ セットは、非スタック データでなければなりません。異なるデータ セットからの変数を使用できます。 [X バーおよび R 管理図] ダイアログの [グラフのオプション] には 次があります。 150 • [シグマ 1 管理限界] と [シグマ 2 管理限界] - 平均線から 1 シグマまたは 2 シグマの位置に管理限界線を追加します。 管理限界線によって、その他のタイプの管理状態外の動作が ないかを確認することができます (いわゆる「ゾーン」規則 に相当します)。 • [ゾーン A 分析] と [ゾーン B 分析] - ゾーン A (2 シグ マ) およびゾーン B (1 シグマ) を超えている点の数です。 • [上方 / 下方の連分析] と [上部 / 下部の連分析] - 連続 8 単位以上の上方または下方への動きを検知します。 • [グラフ範囲をインデックスで制限] - グラフ上の点を、変数 のデータ ポイントの特定範囲 (開始インデックスから終了イ ンデックスまで) に制限します。 [X バーおよび R 管理図] ダイアログの [管理限界計算の基準] オプ ションでは、管理限界の計算の基準となるデータを指定します。次の オプションがあります。 • [すべての観測] - すべての使用可能なデータを使って管理限 界を計算します。 • [範囲内の観測] - [開始インデックス] と [終了インデック ス] の間のデータを使って管理限界を計算します。 • [前回のデータ] - 前回の観測データを使って管理限界を計算 します。前回のデータから計算された [サブ標本サイズ]、 [平均 R]、および [平均 X バー] を入力してください。 X バー管理図の 例 リファレンス: StatTools メニューのコマンド 151 R 管理図の例 未知のデータと データへのリン ク 152 • 未知のデータ - 未知のデータは許可されません。 • データへのリンク - グラフはデータにリンクされていません。 [P 管理図] コマンド 時系列変数の P 管理図を作成 P 管理図は「属性」データに使用されます。属性データの場合、各観 測は項目の標本から仕様に適合しない項目の数 (または比率) を示し ます。例えばある工程で 30 分ごとに特定数の項目が作成され、うち いくつかが不適合項目であると仮定します。その場合、P 管理図によ り 30 分ごとの不適合項目の比率をプロットします。この目的は、ほ かの管理図と同じく工程が管理状態にあるかを判断することです。 この処理には、各標本の不適合項目の数を含む変数か、各標本の不適 合項目の比率を含む変数のうち、少なくとも 1 つを持つデータセッ トが必要です。オプションとして、標本サイズを含む変数を使用する こともできます。標本サイズの変数がない場合、すべての標本で一定 していると仮定される標本サイズを手動で入力する必要があります。 ただし標本サイズの変数がある場合には、標本サイズが一定している 必要はありません。 [P 管理図] ダイ アログ ボックス このグラフの設定には [P 管理図] ダイアログ ボックスを使います。 リファレンス: StatTools メニューのコマンド 153 分析の対象として 1 つの値変数と、オプションでサイズ変数を選択 します。選択されたデータセットは、非スタック データでなければ なりません。異なるデータセットからの変数を使用できます。 [P 管理図] ダイアログ ボックスの [入力データ] のオプションには 次があります。 • [不適合項目の数] - 値変数が、標本全体に含まれる不適合項 目の実際の数を示すことを指定します。 • [不適合項目の比率] - 値変数が、標本全体のうち不適合項目 の占める比率を示すことを指定します。 [P 管理図] ダイアログ ボックスの [標本サイズ] のオプションには 次があります。 • [サイズ変数を使用する] - サイズ変数を使用して各標本の合 計サイズを求めるよう指定します。 • [共通サイズを使用する] - サイズ変数を使わずに、すべての 標本に入力したサイズを使用するよう指定します。 [P 管理図] ダイアログ ボックスの [グラフのオプション] には次が あります。 154 • [シグマ 1 管理限界] と [シグマ 2 管理限界] - 平均線から 1 シグマまたは 2 シグマの位置に管理限界線を追加します。 管理限界線によって、その他のタイプの管理状態外の動作が ないかを確認することができます (いわゆる「ゾーン」規則 に相当します)。 • [ゾーン A 分析] と [ゾーン B 分析] - ゾーン A (2 シグ マ) およびゾーン B (1 シグマ) を超えている点の数です。 • [上方 / 下方の連分析] と [上部 / 下部の連分析] - 連続 8 単位以上の上方または下方への動きを検知します。 • [グラフ範囲をインデックスで制限] - グラフ上の点を、変数 のデータ ポイントの特定範囲 (開始インデックスから終了イ ンデックスまで) に制限します。 [P 管理図] ダイアログの [管理限界計算の基準] オプションでは、 管理限界の計算の基準となるデータを指定します。次のオプションが あります。 • [すべての観測] - すべての使用可能なデータを使って管理限 界を計算します。 • [範囲内の観測] - [開始インデックス] と [終了インデック ス] の間のデータを使って管理限界を計算します。 • [前回のデータ] - 前回の観測データを使って管理限界を計算 します。前回のデータから計算された [サブ標本サイズ] と [平均 P] を入力してください。 P 管理図の例 未知のデータと データへのリン ク • 未知のデータ - 未知のデータは許可されません。 • データへのリンク - グラフはデータにリンクされていません。 リファレンス: StatTools メニューのコマンド 155 [C 管理図] コマンド 時系列変数の C 管理図を作成 C 管理図は、一定サイズの項目の不良の数をプロットするために使用 します。例えば、自動車のドアを 50 個ずつバッチ生産していると仮 定します。その場合、各バッチにつき欠陥 (ペイントの欠陥や縁の仕 上げが粗いなど) の数をカウントすることができます。その後、取得 したカウントを図にプロットします。この目的は、ほかの管理図と同 じく工程が管理状態にあるかを判断することです。 C 管理図のデータセットには、各項目の不良個数を含む変数が 1 つ 必要です。項目サイズはすべての観測で均等と仮定されます。例えば、 自動車ドアの 1 バッチを 1 つの「項目」とする場合、すべてのバッ チに同数のドアが含まれると仮定します。 [C 管理図] ダイ アログ ボックス このグラフの設定には [C 管理図] ダイアログ ボックスを使います。 分析対象として 1 つ以上の変数を選択します。選択されたデータセ ットは、非スタック データでなければなりません。異なるデータセ ットからの変数を使用できます。 156 [C 管理図] ダイアログ ボックスの [グラフのオプション] には次が あります。 • [シグマ 1 管理限界] と [シグマ 2 管理限界] - 平均線から 1 または 2 シグマの位置に管理限界線を追加します。管理限 界線によって、その他のタイプの管理状態外の動作がないか を確認することができます (いわゆる「ゾーン」規則に相当 します)。 • [ゾーン A 分析] と [ゾーン B 分析] - ゾーン A (2 シグ マ) およびゾーン B (1 シグマ) を超えている点の数です。 • [上方 / 下方の連分析] と [上部 / 下部の連分析] - 連続 8 単位以上の上方または下方への動きを検知します。 • [グラフ範囲をインデックスで制限] - グラフ上の点を、変数 のデータ ポイントの特定範囲 (開始インデックスから終了イ ンデックスまで) に制限します。 [C 管理図] ダイアログの [管理限界計算の基準] オプションでは、 管理限界の計算の基準となるデータを指定します。次のオプションが あります。 • [すべての観測] - すべての使用可能なデータを使って管理限 界を計算します。 • [範囲内の観測] - [開始インデックス] と [終了インデック ス] の間のデータを使って管理限界を計算します。 • [前回のデータ] - 前回の観測データを使って管理限界を計算 します。前回のデータから計算された [平均 C] を入力して ください。 リファレンス: StatTools メニューのコマンド 157 C 管理図の例 未知のデータと データへのリン ク 158 • 未知のデータ - 未知のデータは許可されません。 • データへのリンク - グラフはデータにリンクされていません。 [U 管理図] コマンド 時系列変数の U 管理図を作成 U 管理図は C 管理図と似ていますが、ここでは不良率をプロットし ます。例えば、上記の自動車のドアの例でバッチ サイズが一定して おらず、各バッチによりドアの数が異なる場合を仮定します。その場 合、U 管理図を使用してドア 1 個当たりの不良率、つまりバッチ当 たり不良個数をそのバッチのドアの数で除算した値をプロットします。 この目的は、ほかの管理図と同じく工程が管理状態にあるかを判断す ることです。 この処理には、各観測の不良個数を含む変数、または各観測の不良比 率を含む変数のうち少なくとも 1 つを持つデータセットが必要です。 オプションとして、項目サイズを含む変数を使用することもできます。 サイズの変数がない場合、すべての観測で一定していると仮定される 項目サイズを手動で入力する必要があります。ただしサイズの変数が ある場合には、項目サイズが一定している必要はありません。 [U 管理図] ダイ アログ ボックス このグラフの設定には [U 管理図] ダイアログ ボックスを使います。 リファレンス: StatTools メニューのコマンド 159 分析の対象として 1 つの値変数と、オプションでサイズ変数を選択 します。選択されたデータセットは、非スタック データでなければ なりません。異なるデータセットからの変数を使用できます。 [U 管理図] ダイアログ ボックスの [入力データ] のオプションには 次があります。 • [不良個数] - 値変数が標本全体に含まれる不良項目の実際の 数を示すことを指定します。 • [不良率] - 値変数が標本全体のうち不良項目の占める比率を 示すことを指定します。 [U 管理図] ダイアログ ボックスの [標本サイズ] のオプションには 次があります。 • [サイズ変数を使用する] - サイズ変数を使用して各標本の合 計サイズを求めるよう指定します。 • [共通サイズを使用する] - サイズ変数を使わずに、すべての 標本に入力したサイズを使用するよう指定します。 [U 管理図] ダイアログ ボックスの [グラフのオプション] には次が あります。 160 • [シグマ 1 管理限界] と [シグマ 2 管理限界] - 平均線から 1 シグマまたは 2 シグマの位置に管理限界線を追加します。 管理限界線によって、その他のタイプの管理状態外の動作が ないかを確認することができます (いわゆる「ゾーン」規則 に相当します)。 • [ゾーン A 分析] と [ゾーン B 分析] - ゾーン A (2 シグ マ) およびゾーン B (1 シグマ) を超えている点の数です。 • [上方 / 下方の連分析] と [上部 / 下部の連分析] - 連続 8 単位以上の上方または下方への動きを検知します。 • [グラフ範囲をインデックスで制限] - グラフ上の点を、変数 のデータ ポイントの特定範囲 (開始インデックスから終了イ ンデックスまで) に制限します。 [U 管理図] ダイアログの [管理限界計算の基準] オプションでは、 管理限界の計算の基準となるデータを指定します。次のオプションが あります。 • [すべての観測] - すべての使用可能なデータを使って管理限 界を計算します。 • [範囲内の観測] - [開始インデックス] と [終了インデック ス] の間のデータを使って管理限界を計算します。 • [前回のデータ] - 前回の観測データを使って管理限界を計算 します。前回のデータから計算された [サブ標本サイズ] と [平均 U] を入力してください。 U 管理図の例 未知のデータと データへのリン ク • 未知のデータ - 未知のデータは許可されません。 • データへのリンク - グラフはデータにリンクされていません。 リファレンス: StatTools メニューのコマンド 161 162 [ノンパラメトリック検定] メニュー 「ノンパラメトリック」検定とは、基盤の確率分布に関する仮説を検 定するためにデータの標本に対して適用される統計的処理のことです。 「パラメトリック」仮説検定の方が一般に広く使われていますが、ノ ンパラメトリック検定には、さまざまな状況により適した利点が数多 くあります。 パラメトリック仮説検定では、基盤となる確率分布のタイプ (通常は 正規分布) について仮定した上で、そのタイプの分布のパラメーター (通常は平均値と標準偏差) を推定します。ところが実際には正規性 の仮定が誤っているケースが多く見られます。例えば、顧客サービス センターでの 1 時間当たりの受付通話数や、スーパーのレジでの待 ち時間などは正規分布に従いません。ノンパラメトリック検定では、 基盤となる分布のタイプについての仮定が必要ありません。検定の種 類によっては分布の形状についての全般的な仮定を行うものもありま す。例えばウィルコクソン符号順位検定では、対称な分布を仮定しま す。ほかの 2 つの検定 (符号検定とマンホイットニー検定) では、 分布の形状についての仮定は行われません。 一般に標本サイズが小さい場合はノンパラメトリック検定の方が適し ています。標本が大きい場合には正規検定を適用することができます。 正規分布の仮定が正しいと判断できればパラメトリック検定を使用で きますが、標本サイズが小さい場合の正規検定では、正規分布とほか のタイプの分布の区別が難しくなります。そこでノンパラメトリック 検定を使用することにより、こうした問題を回避できます。 リファレンス: StatTools メニューのコマンド 163 順序データ データのタイプによっては、ノンパラメトリック検定で処理できても パラメトリック検定を使用できないことがあります。この例に順序デ ータが挙げられます。順序データでは観測が順位付けにおける位置を 表す数として表されますが、これら 2 つの数値間の距離には意味が ありません。例えば、最終学歴を 0 (高校未満)、1 (高校中退)、2 (高校修了)、3 (大学中退)、4 (大学修了)、そして 5 (大学院) とい うコードで表すとします。この尺度を使用した場合、「高校修了」と 「高校未満」の間の差と、「大学院」と「大学中退」の間の差は順位 から見た場合にはどちらも 2 ですが、それぞれの間に見られる実際 の教育水準の差が等しいとは限りません。この分析パックにはこうし たデータに適用できる、符号検定 (1 標本分析タイプ) とマンホイッ トニー検定という処理が用意されています。 用途のまとめ ノンパラメトリック検定は、パラメトリック検定では対処できない次 のような状況に適用できます。 • • • 164 基盤となる確率分布についての情報が少ない場合 標本サイズが小さすぎるため正規分布仮定の検定結果を信頼 できない場合 順序データを処理する場合 [符号検定] コマンド 変数の符号検定を実行 [符号検定] コマンドは、1 つの変数のメジアン (1 標本分析)、また は変数の対の差のメジアン (対標本分析) についての仮説検定を実行 します。この検定では分布の形状に関する仮定を行いません (特に正 規分布は仮定されません)。1 標本分析は、上記で説明したように順 序データに使用できます。 [符号検定] ダイ アログ ボックス この分析の設定には [符号検定] ダイアログ ボックスを使います。 選択する変数の数は [分析のタイプ] の選択内容により異なります。 1 標本分析には 1 つ以上の変数が必要ですが、対標本分析には 2 つ の変数が必要です。1 標本分析では選択した変数はスタック データ と非スタック データの両方の場合があります。対標本分析の場合、 非スタック データでなければなりません。異なるデータセットから の変数を使用できます。 リファレンス: StatTools メニューのコマンド 165 [符号検定] ダイアログでは次のオプションを使用できます。 • • 符号検定レポー ト 166 [分析のタイプ] - 実行する分析のタイプを選択します。次の オプションがあります。 - [1 標本分析] - 単一の数値変数について仮説検定を実 行します。 - [対標本分析] - この分析は、2 つの変数が自然な対 (ペア) を成す場合に適しています。これは対の間の差 について 1 標本分析を実行するのに相当します。 [メジアン] または [差のメジアン] - [帰無仮説値] - 帰無仮説下での母集団パラメーターの 値です。 - [対立仮説のタイプ] - 分析中に評価される、帰無仮説 値に対立する値です。[対立仮説のタイプ] は「片側」 (帰無仮説を上回るか下回るか) または「両側」(帰無仮 説に等しくない) のどちらかです。 未知のデータと データへのリン ク • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更された 場合、出力も自動的に変更されます。 リファレンス: StatTools メニューのコマンド 167 [ウィルコクソン符号順位検定] コマンド 変数のウィルコクソン符号順位検定を実行 [ウィルコクソン符号順位検定] コマンドは、1 つの変数のメジアン (1 標本分析)、または変数の対の差のメジアン (対標本分析) につい ての仮説検定を実行します。この検定は、対称の確率分布を仮定しま す (正規分布は仮定しません)。 この分析の設定には [ウィルコクソン符号順位検定] ダイアログ ボ ックスを使います。 [ウィルコクソン 符号順位検定] ダイアログ ボッ クス 選択する変数の数は [分析のタイプ] の選択内容により異なります。 1 標本分析には 1 つ以上の変数が必要ですが、対標本分析には 2 つ の変数が必要です。1 標本分析では選択した変数がスタック データ と非スタック データの両方の場合があります。対標本分析の場合、 非スタック データでなければなりません。異なるデータセットから の変数を使用できます。 168 [ウィルコクソン符号順位検定] ダイアログでは次のオプションを使 用できます。 • • • [分析のタイプ] - 実行する分析のタイプを選択します。次 のオプションがあります。 - [1 標本分析] - 単一の数値変数について仮説検定を実 行します。 - [対標本分析] - このタイプの分析は、2 つの変数が自 然な対 (ペア) を成す場合に適しています。これは対の 間の差について 1 標本分析を実行するのに相当します。 [メジアン] または [差のメジアン] - [帰無仮説値] - 帰無仮説下での母集団パラメーターの 値です。 - [対立仮説のタイプ] - 分析中に評価される、帰無仮説 値に対立する値です。[対立仮説のタイプ] は「片側」 (帰無仮説を上回るか下回るか) または「両側」(帰無仮 説に等しくない) のどちらかです。 [正規近似の計算で同順位補正を行う] - 正規近似を使用す る場合のみ、検定で同順位補正を行うよう指定することをお 勧めします。この補正はグループ内の同順位の要素の数をカ ウントし、その結果に基づいて分散量を減らします。同順位 補正を行うと、同順位の要素が存在する場合には常に z 統 計の値が大きくなります。(注意: 同順位の要素がない場合 には、同順位補正を行っても分散量は変化しません。) リファレンス: StatTools メニューのコマンド 169 ウィルコクソン 符号順位検定レ ポート 注意: このレポートでは、標本サイズが 15 より大きい場合に正規 近似を使って P 値が計算されます。 未知のデータと データへのリン ク 170 • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更された 場合、出力も自動的に変更されます。 [マンホイットニー検定] コマンド 変数のマンホイットニー検定を実行 [マンホイットニー検定] コマンドは、2 つの標本についての仮説検 定を実行します。この検定の「メジアン バージョン」では、2 つの 母集団のメジアンが同一であるという仮説が立てられます。また、そ れぞれ確率分布も同じ形状であると仮定します。もう一方の「一般バ ージョン」ではこの仮定を行わず、仮説はどちらかの分布がもう片方 より小さい値を生み出す傾向にあることを否定します (具体的には P[X1>X2] = P[X2>X1] という仮説となり、ここで P[X1>X2] は母集団 1 の観測が母集団 2 の観測より大きくなる確率を示します)。マンホ イットニー検定を使用して、2 つの標本が同じ確率分布により生成さ れているという仮説を棄却できます。マンホイットニー検定は、ウィ ルコクソン順位和検定とも呼ばれます。 [マンホイットニ ー検定] ダイア ログ ボックス この分析の設定には [マンホイットニー検定] ダイアログ ボックス を使います。 分析には 2 つの変数が必要です。これらの変数はスタック データと 非スタック データの両方が可能で、異なるデータセットからの変数 を使用できます。 リファレンス: StatTools メニューのコマンド 171 [マンホイットニー検定] ダイアログでは次のオプションを使用でき ます。 • [分析のタイプ] - 帰無仮説と対立仮説を立てる方法を選択 します。次のオプションがあります。 - [一般バージョン] - 一方の確率分布が他方よりも小さい 値を生み出す傾向にあるかどうかを判断するための仮説 検定を実行します。 - [仮説] セクション o [帰無仮説] - 一方の確率分布が他方より小 さい値を生み出す傾向にあることを否定しま す。具体的には P[X1>X2] = P[X2>X1] とな ります。ここで P[X1>X2] は母集団 1 から の観測が母集団 2 からの観測より大きくな る確率を示します。P[X2>X1] についても同 様に解釈します。連続型分布の場合、これら 両方の確率が 0.5 (P[X1>X2] = P[X2>X1] = 0.5) であるという仮説と同じです。 o [対立仮説のタイプ] - [対立仮説のタイプ] は「片側」(一方の確率が他方を上回るか下 回るか) または「両側」(2 つの確率が等し くない) のどちらかです。 [メジアン バージョン] - 一方の母集団のメジアンが他 方の母集団のメジアンと等しいか、それとも異なるかを 判断するための仮説検定を実行します。2 つの分布が同 じ形状をしていると仮定します。 [仮説] セクション o [帰無仮説] - 2 つのメジアンが等しいとい う仮説です。 o [対立仮説のタイプ] - [対立仮説のタイプ] は「片側」(最初の母集団のメジアンが 2 番 目の母集団のそれを上回るか下回るか) また は「両側」(メジアンが等しくない) のどち らかです。 注意: 検定の一般バージョンとメジアン バージョンでは実行される 計算自体は同じですが、等しい分布形状の仮定の有無および、帰無仮 説についての扱い方が若干異なります。2 つのバージョンが用意され 172 ているのは、分布がほぼ同形状をしていると仮定できない場合でも、 適切な帰無仮説さえ立てることができればマンホイットニー検定を適 用できるようにするためです。つまり、2 つの分布の形状が明らかに 異なる場合に検定を実行し、検定により帰無仮説が棄却された場合、 メジアンが異なることが理由である可能性もありますが、分散量が異 なるなど、その他の原因も考えられます。 • [正規近似の計算で同順位補正を行う] - 正規近似を使用する 場合のみ、検定で同順位補正を行うことを指定するよう推奨 します。この補正はグループ内の順位が同じ要素の数をカウ ントし、その結果に基づいて分散量を減らします。同順位補 正を行うと、同順位の要素が存在する場合には z 統計の値が 常に大きくなります。(注意: 同順位の要素がない場合には、 同順位補正を行っても分散量は変化しません。) マンホイットニ ー検定レポート 上記のレポートでは、2 標本のうち 1 つのサイズが 10 より大き い場合 (ただし一方のサイズが 11 または 12 で、他方のサイズが 3 または 4 の場合を除きます) に、正規近似を使って P 値が計算 されます。 リファレンス: StatTools メニューのコマンド 173 未知のデータと データへのリン ク 174 • 未知のデータ - 未知のデータが許可されます。選択された変数 の、未知のデータがあるすべての行が無視されます。 • データへのリンク - すべてのレポートが、データにリンクされ ている数式により計算されます。選択した変数の値が変更された 場合、出力も自動的に変更されます。 [クラスカル・ウォリス検定] コマンド 変数のクラスカル・ウォリス検定を実行 [ クラスカル・ ウォリス検定 ] コマンドは、3 つ以上の標本について仮説検定を実行します。この検定は変数の対に使用されるマンホイッ ト ニー検定を拡張したものです。一般バージョ ンの検定では、すべての標本が同じ分布から 得られるという仮説が立てられます。その場合は連続分布が仮定されます。これに対して、 すべての母集団分布が (正規またはそれ以外の) 同じ形状を持つと仮定できる場合には、これら母集団のメジアンはすべて等しいという仮説 が成り立ちます。 この分析の設定には [クラスカル・ ウォリス検定] ダイアログを使います。 [クラスカル・ウ ォリス検定] ダイ アログ 3 つ以上の変数を選択できます。スタック形式と非スタック形式の両方のデータセット を使用 できます。異なるデータセット からの変数を組み合わせて使用できます。 リファレンス: StatTools メニューのコマンド 175 [ できます クラスカル 。 ・ ウォリス検定 • 176 [分析のタイプ] - 実行する分析のタイプを選択します。次のオ プションがあります。 - [一般バージョン] - 値変数が各母集団において連続分布に 従い、すべての標本が同じ分布から抽出されるという帰 無仮説が立てられます。 - [メジアン バージョン] - すべての母集団分布が同じ形で あると仮定され、これら母集団のメジアンが同一である という帰無仮説が立てられます。 • [マンホイットニー U 検定] - クラスカル・ウォリス検定は、 一元配置 ANOVA と同様にカテゴリ間に有意な相違があるか どうかを示しますが、具体的にどのカテゴリが異なるかは示 されません。そこで StatTools には、ボンフェローニ補正を 用いたマンホイットニー U 検定が用意されています。ボンフ ェローニ補正は、同じデータに対していくつかの統計的検定 を同時に実行する場合に p 値に加えられる調整です。 • [同順位補正] - KW 検定統計量の標本分布の分散は同順位によ り影響されるので、検定統計量の計算時に同順位の補正を行 うことができます。 ] ダイアログで クラスカル・ウ ォリス検定レポ ート このレポート では 値を計算するには • p 値がカイ二乗近似を使って計算されます。Stat Tools 3 つの方法があります。 でp カイ二乗近似 - KW 検定統計量の標本分布がカイ二乗分布で 近似されるという仮定のもとで p 値が計算されます。変数の 数および各変数内の観測値の数が増えるにつれて、近似は改 善されます。 リファレンス: StatTools メニューのコマンド 177 • 厳密 - KW 検定統計量の真の分布に基づいて p 値が計算され ます。この計算は、標本データの順位をすべての可能な組み 合わせに並べ替える必要があるため (検定統計量の値は可能 なすべてのシナリオで計算する必要があります)、大量のリソ ースを使用します。したがって、このオプションは標本数が 少ない場合のみ使用してください。 • モンテカルロ - この方法は、モンテカルロ抽出法を用いたバ イアスなしの正確な p 値の推定値を提供し、信頼区間を表示 します。厳密な計算方法を使用するにはデータセットが大き すぎる場合、あるいはカイ二乗近似に必要な仮定が満たされ ない場合に使用されます。 StatTools は、変数の数 k が4 以下で、観測 以下の場合に厳密な計算を使用します。モンテカルロ法は、厳密な計算方法を使 用できず、次のいずれかが満たされる場合に使用されます: 1. 変数の数が3 より大きく (k > 3)、変数のうち少なく とも 1 つに含まれる観測値の数が少ない (ni ≤ 5) 場合。2.厳密に3 つの変数があり、これらの変数に含まれる観測値の合計数 N が30 以下の場合。モンテカルロ法は 10000 回の反復試行を実行し (つまり 10000 個の標本を選択し )、全変数の観測値の合計数は最大25000 個まで使用できます。厳密な計算またはモンテカルロ法を使用できない場合には 、カイ二乗近似が使用されます。 未知のデータと データへのリン ク 178 • 未知のデータ - 未知のデータが許可されます。選択された変 数の、未知のデータがあるすべてのセルが無視されます。 • データへのリンク - データにリンクされた数式を使ってライ ブ レポートが計算されます。選択した変数の値が変更した場 合、レポートの値は自動的に更新されます。p 値の計算法も 必要に応じて自動的に変更されます。 多変量解析 [主成分分析] コマンド 選択した変数に対し主成分分析を実行 主成分分析は、多変量データセットの次元を減らすための手順です。 具体的には、相関関係を持つ変数のセットを、より少数の相関のない 変数のセットに変換します。 通常この分析は、その他の分析への入力として使用されます。 • 線形回帰では、多重共線性問題がある場合や、独立変数の数 が観測値の数よりも多い場合に主成分分析が使用されます。 • 外れ値およびクラスターの存在を確認するため、最初の 2 つ の主成分の散布図を作成すると有益です。 この分析の設定には [主成分分析] ダイアログを使います。 [主成分分析] ダ イアログ リファレンス: StatTools メニューのコマンド 179 2 つ以上の変数を選択できます。選択するデータセットは、非スタッ ク形式でなければなりません。異なるデータセットからの変数を組み 合わせて使用できます。 [主成分分析] ダイアログでは次のオプションを使用できます。 • [ [行列のタイプ] - 主成分を抽出する行列を選択します。次のオ プションがあります。 - [共分散行列] - 共分散行列から主成分を計算します。この オプションは、異なる変数に使用される測定スケールが 同類である場合に使用します (例えばセンチメートルとイ ンチは同類の単位ですが、インチと華氏は異類となりま す)。 - [相関行列] - 相関行列から主成分を計算します。このオプ ションは、異なる変数に使用される測定スケールが同類 でない場合に使用します。 計 セクショ 算する主 ンには 成分の 次 数 のオプショ ] ンがあります。 • [成分の固定数] - 計算する主成分の数を指定します。このオプ ションは、計算する成分の数が既にわかっている場合に使用 します。 • [指定された合計分散の比率に対応する成分] - 合計分散のう ち指定された割合を説明するのに十分な数の成分を維持しま す。 • [平均成分分散を上回る成分] - すべての成分の分散の平均を 上回る分散を持つ成分を維持します。 その他にもいくつかのオプションを使用できます。 180 • [スクリー プロット] - 各成分で説明される合計分散の割合を プロットします。 • [最初の 2 成分のスコア プロット] - 最初の主成分を 2 番目の 主成分に対してプロットします。 • [カテゴリ変数で分類する] - 最初の 2 つの主成分の散布図を カテゴリ変数ごとに色分けして作成するにはこのオプション を使用します。 • [各カテゴリに楕円を含める] - 同じカテゴリのポイントをク ラスタリングする楕円形を作成します。 スクリー プロット スコア プロット リファレンス: StatTools メニューのコマンド 181 • [成分の場所] - 主成分を表す変数を生成するかどうかを指定し ます。生成する場合、これらの変数を元のデータセットと新 しいデータセットのどちらに配置するかを選択できます。数 値変数が複数のデータセットから選択された場合、成分を新 しいデータセットに配置するオプションだけを使用できます。 [成分の場所] オプションを選択すると、成分の値を含む列が 選択したデータセットの右に配置されます。 • 未知のデータ - 未知のデータが許可されます。選択された変 数に未知のデータがあるすべての行が無視されます。カテゴ リ変数ごとに分類する場合、未知のカテゴリは「N/A」とい う名前に変更されます。 • データへのリンク – 元のデータへのリンクはありません。デ ータが変更された場合、分析を再実行する必要があります。 主成分のあるデ ータセット 未知のデータと データへのリン ク 182 [クラスター分析] コマンド データセットのクラスター分析を実行 [ クラスター分析 ] コマンドは、観測値や変数を類似項目のグループに分類するために、データセット 内にある パターンを検索します。この手順ではいく つかの「 凝集階層型」 手法を使用します。各手法 は個別のクラスターにある各観測値で開始され、一連のステップを経てクラスターを組み合 わせて最終的にすべての観測値を含む 1 つのクラスターが形成されます。最後の単一クラスターが形成される前にこの手順のステッ プのいずれかを選択することで、データセット の一部分を類似した項目のグループとして取 得します。 この分析ではさまざまな凝集階層型手法と距離測定がサポート されます。また、 つのオプショ ンから選択し、最終的に生成されるクラスターの数を指定することもできます 。クラスター形成プロセスの概要は、「 系統樹」 と呼ばれるグラフと、プロセスのステップ を示すテーブルによって説明されます。 リファレンス: StatTools メニューのコマンド 183 3 この分析の設定には [クラスター分析] ダイアログを使います。 [クラスター分 析] ダイアログ 2 つ以上の変数を選択できます。選択するデータセットは、非スタッ ク形式でなければなりません。異なるデータセットからの変数を組み 合わせて使用できます。 [クラスター分析] ダイアログの上部で次を選択できます。 [分析のタイプ] - 実行する分析のタイプを選択します。観測値をグル ープに分類するには [クラスター観測]、変数をグループに分類するに は [クラスター変数] を選択します。 184 [クラスター分析] ダイアログ - [ク ラスタリングの設 定] タブ このダイアログの最初のタブ ([クラスタリングの設定] タブ) では次を 指定できます。 • [凝集的手法] - 階層クラスタリングは、順次実行されるプロセ スです。凝集法による階層型手法の各ステップで、1 つの観 測値または観測値のクラスターが別のクラスターにマージさ れます。これらの手法では、各ステップでどのクラスター ペ アをマージするかを決定するために観測値間の距離を測定し、 その距離に基づいてクラスター間の距離を計算したうえで、 距離が最短の 2 つのクラスターをマージします。使用する凝 集型クラスタリングの手法によって、それぞれ異なる方法で クラスター間の距離が定義されます。 - 単一 (最近傍) - クラスター A と B の距離は、A にあるポ イントと B にあるポイント間の最小距離として次のよう に定義されます: d(A,B) = min{d(xi,yj), for xi in A and yj in B} ここで d(xi,yj) は、ベクトル xi と yj の間の距離です。 - 完全 (最遠傍) - クラスター A と B の距離は、A にあるポ イントと B にあるポイント間の最大距離として次のよう に定義されます: d(A,B) = max{d(xi,yj), for xi in A and yj in B} ここで d(xi,yj) は、ベクトル xi と yj の間の距離です。 - 平均連結法 - クラスター A と B の距離は、A にある nA 個のポイントと B にある nB 個のポイント間の nA*nB 個 の距離の平均として次のように定義されます: d(A,B) = ∑∑d(xi,yj) / (nA*nB) ここで和は A のすべての xi と B のすべての yj について 求められます。 - 重心法 - クラスター A と B の距離は、2 つのクラスター の平均ベクトル (これを重心と呼びます) 間の距離として 次のように定義されます: d(A,B) = d(x̄A, ȳB) ここで x̄A と ȳB は、それぞれ A の観測ベクトルと B の 観測ベクトルの平均ベクトルです。 リファレンス: StatTools メニューのコマンド 185 - メジアン - 重心法と似ていますが、新しいクラスターの 重心が、古いグループの重心の間のメジアン (中央点) と して次のように計算されます: centroid(A,B) = (x̄A + ȳB) / 2 ここで x A と y B は、それぞれクラスター A と B の 「重心」です。(このメジアンは、統計で通常使用される メジアンとは異なる点に注意してください。)クラスター 間の距離は、この方法で計算されたクラスターの重心の 間の距離です。 - • 186 ウォード法 - この手法は各ステップで最小分散基準を使 用してマージするクラスターのペアを選択するので、正 確にはウォードの最小分散法として知られます。 [距離測定] - 選択した凝集型手法で使用される、距離の測定方 法を選択します。次のオプションがあります。 - ユークリッド - 2 乗ユークリッド - マハラノビス - マンハッタン (別名「市街地」距離) - 相関 (変数をクラスタリングする場合) - 絶対相関 (変数をクラスタリングする場合) • [変数を標準化する] - 距離行列を計算する前に、各変数から 平均値を差し引き、その結果を標準偏差値で除算します。こ のオプションは、測定スケールの単位が異なり、スケールの 差異による影響を最小化したい場合に使用します。 • [クラスターの最終数] - 最終的に生成されるクラスターの数 を指定します。次のオプションがあります。 - [固定数] - [類似度水準の使用] - クラスター A と B の間の類似度水 準は次のように定義されます: s(A,B)=100(1-d(A,B))/dmax ここで d(A,B) はクラスター A と B の間の距離、dmax は 元の距離行列 D にある最大値です。 - [自動 (Mojena 手法)] - 選択されるクラスターの数は、系 統樹の次の条件を満たす最初の段階に対応します。 αj > ᾱ + ksα for j=1,2,...,n ここで、α1,α2, ...,αn は n, n-1,…,1 個のクラスターを持つ 段階の距離値、ᾱ と sα はそれぞれ個々の α 値の平均と標 準偏差、k は定数です。ミリガンとクーパーは、シミュ レーション分析の研究結果から、k を 1.25 に設定するよ う推奨しています (1985 年 6 月発行『Psychometrika』ボ リューム 50、第 2 号、159 ~ 179 ページの「An examination of procedures for determining the number of clusters in a data set」)。 [クラスター分 析] ダイアログ - [オプション] タブ リファレンス: StatTools メニューのコマンド 187 このダイアログのオプショ ンを使用して、生成されるグラフ、テーブル、および変数の設定 を指定します。次のオプショ ンがあります。 188 • [スクリー プロット] - X 軸にクラスターの数 (左端の単一クラ スターの解から開始)、Y 軸にオブジェクトまたはクラスター がマージされる距離をプロットします。 • [系統樹] - クラスターとサブクラスターの関係、およびクラス ターがマージされた順序の両方を示す、ツリー状の図をプロ ットします。この図では次の設定を指定できます。 • [方向] - 水平または垂直に指定します。 • [Y 軸] - Y 軸に表示される測定値を選択します。 • [クラスターを色で識別する] - 最大 15 色を使用できます。 • [プロファイル プロット] - 各ラインが 1 つのクラスターを示 す、一連の色付きのラインです。クラスターごとに各変数の 平均がプロットされ、各ポイントはそのクラスターを表す色 付きのラインでつながれています。互いに距離が近いライン は類似したクラスターを示し、遠くにあるラインは類似度の 低いクラスターを示します。 • [距離行列] - 初期の距離行列を表示します。 • [凝集ステップ] - 凝集ステップの詳細を表示します。 • [変数からの観測値ラベルを使用する] - 観測値のラベルを含 む変数を選択します。この変数の値を繰り返すことはできま せん。これは系統樹および凝集ステップのテーブルに使用さ れます。 • [クラスター メンバーシップの場所] - 各観測がどのクラスタ ーのものかを特定するための変数を挿入します。挿入する場 合、これらの変数を元のデータセットと新しいデータセット のどちらに配置するかを選択できます。 クラスター分析 レポート リファレンス: StatTools メニューのコマンド 189 クラスター メン バーシップのあ るデータセット 未知のデータと データへのリン ク 190 [クラスター メンバーシップの場所] オプションを選択すると、選択 したデータセットの右にグループ メンバーシップを示す列が配置さ れます。 • 未知のデータ - 未知のデータが許可されます。選択された変 数に未知のデータがあるすべての行が無視されます。 データへのリンク 元のデータへのリンクはありません。データが変更された場合、分析を再実行する必要 があります。 [ユーティリティ] メニュー [アプリケーション設定] コマンド StatTools のレポート、グラフ、ユーティリティ、データセット、分 析の設定を指定 [アプリケーション設定] コマンドを使用して、StatTools のレポー ト、グラフ、ユーティリティ、データセット、および分析の設定を行 います。これらの設定はすべての分析とデータセットに適用されます。 その他の分析固有の設定は、各分析のダイアログ ボックスで個別に 定義します。 リファレンス: StatTools メニューのコマンド 191 レポート レポートでは、StatTools の分析により生成されるレポートやグラフ のオプションを指定します。次の設定があります。 • • [配置] - Excel 内のどこに新しいレポートを配置するかを次 から選択します。 - [アクティブなブック] - 各レポートにつきワークシー トが新規作成されます。 - [新規ブック] - 必要に応じて StatTools レポート ブ ックが新規作成され、各レポートがそのブックのシート に配置されます。 - [アクティブなシートの最後の使用列の後] - 各 StatTools レポートがアクティブなシートの最後の使用 列の右に配置されます。 - [開始セルを確認する] - 分析の実行後にレポートまた はグラフの左上隅を配置するセルを選択できます。 - [同じ新規ブックの再利用] - 新規ブックが作成される 場合、その新規ブックがすべてのレポートに使用されま す。 [更新の環境設定] - 変数データが変更された場合の結果の更 新方法を指定します。結果の更新オプションは次のとおりで す。 - [ライブ - 入力データにリンク] - 入力データが変更さ れるとレポートも自動的に更新されます。 - [静的] - 入力データが変更されてもレポートは更新さ れません。処理の実行時に入力データの値に基づいて統 計値が固定されます。 StatTools で結果をライブ更新するには、Excel 式とカスタ ムの StatTools 関数が使用されます。例えば、 =StatMean('Confidence Interval.xls'!ペア) という式は「ペア」という変数の平均値を計算します (これ は Confidence Interval.xls というブックにある Excel 範 囲名「ペア」を使用します)。Pair という範囲内のデータに 変更があると、StatMean 関数から返された値が更新されます。 192 StatTools では次の例外を除き、すべての処理で生成される レポートとグラフをライブ更新することができます。 1) 回帰 2) 判別分析 3) ロジスティック回帰 4) 予測 これらの処理には大量の計算が必要となるため、ライブ更新 を行うと Excel の応答速度が遅くなります。 • [コメントの表示] - レポートに含める StatTools メッセー ジのカテゴリを指定します。下記のようにレポート内のセル にメモ、警告、および参考メモをポップアップ表示すること ができます。 リファレンス: StatTools メニューのコマンド 193 ユーティリティ ユーティリティでは、StatTools のデータ ユーティリティにより作 成される新規変数のオプションを指定します。これらは [データ ユ ーティリティ] メニューに表示されます。既存の変数に対して変換、 組み合わせ、その他の処理を行うことで新規変数を作成します。 • [新規変数の環境設定] - データ ユーティリティにより作成 した新規変数の場所を指定します。次のオプションがありま す。 - [ソース データセットに挿入する] - 作成した各変数を、 元の変数が含まれたデータセットの右側 (または一番 下) に挿入します。 - [新規データセットを作成する] - 新規変数を新規デー タセットに配置します。 ただし、ここで選択した新規変数の環境設定が適用されない こともあります。例えば、スタック化やスタック解除を行う 場合 (新規変数が常に新規データセットに配置されます) や、 元のデータが複数範囲のデータセットから取得される場合 (新規変数は常にソース データセットに挿入されます) がこ れに該当します。 • [更新の環境設定] - 元の変数データに変更があった場合の、 ユーティリティで作成された新規変数の値の更新方法を指定 します。次の更新オプションがあります。 - [ライブ - 入力データにリンク] - 入力データが変更さ れると新規変数の値も自動的に更新されます。 - [静的] - 入力データが変更されても新規変数の値は変 わりません。処理の実行時に入力データの値に基づいて 新規変数の値が固定されます。 ただし、ここで選択した更新の環境設定が適用されず、新規 変数で常に [静的] の環境設定が使用されることもあります。 例えば、スタック化とスタック解除やランダム標本の場合が これに該当します。ライブ更新はこれらのユーティリティに は適用されません。 194 データセットの デフォルト 分析 データセットのデフォルトでは、[データセット マネージャー] コマ ンドを使って作成される新規データセットのオプションを指定します。 これらの設定は、データセットを新規作成するときにデフォルト設定 として表示されます。必要に応じて [データセット マネージャー] ダイアログ ボックスで変更することができます。 • [セル書式を適用する] - StatTools によりデータセットの書 式を設定するかどうかを指定します。 • [変数のレイアウト] - デフォルトの変数レイアウト (行形式 と列形式のどちらか) を選択します。 • [1 列 (行) 目に名前を含める (1 次範囲)] - 最初に定義す る範囲の 1 列目または 1 行目に名前を含めるかどうかを指 定します。 • [1 列 (行) 目に名前を含める (2 次範囲)] - 複数範囲のデ ータセットで、2 番目以降に定義するすべての範囲の 1 列目 または 1 行目に名前を含めるかどうかを指定します。 分析では、分析の設定に使用されるダイアログ ボックスに表示され るデフォルト設定を指定します。これらの設定は、分析用ダイアログ ボックスにデフォルト設定として表示されますが、必要に応じて各ダ イアログ ボックスで変更することができます。 • [警告メッセージの表示] - 分析の実行中に StatTools が変 数にデータが欠けていたり数値以外のデータがあることを検 知した場合に警告メッセージを表示するかどうかを 指定しま す。 • [ダイアログ メモリ] - 分析を設定するためのダイアログ ボ ックスに表示されるデフォルト設定を指定します。次のオプ ションがあります。 - [最後の使用値を保持する] - ダイアログ ボックスの初 期値として、前回アクティブなブックでこのダイアログ ボックスに入力された項目を表示します。初めて表示さ れるダイアログの場合、分析のシステム デフォルト設 定として保存されている値が表示されます。 - [システム デフォルトを使用する] - ダイアログ ボッ クスの初期値として、分析のシステム デフォルト設定 として保存されている値を表示します。 リファレンス: StatTools メニューのコマンド 195 • [パーセンタイルの計算] - パーセンタイルの計算方法を選択 します。どの計算方法によって優れた結果計算が得られるか は、データの性質によって異なります。使用できる方法とそ れぞれに適したデータのタイプは次のとおりです。 1) 自動 (入力データに基づく) 2) 非対称の終点を補間 3) 対称の終点を補間 4) Excel パーセンタイル関数 5) 最近似の観測 (離散) 6) 経験分布関数 (離散) 7) 平均を使用した経験分布関数 (離散) 196 [データセットの削除] コマンド アクティブなブックにある StatTools データセットを削除 [データセットの削除] コマンドは、アクティブなブックから、定義 されている全データセットを削除します。Excel に入力された実際の データは削除されません。削除されるのはデータセットの定義のみで す。 [ダイアログ メモリの消去] コマンド 分析ダイアログ ボックスの入力項目のすべてのメモリを消去 [ダイアログ メモリの消去] コマンドは、分析のダイアログ ボック スの入力項目のすべてのメモリを消去します。この操作を行うと、ダ イアログ ボックスの初期値として各分析のシステム デフォルト設定 が表示されるようになります。 [StatTools アドインのアンロード] コマンド StatTools アドインをアンロード [StatTools ア ド イ ン の ア ン ロ ー ド ] コ マ ン ド は 、 す べ て の StatTools ウィンドウを閉じて、StatTools をアンロードします。 リファレンス: StatTools メニューのコマンド 197 198 [ヘルプ] メニュー ヘルプ StatTools のオンライン ヘルプ ファイルを開く [ヘルプとマニュアル] メニューの [ヘルプ] コマンドは、StatTools のメイン ヘルプ ファイルを開きます。このファイルでは StatTools のすべての機能とコマンドが説明されています。 マニュアル StatTools のオンライン マニュアルを開く [ヘルプとマニュアル] メニューの [マニュアル] コマンドは、PDF 形式のこのマニュアルを開きます。このオンライン マニュアルを表 示するには、Adobe Reader がインストールされている必要がありま す。 [ライセンス認証] コマンド StatTools のライセンス情報を表示し、トライアル バージョンのラ イセンス付与を行う [ヘルプ] メニューの [ライセンス認証] コマンドは、お使いの StatTools のバージョンとライセンス情報が記載された [ライセンス 認証] ダイアログ ボックスを表示します。このダイアログ ボックス を使用して、StatTools トライアル バージョンをライセンスが付与 されたプログラムに変換できます。 StatTools のライセンス認証については、このマニュアルの「第 1 章: StatTools 活用の基礎」を参照してください。 リファレンス: StatTools メニューのコマンド 199 [StatTools について] コマンド StatTools のバージョンと著作権情報を表示 [ヘルプ] メニューの [StatTools について] コマンドは、お使いの StatTools のバージョンと著作権情報が記載された [StatTools につ いて] ダイアログ ボックスを表示します。 200 リファレンス: StatTools 関数 はじめに StatTools はカスタムのワークシート関数を使用して、計算した統計 値を Excel 数式に返します。これらの関数によって次のことが可能 になります。 1) 統計計算を Excel の標準関数と同様にワークシートの式に埋 め込むことができる。 2) 統計結果が「ライブ」になり、元のデータが変更されると同 時に結果も更新されるようになる。 StatTools ワークシート関数は、StatTools レポート内のセルにある 数式に含まれています。すべての StatTools 関数は「Stat」という 文字列で始まります (例: StatMean()、StatStdDev())。StatTools 関数はすべて Excel の関数の挿入ダイアログに表示されるので、簡 単に入力できます。 StatTools 関数と Excel 関数 StatTools は必要に応じて Excel の組み込み統計機能を、独自の堅 牢な高速計算関数で置き換えます。Excel の組み込み統計計算は正確 さに欠けることがあるため、StatTools ではこれらを一切使用しませ ん 。 STDEV() な ど の Excel の ワ ー ク シ ー ト 統 計 関 数 の 一 部 も 、 StatTools 独自の StatSTDEV() などの堅牢な関数で置き換えられま す。StatTools の統計計算は最高の精度を誇り、マクロ計算の代わり に C++ .DLL を使用するのでパフォーマンスも最適化されています。 Excel の標準関数と異なり、StatTools 関数ではスタック形式のデー タを使用することができます。StatTools の StatDestack 関数は、 スタック形式のデータセットから、ユーザーが指定するカテゴリ用に 自動的にスタックを解除します。 その後このデータを、分析に使用 される StatTools 統計関数に渡します。 StatTools 関数は、複数のワークシートに保存されているデータの分 析にも対応しています。複数のシートにわたるデータセットでは、各 変数につき 65,535 個を超えるポイントを使用できます。これらの入 リファレンス: StatTools 関数 201 力には [データセット マネージャー] ダイアログの [複数] ボタン を使用します。 分布関数 StatTools には Excel の組み込み関数 (BinomDist など) を置き換 える、 一連の分布関数 (StatBinomial など) が含まれています。 Excel の分布関数と異なり、StatTools の分布関数は確率分布からい くつもの異なる値を返すことができます。戻り値は統計引数 (関数の 最後から 2 番目の引数) により設定されます。この引数には、入力 した分布について求める統計の種類を 1 ~ 12 の値または文字列で 指定します。 返すことのでき る統計 入力する値または文字列 返される統計 1 または「mean」 平均値 2 または「stddev」 標準偏差 3 または「variance」 分散 4 または「skewness」 歪度 5 または「kurtosis」 尖度 6 または「mode」 最頻値 7 または「discrete mean」 離散平均値 (実際に起こりうる真の平均値の 最近似値) 8 または「x to y」 x 対 y (入力された x 値に対する分布 y 値) 9 または「x to p」 x 対 p (入力された x 値に対する分布 p 値) 10 または「p to x」 p 対 x (入力された p 値に対する分布 x 値) 11 または「x to q」 x 対 q (入力された x 値に対する分布 q 値) 12 または「q to x」 q 対 x (入力された q 値に対する分布 x 値) 例えば、次の StatTools 分布関数があるとします。 StatNormal(10,1,"x to p", 9.5) この関数は、平均値 10、標準偏差 1 の正規分布において x 値 9.5 に対応する P 値を返します。 202 「ライブ」レポート StatTools は、カスタム関数を使用して計算結果をできる限り「ライ ブ」で報告しようとします。したがって、レポートには実用的である 限り元のデータにリンクしている式が使われます。例えば「Weight (重量)」という変数について平均や標準偏差などの集約尺度を求めた いとします。するとサマリー統計処理では重量の範囲に「Weight」と い う 名 前 が 付 け ら れ 、 出 力 セ ル に 「 =StatMean(Weight) 」 と 「=StatStdDev(Weight)」という数式が入力されます。StatMean と StatStdDev は、平均と標準偏差を計算するための StatTools の組み 込み関数です。これらの関数はそれぞれ相当する Excel の標準関数 を置き換えるものです。これらの関数により、データが変更されると その分析結果も自動的に更新されるので、処理を再実行する手間が省 けるというメリットがあります。 リファレンス: StatTools 関数 203 ただし、結果をデータにリンクするのが実用的でない場合もあります。 回帰分析はその典型的な例です。StatTools には回帰分析の出力を生 成するための数式が用意されておらず、数値の結果のみが出力されま す。この場合にはデータが変更されると処理を再実行する必要があり ます。 レポートがデータにリンクされないようにするには、[アプリケーシ ョン設定] の [レポート] から、[更新の環境設定] で [静的] オプ ションを選択します。このオプションは、データの変更に伴う Excel の再計算に長い時間がかかる場合には便利です。 204 リファレンス: 静的関数の一覧 利用できる関数の一覧表 関数 次の表は、StatTools により Excel に追加されるカスタム関数の一 覧です。使用時にはすべての関数に Stat という接頭辞が追加されま す。 戻り値 AUTOCORRELATION(データ , データ セット内の値の自己相関を計算します。 遅延数) AVEDEV(データ 1, データ 2, ... データ N) BINOMIAL(N, P, 統計, 値) CATEGORYINDICIES(範囲, カテゴリ名) CATEGORYNAMES(範囲) CATEGORYOCCURRENCECOUNT (範囲, カテゴリ名) CHISQ(自由度, 統計, 値) CORRELATIONCOEFF(データ 1, データ 2,フラグ) COUNT(データ 1, データ 2, ... データ N) COUNTCATEGORIES(範囲) COUNTCELLSBYTYPE(範囲, 種類) COUNTRANGE(範囲, 最小値, 最大値, 最小を含める, 最大を含め る) COVARIANCE(データ 1, データ 2) COVARIANCEP(データ 1, データ 2) DESTACK(データ範囲, カテゴリ範囲 1, カテゴリ 1, カテゴリ範囲 2, カテゴリ 2) DURBINWATSON(データ) リファレンス: StatTools 関数 データの平均値からの平均絶対偏差を計算しま す。引数には数値、配列、または範囲を指定で きます。 入力した二項分布の統計を計算します。 指定したカテゴリのセル インデックスを取得し ます。 範囲内のカテゴリの名を取得します。 指定したカテゴリの範囲内のセル数を計算しま す。 入力した片側カイ二乗分布の統計を計算しま す。 2 つのデータセット間の相関係数を計算しま す。線形 (ピアソン) 相関またはランク (スピ アマン) 相関を計算できます。 引数に含まれる要素の数を計算します。数値、 配列、または範囲を指定できます。 範囲内のカテゴリの数を取得します。 範囲内に存在する、指定された種類のセル数を 計算します。 最小値から最大値の間の範囲内にある値の数を 計算します。 2 つのデータセット間の標本共分散を計算しま す。 2 つのデータセット間の母共分散を計算しま す。数値が欠けている場合は空の値が返されま す。 スタック データから指定したカテゴリのデータ を抽出します。 データセット内の値のダービン ワトソン統計を 計算します。 205 関数 戻り値 F(自由度 1, 自由度 2, 統計, 値) 入力した 2 つのデータセットの F 分布の統計 を計算します。 範囲内にある、指定したタイプのすべてのセル の値を取得します。 引数の標本尖度を計算します。引数には数値、 配列、または範囲を指定できます。 引数の母尖度を計算します。引数には数値、配 列、または範囲を指定できます。 正の実数の自然対数を計算します。 引数の最大値を計算します。引数には数値、配 列、または範囲を指定できます。 引数の算術平均 (平均) を計算します。引数に は数値、配列、または範囲を指定できます。 引数の絶対値の算術平均 (平均) を計算しま す。引数には数値、配列、または範囲を指定で きます。 データセットのメジアンを計算します。 引数の最小値を計算します。引数には数値、配 列、または範囲を指定できます。 入力した正規 (ガウス) 分布の統計を計算しま す。 対を成すセルの数をカウントします。対の各セ ルが数値であるセルのみカウントされます。 セルの対の間の差の平均値を計算します。 セルの対の間の差のメジアンを計算します。 セルの対の間の差の標本標準偏差を計算しま す。 データセットの p パーセンタイルを計算しま す。 引数の積を計算します。引数には数値、配列、 または範囲を指定できます。 データセットにおける、指定された四分位数を 計算します。 0 より大きく 1 より小さい範囲の乱数を返しま す。 引数の範囲 (最大値 - 最小値) を計算します。 引数には数値、配列、または範囲を指定できま す。 データセット内の値の連統計を計算します。 GETCELLVALUES(範囲) KURTOSIS(データ 1, データ 2, ... データ N) KURTOSISP(データ 1, データ 2, ... データ N) LN(x) MAX(データ 1, データ 2, ... デー タ N) MEAN(データ 1, データ 2, ... デー タ N) MEANABS(データ 1, データ 2, ... データ N) MEDIAN(データ, 離散フラグ) MIN(データ 1, データ 2, ... デー タ N) NORMAL(平均値, 標準偏差, 統計, 値) PAIRCOUNT(データ 1, データ 2) PAIRMEAN(データ 1, データ 2) PAIRMEDIAN(データ 1, データ 2) PAIRSTDDEV(データ 1, データ 2) PERCENTILE(データ, p, 離散フラグ ) PRODUCT(データ 1, データ 2, … データ N) QUARTILE(データ, q, 離散フラグ) RAND() RANGE(データ 1, データ 2, ... データ N) RUNSTEST(データ, カットオフ) 206 関数 戻り値 SKEWNESS(データ 1, データ 2, ... データ N) SKEWNESSP(データ 1, データ 2, ... データ N) STANDARDIZE(x, 平均値, 標準偏差) 引数の標本歪度を計算します。引数には数値、 配列、または範囲を指定できます。 引数の母歪度を計算します。引数には数値、配 列、または範囲を指定できます。 指定した平均値と標準偏差を使用して、分布か ら正規化された値を計算します。 引数の標本標準偏差を計算します。引数には数 値、配列、または範囲を指定できます。 引数の母標準偏差を計算します。引数には数 値、配列、または範囲を指定できます。 引数の和を計算します。引数には数値、配列、 または範囲を指定できます。 引数の平均値からの偏差平方和を計算します。 引数には数値、配列、または範囲を指定できま す。 引数の平方和を計算します。引数には数値、配 列、または範囲を指定できます。 入力したステューデント t 分布の統計を計算し ます。 引数の標本分散を計算します。引数には数値、 配列、または範囲を指定できます。 引数の母分散を計算します。引数には数値、配 列、または範囲を指定できます。 STDDEV(データ 1, データ 2, ... データ N) STDDEVP(データ 1, データ 2, ... データ N) SUM(データ 1, データ 2, ... デー タ N) SUMDEVSQ(データ 1, データ 2, ... データ N) SUMSQ(データ 1, データ 2, ... データ N) STUDENT(自由度, 統計, 値) VARIANCE(データ 1, データ 2, ... データ N) VARIANCEP(データ 1, データ 2, ... データ N) リファレンス: StatTools 関数 207 208 関数の詳細な説明 以下に、StatTools の分布関数と各関数に必須の引数を一覧します。 AUTOCORRELATION AVEDEV 説明 Autocorrelation (データ,遅延数) は、遅延数を使用してデータセ ット内の値の自己相関を計算します。データには自己相関の計算対 象となるデータの配列または範囲を、遅延数には使用する遅延の数 を指定します。 例 StatAutocorrelation (C1:C100,1) という関数は、範囲 C1:C100 のデータを 1 遅延させた自己相関を返します。 ガイドライン 遅延数は 1 以上でなければなりません。 説明 AVEDEV(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N の平均値からの平均絶対偏差を計算します。 例 StatAveDev(1,2,5) という関数は、1、2、5 の平均値からの平均絶 対偏差を計算します。 ガイドライン データ 1,データ 2,...データ N の各引数には数値、配列、または 範囲を指定できます。 BINOMIAL 説明 BINOMIAL(N,P,統計,値) は、N と P の値が指定されたに高分布の 統計を計算します。 例 StatBinomial(2,.3,"x to p",1) という関数は、N=2、P =.3 の二 項分布における、x 値 1 に対する P 値を計算します。 ガイドライン N には試行またはイベントの数を正の整数値で指定します。 P には確率を 0 以上 1 以下の値で指定します。 統計には、返す統計の種類を示す 1 ~ 12 の正数値か、文字列を 指定します。詳しくはこの章の冒頭にある「分布関数」のセクショ ンを参照してください。 値には、0 以上 (x 値を入力する場合) または 0 以上 1 以下 (P 値を入力する場合) を指定します。 CATEGORYINDICIE S 説明 CATEGORYINDICES(範囲, カテゴリ名) は、Excel 範囲内に指定した カテゴリ名を含むセルのインデックスを取得します。これは配列関 数で、範囲内のカテゴリ名を含むセルの位置を示すインデックス番 号 (1 ~範囲のセル数の間) を返します。 例 StatCategoryIndices (C1:C100,"男性") という関数は、「男性」 という文字列を含むセルのインデックス (1 ~ 100 の間) を返し ます。 ガイドライン 範囲には有効な Excel 範囲を指定します。 カテゴリ名には、探しているカテゴリを指定する文字列、値、また はセル参照を指定します。 リファレンス: StatTools 関数 209 CATEGORYNAMES CATEGORYOCCURRE NCECOUNT 説明 CATEGORYNAMES(範囲) は、指定した Excel 範囲内にあるカテゴリ の名前を取得します。これは配列関数で、返される名前の数は 1 ~範囲のセル数の間になります。 例 StatCategoryNames(C1:C100) という関数は、範囲 C1:C100 にある カテゴリの名前を返します。 ガイドライン 範囲には有効な Excel 範囲を指定します。 説明 CATEGORYOCCURRENCECOUNT(範囲, カテゴリ名) は、Excel 範囲内に 指定したカテゴリ名を含むセルの数を返します。 例 StatCategoryOccurrenceCount(C1:C100,"男性") という関数は、 C1:C100 の範囲内で「男性」を含むセルの数を返します。 ガイドライン 範囲には有効な Excel 範囲を指定します。 カテゴリ名には、探しているカテゴリを指定する文字列、値、また はセル参照を指定します。 CHISQ 説明 CHISQ(自由度,統計,値) は、指定した自由度を使用して片側カイ二 乗分布の統計を計算します。 例 StatChiDist(2,"x to p",5) という関数は、値が 5 で自由度が 2 の片側カイ二乗分布を計算します。 ガイドライン 自由度には、1 ~ 32767 の範囲内の値を指定します。 統計には、返す統計の種類を示す 1 ~ 12 の正数値か、文字列を 指定します。詳しくはこの章の冒頭にある「分布関数」のセクショ ンを参照してください。 値には、0 以上 (x 値を入力する場合) または 0 以上 1 以下 (P 値を入力する場合) の値を指定します。 CORRELATIONCOEF F 説明 CORRELATIONCOEFF(データ 1,データ 2,フラグ) は、2 つのデータ セット (データ 1 とデータ 2) の間の相関係数を計算します。フ ラグの値に応じて線形 (ピアソン) 相関またはランク (スピアマ ン) 相関を計算できます。 例 StatCorrelationCoeff(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット間の相関係数を計算しま す。 ガイドライン データ 1 とデータ 2 には同数の要素が含まれていなければなりま せん。 フラグを指定しない場合やゼロに等しい場合は線形 (ピアソン) 相関係数が計算され、フラグがゼロでない場合はランク (スピア マン) 相関係数が計算されます。 210 COUNT COUNTCATEGORIES COUNTCELLSBYTYP E 説明 COUNT (データ 1,データ 2,...データ N) は、データ 1、データ 2 … データ N に含まれる要素の数を計算します。これらの引数には 数値、配列、または範囲を指定できます。 例 StatCount(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット内の要素の数を計算します。 ガイドライン データ 1,データ 2,...データ N は、数値、配列、または範囲を 指定できる 1 ~ 30 個の引数です。 説明 COUNTCATEGORIES (範囲) は、指定した Excel 範囲内にあるカテゴ リの数を返します。 例 StatCountCategories(C1:C100) という関数は、範囲 C1:C100 にあ るカテゴリの数を返します。 ガイドライン 範囲には有効な Excel 範囲を指定します。 説明 COUNTCELLSBYTYPE (範囲, 種類) は、入力した範囲内にある、指 定した種類の要素の数を計算します。 例 StatCountCellByType(A1:A100,1) という関数は、A1:A100 の範囲 にあるデータセット内の、数値要素の数を計算します。 ガイドライン 範囲には有効な Excel 範囲を指定します。 種類には、1=数値、2=空以外、3=空以外かつ非数値、4=空を指定 します。注意: StatTools では、スペースのみが含まれるセルは 空とみなされます。 COUNTRANGE 説明 COUNTRANGE (範囲,最小値,最大値, 最小を含める,最大を含める) は、範囲内の最小値と最大値の間にある値の数を計算します。最 小値と最大値に等しい値を含めるには、最小を含めるおよび最大 を含めるの各引数を TRUE に設定します。 例 StatCountRange(A1:A100,1,10,TRUE,TRUE) という関数は、 A1:A100 にあるデータセット内の、1 以上 10 以下の値の数を計 算します。 ガイドライン 範囲には、値をカウントする対象となるセル範囲を指定します。 最小値には、範囲の最小値を指定します。 最大値には、範囲の最大値を指定します。 最小を含めるは、最小値をカウント対象として含めるかを指定す るブール値です。デフォルト値は TRUE です。 最大を含めるは、最大値をカウント対象として含めるかを指定す るブール値です。デフォルト値は TRUE です。 リファレンス: StatTools 関数 211 COVARIANCE 説明 COVARIANCE(データ 1,データ 2) は、データ 1 と データ 2 の 2 つのデータセット間の標本共分散を計算します。 例 StatCovariance(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット間の標本共分散を計算しま す。 ガイドライン データ 1 およびデータ 2 には配列または範囲を指定できます。 データ 1 とデータ 2 には同数の要素が含まれていなければなりま せん。 COVARIANCEP DESTACK 説明 COVARIANCEP (データ 1,データ 2) は、データ 1 と データ 2 の 2 つのデータセット間の母共分散を計算します。 例 StatCovarianceP(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット間の母共分散を計算します。 ガイドライン データ 1 およびデータ 2 には配列または範囲を指定できます。 説明 DESTACK(データ範囲,カテゴリ範囲 1,カテゴリ 1,カテゴリ範囲 2, カテゴリ 2) は、データ範囲内スタック データから、指定のカテ ゴリ 1 にあるデータを抽出します。この関数により、ほかの StatTools 統計関数がスタック データを入力として受け取ること ができるようになります。したがって StatDestack 関数は、下記 の例のように常にほかの関数に埋め込む形で使用されます。デー タ範囲から抽出された、指定したカテゴリのデータの配列を返し ます。 例 StatMean(StatDestack(B1:B100,A1:A100,"男性")) という関数は 、対応する範囲 A1:A100 に「男性」という値が入っている、範囲 B1:B100 内の値の平均値を計算します。 ガイドライン データ範囲は、スタック データのある範囲です。 カテゴリ範囲 1 は、最初のカテゴリ名がある範囲です。 カテゴリ 1 は、データを取得する最初のカテゴリです。 カテゴリ範囲 2 (オプション) は、2 番目のカテゴリ名がある範囲 です。 カテゴリ 2 (オプション) は、データを取得する 2 番目のカテゴ リです。 DURBINWATSON 212 説明 DURBINWATSON(データ) は、データセット (データ) 内の値のダー ビン ワトソン統計を計算します。 例 StatDurbinWatson(A1:A100) という関数は、A1:A100 にあるデー タ範囲のダービン ワトソン統計を計算します。 ガイドライン データにはデータの配列または範囲を指定できます。 F 説明 F(自由度 1,自由度 2,統計,値) は、自由度の分子を自由度 1、自由 度の分母を自由度 2 とした、F 分布の統計を計算します。 例 StatF (1,1,"x to p",1.5) という関数は、x 値 1.5 に対する、 自由度の分子 1、自由度の分母が 1 である F 分布の P 値を計算 します。 ガイドライン 自由度 1 および自由度 2 には、正の整数値を指定します。 統計には、返す統計の種類を示す 1 ~ 12 の正数値か、文字列を 指定します。詳しくはこの章の冒頭にある「分布関数」のセクシ ョンを参照してください。 値 には、0 以上の値を指定します。 GETCELLVALUES 説明 GETCELLVALUES (範囲,セルの種類) は、範囲内にある指定した種 類のすべてのセルの値を取得します。 例 StatGetCellValues(A1:A100,2) という関数は、A1:A100 にある範 囲内の空以外のセルの値を取得します。 ガイドライン 範囲には、値を取得する対象のセル範囲を指定します。 セルの種類には、0= すべて、1= 数値、2= 空以外、3= 空以外か つ非数値、4= 空、のいずれかの種類を指定します。 KURTOSIS 説明 KURTOSIS(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの標本尖度を計算します。注 意: 正規分布に従うデータに対して StatKurtosis を実行する と、3 の値が返されます。 例 StatKurtosis(A1:A100,{1;2;3;2.4}) という関数は、A1:A100 に あるデータセットおよび、1、2、3、2.4 の各値について標本尖度 を計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 KURTOSISP 説明 KURTOSISP(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの母尖度を計算します。注意: 正規分布に従うデータに対して StatKurtosisP を使用すると、3 の値が返されます。 例 StatKurtosisP(A1:A100,{1;2;3;2.4}) という関数は、A1:A100 に あるデータセットおよび、1、2、3、2.4 の各値について母尖度を 計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 リファレンス: StatTools 関数 213 LN MAX 説明 LN(x) は、自然対数を計算します。 例 StatLN(4.5) という関数は 4.5 の自然対数を計算します。 ガイドライン x には、正の実数値を指定します。 説明 MAX(データ 1,データ 2,...データ N) は、データ 1,データ 2,...デ ータ N で指定されたデータの最大値を計算します。 例 StatMax(A1:A100,{1;2;3;2.4}) という関数は、A1:A100 にあるデ ータセットおよび、1、2、3、2.4 の各値のうち最大値を計算しま す。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 MEAN 説明 MEAN(データ 1,データ 2,...データ N) は、データ 1,データ 2,... データ N で指定されたデータの平均値を計算します。 例 StatMean(A1:A100,{1;2;3;2.4}) という関数は、A1:A100 にある データセットおよび、1、2、3、2.4 の各値の平均値を計算しま す。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 MEANABS 説明 MEANABS(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの絶対値の平均を計算します。 例 StatMeanAbs(A1:A100,{1;2;3;2.4}) という関数は、A1:A100 にあ るデータセットおよび、1、2、3、2.4 の各値の絶対値の平均を計 算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 214 MEDIAN 説明 MEDIAN(データ,計算フラグ) は、データにある値のメジアンを計 算します。オプションの計算フラグを使用して、5 つの計算方法 のうちいずれかを指定することもできます。 例 StatMedian(A1:A100,1) という関数は、A1:A100 にあるデータセ ット内のメジアン値を計算します。このデータは連続型です。 ガイドライン データには Excel 範囲を指定します。 計算フラグはオプションの引数で、-1 ~ 5 の正数値を指定でき ます。この値はパーセンタイルの計算に使用する方法を指定しま す。 -1 または指定なし - 自動 (入力データに基づく) 0 - Excel のパーセンタイル関数と同じ (連続) 1 - 非対称の終点を補間 (連続) 2 - 最近似の観測 (離散) 3 - 経験分布関数 (離散) 4 - 対称の終点を補間 (連続) 5 - 平均を使用した経験分布関数 (離散) MIN 説明 MIN(データ 1,データ 2,...データ N) は、データ 1,データ 2,...デ ータ N で指定されたデータの最小値を計算します。 例 StatMin(A1:A100,{1;2;3;2.4}) という関数は、A1:A100 にあるデ ータセットおよび、1、2、3、2.4 の各値のうち最小値を計算しま す。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 MODE 説明 MODE(データ,離散フラグ) は、データセットの最頻値を計算しま す。 例 StatMode(A1:A100,FALSE) という関数は、A1:A100 にあるデータ セットの最頻値を計算します。このデータは連続型です。 ガイドライン データは、最頻値を計算する対象となるデータの配列または範囲 です。 離散フラグはオプションの引数で、データを離散型 (true) と連 続型 (false) のどちらとして扱うかを指定します。指定しない場 合はデータに基づいて自動的に判断されます。 リファレンス: StatTools 関数 215 NORMAL 説明 NORMAL(平均値,標準偏差,統計,値) は、平均値と標準偏差により 指定される正規分布の統計を計算します。 例 StatNormal(2,1,"x to p",3) という関数は、平均値 2、標準偏差 1 の正規分布における x 値 3 に対する P 値を計算します。 ガイドライン 平均値には分布の算術平均値を指定します。 標準偏差は分布の標準偏差で、0 より大きな値でなければなりま せん。 統計には、返す統計の種類を示す 1 ~ 12 の正数値か、文字列を 指定します。詳しくはこの章の冒頭にある「分布関数」のセクシ ョンを参照してください。 値には、P 値が入力される場合は 0 以上 1 以下の値を指定しま す。 PAIRCOUNT 説明 PAIRCOUNT(データ 1,データ 2) は、データ 1 とデータ 2 にあるセ ルの対の数をカウントします。カウントされるのは数値セルの対 のみです。どちらかの範囲で欠けている値はカウントされませ ん。 例 StatPairCount(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット内の数値セルの対の数を計算 します。 ガイドライン データ 1 とデータ 2 は、同サイズの Excel 範囲でなければなり ません。 データ 1 とデータ 2 からのセルの対は、左上から開始して行ごと に選択されます。 PAIRMEAN 説明 PAIRMEAN(データ 1,データ 2) は、データ 1 とデータ 2 にあるセ ルの対の間の差の平均を計算します。計算が適用されるのは数値 セルの対のみです。どちらかの範囲で欠けている値は計算に含ま れません。 例 StatPairMean(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット内の数値セルの対の間の差の 平均を計算します。 ガイドライン データ 1 とデータ 2 は、同サイズの Excel 範囲でなければなり ません。 データ 1 とデータ 2 からのセルの対は、左上から開始して行ごと に選択されます。 216 PAIRMEDIAN 説明 PAIRMEDIAN(データ 1,データ 2,方法フラグ) は、データ 1 とデー タ 2 にあるセルの対の間の差のメジアンを計算します。計算が適 用されるのは数値セルの対のみです。どちらかの範囲で欠けてい る値は計算に含まれません。オプションの方法フラグを使用し て、5 つのメジアン計算方法のうちどれを使用するかを指定でき ます。 例 StatPairMedian(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット内の数値セルの対の間の差の メジアンを計算します。 ガイドライン データ 1 とデータ 2 は、同サイズの Excel 範囲でなければなり ません。 データ 1 とデータ 2 からのセルの対は、左上から開始して行ごと に選択されます。 方法フラグはオプションの引数で、-1 ~ 5 の正数値を指定でき ます。この値によりメジアンの計算方法を指定します。 -1 または指定なし - 自動 (入力データに基づく) 0 - Excel のパーセンタイル関数と同じ (連続) 1 - 非対称の終点を補間 (連続) 2 - 最近似の観測 (離散) 3 - 経験分布関数 (離散) 4 - 対称の終点を補間 (連続) 5 - 平均を使用した経験分布関数 (離散) PAIRSTDDEV 説明 PAIRSTDDEV(データ 1,データ 2) は、データ 1 とデータ 2 にある セルの対の間の差の標本標準偏差を計算します。計算が適用され るのは数値セルの対のみです。どちらかの範囲で欠けている値は 計算に含まれません。 例 StatPairStdDev(A1:A100,B1:B100) という関数は、A1:A100 と B1:B100 にある 2 つのデータセット内の数値セルの対の間の差の 標本標準偏差を計算します。 ガイドライン データ 1 とデータ 2 は、同サイズの Excel 範囲でなければなり ません。 データ 1 とデータ 2 からのセルの対は、左上から開始して行ごと に選択されます。 リファレンス: StatTools 関数 217 PERCENTILE 説明 PERCENTILE (データ,p,方法フラグ) は、データの p パーセンタイ ルを計算します。オプションの方法フラグを使用して、5 つのパ ーセンタイル計算方法のうちどれを使用するかを指定できます。 例 StatPercentile(A1:A100,.15,0) という関数は、A1:A100 にある データの 15 パーセンタイルを計算します。このデータは連続型 で、加重平均のパーセンタイル計算方法を使用します。 ガイドライン p には 0 以上 1 以下の値を指定します。 方法フラグはオプションの引数で、-1 ~ 5 の正数値を指定でき ます。この値はパーセンタイルの計算に使用する方法を指定しま す。 -1 または指定なし - 自動 (入力データに基づく) 0 - Excel のパーセンタイル関数と同じ (連続) 1 - 非対称の終点を補間 (連続) 2 - 最近似の観測 (離散) 3 - 経験分布関数 (離散) 4 - 対称の終点を補間 (連続) 5 - 平均を使用した経験分布関数 (離散) PRODUCT 説明 PRODUCT(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの積を計算します。 例 StatProduct(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にある データセットの全値および、1、2、3、2.4 の各値の積を計算しま す。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 218 QUARTILE 説明 QUARTILE (データ,q, 方法フラグ) は、データの指定された四分 位を計算します。オプションの方法フラグを使用して、5 つの四 分位計算方法のうちどれを使用するかを指定できます。 例 StatQuartile(A1:A100,1,FALSE) という関数は、A1:A100 にある データの第 1 四分位を計算します。このデータは連続型です。 ガイドライン データには Excel 範囲を指定します。 Q は四分位数です。0= 最小値、1= 第 1 四分位数、2= 第 2 四分 位数 (メジアン)、3= 第 3 四分位数、4= 最大値、をそれぞれ指 定します。 方法フラグはオプションの引数で、-1 ~ 5 の正数値を指定でき ます。この値は四分位の計算に使用する方法を指定します。 -1 または指定なし - 自動 (入力データに基づく) 0 - Excel のパーセンタイル関数と同じ (連続) 1 - 非対称の終点を補間 (連続) 2 - 最近似の観測 (離散) 3 - 経験分布関数 (離散) 4 - 対称の終点を補間 (連続) 5 - 平均を使用した経験分布関数 (離散) RAND RANGE 説明 RAND() は、0 ~ 1 の範囲内の乱数を返します。この関数は Excel に組み込まれた乱数ジェネレーターではなく、Palisade 社 の @RISK 製品の乱数ジェネレーターを使用します。 例 StatRand() という関数は、0 ~ 1 の範囲内の乱数を返します。 説明 RANGE(データ 1,データ 2,...データ N) は、データ 1,データ 2,... データ N で指定されたデータの範囲 (最大 - 最小) を計算しま す。 例 StatRange(A1:A100,{1;2;3;2.4}) という関数は、A1:A100 にある データセットおよび、1、2、3、2.4 の各値の範囲 (最大 - 最小) を計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 RUNSTEST 説明 RUNSTEST (データ,カットオフ) は、データの値に対してカットオ フ値を使用して連統計を計算します。 例 StatRunsTest(A1:A100,StatMean(A1:A100)) という関数は、 A1:A100 にあるデータに対し、データの平均値をカットオフ値と して使用して連検定統計を計算します。 ガイドライン データには Excel 範囲を指定します。 リファレンス: StatTools 関数 219 SKEWNESS 説明 SKEWNESS(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの標本歪度を計算します。 例 StatSkewness(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にあ るデータセットの全値および、1、2、3、2.4 の各値の標本歪度を 計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 SKEWNESSP 説明 SKEWNESSP(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの母歪度を計算します。 例 StatSkewnessP(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にあ るデータセットの全値および、1、2、3、2.4 の各値の母歪度を計 算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 STANDARDIZE 説明 STANDARDIZE(x,平均値,標準偏差) は、指定した平均値と標準偏差 を持つ分布から、正規化された値を計算します。x は正規化する 値です。 例 StatStandardize(2,1,3) という関数は、平均値 1、標準偏差 3 の分布からの値 2 を正規化した値を計算します。 ガイドライン x は正規化する値です。 平均値には分布の算術平均値を指定します。 標準偏差には分布の標準偏差を指定します。0 より大きな値でな ければなりません。 STDDEV 説明 STDDEV(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの標本標準偏差を計算します。 例 StatStdDev(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にある データセットの全値および、1、2、3、2.4 の各値の標本標準偏差 を計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 STDDEVP 説明 STDDEVP(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの母標準偏差を計算します。 例 StatStdDevP(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にある データセットの全値および、1、2、3、2.4 の各値の母標準偏差を 計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 220 SUM 説明 SUM(データ 1,データ 2,...データ N) は、データ 1,データ 2,...デ ータ N で指定されたデータの和を計算します。 例 StatSum(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にあるデー タセットの全値および、1、2、3、2.4 の各値の和を計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 SUMDEVSQ 説明 SUMDEVSQ(データ 1,データ 2,...データ N) は、引数の平均値から の偏差平方和を計算します。引数には数値、配列、または範囲を 指定できます。 数値が欠けている場合は空の値が返されます。 例 StatSumDevSq(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にあ るデータセットの全値および、1、2、3、2.4 の各値の平均値から の偏差平方和を計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 SUMSQ 説明 SUMSQ(データ 1,データ 2,...データ N) は、引数の平方和を計算 します。引数には数値、配列、または範囲を指定できます。 数 値が欠けている場合は空の値が返されます。 例 StatSumSq(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にある データセットの全値および、1、2、3、2.4 の各値の平方和を計 算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を 指定できます。 STUDENT 説明 STUDENT(自由度, 統計,値) は、入力したステューデント t 分布 の統計を計算します。 例 StatStudent(5,1,"x to p",2) という関数は、自由度を 5、x 値 を 2 としてステューデント t 分布からの P 値を計算します。 ガイドライン 自由度は自由度の数を示す整数値です。1 ~ 32767 の範囲内の値 を指定します。 統計には、返す統計の種類を示す 1 ~ 12 の正数値か、文字列を 指定します。詳しくはこの章の冒頭にある「分布関数」のセクシ ョンを参照してください。 x には、分布を評価する対象となる数値を指定します。0 より大 きな値でなければなりません。 リファレンス: StatTools 関数 221 VARIANCE 説明 VARIANCE(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの標本分散を計算します。 例 StatVariance(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にあ るデータセットの全値および、1、2、3、2.4 の各値の標本分散 を計算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を 指定できます。 VARIANCEP 説明 VARIANCEP(データ 1,データ 2,...データ N) は、データ 1,データ 2,...データ N で指定されたデータの母分散を計算します。 例 StatVarianceP(A1:A10,{1;2;3;2.4}) という関数は、A1:A10 にあ るデータセットの全値および、1、2、3、2.4 の各値の母分散を計 算します。 ガイドライン データ 1,データ 2,...データ N には数値、配列、または範囲を指 定できます。 222 索引 1 変数サマリー コマンド, 67 C 管理図コマンド, 156 Palisade 社, 4 P 管理図コマンド, 153 StatTools コマンド クラスカル・ウォリス検定, 175 主成分分析, 179 StatTools メニュー 多変量解析, 179 StatTools アドインのアンロ ード コマンド, 197 StatTools 関数, Error! Not a valid bookmark in entry on page 201 StatAutocorrelation, 209 StatAveDev, 209 StatBinomial, 209 StatCategoryIndices, 209 StatCategoryNames, 210 StatCategoryOccurrenceCou nt, 210 StatChiDist, 210 StatCorrelationCoeff, 210 StatCount, 211 StatCountCategories, 211 StatCountCellByType, 211 StatCountRange, 211 StatCovariance, 212 StatCovarianceP, 212 StatDestack, 212 StatDurbinWatson, 212 StatF, 213 索引 StatGetCellValues, 213, 221 StatKurtosis, 213 StatKurtosisP, 213 StatLN, 214 StatMax, 214 StatMean, 214 StatMeanAbs, 214 StatMedian, 215 StatMin, 215 StatNormal, 216 StatPairCount, 216 StatPairMean, 216 StatPairMedian, 217 StatPairStdDev, 217 StatPercentile, 218 StatProduct, 218 StatQuartile, 219 StatRand, 219 StatRange, 219 StatRunsTest, 219 StatSkewness, 220 StatSkewnessP, 220 StatStandardize, 220 StatStdDev, 220 StatStdDevP, 220 StatStudent, 221 StatSum, 221 StatSumSq, 221 StatVariance, 222 StatVarianceP, 222 アルファベット順一覧, 205 StatTools についてコマンド, 200 223 StatTools のアンインストー ル, 7 U 管理図コマンド, 159 X-R 管理図コマンド, 149 アイコン StatTools, 29 デスクトップ, 7 アプリケーション設定コマン ド, 191 一元配置 ANOVA コマンド, 95 インストール手順, 5–7 ウィルコクソン符号順位検定 コマンド, 168 カイ二乗検定コマンド, 105 カイ二乗独立性検定コマンド, 100, 102 仮説検定 - 比率コマンド, 90 仮説検定 - 平均値 / 標準偏 差コマンド, 87 組み合わせコマンド, 60 差コマンド, 56 散布図コマンド, 76 時系列グラフ コマンド, 113 自己相関コマンド, 116 システムの必要条件, 5 信頼区間 - 比率コマンド, 84 信頼区間 - 平均値 / 標準偏 差コマンド, 81 正規 Q-Q プロット コマンド, 111 相関と共分散コマンド, 70 相互作用コマンド, 58 ダイアログ メモリの消去コマ ンド, 197 ダミー コマンド, 62 遅延コマンド, 54 ツールバー StatTools, 29 データセットの削除コマンド, 197 データセット マネージャー コマンド, 43 224 二元配置 ANOVA コマンド, 98 認証, 199 箱ひげ図コマンド, 78 パレート図コマンド, 146 判別分析コマンド, 140 ヒストグラム コマンド, 73 標本サイズの選択コマンド, 93 符号検定コマンド, 165 変数のスタック解除コマンド, 51 変数のスタック化コマンド, 49 変数の変換コマンド, 52 マンホイットニー検定コマン ド, 171 メニュー 回帰と分類メニュー, 125 サマリー グラフ メニュー, 73 サマリー統計メニュー, 67 時系列と予測メニュー, 113 正規性検定メニュー, 105 データ ユーティリティ メ ニュー, 49 統計的推定メニュー, 81 ノンパラメトリック検定メ ニュー, 163 品質管理メニュー, 145 ヘルプ メニュー (モデル ウィンドウ), 199 ユーティリティ メニュー, 191 予測コマンド, 120 ライセンス認証コマンド, 199 ランダム性の連検定コマンド, 118 ランダム標本コマンド, 64 リリフォース検定コマンド, 109 ロジスティック回帰コマンド, 136 225