Excel - Palisade Corporation

by user

on 28 марта 2017

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download Excel - Palisade Corporation

Transcript

Excel - Palisade Corporation

ユーザーガイド
NeuralTools
Microsoft Excel 用
ニューラルネットワーク
アドイン
®
バージョン 5.7
2010 年 09 月
Palisade Corporation
798 Cascadilla St.
Ithaca, NY 14850
USA
+1-607-277-8000
+1-607-277-8001 (fax)
http://www.palisade.com (Web サイト)
[email protected] (電子メール)
著作権表記
Copyright © 2010, Palisade Corporation.
商標について
Microsoft、Excel、Windows は Microsoft Corporation の登録商標です。
IBM は International Business Machines, Inc. の登録商標です。
Palisade、TopRank、BestFit、RISKview は Palisade Corporation の登録商標です。
NeuralTools for Excel へようこ
そ
ようこそ
NeuralTools を使用すると、業界標準のデータ分析・モデル化ツール
である Microsoft Excel に強力なツールセットを新しく追加できま
す。Microsoft Excel アドインとしてニューラルネットワーク機能
を提供する NeuralTools では、使い慣れた Microsoft Office の作
業環境を離れることなく Excel ワークシートに設定されたデータの
分析を行うことができます。強力なデータマネージャと最新のニュ
ーラルネットワークアルゴリズムを採用した NeuralTools を利用
すれば、Microsoft Office の使いやすさと優れたレポート機能に加
えて、ニューラルネットワークの堅牢で正確な予測機能も手に入れ
ることができます。
使い慣れた作業環境
Excel に慣れているユーザーなら NeuralTools を使った作業も簡単
です。NeuralTools の使い方は Excel とまったく同じです。ツール
バー、メニュー、そしてカスタムワークシート関数のすべてが
Excel アプリケーション内に表示されます。スタンドアロンのニュー
ラルネットワークソフトウェアと異なり、ふだん使っている Excel
と同じように作業ができる NeuralTools は簡単に習得でき、事前の
トレーニング費用もかかりません。使用するデータや変数は Excel
スプレッドシートに入っています。標準の Excel 式による計算だけ
でなく、並べ替え機能やピボットテーブルも利用できます。分析か
ら得られたレポートやグラフは標準の Excel 形式で作成されるので、
Excel に備わっている書式機能をすべて使うことができます。
NeuralTools for Excel へようこそ
i
NeuralTools を使った分析
ニューラルネットワークにはデータ内の複雑な相互関係を学習する
能力があります。人の脳の働きを模倣してデータに内在するパターン
を認識し、与えられた新しいデータから予測を行うことができます。
ニューラルネットワークを使って解決する問題は、主に次の 2 つの
グループに分けられます。
•
分類問題: 分類問題では、未知の項目についてその所属カテ
ゴリを判断します。例としては医学的診断やクレジット返済
能力の予測などが挙げられます。
•
数値的問題: 数値的問題では特定な数値の結果を予測します。
例としては将来の株価予測や特定期間における売上高の予測
などが挙げられます。
ニューラルネットワークは株式市場予測、クレジットやローンのリ
スク管理、クレジット詐欺の検知、売上予測、全般的な事業予測、投
資リスク、医学的診断、科学研究、および管理システムといった、幅
広い分野で使用されています。
NeuralTools には最新のニューラルネットワークアルゴリズムが採
用されており、分類問題 (NeuralTools ではカテゴリ予測といいま
す) と数値的問題の両方において最も優れた予測を立てることが可能
です。
NeuralTools のデータ管理機能
NeuralTools には、Palisade の Excel 用統計アドイン StatTools
と同様に、Excel で直接使用できるデータセットと変数を総合的に管
理する機能が用意されています。Excel にあるデータから、分析の対
象となる変数を指定したデータセットをいくつでも直接定義できます。
NeuralTools はデータのブロックをインテリジェントに分析し、変数
の名前、タイプ、そしてデータの位置などを提案します。データセッ
トと変数は複数のワークブックやワークシートに保存が可能なので、
必要に応じて自由にデータを整理できます。変数を定義したら、これ
らを参照するニューラルネットワークのトレーニングを行います。
Excel でデータを何度も選択する必要はありません。さらに
NeuralTools の変数のサイズは 1 つの Excel ワークシートの列に限
定されません。1 つの変数に対して最大 255 のワークシートにわた
る同じ列を使用することが可能です。
ii
ようこそ
NeuralTools のレポート機能
NeuralTools では Excel の優れたレポート機能やグラフ機能をフル
に活用できます。NeuralTools のグラフは Excel 形式なので、新し
い色やフォントを設定したりテキストを追加したりして簡単にカスタ
マイズできます。レポートのタイトルや数値のフォーマットやテキス
トなども標準の Excel シートと同じ方法で変更できます。
NeuralTools で作成したレポートからテーブルやグラフをほかの文書
やアプリケーションにドラッグ＆ドロップすることも可能です。
NeuralTools インダストリアル版には、Excel ワークシートに新しい
データを入力すると同時に予測値が計算されるライブ予測機能も用意
されています。このライブ計算は、ほかの Excel 再計算と同じく自
動的に行われます。
データのアクセスと共有
NeuralTools では、Excel の優れたデータインポート機能を利用し
て既存のデータを簡単に使用できます。 Excel の機能を使って
Microsoft SQL Server、Oracle、Microsoft Access、その他の ODBC
対応データベースからデータを読み込むことができます。テキスト
ファイルやほかのアプリケーションからデータを読み込むことも可能
です。Excel に読み込めるデータはすべて NeuralTools でも使用で
きます。
NeuralTools ではすべての結果とデータが Excel ワークブックに保
存されます。ほかのすべての Excel ファイルと同じく NeuralTools
で得られた結果とネットワークは世界のどこにでも送信することがで
きます。同僚とデータを共有するのもこの上なく簡単です。
NeuralTools プロフェッショナル版とインダストリ
アル版について
NeuralTools にはプロフェッショナル版とインダストリアル版の 2
つのバージョンがあります。各バージョンの違いは以下のとおりです。
•
NeuralTools プロフェッショナル版のデータセットは 1,000
ケースに制限されますが、インダストリアル版では最大
16,777,216 ケースのデータセットがサポートされます。
•
Excel ワークシートに新しいデータを入力すると同時に予測
値が計算されるライブ予測機能は、NeuralTools インダスト
NeuralTools for Excel へようこそ
iii
リアル版のみで使用できます。このライブ計算は、ほかの
Excel 再計算と同じく自動的に行われます。
iv
ようこそ
目次
第 1 章: NeuralTools 活用の基礎
1
はじめに .........................................................
パッケージの確認 .................................................
製品パッケージの確認 .............................................
このバージョンについて ...........................................
ご利用のオペレーティング環境での作業.............................
サポートについて .................................................
NeuralTools システム必要条件.....................................
3
3
3
3
4
4
6
インストール手順 .................................................. 7
一般的なインストール手順......................................... 7
NeuralTools アイコンおよびショートカットの設定................... 8
DecisionTools Suite .............................................. 9
ソフトウェアのアクティベーション (ライセンス認証) ................. 11
第 2 章: NeuralTools の概要
15
概要 ............................................................. 17
ニューラルネットワークの利点...................................
NeuralTools とニューラルネットワーク...........................
NeuralTools のメニューとツールバー..............................
データセットとデータセットマネージャ...........................
ニューラルネットワークのトレーニング...........................
ネットワークのテスト ............................................
予測 ............................................................
NeuralTools のレポートとグラフ..................................
NeuralTools のユーティリティ....................................
NeuralTools と StatTools、ソルバー、Evolver との連携 ............
第 3 章: NeuralTools リファレンスガイド
17
18
19
19
21
26
27
28
29
30
31
はじめに ......................................................... 33
リファレンス: NeuralTools アイコン
35
NeuralTools ツールバー ........................................... 35
目次
v
リファレンス: NeuralTools メニューのコマンド
37
はじめに ......................................................... 37
ダイアログボックスに表示されるアイコン......................... 38
コマンドリファレンス ............................................ 38
[データセットマネージャ] コマンド..............................
[トレーニング] コマンド .........................................
[テスト] コマンド ...............................................
[予測] コマンド .................................................
39
45
57
65
ユーティリティ ................................................... 69
[アプリケーション設定] コマンド................................. 69
[ニューラルネットマネージャ] コマンド......................... 72
[データ補足ユーティリティ] コマンド............................. 74
ニューラルネットワークについて
77
ニューラルネットワークの基礎知識 ................................ 77
ニューラルネットワークと統計的手法の比較.......................
ニューラルネットワークの構造...................................
数値予測とカテゴリ予測 ..........................................
ネットのトレーニング ............................................
ニューラルネットワークのコンピュータ処理.......................
ニューラルネットワークのタイプ.................................
77
78
78
78
79
79
多層フィードフォワードネットワーク............................... 81
MLF のアーキテクチャ ............................................ 81
MLF ネットのトレーニング ........................................ 83
一般回帰ニューラルネットと確率的ニューラルネット................ 87
一般回帰ニューラルネットワーク................................. 87
確率的ニューラルネットワーク................................... 89
MLF ネットと PN/GRN ネットの比較 ................................. 93
入力の変換 ....................................................... 95
参考文献 ......................................................... 97
索引
vi
99
ようこそ
第 1 章: NeuralTools 活用の基
礎
はじめに .......................................................... 3
パッケージの確認 .................................................
製品パッケージの確認 .............................................
このバージョンについて ...........................................
ご利用のオペレーティング環境での作業.............................
サポートについて .................................................
NeuralTools システム必要条件.....................................
3
3
3
4
4
6
インストール手順 .................................................. 7
一般的なインストール手順......................................... 7
NeuralTools アイコンおよびショートカットの設定................... 8
DecisionTools Suite .............................................. 9
ソフトウェアのアクティベーション (ライセンス認証) ................. 11
@RISK 4.5 Help System © Palisade Corporation, 1999
1
2
はじめに
はじめに
このセクションでは、 NeuralTools 製品パッケージの内容と、
Windows 2000 以降に NeuralTools をインストールしてお使いの
Microsoft Excel 2000 またはそれ以降と連携させる方法について解
説します。
パッケージの確認
NeuralTools パッケージには以下が含まれています。
以下が収録された DecisionTools Suite CD-ROM
•
NeuralTools プログラム
•
NeuralTools チュートリアル
•
NeuralTools ユーザーガイド (本書) の PDF ファイル
NeuralTools ライセンス使用許諾契約書
パッケージ内容に不備がある場合は NeuralTools 販売代理店または
サプライヤーにご連絡いただくか、Palisade 社 (電話: 米国 (607)
277-8000) まで直接お問い合わせください。
製品パッケージの確認
NeuralTools は、単体製品として購入する場合と、DecisionTools
Suite プロフェッショナル版またはインダストリアル版に含まれて出
荷される場合があります。NeuralTools CD-ROM には、NeuralTools
Excel アドイン、NeuralTools のサンプルファイル、および索引付
きの NeuralTools オンラインヘルプシステムがそれぞれ含まれて
います。DecisionTools Suite プロフェッショナル版およびインダス
トリアル版には、上記すべてとさらに追加のアプリケーションが含ま
れています。
このバージョンについて
このバージョンの NeuralTools は、Microsoft Excel 2000 またはそ
れ以降に 32 ビットプログラムとしてインストールできます。
第 1 章: NeuralTools 活用の基礎
3
ご利用のオペレーティング環境での作業
このユーザーガイドは、Windows オペレーティングシステムおよび
Excel についての一般的な知識がある読者を対象としています。特に
以下の知識が必要です。
•
ご利用のコンピュータ、およびマウスの使い方に精通しているこ
と。
•
アイコン、クリック、ダブルクリック、メニュー、ウィンドウ、
コマンド、およびオブジェクトといった用語に精通していること。
•
ディレクトリ構造やファイルの命名といった、基礎的な概念を理
解していること。
サポートについて
テクニカルサポートは、有効なメンテナンスプランをお持ちの
NeuralTools 登録ユーザーのお客様に対して無償で、あるいはインシ
デントごとに有償で提供しております。NeuralTools 登録ユーザーに
なるには、http://www.palisade.com/support/register.asp にてオンライ
ン登録を行ってください。
電話でのお問い合わせの際には、あらかじめ製品のシリアル番号とユ
ーザーガイドをお手元にご用意ください。また、コンピュータで作
業できる状態でご連絡いただければ、さらに効果的なテクニカルサ
ポートを受けることができます。
お問い合わせの
前に
4
テクニカルサポートへのお問い合わせの前に、次の事柄をご確認く
ださい。
•
オンラインヘルプを参照しましたか？
•
本ユーザーガイドを確認し、オンラインマルチメディアチュ
ートリアルの内容を参照しましたか？
•
「お読みください」(README.WRI) ファイルを読みましたか？こ
のファイルには、マニュアルに収録されていない、最新の
NeuralTools 製品情報が記載されています。
•
問題となっている障害は再現することが可能ですか？また、別の
コンピュータやモデルでも、問題点を再現することは可能です
か？
はじめに
•
Palisade へのお
問い合わせ
弊社の Web サイトをご覧になりましたか？弊社サイトの URL ア
ドレスは http://www.palisade.com です。このサイトのテクニ
カルサポートのセクションには、最新の FAQ (テクニカルサポ
ートに寄せられた質問とその回答集を収録した、検索可能なデー
タベース)、および NeuralTools のパッチが掲載されています。
NeuralTools およびその他の Palisade ソフトウェアの最新情報
をいち早く入手できるよう、弊社のサイトには定期的にアクセス
されることをお勧めします。
Palisade 社では、NeuralTools に関するご質問、ご意見、およびご
提案をお待ちしております。テクニカルサポートには、以下のいず
れかの方法でご連絡いただけます。
•
電子メール: [email protected]
•
電話: +1-607-227-8000 (米国)、米国東海岸時間平日午前 9 時
から午後 5 時まで。テクニカルサポートへの電話案内の指示に
従ってください。
•
ファックス: +1-607-227-8001 (米国)
•
郵便:
Technical Support
Palisade Corporation
798 Cascadilla St
Ithaca, NY 14850
USA
Palisade Europe へのお問い合わせ:
•
電子メール: [email protected]
•
電話: +44 1895 425050 (英国)
•
ファックス: +44 1895 425051 (英国)
•
郵便:
Palisade Europe
31 The Green
West Drayton
Middlesex
UB7 7PN
United Kingdom
Palisade Asia-Pacific へのお問い合わせ:
•
電子メール: [email protected]
•
電話: +61 2 9252 5922 (オーストラリア)
•
ファックス: +61 2 9252 2820 (オーストラリア)
第 1 章: NeuralTools 活用の基礎
5
•
郵便:
Palisade Asia-Pacific Pty Limited
Suite 404, Level 4
20 Loftus Street
Sydney NSW 2000
Australia
いずれの方法でお問い合わせいただく場合でも、必ず製品名、正確な
バージョン番号、およびシリアル番号をご連絡ください。正確なバー
ジョンは、Excel の NeuralTools メニューから [NeuralTools につ
いて] コマンドを選択することで確認できます。
ステューデント
版
ステューデント版の NeuralTools に対する電話でのサポートは提供
しておりません。サポートが必要な場合は、以下の方法をご検討くだ
さい。
♦
担当の教授または教育助手に相談する。
♦
http://www.palisade.com にアクセスして FAQ を参照する。
♦
電子メールまたはファックスで弊社のテクニカルサポート部
門に連絡する。
NeuralTools システム必要条件
NeuralTools 5.5 for Microsoft Excel、Windows 版のシステム必要
条件は以下の通りです。
6
•
ハードディスクが備わった Pentium 以上のパーソナルコン
ピュータ
•
Microsoft Windows 2000 SP4、Windows XP またはそれ以降
•
Microsoft Excel 2000 またはそれ以降
はじめに
インストール手順
一般的なインストール手順
NeuralTools のセットアッププログラムは、ユーザーが指定したハ
ードディスク上のディレクトリに NeuralTools システムファイル
をコピーします。
Windows 2000 およびそれ以降でのセットアッププログラム実行方法
は、以下の通りです。
1) CD-ROM ドライブに NeuralTools または DecisionTools Suite
CD-ROM を挿入します
2) [スタート] ボタンをクリックし、[設定] > [コントロールパネ
ル] をクリックします。
3) [プログラムの追加と削除] アイコンをダブルクリックします。
4) [インストール/アンインストール] タブの [インストール] ボタ
ンをクリックします。
5) 画面に表示されるセットアップ手順に従います。
NeuralTools のインストール中に問題が発生する場合は、インストー
ル対象のドライブに十分な空きスペースがあることを確認してくださ
い。十分な空きスペースが確保できたら、再度、インストール手順を
実行してください。
NeuralTools の
コンピュータか
らの削除
ご利用のコンピュータから NeuralTools を削除する場合は、[コント
ロールパネル] の[プログラムの追加と削除] ユーティリティを起動
して NeuralTools のエントリを選択してください。
第 1 章: NeuralTools 活用の基礎
7
NeuralTools アイコンおよびショートカットの設定
Windows タスク
バーでのショー
トカットの作成
NeuralTools のセットアッププログラムは、タスクバーのプログラ
ムメニューに NeuralTools コマンドを自動的に作成します。ただし、
セットアップ作業中に問題が発生した場合、あるいは、別の機会に手
動でこのコマンドを作成したい場合は、以下の手順に従います。以下
は Windows XP プロフェッショナル版の手順です。その他のオペレー
ティングシステムでは手順が若干異なる場合があります。
1) [スタート] ボタンをクリックし、[設定] を選択します。
2) [タスクバーと [スタート] メニュー] をクリックし、[[ス
タート] メニュー] タブをクリックします。
3) [カスタマイズ] をクリックし、[参照] をクリックします。
4) 「NeuralTools.EXE」というファイルを見つけてクリックし、
[OK] をクリックします。
5) [次へ] をクリックし、プログラムのショートカットを保存す
るメニューをダブルクリックします。
6) 名前として「NeuralTools」と入力し、[完了] をクリックし
ます。
7) すべてのダイアログで [OK] をクリックして閉じます。
8
インストール手順
DecisionTools Suite
NeuralTools は、Palisade 社が提供しているリスク分析・意思決定
分析のためのセット製品 DecisionTools Suite の一部です。デフォ
ルトの NeuralTools インストール手順では、メインディレクトリで
ある「Program Files\Palisade」のサブディレクトリに NeuralTools
がインストールされます。これは、「Microsoft Office」ディレクト
リのサブディレクトリに Excel がインストールされるのと同じ要領
です。
Program Files\Palisade ディレクトリに作成されるサブディレクト
リの 1 つが、 NeuralTools ディレクトリ ( デフォルト名
「NeuralTools5」) です。このディレクトリには、NeuralTools アド
インプログラムファイル (NEURALTOOLS.XLA) に加えて、サンプル
モデルおよび、NeuralTools を実行するために必要な関連ファイルが
含まれています。Program Files\Palisade には、SYSTEM というサブ
ディレクトリも作成されます。このディレクトリには、共通のヘルプ
ファイルやプログラムライブラリなど、DecisionTools Suite のす
べてのプログラムで必要とされるファイルが含まれています。
第 1 章: NeuralTools 活用の基礎
9
10
インストール手順
ソフトウェアのアクティベーション (ライセンス
認証)
アクティベーション (ライセンス認証) とは、お手元の NeuralTools
ソフトウェアを完全なライセンス版製品として実行するために必要な、
一度限りのライセンス認証手続きです。ライセンス認証コードは、書
類または電子メールでお送りしたインボイスに記載されている、「
19a0-c7c1-15ef-1be0-4d7f-cd」などのダッシュ (-) で区切られた一
連の文字列です。インストール手続き中にライセンス認証コードを入
力した場合は、当該ソフトウェアの初めての実行時にソフトウェアの
アクティベーションが行われるため、他のユーザー操作が必要になる
ことはありません。インストール手続きの完了後にソフトウェアのア
クティベーションを行いたい場合は、NeuralTools の [ヘルプ] メニ
ューから [ライセンス認証] コマンドを選択し、表示される
[Palisade ライセンス認証] ダイアログボックスに、お客様のライ
センス認証コードを入力します。
FAQ (よくある質
問と回答)
1) ソフトウェアがアクティベートされていないとどうなりますか？
インストール手続き中にライセンス認証コードを入力しなかった、あ
るいは、トライアル版をインストールした場合、当該ソフトウェアは
使用期限または利用ユーザー数、あるいはその両方に制限が課された
トライアル版として実行されます。当該製品を完全なライセンス版と
して実行するには、ライセンス認証コードを用いて製品のアクティベ
ーションを行う必要があります。
第 1 章: NeuralTools 活用の基礎
11
2) アクティベーションを行わずに製品を利用できる期間は、どの程
度ですか？
ライセンス認証が完了していないソフトウェアは 15 日間実行できま
す。期間中は製品の全機能を使用できますが、プログラムを起動する
たびに、残りの試用期間を示してライセンス認証を促す [ライセンス
認証] ダイアログが表示されます。15 日間のトライアル期間が過ぎ
ると、アクティベーションを済ませるまでソフトウェアを実行するこ
とはできません。
3) アクティベーションのステータスは、どうすれば確認できます
か？
[ライセンス認証] ダイアログボックスは、NeuralTools [ヘルプ]
メニューの [ライセンス認証] コマンドを選択すると表示されます。
ソフトウェアのアクティベーションが完了している場合は認証手続き
完了、トライアル版ソフトウェアの場合はライセンス認証未完了のス
テータスがそれぞれ表示されます。ソフトウェアのアクティベーショ
ンが完了していない場合は、当該ソフトウェアを実行できる残り期間
も表示されます。
4) ソフトウェアをアクティベーションする方法は？
ライセンス認証コードをお持ちでない場合は、[ライセンス認証] ダ
イアログの [購入] ボタンをクリックすることで入手できます。オン
ライン購入手続きを行うと、ライセンス認証コードが直ちに提供され、
再インストールが必要になった場合に備えてインストーラダウンロ
ードへのリンクがオプションで提供されます。電話での購入をご希望
の場合は、本章の「Palisade へのお問い合わせ」セクションに記載
の最寄りの Palisade 事業所までご連絡ください。
アクティベーション手続きは、インターネット経由または電子メール
を利用して行えます。
•
インターネットに接続している場合
[Palisade ライセンス認証] ダイアログボックスに、ライセンス認
証コードを入力するか貼り付けてから、[自動ライセンス認証] をク
リックします。数秒後に、手続き完了を示すメッセージが表示され、
[ライセンス認証] ダイアログボックスにソフトウェアのライセンス
認証が完了したことを示すステータスが表示されます。
•
インターネット接続がない場合
電子メールを使用した自動アクティベーションを利用できます。以下
の手順を行ってください。
12
ソフトウェアのアクティベーション (ライセンス認証)
1. [手動での認証] をクリックして、「request.xml」ファイル
を表示します。このファイルはディスクに保存するか、
Windows のクリップボードにコピーすることができます。(こ
の際、コンピュータ上の「request.xml」ファイルの保存場所
を書き留めておくようお勧めします。)
2. この XML ファイルを電子メール本文にコピーするか添付して、
[email protected] 宛てに送信します。送信した電子
メールの返信アドレスに、自動応答が送られてきます。
3. 返信メールに添付されている「response.xml」を、コンピュ
ータのハードディスク上に保存します。
4. [Palisade ライセンス認証] ダイアログボックスに表示され
る [処理] ボタンをクリックし、「response.xml」ファイル
を参照します。このファイルを選択し、[OK] をクリックしま
す。
手続き完了を示すメッセージが表示され、[ライセンス認証] ダイア
ログに当該ソフトウェアのアクティベーション完了を示すステータス
が反映されます。
5) ソフトウェアライセンスを他のマシンに移行するには？
ライセンスの移行 (再ホスティング) は、[Palisade ライセンス認証
] ダイアログボックスを使って 2 ステップで完了できます。まず、
1 台目のマシンでライセンス認証を解除してから 2 台目のマシンで
ライセンス認証を行います。再ホスティングが用いられる典型的な場
面としては、ご使用の NeuralTools を職場の PC からラップトップ
に移動するようなケースが挙げられます。マシン 1 からマシン 2
へのライセンス再ホスティング手続きを行う際には、両方のマシンに
当該ソフトウェアがインストールされていることと、ライセンス認証
解除・ライセンス認証の再ホスティング処理時に各マシンがインター
ネットに接続されていることを確認するようにしてください。
1. マシン 1 の [ライセンス認証] ダイアログで、[ライセンス
認証の自動解除] をクリックします。手続き完了を示すメッ
セージが表示されるまで待ちます。
2. マシン 2 で、[自動ライセンス認証] をクリックします。手
続き完了を示すメッセージが表示されるまで待ちます。
ご利用のマシンからインターネットに接続できない場合は、上記の電
子メールを使用した自動処理と同じ要領で、再ホスティング手続きを
行えます。
第 1 章: NeuralTools 活用の基礎
13
6) インターネット接続があるにもかかわらず、ライセンス認証・ラ
イセンス認証解除手続きを自動的に処理できない場合は？
ご利用のファイアウォールを、弊社ライセンシングサーバーへの
TCP 接続を許可するように設定する必要があります。シングルユー
ザー (ネットワークインストール以外) 向けのライセンシングサー
バーは、 http://service.palisade.com:8888 ( つまり
http://service.palisade.com の TCP ポート 8888) です。
14
ソフトウェアのアクティベーション (ライセンス認証)
第 2 章: NeuralTools の概要
概要
ニューラルネットワークの利点...................................
NeuralTools とニューラルネットワーク...........................
NeuralTools のメニューとツールバー..............................
データセットとデータセットマネージャ...........................
変数のタイプ ............................................
複数範囲のデータ ........................................
ニューラルネットワークのトレーニング...........................
トレーニング、テスト、予測の組み合わせ ..................
ネットワークの構成 ......................................
トレーニングのプレビュー ................................
トレーニングの実行 ......................................
トレーニングのレポート ..................................
ネットワークのテスト ............................................
テストのレポート ........................................
予測 ............................................................
予測結果 ................................................
ライブ予測 ..............................................
NeuralTools のレポートとグラフ..................................
NeuralTools のユーティリティ....................................
NeuralTools と StatTools、ソルバー、Evolver との連携 ............
第 2 章: NeuralTools の概要
17
17
18
19
19
20
21
21
22
22
22
23
24
26
26
27
27
28
28
29
30
15
16
概要
NeuralTools は、使い慣れた Microsoft Excel の作業環境で直接実
行できる強力なニューラルネットワーク機能を提供します。データ
セットの定義、ニューラルネットワークのトレーニングとテスト、
そしてトレーニング済みのネットワークを使った値の予測など、
NeuralTools の操作は Excel 内にあるデータに対して実行され、分
析結果のレポートやグラフも Excel で作成されます。
ニューラルネットワークの利点
ニューラルネットワークにはデータ内に存在する複雑な関係を学習
する能力があります。ニューラルネットワークは人の脳の働きを模
倣してデータに内在するパターンを認識し、与えられた新しいデータ
に基づき予測を行うことが可能です。ニューラルネットワークを使
って解決する問題は、主に次の 2 つのグループに分けられます。
•
分類問題: 分類問題では、未知の項目についてその所属カテ
ゴリを判断します。例としては医学的診断やクレジット返済
能力の予測などが挙げられます。
•
数値的問題: 数値的問題では結果として特定の数値を予測し
ます。例としては将来の株価予測や特定期間の売上高予測な
どが挙げられます。
NeuralTools には、ニューラルネットワークをさまざまな予測問題
に適用する方法を示したサンプルが付属しています。これらのサンプ
ルは「NeuralTools\Examples」フォルダに Excel ワークシートとし
て保存されています。
第 2 章: NeuralTools の概要
17
NeuralTools とニューラルネットワーク
NeuralTools ではニューラルネットワークの開発と使用を以下の 4
ステップで行います。
•
データの準備 - NeuralTools で使用するデータをデータセッ
トとして定義します。データセットマネージャを使用してデ
ータセットを設定します。いったん設定したデータセットは
ニューラルネットワークで何度でも使用できます。
•
トレーニング - トレーニングでは、出力値がすでにわかって
いるケースで構成されるデータセットに基づいてニューラル
ネットワークが生成されます。このデータは通常、出力・従
属変数の値がわかっている過去のケースから構成されます。
•
テスト - テストではトレーニング済みのニューラルネット
ワークをテストして、既知の出力値をどれだけ正確に予測で
きるかを評価します。テストには通常、過去のデータのサブ
セットが使用されます。このサブセットはネットワークのト
レーニングには使用されません。テストの後、ネットワーク
のパフォーマンスが測定されます。測定には既知の解を正確
に予測できた割合 (%) などの統計を使用します。
•
予測 - トレーニング済みのニューラルネットワークを使っ
て、未知の出力値の予測を行います。トレーニングとテスト
が済んだネットワークは、新しいケースデータの出力を予測
するために使用できます。
トレーニングとテストは反復処理により実行され、場合によっては長
い時間がかかります。通常はテストのパフォーマンスが最適になるニ
ューラルネットワークを生成するために、異なる設定のトレーニン
グを何度か実行します。「ベストネット」を取得できたら、予測自
体は短時間で実行できます。
以下のセクションでは NeuralTools が Excel で行う処理について説
明し、データセットを定義してニューラルネットワークのトレーニ
ングとテストを行う方法について解説します。その後、トレーニング
済みのネットワークを使用して未知の出力値を予測します。
18
概要
NeuralTools のメニューとツールバー
NeuralTools をインストールすると、Excel 2003 およびそれ以前で
は Excel のメニューバーの一部として NeuralTools のメニューとコ
マンドが表示されます。また、NeuralTools ツールバーも Excel に
表示されます。NeuralTools メニューに表示されるコマンドを使って、
1) データをデータセットとして定義し、2) ニューラルネットワー
クのトレーニングとテストを実行し、3) トレーニング済みニューラ
ルネットワークを使って値を予測します。Excel 2007 では、すべて
のコマンドに [NeuralTools] リボンバーからアクセスできます。
データセットとデータセットマネージャ
NeuralTools のデータはケースと変数に基づいて構成されています。
使用するデータセット (または統計変数のセット) は各列の 1 行目
に変数名が指定された連続した列で構成されています。データセット
の各行のことをケースと呼びます。各ケースには一連の独立変数値が
入っていて、従属出力変数は既知の値が指定されているか、空白にな
っています。出力変数の値がないケースについては NeuralTools を
使用してその値を予測することになります。
第 2 章: NeuralTools の概要
19
データセット、変数、ケースの定義には NeuralTools のデータセッ
トマネージャを使用します。その後、定義した変数をニューラルネ
ットワークのトレーニングとテストに使用します。分析に使うデータ
を何度も繰り返し選択する必要はありません。既知のすべての過去の
ケースを 1 つのデータセットとして定義し、結果を予測したいケー
スを別のデータセットとして定義することもできます。または、既知
のデータと予測が必要なデータをすべて同じデータセットに定義する
ことも可能です。
データセット内の変数にはそれぞれ名前と Excel セル範囲が関連付
けられています。セル範囲内の各列に、1 つの変数のデータが指定さ
れます。データセットに複数のセルブロックを含めて、同じワーク
ブックの複数のシートにわたりデータを保存することもできます。
データセットを定義する場合、NeuralTools は現在 Excel で選択さ
れている項目の周りのセルブロックにある変数を認識しようとしま
す。これにより、最初の行に変数名が指定され各変数が列ごとに並ん
だデータセットの設定を素早く簡単に行うことができます。
変数のタイプ
20
NeuralTools では変数のタイプが「独立・従属」、および「数値・カ
テゴリ」(例えば「はい」か「いいえ」、または「赤」、「緑」
「青」のいずれかなど) の 2 つの方法で区別されます。各データセ
ットの各変数のタイプはデータセットマネージャにより自動的に認
識されますが、このタイプは手動で変更することができます。
概要
複数範囲のデー
タ
Excel 2003 またはそれ以前のワークシートでは 1 列に変数として指
定できるデータが 65,536 に制限されています。変数にこれを超える
数の値があり、Excel 2007 を使用しない場合には、NeuralTools で
1 つのデータセットに複数のセル範囲を割り当てることができます。
つまりデータセットを複数のシートにわたって繰り返すことにより、
異なるワークシートの同じ列に 1 つのデータセットのすべての値を
保存することができます。
ニューラルネットワークのトレーニング
過去の既知の値が指定されたケースを含むデータセットを定義したら、
次にそのデータを使ってニューラルネットワークのトレーニングを
行います。NeuralTools で生成されるネットワークのタイプは、さま
ざまなオプションによって決まります。パフォーマンスのより優れた
ネットワーク (より正確な解答を予測できるネットワーク) を生成す
るためのネットワークオプションは、扱うデータの性質によって異
なります。トレーニング済みのネットワークが出力値をどの程度正確
に予測できるかは、トレーニング後に行うテストプロセスによって
測定されます。
ニューラルネットワークのトレーニング、テスト、および予測を行
うには、トレーニングに使用するデータが含まれるデータセットを指
定する必要があります。NeuralTools はトレーニング済みネットワー
クをワークブックに直接保存しますが、オプションでディスク上にフ
ァイルとして保存することもできます。
第 2 章: NeuralTools の概要
21
トレーニング、
テスト、予測の
組み合わせ
ネットワークの
構成
過去のデータと出力値が未知の新しいデータの両方を含むすべてのデ
ータが 1 つのデータセットに入っている場合、NeuralTools でネッ
トワークのトレーニングとテスト、および出力値の予測のすべての処
理を 1 度のステップで実行することが可能です。その場合、過去の
データのうち一部をテスト用に保留し (前の例では 20% に指定され
ています)、従属値が未知のケースについて出力値を自動的に予測す
るよう指定します。この方法では 1 度の操作で素早く解答を得るこ
とができます。
NeuralTools では、できる限り最適な予測を行えるようにさまざまな
構成のニューラルネットワークがサポートされます。分類・カテゴ
リ予測 (つまり従属変数のタイプがカテゴリの場合) には、確率的ニ
ューラルネットワーク (PNN) と多層フィードフォワードネットワ
ーク (MLF) の 2 種類のネットワークを使用できます。数値予測には
MLF ネットワークおよび、一般回帰ニューラルネットワーク (GRNN)
を使用できます。GRNN は PNN ネットワークと深く関連しています。
NeuralTools ではベストネット検索機能を使ってネットワーク構成
を簡単に選択することができます。このオプションを使用すると、
NeuralTools がさまざまなニューラルネットワーク構成のトレーニ
ングとテストを実行し、所定のデータに対して最適な予測が得られる
ネットワークを生成します。ベストな構成はテストデータに基づい
て判断されるので、ベストネット検索を使用する際は [トレーニン
グ] タブで [ランダムに選択したケースで自動テストを行う] オプシ
ョンを選択する必要があります。
トレーニングの
プレビュー
22
トレーニングとネットワーク構成のオプションを選択すると、ネット
ワークのトレーニング中に実行される処理が NeuralTools にプレビ
概要
ューとして表示されます。通常ニューラルネットワークのモデル化
ではトレーニングに一番長い時間がかかるので、トレーニングを実際
に開始する前にその設定を確認しておくと役に立ちます。データに問
題がある場合は NeuralTools により自動検出されるので、必要に応
じてトレーニングを続行する前に修正できます。
トレーニングの
実行
NeuralTools が指定のデータを使ってニューラルネットワークのト
レーニングを行う間、その進行状況が表示されます。トレーニングが
進行するにつれ、NeuralTools はエラーが少なくより正確な予測を行
えるネットワークを生成していくので、通常はニューラルネットワ
ークのパフォーマンスが徐々に向上していきます。トレーニング中は
NeuralTools の進行状況を示すグラフが随時更新されます。
第 2 章: NeuralTools の概要
23
最大トレーニング時間などの、ユーザーが指定した停止条件のいずれ
かが満たされるとトレーニングが終了します。ネットのテストやデー
タセットで未知の出力値の予測を自動的に行うよう指定した場合には、
トレーニングに続いてこれらの処理が実行されます。
トレーニングの
レポート
24
トレーニングのレポートにはトレーニングを行ったネットのパフォー
マンスが報告されます。不良な予測の率などの統計により、トレーニ
ングセット内でネットワークの予測した出力値が既知の実測値に一
致しないケースの数がわかります。
概要
第 2 章: NeuralTools の概要
25
ネットワークのテスト
テストによって、トレーニング済みニューラルネットワークが既知
の出力値をどれだけ正確に予測できるかが評価されます。通常テスト
データには既知の出力値を持つ過去のデータのサブセットが使用され
ます。このサブセットはネットワークのトレーニングには使用されま
せん。
テスト用のデータが個別のデータセット内にある場合、NeuralTools
がテスト用データセット内の変数をトレーニングデータの変数と照
合します。トレーニングの場合と同様に、テストを実行する前に
NeuralTools にテストの設定がプレビューとして表示されます。
テストのレポー
ト
26
テスト (およびその際に処理される予測) の処理はトレーニングより
もずっと短時間で完了します。NeuralTools はテストデータにある
既知の解答をどの程度正確に予測できたかを報告します。これにより
ネットワークを未知の出力値のあるケースに適用した場合に優れた予
測を行えるかどうかを判断できます。
概要
予測
ニューラルネットワークの最終的な使用目的は予測を立てることで
す。トレーニング済みネットワークを、出力値が未知でその予測が必
要な新しいケースに適用します。NeuralTools では、1) データセッ
トにあるケースに対してコマンドを実行して値を予測する方法と、2)
ライブ予測 (インダストリアル版のみ) を使用する方法の 2 つがあ
ります。後者ではワークシート内のケースの独立変数の値を入力する
ことができ、NeuralTools でその予測出力値が自動的に計算されます
。
データセット内の 1 つのグループの値を予測する場合、[予測] ダイ
アログを使って予測処理の設定を行うことができます。例えば出力値
が未知であるケースのみの予測を行い、オプションでライブ予測を有
効にして、データに変更を加えた場合の予測値への影響を見ることも
可能です。また、異なるトレーニング済みネットを使用した場合に予
測値が受ける影響を確認できます。
トレーニングやテストと同様に、まず NeuralTools に予測に使用さ
れるデータと設定のプレビューが表示されます。その後、予測結果が
Excel ワークシートに報告されます。
予測結果
予測された出力値は、予測の実行対象となったケースの隣に表示され
ます。下の図では予測値がピンク色で表示されています。
第 2 章: NeuralTools の概要
27
ライブ予測
ライブ予測を有効にすると、NeuralTools は予測値が表示されるセル
に Excel 式を自動的に追加します。この式により予測値が生成され
るので、ケースの独立変数の値を手動で変更するとその予測値も自動
的に再計算されるようになります。ライブ予測機能を使用すると、
[予測] ダイアログを使わずに新しいケースのデータを Excel に直接
入力して、新しい予測を自動的に生成することが可能です。例えば、
上記のワークシートの 7 行目にあるケースの独立変数の値が下記の
ように変更された場合、その予測値も自動的に更新されます。通常の
ワークシートセルと同様、すべての Excel 式からライブ予測を使用
したセルを参照することができます。
(注意: ライブ予測機能が使用できるのはインダストリアル版のみで
す。)
NeuralTools のレポートとグラフ
NeuralTools では、トレーニング、テスト、予測のそれぞれにつきサ
マリーレポートと詳細レポートの両方が作成されます。サマリーレ
ポートは個別のワークシートとして作成され、テストまたはトレーニ
ングに関する全般的な情報を確認できます。詳細レポートはレポート
対象のデータの横に表示され、ケースごとの詳しい情報が含まれてい
ます。さらに、サマリーレポートの情報のほとんどは、詳細レポー
28
概要
ト内でもタイトルセルにコメントとして追加されます。このコメン
トとして追加されたサマリーレポート情報のことをクイックサマリ
ーと呼びます。
NeuralTools で作成されたグラフはすべてレポートに表示されます。
これらのグラフは Excel 形式で作成されるので標準の Excel グラフ
コマンドを使ってカスタマイズできます。
NeuralTools のユーティリティ
NeuralTools ではニューラルネットワークのモデル化を管理しやす
くするために 2 つのユーティリティが用意されています。ニューラ
ルネットマネージャは、トレーニング済みニューラルネットワー
クを複数のワークブックやファイル間でコピーしたり移動したりする
ために使います。データ補足ユーティリティは、データセット内で値
が欠けているケースの検出と修正に使用します。
第 2 章: NeuralTools の概要
29
NeuralTools と StatTools、ソルバー、Evolver との
連携
NeuralTools は Palisade 社の Excel 用統計アドイン StatTools と
連携させて使用するために設計されています。この 2 つの製品は同
じデータセットマネージャを使用するので、NeuralTools で定義し
たデータセットを StatTools で分析したり、その逆の処理を行うこ
ともできます。StatTools を使用して、NeuralTools で定義されたデ
ータセットに関する統計や、NeuralTools で生成された予測値に関す
る統計を計算できます。
NeuralTools で生成された詳細レポートは直ちに StatTools で分析
できます。これらのレポートは StatTools のデータセットマネージ
ャのデータセットのリストに自動的に表示されます。したがって、
NeuralTools のサマリーレポートに含まれていないデータについて
も StatTools を使って統計結果を取得することが可能になります。
例えばテストのサマリーレポートには残留誤差 (実測値と予測値の
差) のヒストグラムが含まれています。例えばこのヒストグラムでは
残留誤差がほぼ正規分布として表示されていると仮定します。その場
合、正規分布の仮説をテストするために、StatTools に用意されてい
る正規性検定を詳細レポートの残留変数に適用することができます。
この例は「Abalone Age Prediction with StatTools Analysis.xls」
ファイルに含まれています。
NeuralTools のライブ予測機能によって独立変数の変更による予測値
への影響が確認しやすくなります。ライブ予測では、Excel のその他
のツールを利用して独立変数と従属変数との関係を調査することがで
きます。
ソルバー - Excel に付属しているこの最適化ツールを NeuralTools
のライブ予測機能と連携させて、NeuralTools での予測実行時に最適
な値を計算することが可能です。この例は「 Auto Loans with
Solver.xls」ファイルに含まれています。このサンプルではニューラ
ルネットワークを使って負債主が期日内に負債を返済するかどうか
を予測しています。ただしこのネットワークでは解答の信頼度が 60%
しかありません。このような場合に Excel のソルバーを使って、負
債主が期日内に返済を行う信頼度が 90% に上がるようなローン金額
を判断することができます。ソルバーがさまざまなローン額を試行し、
NeuralTools が確率値を自動的に更新します。ソルバーの代わりに
Palisade 社の遺伝的アルゴリズムベースの最適化ツール Evolver
を使って解答を見つけることもできます。Evolver はソルバーと異な
り、局所的な最適解が複数ある問題を処理することができます。
30
概要
第 3 章: NeuralTools リファレ
ンスガイド
はじめに
33
リファレンス: NeuralTools アイコン
35
NeuralTools ツールバー ........................................... 35
リファレンス: NeuralTools メニューのコマンド
37
はじめに ......................................................... 37
ダイアログボックスに表示されるアイコン......................... 38
コマンドリファレンス ............................................ 38
[データセットマネージャ] コマンド..............................
[トレーニング] コマンド.........................................
[テスト] コマンド ...............................................
[予測] コマンド .................................................
39
45
57
65
ユーティリティ ................................................... 69
[アプリケーション設定] コマンド................................. 69
[ニューラルネットマネージャ] コマンド......................... 72
[データ補足ユーティリティ] コマンド............................. 74
ニューラルネットワークについて
第 3 章: NeuralTools リファレンスガイド
77
31
32
はじめに
この「NeuralTools リファレンスガイド」の章では、NeuralTools
のアイコン、コマンド、および統計関数について説明します。この章
は次の 2 つのセクションに分かれています。
1) リファレンス: NeuralTools アイコン
2) リファレンス: NeuralTools メニューのコマンド
第 3 章: NeuralTools リファレンスガイド
33
34
はじめに
リファレンス: NeuralTools アイ
コン
NeuralTools ツールバー
NeuralTools のアイコンを使用して、ケースや変数を持つデータセッ
トを定義し、ニューラルネットワークを作成してこのデータに適用
します。NeuralTools アイコンは、Excel 2003 およびそれ以前のバ
ージョンではカスタムツールバーとして表示され、Excel 2007 では
リボンに表示されます。このセクションでは、各アイコンの実行機能
および、これらに対応するメニューコマンドを解説します。Excel
2007 では、すべてのコマンドに [NeuralTools] リボンバーからア
クセスできます。
Excel 2003 以前の NeuralTools ツールバーおよび NeuralTools の
ダイアログボックスには次のアイコンが表示されます。
アイコン
実行される機能と対応コマンド
データセットと変数を定義、または既存のデータセッ
トと変数を編集または削除
対応コマンド: [データセットマネージャ] コマンド
ニューラルネットワークのトレーニングを実行
対応コマンド: [トレーニング] コマンド
ニューラルネットワークのテストを実行
対応コマンド: [テスト] コマンド
トレーニング済みネットワークを使って値を予測
対応コマンド: [予測] コマンド
ニューラルネットワークのユーティリティを実行
対応コマンド: [ユーティリティ] コマンド
NeuralTools ヘルプファイルを表示
対応コマンド: [ヘルプ] コマンド
リファレンス: NeuralTools アイコン
35
Excel 2007 では NeuralTools リボンに次のアイコンが表示されます。
アイコン
実行される機能と対応コマンド
データセットと変数を定義、または既存のデータセッ
トと変数を編集または削除
対応コマンド: [データセットマネージャ] コマンド
ニューラルネットワークのトレーニングを実行
対応コマンド: [トレーニング] コマンド
ニューラルネットワークのテストを実行
対応コマンド: [テスト] コマンド
トレーニング済みネットワークを使って値を予測
対応コマンド: [予測] コマンド
ニューラルネットワークのユーティリティを実行
対応コマンド: [ユーティリティ] コマンド
NeuralTools ヘルプファイルを表示
対応コマンド: [ヘルプ] コマンド
36
リファレンス: NeuralTools メニ
ューのコマンド
はじめに
リファレンスガイドのこのセクションでは、Excel の NeuralTools
メニューに表示される NeuralTools コマンドについて詳しく説明し
ます。ここでは [データセットマネージャ] コマンドから開始して、
メニューに表示されるのと同じ順序で各コマンドについて解説してい
きます。これらのコマンドの多くは NeuralTools アイコンを使って
も実行できます。各 NeuralTools アイコンに対応するコマンドにつ
いては、この章の「リファレンス: NeuralTools アイコン」のセクシ
ョンを参照してください。
リファレンス: NeuralTools メニューのコマンド
37
ダイアログボックスに表示されるアイコン
NeuralTools のダイアログボックスにはヘルプアイコンとアプリケ
ーション設定アイコンの 2 つのアイコンが表示されることがありま
す。ヘルプアイコンを使用すると、そのダイアログに関するヘルプ
トピックに素早くアクセスできます。アプリケーション設定アイコン
をクリックすると [アプリケーション設定] ダイアログが開きます。
このダイアログで NeuralTools レポートの設定や、トレーニング、
予測、および実行時のデフォルト設定を入力したり編集したりできま
す。
38
コマンドリファレンス
コマンドリファレンス
[データセットマネージャ] コマンド
NeuralTools データセットと変数を定義、または既存のデータセット
と変数を編集または削除
[データセットマネージャ] コマンドを使用して、ケースや変数を持
つデータセットを定義します。定義したデータセットは、ニューラル
ネットワークのトレーニング、テスト、および予測に使用できます。
[データセットマネージャ] ダイアログボックスでは、データセッ
トの追加と削除、データセットの名前の指定、データセット内変数の
レイアウトおよび名前の指定を行うことができます。
データセットと
変数の定義
NeuralTools のデータは変数とケースに基づいて構成されています。
使用するデータセット (または統計変数のセット) は、Excel のワー
クシートに各列の 1 行目に変数名が指定された連続した列として指
定されています。データセットの各行のことをケースと呼びます。各
ケースには一連の独立変数値が入っていて、従属出力変数は既知の値
が指定されているか、空白になっています。
データセット内の変数にはそれぞれ名前と Excel セル範囲が関連付
けられています。データセットに複数のセルブロックを含めて、同
じワークブックの複数のシートにわたりデータを保存することもでき
ます。
データセットを定義する場合、NeuralTools は現在 Excel で選択さ
れている項目の周りのセルブロックにある変数を認識しようとしま
す。これにより、最初の行に変数名が指定され、各列ごとに変数が配
置されたデータセットの設定を素早く簡単に行うことができます。
リファレンス: NeuralTools メニューのコマンド
39
[データセット
マネージャ] ダ
イアログボック
ス
[データセットマネージャ] ダイアログボックスの [データセット]
オプションには次があります。
40
•
[新規作成]、[削除] - 新しいデータセットを追加するか、既
存のデータセットを削除します。
•
[名前] - データセットの名前を指定します。
•
[Excel 範囲] - データセットに関連付ける Excel 範囲を指
定します。1 つのデータセットに複数のセル範囲が割り当て
られている場合、このエントリの前に [複数] というラベル
が表示されます。
•
[セル書式を適用する] - データセットを識別するグリッドと
色を追加します。
•
[複数] - [データセットマネージャ] ダイアログボックス
の [複数] ボタンをクリックすると、[複数範囲のデータセッ
トの定義] ダイアログが表示されます。このダイアログで複
数セル範囲のデータセットを構成する個々のセル範囲を入力
できます。
コマンドリファレンス
•
複数範囲のデー
タセット
[インポート] - 別のデータセットやトレーニング済みニュー
ラルネットワークにある変数タイプをこのデータセットにコ
ピーできます。[変数タイプのインポート] ダイアログを使っ
て変数タイプの場所と、変数定義に使用するネットワークを
指定します。
NeuralTools では異なるワークシート上の複数のセル範囲を 1 つの
データセットに割り当てることができます。複数範囲のデータセット
は次のような場合に使用します。
Excel 2003 以前のワークシートで 1 データセット内の各変数にある
データポイントの数が 65,536 個を超えるため、データセットが同
じワークブックの複数のワークシートにまたがる場合
変数のデータが、1 つのワークブック内のワークシート上にある複数
のブロックに散在している場合
注意：複数範囲のデータセットを 1 つのワークシート内に定義する
ことはできません。複数範囲のデータセットは、同じワークブック内
にある複数のワークシート上に定義します。
[複数範囲の選択] ダイアログでは次のオプションを使用できます。
•
[すべてクリア] - 入力されたすべての範囲をクリアします。
リファレンス: NeuralTools メニューのコマンド
41
[変数] オプショ
ン
•
[自動入力] - 最初に入力された範囲 (1 行目) を、アクティ
ブなワークブック内の表示可能な全ワークシートに適用し、
これらの「シート名!セル範囲」参照をグリッドに入力します。
•
[選択] - データセット範囲として使用するセルのブロックを
強調表示するための選択ツールを表示します。
•
[2 次範囲の 1 列 (行) 目に変数名を含める] - 複数範囲の
データセットでは、ダイアログに一覧された各範囲に各列を
示す変数名を含めるか、選択した最初の範囲だけに列を示す
変数名を含めるかを指定できます。最初の選択範囲は、[複数
範囲のデータセットの定義] ダイアログで 1 行目に入力した
範囲です。
[データセットマネージャ] ダイアログボックスにあるグリッド内
の各行に、1 つのデータセット内の変数が一覧表示されます。これに
は変数のデータポイントが入っている [Excel データ範囲]、[変数
名]、および [変数タイプ] が含まれます。
[変数タイプ] のオプションには次があります。
42
•
[従属カテゴリ] - 一連の可能なカテゴリ (例えば Yes また
は No、赤または緑など) から値が取得される従属 (つまり出
力) 変数です。
•
[従属数値] - 可能な値が数値である従属 (出力) 変数です。
コマンドリファレンス
タグ変数につい
て
•
[独立カテゴリ] - 一連の可能なカテゴリ (例えば Yes また
は No、赤または緑など) から値が取得される独立変数です。
•
[独立数値] - 可能な値が数値である独立変数です。
•
[タグ] - 可能な値が「トレーニング」、「テスト」、「予
測」のいずれかである変数です。このタイプの変数は、デー
タセット内にあるケースをトレーニング、テスト、予測のう
ちどれに使用するかを指定するために使われます。
•
[未使用] - データセット内にある、ニューラルネットワー
クで使用されない変数です。
タグ変数は NeuralTools のデータセットに含まれる特殊なタイプの
変数で、データセット内でトレーニング、テスト、または予測にそれ
ぞれ使用されるデータを識別するために使用します。これは、ネット
ワークのトレーニング、テスト、予測に使用するデータをすべて 1
つのデータセットに含める場合は特に便利です。タグ変数を使用する
と、NeuralTools がタグ変数の値に基づいてトレーニング、テスト、
または予測にそれぞれ使われるケースを選択します。タグ変数の値を
変更することにより、ネットワークをトレーニングし直してネットワ
ークのパフォーマンスが変動するかどうかを調べることができます。
未知の従属変数値を持つ新規ケースをデータセットに追加して、「予
測」タグを使ってこれらを予測するようにも指定できます。タグ変数
の取りうる値は次の 3 通りです。
•
[トレーニング] - このケースをトレーニングに使用するよ
う指定します。
•
[テスト] - このケースをテストに使用するよう指定します。
•
[予測] - このケースを予測に使用するよう指定します。
注意：データセットにタグ変数がある場合、[トレーニング] ダイア
ログに異なるオプションが表示されます。詳しくは [トレーニング]
コマンドの項を参照してください。
データセットと
変数のデータ容
量
NeuralTools では各セッションにつき次の使用が許可されます。
1 つのワークブック内にある最大 256 個のデータセット。
Excel 2007 では各データセットにつき最大 16,384 個の変数 (それ
以前のバージョンの Excel では最大 256 個の変数)。1 つのデータ
セットにある全データが同じワークブック内になければなりません。
変数 1 つ当たりのデータポイント数および、データセット 1 つ当
たりのケース数は Excel 2007 で使用可能なメモリ容量によってのみ
リファレンス: NeuralTools メニューのコマンド
43
制限されます (それ以前の Excel では最大 16,777,216 データポイ
ントまで)。
実際のデータ容量は、お使いのシステム構成や Excel のバージョン
によって上記より少なくなる場合があります。Excel 自体のメモリ制
限によりデータ容量が影響を受ける場合もあります。
注意： [データセットマネージャ] ダイアログボックスには、アク
ティブなワークブック (このダイアログボックスのタイトルに表示
されるワークブック) 内のすべてのデータセットと変数が表示されま
す。ほかのワークブックのデータセットを表示するには、まず Excel
で該当するワークブックをアクティブにしてから、[データセットマ
ネージャ] ダイアログを表示します。
44
コマンドリファレンス
[トレーニング] コマンド
ニューラルネットワークのトレーニングの設定を指定し、トレーニ
ングを実行
[トレーニング] コマンドを使用して、1) NeuralTools でのニューラ
ルネットワークのトレーニングに使用する設定を指定し、2) ネット
のトレーニングを開始します。
[トレーニング]
タブ
[トレーニング] ダイアログボックスの [トレーニング] タブでは、
ニューラルネットワークのトレーニングの全般的なオプションを指
定します。次のオプションがあります。
•
[データセット] - ニューラルネットワークのトレーニング
に使用されるデータセットが表示されます。このデータセッ
トは [データセットマネージャ] で定義されていて、アクテ
ィブなシート内になければなりません。
•
[ネットの保存名] - トレーニングを行うニューラルネット
ワークの名前と場所を指定します。ニューラルネットワーク
は Excel ワークブックに保存するか、ディスク上に個別のフ
ァイルとして保存することができます。名前や場所を変更す
るには、[参照] をクリックします。
リファレンス: NeuralTools メニューのコマンド
45
保存するニューラルネットワークの名前と説明を入力すること
もできます。
[トレーニング完了時に行う操作] のオプションを使用して、ト
レーニング終了後にトレーニング済みネットを使ってテストと予
測を自動的に行うよう指定できます。この操作はテストと予測の
対象となるデータが、トレーニング用データと同じデータセット
内にある場合に実行できます。
•
•
•
46
[ランダムに選択したケースで自動テストを行う] - 次の
どちらかを指定します。
1)
データセット内の特定の割合のケースがトレーニン
グから保留され、テストに使用されます。
2)
タグ変数の値が「テスト」であるケースを使ってテ
ストを行います。タグ変数は、[データセットマネ
ージャ] で指定されている変数タイプです。
[欠けている従属値の自動予測を行う] - トレーニング済
みネットを使って、次のどちらかのケースについて従属
変数値を予測するよう指定します。
1)
従属変数の値が欠けているケース、または
2)
タグ変数の値が「予測」であるケース。タグ変数は
[データセットマネージャ] で指定される変数タイ
プです。
[ライブ予測を有効にする] - NeuralTools に、予測する
従属変数値が表示されているセルに数式を挿入して予測
値を計算するよう指定します。ライブ予測機能について
詳しくは、この章の [予測] コマンドの項を参照してく
ださい。
コマンドリファレンス
•
変数の影響力分
析について
[変数の影響力を計算する] - NeuralTools に、ネットで
計算される予測を判断する際にトレーニングデータセッ
ト内の各独立変数の相対影響力を計算するよう指定しま
す。
変数の影響力分析の目的は、独立変数の変化に対するネット予測の感
度を測定することです。この分析はトレーニングデータに対しての
み行われます。分析の結果、各独立変数に「変数の相対影響力」を表
す値が割り当てられます。これはパーセント値で、合計すると 100%
になります。特定の変数のパーセント値が低いほど、その変数の予測
への影響力が小さいことを示します。この分析の結果によって、より
正確な予測を行える独立変数の新規セットを選択しやすくなります。
例えば新しい変数をいくつか追加して、代わりに影響力の小さい変数
を除外することができます。ただし、これは特定のネットに関する影
響力分析の結果である点に注意してください。あるネットが特定の変
数を無視することを「学習した」ことから、別のネットも同じ動作を
「学習する」であろうと推測されます。ただし、異なるタイプのネッ
トを使った別のトレーニングセッションを実行した結果、実際には
この変数が予測精度の向上に大きく貢献していることが判明する可能
性もあります。ケース数が少なかったり、変数の数が多いデータセッ
トでは、トレーニング済みネット間の変数の相対影響力の差が大きく
なる傾向にあります。また、これらの値はあくまで「相対的」なもの
である点に注意してください。例えば 2 つの独立変数にそれぞれ
99% と 1% が割り当てられているとします。これは、後者の変数は前
者に比べて有意度が大幅に低いことを示しますが、予測精度を高めた
い場合には、必ずしも後者の変数が重要でないとは限りません。
このほかにも変数の影響力分析については次の点に留意する必要があ
ります。
1)
分析にはトレーニング用データセットのみが含まれます。(自動
テストまたは自動予測を使用する場合、これらのケースは含まれ
ません。これらのケースにはトレーニング範囲外の数値が含まれ
ている可能性があり、その場合は予期しない分析結果が得られる
ためです。)
2)
この分析では所定のカテゴリ独立変数につき、各ケースに対して
その変数のすべての有効なカテゴリを順次分析し、これが予測値
に与える変化を測定します。(カテゴリ予測では数値の予測値が
ありませんが、カテゴリ予測の基準となる元の数値ネット出力が
得られます。分析にはこれらの数値出力が使用されます。)
3)
所定の数値独立変数については、各ケースに対してその変数のト
レーニング値範囲の最小値から最大値までを順次分析し、これが
予測値に与える変化 (カテゴリ予測の場合はその元になる数値出
力に与える変化) を測定します。
リファレンス: NeuralTools メニューのコマンド
47
変数の影響力分析の目的は、例えば特定の変数が無意味であるという
ような、確実な結論をサポートすることではありません。この分析の
目的は、独立変数の最適なセットを見つけるための支援をすることに
あります。例えば、この分析結果から特定の変数にあまり意味がない
と思われる場合には、この変数を除いてネットのトレーニングを行う
ことも可能です。
変数の影響力分析の結果は、トレーニングのサマリーレポートに表
示されます。
[ネット構成] タ
ブ
[トレーニング] ダイアログの [ネット構成] タブを使用して、指定
のデータでトレーニングを行うニューラルネットワークの種類を選
択します。特定のネット構成を選択するか、[ベストネット検索] を
選択して NeuralTools でさまざまな可能な構成をテストし、最適な
パフォーマンスが得られるネットを自動的に識別するよう指定するこ
ともできます。
NeuralTools では可能な限り最適な予測を行えるよう、さまざまな構
成のニューラルネットワークがサポートされます。分類・カテゴリ
予測 (従属変数のタイプがカテゴリの場合) には、確率的ニューラル
ネットワーク (PNN) と多層フィードフォワードネットワーク
(MLF) の 2 種類のネットワークを使用できます。数値予測には MLF
48
コマンドリファレンス
ネットワークおよび、一般回帰ニューラルネットワーク (GRNN) を
使用できます。GRNN は PNN ネットワークと深く関連しています。使
用できるネットワーク構成についての技術的な詳細は、「ニューラル
ネットワークについて」のセクションを参照してください。
[ネット構成] タブには次の設定があります。
•
[ネットのタイプ] - トレーニングに使用するネットのタイプ
を選択するか、[ベストネット検索] を選択します。[ネット
構成] タブの [オプション] セクションの内容は、選択した
ネットのタイプによって異なります。使用できるネットのタ
イプは次のとおりです。
1) [ベストネット検索] - NeuralTools が、チェックマー
クの付いたすべてのネット構成をテストします。入力さ
れた最小-最大範囲のノード数を使用する PNN/GRNN お
よび MLFN ネットが含まれます。テストデータから取得
した誤差に基づいて、指定のデータで最適なパフォーマ
ンスが得られるネット構成が判断されます。[試行した全
ネットを新規ワークブックに保存する] を選択した場合
、テスト済みの各ネットを (パフォーマンスが最適かど
うかに関わらず) ワークブックから個別に読み込み、ト
レーニング終了後に予測に使用できます。各ネットのテ
ストのサマリーレポートも利用できます。
2) [PN/GRN ネット] - この 2 タイプのネットではトレーニ
ング用に追加のオプションを選択する必要はありません。
そのため、これが NeuralTools インストール時のデフォ
ルト設定になっています。データの出力値が数値の場合
は GRNN ネットワークがトレーニングされ、出力値がカ
リファレンス: NeuralTools メニューのコマンド
49
テゴリの場合は PNN ネットワークがトレーニングされま
す。
3) [MLF ネット] - 多層フィードフォワードネットワーク
(MLFN) には 1 つか 2 つの非表示ノード層があります。
2 番目の層のノード数をゼロにすると、この層が排除さ
れます。MLFN ネットの最適な構成を判断するには、単一
の MLFN ネットをトレーニングするオプションの代わり
にベストネット検索オプションを使用するのが一番確実
な方法です。ベストネット検索を実行する時間がない場
合は [ノード数] の値を[自動] のままにすることを推奨
します。
[実行詳細] タブ
50
[トレーニング] ダイアログの [実行詳細] タブを使用して、トレー
ニングの停止条件を指定します。停止条件を選択しない場合、トレー
ニングは適切な時点で停止します。PNN/GRNN ネットのトレーニング
は比較的短時間で終了しますが、MLF ネットのトレーニングには長い
時間がかかります。停止条件を選択する代わりに、トレーニングの時
間がなくなった時点でトレーニングの進行状況ダイアログの [停止]
ボタンを手動でクリックすることも可能です。ベストネット検索で
は、検索アルゴリズムが 1 つの構成に時間をかけ過ぎないようにす
るため、1 つのネットのトレーニング時間の制限を定義する必要があ
ります。3 つの停止条件を組み合わせて、そのうちいずれかの条件が
満たされた場合に停止するよう NeuralTools に指定することもでき
ます。
コマンドリファレンス
トレーニングの [実行詳細] には、次のオプションがあります。
[トレーニングの
プレビュー] ダ
イアログ
•
[時間] - 1 つのネットワークのトレーニングを一定時間に制
限します。アルゴリズムによりこれ以上の改善が期待できな
いと判断された場合には、所定の時間が経過する前にトレー
ニングが停止することもあります。ベストネット検索を使用
する場合、テスト対象の各ネット構成がここで入力した時間
だけトレーニングされます。
•
[試行] - NeuralTools に、所定の試行数を実行した時点で停
止するよう指定します。多層フィードフォワードネットワー
クで言う「試行」とは、ニューロン間の結合への「荷重」の
割り当てのことを指します。最良の予測を生成する荷重を検
索することでトレーニングが行われます。確率的ニューラル
ネットワークおよび一般回帰ニューラルネットで言う「試
行」とは、変数への「平滑化係数」の割り当てを指します。
最良の平滑化係数を検索することでトレーニングが行われま
す。
•
[進行] - NeuralTools に、所定の時間内に誤差統計が少なく
とも入力された % 率以上改善されない場合は停止するよう指
定します。
[トレーニングのプレビュー] ダイアログには、トレーニングを開始
する前に、現在のネットワークトレーニングの設定および、データ
内で検知されたエラーが表示されます。このダイアログの内容から、
選択したトレーニング条件をすべて確認できます。[エラーと警告]
セクションに、使用するデータや設定について NeuralTools が検知
したすべての問題の説明が表示されます。必要に応じてトレーニング
を開始する前にこれらの問題を修正することができます。
リファレンス: NeuralTools メニューのコマンド
51
[トレーニング進
行中] ウィンド
ウ
[トレーニング進行中] ウィンドウには、実行中のネットワークトレ
ーニングの進行状況が報告されます。グラフは NeuralTools による
ネットワークの改善状況と報告誤差数の変化を示します。
[トレーニング進行中] ウィンドウには、トレーニングデータの誤差
が報告されます。このトレーニング誤差値の変化に基づいて、トレー
ニングに使用されないケースに対してネットが行う予測の質について
の結論を直接導き出すことはできません。予測の質に関する結論は、
テストデータで得られた誤差に基づいて行う必要があります。また、
数値予測の場合、進行状況ウィンドウに報告されるのはスケーリング
されたデータに基づく二乗平均平方根誤差である点にも注意してくだ
さい (スケーリングについては「入力の変換」セクションを参照して
ください)。カテゴリ予測の場合、報告される誤差はカテゴリデータ
の予測表現に基づいています。
52
コマンドリファレンス
トレーニングの
レポート
トレーニング後にサマリーと詳細の両方のレポートを作成できます。
これらのレポートには、トレーニング済みニューラルネットワーク
のパフォーマンスの詳細が報告されます。レポートに含める情報は、
[アプリケーション設定] ダイアログの [生成するレポート] および
[詳細レポートの列] の設定で指定します。
•
トレーニングのサマリーレポート - トレーニングのサマリ
ーレポートには、トレーニング済みニューラルネットワー
クに関する統計とグラフが表示されます。
リファレンス: NeuralTools メニューのコマンド
53
分類・カテゴリ予測の場合、トレーニングのサマリーレポートには
次の主な統計とグラフが含まれます。
1) [不良な予測の率] - 予測したカテゴリが実際のカテゴリに一
致しないケースの比率です。
2) [平均不正確率] (PNN ネットのみ) - NeuralTools が各ケー
スにつき平均不正確率を計算します。これは PNN ネットによ
り誤ったカテゴリに割り当てられた確率の和です。例えば、
ネットにより特定のケースに赤 30%、黄色 20%、緑 50% の各
確率が割り当てられ、正解が赤であることがわかっている場
合には、このケースの不正確率は 20% + 50% = 70% となりま
54
コマンドリファレンス
す。この値は、カテゴリ予測の各ケースごとの誤差尺度を提
供します。これは数値予測の残差に相当します。「平均不正
確率」は、すべてのケースの誤差値を平均したものです。
詳細レポートには各ケースごとの不正確率が表示されます。
この概念を把握するには、詳細レポートの設定を変更して確
率的ニューラルネットワークにより従属変数の可能な各カテ
ゴリに割り当てられた確率を表示するように指定すると役立
ちます。これには [ユーティリティ] メニューの [アプリケ
ーション設定] を選択し、[詳細レポートの列] の右にあるド
ロップダウンメニューをクリックします。[NeuralTools 詳細レポートに表示する列] ダイアログが表示されます。こ
のダイアログでテスト用に [全カテゴリの確率 (PNN)] を選
択します。その後、従属変数に少なくとも 3 つのカテゴリが
あるデータセット (Auto Loans.xls サンプルファイルを使
用できます) を使って、[ランダムに選択したケースで自動テ
ストを行う] を選択して PN ネットをトレーニングします。
この結果生成される詳細レポートで [不良 (%)] 列の値と可
能な各カテゴリに割り当てられた確率との関係を調べます。
不良 (%) は、すべての不正なカテゴリの確率の和です。
3) [分類行列] - 各カテゴリごとに、実際のカテゴリを予測され
たカテゴリに比較します。例えば分類行列の情報から、ネッ
トが実際に見られる病状を正しく検知できていても、健康者
についても同じ病状があると誤認される傾向があることなど
がわかります。
4) [変数の影響力] - 選択されている場合、独立変数が予測解に
与える相対影響力が表示されます。
5) [正しくないカテゴリの確率ヒストグラム] (PNN ネットのみ)
- 正しくないカテゴリの確率については、上記の「平均不正
確率」のセクションを参照してください。
リファレンス: NeuralTools メニューのコマンド
55
数値予測の場合、トレーニングのサマリーレポートには次の主な統
計とグラフが含まれます。
1) [不良な予測の率] - 実際の値の周りの所定の範囲外にある予
測値が「不良」とみなされます。この範囲は [アプリケーシ
ョン設定] の [良 / 不良の許容誤差 (トレーニング)] で設
定されます。
2) [二乗平均平方根誤差] - 実際の値からの予測の偏差の尺度で、
平均二乗偏差の平方根として計算されます。
3) [平均絶対誤差] - 実際の値からの予測の平均偏差です。
4) [変数の影響力] - 選択されている場合、独立変数が予測解に
与える相対影響力が表示されます。
5) [残留誤差のヒストグラム] - 「残留誤差 (または残差)」は、
実際の値と予測値との間の差です。
6) 実際の値、予測値、および残差の間の関係を示す散布図が表
示されます。
56
コマンドリファレンス
[テスト] コマンド
トレーニング済みニューラルネットワークのテストの設定を指定し、
テストを実行
[テスト] コマンドを使用して、1) トレーニング済みニューラルネ
ットワークのテストに使用する設定を指定し、2) ネットのテストを
開始します。
通常テストには、ネットのトレーニングに使用されない、既知の出力
値があるデータを使用します。[テスト] ダイアログには、次のオプ
ションがあります。
•
[データセット] - トレーニング済みニューラルネットワー
クのテストに使用されるデータセットが表示されます。この
データセットは [データセットマネージャ] で定義されてい
て、アクティブなワークシート内になければなりません。
•
[使用するネット] - テストするニューラルネットワークの
名前と場所を指定します。ニューラルネットワークは Excel
ワークブックに保存するか、ディスク上に個別のファイルと
して保存することができます。名前や場所を変更するには、
[参照] をクリックします。
リファレンス: NeuralTools メニューのコマンド
57
変数の照合
[変数の照合] では、テストするデータセット内の変数を、ネットの
トレーニングに使われたデータセットの変数に照合する方法を指定し
ます。
変数の照合には次の 2 つのオプションを指定できます。
1) [自動照合] - テストデータセット内の変数名を、トレーニ
ング済みネットのデータセット内にある変数の名前に照合し
、その結果に基づいて変数タイプが設定されます。
2) [カスタム照合] - カスタム照合ではテスト用データセット内
の各変数を、トレーニング済みネットのデータセット内の変
数に 1 つずつ割り当てることができます。このオプションは
2 つのデータセットで変数名が異なる場合や、割り当てを変
更したい場合などに使用します。
[変数の照合] ダイアログには、照合を行う各データセットの変数の
名前が一覧されます。照合できるのは同じタイプの変数のみです。照
合を行うたびに、指定した割り当てがデータセットに保管されます。
[以前の照合の読み込み] をクリックすると、以前行った照合が順次
読み込まれ、データセットでこれまでに使われた割り当てにアクセス
できます。
[テストのプレビ
ュー] ダイアロ
グ
58
[テストのプレビュー] ダイアログには、テストを開始する前に、現
在のネットワークテストの設定および、データ内で検知されたエラ
ーが表示されます。このダイアログの内容から、選択したテスト条件
コマンドリファレンス
をすべて確認できます。[エラーと警告] セクションに、使用するデ
ータについて NeuralTools が検知したすべての問題の説明が表示さ
れます。必要に応じてテストを開始する前にこれらの問題を修正する
ことができます。
テストのレポー
ト
テスト後にサマリーと詳細の両方のレポートを作成できます。これら
のレポートには、トレーニング済みニューラルネットワークのテス
トデータセットに対するパフォーマンスの詳細が報告されます。レ
ポートに含める情報は、[アプリケーション設定] ダイアログの [生
成するレポート] および [詳細レポートの列] の設定で指定します。
特に詳細レポートにはトレーニング済みネットがテストデータセッ
トの個々の出力値をどれくらい正確に予測できたかが報告されるので
、テストには特に役立ちます。
•
テストのサマリーレポート - テストのサマリーレポートに
は、トレーニング済みニューラルネットワークのテストデ
ータセットに対するパフォーマンスに関する統計とグラフが
表示されます。
リファレンス: NeuralTools メニューのコマンド
59
60
コマンドリファレンス
カテゴリ予測の場合、テストのサマリーレポートには次の主な
統計とグラフが含まれます。
1) [不良な予測の率] - 予測したカテゴリが実際のカテゴリ
に一致しないケースの率です。
2) [平均不正確率] (PNN ネットのみ) - NeuralTools が各
ケースにつき平均不正確率を計算します。これは PNN ネ
ットにより正しくないカテゴリに割り当てられた確率の
和です。例えば、ネットにより特定のケースに赤 30%、
黄色 20%、緑 50% の各確率が割り当てられていて、正解
が赤であることがわかっている場合には、このケースの
不正確率は 20% + 50% = 70% となります。この値は、カ
テゴリ予測の各ケースごとの誤差尺度を提供します。こ
れは数値予測の残差に相当します。「平均不正確率」は、
すべてのケースの誤差値を平均したものです。
3) 詳細レポートには各ケースごとの不正確率が表示されま
す。この概念を把握するには、詳細レポートの設定を変
更して確率的ニューラルネットワークにより従属変数の
可能な各カテゴリに割り当てられた確率を表示するよう
に指定すると役立ちます。これには [ユーティリティ]
メニューの [アプリケーション設定] を選択し、[詳細レ
ポートの列] の右にあるドロップダウンメニューをクリ
ックします。[NeuralTools - 詳細レポートに表示する列
] ダイアログが表示されます。このダイアログでテスト
用に [全カテゴリの確率 (PNN)] を選択します。その後
、従属変数に少なくとも 3 つのカテゴリがあるデータセ
ット (Auto Loans.xls サンプルファイルを使用できま
す) を使って、[ランダムに選択したケースで自動テスト
を行う] を選択して PN ネットをトレーニングします。
この結果生成される詳細レポートで [不良 (%)] 列の値
と可能な各カテゴリに割り当てられた確率との関係を調
べてみます。不良 (%) は、すべての不正なカテゴリの確
率の和です。
4) [分類行列] - 各カテゴリごとに、実際のカテゴリと予測
されたカテゴリを比較します。例えば分類行列の情報か
ら、ネットが実際に見られる病状を正しく検知できてい
ても、健康者についても同じ病状があると誤認される傾
向があることなどがわかります。
5) [正しくないカテゴリの確率ヒストグラム] (PNN ネット
のみ) - 正しくないカテゴリの確率については、上記の
「平均不正確率」セクションを参照してください。
リファレンス: NeuralTools メニューのコマンド
61
数値予測の場合、テストのサマリーレポートには次の主要な統
計とグラフが含まれます。
1) [不良な予測の率] - 実際の値の周りの所定範囲外にある
予測値が「不良」とみなされます。この範囲は [アプリ
ケーション設定] の [良 / 不良の許容誤差 (テスト)]
で設定されます。
2) [二乗平均平方根誤差] - 実際の値からの予測の偏差の尺
度で、平均二乗偏差の平方根として計算されます。
3) [平均絶対誤差] - 実際の値からの予測の平均偏差です。
4) [残留誤差のヒストグラム] - 「残留誤差 (または残
差)」は、実際の値と予測値との間の差です。
5) 実際の値、予測値、および残差の間の関係を示す散布図
が表示されます。
62
コマンドリファレンス
•
[テストの詳細レポート] - このレポートはテスト用データセ
ットの隣に表示されます。トレーニング済みネットがテスト
データセットの個々の出力値をどれくらい正確に予測できた
かが報告されます。
テストの詳細レポートでは、[アプリケーション設定] ダイアログで
設定された許容誤差に基づいて、予測が「良」と「不良」のどちらか
に分類されます。複数のテストを実行する場合、詳細レポートをテス
ト用データセットの右の新しい列に追加して、新しいトレーニング済
みネットをテストする際に個々のケースの予測がどのように変化する
かを確認することもできます。
詳細レポートの
クイックサマリ
ー
Excel のポップアップコメントを利用して、詳細レポートの表示中
にサマリーレポートに素早くアクセスすることができます。マウス
をレポートの見出しに合わせると、ポップアップコメントが表示さ
れます。注意: ポップアップコメントを表示するには、[Excel のオ
プション] - [詳細設定] の [表示] でコメントが有効になっている
必要があります。
リファレンス: NeuralTools メニューのコマンド
63
64
コマンドリファレンス
[予測] コマンド
トレーニング済みニューラルネットワークを使った値の予測の設定
を指定し、予測を実行
[予測] コマンドを使用して、1) トレーニング済みニューラルネッ
トワークを使った値の予測に使用する設定を指定し、2) 予測を実行
します。
通常の場合、未知の従属変数値があるケースが予測の対象となります。
[予測] ダイアログには、次のオプションがあります。
•
[データセット] - 予測に使用されるデータセットが表示され
ます。このデータセットは [データセットマネージャ] で定
義されていて、アクティブなワークシート内になければなり
ません。
•
[使用するネット] - 予測に使用するニューラルネットワー
クの名前と場所を指定します。ニューラルネットワークは
Excel ワークブックに保存するか、ディスク上に個別のファ
イルとして保存することができます。名前や場所を変更する
には、[参照] をクリックします。
•
[変数の照合] - 予測データを含むデータセット内の変数を、
ネットのトレーニングに使われたデータセット内の変数に照
合する方法を指定します。変数の照合を変更するには [編
集...] をクリックします。変数の照合については、この章の
「[テスト] コマンド」のセクションを参照してください。
リファレンス: NeuralTools メニューのコマンド
65
•
[予測対象] - 予測の対象となるケースを選択します。通常は
[従属値が欠けているケース] を選択しますが、必要に応じて
[すべてのケース] を予測するよう指定することもできます (
その場合は従属変数値がわかっているケースも予測の対象と
なります)。データセットにタグ変数がある場合、タグが「予
測」に設定されたケースのみの従属変数値が予測されます。
•
[オプション] - 予測値を配置する場所とライブ予測のオプシ
ョンを設定します。
1) [予測値をデータセットに直接配置する] - このオプショ
ンは、予測する各ケースにつき予測値をデータセット内
の従属変数に直接配置するよう指定します。[アプリケー
ション設定] の [生成するレポート] で [詳細レポート]
が選択されている場合には、予測値が詳細レポートにも
配置されます。このオプションを使用すると、そのセル
の現行値がすべて上書きされるので注意が必要です。デ
ータセット内に配置された予測値は色で区別されていま
す。
2) [ライブ予測を有効にする] - NeuralTools に、予測する
従属変数値が表示されるセルに数式を挿入するよう指定
します。これらの数式により、独立値が変化した場合に
NeuralTools で随時予測値を計算できるようになります。
3) [未知の値があるケースや値が無効なケースのライブ予測
を除く] - ケースの入力変数値が欠けている場合にはラ
イブ予測の数式を追加しないよう指定します。未知の入
力値があるとライブ予測式はエラー値を返します。ただ
し、独立値が欠けているケースについては NeuralTools
による数式の入力を許可する方が便利な場合もあります。
すると未知の値が入力されると同時に予測値が自動的に
表示されます。
ライブ予測
ライブ予測は NeuralTools インダストリアル版に用意されている強
力な機能です。ライブ予測を使用すると、特に予測処理を実行しなく
ても Excel で自動的に予測が行われます。ライブ予測では、予測す
る従属変数値が表示されるセルに NeuralTools が数式を挿入します。
これらの数式は次のようなカスタムの NeuralTools 関数を使用して
予測値を求めます。
=NetOutputPrediction(_PALDS_DG25B8C82B!$A$140, "DG25B8C82B",
"VG1DD83AF2", 'Prediction Data'!$A$6:$I$6, A7:I7)
数式は NeuralTools によりワークシートに追加されるので、手動で
入力する必要はありません。NeuralTools はこれらの引数に基づいて
使用するトレーニング済みネットワークおよび、ワークシート内の独
66
コマンドリファレンス
立変数の場所を識別します。ケースの入力独立変数の値が追加された
り変更されたりすると、NeuralTools が自動的に新しい予測値を返し
ます。これにより、既存のトレーニング済みネットを使って新しいケ
ースの予測を簡単に追加したり生成できるようになります。
注意：予測の基盤となるセル値が変化しないと思われる場合、トレ
ーニングまたは予測ダイアログでライブ予測の選択を解除することを
推奨します。すると、Excel でワークブックの再計算にかかる時間を
最小限に抑えることができます。
[予測のプレビュ
ー] ダイアログ
[予測のプレビュー] ダイアログには、予測を開始する前に、現在の
予測の設定および、データや設定で検知されたエラーが表示されます。
このダイアログの内容から、選択した予測条件をすべて確認できます
。[エラーと警告] セクションに、使用するデータについて
NeuralTools が検知したすべての問題の説明が表示されます。必要に
応じて予測を開始する前にこれらの問題を修正することができます。
予測レポート
予測後にサマリーと詳細の両方のレポートを作成できます。これらの
レポートには、トレーニング済みニューラルネットワークのテスト
データセットに対するパフォーマンスの詳細が報告されます。レポー
トに含める情報は、[アプリケーション設定] ダイアログの [生成す
るレポート] および [詳細レポートの列] の設定で指定されます。
[予測の詳細レポート] - このレポートは予測データセットの隣に表
示されます。予測値をデータセットの独立変数の中に直接配置しない
場合、このレポートに予測値が表示されます。独立変数にケースの過
去のデータが一部含まれている場合には、これらの過去のケースとネ
ットによる予測を混同しない方が安全です。
リファレンス: NeuralTools メニューのコマンド
67
複数の予測を実行する場合、詳細レポートをデータセットの右の新し
い列に追加して、新しいトレーニング済みネットを使用する際に個々
のケースの予測がどのように変化するかを確認することもできます。
68
コマンドリファレンス
ユーティリティ
[アプリケーション設定] コマンド
トレーニング、テスト、予測のレポートの設定を指定
[アプリケーション設定] コマンドを使用して、1) トレーニング、テ
スト、予測で生成するレポート、2) トレーニングのデフォルト設定
、および 3) 予測と実行詳細のデフォルト設定をそれぞれ指定します
。主にアプリケーション設定では、トレーニング、テスト、予測ダイ
アログで使用されるデフォルト設定が指定されます。これらの各設定
についての詳細は、該当するダイアログの説明を参照してください。
ここではそれ以外の設定について説明します。
レポート
レポートの設定には次の項目が含まれます。
•
[生成するレポート] - NeuralTools のすべての処理はサマリ
ーレポートと詳細レポートの両方を生成することができます。
ただし、一部のレポートは処理によっては情報価値がないた
め、通常はデフォルトのレポート設定を使用します。例えば、
予測処理では詳細レポートが標準のレポートオプションです。
リファレンス: NeuralTools メニューのコマンド
69
この場合、サマリーレポートからはあまり役立つ情報を得ら
れません。
サマリーレポートは独自のワークシートに作成されますが、
詳細レポートはデータセットと同じワークシート内にデータ
セットの右の列に配置されます。
•
[サマリーレポートの保存場所] のオプションには次があり
ます。
-
•
•
70
[新規ワークブック] - 各レポートにつきワークシートが
新規作成されます。複数のレポートで同じワークブック
を再利用するか、各レポート用に新しいワークブックを
作成することができます。
[詳細レポートの場所] のオプションには次があります。
-
[既存のレポートを上書き] - データセットの前回の詳細
レポートからのデータが入った列が、新しい詳細レポー
トにより上書きされます (詳細レポートを手動で削除す
るには、列の見出しをクリックしてからドラッグで該当
するすべての列を選択し、[編集] メニューの [削除] を
クリックします)。
-
[データセットの右] - データセットの右に新しい列が挿
入され、新しい詳細レポートがそこに配置されます。
-
[既存のレポートの右] - データセットおよび既存のレポ
ートの右にある列に、新しい詳細レポートが配置されま
す。
[詳細レポートの列] - データセットの右に配置される詳細レ
ポートに、ここで選択した各行につき 1 つの列が作成されて
各ケースの情報が表示されます。
ユーティリティ
次の列を表示できます。
1) [使用したタグ] -「トレーニング」、「テスト」、「予
測」のタグにより、各ケースがトレーニングやテストに
使用されたこと、または予測の対象となったことを示し
ます。
2) [ネットを使って取得した予測] - ネットにより予測され
た数値またはカテゴリが表示されます。
3) [予測カテゴリの確率 (PNN)] - 確率的ニューラルネッ
トワークでは未知のカテゴリの予測に加えて、そのカテ
ゴリの確率も割り当てられます。多層フィードフォワー
ドネットワークを使ってカテゴリを予測する場合は使用
できません。数値予測には適用されません。
4) [正しくないカテゴリの確率 (PNN)] - PNN ネットにより
正しくないカテゴリに割り当てられた確率の和です。例
えば、ネットにより特定のケースに赤 30%、黄色 20%、
緑 50% の各確率が割り当てられていて、正解が赤である
ことがわかっている場合には、このケースの不正確率は
20% + 50% = 70% となります。この列は、カテゴリ予測
の各ケースごとの誤差尺度を提供します。これは数値予
測の「残差」列に相当します。
5) [残留誤差] - 実際の値と予測値の間の差です。カテゴリ
予測には適用されません。
6) [良 / 不良の評価] - 数値予測の場合、特定のケースの
予測が実際の値から所定の範囲内に収まるかどうかがこ
の列に表示されます。この範囲は [良 / 不良の許容誤差
] として定義されます。カテゴリ予測の場合、この列に
は予測カテゴリが実際のカテゴリと一致するかどうかが
表示されます。
7) [全カテゴリの確率 (PNN)] - このオプションを使用して
確率的ニューラルネットワークをトレーニングすると、
各従属カテゴリにつき 1 つの列が挿入されます。例えば
、ネットで色を予測する場合、「赤 %」、「黄色 %」、
「緑 %」という列が挿入され、ここに各色に割り当てら
れた確率が表示されます。
•
[良 / 不良の許容誤差] - テストとトレーニングでは、数値
予測と実際の従属変数値の差がここで入力した % 値内である
場合に「良」と評価されます。
リファレンス: NeuralTools メニューのコマンド
71
[ニューラルネットマネージャ] コマンド
トレーニング済みニューラルネットワークをコピー、移動、削除
[ニューラルネットマネージャ] コマンドを使用して、トレーニン
グ済みニューラルネットワークをワークブックやファイル間で移動
したり、これらのネットワークに説明や情報を追加できます。
ニューラルネットワークは Excel ワークブックに保存するか、ディ
スク上に個別のファイルとして保存することができます。1 つの
Excel ワークブックに任意数のネットワークを保存できます。ニュー
ラルネットマネージャを使用して、ネットワークを新規ワークブッ
クやファイルに移動したり、ネットワークの削除や置換を行うことが
できます。これにより、トレーニングデータの含まれたワークブッ
クがなくても、既存のトレーニング済みネットワークを使用して別の
ワークブックにあるデータセットを簡単に分析できます。
72
ユーティリティ
ニューラルネットマネージャには次のオプションがあります。
•
[コピー] - トレーニング済みニューラルネットワークを別
の場所にコピーします。ネットワークをコピーする先のワー
クブックまたはファイルを選択してください。
•
[取り除く] - トレーニング済みニューラルネットワークを
削除します。
•
[置換] - トレーニング済みニューラルネットワークを新規
ニューラルネットワークで上書きします。この機能はライブ
予測に使われるネットに対して使用できます。置換後は、古
いネットを使って行われていたライブ予測が、新しいネット
を使って実行されるようになります。ただし、これは詳細レ
ポートには適用されません。詳細レポートに置換前のネット
を使用したライブ予測セルが含まれている場合、置換後これ
らのセルには固定値が設定されます。
•
[ネット情報] - ネットワークに説明や情報を追加できます。
トレーニング済みネットワークとそのトレーニング条件を確
認するのに役立ちます。
リファレンス: NeuralTools メニューのコマンド
73
[データ補足ユーティリティ] コマンド
データセット内の未知のデータやエラー値を人工的な値で置換
[データ補足ユーティリティ] コマンドを使用して、データセットに
ある未知の値や不正なデータを人工の値で置換します。未知の値があ
るケースはトレーニング、テスト、および予測の処理中に
NeuralTools により無視されるので、処理を実行する前にこれらの値
を修正しておくと役に立ちます。
データセットに未知の値を持つケースが含まれている場合、[トレー
ニングのプレビュー] ダイアログボックスに警告が表示されます。
これらのケースは [データ補足ユーティリティ] コマンドを使って修
正することができます。
[データ補足ユーティリティ] ダイアログには次のオプションがあり
ます。
•
[修正する変数] - 現在のワークシート内のデータセットで使用
される変数のリストと、欠けている値、エラーの値、および数値
変数の場合は数値でない値の数がそれぞれ表示されます。未知の
値やその他の問題のあるデータを置換するには、変数にチェック
マークを付けます。
この変数リストで右クリックのメニューを使用して、変数のグル
ープを選択したり選択解除することができます。
74
ユーティリティ
•
[置換する値] - 選択した変数内の置換する値のタイプを選択し
ます。[特定の値] を選択すると、その変数内の特定の値のすべ
てのインスタンスを新しい値に置換できます。
•
[次のもので置換] - 未知の値や問題があるデータの代わりにデ
ータセットに配置する値を指定します。カテゴリ変数と数値変数
では指定できる値が異なります。
[カテゴリ変数] - 次のオプションがあります。
-
[使用頻度が最高 (最低) のカテゴリ] - データセット内
のケースで頻度が最高または最低のカテゴリ値で置換し
ます。
-
[近接カテゴリ] - データセット内の未知の値があるケー
スの隣にあるケースのカテゴリ値で置換します。
-
[ランダムに選択したカテゴリ] - データセット内からラ
ンダムに選択されたカテゴリ値で置換します。
-
[指定のカテゴリ] - すべての未知の値または問題のある
値を特定の値に設定します。
[数値変数] - 次のオプションがあります。
-
[変数の平均値] - データセット内の全ケースの変数の平
均値で置換します。
-
[変数のメジアン値] - データセット内の全ケースの変数
のメジアン値で置換します。
-
[近接値からの補間値] - データセット内の未知の値があ
るケースの隣にあるケースの変数値を補間した値で置換
します。
-
[ランダムな値 (最小 - 最大範囲内)] - データセット内
のすべてのケースの変数の最小値と最大値の間にあるラ
ンダムな値で置換します。
[セルをクリア] は両方の変数タイプに共通のオプションで、選択さ
れている変数値をクリアします。
未知の値につい
て
[データ補足ユーティリティ] ダイアログでは、未知の値に対処する
1 つの方法として実際のデータが欠けている場合に人工的なデータを
生成することができます。ただし、未知のデータを空のままにして
NeuralTools でこれらのデータを無視する方が好ましいことも多くあ
ります。NeuralTools では「?」などの特殊な記号が未知のデータと
して認識されない点に注意してください。疑問符はクリアする必要が
あります。これには、[データ補足ユーティリティ] の [置換する値]
リファレンス: NeuralTools メニューのコマンド
75
セクションで [特定の値] を選択し、[次のもので置換] セクション
で [セルをクリア] を選択します。
また、NeuralTools を使って未知データがほとんどない独立変数に基
づいて、独立変数の未知の値を予測する方法もあります。未知の値を
予測するようトレーニングしたネットが信頼できるかどうかは、テス
トの結果から判断できます。
76
ユーティリティ
ニューラルネットワークについて
ニューラルネットワークの基礎知識
ニューラルネットワークは、数値の入力に対して計算を実行し、1
つ以上の数値を出力する処理機構です。特定の目的で設計されトレー
ニングされたニューラルネットワークの場合、所定の値に対してほ
ぼ正しい値を出力することができます。例えばネットへの入力として、
アワビの体長、直径、重量といった簡単に測定できる特性を指定する
ことができます。ネット内で実行される計算の結果、おおよそ動物の
年齢に近い 1 つの数値を得ることができます (アワビの年齢査定は
困難です)。
ニューラルネットワークの概念は脳の構造に基づいています。脳は
「ニューロン」と呼ばれる多数の脳細胞で構成されています。ニュー
ロンは、いくつもの「樹状突起」を介してほかのニューロンからの刺
激を受け取ります。受け取った刺激に応じて、ニューロンはその「軸
索」を介してほかのニューロンに信号を送ります。軸索はほかのニュ
ーロンの樹状突起に結合しています。人工のニューラルネットも脳
と同じように複数の入力を受け取り 1 つの出力を生成する、いくつ
もの要素で構成されています。通常出力は入力のシンプルな関数とし
て表されます。
ニューラルネットワークと統計的手法の比較
ニューラルネットワークは従来の統計的手法に代わるアプローチを
提供します。ニューラルネットワークは、線回帰のように関数の近
似に使用されたり、判別分析やロジスティック回帰のように分類にも
使用されます。ニューラルネットワークの利点は非常に複雑な関数
のモデル化を行えることです。この特長は従来の線形手法 (線回帰や
線形判別分析など) とは対照を成しています。人工ニューラルネッ
トワークより以前によく使われた線形モデルの最適化手法は、20 世
紀半ばに発明されたものです。ニューラルネットワークの効果的な
トレーニングアルゴリズムを開発するには長い年月がかかりました。
今日ではニューラルネットワークのトレーニングを行う多様な洗練
されたアルゴリズムが利用できるようになり、従来の手法に代わる魅
力的なオプションとなっています。
ニューラルネットワークについて
77
ニューラルネットワークの構造
ニューラルネットワークは「ノード」または「ニューロン」と呼ば
れる、互いに結合された単位要素で構成されています。各ニューロン
はネット内の一部の計算を実行します。あるニューロンがいくつかの
数値を入力として受け取り、比較的単純な計算を行った結果、出力を
返します。ニューロンの出力値は別のニューロンへの入力の 1 つと
して渡されます。ただし、処理機構全体の最終出力を生成するニュー
ロンは例外です。
ニューロンはいくつもの層に分かれています。入力層のニューロンは
、例えば個々のアワビの体長、直径、重量など、計算に使用する入力
を受け取ります。これらの値は最初の隠れ層のニューロンに渡されま
す。その後ニューロンがこの入力に対して計算を行った結果の出力が
さらに次の層に渡されます。この 2 番目の層も隠れ層である場合が
あります。そして最後の隠れ層にあるニューロンからの出力が、ネッ
トの最終出力 (例えばアワビの年齢など) を生成するニューロンに渡
されます。
数値予測とカテゴリ予測
通常は数値の予測にニューラルネットワークを使用する場合、1 つ
の出力が生成されます。これは、単一出力ネットの方が複数出力ネ
ットよりも信頼度が高く、大半の予測問題は単一出力ネットを使って
解決できるためです。例えば、翌日の株式の出来高と株価の両方を予
測する 1 つのネットを構築するよりも、株価予測用と出来高予測用
の 2 つのネットを個別に構築する方が優れた結果を得られます。こ
れに対して、ニューラルネットワークを分類 (カテゴリ予測) 問題
に適用する場合、複数の出力が生成されます。例えば、翌日の株価が
「1% 以上上がる」、「1% 以上下がる」、「変動率が 1% 未満」のい
ずれになるかを予測したいとします。その場合、ネットにより 3 つ
の出力が生成され、そのうち最も大きい出力値がカテゴリとして選択
されます。
ネットのトレーニング
ネットのトレーニングでは、ネットが特定の入力に対してほぼ正しい
出力を生成できるように計算のパラメータの微調整が行われます。こ
のプロセスは、トレーニング用データとトレーニングアルゴリズム
に基づいて行われます。トレーニングアルゴリズムがさまざまな計
算パラメータのセットを選択し、各トレーニングケースにネットを
適用してその結果を評価した上で、ネットの解答がどの程度優れてい
るかを判断します。パラメータの各セットのことを「試行」と呼びま
78
ニューラルネットワークの基礎知識
す。トレーニングアルゴリズムは前の試行の結果に基づいて次のパ
ラメータセットを選択します。
ニューラルネットワークのコンピュータ処理
ニューラルネットワークは、各種のコンピュータハードウェアで実
装が可能なコンピュータモデルです。それぞれが 1 つのニューロン
の機能を果たす小さな処理要素からニューラルネットワークを構築
することもできます。ただし、ほとんどのニューラルネットワーク
は、今日一般に使われているような単一の強力なプロセッサを持つコ
ンピュータで実装されています。単一プロセッサのコンピュータでは、
NeuralTools などのプログラムが各ニューロンの計算を同じプロセッ
サ上で処理します。この場合、ニューロンという概念は物理的な処理
要素ではなく、予測の取得に必要な計算処理の一部を表すことになり
ます。
ニューラルネットワークのタイプ
ニューラルネットワークにはさまざまなタイプがあり、それぞれが
異なる構造、ニューロン内で実行される計算の種類、およびトレーニ
ングアルゴリズムを備えています。NeuralTools で使用できるタイ
プのニューラルネットワークとして、多層フィードフォワードネッ
トワーク (MLF ネット) が挙げられます。NeuralTools の MLF ネッ
トではユーザーが隠れニューロンの層を 1 つにするか 2 つにするか
および、隠れ層に含めるニューロンの数を指定できます (適切な選択
を行うためのヘルプが用意されています。詳しくは MLF ネットのセ
クションを参照してください)。NeuralTools では一般回帰ニューラ
ルネットワーク (GRN) および確率的ニューラルネットワーク (PN)
も利用できます。この 2 つは相互に関連しており、前者が数値予測
、後者はカテゴリ予測・分類にそれぞれ使用されます。GRN/PN ネッ
トではユーザーがネットの構造を指定する必要はありません。これら
のネットには常に 2 つの隠れ層があり、第 1 層では各トレーニング
ケースにつき 1 つのニューロンが割り当てられ、第 2 層のサイズは
トレーニングデータに基づいて決定されます。
以下のセクションでは、NeuralTools で使用できる各タイプのニュー
ラルネットワークについてより詳しく説明します。
ニューラルネットワークについて
79
80
多層フィードフォワードネットワーク
多層フィードフォワードネットワーク
多層フィードフォワードネットワーク (「多層知覚ネットワーク」
とも呼ばれます) は、複雑な関数の近似が可能な処理機構です。した
がって、独立変数と従属変数の間の複雑な関係をモデル化することが
できます。
MLF のアーキテクチャ
次の図は 3 つの独立数値変数のある数値予測を行う MLF ネットを示
します。このネットには第 1 隠れ層に 2 つのニューロン (ノード)、
第 2 隠れ層に 3 つのニューロン (ノード) が設定されています。
出力
第 2 隠れ層
第 1 隠れ層
入力
ネットの動作は次の要因によって決まります。
•
トポロジー (隠れ層の数とその各層にあるノードの数)
•
結合「荷重」(各結合に割り当てられるパラメータ) および、バ
イアス項 (各ニューロンに割り当てられるパラメータ)
•
各ニューロンへの入力を出力に変換するためのアクティベーショ
ン / 伝達関数
ニューラルネットワークについて
81
例えば、n 個の入力を持つ隠れニューロンは、まずその入力の重み付
けされた和を計算します。
Sum = in0 * w0 + in1 * w1 + ... + inn * wn + bias
ここで in0 ～ inn はその前の層のニューロンの出力、w0 ～ wn は結
合荷重を示します。各ニューロンに独自のバイアス値があります。そ
の後、Sum にアクティベーション関数が適用されてニューロンの出力
が生成されます。
隠れ層ニューロンのアクティベーション関数にはシグモイド (S 字
形) 関数が使用されます。具体的には NeuralTools は双曲線正接関
数を使用します。NeuralTools では出力ニューロンがアイデンティテ
ィをアクティベーション関数として使用します (つまり、単にその入
力の重み付けされた和を返します)。ニューラルネットワークは出力
ニューロンにあるシグモンドアクティベーション関数で構成される
こともあります。ただし、ニューラルネットワークで複雑な関数を
近似するためにこれが必要なわけではありません。また、シグモイド
関数では出力範囲が制限されますが (双曲線正接関数では -1 ～ 1)、
一般にこの範囲に収まらない従属値が出てきます。したがって出力ニ
ューロンでシグモイド関数を使用すると、トレーニングデータをネ
ットに渡す前に出力値に対して強制的に追加の変換が行われます。
MLF ネットを分類に使用する場合、それぞれが可能な従属カテゴリに
対応する複数の出力ニューロンが設定されます。ネットはその数値出
力を計算することでケースを分類します。出力値が最大のニューロン
に対応するカテゴリが選択されます。
82
多層フィードフォワードネットワーク
MLF ネットのトレーニング
MLF ネットのトレーニングは、一連の結合荷重および、新しいケース
に対してネットが一般に正しい解答を生成できるようなバイアス項を
検索することにより行われます (以下の例では簡素化するためにバイ
アス項を省略します)。トレーニングでは、まずランダムに選択され
た一連の荷重が結合に割り当てられます。各トレーニングケースに
ついて予測が行われます (独立値を入力として渡し、出力が取得され
ます)。通常の場合、既知の従属値とは異なる出力が得られます。そ
こで各トレーニングケースについて誤差値が求められます。これら
の値からトレーニングセット全体の誤差の尺度を計算し、初期の荷
重を使った場合のネットのパフォーマンスを判断します。
通常はランダムに選択された初期の荷重を使ったネットのパフォーマ
ンスはあまり高くないため、次にほかの荷重の割り当てを試行します。
ただし、この時点で荷重の割り当てがランダムではなくなります。使
用するトレーニングアルゴリズムによって、前回の試行の結果に基
づく結合荷重が選択されます。これは、結合荷重を変化させることで
誤差を最小化するという最適化問題として考えることができます。
歴史的背景
MLF ネットで結合荷重をトレーニングするアルゴリズムとして最初に
成功を収めたのは「逆伝播法 (バックプロパゲーション)」という手
法です。しかし最近では、より短時間で大局的な最適解を得られる可
能性の高い、ほかのアルゴリズムの方が一般に好まれます。
NeuralTools は「2 次」最適化手法の 1 つである「共役勾配降下」
という手法を用いています。これらの「決定的」な最適化手法は、誤
差関数の傾斜を効率的に降下することができ、関数の局所的最小値を
見つけるよう設計されています。NeuralTools は、大局的な最小値の
代わりに局所的な最小値が検索されるリスクを減らすため、「決定
的」な手法に「確率的」な最適化手法を組み合わせて使用します。具
体的には、共役勾配降下法に加えて「Simulated Annealing」という
確率的な手法が用いられています。このアルゴリズムは以前の試行の
結果に基づいて、特定の時点で使用する手法を決定します。共役勾配
降下法について詳しくは、Bishop (1995) および Masters (1995) の
各書を参照してください。また、Simulated Annealing については
Masters (1995) を参照してください。
誤差の尺度
数値予測用ネットのトレーニングでは、すべてのトレーニングケー
スの平均平方誤差が誤差の尺度として使われます。これは、正しい解
答とネットで得られた解答との平均平方差です。分類用ネットでは、
各トレーニングケースにつき複数の出力があります (各従属カテゴ
リごとに 1 つの出力が生成されます)。この場合、望ましい出力値に
ついてすべてのトレーニングケースの全出力の平均平方誤差を計算
します。各トレーニングケースにつき、正しいカテゴリに対応する
ニューラルネットワークについて
83
出力ではその値を 1 に近付け、それ以外の出力の値は 0 に近付ける
ことが目標となります。
トレーニング時
間
NeuralTools の MLF トレーニングアルゴリズムは、異なる初期の荷
重から処理を何度も再実行します。したがって、ネットのトレーニン
グ時間が長いほど優れた結果が得られます。アルゴリズムを再実行す
る回数が多いほど、誤差関数の大局的な最小値が見つかる確率が高く
なります。
トポロジーの選
択
選択した層数と層内のニューロン数により、ネットが独立変数と従属
関数の間の関係を学習できるかどうかが決まります。一般に 1 つの
隠れ層と 2 つの隠れニューロンを持つネットでは、トレーニングに
より望ましい誤差水準を達成することは困難です。その一方で層とニ
ューロンの数を増やした場合、そのコストに見合うだけの利益を得る
のが難しくなります。ほとんどの問題は単一の隠れ層で十分に処理で
きます。通常は 2 つの層を使用するとトレーニングの所要時間が不
要に長くなります。一般には数個のニューロンを持つ単一隠れ層でも
十分な結果を得られます。
NeuralTools ではトレーニングデータに基づいてネットのトポロジ
ーを自動構成することができます。ただし、ベストネット検索機能
を利用するとさらに信頼度を高めることが可能です。ベストネット
検索の一貫として、異なる数のニューロンを持つ広範な単一隠れ層ネ
ットがトレーニングされます。デフォルトでは 2 ～ 6 個の隠れニュ
ーロンを持つ 5 つの MLF ネットがトレーニングに含められます。ト
レーニングに十分な時間を割くことができる場合には範囲を広げるこ
とができますが、過学習を防ぐためにまず 2 つのニューロンを持つ
ネットから開始することを推奨します。
過学習の回避
「過学習」という用語は、ネットが独立変数と従属変数との関係の一
般的な特性だけでなく、一般には適用されない (トレーニング以外の
ケースには関係のない) トレーニングケースに関する具体的な事実
までを学習してしまう状況を指しています。この問題に対処するため、
テストセットをトレーニング中にテストするセットと、トレーニン
グ後に使用する正式なテストセットの 2 つに分けることがあります。
トレーニング中にテストするセットの誤差はトレーニングの最中に定
期的に計算されます。この誤差が増加し始めると、ネットが過学習傾
向にある証拠とみなされ、トレーニングが停止されます。
NeuralTools では、これとは異なる手法を用いて過学習を回避してい
ます。2 つの個別のテストセットを使うという上記の手法は現実的
でないことが多く、通常はトレーニングセットと 2 つのテストセ
ットに分けるのに十分な量のデータを用意するのは不可能です。また、
トレーニング中にテストするセットの誤差が増加しても、必ずしも過
学習の証拠であるとは限りません。これは局所的な増加であり、トレ
ーニングを続行することにより誤差が再び減少する可能性もあります。
84
多層フィードフォワードネットワーク
NeuralTools のベストネット検索は、過学習を回避するように設計
されています。デフォルト設定では 2 つのニューロンを使ってベス
トネット検索が開始されます。このようなネットが過学習につなが
ることはあまりありません。デフォルト設定では最大 6 つのニュー
ロンを持つネットがトレーニングされます。5 つおよび 6 つのニュ
ーロンを持つネットが過学習になった場合、単一のテストセットの
結果でこれが報告されます。その場合、2、3、または 4 つのニュー
ロンを持つネットのいずれかが最小のテスト誤差を持つことになりま
す。
ニューラルネットワークについて
85
86
一般回帰ニューラルネットと確率的ニューラルネット
一般回帰ニューラルネットと確率的ニューラル
ネット
一般回帰ニューラルネット (GRN ネット) と確率的ニューラルネッ
ト (PN ネット) は、類似した概念に基づいています。GRN ネットは
数値予測・関数の近似に使用され、PN ネットはカテゴリ予測・分類
に使用されます。この 2 タイプのネットは Donald Specht により提
唱されたものです ("Probabilistic Neural Networks", Neural
Networks, 3, 1990, pp. 109-118 、 "A General Regression Neural
Network", IEEE Transactions on Neural Networks, 2, 1991, pp.
568-576)。以下の概要は Masters (1995) にある説明を基にしていま
す。さらに詳しい説明は原書を参照してください。
一般回帰ニューラルネットワーク
ここでは次のグラフにある 1 つの独立数値変数と 1 つの従属数値変
数を持つトレーニングデータセットを例として説明を進めます。
1200
1000
800
600
400
200
0
-12 -10 -8
-6
-4 -200
-2 0
2
4
6
8
10 12
-400
-600
-800
-1000
人間の目にはこのデータのパターンが明らかにわかります。独立値 6
に対する未知の従属値を推測する場合、その値は 200 より大きく
400 未満であると推定できます。この推定は 200 未満の値を示す 2
つの最近のケースではなく、これより遠くにあるケースに基づいてい
ます。ただし、独立値が -10 に近いケースにはあまり注目しません。
ニューラルネットワークについて
87
既知のケースが未知のケースに近いほど、未知の従属値を推定する際
の荷重が大きくなります。一般回帰ニューラルネットワークはこの
ような直感的な概念に基づいて構築されています。ネットではすべて
のトレーニングケースが表されます。渡された各ケースについて、
ネットが各トレーニングケースの従属値を使って予測従属値を計算
し、近くのトレーニングケースが出力値により大きく貢献するよう
重み付けが行われます。
GRN のアーキテ
クチャ
2 つの独立数値変数を持つ一般回帰ニューラルネットワークは、下
記のグラフのような構成になっています (ここではトレーニングケ
ースが 3 つあると仮定します)。
出力
集約層
(分子と分母ノード)
パターン層
(トレーニングケース当たり
1 ニューロン)
入力
パターン層には各トレーニングケースにつき 1 つのノードが含まれ
ています。ネットにトレーニングケースを渡す場合、2 つの独立数
値を入力することになります。パターン層の各ニューロンが、渡され
たケースからの距離を計算します。分子ノードと分母ノードに渡され
る値は、距離と従属値の関数です。集約層の 2 ノードがその入力を
合計し、出力ノードがこれらを分けて予測を生成します。
パターン層のニューロンで計算される距離関数は「平滑化係数」を使
用します。各入力が独自の「平滑化係数」値を持ちます。入力が 1
つの場合、平滑化係数の値が大きいほど遠くにあるトレーニングケ
ースが予測値にとってより有意になります。入力が 2 つの場合、平
滑化係数は面上の 1 つの軸に沿った距離に関連します。一般に複数
の入力がある場合は複数次元空間の 1 次元に関連します。
88
一般回帰ニューラルネットと確率的ニューラルネット
GRN ネットのトレーニングは、平滑化係数を最適化することでトレー
ニングセットの誤差を最小化するのが目標です。これには共役勾配
降下法による最適化が用いられます。トレーニング中にさまざまな平
滑化係数のセットを評価する誤差尺度としては、平均平方誤差が使用
されます。ただし個々のトレーニングケースの平方誤差の計算時に
は、そのケースがパターン層から一時的に除外されます。これは、除
外されるニューロンの計算距離がゼロになり、予測計算においてほか
のニューロンが無意味になってしまうためです。
確率的ニューラルネットワーク
確率的ニューラルネットワークについては、2 つの独立数値変数と、
カテゴリが 2 つある 1 つの従属変数を持つ、次のようなトレーニン
グデータセットを例として説明します。
?
円は一方のカテゴリ内のトレーニングケースを表し、四角はもう片方
のカテゴリに所属するトレーニングケースを示します。ここでは疑
問符 (?) が付いているケースのカテゴリを分類するのが目的です。
人間の目には、このケースが四角ではなく円のカテゴリに属する可能
性の方が高いことがわかります。ただし、多くの分類手法ではこれと
同じ結論に達することができません。カテゴリを線形分離する必要の
ある手法はこの分類に失敗します。例えば最近接法を使用すると、未
知のケースが四角のカテゴリに割り当てられます。また中心傾向を重
視する手法でも、未知のケースが円カテゴリよりも四角カテゴリの中
心の方に近いので同じ結果になります。
これに対して、PN ネットを利用すれば正しい予測結果が得られます。
PN ネットでは新しいケースとすべてのトレーニングケースとの間の
距離を考慮した上で、近いケースにより大きな荷重が割り当てられま
す。この場合、周辺にある円カテゴリの効果が、近接している 1 つ
の四角カテゴリの効果を上回ります。
ニューラルネットワークについて
89
PNN のアーキテ
クチャ
確率的ニューラルネットワーク (PNN) は下図のように構成されてい
ます。ここでは 2 つの独立数値変数と 2 つの従属カテゴリ変数があ
り、5 つのトレーニングケース (最初のカテゴリが 3 ケース、2 番
目のカテゴリが 2 ケース) を持つと仮定しています。
出力
集約層
(カテゴリ当たり
1 ニューロン)
パターン層
(トレーニング
ケース当たり
1 ニューロン)
入力
ネットに入力される各ケースについて、パターン層の各ニューロンが、
そのニューロンが表すトレーニングケースと入力ケースとの間の距
離を計算します。集約層に渡される値は、距離と平滑化係数の関数で
す。GRN ネットと同様に各入力に独自の平滑化係数があります。これ
らの係数により、距離に応じてトレーニングケースの有意性がどの
程度減少するかが決まります。集約層には各従属カテゴリに 1 つの
ニューロンがあります。各ニューロンは、そのカテゴリのトレーニン
グケースに対応するニューロンの出力値を合計します。集約層のニ
ューロンの出力値は各クラスの確率密度関数の推定であると解釈でき
ます。出力ニューロンは、確率密度関数の値が最も高いカテゴリを予
測カテゴリとして選択します。
90
一般回帰ニューラルネットと確率的ニューラルネット
GRN ネットと同様に、PN ネットのトレーニングは平滑化係数を最適
化することでトレーニングセットの誤差を最小化するのが目標です。
これには共役勾配降下法による最適化が用いられます。トレーニング
中にさまざまな平滑化係数のセットを評価する誤差尺度は、すべての
トレーニングケースにつき集約層にあるニューロンから返される全
値に基づいて計算されます。この尺度では、正しいカテゴリに割り当
てられた確率だけでなく、不正なカテゴリに割り当てられた確率の分
布も考慮されます (不正なカテゴリの確率がほぼ一様分布する場合、
一部の不正なカテゴリのみが高い確率で発生するよりも好ましいと判
断できます)。ただし個々のトレーニングケースの誤差の計算時には、
そのケースがパターン層から一時的に除外されます。これは、除外さ
れるニューロンの計算距離がゼロになり、ほかのニューロンが計算に
おいて無意味になってしまうためです。
ニューラルネットワークについて
91
92
MLF ネットと PN/GRN ネットの比較
MLF ネットと PN/GRN ネットの比較
NeuralTools で利用できる各タイプのニューラルネットワークには、
それぞれ次のような利点があります。
GRN/PN ネットの利点
•
短時間でトレーニングできる。
•
トポロジー (隠れ層とノードの数) を指定する必要がない。
•
PN ネットでは分類だけでなく、ケースが可能な各従属カテゴリ
に属する確率も返される。
MLF ネットの利点
•
サイズが比較的小さく予測にかかる時間も短い。
•
トレーニングデータの範囲外の信頼度が高い (例えば一部の独
立変数がトレーニングデータにおけるその変数の範囲の外にあ
る場合など)。ただし、MLF ネットによるトレーニングデータの
範囲外の予測にはリスクが伴う。
•
非常に小さいトレーニングセットからの一般化が可能である。
ニューラルネットワークについて
93
94
入力の変換
入力の変換
NeuralTools はトレーニングの前に数値変数をスケーリングして、各
変数の値がほぼ同じ範囲に収まるようにします。この処理は、トレー
ニングの初期段階で変数のネット出力への影響を均等化するために行
われます。正しい予測を行うには変数の有意性が不十分な場合、入力
から第 1 隠れ層への結合荷重を減らすことにより、これがトレーニ
ング中に反映されます。ただしこの有意性に欠ける変数がほかの変数
よりも大きい場合には、値が大きい分を補正するために荷重を大幅に
下げる必要が出てきます。
スケーリングには、トレーニングセットを使って計算された平均値
と標準偏差が各変数に適用されます。各値から平均値を差し引き、そ
の結果が標準偏差で除算されます。トレーニング済みネットのテスト
や予測の際にもこれと同じスケーリングパラメータが使用されます。
カテゴリや記号データは、数値入力を受け入れるニューラルネット
ワークでは直接使用できません。したがって、各独立カテゴリ変数を
複数の数値のネット入力 (可能な各カテゴリにつき 1 つ) で表す必
要があります。これには「one-of-n」という変換法が用いられます。
例えば次のようなトレーニングケースのセットがあると仮定します。
年齢
州
借入額
従属:支払
41
NY
4,000
期日内
32
CT
7,000
遅延
54
NJ
6,000
期日内
37
NY
5,000
不履行
これらのトレーニングケースはそれぞれネットに次の値として渡さ
れます。
年齢
州=CT
州=NJ
州=NY
借入額
従属:支払
41
0
0
1
4,000
期日内
32
1
0
0
7,000
遅延
54
0
1
0
6,000
期日内
37
0
0
1
5,000
不履行
ニューラルネットワークについて
95
96
参考文献
参考文献
NeuralTools で使用されるニューラルネットワークに関する追加の
情報については、以下の文献を参考にしてください。
Bishop,
Christopher
M.,
Neural
Networks
for
Pattern
Recognition, Oxford, 1995.
Masters, Timothy, Advanced Algorithms for Neural Networks,
Wiley, 1995.
Reed, Russell D., Robert J. Marks, Neural Smithing, MIT, 1999.
ニューラルネットワークについて
97
98
参考文献
索引
Ｅ
Evolver, 30
Ｇ
い
一般回帰ニューラルネットワー
ク, 22, 48, 87
インストール手順, 6
GRN のアーキテクチャ, 88
Ｍ
MLF ネットと PN/GRN ネットの比
較, 93
MLF のアーキテクチャ, 81
MLF ネットのトレーニング, 83
か
過学習の回避, 84
確率的ニューラルネットワーク,
48, 89
さ
残留誤差のヒストグラム, 55
Ｎ
NeuralTools のアンインストール
, 7
Ｐ
し
システムの必要条件, 6
実行詳細, 50
詳細レポートのクイックサマリ
ー, 63
Palisade 社, 5
PNN のアーキテクチャ, 90
Ｓ
す
数値的問題, ii
StatTools, 30
そ
あ
アイコン
NeuralTools, 35
デスクトップ, 8
[アプリケーション設定] コマン
ド, 69
索引
ソルバー, 30
た
ダイアログボックスに表示され
るアイコン, 38
タグ変数, 43
多層フィードフォワードネット
ワーク, 48, 81
99
つ
ツールバー
NeuralTools, 35
て
データセット, 19
データセットと変数, 39
データセットと変数のデータ容量
, 43
データセットマネージャ, 20
[データセットマネージャ] コマ
ンド, 39
[データセットマネージャ] ダイ
アログボックス, 40
[データ補足ユーティリティ] コ
マンド, 74
テスト, 18
[テスト] コマンド, 56
テストのプレビュー, 58
テストのレポート, 26, 59
ニューラルネットワークと統計
的手法の比較, 77
入力の変換, 95
ね
ネットワークのテスト, 26
ふ
複数範囲のデータセット, 41
プロフェッショナル版, iii
分類行列, 54
分類問題, ii
へ
変数タイプ, 42
変数の照合, 57
み
未知の値について, 76
と
トレーニング, 18
[トレーニング] コマンド, 44
トレーニング進行中, 52
トレーニング、テスト、予測の組
み合わせ, 22
トレーニングのレポート, 53
に
二乗平均平方根誤差, 55
[ニューラルネットマネージャ]
コマンド, 72
100
よ
予測, 18, 27
[予測] コマンド, 64
予測のプレビュー, 67
ら
ライブ予測, 28, 66
ランダムに選択したケースで自動
テストを行う, 45