...

博士論文 ソフトウェア開発の超上流工程における 非機能要件の定量的

by user

on
Category: Documents
21

views

Report

Comments

Transcript

博士論文 ソフトウェア開発の超上流工程における 非機能要件の定量的
NAIST-IS-DD1061202
博士論文
ソフトウェア開発の超上流工程における
非機能要件の定量的評価
齊藤康廣
2015 年 2 月 3 日
奈良先端科学技術大学院大学
情報科学研究科 情報システム学専攻
本論文は奈良先端科学技術大学院大学情報科学研究科に
博士(工学) 授与の要件として提出した学位論文である。
齊藤康廣
審査委員:
松本健一 教授
(主指導教員)
藤川和利 教授
(副指導教員)
門田暁人 准教授
(副指導教員)
2
ソフトウェア開発の超上流工程における
非機能要件の定量的評価*
齊藤康廣
内容梗概
委託ソフトウェア開発プロジェクトの超上流工程において,ユーザ(発注企業)が作成す
る提案依頼書(Request for Proposal: RFP)の品質は,ソフトウェア開発を成功させる上
で極めて重要である.RFPは多様な情報で構成されているが,品質評価の重要な対象の
一つとなるのが,非機能要件(Non Functional Requirements: NFR)である.NFRは,
開発すべきソフトウェアのアーキテクチャや,保守・運用における制約条件となるため,
NFRが明確に記述されているか否かは,RFP品質を議論する上で特に重要な観点とな
る.
本論文では,RFPの品質を定量的に評価する3つの方法を提案する.評価対象とする
のは,RFPで示されるべき非機能要件(NFR)であり,評価の観点は,その記述の明確さ,
である.
最初の提案では,評価対象を,ユーザにとって重要度の高い「保守と運用に関する55個
の非機能要件」に限定した上で,要件記述の明確さを最大5段階で評価するためのメトリク
スを定義する.評価結果は,RFPの総合評価点と,要件毎の評価点を俯瞰するためのレ
ーダチャートとして示される.地方自治体,図書館,官公庁,独立行政法人,大学,病院の
6ドメイン29件のRFPを評価対象としたケーススタディによって,記述が不十分な要件を特
定することにより,基準値との比較を通じて特に改善が必要な特性を明らかにできることを
確認した.
2番目の提案では,評価の自動化を目的として,RFPに含まれる各NFRに関するキーワー
ド(NFRキーワード)の出現頻度に基づいて,教師あり機械学習によって各要件の記述の
*
奈良先端科学技術大学院大学 情報科学研究科博士論文, NAIST-IS-DD1061202,
2015年2月3日.
i
明確さを評価する.提案方法では,自然言語で記述されたRFPからNFRキーワードを抽
出し,各NFRにマッピングする.そして,NFRキーワードの出現頻度とNFRの記述の明確
さとの関係をランダムフォレストによりモデル化する.70件のRFPを題材として,提案方法
によって26種類の非機能要件の記述の明確さを評価した結果,人手による評価との一致
率の平均値は69.8%であり,±1の誤差を許容した±1差一致率の平均値は97.2%となっ
た.
3番目の提案では,評価の自動化において教師データを不要とすることを目的として,
NFRキーワードの出現頻度とそれに対する重み付けのみに基づいて,関連するNFRに評
価値を与える.提案方法では,重み付けを与える方法として,単純TF-IDF,拡張TFIDF,およびトークン比の3種類を採用し,実験による比較を行った.その結果,拡張TFIDFがもっともよい結果を示し,提案方法による評価値と人手による評価値との相関係数は
0.22~0.43となった.このことから,教師データを付与することが難しい状況においても,あ
る程度の精度でNFRの自動評価を行えることが示唆された.
キーワード
提案依頼書,非機能要件,評価指標,機械学習,テキストマイニング
ii
Quantitative Evaluation of Non Functiona l
Requirements in a n Early Stage
of Software Development *
Ya s uhi r o Sa i t o
Abstract
In the beginning of a contracted based software development project, the
quality of a Request For Proposal (RFP) is extremely important for successful
development of a software system. The RFP is a document provided by a software
user company and used as an initial system requirements specification to ask
software developer companies to propose their technical plans to fulfill the
requirements. The RFP consists of various requirements information, and one of
the most important information is Non Functional Requirements (NFRs). It is
because NFRs define constraints of software architecture, and they also affect the
software maintenance cost and operation cost. Therefore, it is extremely important
to evaluate whether NFRs are written clearly enough or not.
In this thesis, three methods for quantitative evaluation of an RFP are
proposed. The goal of evaluation is clarity of description of NFRs. Firstly, we
selected a set of fifty-five important NFRs that should be written in an RFP. Then,
metrics to evaluate the clarity of NFRs was defined. The result of evaluations are
shown by total score and radar charts for the purpose to observe low clarity NFRs.
In a case study, RFPs from 29 projects were evaluated by the proposed metrics. As
a result, we confirmed that the identification of poorly-written NFRs became
easily recognizable by the proposed method.
.*Doctoral Dissertation, Department of Information Systems, Graduate School of Information
Science, Nara Institute of Science and Technology, NAIST-IS-DD1061202, February 3, 2015.
iii
Secondly, for the purpose of automatic evaluation of clarify of NFR descriptions,
we proposed a machine learning approach using Random Forest and term
frequency of NFR key words extracted by text mining. An estimation model
trained from known NFRs automatically gives the clarity of NFRs in the unknown
RFPs. As a result of an evaluation of 26 NFR categories using 70 RFPs, 69.8% of
the estimation results showed identical score with human evaluation. And, 97.2%
of the estimation results matched human score if we allow plus or minus one score
difference.
Thirdly, for the purpose of automatic evaluation of without training data, we
proposed an unsupervised technique to evaluate the clarity of NFR descriptions.
The proposed method estimates the clarity based on term frequency of key words
related to NFRs. Three types of weights to key words are used, that is, TF-IDF,
extended TF-IDF and key words ratio. As a result of evaluation of the proposed
method and comparison of weight types using one hundred sixty one RFPs,
extended TF-IDF showed the best fit to human evaluation, and the correlation
coefficient between estimated clarity and human evaluation ranged from 0.22 to
0.43. The result shows that the automatic evaluation is possible to some extent
even if one cannot prepare training data for supervised machine learning.
Keywords:
Request For Proposal,Non-Functional Requirements, Machine Learning, Text Mining
iv
関連発表論文
学術論文誌
1.
齊藤康廣 , 門 田暁人 , 松本健一 .“非 機能要 件に着目 した Request For
Proposal (RFP) 評価”.SEC Journal,第 38 号, September 2014, pp. 30-37.
(第 2 章に関連する)
国際会議発表
1.
Yasuhiro Saito, Akito Monden, Kenichi Matumoto. “ Evaluation of Non
Functional Requirements in a Request for Proposal (RFP)”. Proceedings of
2012 Joint Conf of 22nd Int'l Workshop on Software Measurement and 7th
Int'l Conference on Software Process and Product Measurement (IWSMMENSURA) ,
October 2012,pp.106-111.(第2章に関連する)
国内研究集会発表
1.
齊藤康廣,門田暁人,松本健一.“Request For Proposal (RFP) における保
守・運用要件指標の抽出と評価”. 情報処理学会研究報告 2012-SE-175(1) ,
March 2012,pp.1-10.(第2章に関連する)
2.
齊藤康廣,門田暁人,松本健一.“RFP における機械学習による非機能要件
の評価”.情報処理学会研究報告. 2013-SE-179(5), March 2013, pp.1-7.
(第 3 章に関連する)
v
目 次
1
第 1 章 序論
1.1 研究の背景.........................1
1.2 研究の目的.........................2
1.3 論文構成..........................4
6
第 2 章 非機能要件に着目した RFP の評価
2.1 概要 ...........................6
2.2 関連研究
. .......................7
2.2.1 非機能要件に関するガイドライン
..........7
2.2.2 RFP や非機能要件に非機能要件に関する従来研究 ... 8
2.3 提案方法 .........................8
2.3.1 概要 ........................8
2.3.2 評価対象とする非機能要件
............. 9
2.3.3 非機能要件評価シート.................9
2.3.4 評価結果 .. ....................13
2.4 ケーススタディ
.....................13
2.4.1
概要
2.4.2
総合評価点
2.4.3
レーダチャート ...................15
2.4.4
ベンチマーキング .................17
2.4.5
評価者間の評価点のばらつき ..............19
.......................13
....................14
2.5 まとめ ......................... 21
2.5.1 評価結果と考察
...................21
2.5.2 課題 .............. ..........22
第 3 章 機械学習による非機能要件の自動評価
24
3.1
概要 ...........................24
3.2
関連研究 ........................24
vi
3.3
非機能要件キーワードの出現頻度予備分析 .........26
3.3.1 NFR キーワードの抽出 ...............26
3.3.2 「小項目」と NFR キーワードの関連付け .......28
3.3.3 「小項目」と NFR キーワード出現頻度
.......30
3.4 提案手法 .........................33
3.4.1 「小項目」の自動評価モデル構築の概要 . ......33
3.4.2 非機能要件評価モデルの構築 ............ 35
3.4.3 「NFR キーワード評価シート」の利用 ........39
3.5
ランダムフォレストを用いた非機能要件評価実験 ......39
3.5.1 実験の目的 .....................39
3.5.2 実験データと実験方法
...............40
3.5.3 実験結果の評価手法.................42
3.5.4 実験結果に基づく一致の検定と考察..........44
3.5.5 手動評価と自動評価の比較..............46
3.6 まとめ ..........................51
第 4 章 機械学習によらない非機能要件の自動評価
4.1
53
概要 ...........................53
4.2 関連研究 .........................53
4.3
提案手法
........................55
4.3.1 NFR キーワードの抽出 ...............55
4.3.2 NFR キーワードの重み ...............55
4.3.3 単純及び拡張 TF-IDF とキーワード比
........56
4.3.4 RFP の NFR 評価スコア . .............60
4.4
評価実験
.........................62
4.4.1 評価実験データと「小項目」 .............63
4.4.2 評価実験と考察 ...................63
4.5 クラスタリングによる評価スコアの段階評価..........74
vii
4.5.1 提案手法 .....................74
4.5.2 クラスタリング評価実験 ..............76
4.5.3 評価実験結果と考察 ................76
4.6 まとめ ..........................81
第 5 章 社会的影響別の非機能要件評価
83
5.1 概要 ...........................83
5.2 社会的影響による RFP の分類と手動評価 ..........83
5.3 社会的影響カテゴリ別の評価スコア .............86
5.4 社会的影響カテゴリ別の評価比較 ..............89
5.5 まとめ...........................91
92
第 6 章 結論
謝辞
参考文献
viii
図 目 次
図1.1
委託開発ソフトウェア開発プロジェクト ...................2
図2.1
提案するRFP評価法の概要 ........................12
図2.2(a) 5段階評価 明確さ評価基準の例 ....................12
図2.2(b) 3段階評価 明確さ評価基準の例 ....................12
図2.2(c) 2段階評価 明確さ評価基準の例 .. . ..................12
図2.3(a) 総合評価点 システムドメイン毎の評価点. . ...............16
図2.3(b) レーダチャート:大項目 システムドメイン毎の評価点... . ......16
図2.3(c) レーダチャート:中項目 システムドメイン毎の評価点.. .......17
図2.4
ケーススタディ結果:基準値(RFPトップ3)との比較. . . . . . .....19
図3.1
NFRキーワード評価シート(抜粋).. . . . . . ................28
図3.2 「小項目」ごとのNFRキーワード出現頻度. . . .... ...........29
図3.3
RFP語数とNFRキーワード出現頻度. . . . . ...............31
図3.4
NFRキーワード出現頻度とRFPの手動評価ポイント. . .. ......32
図3.5
NFRキーワード出現頻度と「小項目」の種類.. . . . . . ..........33
図3.6
機械学習によるNFRキーワード評価モデル構築手順... . . . .....35
図3.7 「小項目」の3段階評価の比較. . . .. ....................45
図3.8
クロス表とκ統計量(一部). . . . . . .....................46
図3.9(a) 自動評価と手動評価の評価得点レーダチャート(3段階評価).. . . . . 50
図3.9(b) 自動評価と手動評価の評価得点レーダチャート(5段階評価).. . . . . 51
図4.1
単純TF-IDFとNFRキーワードの出現頻度.. . . . ............59
図4.2
拡張TF-IDFとNFRキーワード出現RFP数.. . .............60
図4.3(a) 応答性のNFRキーワード評価別箱ひげ図.. . . . ............66
図4.3(b) 負荷バランスのNFRキーワード評価別箱ひげ図... . . . ........66
図4.3(c) リカバリ処理のNFRキーワード評価別箱ひげ図. . . ...........67
図4.3(d) アクセス管理のNFRキーワード評価別箱ひげ図. .............67
図4.3(e) セキュリティ管理のNFRキーワード評価別箱ひげ図. . .........68
図4.3(f) 障害対策のNFRキーワード評価別箱ひげ図. . . ............68
ix
図4.4(a) 手動評価点毎の拡張TF-IDF評価点の比率:応答性. ........70
図4.4(b) 手動評価点毎の拡張TF-IDF評価点の比率:負荷バランス. ....70
図4.4(c) 手動評価点毎の拡張TF-IDF評価点の比率:リカバリ処理. ......71
図4.4(d) 手動評価点毎の拡張TF-IDF評価点の比率:アクセス管理. .....71
図4.4(e) 手動評価点毎の拡張TF-IDF評価点の比率:セキュリティ管理. ...72
図4.4(f) 手動評価点毎の拡張TF-IDF評価点の比率:障害対策 .......72
図4.5
手動評価別のNFRキーワード出現回数と拡張TF-IDF評価点 ...73
図4.6
手動3段階評価別の拡張TF-IDF評価スコア.............. 73
図4.7 「小項目」ごとのNFR評価スコア一致数.................. 78
図4.8
「小項目」別の一致率および不一致率...................81
図5.1
社会的影響カテゴリ別の「小項目」の手動評価スコア..........85
図5.2
社会的影響カテゴリ別の個別RFPの小項目評価スコア.........87
図5.3
社会的影響カテゴリ別の個別RFP評価 . . ...............89
図5.4(a) 社会的影響カテゴリ別の小項目手動評価スコア . . ..........90
図5.4(b) 社会的影響カテゴリ-別の小項目拡張TF-IDF評価スコア. . .....90
x
表 目 次
表2.1
各評価者の各RFPに対する総合評価点. . . . .. ............21
表 3.1
NFR キーワードの重要度と出現頻度...................27
表 3.2
出現した RFP 数が多い上位 20 個の NFR キーワード........30
表 3.3
NFR キーワードと RFP の相関関係 ...................33
表 3.4
段階評価とポイント .............................36
表 3.5
NFR キーワード評価シート(抜粋)
表 3.6
段階評価法別のκ統計量 .........................46
...................38
表 3.7(a) ランダムフォレストの評価推定(3 段階評価) ..............48
表 3.7(b) ランダムフォレストの評価推定(5 段階評価) ..............49
表 3.8
自動評価と手動評価の誤差. ........................50
表 4.1
3つの手法による重みと NFR キーワードの出現頻度(抜粋) . ....59
表 4.2
NFR キーワード重みの例..........................62
表 4.3
NFR キーワード重みと手動評価の相関係数 . ............64
表 4.4
NFR キーワードに関連する記述例 「障害対策」............65
表 5.1
社会的影響カテゴリ別の手動評価(一部の NFR 評価指標) ....85
付録 目 次
付録 A. 「NFR キーワード評価シート」 ...... ..............102
付録 B. 161 件の RFP による「NFR キーワード評価シート」の評価対象「小項
目」 ...................................108
ⅺ
第 1 章 序論
1.1
研究の背景
提 案 依 頼 書(Request For Proposal, 以 後は RFP とする)は,ソフトウェ
ア開 発 を委 託 するにあたり,委 託 元 企 業 (ユーザ)が,委 託 先 候 補 の企 業 (ベン
ダ)に対して,開 発に関 する具 体 的 な技 術 提 案 (技 術 仕 様・技 術 提 案 書の作 成 )
を依 頼 する文 書 である.RFP には,機 能 要 件 ,非 機 能 要件 ,事 務 要 件 ,システ
ム要 件 ,ライセンス事 項 ,開 発 者 資 格 ,契 約 要 件 などが記 述 されている.ユー
ザは,提 示 された技 術 仕 様 ・技 術 提 案 書 に基 づいてベンダを選 定 し,契 約 仕
様 書 の作 成 ,契 約 の締 結 を経 て,ソフトウェアの開 発 作 業 が開 始 されることにな
る.RFP は,ソフトウェアの委 託 開 発のベースとなる,重要 な文 書 の一 つであり,
その品 質が,ソフトウェア開 発 の成 否を大きく左 右することになる[8] .
委 託 ソフトウェア開 発 の超 上 流 工 程 では,ユーザが作 成 した RFP に記 述 さ
れている要 求 仕 様 をもとにベンダが技 術 提 案 書 を作 成 し,両 者 が技 術 協 議 を
通 じてユーザ要 求を明 確にしていく.このプロセス(図 1.1 参 照)は委 託 ソフトウ
ェアの開 発 においてユーザ要 求 を後 工 程 のソフトウェア設 計 において明 確 に反
映 するために行 われる.しかし,多 くの委 託 ソフトウェア開 発 の超 上 流 工 程 にお
いて,ユーザとベンダ間 で要 件 が十 分 に確 認 されずに契 約 が行 われ,ソフトウェ
ア開 発 以 後 の工 程 でユーザ要 件 に係 る問 題 が発 生 する.委 託 ソフトウェア開 発
では,要 件 定 義 が不 十 分 であると,「スコープ・クリープ(要 求 のなしくずし的 な
追 加 ・変 更 )」が問 題 となり,ソフトウェア品 質 や納 期 に影 響 を与 える[50] . 特
に非 機 能 要 件 については,後 工 程 での追 加 ・変 更 が困 難 であるが,文 献 による
と「非 機 能 要 求については,ユーザは要 求 仕 様にほとんど何も記 述 していない.
これが原 因になって,後 になってユーザとベンダ間の紛 争 の種 になる」[3]と言 わ
れている.ここで「非 機 能 要 件 」とは,「非 機 能 要 求 は,解 に対 して得 られる制 約
のことである.非 機 能 要 求 は,しばしば制 約 または品 質 要 求 という名 で知 られて
いる.「SWEBOK2004」[3]と定 義 されている非 機 能 要 求 を要 件 として記 述 され
たものと考 える.「非 機 能 要 件 」は,ユーザとベンダ双 方 にとって、ソフトウェア品
質 の物 理 的 な制 約 条 件 を合 意 することであるから,「機 能 要 件 」と比 較 してより
1
完 全 性 と網 羅 性 を契 約 前 に明 確 にしておく必 要 がある.よって,この問 題 につ
いて,ユーザとベンダ間 の技 術 協 議 にて,ユーザ要 件 の客 観 的 な評 価 を通 じて
議 論 を行 うことが重 要 である.従 来 研 究 では,ソフトウェア開 発 プロセスを通 じて
定 量 的 な手 法 を導 入 することにより,ソフトウェア開 発 プロジェクトをソフトウェアメ
トリクスの観 点 から指 標 を計 測 し,管 理 することが行 われている[46][47].しかし,
多 くの場 合 ,実 際 のソフトウア設 計 及 び製 作 の段 階 以 後 を対 象 としており,超
上 流 工 程 での 要 件 定 義 に お けるメ トリク スに 関 する関 連 研 究 は 極 めて少 ない
[27][48].ソフトウェアライフサイクルの最 も初 期 段 階 である超 上 流 工 程 の要 件
定 義 にソフトウェアメトリクスを導 入 することによりユーザ要 求 を計 測 することは,
ソフトウェア開 発プロセスを管 理 するためにも極 めて重 要 であると考 える.
プロポーザル
フェーズ
計画フェーズ
設計・製作フェーズ
保守・運用
フェーズ
テスト
フェーズ
企画書
ユーザ要件
RFP
提案書
要件定義
契約書
要求仕様書
契約
図 1.1
1.2
CODE
保守・運用
TEST
仕様書
マニュアル
運用
委 託 開 発 ソ フ ト ウェ ア 開 発 プ ロ ジ ェ クト
研究の目的
本 論 文は,ユーザが作 成した RFP に記 述 されている非 機 能 要 件 (以 後 適 宜
NFR とする)の記 述 内 容 の明 確 さを定 量 評 価 する評 価 指 標 を提 案 し,実 際 の
RFP をケーススタディとして評 価 実 験を行 うことによりその有効 性 を評 価すること
を目 的 とする.
2
ソフトウェアライフサイクルの超 上 流 工 程 で最 も重 要 な書 類 の一 つである
RFP に記 述されているユーザの非 機 能 要 求を評 価 するためには,RFP に記述
されるべき「非 機 能 要 件 」について明 らかにする必 要 がある.「非 機 能 要 件 」を
定 義 するには,まず,第 一 にユーザ要 求 の把 握 が必 要 である.ただし,ユーザ
が RFP を作 成した段 階 で,すべての非 機 能 要 求を把 握しているとは限らず,ユ
ーザが記 載 している内 容 は,ユーザのドメイン知 識 に基 づいた達 成 すべきシス
テムへの要 求 であり、そのソフトウェアシステムを実 現 するための要 件 とは限 らな
い場 合 がある.これらに対 して,ベンダはソフトウェアシステムを構 築 する上 で求
められる「非 機 能 要 件 」を提 案 する必 要がある.非 機 能 要 求 として,共 通 的 に重
視 される特 性 として,「性 能 (効 率 性 )」,「信 頼 性 」,「セキュリティ」,「使 用 性 」お
よび「保 守 性 」が指 摘 されている[49].しかし,これらの特 性 は「非 機 能 要 件 」と
し ての 大 きな特 性 で あり,また , さまざ まな 語 句 が 使 用 さ れてい る[3] .さら に ,
RFP に記 述 された「非 機 能 要 件 」を定 量 評 価 する上 で必 ずしも適 当 な特 性 で
あるとは言えない.よって,文献 や従 来 研 究 の調 査 により,RFP に記 述 されるべ
き「非 機 能 要 件」の記 述 内 容の明 確 さを評 価する特 性を選 別する必 要がある.
RFP にはユーザの機 能 要 求および非 機 能 要 求が自 然 言 語 で記 述 されてお
り,ユーザ要 件 の記 述 があいまいであることが要 因 となり後 工 程 のソフトウェア設
計 において要 求 の実 現 されたソフトウェアが構 築 できないことが問 題 となる.そこ
で,この問 題 解 決 を支 援 するモデルとして,最 初 に,文 献 や市 場 調 査 の結 果 を
参 考にした RFP の非 機 能 要 件 指 標(以 後 NFR 指 標 とする)で構 成 される「非
機 能 要 件 評 価 シート」を提 案 する.2 番 目 に,「非 機 能 要 件 」の自 動 評 価 を目
的 として,自 然 言 語 で記 述 された RFP から NFR 指 標に関 連 する NFR キーワ
ードを抽 出 して「NFR キーワード評 価 シート」を作 成 する.そして,NFR キーワ
ードの出 現 頻 度 にもとづいて算 出 した評 価 点 による自 動 評 価 モデルを提 案 す
る.自 動 評 価 モデルでは,教 師 あり機 械 学 習 によるランダムフォレストによる 70
件 の RFP について評 価 推 定 の実 験 を行 う.自 動 評 価 モデルによる実 験 結 果
は,3つの段 階 評 価 結 果 を人 手 による評 価 (以 後 手 動 評 価 とする)と比 較 し,自
動 評 価に有 効 な段 階 評 価について考 察 する.3 番 目 に,多 くの RFP を題材 と
して評 価 の自 動 化 を行 う場 合 には,手 動 評 価 による教 師 データの作 成 に時 間
3
を要 することから,教 師 なしで自 動 評 価 する 3 つの重 み付 け手 法 の有 効 性を評
価 する.TF-IDF 手 法 ,TF-IDF を拡 張した拡 張 TF-IDF およびトークン比 の
考 えによる 3 つの手 法 で NFR キーワードに重 み付 けした評 価 点 による比 較 を
行 う.評 価 実 験 により,3 つの手 法 を手 動 評 価 の結 果 と比 較 し,最 も有 効 な手
法 を提 案 する.さらに,教 師 なし機 械 学 習 による自 動 評 価 を目 的 として,評 価 ス
コアをクラスタリング手 法により 3 グルーブに分 類し,手 動 評 価による 3 段 階 評
価 との比 較 を行 う.最 後 に,「NFR キーワード評 価 シート」による評 価 が情 報 化
対 象 ドメインによらず有 効 であることを確 認 するために,情 報 化 対 象 システムを
その社 会 的 影 響により 3 つのカテゴリに分 類 した 161 件の RFP について評 価
点 を算 出し,比 較 評 価 を行う.
提 案 した評 価 モデルによる定 量 評 価 を行 い,評 価 結 果 に基 づいて技 術 協 議
を進 めることで,ソフトウェア開 発 の超 上 流 工 程 でのユーザとベンダの合 意 形 成
が促 進 され,RFP の記 述 内 容 の明 確 さを向 上 することが可 能 であると考 える.
また,ユーザ要 求 の変 化 を定 量 評 価 結 果 の時 系 列 データの推 移 として管 理 す
ることにより,さらに後 工 程 であるソフトウェア開 発 工 程 においても,ユーザ要 件
について,ユーザとベンダ間 の合 意 を支 援 する有 効 なツールとなり得 ると考 える.
1.3
論文構成
本 論 文は大 きく 4 つの章から構 成 される.第 2 章 では,RFP の非 機 能 要 件
を評 価する「非機 能 要 件 評 価 シート」を提 案 し,29 件 の RFP についてケースス
タディを行 う.「非 機 能 要 件 評 価 シート」にもとづいて手 動 評 価 した定 量 評 価 が,
非 機 能 要 件の記 述の明 確 さについて有 効 であるかどうかを確 認 する.第 3 章で
は,自 然 言 語 で記述 された 70 件の RFP から非 機 能 要 件 を記 述 した NFR キ
ーワードを抽 出する.抽 出した NFR キーワードを第 2 章で作 成 した「非 機 能 要
件 評 価 シート」と対 応 させた「NFR キーワード評 価 シート」を提 案 する.「NFR キ
ーワード評 価 シート」の NFR キーワード出 現 頻 度にもとづいて非 機 能 要 件 の記
述 内 容 の明 確 さを,教 師 あり機 械 学 習 のランダムフォレストにより推 定 する評 価
実 験 を行 う.ランダムフォレストによる評 価 推 定 と手 動 評 価 の一 致 度 合 いを評 価
4
し,自 動 評 価の有 効 性 を検 証する.第 4 章 では,教 師なし自 動 評 価の有 効 性
を確 認するために,NFR キーワードの重 み付 けとして NFR キーワード出現 頻
度 にもとづく「単 純 TF-IDF」「拡 張 TF-IDF」および「キーワード比 」の 3 つの手
法 による評 価 実 験 を行 う.手 動 評 価 との比 較 により,3 つの手 法 の中 から有 効
な手 法 を提 案 する.さらに,追 加 実 験 として,教 師 なし機 械 学 習 によるクラスタリ
ング手 法 の一つである k-means 法により自 動 評 価 された結果 と 3 段 階の手 動
評 価 との評 価 実 験 を行 い,教 師 なし機 械 学 習 による評 価 の有 効 性 を検 証 する.
第 5 章 では, 161 件 の RFP を社 会 的 影 響 で3つに分 類した情 報 化 対 象シス
テムについて,「NFR キーワード評 価 シート」を適 用 することにより,非 機 能 要 件
の記 述 内 容 の明 確 さが有 効 に評 価 されることを確 認 する.最 後 に,第 6 章で論
文 全 体 の結 論を述べ,まとめを行 う.
5
第 2 章 非機能要件に着目した RFP の評価
2.1
概要
RFP は多 様な情 報 で構 成 されているが,品 質 評 価の重 要 な対 象 の一 つとな
る の が , 「 非 機 能 要 件 (Non Functional Requirements: NFR ) 」で あ る .
NFR は,開 発 すべきソフトウェアのアーキテクチャに対 する制 約 条 件 となり,ア
ーキテクチャの実 現 可 能 性 に大 きく影 響 する.アーキテクチャは,ソフトウェア品
質 を決 定 する主 要 因 の一 つとされている[5].更 に,開 発 開 始 後 のアーキテクチ
ャ変 更 が容 易でないことから,RFP に基づく技 術 仕 様・技 術 提 案 書の作 成 にお
いて,アーキテクチャの策 定 やその実 現 可 能 性 の評 価 は,ベンダにとって極 め
て重 要 な作 業 の一 つとなっている. NFR が明 確 に記 述 されているか否 かは,
RFP 品 質を議 論する上 で重 要 な観 点の一 つと言える.
本 章 では,ベンダへの提 案 依 頼 書 (RFP)提 示 に先 立 ち,RFP 作 成 者 であ
るユーザ自 身 が,RFP の品 質を定 量 的 に評 価する方 法を提 案 する.評 価 対 象
とするのは,RFP で示 されるべき非 機 能 要 件 (NFR)であり,評 価 の観 点 は,そ
の記 述の明 確 さ,である.RFP に記 述 すべき NFR を示 すガイドラインや報 告
書 ,あるいは,NFR を評 価 するためのメトリクスは,これまでにも数 多 く提 案 され
ている[1] [2] [3] [4] [6] [7] [11].本 論 文で提 案する方 法は,それら既 存のガ
イドライン,報 告 書 ,メトリクスを基 盤 として,RFP に記 述 すべき NFR を,より委
託 元 企 業 (ユーザ)の視 点 で評 価 する手 順 を示 すものである.具 体 的 には,評
価 対 象を,ユーザにとって重 要 度の高 い「保 守 と運 用に関する 55 個の非 機 能
要 件」に限 定した上で,要 件 記 述の明 確 さを最大 5 段 階 で評 価 するためのメト
リクス(評 価 基 準 スキーム)を定 義 し,評 価 結 果 は,RFP の「総 合 評 価 点 」と要
件 毎 の評 価 点を俯 瞰 するための「レーダチャート」として示 すものとする.
以 降 ,2.2 節 では,関 連 研 究 として,NFR に関 する代 表 的 なガイドライン,報
告 書 ,メトリクスを紹 介 する.3 節では,提案 法を示し,4 節 では,WWW 上 に公
開 されていた 29 件 の RFP を対 象 としたケーススタディの結 果 を示し,提 案 法
6
の適 用 容 易 性 や有 用 性 について議 論 する.最 後 に,5 節 では,まとめと今 後 の
課 題について述 べる.
2.2
関連研究
2.2.1 非 機 能 要件 に 関 す る ガ イ ド ライ ン
日 本 ユーザ情 報 システム協 会 (JUAS)による「非 機 能 要 求 仕 様 定 義 ガイドラ
イン」[3]には,ソフトウェアライフサイクルを通 じて使 用 することが推 奨 される 200
個 を超 える非 機 能 要 件 が,ISO/IEC09126 等 に準 拠 する形 で示 されている.
ただし,ソフトウェア開 発 終 了 後 の保 守 や運 用 に関 する非 機 能 要 件 は,必 ずし
も網 羅 されていない.一 方 ,「システム構 築 のトラブルを回 避 するための IT シス
テム契 約 締 結 の手 順 とポイント」[7],および,「情 報 システム調 達 のための技 術
参 照 モデル(TRM)」[11]は,ユーザとベンダ間 でソフトウェア開 発 契 約 を締 結
す る 上 で 重 要 と な る , サ ー ビ ス レ ベ ル に 関 す る 合 意 ( Service Level
Agreement: SLA)に必 要 な要 件 を示 すとともに,保 守 と運 用 に関 する非 機 能
要 件も数 多 く示 されている.提 案 法 では,これら 3 つのガイドラインで示 された非
機 能 要 件を,評価 対 象の候 補 とする.
「システム/ソフトウェア製 品 の品 質 要 求 定 義 と品 質 評 価 のためのメトリクスに
関 する調 査 報 告 書 」[6]には,利 用 者 ニーズに応 えるソフトウェア品 質 の確 立 ,
および,そのために広 く利 用 可 能 なメトリクスの選 定 を目 的 とする事 例 調 査 の結
果 がまとめられている.報 告 には,非 機 能 要 件 の重 要 度 に関 するユーザ・ベン
ダ企 業 へのアンケート結 果 が含 まれている.提 案 法 では,このアンケート結 果 を,
評 価 対 象 とする非 機 能 要 件の選 定に利 用 する.
多 種 多 様 な非 機 能 要 件 間 の関 係 を明 らかにする研 究 も行 われている.日 本 情
報 システム・ユーザー協 会 (JUAS)による「ソフトウェア開 発 管 理 基 準 に関 する
調 査 報 告 書 」[4]では,品 質 目 標 (SLA 指 標 ),運 用 容 易 性 ,障 害 対 策 ,災 害
対 策 といった観 点 で,非 機 能 要 件 が整 理 されている.また,情 報 処 理 推 進 機構
ソフトウェア・エンジニアリング・センター(IPA-SEC)による「共 通 フレーム 2007」
[1]では,運 用 と保 守 のプロセスに関 する非 機 能 要 件 の整 理 がなされている.提
7
案 法では,これら2つの成 果 に基づき,評 価 対 象 とする非 機 能 要 件 55 個を 3
階 層でグループ化している.
2.2.2 RFP や 非 機 能 要 件 に 非 機 能 要 件 に 関す る 従 来 研 究
IPA-SEC による「非 機 能 要 求グレード」[2]は,情 報 システムにおけるセキュリ
ティや性 能 ,業 務 の手 順 など,機 能 以 外 に関 する要 件 (非 機 能 要 件 )を定 義 す
ると共 に,要 件 に対 する要 求 レベルを評 価 し,ユーザ・ベンダ間 で合 意 を形 成
するための枠 組 みを与 えるものである.要 件 を階 層 的 にグループ化 し,評 価 基
準 を要 件 毎 に定 義 するというアプローチは,提 案 法 と同 じであるが,要 求 レベル
の評 価 はベンダ視 点 で行 われ,ユーザにとって重 要 な保 守 に関 する要 件 など
については言 及されていない.
RFP や要 求 仕 様 書 など,ソフトウェア開発 の初 期 に作 成される文 書の評 価 に,
自 然 言 語 処 理 技 術 を用 いる研 究 も報 告 されている.佐 藤 らは,要 求 仕 様 にお
ける品 質 要 求 の含 有 率 を,形 態 素 解 析 に基 づく重 要 語 句 の抽 出 などにより測
定 する具 体 的 な方 法 とツールを提 案 している[10].評 価 対 象 には非 機 能 要 件
も含 まれているが,評 価 の粒 度 は,「セキュリティ」,「成 熟 性 」,「運 用 性 」などで
あり,提 案 法に比 べると大きい.
2.3
提案方法
2.3.1 概 要
提 案 法 は,ソフトウェア開 発 に向 けて作 成 される提 案 依 頼 書 (Request For
Proposal: RFP)の品 質を定 量 的 に評 価 するものである.品 質 評 価 の観 点 は,
「運 用 と保 守 に関 する非 機 能 要 件 」に関 する記 述 の有 無 ,および,明 確 さであ
る.評 価結 果 は,RFP の総 合評 価 点 (100 点 満 点),および,要 件 毎の評 価 点
を俯 瞰 するためのレーダチャートとして示 される(図 2.1 参 照 ).
提 案 法 の主 な利 用 者 は,RFP 作 成 者 (ソフトウェア開 発 をベンダに依 頼 するユ
ーザ)である.RFP 作 成 者は,ベンダに対 する RFP の提 示 に先 立 ち,非 機 能
要 件 に関 する記 述 の明 確 さを提 案 法 により定 量 的 ・視 覚 的 に把 握 する.明 確
8
に記 述 されていない要 件があれば,必 要 な加 筆 修 正を RFP に対 して行う.
2.3.2 評 価 対 象 と す る非 機 能 要 件
評 価 対 象 とするのは,2.1 で示 した 3 つのガイドライン[3][7][11]で示 されてい
る非 機 能 要件 のうち,保 守 と運 用に関する 55 個 の非 機 能 要件 である.これは,
本 提 案 法 の主 な利 用 者 となる委 託 元 企 業 (ユーザ)が,ソフトウェアと最 も直 接
的 に関 わるのが「保 守 と運 用 」であり,それら要 件 をベンダに正 確 に伝えることが
RFP 作 成 の主 要 な目 的 のひとつと考 えられるからである.また,非 機 能 要 件 は,
セキュリティ対 策 ,冗 長 化 ,応 答 時 間 といったアーキテクチャの制 約 条 件 となる
場 合 が多 く,アーキテクチャの実 現 可 能 性 を評 価 する上 でも役 立 つ.これとは
反 対 に,ベンダによるソフトウェア開 発 管 理 に関 する要 件 ,ユーザが自 身 のため
に行 う開 発 管 理 に関 する要 件 (ベンダに伝 える必 要 性 の低 い要 件 )は,評 価 対
象 とはしていない.
ユーザ企 業 への調 査 結 果 [6]から,実 際 にユーザが使 用 しているあるいは使
用 したいとしたメトリクスの中から,RFP に記 述すべきメトリクスを回 答 数の多 いも
のからランキング付 けし,38 個 を抽 出 した.しかし,RFP に記 述 すべき「保 守 ・
運 用 要 件 」の網 羅 性 を高 めるためにユーザ企 業 の調 査 でアンケート対 象 となっ
ていない非 機 能 要 件 については,文 献 [3][7][11]に基 づいて,サービスレベル
に関 する合 意 に必 要 な非 機 能要 件を選 定 し(17 個)55 個の要 件を評 価 対 象と
した. 55 個の要 件のうち 34 個は運 用 に関 する要 件 ,21 個 は保 守 に関 する要
件 である.また,55 個 の要 件 のうち 17 個 は,サービスレベルの合 意 に必 要 な要
件 である.残る 38 個 は,文 献 [6]で実 施 されたアンケートにおいて,3 分の 1 以
上 のユーザ企 業 が,「RFP に実 際 に記 述 している」あるいは「記 述 すべき」と回
答 した要 件 である.
2.3.3
非機能要件評価シート
非 機 能 要 件 評 価シートは,評 価対 象 とする 55 個の非 機 能 要 件 それぞれに
ついて,「評 価 メトリクス(明 確 さの評 価 基 準 スキーム)」と「重 要 度 (評 価 におけ
る重 み)」を与えるものである(図 2.1 参 照 ).なお,評 価 対 象 とする要 件が 55 個
9
と多 数 にのぼるため,評 価 結 果 の俯 瞰 が難 しくなる可 能 性 がある.そこで,類 似
する要 件をグループ化 し,17 個 の「中 項 目 」として設 定 し,更 に,それら中 項 目
を,ソフトウェア利 用 者 の観 点 で設 定した 7 個の「大 項 目」に対 応 付 けている.
評 価 対 象 とする要 件 それぞれについての記 述 内 容は次の通 りである.
■非 機 能 要 件 i
名 称:
定義:
■評 価メトリクス(評 価 点 s i )
明 確 さ4の評価 基 準
3の評 価 基 準
2の評 価 基 準
1の評 価 基 準
0の評 価 基 準
■重 要 度 w i
提 案 法では,各 要件 は最 大 5 段 階で評 価 される.評 価 点 の取りうる値は,0 か
ら 4 の整 数 値 である.「明 確 さ評 価 基 準」は,文 字 通り,当 該 要 件 の明 確 さを評
価 するための基 準 を示 すものである.当 該 要 件 が(十 分 に)明 確 に記 述 されて
いる場 合 の評 価 点は 4,記 述がない,もしくは,記 述の明 確 さが著 しく低 い場 合
は 0 となる.ただし,要 件によっては,記 述 の明 確 さに区 別 はなく記 述の有 無 だ
けで評 価 できる要 件 ,記 述 の明 確 さについての議 論 や検 討 が(現 時 点 では)十
分 ではなく 5 段 階 評 価が難しい要 件 ,などがある.そうした要 件については,明
確 さ 3 の評 価 基 準 ,同 2 の評 価 基 準 ,同 1 の評 価 基 準 のいずれか,もしくは,
全 てを「該 当 なし(N/A)」とできるものとする.例 として,いくつかの非 機 能 要 件 と
その明 確 さ評 価 基 準 を図 2.2 示す.図 2.3(a)に示す非 機 能 要 件 「バックアップ
方 式 」では,5つ全 ての評 価 基 準 が示 されており,5 段 階 評 価 が行 われる.図
2.3(b)に示 す非 機 能 要 件「システムソフト」では,明 確 さ 3 と 1 の評 価 基 準 評価
が「該 当 なし(N/A)」となっており,3 段 階 評 価 となる.図 2.3(c)に示 す非 機 能
10
要 件「応 答 時 間 」では,明 確さ 3 から 1 の評 価 基 準が全 て「該 当 なし(N/A)」と
なっており,2 段 階 評 価 となる.
「重 要 度 」は,RFP における当 該 要 件 の重 要 度を相 対 的に示 す数 値 である.
前 述 の通 り,要 件 の明 確 さの評 価 点 が取 り得 る値 は,全 ての要 件 において,0
から 4 の整 数 値である.そこで,RFP の総 合 評 価 点(100 点 満 点 )の算 出 にお
いて,複 数 の要 件 の評 価 点 を加 算 するにあたって,この重 要 度 を重 みとして用
いる.要 件 の重 要 度 は,対 象 ソフトウェアのドメインや利 用 組 織 毎 に異 なり,一
律 に定 めることは出 来 ない.本 論 文 では,一 例 として,文 献 [6]で実 施 されたア
ンケートにおいて,「重 要 な要 件 であり,RFP に実 際 に記 述 している」あるいは
「記 述 すべき」と回 答 したユーザ企 業 数 に 基 づき重 要 度 を決 定 した.例 えば,
「バッチ処 理 正 常 終 了 率 」の重 要 度 は「オンラインシステム稼 働 率 」の重 要 度 の
6.2 倍 となっているが,これは,同 アンケートにおいて,上 記 のように回 答 したユ
ーザ企 業 数が 6.2 倍 あったことを意 味 する.同アンケートの対 象 外 の要 件 につ
いては,システム発 注 ・開 発 に長 年 携 わってきたエキスパートの意 見 に基 づき重
要 度を決 定した.その上 で,評 価 対 象 とする 55 個の非 機 能 要 件 全 体で,重 要
度 (重 み)の合 計が 100 となるよう正規 化を行った.その結 果 ,重 要 度が最も高
い要 件は「バッチ処 理 正 常 終 了 率」で重 要 度は 6.2,最 も低い要 件は「オンライ
ンシステム稼 働 率 」,「アクセス監 査 」など 18 個の要 件 で重 要 度は 1.0 となった.
11
非機能要件評価シート(抜粋)
大項目
運用開始
準備
システム
運用評価
中項目
非機能要件
重み
運用テスト
運用移行許容障害発生率
6.0
運用開始条件の明確化
テスト密度
2.6
テストカバレッジ
2.2
介入オペレーションの最小化
1.9
介入オペレーションの容易性
1.9
平均稼働率
5.3
オンラインシステム稼働率
1.0
バッチ処理正常終了率
6.2
応答時間
3.7
応答時間(最悪時の応答時間比率)
1.3
スループット
3.6
最大負荷スループット
1.1
運用容易性
稼働率目標
稼働品質性能
RFP
総合評価点
X点
2.5
2
1.5
1
0.5
0
大項目
レーダーチャート
3.5
3
2.5
2
1.5
1
0.5
最大停止時間
1.3
業務停止回数/年
1.0
既定時間外停止回数
1.0
ターンアラウンド時間
2.6
通常時余裕率
1.0
ピーク時余裕率
1.0
中項目
レーダーチャート
図 2.1 提 案 する RFP 評 価 法の概 要
( a) 5 段 階 評 価
(b)
図 2.2
(c) 2 段 階 評 価
12
3 段階評価
明確さ評価基準の例
2.3.4
評価結果
「非 機 能 要 件 評 価 シート」に基 づく評 価 結 果 は,RFP の「総 合 評 価 点 」と要
件 毎の評 価 点を俯 瞰 するための「レーダチャート」に大 別 される.総 合 評 価点 S
は,評 価 対 象 とする 55 個の非 機 能 要 件それぞれに対する評 価 点を,その重 要
度 で重 み付 けした加 重 和である.
S = Σw i s i /4 (i = 1, … , 55)
ここで,s i は,要 件 i の評 価 点 ,w i は要 件 i の重 要 度 である.55 個の非 機 能
要 件 全 てが明 確に記 述 されている場 合 ,総 合 評 価点 S の値 は 100 となり,記
述に明 確 さがない,あるいは,記 述 そのものがないほど,要 件の重 要 度に応 じて
減 点 されていることになる.
レーダチャートは,要 件 間 での評 価 点 の比 較 などが容 易 に行 える表 現 形 式 で
ある.ただし,提 案 法 では,評 価 対 象とする非 機 能 要 件が 55 個と多 数にのぼる
ため,それら全 ての評 価 値 をレーダチャートで表 現 することは現 実 的 ではない.
そこで,「非 機 能 要 件 評 価 シート」において設 定 した「大 項 目 」および「中 項 目 」
を単 位 としてレーダチャートを作 成 する(図 2.1 参 照 ).「大 項 目 レーダチャート」
では,大 項 目 それぞれに属 する要 件 の評 価 点 の平 均 値 を示 す.「中 項 目 レー
ダチャート」でも,同 じく,中 項 目 それぞれに属 する要 件 の評 価 点 の平 均 値 を示
す.平 均 値 が取 り得 る値 は,いずれも,0~4 であり,要 件 が明 確 に記 述 されて
いるほど高 い値 となる.
2.4
2.4.1
ケーススタディ
概要
提 案 法 の適 用 容 易 性 や有 用 性 を評 価 するために行 ったケーススタディの結
果 について述 べる.ケーススタディでは,地 方 自 治 体 ,図 書 館 ,政 府 機 関 ,大
学 ,病 院 などが,ベンダ候 補 企 業 向 けの入 札 情 報 として WWW 上 に公 開して
いた 29 件の RFP を評 価 対 象 とした.RFP の評 価 は,各 RFP の作 成 者 では
なく,システム発 注 ・開 発 に 10 年 以 上 携 わってきたエキスパート1名 が,対 象
13
RFP 全 てに対して行 った.
RFP の評 価に要した時 間は,RFP1件 あたり最 大 1 時 間 程度 であった.評
価 者は,対 象 RFP で表 されるシステムやそのドメインに関 する知 識 を十 分 に有
していたわけではなかった.しかし,対 象 RFP を熟 読 することで,非 機 能 要 件
55 項 目それぞれの評 価 点を支 障 なく決 定 することが出 来た.RFP 作 成 者自 身
であれば,より短 い時 間 で評 価 が可 能であることは容 易に推 察 される.
また,提 案 方 法は RFP のみに基 づいて実 施 可 能であり,対 象 RFP を公 開 して
いる団 体 や RFP 作 成 者に対してインタビューを行ったり,追 加 資 料を求 めたり
する必 要 のないことも確 認 された.このことは,(RFP 作 成 者 自 身 を含 む)複 数
人 で RFP を評 価し,デルファイ法 などにより,より客 観 性 ・妥 当性 の高 い結 果を
得 ることが,比較 的 容 易 であることを意 味する.
2.4.2
総合評価点
図 2.3(a)は,29 件の RFP の総 合 評 価 点の分 布を,RFP が表 す情 報 システ
ムの 5 つのドメイン毎 に示 した箱 ひげ図 である.5 つのドメインとそれぞれの RFP
件 数 は次 のとおりである.
地 方 自 治体 6 件
図書 8 件
政 府 機関 5 件
大学 5 件
病院 5 件
箱 ひげ図 は,データ分 布 の様 相 を視 覚 的 にとらえやすく表 すために工 夫 され
た図 である.箱 の中 に引 かれた横 線 がその分 布 の中 央 値 を,箱 の下 辺 と上 辺
がそれぞれ第 一 四 分 位 数 ,第 三 四 分 位 数 を,更 に,上 下 にのびたヒゲの先 端
が,それぞれ最 大 値 と最 小 値 を表 す.なお,外 れ値 がある場 合 は,箱 やひげと
は別 に,〇印 で表 される.
図 2.3(a)より,ドメインによって総 合 評 価 点 に大 きな違 いのあることが分かる.
また,総 合 評 価 点 が 60 点 以 上 となったのは,政 府 情 報 システムと病 院 情 報 シ
ステムのそれぞれで 1 件 のみである.提 案 法 では,評 価 対 象とする 55 個 の非
14
機 能 要 件 全てが RFP において明 確に記 述 されているべき,という立 場 で評 価
が行 われている.総 合 評 価 点は,満 点 となる 100 点 にできるだけ近 いことが望 ま
れる.しかし,大 半の RFP は総 合 評 価点 が 100 点からほど遠 く,非 機 能 要件
がまだまだ明 確 には記 述 されていない,ということになる.特 に,図 書 情 報 システ
ムでは,総合 評 価 点 の中 央 値 が 10 点 未 満 であり,RFP に改 善 の余 地 が大 きく
残 されていると言える.
2.4.3
レーダチャート
大 項 目 と中 項 目 の評 価 結 果 となるレーダチャートを図 2.3(b)(c)にそれぞれ
示 す.同 図 では,5 つのドメインそれぞれにおける評 価 点の平 均 が示 されている.
図 2.3(b)を見 ると,5つのドメイン全 てにおいて大 項 目 「運 用 開 始 の準 備 」の評
価 点 が 0,「災 害 対 策 」が 0.5 以 下 ,「システム運 用の評 価」が 1.0 以 下と極 め
て低 いことが分 かる.評 価 点 が 0 となった「運 用 開 始 の準 備 」は,図 1に示 すと
おり,3 つの非 機 能 要 件「運 用 移 行 許 容 障 害 発 生 率」,「テスト密 度」,「テストカ
バレッジ」で構 成 されている.評 価 点が 0 ということは,これらが全 て RFP に一
切 記 述 されていなかったことになる.必 要 がないから記 述 されていなかったとも
考 えられるが,「非 機 能 要 件 を十 分 に提 示 している」とするユーザ企 業 が
22.6%に過 ぎないとの調 査 結 果 [4]もあることから,ここでは,「必 要 だが記 述 さ
れていなかった」との立 場 をとる.今 回 のケーススタディにおけるユーザは,地 方
自 治 体 ,政 府 機 関 ,大 学 ,病 院 等 であり,情 報 システム部 門 を持 たず,テストに
関 する知 識や経 験 が不 足していた可 能 性 がある.その結 果 , テストに関 連 する
要 件が記 述 されず,評 価 点が 0 となったと推 察 する.
評 価 点が 1.0 以 下 となった「システム運 用 評 価」は,同 じく図 1.1 に示 すとお
り,3つの中 項 目 「運 用 容 易 性 」,「稼 働 率 目 標 」,「稼 働 品 質 性 能 」で構 成 され
ている.図 2.3(c)によれば,このうち,「稼 働 品 質 性 能 」の評 価 点 がどの分 野 に
おいても低 いことが分 かる.「稼 働 品 質 性 能 」は 11 個の非 機 能 要 件 で構 成 され
ており,更 に詳 細 な評 価 ・分 析が可 能 であるが,ここでは省 略する.詳しくは,文
献 [9]を参照 されたい.
15
60
50
40
30
20
10
0
自治体
情報システム
図書
情報システム
政府機関
情報システム
大学
情報システム
病院
情報システム
(a) 総 合 評 価 点
運用開始の準備
2.5
業務運用と
利用者支援
2
システム運用
の評価
1.5
1
0.5
0
保守生産性
運用監視
災害対策
障害対策
図書情報システム
大学情報システム
地方自治体情報システム
病院情報システム
政府機関情報システム
(b) レーダチャート:大 項 目
16
導入教育
運用テスト
3.5
運用開始条件の明確化
3
障害対応
運用容易性
2.5
2
ライセンス
保守
稼働率目標
1.5
1
0.5
サービス
提供時間
稼働品質
性能
0
保守容易性
異常検知
条件
問題点把握
及び修正 分析
セキュリティ
対策
災害対策
障害予防
冗長化
図書情報システム
大学情報システム
地方自治体情報システム
異常中断時の
処理機能
病院情報システム
政府機関情報システム
(c) レ ー ダ チ ャ ー ト : 中 項 目
図 2.3
2.4.4
シ ス テ ム ド メ イ ン 毎の 評 価 点
ベンチマーキング
ケーススタディ結 果 のひとつとして,提 案 法 におけるベンチマーキングについ
て述べる.先にも示した通 り,提 案 法 では,評 価 対 象 とする 55 個 の非 機 能 要 件
全 てが RFP において明 確に記 述 されているべき,という立 場 で,いわゆる減 点
法 により評 価が行 われる.RFP 作 成 者の目 標は,総 合 評 価 点が 100 点 ,レー
ダチャートで示 される全 ての項 目 の評 価 点 が 4 点 ,となる RFP を作 成 すること
と言 える.
ただし,100 点 満 点 の RFP を作成 することが,(現 時 点 において)現 実 的で
あるかどうかについては議 論 の余 地 がある.提 案 法 では,既 存 のガイドライン,
および,RFP 作 成 者 となるユーザ企 業へのアンケート結 果に基 づいて,評 価 対
象 となる非 機 能 要 件 を選 定 し,記 述 の明 確 さの評 価 基 準 や重 要 度 等 を要 件 毎
に定めている.しかし,それら要 件を明 確 に記 述 することの容 易 性 については考
慮 されていない.限 られた工 数 ・期 間 の下 では,明 確 に記 述 されにくい要 件 が
存 在する可 能 性もある.目 標 としての 100 点 満 点 とは別に,標 準 値 あるいは基
17
準 値 を設 定 し,個 々の RFP 評 価 点 との比 較 を行 うベンチマーキングも必 要 で
あると考 えられる.
ここでは,一 例 として,評 価 対 象 とした 29 個 の RFP のうち,総 合 評 価 点が高
かった 3 個の RFP(RFP トップ 3)における平 均 評 価 点を,各 要 件に対 する評
価 点 の基 準 値 とした.なお,基 準 値 の設 定 においては,特 異 点 ,あるいは,例
外 的 と思 われる値 (評 価 点 )は除 外 する必 要 がある.特 に,著 しく高 い評 価 点 は,
目 指 すべき高 い目 標 として基 準 値 に組 み入 れるべきとされる一 方 で,特 異 点 ,
あるいは,例 外 的 として基 準 値 設 定 から除 外 すべき場 合 もある.基 準 値 設 定 に
用 いた3個 の RFP のうち2個 の総 合 評 価点 はおよそ 60 点 で,他 の RFP に比
べれば著しく高 い値となっている.ただし,100 点 満点 中の 60 点 であり,要 件
によっては,他 の RFP よりも平 均 評 価 点が低 くなる場 合もあることから,現 時 点
では,特 異 点 ,あるいは,例 外 的 とは見 なさず基 準 値 設 定 に用 いた.図 2.4 は,
総 合 評 価 点が中 央 値 であった RFP(RFP M と呼 ぶこととする)における評 価 点
を基 準 値 と比較 した結 果 である.一 般 論で言 えば,RFP M の評 価 値 と基 準 値
の差 が大 きい要 件 ほど,記 述 の明 確 さに改 善 の余 地 があることになる.同 図 より,
要 件「稼 働 率 目 標」,「異 常 検 知 条 件」,「サービス提供 時 間 」などが該 当 する.
個 別 の要 件 について,もう少 し詳 しく見 ていくと,例 えば,要 件 「導 入 教 育 」の
評 価 点は,RFP M では 4 点,基 準 値 ,すなわち,RFP トップ 3 の平 均 では
2.89 点 となっている.評 価 点が満 点の 4 点 であることから,RFP M において同
要 件が相 対 的にも絶 対 的にも極 めて明 確 に記 述 されていることが分かる.
また,要 件「運 用 容 易 性」に注 目してみると,RFP M の評 価 点は 2 点 ,基 準
値 も 2.17 点 とほぼ同 じである.RFP M の評 価 点だけで判 断すると,同 要 件 は
必 ずしも明 確に記 述 されていない,ということになる.しかし,RFP トップ 3 と同
程 度 には明 確 に記 述 されており,現 時 点 では,改 善 の余 地 はそれほどないかも
しれない.一 方 ,RFP M において,評 価 点 が同 じ 2 点 となっている要 件「障 害
予 防 」について見てみると,基 準 値 は 3.20 点 となっており,より明 確に記 述 する
余 地 が残 されていることが分かる.こうした違 いは,RFP M の評 価 点だけを比 べ
ても分 からない.他 にも,要 件「冗 長 化 」について言えば,RFP M の評 価 点 は 3
点 と要 件 「運 用 容 易 性 」よりも高 い評 価 となっているが,基 準 値 は 4 点 であり,
18
要 件 「運 用 容 易 性 」よりも既 に明 確 に記 述 されてはいるが,更 に明 確 に記 述 す
る余 地 が残 されていることが分かる.
なお,RFP M において評 価 点 が 0 点 となっているのは,要 件 「運 用 テスト」,
「運 用 開 始 条 件 の明 確 化 」,「稼 働 率 目 標 」,「稼 働 品 質 性 能 」,「異 常 検 知 条
件 」,「災 害 対策 」,「ライセンス保 守 」の 7 要 件 である.このうち,要 件「運 用 テス
ト」,「運 用 開 始 条 件の明 確 化」については,基 準 値も 0 点 となっているが,いず
れもユーザ企 業に対 するアンケート[6]において重 要 であるとの回 答 数 が多 い要
件 である.特 に,高 い信 頼 性 が要 求 されるドメインでの委 託 ソフトウェア開 発 に
おいては,ベンダがシステム開 発 の完 了 を確 認 し,ユーザが運 用 を開 始 する条
件 として RFP に記 述 されるべき要 件である.一 方 ,残 りの 5 つの要 件 について
は,より明 確に記 述する余 地があり,RFP M における記 述 の不 明 確 さには,個
別 の原 因 や理 由があると考 えるべきである.
導入教育
運用テスト
4
運用開始条件の明確化
3.5
障害対応
運用容易性
3
2.5
ライセンス
保守
2
稼働率目標
1.5
1
0.5
サービス
提供時間
稼働品質
性能
0
保守容易性
異常検知
条件
問題点把握
及び修正 分析
セキュリティ対策
災害対策
障害予防
基準値
図 2.4
2.4.5
冗長化
異常中断時の
処理機能
総合評価点が中央値のプロジェクト
ケ ー ス ス タ デ ィ 結 果 : 基 準値 ( RFP ト ッ プ3 ) と の 比 較
評 価 者 間 の 評 価 点 の ば ら つき
評 価 者 間 のばらつきを確 認 するため,評 価 者 を2名 追 加 し,エキスパートとの
19
間 で評 価 結 果を比 較 する実 験を行った.追 加した評 価 者のうち 1 名 は,ソフトウ
ェア工 学 を専 門 とする,業 務 経 験 のない大 学 教 員 (以 降 ,教 員 と記 す)である.
もう 1 名 は,エンタープライズ系のソフトウェアエンジニアとして 20 年 以 上の経 験
を有 する者 (以降 ,エンプラ系SEと記 す)である.29 件の RFP のうち,各 ドメイ
ン(地 方 自 治 体 ,図 書 館 ,政 府 機 関 ,大 学 ,病 院 )から各 1件 をランダムに選 択
し評 価 対 象 とした.
実 験 の結 果 ,まず,各 要 件 に対 する評 価 点 の評 価 者 間 での差 (絶 対 値 の平
均 )は,1非 機 能 要 件 あたり,エキスパートと教 員 の間 で 0.367,エキスパートと
エンプラ系 SEとの間 で 0.585 となり,1 未 満(5 段 階 評価 における1段 階 未 満 )
となった.評 価 点 に有 意 差 (フリードマン検 定 ,有 意 水 準 5%)が認 められたの
は,病 院 情 報 システムの RFP に対 するエキスパートの評 価 点 とエンプラ系 SE
の評 価 点 のみであった.そのケースにおいて,評 価 点 の差 が特 に大 きかった要
件 は,「スループット」「最 大 負 荷 スループット」「最 大 停 止 時 間 」「ターンアラウン
ド時 間 」「保 証 期 間 」の 5 つであった.これらはいずれも,要 件 に関 する数 値 情
報 が記 述 されていれば 4 点 ,されていなければ 0 点 となる要 件 で,エキスパート
による評 価はいずれも 0 点 ,逆に,エンプラ系SEによる評 価 はいずれも 4 点 で
あった.実 際には,これら5つの要 件 に関する数 値 情 報は RFP には記 述 されて
おらず,エンプラ系 SEによる評 価 は妥 当 でないことがわかった.エンプラ系 SE
に追 加 インタビューしたところ,「数 値 情 報 は示 されていなかったが,要 件 に関
する記 述は見られたので 4 点と評 価した.数 値 情 報の有 無を厳 密に評 価 に反
映 しなかったのは少 し寛 大 なのでは,と指 摘 されてもいたしかたない.」との回 答
が得 られた.このことから,数 値 情 報 の有 無 が評 価 に直 結 する要 件 については,
そのことを評 価 者 に徹 底 することが必 要 であり,また,徹 底 することで,評 価 者
間 で評 価 のばらつきを小 さく抑えることが期 待 される.
次 に,総 合 評 価 点(100 点満 点 ,重 み付 き)については,表 2.1 に示 す結 果
となった.エンプラ系 SE による病 院 情 報 システムに対 する評 価 点 を除 くと,教
員 およびエンプラ系SEによる評 価 点 とエキスパートによる 評 価 点 と の 差 は ,最
大 でも 6.09 にとどまった.
以 上 より,実 務 経 験 のない大 学 教 員 であってもエキスパートと有 意 差 のない評
20
表 2.1
各評価者の各 RFP に対する総合評価点
評価者
エンプラ
エキス
教員
ドメイン
系SE
パート
2.71
5.99
6.88
図書館
27.31
32.79
33.40
政府機関
18.91
15.16
16.91
大学
5.06
5.88
5.34
病院
42.75
44.08
64.90
地方自治体
価 を行 えること,また,数 値 情 報 の記 述 が求 められる非 機 能 要 件 については,
具 体 的 な数 値 が記 述 されていなければ評 価 点 は“0”とすべきことを徹 底 するこ
とで,評 価 のばらつきを抑 えられる可 能 性 があることが分 った.本 結 果 の信 頼 性
を増 すため,より多 くの評 価 者 を被 験 者 として評 価 実 験 を行うことが今 後 の課 題
となる.
2.5 まとめ
2.5.1
評価結果と考察
本 章 では,ベンダへの提 案 依 頼 書 (RFP)提 示 に先 立 ち,RFP 作 成 者 であ
るユーザ自 身 が,RFP の品 質を定 量 的に評 価する方 法を提 案 した.評 価 対 象
は,ユーザにとって重 要 度 の高 い「保 守 と運 用 に関 する 55 個 の非 機 能 要 件
(NFR)」であり,評 価 の観 点 は,その記 述 の明 確 さ,である.記 述 の明 確 さは,
最 大 5 段 階 で評 価 され,その結 果は,RFP の「総 合 評 価 点」と要 件 毎の評 価
点 を俯 瞰 するための「レーダチャート」として示 される.地 方 自 治 体 ,図 書 館 ,政
府 機 関 ,大 学,病 院 などが WWW 上 に公 開 していた 6 ドメイン 29 件 の RFP を
評 価 対 象 としたケーススタディによって,記 述 が不 十 分 な要 件 を特 定 したり,基
準 値 との比 較 を通 じて特 に改 善 が必 要 な特 性 を明 らかにしたりできることなどが
21
確 認 された.加 えて,ドメインや要 件 によって評 価 点 やそのばらつきに比 較 的 大
きな差 があることが,総 合 評 価 点 の比 較 やレーダチャートによる俯 瞰 により明 確
となり,提 案 法に基づく RFP ベンチマーキングの可 能 性 についても議 論 を行 っ
た.なお,評 価は RFP のみに基 づいて実 施 可 能であり,評価 に必 要 な時間 も,
RFP1件あたり最 大 1 時 間 程 度 であった.
提 案 法 は,RFP を対 象 としたものであり,ベンダへの提 示 に先 だってユーザ
のみが利 用 するものと位 置づけられている.ただし,RFP に基 づいて作 成 される
技 術 仕 様・技 術 提 案 書や契 約 仕 様 書 へと適 用 範 囲を拡げることは比 較 的 容 易
である.その場 合 ,技 術 仕 様 ・技 術 提 案 書 の作 成 においてベンダが提 案 法 を
利 用 する,また,契 約 仕 様 書 の作 成 に向 けた技 術 協 議 において,ユーザとベン
ダの双 方 が提 案 法 を利 用 し,非 機 能 要 件 に関 する合 意 形 成 を効 率 よく行 う,と
いったことも考えられる.
また,関 連 研 究 においても少 し紹 介 したが,ソフトウェア開 発 で作 成 される文
書 の評 価 に,自 然 言 語 処 理 技 術 を用 いる研 究 が盛 んに行 われている.提 案 手
法 においても,例 えば,非 機 能 要 件 記 述 に含 まれる典 型 的 な語 句 や表 現 を自
然 言 語 処 理 技 術 で抽 出 し,非 機 能 要 件 の文 例 集 を作 成 することが考 えられる.
文 例 集があれば,RFP や対 象ドメインに関 する知 識が十 分 でない者 でも,提 案
手 法 による評 価 が可 能 に,あるいは,より容 易 になる.評 価 者 による評 価 結 果 の
ばらつきが減 れば,評 価 法に基 づく RPF ベンチマーキングの信 頼 性や有 用 性
も高 まる.テキ ス トマ イ ニ ングや 機 械 学 習 といった 技 術 と組 み合 わせることで,
RFP 評 価の自 動 化にも道を開 くことになる.
2.5.2
課題
提 案 手 法を用いて超 上 流 工 程 で RFP に記 述 されている非 機 能 要 件を定 量
評 価 することにより,ユーザの満 足 度 は向 上 することが推 定 される.なぜなら,不
十 分 な記 述 のユーザ要 求 が数 値 として明 確 になり,これを明 確 化 することにより
要 件 定 義 が行 われることが期 待 されるからである.しかし,ユーザの満 足 度 を評
価 するためには,定 義 された非 機 能 要 件 についてソフトウェアライフサイクルを
通 じた「要 求 管 理 」を継 続 することにより,要 求 の変 更 を定 量 評 価 することが求
22
められる.文 献 によれば「マイクロソフトのプロジェクトでは 30%の要 求 をあらかじ
め抽 出 することはできず,開 発 工 程 の途 中 で追 加 された」[49]とされている.委
託 ソフトウェア開 発 では,ソフトウェアライフサイクルを通 じて,提 案 手 法 によるユ
ーザ要 求 の追 加 変 更 を定 量 的 に評 価 し,顧 客 満 足 度 を検 証 することが今 後 の
課 題 である.
また,RFP に記 述 された非 機 能 要 件の記 述 内 容ついて,多 くの RFP を人 手
で評 価 を行うには時 間 を必 要 とする問 題 点 については,多 くの RFP を自 動 評
価 することにより時 間 を短 縮 し,相 対 的 に比 較 評 価 できることが求 められる.自
然 言 語で記 述 された RFP の非 機 能要 件 の記 述 内 容を自 動 評価 するためには,
非 機 能 要 件 に関 連 する語 句 が RFP にどの程 度 記 述 されているかを評 価 する
することにより,明 確 さを評 価 する手 法 が有 効 であると考 えられる.そこで,次 章
以 後 では,非 機 能要 件に関 連 する NFR キーワードを,テキストマイニングを用
いて RFP テキストから抽 出し,自 動 評 価 することにより,非 機 能 要 件 の記 述 内
容 の明 確 さを評 価する手 法について述 べる.
23
第3章
3.1
機械学習による非機能要件の自動評価
概要
第 1 章で述 べた手 法 [9][15] では, RFP に記 載 されるべき 55 個 の非 機 能
要 件 (図 2.1 参 照 )の記 述をユーザ視 点 から評 価する枠 組みを提 案し,ケース
スタディにおいてエキスパート技 術 者 による評 価 を行 った.しかし,「非 機 能 要 件
評 価 シート」に基 づいた“人 手 による評 価 ”(以 後 は手 動 評 価 と称 する)は,エキ
スパートがいることが前 提 となること,および評 価 に時 間 を要 することが問 題 とな
る.そこで,本 章 では,これらの問 題 を解 決 するために,RFP に含 まれるキーワ
ード群 から非 機 能 要 件 に関 連 するキーワード(以 後 NFR キーワードとする)を
抽 出 し,その出 現 頻 度 に基 づいた機 械学 習 による自 動 評 価 手 法 を提 案 する.
提 案 手 法 では,最初 に自 然 言 語 で記 述された複 数の RFP から NFR キーワ
ードをテキストマイニングにより抽 出 する.NFR キーワードと「中 項 目 」の関 連 付
けにおいて,より明 確 に非 機 能 要 件 の記 述 内 容 を評 価 するために「非 機 能 要
件 評 価 シート」の階 層 をさらに細 分 化 し,粗 いレベルの「中 項 目 」と抽 出 した
NFR キーワードの間 に「小 項 目 」(非機 能 要 件)を設 けることにより,「NFR キー
ワード評価 シート」を作 成した.次に,抽 出 された NFR キーワードと「小 項 目 」に
マッピングされた NFR キーワード群 の出 現 頻 度 をデータとして,教 師 あり機 械
学 習 によりモデル化 する.モデル化 手 法 としては,分 類 精 度 が最 も高 く,高 次
元 データ解 析 に向 いており,汎 化 能 力 に優 れているランダムフォレストを用 いる
[17].評価 実 験 では,NFR キーワードによる自 動 評 価について,2 段階 ,3 段
階 及 び 5 段 階の手 動 評 価の結 果を教 師 データとした機 械 学 習を行 い,その結
果 について比 較 する.以 下 ,3.2 節 で関 連 研 究 ,3.3 節で RFP と NFR キーワ
ードの相 関 関 係 についての予 備 調 査,3.4 節 で機 械 学 習 による提 案 手 法 ,3.5
節 で機 械 学 習 による非 機 能 要 件 評 価実 験 , 3.6 でまとめについて述 べる.
3.2
関連研究
ソフトウェア開 発 の上 流 工 程 にて,自 然 言 語 で記 述 された非 機 能 要 件 を評
24
価 する国 内 での先 行 研 究 は少 なく,特 に非 機 能 要 件 の記 述 内 容 の定 量 評 価
については示 されていない.ソフトウェア開 発 の上 流 工 程 にテキストマイニングを
応 用 する実 用 的 な研 究 として,日 本 国 内 では福 田 [19]による概 念 データモデリ
ング,SOA のサービス抽 出 及 びサービスのクラスタ化 を支 援 する試 みが提 案 さ
れているが,クラスタ分 析 及 び文 書 ・語 句 行 列 による評 価 の試 行 にとどまってお
り,定 量 評 価は行 われていない.
また,今 村 ら[12]による技 術 文 書 からの用 語 知 識 を自 動 的 に獲 得 する実 験
は,共 起 関 係 としての「係 り受 け先 」と「文 節 内 の後 方 」が体 系 的 意 味 分 類 とし
て有 効 であることを指 摘 しており,自 然 言 語 で記 述 された技 術 文 書 から語 句 を
抽 出 する場 合 に有 益 な手 法 を示 唆 している.しかし,機 械 学 習 によるモデル化
は今 後 の課題 としている.
さらに,自 然 言 語 で記 述 された文 書 の質 判 定 については,英 語 で記 述 され
た論 文を対 象 としたさまざまな手 法による質 判 定 の研 究 [13] [14]が行 われてい
る.小 林 らは,論 文 の質 が如 実 に反 映 される言 語 項 目 を素 性 として論 文 の質 を
ランダムフォレストにより 2 クラス分類 し,分 類 精 度を評 価している.本 研 究とは,
非 機 能 要 件を対 象としている点 ,および,多クラス分 類を行 う点 が異 なる.
一 方 ,海 外 の先 行 研 究 では,自 然 言 語 で記 述 された要 求 仕 様 を,ソフトウェ
ア開 発 の上 流 工 程 において評 価 する重 要 性 の視 点 から,テキストマイニング技
術 により抽 出 した語 句 にもとづいて要 求 分 析 を行 い,ソフトウェア設 計 を支 援 す
る手 法 及び評 価に関 する先 行 研 究 [19] [20] [21] [22] [23] [24]がある.本 研
究 の対 象 である自 然 言 語 で記 述 された非 機 能 要 件 に着 目 した先 行 研 究 として
は,1)サポートベクタマシーンによる非 機 能 要 件 ,特 にアーキテクチャに関 する
分 類 器 に関 する先 行 研 究 [25],2)セキュリティ,パフォーマンス,操 作 性 などの
非 機 能 要 件 に関 する語 句 をキーワードとして,独 自 の分 類 器 を用 いて評 価 する
手 法を提 案している先 行 研 究 [26] [27],及 び 3)コンポーネントベース開 発 を対
象 として非 機 能 要 件 メトリクスにもとづいた品 質 評 価 に関 する先 行 研 究 [28]があ
る.しかし,これらの先 行 研 究 は,非 機 能 要 件 をパフォーマンス,セキュリティ,
可 用 性 などの非 常 に大 きなカテゴリにおける評 価 にとどまっており,評 価 実 験 に
おけるデータ数 も少ない.一 方 ,本 研 究 では,より細 分 化 された非 機 能 要 件(例
25
えば,セキュリティに関 して言 えば,アクセス権 限 ,ウイルス対 策 ,セキュリティ管
理 レベル,パスワード管 理 ,暗 号 処 理 ,情 報 漏 洩 対 策 ,認 証 機 能 ,不 正 アクセ
スなど)をそれぞれ評 価することを目 的 としている.また,評 価 に用 いた 70 件の
RFP によるモデル構 築 用のデータを Web にて公 開することで,一 般 企 業にお
ける利 用を可 能 としている[16].
3.3
非機能要件キーワードの出現頻度予備分析
本 節 では ,収 集 した RFP テキスト群 を 用 いて「小 項 目 」にマッピングされた
NFR キーワードで記 述 の明 確 さを評 価 することの妥 当 性 について予 備 分 析 を
行 う.機 械 学 習を行う前 処 理 として,収 集した RFP 群 の各 RFP を文 書 として
結 合した RFP テキストを作 成 する.RFP 群 はウェブに公 開 されている「調 達 仕
様 書」,「要 求仕 様 」などからさまざまな情 報 化 対 象ドメイン(第 1 章 と同 様 に「図
書 情 報 システム」,「大 学 情 報 システム」,「医 療 情 報 システム」,「政 府 機 関 情
報 システム」などの公 的 機 関 における情 報 化 システム)を対 象 とした.理 由 として,
RFP 情 報 が公 開されており入 手が容 易であること,および委 託 ソフトウェア開 発
による情 報 化 システムの非 機 能 要 件が記 述 されていることがあげられる.
3.3.1
NFR キ ー ワ ー ド の 抽 出
自 動 評 価を行うためにウェッブに公 開 されている 70 件 の RFP 群を対 象 とし
た.詳 細は 3.4 節を参 照のこと.
機 械 学 習 に使 用 するキーワードについては,「出 現 頻 度 で上 位 10%の単 語
しか使 わなくても分 類 器 の性 能 は下 がらないという実 験 結 果 がある.大 多 数 の
単 語の文 書 頻 度はきわめて低 く,実 際には上 位10%がすべての低 中 頻 度を含
んでいるからである」[32]と言 われている.ランダムフォレストでは,説 明 変 数 総
数 の平 方 根 (デフォルト値)の説 明 変 数 により決 定 木を生 成 し分 類 が行 われる.
評 価 対 象 とした RFP 群の中 で NFR キーワードの出 現 頻 度が高 い大 項 目「運
用 要 件」の「小 項 目」に関 連 付 けられた NFR キーワードについて説 明 変 数の重
要 度 と出 現 頻 度を表 3.1 に示 す.表 3.1 によると,出 現 頻 度 で上 位 10%の
26
NFR キーワードの場 合は,説 明 変 数の重 要 度 は 13.16%から 90.2%であり,
個 別 の NFR により大 きな差 がある.しかし,出 現 頻 度で上 位 10%より多 い出 現
頻 度 上 位 10 個 の NFR キーワードの場 合 は,60.2%から 100%(ただし,キー
ワード数 が 10 個 に満 たない NFR があるので 100%となっている)となることが
認 められる.「小 項 目」の NFR キーワード数 が 30 個 程 度であれば,上 位 10 個
の NFR キーワードによる説 明 変数 の重 要 度が 70%以 上であることが分 かる.
よって,表 3.1 によると,さらに多 くの NFR キーワードを採 用すれば NFR キー
ワードによる重 要 度比 率は高 くなると言 える.しかし,個 々の NFR による違 いが
あるにせよ,「小 項 目」に対 応 付 けられた 30 個 程 度 の NFR キーワードであれば
NFR キーワードの出 現 頻 度が上 位 10 個 の重 要 度 比 率が70%以 上 であり,自
動 評 価に十 分 な分 類 精 度が得られると言える.
表3.1 NFRキーワードの重要度と出現頻度
NFR
説明変数
システム管理
NFRキーワード数=31
運用管理
NFRキーワード数=22
アクセス権限
NFRキーワード数=25
ウイルス対策
NFRキーワード数=30
セキュリティ管理レベル
NFRキーワード数=32
セキュリティ対応
NFRキーワード数=35
パスワード管理
NFRキーワード数=24
暗号処理
NFRキーワード数=13
情報漏洩対策
NFRキーワード数=9
認証機能
NFRキーワード数=35
不正アクセス
NFRキーワード数=16
システム異常検知
NFRキーワード数=31
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
重要度
重要度比率
合計
16.82767
100%
24.07378
100%
18.40352
100%
16.0936
100%
16.0434
100%
19.59131
100%
12.40575
100%
12.98212
100%
10.43894
100%
13.36928
100%
22.05132
100%
16.87974
100%
27
出現頻度
10%
9.825959
58.39%
8.193873
34.04%
4.214255
22.90%
10.10849
62.81%
6.133548
38.23%
8.064515
41.16%
1.884423
15%
11.68589
90.02%
1.374139
13.16%
2.699545
20.19%
8.342224
37.83%
6.509435
38.56%
出現頻度
TOP5
10.69791
63.57%
13.74518
57.10%
6.325919
34.37%
10.91389
67.82%
7.626645
47.54%
9.119925
46.55%
6.280194
51%
12.5504
96.67%
9.076611
86.95%
5.296596
39.62%
12.83992
58.23%
8.942516
52.98%
出現頻度
TOP10
13.4981
80.21%
18.86369
78.36%
13.60273
73.91%
11.87168
73.77%
9.657985
60.20%
13.4673
68.74%
9.17485
74%
12.5504
96.67%
10.43894
100.00%
9.078904
67.91%
22.05132
100.00%
13.71657
81.26%
3.3.2
「 小 項 目 」 と NFR キ ー ワ ード の 関 連 付 け
70 件 の RFP から抽 出した NFR キーワードについて,「非 機 能 要 件 評 価シー
ト」の「非 機 能 要 件 」項 目 と「同 意 概 念 」となる場 合 があることが分 かった.さらに,
NFR キーワード群をカテゴライズすることにより,非 機 能 要 件 としての「上 位 概 念」
が明 確 になり,非 機 能 要 件 の記 述 内 容 の明 確 さを評 価 する上 で有 効 であると
考 え,「非機 能 要 件 評 価 シート」の「中 項 目」の下 層 に「小 項 目」を追 加した 4 層
構 成 となる「NFR キーワード評 価 シート」を作 成 した.「NFR キーワード評 価 シ
ート」の概 要 を図 3.1(詳 細は付 録 A.を参 照 )に示 す.また,各 「小 項 目」に関
連 付 けられた NFR キーワードの出 現 頻 度 の合 計を図 3.2 に示 す.
図 3.2 によると評 価 対 象 とした RFP 群の NFR キーワードの出 現 頻 度が,各
「小 項 目 」により明 確 な差 として表 されることがわかる.このことは,どの「小 項 目 」
の記 述 の明 確 さが不 足 しているか,あるいは十 分 であるかについて比 較 し,判
断 することが可 能 であることを示 唆している.次 項 3.3.3 では,「小 項 目 」と NFR
キーワード出 現 頻 度についての予 備 調 査を行った結 果を示す.
大項目
RFP
中項目
操作容易特性
稼働品質特性
小項目
オペレーション
応答性
NFRキーワード
操作性 操作マニュアル 画面遷移
平均応答 転送応答性 最小レスポンス
安定的レスポンス 最小応答 応答性
画面レスポンス ターンアラウンド
システム性能
ネットワーク使用率 CPU使用率
ネットワーク性能 演算性能 SPEC
システム運用
CPU負荷率 システム性能 処理性能
の評価要件
負荷バランス
負荷監視 CPU負荷 回線負荷
負荷分散性能 ロードバランシング
負荷低減 ピーク時 ネットワーク負荷
稼働品質
平均稼働率 アクセス頻度 稼働率
正常稼働 稼働実績 ダウンタイム
通信速度 トラフィック量 連続運転
障害検知特性
事故派生 異常発生通知 停電信号
システム異常検知 状態監視 検知システム 障害時
システムエラー システムダウン 故障検知
障害要因
障害発生場所 障害の切り分け 障害原因
運用監視要件
ネットワークダウン サーバ障害 障害要因
ハードウエア障害 機器障害 ディスク障害
システム監視特性 運用管理
運用管理ソフト 運転状況 運用マニュアル
運用管理 運用状況 運用管理システム
運用ルール 運用計画 正常運用
図 3.1 NFR キーワード評 価 シート(抜 粋 )
28
8
7
6
5
4
3
2
1
0
20
15
10
5
0
1.5
1
0.5
0
68
38
98
研修対象
研修計画
研修機材
研修内容
研修方式
保守障害対応
知的財産権
保守タイプ
同時使用ユーザ数
ライセンス契約
サービスレベル
サービス対象
サービス体制
モジュール性
システム拡張性
バージョン管理
構成管理管理
保守マニュアル
システム管理マニュアル
運用管理マニュアル
ログ管理・解析
システムログ
運用ログ
災害対策
パッチ処理
リカバリ処理
停止処理
障害管理
障害対策
バックアップシステム
バックアップ管理
RAID構成
冗長化
暗号処理
情報漏洩対策
ウイルス対策
パスワード管理
認証機能
セキュリティ対応
セキュリティ管理レベル
アクセス権限
不正アクセス
システム管理
運用管理
障害要因
システム異常検知
稼働品質
負荷バランス
システム性能
応答性
オペレーション
運用開始
運用移行テスト
総合テスト
運用テスト仕様
運用テスト計画
206
158
122
329
434
41
181
222
398
129
217
333
177
73
14
50
125
74
42
147
56
84
35
161
27
261
249
130
114
209
200
26
368
61
417
178
353
269
146
593
333
397
60
113
70
88
32
301
72
245
218
79
108
0
100
200
300
400
500
600
700
図3.2 「小項目」毎のNFRキーワード出現頻度
29
3.3.3
「 小 項 目 」 と NFR キ ー ワ ード 出 現 頻 度
NFR キーワード 776 個 の内 ,70 件 の RFP 群 に出 現 したかどうかをカウント
した RFP 出 現 頻 度が多 い 20 個 の NFR キーワードを表 3.2 示 す.表 3.2 よる
と「小 項 目 」の内 「運 用 管 理 」,「システム拡 張 性 」,および「オペレーション」が多
いことが認 められる.また,収 集した RFP の多 くは公 的 機 関が入 札を目 的にウ
ェッブ上 に公 開 したものであり,「バージョン管 理 」,「保 守 障 害 対 応 」および「障
害 要 因 」 あるいは 「障 害 対 策 」に 関 連 する NFR キ ーワード に ついて,多 くの
RFP に出 現 していることが特 徴 として考 えられる.このことは,「小 項 目 」に関 連
付 けられる NFR キーワードによる評 価 の可 能 性 を示 唆していると言 える.
表 3.2
出 現 した RFP 数 が 多い 上 位 20 個の NFR キ ー ワ ー ド
NFRキーワード
システム管理
システム運用
バージョンアップ
拡張性
障害対応
障害発生
運用管理
操作マニュアル
セキュリティ対策
障害時
保守体制
著作権
操作研修
ハードウェア構成
冗長化
ネットワーク構成
操作方法
暗号化
運用支援
運用マニュアル
RFP出現
頻度
46
43
40
40
40
39
36
36
36
34
33
29
29
28
25
25
24
23
23
23
小項目
システム管理
運用管理
バージョン管理
システム拡張性
保守障害対応
障害要因
運用管理
オペレーション
セキュリティ管理レベル
障害対策
サービス体制
知的財産権
研修内容
システム拡張性
冗長化
システム拡張性
オペレーション
暗号処理
運用管理
運用管理
次 に,RFP に記 述 されている語 数 と NFR キーワードの出現 頻 度 について図
3.3 に示 す.図 3.3 によると,2 件の RFP については RFP 総 語 数 および NFR
30
キーワードの出現 回 数 が外 れ値 となっているが,残 りについては RFP 総 語 数 と
NFR キーワード出 現 頻 度に相 関 関 係 (表 3.3 参 照)があり,RFP 総 語 数が多
い場 合には NFR キーワードの出 現 頻 度も高 いことが認 められる.また,外 れ値
の 2 件 は独 立 行 政 法 人の共 通 情 報 基 盤 システムと新 設の総 合 医 療センターに
関 する情 報 化 システムであり,評 価 対 象 とする RFP 群 の中 では相 対 的 に多 く
の非 機 能 要 件が明 確 に記 述 されている RFP と言 える.
1400
出現したNFRキーワード数
1200
1000
800
600
400
200
0
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
RFPの総語数
図 3.3
RFP 総 語 数 と NFR キ ー ワ ー ド 出 現 頻 度
さらに,図 3.4 に RFP 毎 の NFR キーワード出 現 頻 度 と「小 項 目 」について,
RFP を手 動 評 価 した総 合 評 価 ポイントを示 す.図 3.4 によると, NFR キーワ
ード出 現頻 度 と RFP の手 動 評 価 の相 関 係 数 は 0.649 であり,相 関 があると言
えるが,強 い相 関があるとは言えない.これは,一 部 の RFP について NFR キー
ワード出 現 頻 度 は低 いが手 動 評 価 が高 いものがあることによると考 えられる.特
に,外 れ値 となっている RFP は医 療 情 報 システムに関 するものであり,手 動 評
価 が高 い理 由 として,システムの応 答 あるいは処 理 時 間 について数 値 情 報 で
記 述 されており,また非 機 能 要 件 に関 連 する専 門 用 語 が複 合 語 ではなく平 易
な表 現 で記 述 されている等 がある.手 動 評 価 では,記 述 内 容 の前 後 関 係 ある
31
いは明 確 な数 値で記 述 されている場 合には,評 価を高 くするが,NFR キーワー
ドとして抽 出 した場 合 には,出 現 頻 度 が低 い結 果 となっていることが考 えられる.
NFRキーワード出現頻度
250
200
150
100
50
0
0
50
100
150
200
250
RFPの手動評価ポイント
図 3.4 NFR キーワード出 現頻 度 と RFP の手 動 評 価
最 後 に,図 3.5 に NFR キーワード出 現 頻 度 と「小 項 目 」の相 関 を示 す.図
3.5 によると,これらの相 関 係 数は 0.857 で,強 い相関 があり,NFR キーワード
の出 現 頻 度 が多 ければ RFP に記 述 されている非 機 能 要 件 を「小 項 目 」により
評 価することが有 効 であることを示している.
以 上 の予 備 調査 の結 果 により,「小 項 目」にマッピングされた NFR キーワード
と RFP に相関 があり,NFR キーワードの出 現 頻 度により非 機 能 要 件の記 述 の
明 確 さを評 価 することの有 効 性 が示 されたと考 えられる. そこで,次 節 の 3.4
節 以 降では NFR キーワードの出 現 頻 度により自 動 評 価 手 法を提 案し,機 械 学
習 による評 価 実 験の結 果 と手 動 評 価 との比 較について述 べる.
32
30
「小項目」の種類
25
20
15
10
5
0
0
50
100
150
200
250
NFRキーワード出現頻度
図 3.5 NFR キーワード出 現 頻 度 と「小 項 目 」の種 類
表 3.3 NFR キーワードと RFP の相 関 関 係
相関関係データ
RFP総語数とNFRキーワード出現頻度
NFRキーワード出現頻度と手動評価
RFP毎の「小項目」の種類とNFRキーワード出現頻度
3.4
相関係数
相関
0.851 強い相関あり
0.649 相関あり
0.857 強い相関あり
提案手法
本 節 では,「NFR キーワード評 価 シート」の重 要 な中 項 目 10 個 に属 する 26
個 の「小 項 目 」に絞 ってモデルを構 築 し実 験 を行 う.モデル構 築 にはエキスパ
ートの労 力 が必 要 となるが,ひとたびモデルができれば,エキスパートがいない
状 況においても,RFP の評 価を支 援 できる.また,モデル構 築 用に, 70 件の
RFP のキーワード群 ,各 キーワードの出 現 頻 度 ,教 師 信 号 をまとめたデータを
Web にて公 開しており[16],エキスパートがいない場 合 でもモデル構 築・利 用 を
可 能 としている.
3.4.1
「 小 項 目 」 の 自 動 評 価 モ デル 構 築 の 概 要
本項で述べる自動評価モデルは,第 2 章で作成した「非機能要件評価シート」と,
テキストマイニングにより抽出した NFR キーワードをもとに作成した「NFR キーワー
ド評価シート」の「小項目」を NFR キーワードの出現頻度により自動評価するもので
33
ある.ここでは,自動評価モデル構築の前処理から評価モデル構築までの手順概要
について述べ,次項 3.4.2 でその詳細を述べる.図 3.6 に「小項目」の自動評価モ
デル構築手順の概要を示す.図中の各手順は次のとおりである.
手順1:RFP 「小項目」の手動評価
RFP に記述されている「小項目」の内容を判断し,あらかじめ評価者が「小
項目」について段階評価を行う.この評価結果は,教師信号としてモデル構
築用に用いられる.
手順2:RFP の形態素解析
RFP 群のテキストデータから形態素解析を行い,名詞および複合語を抽出
する.
手順3:NFR キーワードの抽出
形態素解析により抽出された名詞及び複合語の中から評価対象とする
「小項目」に関連する NFR キーワードを手作業で抽出し, 「小項目」とのマ
ッピングを行う.
手順4:評価モデルの構築
NFR キーワードを説明変数とし,手順1で行った手動段階評価点を教師デ
ータとした教師あり機械学習用のデータを生成する.
34
手順2
RFPの
形態素解析
NFRキーワード
NFRキーワード評価シート
応答性
キーワード
マトリクス
操作手順
RFP
負荷分散
共通要件
ネットワークに対してどのような機器が接続されたかを検知するため,接続口
グ等を保存すること。
あらかじめ登録された端末以外はネットワークに接続できないこと。
登録されている端末についても,アクセスログ及び操作ログ等を保存すること。
不正アクセス
不正アクセス防止機能要件
院内にウィルス/ワームが侵入した場合の二次感染による病院機能の停止や
患者個人情報漏洩を防ぐ対策として,以下の機能を実装すること。
あらかじめ登録された端末以外はネットワークに接続できないような対策を講じ
ること。
情報漏洩対策エージェントと連動し,病院ネットワークセキュリティポリシーに適
合する端末にはネットワークアクセスを許可し,適合しない端末についてはアク
セスを拒否すること。
不正アクセス防止機器要件
ポリシーに準拠していない端末が,ネットワークに接続することをレイヤ2また
はレイヤ3レベルで防止できるシステムであること。
不正アクセス防止機能を実現するために以下を導入すること。
ネットワーク認証サーバ
セキュリティボリシーサーバ
情報漏洩対策
情報漏洩対策機能要件
HIS系端末を保護するためHIS系の全端末に対し,以下の機能を実装すること。
ポートスキャン,バッファオーバーフロー,トロイの木馬,不正パケット,Eメール型
ワーム,キーボード入力履歴の盗聴等の攻撃を検知・防御できること。
未知のウィルス・ワームを検知・防御できること。
情報漏洩対策エージェントはセキュリティボリシーサーバと照合することによ
り,アプリケーションの動作及び認められていないアプリケーションの新規イン
ストールを制御/防止できること。
情報漏洩対策として, USBメモリやCD-ROM等の外部リソースやディレクトリの
利用(書き込み/書き出し),プリンタでの印刷を制限できること。
情報漏洩対策は情報漏洩対策サーバと各端末にインストールされた情報漏洩
対策エージェントにより実装されること。
外部ネットワーク接続
基本的に外部ネットワーク(インターネット系ネットワークを含む)と接続しないこ
と。
位置情報検知
院内に張り巡らせたデータ通信で利用する無線アクセスポイントを利用し,無線
ネットワーク配下にあるHIS系端末の位置を把握,また操作端末の施設平面図
に位置を表示する以下の機能を有すること。
操作端末から, HIS系端末の位置が検索できること。
あらかじめ設定されたエリアを設定することで,そのエリア内にあるHIS系端末の
位置情報が表示出来ること。
オプションにて無線アクセスポイントにアソシェートせず,データ通信無線ネット
ワークに負荷を掛けないWi-Fiタグを位置検知端末として利用可能なこと。
位置情報検知対象のHIS系端末に特別なクライアントソフト等を必要としないこ
と。
位置情報検知に用いるアンテナは,データ通信や音声通信とも共用可能なこ
と。
HIS系ネットワークスイッチ仕様
HIS系ネットワークスイッチ共通要件
RFPの手動
評価
監視機能
障害原因
NFR
キーワード
フィルタリング
手順3
評価モデル
の構築
手動評価
結果
手順4
手順1
図3.6
3.4.2
機械学習によるNFRキーワード評価モデル構築手順
非 機 能 要 件 評 価 モ デ ル の 構築
手順1: 「小項目」の手動評価
エキスパートによる RFP の手 動 評 価 の結果 は, RFP の機 械 学 習によ
る自 動 評 価 において教 師 データとして使 用 し,比 較 のために「小 項 目 」ごと
に 2 段 階 評 価 ,3 段 階 評 価 及 び 5 段 階 評 価により評 価 ポイントとして与 え
られる.これらの段 階 評 価 は,RFP の「小 項 目 」の記 述 内 容 の明 確 さを評
価 するために記 述 されているか記 述 されていないかを評 価 するスケールと
して,2 段 階 評 価 ,非 機 能 要 件 の記 述 はあるが内 容 としてあいまい性 を含
む記 述を評 価 する場 合には中 間的 な評 価 スケールを追 加した 3 段 階 評 価
とする.また,両 極 端と中 間 の間 にさらに中 間 的 な評 価の場 合 には 5 段階
評 価が適 切 である.各 段 階 評 価の評 価 基 準 は下 記 の表 3.4 よる.
35
表 3.4 段 階 評 価 と評 価ポイント
評価ポイント
4
3
2
1
0
手順2:
5段階評価
明確
やや明確
やや不明確
不明確
記載なし
3段階評価
N/A
N/A
明確
不明確
記載なし
2段階評価
N/A
N/A
N/A
明確
記載なし
RFP の 形 態 素 解 析
ユーザが作 成 する RFP は様 々な形 式 (例 えば,Word 形 式 ,Excel 形
式 ,PDF 形 式 など)で作 成 されている.RFP 文 章 から NFR キーワードを
抽 出 するためには,これらの形 式 をテキスト形 式 に変 換 して処 理 を行 う必
要 がある.そこで,自 然 言 語 の文 章 として記 述 されている部 分 をテキスト形
式 に変 換 する.また,図 として記 述 されている部 分 は削 除 し,表 で記 述 さ
れている部 分 は可 能 な限 りテキストに変 換 する.以 上 の処 理 をモデル構 築
に用 いるすべての RFP について行 い,RFP テキストデータ群 R を得 る.こ
の RFP テキストデータ群 R をひとつのテキスト文 書 として形 態 素 解 析を行
うことにより,RFP テキストデータ群 R の全 体 から名 詞および複 合 語 (名 詞
語 句 の組 み合 わせ)を抽 出 する(例 えば,「操 作 」と「手 順 」の複 合 語 である
「操 作 手 順 」を抽 出する).
手順3:
NFR キ ー ワ ー ド の 抽 出
テキストマイニングにより抽 出 された名 詞 および複 合 語 の中 から「小 項 目 」
に関 係 づけられる NFR キーワードを手 作 業 で選 択 する.この場 合 ,出 現
頻 度が2回 以 上の NFR キーワードについて採 用 し,1回 のみ出 現 する語
句は不 採 用 とするが,対 象 とした RFP 群 での出 現 頻 度 は 1 回 であっても,
ソフトウェアアーキテクチャを構 築 する上 で重 要 と考 えられる「小 項 目 」の評
価に重 要 な NFR キーワードは採 用 した.また,「小 項 目 」に関 する単 一の
名 詞だけでなく専 門 用 語を加えた NFR キーワードにより,より明 確 に非 機
能 要 件 の記 述 内 容 を評 価 することが可 能 となることから複 合 語 を採 用 した.
36
複 合 語 として 「小 項 目 」の内 容 を表 す助 詞 を含 む複 合 語 句 (例 えば,操
作 を容 易 にする,平 均 読 み出 し遅 延 ,障 害 切 り分 けなど)は平 易 な語 句 で
表 現 された「小 項 目」を特 徴 付 ける NFR キーワードと考 えられるので採 用
した.複 合 語 の選 択 にはエキスパートの知 識 が必 要 となるが,本 論 文 で抽
出 したキーワード群 を Web に公 開 している[16].一 方 ,出 現 頻 度 は高 い
が,広 範 囲 の意 味を持 つ単 語 (オペレーションなど)は抽 象 度 が高 く,専 門
性 が低 いため「小 項 目 」の記 述 の明 確 さを評 価 するには劣 る語 句 と考 えら
れるので除 外する.
次に,抽 出した NFR キーワードと「小 項 目」とのマッピングを行 う. k 番
目 の「小 項 目」に対 応 する j 番 目の NFR キーワードを W kj ( k =1,2,…,m
j =1,2,…n)と記 す.この一 連 の手 作 業 により,「NFR キーワード評 価 シー
ト」が得られる.表 3.5 に「NFR キーワード評 価 シート」の一 部 を示 す.(詳
細 については,付 録 A.を参 照)この表 は,「大 項 目 」,「中項 目 」,「小 項 目 」
および「NFR キーワード」の 4 層 で構 成 され,構 造 化している.一 旦 作 成 さ
れた「NFR キーワード評 価 シート」は新 たな RFP を人 手 により評 価 を行う
場 合 においても役 立 つものとなる.
37
表 3.5 NFR キーワード評 価 表 (抜 粋 )
大項目
中項目
NFRキーワード
小項目
操作容易特性 オペレーション
操作性,操作マニュアル,操作方法,画面遷移
入力ミス,操作説明,容易に操作,操作手順書
オンラインマニュアル,直感的に操作
操作説明書,操作が容易,操作ガイド,操作説明
平均応答,ハードディスク応答性能,秒以下
応答性
ネットワーク転送容量,転送応答性,最小応答
安定的レスポンス,スループット,データ量
最大スループット,平均読み出し遅延
ハードディスク容量,レスポンスタイム
システム
システム性能
ネットワーク使用率,MPU使用率,CPU使用率
運用の評
ディスクIO負荷率,アクセス速度,演算性能
価要件
ソフトウェア性能,ハードウェア性能,同時接続数
システム性能,総合演算性能,以上の性能
負荷監視,CPU負荷,回線負荷,負荷計測
負荷バランス
最大負荷時,負荷分散性能,負荷分散
ロードバランシング,負荷率,負荷低減,ピーク時
負荷低減,ネットワーク負荷,負荷予測
稼働品質
平均稼働率,アクセス量,アクセス頻度
稼働率,%以上,システム稼働率,正常稼働
システム稼働率,安定稼働,正常に稼働
24時間365日稼働,ダウンタイム,稼動安定性
障害検知特性 システム異常検知事故発生,事故発生,停電信号
イベント発生,上限値警告,状態監視
障害通知機能,状態監視機能,異常
障害監視機能,自動運転監視,システム監視
運用監視
障害要因
システム障害1次切り分け,障害発生場所
要件
プラットフォーム障害,障害発生時刻
障害の切り分け,サーバ障害,ネットワーク障害
ハード障害発生,ネットワーク障害,電源障害
機器障害,ソフトウェア障害,ハードウェア障害
手順4:
評 価モ デ ル の 構 築
「NFR キーワード評 価 シート」の各「小 項 目」にマッピングされた NFR キ
ーワード W kj のそれぞれの出 現 頻 度を算 出する.NFR キーワードの出 現
頻 度 は,評 価 する「小 項 目 」ごとに算 出 する.よって,評 価 モデルとなるデ
ータは,評 価対 象 の RFP の行 成分 と関 連 する NFR キーワード W kj の出
現 頻 度 である列 成 分 で構 成 される,「小 項 目 」ごとのマトリクスとなる.これら
のマトリクスが従 属変 数 となり,このマトリクスに手 順 1 で作 成 した手 動 評 価
結 果 を目 的 変 数 である教 師 信 号 として追 加 して,ランダムフォレスト推 定 の
ための評 価 モデルを作 成 する.
38
3.4.3
「 NFR キ ー ワ ー ド 評 価 シ ート 」 の 利 用
一 般 的な RFP 評 価 として,「NFR キーワード評価 シート」を利 用 するために
は,できる限 り「小 項 目 」の記 述 に偏 りがない,さまざまなドメインについての情 報
化 システム RFP 群をサンプルデータとして採 用 することが求 められる.これによ
り,比 較 評 価 対 象 となる RFP の非 機 能 要 件 の記 述 内 容 の明 確 さについて,隔
たりのない定 量 評 価 を行 うことが可 能 となる.また,特 定 のドメインについて
「NFR キーワード評 価 シート」モデルを利 用 する場 合には,対 象とするドメインの
RFP 群 に つ い て , よ り 多 く の サ ン プ ル デ ー タ を 採 用 す る こ と が 求 め ら れ る .
「NFR キーワード評 価 シート」モデルは,「小 項 目」の評 価を行 うことにより,その
上 位 階 層 である中 項 目 及 び大 項 目 も定 量 的 に評 価 することができ,階 層 的 に
RFP の記 述 内 容の明 確 さについて確 認 することができる.記 述 内 容 の明 確 さが
不 足しているケースでは,記 述 内 容を改 良した後に再 び「NFR キーワード評 価
シート」モデルを利 用 することにより,どの程 度 非 機 能 要 件 の記 述 内 容 が改 良 さ
れたかという点 について定 量 的 に把 握 するが可 能 である.さらに,一 度 ,モデル
を構 築 すれば RFP 作 成 と評 価 に多 くのエキスパートを必 要 とする作 業 を軽 減
し,少 ないコストで非 機 能 要 件 の記 述 内 容 の明 確 さについて評 価 を行 うことが
容 易 となる.次 節 では,「NFR キーワード評 価 シート」モデルにもとづく評 価 実
験について述 べる.
3.5
ランダムフォレストを用いた非機能要件評価実験
3.5.1
実験の目的
実 験 では NFR キーワードに基 づく「小 項 目」の自 動 評 価と手 動 評 価を比 較
し,教 師 あり機 械 学 習 による自 動 評 価 モデルの妥 当 性 を評 価 する.そこで,5
段 階 評 価 ,3 段 階 評 価および 2 段 階 評 価 の 3 種 類の段 階 評 価 の評 価 実 験を
行 い,RFP の多 段 階 評 価 として,どの評 価 法 が有 用 であるかについて比 較 検
証 する.
39
3.5.2
評価実験データと実験方法
(1)評価実験データの準備
評価対象とした RFP サンプルデータは,Web 上に公開されている図書情報シ
ステム(11 件),病院情報システム(10 件),大学情報システム(8 件),政府機関情
報システム(14 件),自治体基幹情報システム(10 件),地方自治体業務システム
(14 件)及びその他情報システム(3 件)の計 70 件である.これらの RFP サンプル
データの非機能要件に関する記述部分としてのデータのサイズは,37,281 行の
1,357,655 語のテキストファイルである.
(2)教師データの作成
ランダムフォレスト推定の目的変数として与える教師データは 70 件の RFP サン
プルデータについて,「小項目」ごとに評価者が RFP に記述されている内容を評
価して段階評価を行う.評価ポイントは 3.4.2 の手順1で述べた基準に基づいて,
26 個の「小項目」について 2 段階評価,3 段階評価及び 5 段階評価を行う.
(3) 評価モデル用テキストデータの前処理
評価モデル用のテキストデータをテキストマイニングするツールとして,フリーソフ
トである KH-Coder[18]を採用する.評価モデル用の各テキストデータをファイル
結合し, HTML タグによって区別された「文書」とみなす単位の集合として構成す
る.結合された評価モデル用の RFP 群 R は全体が<h1></h1>によりマーキン
グされ,各 RFP(ri)は<h2></h2>としてマーキングされる.マーキングした評価
モデル用テキストデータの例を以下に示す.
<h1>RFP 非機能要件評価用テキストデータ</h1>
<h2>file:1_A 図書館システム.txt</h2>
RFP 本文……………………………………………………
………………………………………………………………
40
<h2>file:15_B 図書館システム.txt</h2>
RFP 本文……………………………………………………
………………………………………………………………
………………………………………………………………
<h2>file:20_A 病院情報システム.txt</h2>
以下略
テキストマイニングツールでは,RFP 本文内の段落や文を「文書」とみなす単位
として HTML タグ<h1></h1>から<h5></h5>までの5つの構造を使用する
ことができるが,本論文では<h1></h1>及び<h2></h2>のみを使用する.こ
れらの前処理の結果,対象としたサンプル RFP の「小項目」を含む評価モデル用
のテキストデータが得られる.RFP テキストデータの総語数は 670,125 語である.
また,各 RFP についてみると,最大語数,最小語数および平均語数はそれぞれ
79,816 語,1,153 語および 9,573 語である.
(4)キーワードの抽出
最初に,評価モデル用のテキストデータをテキストマイニングツールにより形態
素解析を行い,名詞および複合語を対象として NFR キーワードをマニュアルでフ
ィルタリングする.
次に,フィルタリングした NFR キーワードを「小項目」にマッチングする.さらに,
マッチングした NFR キーワードを指定して,「小項目」ごとに評価モデル用のテキ
ストデータについてテキストマイニングを行い,26 個の「小項目」に関する NFR キ
ーワードの出現頻度を計測する.この計測結果をもとに,70 個のプロジェクトを「行」
とし,各 NFR キーワードの出現回数を「列」とするマトリクスを得る.抽出された名
詞および複合語から選択を経て得られた NFR キーワード総数は,776 語である.
(5)評価実験データの作成
(4)で作成したマトリクスに(2)で作成した 2 段階,3 段階及び 5 段階のマニュ
41
アル評価結果を対応させて実験用データセットを作成する.評価実験を行うデー
タセットは,3.4.2 の手順4で述べた手順により作成された「小項目」ごとの 26 個の
マトリクスに3種類の段階評価である教師データを付加した計 72 個のデータセット
となる.
(6)機械学習の条件作成と実験方法
機械学習プログラムは,「R 言語」のランダムフォレストパッケージを採用する.ラ
ンダムフォレスト用プログラムは,データ全体の 2/3 を学習データとしてモデルが構
築され,構築したモデルを評価するために約 1/3 の残りのデータを取り除いておい
てテストデータとする.また,ランダムフォレストの実行にあたっては,学習データと
予測データを予測繰り返しの都度ランダムに生成し,ランダムフォレストの分類問
題として評価推定を行う.ランダムフォレストの決定木の数はデフォルト値の 500 と
する.
実験データは「小項目」ごとに生成しているので,実験回数は 3 種類(2 段階評
価,3 段階評価,及び 5 段階評価)を評価対象として,26 個の「小項目」について
行い,計 72 回のランダムフォレスト推定を実行する.
3.5.3
実験結果の評価手法
ランダムフォレスト推 定 結 果 とマニュアル評 価 の一 致 率 を検 定 する手 法 として
κ統 計 量 [31]による検 定 を行 う.κ統 計 量 は,ふたりの評 定 者 の判 定 結 果 がど
の程 度 一 致 しているかを示 す指 標 であり,ふたりの評 定 者 の判 定 が偶 然 一 致
する確 率を求 めて,偶 然によらない一 致 率を以 下の計 算 式により計 算する.
κ統 計 量 =(実 際の一 致 率―偶 然 の一 致 率)/(1-偶 然 の一 致 率)
2段 階 評 価 を例 にとると,手 動 評 価 とランダムフォレストの評 価 についてのクロス
表 は以 下 となる.
42
RFによる評価
評価1
評価0
人手による 評価1
評価
評価0
計
m10
m00
m・0
m11
m01
m・1
計
m1・
m0・
n
ここで,m 11 およびm 00 は手 動 評 価 とランダムフォレストの評 価 が一 致 した RFP
の数 であり,m 01 およびm 10 は不 一 致 となった RFP の数 である.実 際の一 致 率
Pe は,Po=(m 11 +m 00 )/nで計 算 され,偶 然の一 致 率 Pe は,Pe=((m 11 +
m 10 )(m 11 +m 01 )+(m 01 + m 00 )(m 10 +m 00 ))/n 2 で計 算 される.よって,
κ統 計 量 は下記 の式 で求められる.
κ統 計 量 =(Po―Pe)/(1-Pe)
また,κ統 計 量 は,ふたりの評 者 の判 定 結 果 による不 一 致 の 程 度 が多 段 階
評 価 における評 価 結 果 で異 なる(例 えば,評 定 者 A が 1 と評 定 し評 定 者 B
が 2 と評 定 した場 合 と,評 定 者 A が 1 と評 定 し評 定 者 B が 3 と評 定 し
た場 合 )場 合 に,より不 一 致 であると考 える結 果 に対 して重 みを大 きくする「重
み付 けκ統 計 量」による検 定 がある.
本 実 験 では,評 価 者 による評 価 結 果 とランダムフォレスト推 定 評 価 結 果 により
不 一 致 がある場 合 には重 みを付 けることが適 当 と考 え,「重 み付 けκ統 計 量 」
(以 後 単 にκ統 計 量 とする)により検 定 する.また,κ統 計 量 による評 価 を行 っ
た結 果 から,3 種 類 の段 階 評 価 の中 でどの段 階 評 価 が最 も有 効 であるかにつ
いて考 察 する.以 下 はκ統 計 量 による判 定 基 準である.
κ統 計 量 による判 定 基 準
0 ~ 0.40
:低 い一 致
0.41 ~ 0.60 :中 等 度の一 致
0.61 ~ 0.80 :かなりの一 致
0.81 ~
:高い一 致
43
さらに,「3 段 階 評 価 」については,ランダムフォレストによるテストデータの評 価
推 定 結 果 が評 価 者 の評 価 と一 致 しているかどうかを下 記 の一 致 判 定 基 準 につ
いても考 察する.
一 致 率=一 致 ケース/全 テストデータケース
±1 差 一 致 率=((一 致 ケース)+(±1 差 一 致 ケース))/全 テストデータケース
ここで,
一 致 ケース:データセットをランダムサンプリングして 1/3 をテストデータとした場
合 にランダムフォレストによる予 測 と教 師 データが一 致 したケース数 とする.
全 テストデータケース:70 件のデータセットをランダムサンプリングした 1/3 のテ
ストデータ数 とする.
±1 差 一 致ケース:データセットをランダムサンプリングして 1/3 をテストデータと
した場 合 にランダムフォレストによる予 測 と教 師 データが一 致 した場 合 とその評
価 の差 が±1 差であったケースの合 計 数 とする.
3.5.4
実 験 結 果 に 基 づ く 一 致 の 検定 と 考 察
3 段 階 評 価について算 出した「小 項目 」のκ統 計 量 による検 定 と一 致 率の結
果 を,図 3.7 にレーダチャートで示 す.図 3.7 によると,κ統計 量 は一 致 率 と比
較 して各 「小 項 目 」の評 価 に差 が大 きく表 れることが分 かる.そこで,より階 層 の
高 い「中 項 目 」の評 価 をκ統 計 量 により比 較 して,平 均 化 されたκ統 計 量 をもと
に 3 種 類の段 階 評 価 の内 どの段 階 評 価 の一 致 率が高 いかについて考 察 する.
「中 項 目 」の一 致 率 は,各 「中 項 目 」に属 するすべての「小 項 目 」について算 出
したκ統 計 量の平 均 値 としている.「中 項 目 」についての 3 種 類 の段 階 評 価 の
κ統 計 量を表 3.6 示 す.表 3.6 よると,2 段 階 評 価のκ統計 量 0.3591 は,こ
れ以 外 の多 段 階 評 価 と比 較 して,「冗 長 化 特 性 」と「セキュリティ対 策 特 性 」は
比 較 的 高 い一 致 と言 えるが,高 い一 致 (稼 働 品 質 特 性 ,データバックアップ特
性 ,冗 長 化 特 性 など)と低 い一 致 (障 害 検 知 ,障 害 予 防 ,障 害 復 旧 など)の差
が大 きく,安 定 していないことが認 められる.5 段 階 評 価 も同 様 に高 い一 致 と低
44
い一 致 率 の差 が大 きく,安 定 しているとは言 えない. 3 段 階 評 価 の「中 項 目 」
全 体 のκ統 計 量は 0.4063 であり,2 段階 評 価と 5 段 階 評 価 と比 較して個 々の
「中 項 目 」についての一 致 差 も少 なく,全 体 のκ統 計 量 として最 も高 い数 値 を
示している.さらに,3 段 階 評 価の個 々の「中 項 目 」で見 ると,最も高 い一 致を示
した「システム監 視 」(κ統 計 量 が 0.6487)と最も低 い一 致を示した「障 害 復 旧 」
(κ統 計 量が 0.2026)があり,それぞれの「中 項 目」で大 きい差 があることが認 め
られる.これは,κ統 計 量 の計 算 において一 致 の隔 たり(クロス表 の対 角 部 分 の
隔 たり)があれば一 致 が低 くなり,κ統 計 量 が小 さくなることが要 因 と考 えられる.
そこで,例 として「システム監 視 」の小 項 目 である「運 用 管 理 」および「システム管
理 」と「障 害 復 旧 」の「小 項 目 」である「リカバリ処 理 」および「パッチ処 理 」のクロ
ス表 とκ統 計量 を図 3.8 に示 す.図 3.8 によるとクロス表 で一 致 の隔たりがある
「リカバリ処 理」および「パッチ処 理 」のκ統 計 量 が低 いことが認 められる.
よって,「小 項 目 」の個 々の一 致 については,実 験 結 果 によるκ統 計 量 に差
はあるが,3 種 類の段 階 評 価の内 ,3 段 階 評 価が最も高 い一 致 を示すことが分
かった.次 項 3.5.5 では,ランダムフォレストによる 3 段 階評 価 と 5 段 階 評 価に
ついての自 動 評 価 と手 動 評 価 の結 果を比 較 検 証する.
κ統計量
一致率
オペレーション
冗長化
RAID構成
停止処理
障害対策
障害管理
リカバリ処理
稼働品質
応答性
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
負荷バランス
システム性能
システム管理
運用管理
パッチ処理
障害要因
バックアップ管理
アクセス権限
バックアップシステム
ウイルス対策
不正アクセス
セキュリティ管理レベル
認証機能
情報漏洩対策
セキュリティ対応
パスワード管理
暗号処理
図 3.7 「小 項 目」の3段 階 評 価 の比 較
45
リカバリ処理
κ=
RFによる評価
評価2 評価1 評価0 計
0.2931
手動評価 評価2
0
0
0
評価1
2
4
0
評価0
1
8
8
計
3
12
8
運用管理
κ=
RFによる評価
0.7333
評価2 評価1 評価0 計
手動評価 評価2
1
1
0
評価1
5
11
0
評価0
0
0
6
計
6
12
6
0
6
17
23
パッチ処理
κ=
RFによる評価
0.2780
評価2 評価1 評価0 計
手動評価 評価2
0
0
0
評価1
2
0
0
評価0
1
4
16
計
16
1
6
0
2
21
23
2
16
6
24
システム管理
κ=
RFによる評価
0.6308
評価2 評価1 評価0 計
手動評価 評価2
0
0
0
評価1
4
11
0
評価0
0
2
7
計
4
13
7
0
15
9
24
図3.8 クロス表とκ統計量(一部)
表 3.6 段 階 評 価 方 法 別の κ 統 計 量
非機能要件 中項目
オペレーション
稼働品質
障害検知
システム監視
セキュリティ対策
冗長化
データバックアップ
障害予防
障害復旧
平均
3.5.5
2段階評価 3段階評価
κ統計量
κ統計量
0.2727273
0.352601
0.538645
0.632996
0.225141
0.416683
0.343091
0.648718
0.472326
0.414079
0.628205
0.486667
0.51875
0.268439
0
0.234274
0.233333
0.20265
0.3591
0.4063
5段階評価
κ統計量
0.2814371
0.5681375
0.18433735
0.467636
0.294958
0.4251353
0.3625605
0.10996563
0.07539316
0.3077
手動評価と自動評価の比較
ランダムフォレストによる 1/3 のテストデータの推 定 評 価 結 果 について,手 動
評 価 との一 致 率 および±1 差 一 致 率を計 算 (3.5.3 項 参 照 )した 3 段 階 評 価 の
結 果 を表 3.7(a)に示 す.また,5 段 階 評 価 については表 3.7(b)に示 す.
3 段 階 評 価による 26 個の「小 項 目」についての一 致 率 及び±1 差の一 致 率
の平 均 値 は,それぞれ,69.8%及 び 97.2%で高い一 致 であった.また,一 致 率
が 70%を超 えたものは「小 項 目」26 個 の内 の 13 個であり,全 体の約 1/2 であ
った.更に,±1 差 一 致 率 では,25 個 が 90%を超 えている.このことは,評 価 が
46
全 く異なる評 価 点の差 が“2”である RFP が少 ないことによる.ただし,すべての
RFP について「小 項 目」26 個の評 価 点が“3”と評 価 された高 評 価 の RFP は,
手 動 評 価 全 体の 9.8%とその比率 が少 ない.一 方 ,κ統 計 量の平 均 は 0.43 で
あり,ランダムフォレストによる推 定 評 価 と評 価 者 による評 価 との正 答 率 は約
43%であった.「小 特 性」ごとにκ統 計 量の一 致 基 準で見 ると,「小 項 目」26 個
の内 ,「高い一 致 」が 2 個(「応 答 性」および「暗 号 処 理 」),「かなりの一 致 」が 4
個 (「稼 働 品 質 」,「運 用 管 理 」,「システム管 理 」および「RAID 構 成 」)および
「中 程 度 の一 致」が 8 個 であり,「中 程 度の一 致」以 上 と判 定 される「小 特 性 」の
比 率 は 54%である.これは,RFP サンプルデータの非 機 能 要 件 の記 述 内 容 が,
明 確 に書 かれているものが少 なく,評 価 点 が“1”および“2”のデータが多 く,ク
ロス表 の対 角 部 分 の隔 たりが大 きいことが要 因 のひとつと考 えられる.この結 果 ,
κ統 計 量 によってランダムフォレストの推 定 結 果 と手 動 評 価 との一 致 を評 価 す
ると低 い一 致 となることが考 えられる.よって,「小 項 目 」の記 述 内 容 の明 確 さが
高 いプロジェクトの RFP をサンプルデータとして収 集 し,評 価 点が“3”の高 い評
価 の RFP サンプルを含 めた学 習データによる自 動 評 価を行 うことによりκ統 計
量 による一 致の評 価も高 くなることが期 待 される.
一 方 ,5 段 階 評価 の一 致 率は 61.96%であり,3 段 階 評 価の一 致 率である
69.84%との差 は 7.88%となり,一 致 率 が低 いと言 える.また,±1 差 一 致 率の
場 合 は 12.11%となり,その差はさらに大 きいことが認 められる.3 段 階 評 価の±
1 差 一 致 率が 5 段 階 評 価より高 くなっている要 因 として,多 段 階 評 価 における
3 段 階 評 価 の中 心 性 向が高 いことが考えられる.さらに,5 段 階 評 価では,ラン
ダムフォレストの分 類 精 度(3 段 階 評 価の平 均 OOB 誤 差は 28.91%であり 5 段
階 評 価の平 均 OOB 誤 差 は 38.71%)が低 いために一 致 率が低 くなっているも
のと考 えられる.
次 に,3 段 階評 価 の場 合のランダムフォレストによる「自 動 評 価 」と「手 動 評 価 」
平 均 値ついて,誤 差 および有 意 水準 5%でt検 定を行った結 果 を表 3.8 に示
す.表 3.8 によると「小 項 目」は 26 個の内 15 個に有 意 差があり,評 価が一 致
していると判 定 される「小 項 目」は全体 の約 42%の 11 個 であった.これらの結
果 から,ランダムフォレストによる「自 動 評 価 」においては,3 段 階 評 価が 5 段階
47
評 価より「手 動 評 価」と一 致していると言える.
さらに,各 「小 項 目 」のランダムフォレストによる 1/3 のテストデータについての
「 自 動 評 価 」 の 平 均 値 と 対 応 す る 「 手 動 評 価 」 の 平 均 値 を 図 3.9(a) お よ び
3.9(b)のレーダチャートに示 す.段 階 評 価 による評 価 結 果 をわかりやすくするた
めに,評 価 点を“1”,“2”,および“3”の 3 段 階 と“1”,“2”,“3”,“4”および“5”
の 5 段 階 評 価としている.図 3.9 によると,「応 答 性 」,「運 用 管 理」,「アクセス
権 限 」及 び「バックアップ管 理 」については,ランダムフォレストモデル推 定 評 価
と評 価 者 による評 価 がほぼ一 致 しているが,その他 の「小 項 目 」ではいずれも評
価 者 による評 価が高 い結 果となっていることが認 められる.さらに,5 段 階 評 価 と
3 段 階 評 価 との比 較 においては,5 段 階 評 価は「自 動 評価 」と「手 動 評 価」の評
価 差 がより大きいことが認 められる.
表 3.7(a) ランダムフォレストの評 価 推 定 結 果(3 段 階 評 価)
小項目
オペレーション
稼働品質
応答性
負荷バランス
システム性能
システム管理
運用管理
障害要因
アクセス権限
ウイルス対策
セキュリティ管理レベル
セキュリティ対応
パスワード管理
暗号処理
情報漏洩対策
認証機能
不正アクセス
バックアップシステム
バックアップ管理
パッチ処理
リカバリ処理
障害管理
障害対策
停止処理
RAID構成
冗長化
全体
一致数
12
20
21
20
14
18
19
16
13
17
15
17
18
22
19
16
17
15
12
18
13
18
15
16
18
16
435
±1差 不一致
一致数
数
11
1
2
2
3
0
3
1
10
0
6
0
5
0
7
1
11
0
7
0
7
2
7
0
3
3
2
0
5
0
8
0
7
0
9
0
11
1
5
1
10
1
5
0
9
0
8
0
6
0
8
0
175
13
48
一致率
±1差 一
致率
κ統計量
50.00%
83.33%
87.50%
83.33%
58.33%
75.00%
79.17%
66.67%
54.17%
70.83%
62.50%
70.83%
75.00%
91.67%
79.17%
66.67%
70.83%
62.50%
50.00%
75.00%
54.17%
78.26%
62.50%
66.67%
75.00%
66.67%
95.83%
91.67%
100.00%
95.83%
100.00%
100.00%
100.00%
95.83%
100.00%
100.00%
91.67%
100.00%
87.50%
100.00%
100.00%
100.00%
100.00%
100.00%
95.83%
95.83%
95.83%
100.00%
100.00%
100.00%
100.00%
100.00%
0.353
0.619
0.909
0.505
0.381
0.631
0.733
0.415
0.120
0.556
0.204
0.219
0.163
0.848
0.500
0.467
0.495
0.455
0.120
0.373
0.307
0.000
0.301
0.392
0.640
0.467
69.84%
97.92%
0.430
表 3.7(b) ランダムフォレストの評 価 推 定 結 果(5 段 階 評 価)
小項目
オペレーション
稼働品質
応答性
負荷バランス
システム性能
システム管理
運用管理
障害要因
アクセス権限
ウイルス対策
セキュリティ管理レベル
セキュリティ対応
パスワード管理
暗号処理
情報漏洩対策
認証機能
不正アクセス
バックアップシステム
パッチ処理
リカバリ処理
障害管理
障害対策
停止処理
RAID構成
冗長化
システム異常検知 全体
一致数
13
19
23
21
12
17
14
10
9
14
11
10
14
20
17
15
16
9
17
10
22
13
14
16
14
14
384
±1差
一致数
4
3
0
0
7
4
5
9
10
8
8
11
4
2
7
5
6
14
3
8
0
9
7
6
6
2
148
49
不一致数 OOB誤差 一致率
6
1
1
3
5
3
4
5
5
1
5
3
6
2
0
4
2
1
4
6
2
2
3
2
4
8
88
58.70%
34.78%
0.00%
19.57%
47.83%
32.61%
65.22%
52.17%
60.87%
32.61%
50.00%
50.00%
47.83%
4.35%
15.22%
50.00%
34.78%
52.17%
39.13%
41.30%
17.39%
45.65%
34.78%
32.61%
39.13%
47.83%
38.71%
56.52%
82.61%
95.83%
87.50%
50.00%
70.83%
60.87%
41.67%
37.50%
60.87%
45.83%
41.67%
58.33%
83.33%
70.83%
62.50%
66.67%
37.50%
70.83%
41.67%
91.67%
54.17%
58.33%
66.67%
58.33%
58.33%
61.96%
±1差
一致率
73.91%
95.65%
95.83%
87.50%
79.17%
87.50%
82.61%
79.17%
79.17%
95.65%
79.17%
87.50%
75.00%
91.67%
100.00%
83.33%
91.67%
95.83%
83.33%
75.00%
91.67%
91.67%
87.50%
91.67%
83.33%
66.67%
85.81%
表 3.8
自 動 評 価 と手 動評 価 の誤 差
小項目
RF評価得点
オペレーション
応答性
システム性能
負荷バランス
稼働品質
障害要因
運用管理
システム管理
不正アクセス
アクセス権限
セキュリティ管理レベル
セキュリティ対応
認証機能
パスワード管理
ウイルス対策
情報漏洩対策
暗号処理
冗長化
RAID構成
バックアップ管理
バックアップシステム
障害対策
障害管理
停止処理
リカバリ処理
パッチ処理
平均
手動評価
得点
1.33
1.88
1.21
1.17
1.17
1.42
1.88
1.63
1.38
2.04
1.17
1.04
1.50
1.04
1.38
1.17
1.38
1.38
1.33
2.00
1.50
1.38
1.00
1.17
1.25
1.13
1.38
1.71
1.92
1.63
1.29
1.42
1.71
2.00
1.88
1.58
1.92
1.63
1.92
1.75
1.42
1.67
1.38
1.46
1.54
1.58
1.96
1.79
1.42
1.21
1.50
1.75
1.42
1.63
ランダムフォレスト評価点
誤差(手動
評価ーRF評
価)
0.38
0.04
0.42
0.13
0.25
0.29
0.13
0.25
0.21
0.13
0.46
0.88
0.25
0.38
0.29
0.21
0.08
0.17
0.25
0.04
0.29
0.04
0.21
0.33
0.50
0.29
0.26
P(T<=t)
両側
0.017
0.575
0.000
0.266
0.056
0.056
0.185
0.011
0.057
0.377
0.002
0.000
0.031
0.017
0.005
0.022
0.162
0.162
0.011
0.802
0.016
0.747
0.022
0.003
0.000
0.016
手動評価点
オペレーション
パッチ処理 2.50
応答性
リカバリ処理
システム性能
停止処理
障害管理
2.00
負荷バランス
稼働品質
1.50
障害対策
システム異常検知
1.00
0.50
バックアップシステム
障害要因
0.00
バックアップ管理
運用管理
RAID構成
システム管理
冗長化
不正アクセス
暗号処理
アクセス権限
情報漏洩対策
セキュリティ管理レベル
ウイルス対策
パスワード管理
図3.9(a)
セキュリティ対応
認証機能指標
自動評価と手動評価の評価得点レーダチャート(3段階評価)
50
ランダムフォレスト評価点
手動評価得点
オペレーション
パッチ処理指標 3.00
応答性
リカバリ処理
システム性能
停止処理
2.50
負荷バランス
2.00
障害管理
稼働品質
1.50
障害対策
システム異常検知
1.00
バックアップシステム
障害要因
0.50
0.00
バックアップ管理
運用管理
RAID構成
システム管理
冗長化
不正アクセス
暗号処理
アクセス権限
情報漏洩対策
セキュリティ管理レベル
ウイルス対策
パスワード管理
図3.9(b)
図 3.9
3.6
セキュリティ対応
認証機能
自動評価と手動評価の評価得点レーダチャート(5段階評価)
自 動 評 価 と手 動評 価 の評 価 得 点レーダチャート
まとめ
本 章 では,NFR キーワードを RFP からテキストマイニングにより抽 出 し,「非
機 能 要 件 評 価 シート」に追 加 した「小 項 目 」とマッピングすることにより,「非 機 能
要 件 評 価 シート」の改 良 を行 い,「NFR キーワード評 価 シート」を作 成 した.次
に,RFP の「小 項 目」の記 述 内 容 の明 確 さを NFR キーワードにより自 動 評 価 す
ることを目 的 として,「NFR キーワード評 価 シート」の重 要な「小 項 目」を教 師 あり
機 械 学 習 の手 法 であるランダムフォレストによる評 価 推 定 モデルを構 築 した.ラ
ンダムフォレストによる評 価 結 果については,2 段 階 ,3 段 階 及 び 5 段 階の多 段
階 評 価 の中 でどの評 価 手 法 が有 効 であるかについて「小 項 目 」ごとに評 価 を行
い,「中 項 目 」を対 象 に有 効 性 の評 価 を行 った.評 価 結 果 の検 証 については,
ランダムフォレストによる自 動 推 定 評 価 と評 価 者 による手 動 評 価 を一 致 率 の計
算 と統 計 的手 法 であるκ統 計 量 の計 算により一 致の考 察 を行 った.
実 験の結 果 ,3 段 階 評 価が他 の段階 評 価 と比 較して高 い一 致を示した.
3 段 階 評 価 について,ランダムフォレストによる推 定 結 果 と評 価 者 による評 価 が
51
一 致 しているかどうかについて計 算 した一 致 率 は,69.8%であった.ただし,一
致 率 が 70%を超えたものは「小 項 目 」26 個 の内 の 13 個 であり,「小 項 目 」につ
いての評 価が高 い評 価 対 象 とした RFP が少 ないという問 題があった.一 方 ,κ
統 計 量 の判 定 基 準 では「中 程 度 の一 致 」以 上 が 54%であった.これらの実 験
結 果 は,NFR キーワードによる RFP の非 機 能 要 件 の記 述 内 容 の明 確 さを評
価 することは可 能 であり有 用 であることを示 している.ただし,「小 項 目 」の評 価
が高 い RFP をさらに追 加して,評 価対 象 の RFP の評価 結 果 の隔たりを減少 さ
せることが今 後 の課 題 である.
次 に,自 動 評 価 モデルの誤 差 について評 価 を行 った結 果 ,自 動 評 価 と手 動
評 価が一 致 すると判 断 される「小 項 目」は 26 個 の内 の 11 個 であり,全 体 の約
42%であった.これらの結 果から,「小 項目 」を NFR キーワードで自 動 評 価する
モデルは有 効であると言えるが,NFR キーワードの選 定 や数 を変 えてモデルの
チューニングを行 い,ランダムフォレストの精 度 を高 めることが今 後 の課 題 である.
本 章で提 案 した自 動 評 価モデルは,NFR キーワードによる RFP の非 機 能
要 件 を評 価することの可 能 性を示すものであり,RFP に記 述 された非 機 能 要 件
の記 述 が明 確 であるかどうかを自 動 評 価 した結 果 を利 用 することにより,ユーザ
とベンダの技 術 討 論 を通 じて委 託 ソフトウェア開 発 プロセスの上 流 工 程 で RFP
の品 質 向 上 に貢 献 できる有 効 なモデルであると考 える.
52
第4章
4.1
機械学習によらない非機能要件の自動評価
概要
第 3 章 では,「NFR キーワード評 価 シート」を作 成し,NFR キーワードによる
「小 項 目 」の自 動 評 価 モデルを提 案 [43]し,RFP に記 述 された非 機 能 要 件 の
明 確 さの評 価 について有 効 性 を確 認 した.しかし,教 師 あり機 械 学 習 による自
動 評 価モデルでは,学 習データの隔 たりおよび RFP サンプル数 が多 い場 合 の
教 師データ作 成 にかかる工 数について課 題 があった.
そこで,本 章ではウェッブから収 集 した 161 件 の RFP サンプルデータ群 より
抽 出 した NFR キーワードを「小 項 目」に関 連 付 け,RFP の隔たりを減 少 させた
評 価 データを対 象とした.(評 価 対 象 とした「小 項 目」と関 連づけした NFR キー
ワードについては付 録 B を参照 のこと) そして,RFP サンプル数を多 くした場
合 でも,RFP に記 述 された「小 項 目 」を教 師 なしで評 価 する機 械 学 習 によらな
い 3 つの重み付 け手 法について提 案 し,比 較 評 価 する.そこで,3 つの手 法 の
比 較 を行うために,161 件 の RFP について手 動 評 価を行い,手 動 評 価 との比
較 により有 効 な手 法 を検 証 する.また,追 加 実 験 として教 師 なし機 械 学 習 の一
つであるクラスタリングによる評 価 実 験 を行 う.3つの手 法 は,シンプル TF-IDF
法 によるもの,TF-IDF 法 の考 えを拡 張 したものおよびトークン比 の考 え方 を応
用 したキーワード比 によるものである.それぞれの手 法 では,NFR キーワードの
出 現 頻 度による重みを計 算した「NFR キーワード指 数」により評 価 スコアを算 出
して評 価する.以 下 , 4.2 節で関 連 研 究 について述べる.4.3 節 では提 案 手 法
の詳 細を述 べ,4.4 節 では実 験 結 果による3つの手 法 の比 較 評 価 を行 う.さらに,
4.5 節では拡 張 TF-IDF とキーワード比 を用 いた RFP 評 価 のクラスタリングに
ついての追 加 実 験について述べ,4.6 節 でまとめを述 べる.
4.2
関連研究
機 械 学 習 によらないで,自 然 言 語 で記 述 された非 機 能 要 求 内 容 の品 質を評
53
価 する先 行 研 究 は,(1)自 然 言 語 で記 述 された要 求 の品 質 を構 文 解 析 あるい
は言 語 としての欠 陥 評 価をするモデルに関 する研 究 [34] [35],(2)オントロジを
用 いた要 求 抽 出 と分 析 [36] [41] [44],(3)コーパスに基 づく要 求 分 析 [37],
(4)パターンモデルにもとづく分 類 による要 求 分 析 モデルの研 究 [26] [28]など
がある.しかし,(1)はソフトウェア開 発 段 階 でソフトウェア要 求 仕 様 書 の評 価 を
エンジニアが行うためのツールであり,本 研 究 が対 象 としている超 上 流 工 程 での
ユーザ要 求 の評 価 モデルとしては適 当 ではない.(2)はオントロジを用 いて欠
落 や矛 盾 のないソフトウェア仕 様 書 を作 成 することを目 的 としており,要 求 品 質
を評 価 してソフトウェア設 計 に反 映 させることに有 効 であるが,評 価 に時 間 を要
する.(3)は要 求 文 書 を分 析 することを目 的 としており,要 求 品 質 の定 量 的 評
価 に言 及していない.(4)は抽 出 語 句を NFR 分 類 器 により分 類し,NFR に関
連 付 けを自 動 的に行うが,プロジェクトの定 量 評 価 は行 っていない.
また,IPA SEC では,「ドキュメント品 質 評 価 指 標」として,NFR の記 述 十分
性を要 求 仕 様 書 内の各パートのページ数 と要 求 仕 様 書ページ数 の総 和 の比 を
用 いた“非 機 能 要 件 記 述バランス”を提 案 している[45].
ドキュメント品 質 評 価 指 標:要 求 仕 様 書バランス
=(要 求 仕 様 書 内の各パートのページ数)/(要 求 仕 様 書 ページ数の総 和 )
これを NFR キーワードで置き換 えて表 現 すると
非 機 能 要 件 記 述十 分 性 評 価 指 標:NFR キーワード記 述 バランス
=(各 RFP の NFR キーワード出 現 回 数の合 計)/(RFP テキスト全 体 の NFR
キーワード出 現 回 数)
となるが,個 別 の NFR 記 述 内 容 について評 価することはできない.
また,「非 機 能 要 求 グレード評 価 」による非 機 能 要 求 グレード抽 出 項 目 は筆 者
らによる先 行 研 究 の「非 機 能 要 件 評 価 シート」に該 当 し,非 機 能 要 件 を決 定 す
るプロセスを支 援 するが,非 機 能 要 件 の記 述 内 容 について具 体 的 なレベルで
の定 量 評 価は行っていない.また,RFP から非 機 能 要 求グレードを抽 出するプ
ロセスに多 くの時 間をかける必 要がある.
本 章 で提 案 する評 価 モデルは,「小 項 目 」ごとに自 動 的 に定 量 的 評 価 するこ
とが可 能 であり,より具 体 的 な NFR について記 述 内 容 をさらに明 確 にするべき
54
かどうかを定 量 的に把 握することが可 能 である点 において優 位 性 がある.
4 .3
提案手法
本 節 では,161 件 の RFP から抽 出 した NFR キーワードの出 現 頻 度を用い
て算 出 する 3 つの提 案 手 法の NFR キーワードの重 み付 けを示 し,NFR 評 価
スコアの算 出 方 法について述 べる.
4.3.1
NFR キ ー ワ ー ド の 抽 出
収 集 した 161 件 の RFP テキストを結 合 し,各 RFP を文 書 単 位 としたテキス
トデータを対 象 として,テキストマイニングにより NFR キーワードを抽 出 する.抽
出 した NFR キーワードは,「小 項 目」の内 ,第 3 章 で述 べたランダムフォレスト
の予 測 結 果 とマニュアル評 価 の結 果 が「低 い一 致 」であった「負 荷 バランス」,
「アクセス管 理 」,「セキュリティ管 理 」,「障 害 対 策 」および「リカバリ」と「高 い一 致 」
を示した「応 答 性」について見 直 しを行 い,マッピングした.NFR キーワードの追
加 に当 たっては,出 現 頻 度 が少 ない場 合 でも,長 くて難 しい複 合 語 であれば意
味 の重 要 性 が高 いとする「語 彙 の意 味 重 要 性 」(たとえば,「ロードバランシング
構 成 」,「情 報 セキュリティマネジメントシステム」,「情 報 システムダウン対 策 マニ
ュア ル 」な ど )の 考 え に 基 づ い て ,NFR に 関 する 複 合 語 を 追 加 し た . 次 項 で
NFR キーワードへの重み付 け手 法 である「NFR キーワード指 数 」について述 べ
る.
4.3.2
NFR キ ー ワ ー ド の 重 み
「小 項 目 」にマッピングされた多種 の NFR キーワードについての出 現 頻 度が
高 い RFP は,「小 項 目」の記 述 内 容の明 確 さについて評 価が高 いことが推 定さ
れる.しかし,特 定の NFR キーワードが同 一の RFP に集 中して出 現する場 合
は,その出 現 の偏 りが大 きく,重 要 な NFR キーワードとは限 らない.また,出 現
頻 度が少 ない NFR キーワードであっても,長 く難しい複 合 語としての専 門 用 語
55
であれば重 要 性 があり,「小 項 目 」の記 述 内 容 の明 確 さが高 いことが考 えられる.
そこで,対 象 とした RFP の中 で,個 々の NFR キーワードがどの程 度 重 要であ
るかを示 す指 数 である「NFR キーワード指 数 」を「小 項 目 」にマッピングされた
NFR キーワードの出 現 頻 度から(算 出 方 法 は 4.3.3 項を参 照)求 めることが必
要 となる.
一 般 的 に,文 章 における語 彙 の重 要 度 を重 みとして数 量 的 に示 す方 法 とし
て,TF-IDF 法 が広 く用 いられている.TF-IDF 法は経 験 的な方 法 であり,さま
ざまな拡 張 が提 案 されている.TF-IDF 法 は文 章 から特 徴 的 なキーワードを抽
出 し,文 章 に記 述 されている内 容 を定 量 的 に特 徴 づける手 法 として適 用 される
ケースが多 い.しかし,TF-IDF 法の問 題 点 として必ずしも文 章を特 徴づける語
句 が高 いスコアになるとは限らない.
次 項では,3 つの手 法 である単 純 TF-IDF,拡 張 TF-IDF およびキーワード
比の定 義 と,これらにより算 出 した重 みとしての「NFR キーワード指 数 」について
述 べる.
4.3.3
単 純 及 び 拡 張 TF-IDF と キ ー ワ ー ド 比
最も一般的な TF-IDF 法は文書d内の単語wに以下の重みを与えると定義されて
いる[32].
TF-IDF_Weight(w,d)=TermFreq(w,d)*log(N/DocFreq(w))
こ こ で ,TermFreq(w,d) は 文 書 d 内 で の 単 語 w の 出 現 頻 度 , N は 全 文 書 数 ,
DocFreq(w)は単語wを含む文書数である.
TF は文書 d における語wの頻度であり,頻度が高いほど大きな値をとる.一方,
IDF は語wが多くの文書に表れるほど小さくなり,特定の文書に表れるほど大きくな
る.
しかし,シンプルな TF-IDF 手法では NFR キーワードの出現頻度が重みとして
極めて大きく影響する.提案手法は,複数の文章の集合である RFP に対して「小項
目」による個別評価を目的としており,同一の NFR キーワードが特定の RFP に集
中して出現する場合の極端な重み付けによる評価差を避ける必要がある.また,多
56
数の RFP に出現する NFR キーワードは重要性が高いと考えられる.そこで,2 番
目の手法として各「小項目」にマッピングした NFR キーワードの極端な重み付をなく
すための手法としてシンプルな TF-IDF を拡張した手法を提案している.
TF-IDF の拡張については様々な方法が提案されているが,「Log および文書中
のタームにより正規化する」方法を採用し,下記の式により拡張 TF-IDF である
Ex_TF-IDF_ Weight(wsub,drfp)を算出する.対数の底は2としている.この手法によ
り,出現頻度が極めて高い NFR キーワードの評価を出現頻度が極めて低い NFR
キーワードに対してその差を平準化することができる.
Ex_TF-IDF_Weight(wsub,drfp)=Ex_TermFreq(wsub,drfp)*Ex_IDF(wrfp)
ここで,
Ex_TermFreq(𝑤𝑤𝑠𝑠𝑠𝑠𝑠𝑠 , 𝑑𝑑𝑟𝑟𝑟𝑟𝑟𝑟 )=
1+ log 2 𝑤𝑤𝑠𝑠𝑠𝑠𝑠𝑠
log 2 𝑤𝑤𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠
Ex_IDF(𝑤𝑤𝑟𝑟𝑟𝑟𝑟𝑟 )= log 2 ( 𝑁𝑁𝑟𝑟𝑟𝑟𝑟𝑟 /𝑤𝑤𝑟𝑟𝑟𝑟𝑟𝑟 )
ここで,
Ex_TermFreq : RFP テキスト全体における NFR キーワード出現頻度
wsub:RFP テキスト全体における各「小項目」に属する NFR キーワードの出現頻度
wsubn:各「小項目」に属する NFR キーワード種類の総数
Ex_IDF :RFP テキスト全体における NFR キーワードが出現する RFP 数
Nrfp :評価対象とした RFP の総数(定数:本実験では 161)
wrfp :各「小項目」に属する NFR キーワードが出現した RFP の総数
3 番目の手法としてトークン比の考え方に基づいた語彙の豊富さによる重み付け
について述べる.ここで,トークン比[39]とは語彙の豊富さを示す最も簡単な指標で
あり,延べ語数 N に対する異なり語数 V の比率(Type-Token Ratio) TTR =
V/N で示される.本手法のキーワード比は以下の式で算出する.
TKR=Vk/Nsub
ここで,
57
TKR:キーワード比(Type-KeyWord Ratio)
Vk:RFP 中に出現する「小項目」に関する NFR キーワードの種類数
Nsub:「小項目」に属する NFR キーワードの総数
161 件の RFP より抽出し,「応答性」にマッピングされた NFR キーワードの出現
頻度により算出した拡張 TF-IDF,単純 TF-DF およびキーワード比の 3 つの手法
による重みと NFR キーワード出現頻度の一部を表 4.1 に示す.表 4.1 によると,単
純 TF-IDF やキーワード比については,たとえば「スループット」という NFR キーワ
ードの場合のように出現頻度が高い場合には,NFR キーワードの出現頻度の影響
が大きく,重みは極めて大きな値をとるが,拡張 TF-IDF は相対的に極めて低い値
に抑えられることがわかる.このことは,拡張 TF-IDF の場合には,多くの RFP に頻
繁に出現する NFR キーワードの極端な重み付けによる評価点を低く抑えることがわ
かる. 一方,単純 TF-IDF やキーワード比は多くの RFP に頻繁に出現する NFR
キーワードの極端な重み付けによる評価差が大きくなる.また,キーワード比につい
ては特定の RFP に集中して出現する NFR キーワードの重み付けについては,そ
の他の手法と比較して低く抑えられている.
図 4.1 に単純 TF-IDF と NFR キーワード出現頻度を出現数の多い NFR キー
ワード順に並べた場合の関係を示し,図 4.2 に拡張 TF-IDF と NFR キーワードが
出現する RFP 数を出現 RFP 数が多い NFR キーワード順に並べた場合の関係を
示す.図 4.1 によると,NFR キーワードの出現頻度が高い場合において単純 TFIDF は極めて変動が大きいことが認められ,拡張 TF-IDF は NFR キーワードが出
現する RFP 数が中位の領域において相対的に高い値となり,NFR キーワード出現
数に大きく影響されないことを示している.このことは,拡張 TF-IDF による「NFR キ
ーワード指数」が,特定 RFP に集中して出現する一般性に乏しい NFR キーワード
が極端に高い評価ポイントとなることを低減するフィルタとして働き,比較的多くの
RFP に出現するキーワードの重要性を上げる働きを持っていることがわかる. 次項
では,「NFR キーワード指数」による RFP の評価スコア算出の方法について述べる.
58
表4.1
3つの手法による重み とNFRキーワードの出現頻度(抜粋)
NFRキーワード
応答性
最小応答
キーワード 平均応答
語数:33 最小レスポンス
応答速度確保
安定的レスポンス
転送応答性
端末レスポンス
ネットワーク応答
画面レスポンス
ハードディスク応答性能
平均読み出し遅延
システム応答速度
スループット
スループット目標値
最大スループット
VPNスループット
応答時間
オンライン応答時間
レスポンスタイム
レスポンス目標値
ターンアラウンド
秒程度
秒以内
秒以下
タイムラグ
平均処理応答
フォワーディングレート
メモリ使用率
主記憶容量
ハードディスク容量
ネットワーク転送容量
データ量
応答性
拡張TF-IDF 単純TF-IDF キーワード比 出現頻度 出現RFP数
4.066
47.460
0.182
10
6
2.944
17.238
0.091
3
3
2.510
12.662
0.061
2
2
1.453
7.331
0.030
1
1
2.907
14.662
0.030
2
1
2.907
14.662
0.030
2
1
2.907
14.662
0.030
2
1
2.510
12.662
0.061
2
2
1.453
7.331
0.030
1
1
4.169
31.655
0.061
5
2
1.453
7.331
0.030
1
1
2.510
12.662
0.061
2
2
1.453
7.331
0.030
1
1
4.040
257.958
0.758
96
25
6.493
149.395
0.091
26
3
2.510
12.662
0.061
2
2
2.510
12.662
0.061
2
2
3.568
129.060
0.727
47
24
3.560
30.054
0.152
6
5
3.662
145.536
0.727
53
24
8.584
219.928
0.030
30
1
4.687
95.280
0.242
22
8
3.467
68.113
0.515
21
17
2.650
259.685
1.606
162
53
4.315
140.385
0.455
41
15
3.511
26.655
0.121
5
4
2.907
14.662
0.030
2
1
4.828
36.655
0.030
5
1
3.440
37.449
0.273
9
9
6.081
248.796
0.212
55
7
4.838
136.306
0.303
34
10
3.757
21.993
0.030
3
1
2.292
197.940
1.818
139
60
1200
1000
800
NFRキーワード出現頻度
単純TF-IDF
600
400
200
1
9
17
25
33
41
49
57
65
73
81
89
97
105
113
121
129
137
145
153
161
169
177
185
193
201
209
217
225
233
241
249
257
265
273
281
289
297
305
313
321
0
NFRキーワード出現頻度ランキング順
図 4.1 単 純 TF-IDF と NFR キーワード出 現 頻 度
59
120
100
80
出現RFP数
拡張TF-IDF
60
40
20
1
8
15
22
29
36
43
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
162
169
176
183
190
197
204
211
218
225
0
NFRキーワード出現RFP数ランキング順
図 4.2 拡 張 TF-IDF と NFR キーワード出 現 RFP
4.3.4
RFP の NFR 評 価 ス コ ア
提 案 する手 法 のもとになった TF-IDF 手 法 は,対 象 とする文 書 全 体 において
語 句 が特 徴 的 に多 く出 現 することを評 価 する指 標 である.本 研 究 の目 的 は,多
くの RFP に特 徴 的 に表 れる NFR キーワードにより非 機 能 要 件である「小 特 性」
の評 価 スコアを求 め,個々の RFP を定 量 的 に評 価 することである.したがって,
NFR キーワードの出 現 頻 度をそのまま用いると,一 つの RFP に繰り返 し記述 さ
れ出 現 する NFR キーワードにより,その RFP の評 価 スコアが高 い結 果 となる.
しかし,一 つの NFR キーワードの出現 頻 度 が高 い場 合 に,その RFP の非 機
能 要 件 の記 述 内 容が明 確 であるとは限らない.そこで,個 々の RFP を文 書 単
位 として,評 価 対 象 としたすべての RFP から NFR キーワード抽 出 し「小項 目 」
にマッピングする.そして,各 手 法 により算 出 した「NFR キーワード指 数 」による
重 み付 けを行 い,「小 項 目」ごとに RFP の評 価スコアを算 出している.こうするこ
とにより,特 定 の RFP のみに集 中 的に出 現 した NFR キーワードがこの特 定 の
RFP の評 価 スコアを高 くすることを避 けることが可 能 となる.
「小項目」ごとの評価スコア算出に当たっては,最初に,テキストマイニングを行い,
各 NFR キーワードの出現頻度を列とし,各 RFP を行としたマトリクスを生成する.次
60
に,このマトリクスにおいて各 NFR キーワードが出現したかどうかについて NFR キ
ーワードが該当 RFP に出現した場合を“1”とし,出現しなかった場合を“0”としたマ
トリクスに変換する.したがって, RFP ごとの NFR 評価スコアは,これらの重みを合
計して算出される.以下に NFR 評価スコア算出式を示す.
ここで,
RFP𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑒𝑒(𝑖𝑖) = � 𝑅𝑅𝑅𝑅𝑅𝑅(𝑖𝑖)[1,1,0, ⋯ ,0,1,0] ∗ 𝐾𝐾𝐾𝐾(𝑖𝑖, 𝑗𝑗)
RFP𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠(𝑖𝑖): 「小項目」i の NFR 評価スコア
𝑅𝑅𝑅𝑅𝑅𝑅(𝑖𝑖)[1,1,0, ⋯ ,0,1,0]:「小項目」i の NFR キーワード出現行列
𝐾𝐾𝐾𝐾(𝑖𝑖, 𝑗𝑗):「小項目」指標 i に属する j の「NFR キーワード指数」
表 4.2 に拡張 TF-IDF により算出した「小項目」ごとの NFR キーワード数,及び
「NFR キーワード重み」の例を示す.表 4.2 によると拡張 TF-IDF の場合に,「小項
目」にマッピングされた NFR キーワード種類にかかわらず NFR キーワードの重み付
けされていることが分かる.
61
表4.2 NFRキーワード重みの例
小項目
応答性 NFRキーワード種類
IKn=33
リカバリ処理 NFRキーワード種類IKn=53
アクセス管理
NFRキーワード種類IKn=134
負荷バランス
NFRキーワード種類
IKn=41
セキュリティ管理
NFRキーワード種類
IKn=102
障害対策
NFRキーワード種類
IKn=76
4.4
NFRキーワードの例
応答性
最小レスポンス
画面レスポンス
スループット目標値
レスポンスタイム
復旧対応
障害リカバリ手順
データリカバリ
リカバリプロセス
リカバリログ
回復時間
不正なアクセス
侵入監視
不正ログイン
不正アクセス防止
アクセス制限
アカウントロック
負荷分散
負荷分散装置
ロードバランシング
ネットワーク負荷
負荷率
セキュリティ管理
情報セキュリティ対策基準
セキュリティ管理機能
セキュリティレベル
インシデント管理機能
障害対策
システム障害対応
計画停電対応
ホットスワップ
障害検知ソフトウェア
障害発生頻度
NFRキーワード
重み
4.06623136
1.453279959
4.169152954
6.493240967
3.662394767
3.774860382
1.279856614
5.997211406
3.024930495
4.588237967
3.158955849
2.470947366
1.037478679
1.79191536
2.800739317
2.36330307
3.750156452
3.7144558
4.509926791
4.494587614
3.473900711
3.054600816
2.240994328
3.004146602
2.846453825
3.044960861
3.40147674
2.451364807
3.464907252
3.897737079
3.276547471
3.033028982
3.520007328
評価実験
本 節 では,「NFR キーワード指 数 」により重 み付 けされた NFR キーワードに
よる,RFP の記 述 内 容 の明 確 さを評 価 する実 験 について述 べる.評 価 実 験 で
は 161 件のサンプル RFP を入 力 データとしてテキストマイニングにより NFR キ
62
ーワードを抽 出 した後 に,この NFR キーワードを指 定 してその出 現 頻 度 から
「NFR キーワード指 数 」を生 成し,RFP ごとに各 「小項 目 」の評 価 スコアを求め
て評 価 する.次の各 項 で,評 価 実 験 の結果 および考 察 について述 べる.
4.4.1
評 価 実 験 デ ー タ と 「 小 項 目」
評 価 実 験では,サンプルデータとしてウェッブから収 集した RFP は text 形式
に変 換 し,データクリーニングを行 った後 に,各 RFP を一 つの文 章 単 位 として
すべてのサンプルを含 む一 つのテキスト文 書 を作 成 する.RFP テキストデータの
総 語 数は 4,611,476 語 である.また,評 価 対 象 とした「小 項 目 」である「応 答 性」,
「負 荷 バランス」,「リカバリ」,「アクセス管 理 」,「セキュリティ管 理 」および「障 害
対 策 」に出 現 した NFR キーワード数 はそれぞれ 398 個 ,467 個 ,653 個 ,
1,471 個 ,2,580 個 および 823 個 であった.
4.4.2
評価実験結果と考察
表 4.3 に各 「NFR キーワード指 数」による 3 種 類 の評 価手 法 と「手 動 評 価 」
との相 関 係 数を示す.表 4.3 によると,相 関 の強 さについてはすべての「小 項 目 」
指 標 について「弱 い相 関 あり」と認 められるが,「拡 張 TF-IDF」がすべての「小
項 目 」について相 関 が相 対 的 に強 いことがわかる.「小 項 目 」別 にみると,「セキ
ュリティ管 理 」,「障 害 対 策 」,「アクセス管 理 」,「応 答 性 」,「リカバリ処 理 」および
「負 荷 バランス」の順に相 関が強 い.上 位 3 つの「小 項 目 」については下 位 3つ
の「小 項 目 」と比 較 して NFR キーワードの種 類 数 が多 いことから,語 彙 の豊 富
さが相 関 の強 さに影 響 していることが考 えられる.「拡 張 TF-IDF」手 法は,対 応
する「小 項 目 」の各 NFR キーワードの出 現 頻 度 が高 ければ評 価 点 は高 くなる
が,同 一 の NFR キーワードの出 現 頻 度が高 くても評 価 点は高 くならず,異 なる
キーワードの種 類 が多 いほど評 価 スコアが高 くなると言 える.しかし,「拡 張 TFIDF」手 法 の評 価 スコアが高 い場 合 でも必 ずしも「手 動 評 価 」が高 くないケース
がある.(図 4.3 参 照)
63
表4.3
NFRキーワード重みと手動評価の相関係数
手動評価との相関係数
アクセス管理
セキュリティ管理
リカバリ処理
応答性
障害対策
負荷バランス
単純TF-IDF
拡張TF-IDF
キーワード比
0.3267
0.3684
0.3444
0.3344
0.4296
0.4051
0.2419
0.2666
0.1869
0.3352
0.3625
0.325
0.3855
0.4113
0.3125
0.1444
0.2239
0.1451
そこで,161 件 の RFP について,個 別 の「小 項 目」に関する3つの手 法 により
算 出 された評 価ポイントと 3 段 階の手 動 評 価 結 果 と対 応 させた結 果 を図 4.3(a),
(b),(c),(d),(e),(f) の箱 ひげ図 に示 す.図 4.3 によると,手 動 による 3 段 階
評 価 との比 較 において「応 答 性 」および「負 荷 バランス」の2つの「小 項 目 」以 外
は「拡 張 TF-IDF」のばらつきが小 さいことが認 められる.また,「応 答 性 」および
「負 荷 バランス」については「キーワード比 」のばらつきが小 さいことも認 められる
が,3 つの手 法 の内 「拡 張 TF-IDF」手 法 が最 も有 効 であることを示 していると
考 えられる.ただし,「拡 張 TF-IDF」手 法 の場 合 であってもすべての「小 項 目 」
に外 れ値 があり,手 動 評 価 と NFR キーワードによる評 価 の判 定 に大 きな差 が
認 められる.人 による評 価 と自 動 評 価 に大 きな差 があるケースとして,「手 動 評
価 」が“0”であっても「教 師 なし自 動 評 価 」で高 い評 価 点 となっている場 合 がある.
特 に,「障 害 対 策 」の「拡 張 TF-IDF」による評 価 点 は“22.7”であるが「手 動 評
価」は“0”となっている.この場 合 の NFR キーワードに関 連 する RFP の記 述 内
容 を,表 4.4 に示 す.表 4.4 によると「障害 対 策」という語 句についての記 述 内
容 には具 体 的 な表 現 がなく,ただ「提 案 依 頼 」を求 める内 容 であることが認 めら
れる.また,専 門 用 語 としての「ホットスワップ」や「リンクアグリゲーション」につい
ては,具 体 的 な記 述 も認 められる.人 による RFP の評 価 の場 合 には,非 機 能
要 件 である「小 項 目 」の語 句 の記 述 は認 めるが,ユーザとしての要 求 が明 確 に
記 述 されずに提 案 依 頼 を行 っていることが,低 い評 価 につながったことが考 えら
れる.さらに,専 門 用 語 についての記 述については,より具 体 的 な記 述 が求 めら
れるにもかかわらず,簡 単 な記 述 であれば評 価 が低 いことが考 えられる.人 によ
る 3 段階 評 価 の場 合 には,「選 択 バイアス」や,NFR キーワードの出 現 頻 度だ
64
けに依 存しないことが推 定 される.「手 動 評 価 」は,評 価 者 が文 章 の前 後 関 係を
見 て判 断 し,評 価 していることが考 えられる.よって,自 動 評 価 と手 動 評 価 との
評 価 結 果 の極 端 な一 致 の違 いをなくすためには, NFR キーワードの前 後 関
係 や文 脈を考 慮した NFR キーワード指 数 を生 成し,「拡 張 TF-IDF」手 法を改
良 することが今 後の課 題 である.
表 4.4 NFR キーワードに関 連 する記 述 例 「障 害 対 策」
NFRキーワード
アクシデントレポート作成機能
ホットスワップ
リンクアグリゲーション
計画停電
障害切り分けマニュアル
障害対策
障害対応
耐障害性
出現回数 記述内容
インシデントレポート・アクシデントレポート作成機能があ
1
ること。
以下の条件でインシデントレポート・アクシデントレポート
作成機能があること。
各ディスク装置は、RAID構成及びホットスワップ対応等
3
で障害対策が十分に施されていること。
装置内で電源ユニット、ファンモジュールがホットスワップ
可能なこと。
装置内で電源ユニット、ファンモジュールがホットスワップ
可能なこと。
上記インタフェースについては、2ポート以上を仮想的に1
3
ポートとする機能 (一般的に、リンクアグリゲーション)
IEEE 802.3ad リンクアグリゲーション機能 (LACP及び
スタティック) を有すること。
スタック接続された装置間でリンクアグリゲーション接続
が可能なこと。
計画停電時にタイマーによる自動安全停止及び正常起
1
動を考慮した設計を行うこと。
1 障害切り分けマニュアル
1 障害対策
基幹システムは機能単位での分割・分散化を図り、一つ
の機能の停止が全体システムの停止に波及しないよう
に障害の局所化を図れるものを提案すること。
3 想定する障害対応策及び回避策
仕様を満たし、障害原因の追及および障害対応を顧客確
認が容易にできるシステム提案であること。
夜間や休日を含む24時間の障害対応について、優れた
提案がされていること。
さらに耐障害性、性能確保についても十分考慮して総
1
ディスク容量を見積ること。
65
図4.3 (a) 応答性のNFRキーワード評価別箱ひげ図
図4.3(b) 負荷バランスのNFRキーワード評価法別箱ひげ図
66
図4.3(c) リカバリ処理のNFRキーワード評価法別箱ひげ図
図4.3(d) アクセス管理のNFRキーワード評価法別箱ひげ図
67
図4.3(e) セキュリティ管理のNFRキーワード評価別箱ひげ図
図4.3(f) 障害対策のNFRキーワード評価法別箱ひげ図
図 4.3
NFR キ ー ワ ー ド 重 み 付 け 手法 別 評 価 結 果 の 箱 ひげ 図
68
次 に,6 つの「小 項 目 」について,教 師なし自 動 評 価 手 法の拡 張 TF-IDF に
よる評 価 点を「5 点 未 満」,「5 点 以 上 10 点 未 満 」および「10 点 以 上」の 3 区 分
として,3 段 階 手 動 評 価の「0 点 」,「1 点 」および「2 点」の各 評 価 に占 める比 率
を算 出 した結 果を図 4.4(a),(b),(c),(d),(e)および(f)に示 す.図 4.4(a),(b),
(c),(d),(e)および(f)によると「手 動 評 価 」が高 い場 合には,拡 張 TF-IDF の評
価 点 も高 いことが認 められる.このことは,拡 張 TF-IDF による教 師 なし自 動評
価 が多 段 階 評 価 による「手 動 評 価 」の代 替 となる可 能 性 を示 していると言 える.
しかし,「手 動 評価 」が“2”の場 合 でも「自動 評 価 」が「5 点 未 満」の評 価 となる比
率 が高 い「小 項 目 」がある.特 に,「負 荷 バランス」については,自 動 評 価 による
「5 点 未 満」の評 価が 65%程 度 ある.(図 4.4(b)参 照) これは,「負 荷 バランス」
の NFR キーワード数 が比 較 的 少 ない 41 個 であること,および出 現 頻 度が少 な
いために教 師 なし自 動 評 価の評 価 点が低 くなったと考えられる.
一 方 ,「応 答 性」については,NFR キーワード数 が 33 個 と「負 荷 バランス」よ
り少 ないが,出 現 頻 度 が高 いので,自 動 評 価 の評 価 点 は比 較 的 高 く,「手 動 評
価」が“2”の場 合の「10 点 以 上」の比 率が 35%程 度 となっている.これは,人 に
よる「手 動 評 価」では「小 項 目」毎 に 3 段 階 評 価を行 い,NFR キーワードの出 現
頻 度 にかかわらず記 述 が明 確 であれば高 評 価 していることによることが考 えられ
る.また,図 4.5 に 56 件の RFP について,例 として,「アクセス管 理 」の「教 師
なし自 動 評 価」と「手 動 評 価」の NFR キーワードの出 現 回 数の結 果を示す.図
4.5 によると,「教 師 なし自 動 評 価」と「手 動 評 価」の不 一 致については以 下のよ
うなケースがあることが認 められる.
①NFR キーワードの出 現 頻 度が 20 を超 え評 価 が高い場 合 であっても,「手 動
評 価」では“0”評 価 のケース
②NFR キーワードの出 現 頻 度は 10 を超 え,評 価 点が中 程 度 の場 合 であって
も,「手動 評 価 」では“0”のケース
③NFR キーワードの出 現 頻 度が 10 以 下 で低く,評 価 点も 10 以 下で低 い場
合 であっても,「手動 評 価」では“2”のケース
69
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
O評価
1評価
5点未満
5点以上10点未満
2評価
10点以上
図4.4(a) 手動評価点毎の拡張TF-IDF評価点の比率:応答性
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
O評価
1評価
5点未満
5点以上10点未満
2評価
10点以上
図4.4(b) 手動評価点毎の拡張TF-IDF評価点の比率:負荷バランス
70
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
O評価
1評価
5点未満
5点以上10点未満
2評価
10点以上
図4.4(c) 手動評価点毎の拡張TF-IDF評価点の比率:リカバリ処理
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
O評価
1評価
5点未満
5点以上10点未満
2評価
10点以上
図4.4(d) 手動評価点毎の拡張TF-IDF評価点の比率:アクセス管理
71
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
O評価
1評価
5点未満
5点以上10点未満
2評価
10点以上
図4.4(e) 手動評価点毎の拡張TF-IDF評価点の比率:セキュリティ管理
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
O評価
1評価
5点未満
5点以上10点未満
2評価
10点以上
図4.4(f) 手動評価点毎の拡張TF-IDF評価点の比率:障害対策
図 4.4
手 動 評 価 点 毎 の 拡張 TF-IDF 評 価 点 の 比 率
さ ら に,一 部 の「 小 項 目 」( ア ク セ ス 管 理 ,リカ バ リ 処 理 お よ び 障 害
対 策 )に つ い て は マ ニ ュ ア ル 評 価 が“ 0”で あ っ て も 拡張 TF-IDF の 評 価
点 が 「 20 点 以 上 」 の 高 評 価 の RFP も あ る . し か し ,図 4.6 に 示 す よう
に 手 動 3 段 階 評 価 別 の 拡張 TF-IDF の 評 価 ス コ ア 平 均 値は 段 階 評 価 と の
72
結 果 を 明 確 に 示し て い る こ と が 認 めら れ る .こ れ らの 結 果 は ,非 機 能 要
件 の 記 述 の 明 確さ を 評 価 す る 手 法 とし て ,教 師な し 自 動 評 価 手 法 を 手 動
評 価 の 代 替 と して 使 用 す る こ と は 難し い が ,「 手動 評 価 」と の 補 完 的 な
使 用 と し て 有 効で あ る と 考 え ら れ る.今 後 は,NFR キ ー ワ ー ド の 前 後 関
係 を 含 め た 文 脈を「 教 師 な し 自 動 評価 手 法 」に 反 映 さ せ る 等 に よ り,「 手
動 評 価 」 と の 一致 率 を 高 め る こ と が課 題 で あ る .
3
90
80
70
60
2
50
40
1
30
20
10
0
1
3
5
7
9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55
NFRキーワード出現回数
拡張TF-IDF評価点
手動評価
図4.5 手動評価別のNFRキーワード出現回数と拡張TF-IDF評価点
手動評価0
障害対策
手動評価1
応答性
14
12
10
8
6
4
2
0
セキュリティ管理
手動評価2
負荷バランス
リカバリ処理
アクセス管理
図4.6 手動3段階評価別の拡張TF-IDF評価スコア
73
0
4.5
クラスタリングによる評価スコアの段階評価
段 階 評 価により,RFP の非 機 能 要 件の記 述 内 容が個 々の「大 項 目」,「中 項
目 」および「小 項 目 」についてどの程 度 明 確 であるかを相 対 的 に把 握 することが
可 能 であり ,超 上 流 工 程 に お いて ユーザ に とっ て有 用 な 指 標 となる.し か し ,
RFP の評 価 スコアを算 出し,前 節で提 案した 3 つの手 法 により,段 階 評 価によ
る分 類 を自 動 評 価 することには課 題 がある.そこで,追 加 実 験 として,教 師 なし
機 械 学 習の一 手 法 であるクラスタリングにより,評 価 スコアに応じて 3 段 階 評価
に分 類 する実 験を行 った.クラスタリング手 法 を用 いることにより,RFP から抽 出
した NFR キーワードと関 連 付けた「小 項 目 」について,定 量的 に評 価した結 果
が類 似 性 により分 類 されることが推 定 される.
クラスタリングについては,文 献 [32]によると「互 いに関 連 する文 書 同 士 は,
関 連 しないものよりも類 似 している」というクラスタ仮 説 (cluster hypothesis)
に基 づいている.前 節 では「拡 張 TF-IDF」が手 動 評 価 との比 較 において,3つ
の手 法 の中 では相 関 が高 く,評 価 も類 似 していると考 えられる.また,「キーワー
ド比 」は NFR キーワードの豊 富 さを示す指 標 であることから,3 グループへのク
ラスタリング実 験 では,「拡 張 TF-IDF」と「キーワード比」の 2 次 元 データによる
k-means 法を用 いた.「小 項 目 」の 3 段 階 評 価に対 応して評 価 するために,3
グループにクラスタリングされた結 果 と,評 価 者が各 RFP について「手 動 評 価」
した結 果 との一 致 率 について検 証 を行 う.次 項 では提 案 手 法 の詳 細 について
述 べる.
4.5.1
提案手法
「小 項 目 」ごとに「拡 張 TF-IDF」により算 出 した NFR 評価スコアと「キーワード
比」のペアを列とし,各 RFP を行として,k-means 法を適用する.
K-means アルゴリズムは「非階層的クラスタ分析であり,クラスタ数を指定してその
個数のクラスタを構成する手法」である.文献[40]では,「k-means アルゴリズムは,
ベクトル集合{x1,x2,----,xn}を一連のクラスタ{C1,C2,----,Ck}に分割する.こ
74
のアルゴリズムは,はじめにシードと呼ぶ k 個の初期クラスタ要素を必要とする.これ
らは外部から与えられるか,またはベクトルの中からランダムに選択される.」とされて
いる.また,「k-means アルゴリズムはシンプルかつ効率的なため,頻繁に用いられ
る.各々の反復処理においては O(kn)回の類似度比較を行えば良く,通常,収束
するまでの反復処理の回数は非常に少ない.」と言われている.しかし,「k-means
アルゴリズムにおける大きな問題点は,得られる結果が最初のシードの選択に依存
すること」であり,この問題を解決するために,クラスタリングを複数回実行し,その都
度異なったシードを選ぶ方法をとっている.本項では,クラスタ数 3 を指定してクラス
タリングを複数回実行することにより,RFP 群の評価結果を 3 つのクラスタとして構成
し,「小項目」ごとに 3 段階評価との対応付けを行っている.
クラスタリングの評価[40]には 4 種類あるが,最も一般的な尺度は,ある正解のク
ラスタのデータを,どの程度含むかという純度(purity)である.人によって分類された
正解となるクラスタを{A1,A2,----,An}とし,{C1,C2,---,Cm}をクラスタリング手
法によって得られたクラスタとすると,純度は以下の式で定義される.純度は 0 から 1
の値をとり,値の結果が高いほどクラスタリングの結果が良いとされている.
Purity𝑖𝑖=
1
𝐶𝐶𝐶𝐶
Maxℎ �𝐶𝐶𝐶𝐶 � 𝐴𝐴ℎ�
また,もう一つの一般的な尺度として以下に示すエントロピー尺度がある.エントロ
ピーは 0 から 1 の値をとり,値が低いほどクラスタリング結果が良いとされている.
𝐾𝐾
𝑘𝑘
𝑖𝑖=1
𝑖𝑖=1
∑𝐾𝐾
|𝐶𝐶𝐶𝐶|
𝑗𝑗=1 𝑥𝑥𝑥𝑥𝑥𝑥
�
E𝑖𝑖 = − �
𝐸𝐸𝐸𝐸
𝑁𝑁
𝑁𝑁
ここで,N はクラスタリング対象のデータ数,また Ei は以下で定義される.
𝐾𝐾
E𝑖𝑖 = − � 𝑃𝑃(𝐴𝐴ℎ| 𝐶𝐶𝐶𝐶)𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙(𝐴𝐴ℎ|𝐶𝐶𝐶𝐶)
ℎ=1
また,確率P(Aℎ|C𝑖𝑖)は|𝐴𝐴ℎ ∩ 𝐶𝐶𝐶𝐶|�|𝐶𝐶𝐶𝐶| = 𝑥𝑥𝑥𝑥ℎ�∑𝐾𝐾 𝑥𝑥𝑥𝑥𝑥𝑥 によって推定される.
𝑗𝑗=1
75
4.5.2
クラスタリング評価実験
NFR キーワードを抽 出 した後 ,クラスタリングによる評 価 実 験 を行 う手 順を以
下に述 べる.
手 順 1: 「拡 張 TF-IDF」による「NFR キーワード指 数」で算 出 した NFR 評
価スコアと RFP 群のキーワード比 とのペア数 値 をクラスタリング対 象デ
ータとして,クラスタ数 3 を指 定 して非 階 層クラスタ分 析 手 法 である kmeans を実 行 する.k-means 法 によるクラスタリングは最 初 にランダム
に選 択 されたシードに依 存することから,試 行 回 数 50 回を指 定 して実
行する.
手 順 2: 3 グループにクラスタにクラスタリングされた結 果 から,マニュアルに
より NFR 評 価 スコアの大 小 関 係をもとにスコアの高いクラスタの評 価を
“2”,スコアが中 間 のクラスタの評 価 を“1”およびスコアが低 いクラスタ
の評 価を“0”に対 応づける.
手 順 3: クラスタ分 析 による評 価 結 果 と手 動 評 価 結 果 の一 致 率 について
分 析 を行 う.クラスタリングの評 価 結 果 とマニュアル評 価 のクロス表 を作
成し,クラスタリング評 価 尺 度を求 める.
4.5.3
評価実験結果と考察
「小 項 目 」ごとのクラスタリング結 果 と手 動 評 価 との比 較 を図 4.6 に示 す.図
4.6 によると,すべての RFP について,「小 項 目」のクラスタリング結 果と手 動 評
価 における一 致 率 (3 段 階 評 価 の結 果 が“2”,“”および“0”で一 致 している比
率 )は「小 項 目 」の平 均 値 で 60.7%であった.また,不 一 致 率 は「小 項 目 」の平
均 値 で 38.5%であった.一 致 率 60.7%の内 訳 は,評 価 スコア“ 2”で一 致 が
10.2%,評 価 スコア“1”で一 致が 24.7%および評 価 スコア“0”で一 致 が 65.0%
となっている.一 方 ,不 一 致 率 38.5%の内 訳 をみると評 価 スコアの“2”を“1”あ
76
るいは“1”を“2”とした評 価が 32.7%であり,評 価 スコアの“1”を“0”あるいは“0”
を“1”とした評 価 が 67.3%であた.評 価 が一 致 した場 合 および不 一 致 であった
場 合 のいずれも,「小 項 目 」の評 価 スコアが低 い“0”が多 かったことが,これらの
要 因 と推 定 される.また, RFP の「小 項 目 」にもとづく非 機 能 要 件 の記 述 内 容
の明 確 さの評 価 において,「該 当 する指 標 に関 する記 述 がない,あるいは記 述
はあるがその内 容 が極 めてあいまいな表 現 である」RFP が多 いことも示 している.
しかし,評 価 スコアの“2”を“0”あるいは“0”を“2”とした評 価 は 10 個 であり,161
件 の RFP を 6 種 類 の「小 項 目 」で評 価 した 966 ケースの 0.9%であったことは,
クラスタリングによる 3 段 階 評 価の精 度 向 上 の可 能 性 を示 していると言 える.
一 方 ,クラスタリング評 価 の「小 項 目 」全 体 について,評 価 尺 度 であるエントロ
ピー及 び純 度で見 ると,それぞれ 0.737 と 0.606 であった.クラスタリングの結
果 はエントロピーが高 く,純 度 も低 いため良 いとは言 えないが,委 託 ソフトウェア
開 発の超 上 流 工 程において,評 価スコアを大 まかに 3 段 階 に分 類し,どの程 度
の評 価 にあるかを直 観 的 に把 握 することに効 果 があると考 えられる.そこで,不
一 致 となった要 因を個 別に考 察 することにより,今 後 の課 題を明 らかにする.
「小項目」ごとの一致率および不一致率を図 4.7 に示す.図 4.7 によると,「負荷
バランス」の一致率が最も高く,「応答性」の一致率が最も低い結果が認められる.
「負荷バランス」について一致率が高いことの一つの要因として,評価スコアの“0-0”
及び“1-1”の一致数が多いことが考えられる.「応答性」について一致率が低い要因
の一つとして,レスポンスの記述と具体的数値が記述されている RFP について,手
動評価は“2”であるがクラスタリングでは“0”評価となっていることが一つの要因と考
えられる.この例では,「応答性」についての定量的要求が明確であれば手動評価と
しての評価スコアが高いが,NFR キーワードの出現頻度が少ないため評価スコアが
低くなり,k-means 法によるクラスタリングでは“0”評価となっていることが推定される.
そこで,手動評価とクラスタリング結果の一致率に差異が生じる要因および解決策に
ついて以下に考察する.
77
80
70
評価スコア一致数
60
50
40
30
障害対策
セキュリティ管理
負荷バランス
アクセス管理
リカバリ処理
応答性
20
10
0
応答性
"2-2"
7
"0-0"
66
"1-1"
16
2-0差
0
2-1差
4
1-2差
22
1-0差
7
0-1差
37
0-2差
2
リカバリ処理
8
65
24
0
3
14
17
29
1
アクセス管理
13
60
29
0
9
11
19
20
0
負荷バランス
7
73
32
0
4
7
16
21
1
セキュリティ管理
9
63
23
0
9
14
16
22
5
障害対策
16
54
21
1
12
12
21
24
0
図 4.7 小 項 目ごとの NFR 評 価 スコア一 致 数
A) 手 動 評 価が高 く,クラスタリング評 価 が低いケース
複 合 語 としての専 門 用 語 が記 述 されていないが,平 易 な語 句 で該 当
する指 標 の要 求 を記 述 しているケースが考 えられる.例 として,「リカバリ
処 理 」にて,「システムに障 害 が発 生 した場 合 は 2 時 間 以 内 に対 応 し、
障 害 箇 所 の究 明を行 ったうえで、応 急 的 措 置 」と記 述 されているものがあ
る.ここでは「システム障 害 」としての複 合 語 ではなく「システムに障 害 」と
記 述 されており NFR キーワードとしていないため評 価 されない.また,手
動 評 価 では「2 時 間 以 内 に対 応 」を定 量 的 記 述 として評 価 するが NFR
キーワードではないので評 価 ポイントがなく,評 価 スコアは低 いためクラス
タリングでの評 価は低 くなる.さらに,RFP に記 述 されている単 語 表 現に
問 題 があり,テキストマイニングによる形 態 素 解 析 で抽 出 できない場 合 が
あった.例 として,「レスポンス」を「リスポンス」と記 述 ,「画 面 応 答 」を「画
面 レスポンス」と記 述 しているなどである.これらの問 題 点 に対 して,文 脈
78
解 析および意 味 解 析 の手 法を取 り入 れること,あるいは評 価 する NFR キ
ーワード表 現の多 様 性を許 容することが考 えられる.
B) 手 動 評 価が低 く,クラスタリング評 価 が高いケース
複 合 語 としての多 様 な専 門 用 語 が記 述 されているが,該 当 指 標 に対
する体 系 的 な記 述がないケースがある.これは,RFP の記 述 として NFR
と FR を明 確に区 分 せずに FR の中 に NFR を部 分 的に記 述している場
合 である.さらに,同 一 フレーズを繰 り返 して記 述 している場 合 に,該 当
プロジェクトでの複 数 の特 定 NFRキーワードの出 現 頻 度 が極 めて大 きく
なり,「NFR 評 価 指 数 」による評 価 スコアが高 くなる場 合 である.これは,
NFR キーワードが文 節の表 題 とされている場 合 ,あるいは RFP の記 述
において文 章 の繰 り返 しを多 用 している場 合 である.これらの問 題 点 に
対して,サンプルデータである RFP 原 文を加 工して NFR 記 述 部 分をま
とめること,あるいは繰 り返 されている NFR キーワードを減 少 させる手 法
が必 要 となる.また,“±1”の評 価 差 が生 じる要 因 として以 下 のケースが
考えられる.
C) クラスタリングと手 動 評 価 が“0-1”となるケース
NFR 評 価 スコアが比 較 的 低 い RFP 群 のクラスタリングは“0”となった
が,手 動 評 価 では,特 定 の NFR キーワードの重 要 性 を判 断 し評 価 を
“1”としているケースである.これに対 しては,NFR キーワードの多 様 性
を高 め NFR キーワード数を増 加 することにより評 価 スコアを上 げる方 法
が考 えられる.しかし,「出 現 頻 度 で上 位 10%の単 語 しか使 わなくても,
分 類 器 の性 能 は下 がらないという実 験 の結 果 がある」[32]とされており,
少 ない NFR キーワードで分 類 を可 能 とすることが課 題 となる.
D) クラスタリングと手 動 評 価 が“1-2”となるケース
評 価 スコアが極 めて高 いプロジェクトが少 数 あり,これに影 響 されて少
数 のプロジェクトのみが“2”に分 類 され,手 動 評 価 では“2”と判 断 されるケ
79
ースで,クラスタリングでは中 間 評 価 の“1”となるケースである.これに対 し
ては,「小 項 目 」の評 価スコアが極 めて高 い RFP を外れ値 として処 理する
ことにより NFR 評 価 に差 異 が少ないサンプルデータを対 象 とすることによ
り問 題 点 を避 けることができる.ただし,「小 項 目 」の評 価 スコアが高 い
RFP を対 象 外 とすることは,非 機 能 要 件 の明 確 さを評 価 するためには問
題 であり,外 れ値 の取 り扱 いは今後 の課 題 である.
E) クラスタリングと手 動 評 価 が“1-0”となるケース
NFR キーワードではないにもかかわらず,NFR キーワードとして評 価 ポ
イントとなった場 合 である.たとえば,「負 荷 検 査 」は医 療 機 関 における検
査 項 目 として使 用 されるケースがあり,「病 院 情 報 システム」に記 述 される,
あるいは“ピーク時 ”は業 務 そのもののピーク時 間 帯 を意 味 する語 句 として
使 用 されるなどである.これは,NFR キーワードが,実 際 は非 機 能 要 件 と
は異 なる意 味 のために,手 動 評 価 では評 価 されないことが考 えられる.こ
れに対 しては,自 然 言 語 処 理 の手 法 による語 義 のあいまい性 解 消 やキー
ワードのコロケーション統 計(コロケーションは一 般に語 の習 慣 的 な共 起 関
係 と説 明 されている)を評 価 手 法 に組 み込 むことなどが対 策 として考 えら
れる.
F) クラスタリングと手 動 評 価が“2-1”となるケース
重みが大きい NFR キーワードが記 述 されているが,その記 述 内 容 が簡
単 であり,手 動 評 価 ではあまり評 価 されないケースである.たとえば,「障
害 管 理 」指 標 としての「障 害 管 理 」,「障 害 復 旧 」あるいは「障 害 対 策 」は
比 較 的 「NFR キーワード指 数 」の評 価 が高 いが,「障 害 が発 生 した場 合
は、障 害 の復 旧 作 業 を行 うこと」などと平 易 に記 述 されているなどである.
これは,あまり専 門 的 ではない NFR キーワードであるが RFP サンプル群
での出 現 頻 度が高 いため「NFR キーワード指 数」が比 較 的高 いことによる
ことが考えられる.これに対 しては,専 門 性 が高 い NFR キーワードについ
ては「NFR キーワード指 数 」の重 みを大 きくする手 法 ,あるいは一 般 的 な
80
NFR キーワードをフィルタリングすることなどが対 策 として考 えられる.
一致率
不一致率
応答性
0.552795031
0.447204969
障害対策
リカバリ処理
0.565217391
0.428571429
0.391304348
0.602484472
0.366459627
0.378881988
セキュリティ管理
0.590062112
0.633540373
アクセス管理
0.298136646
0.695652174
負荷バランス
図4.8 「小項目」別の一致率および不一致率
4.6
まとめ
本 章では,機 械 学習 によらない非 機 能 要 件 の評 価 手 法 として提 案 した 3 つ
の手 法 を比 較 した.実 験 結 果 では,「手 動 評 価 」との各 「小 項 目 」についての比
較 で,「拡 張 TF-IDF」手 法 の相 関 係数 が 0.2239 から 0.4296 となり,「弱 い相
関」であるが,最も有 効 であることがわかった.しかし,「拡 張 TF-IDF」手 法 の評
価 スコアが高 い場 合 でも必 ずしも「手 動 評 価 」が高 くないケースもあり,教 師 なし
自 動 評 価 手 法 を手 動 評 価 の代 替 として使 用 することは難 しく,「手 動 評 価 」との
補 完 的に使 用 することが考 えられることがわかった.また,「拡 張 TF-IDF」と「手
動 評 価 」との比 較 において,各 「小 項 目」に外 れ値 となった RFP があり,NFR キ
ーワードによる評 価 に文 章 の前 後 関 係 や文 脈 も含 めて評 価 することが必 要 であ
り,今 後 の課 題であることもわかった.
81
一 方 ,追 加 実 験 で行 った「手 動 評 価 」とクラスタリングについては,その一 致
率 は 60.5%であった.さらに,不 一 致 率 は 0.9%であった.提 案 手 法 の精 度 評
価 において,クラスタリングの評 価 尺 度 であるエントロピー及 び純 度 はそれぞれ
0.737 と 0.606 であった.エントロピーを高 めている要 因 としては,評 価 差の違
いが±1 であるケースが 38.2%と比 較 的 多 いことが考えられる.この点 について
は,RFP サンプルデータとして実 験 を行 った 161 件 の RFP データ群 の「小 項
目 」における評 価 が低 いデータが多 いことも要 因 のひとつでであり,今 後 は,こ
の±1 差 の評 価 を減 少 させる手 法 を組 み込 むことが課 題 である.また,手 動 評
価 を正 解 集 合 としてクラスタリングの結 果 と一 致 率 の評 価 比 較 を行 ったが,手
動 評 価 の客 観 性 を高 めることも必 要 であり,多 数 の評 価 者 による評 価 を行 った
結 果を採 用 した実 験 を行 い,検証 する必 要 がある.
82
第5章
5.1
社会的影響別の非機能要件評価
概要
非 機 能 要 件 は,情 報 化 対 象 となっているシステムのカテゴリ,あるいは規 模 に
より重 視 される非 機 能 要 件 とそれほど重 視 されない非 機 能 要 件 があると推 定 さ
れる.しかし,委 託 開 発 を行 う情 報 化 システムの規 模 や対 象 領 域 は様 々である
が,社 会 的 影 響 が同 じカテゴリの中 での比 較 ,あるいは,異 なるカテゴリとの比
較 を行 い,どの「非 機 能 要 件 」の記 述 が明 確 でないかを定 量 的 に把 握 し,確 認
できることは有 効 である.そこで,本 章 では,社 会 的 影 響の違 いによる 3 つのカ
テゴリに分 類した RFP 群 について,前 章 で述べた「拡 張 TF-IDF」手 法 による
評 価 を行 い,「NFR キーワード評 価 シート」による非 機 能 要 件 の記 述 内 容 の明
確 さを評 価することの有 効 性 について述 べる.
「社 会 的 影 響 によるシステム分 類 の判 定 基 準 」については,IPA-SEC の「非
機 能 要 求グレード」 [2]で以 下 のように定 義 されている.
社 会 的 影 響によるシステム分 類 の判 定 基準
A) 社 会 的 影 響 が極 めて大 きいシステム: 常 時 サービスの提 供 が前 提 となる
ため,基 本 的に停 止 は不 可 .
このカテゴリの NFR 評 価 指 標による評 価 が最 も高いことが推 定 される.
B) 社 会 的 影 響 が限 定 されるシステム: 24 時 間 無 停 止 でのサービス提 供 は
必 要 ないが,極力 稼 働は継 続 させる.
このカテゴリの NFR 評 価 指 標による評 価 は中 間 であることが推 定 される.
C) 社 会 的 影 響 がほとんど無 いシステム: 業 務 時 間 内 のみのサービス提 供 で
あり,夜 間の稼 働 は無 い.
5.2
社会的影響による RFP の分類と手動評価
本 章で対 象 とした 161 件 の RFP サンプルを「社 会 的 影 響 によるシステム分
83
類 の判 定 基 準 」により「社 会 的 影 響 が極 めて大 きいシステム」,「社 会 的 影 響 が
限 定 的 なシステム」および「社 会 的 影 響 が少 ないシステム」3 つのカテゴリに分
類 した. RFP サンプル群 は,社 会的 影 響 別にそれぞれ 56 件 ,56 件 および 49
件 に分 類 された.
これらについて人 手 による評 価 を行 った「小 項 目 」ごとの評 価 スコアを図 5.1
に示 す.図 5.1 によると「社 会 的 影 響が極 めて大 きいシステム」の評 価は「社 会
的 影 響 が低 いシステム」との比 較 では,すべての「小 項 目 」において高 い評 価 と
なっており,「社 会 的 影 響 が限 定 的 システム」との比 較 においては,「ウイルス対
策 」,「RAID 構 成」および「障 害 対 策」が低 い評 価 であるが,その他 の「小 項 目 」
においては,すべて高 い評 価となっていることが認 められる.このことは「NFR キ
ーワード評 価 シート」の「小 項 目 」の手 動 評 価 において,社 会 的 影 響 カテゴリの
特 徴 を評 価 できることを示 していると考 えられる.社 会 的 影 響 カテゴリに分 類 さ
れた個 別の RFP についての 3 段 階 での手 動 評 価 結 果の一 部 を表 5.1 に示
す.表 5.1 によると,3 段 階 評 価において特 に「セキュリティ管理 」と「障 害 対 策 」
の“0”評 価 がその他 の「小 項 目 」と比 較して多 く,非 機 能 要 件 の記 述 においてさ
らに明 確 にする必 要 があることが認 められる.また「リカバリ処 理 」,「応 答 性 」お
よび「負 荷バランス」については“2”評 価 の RFP が相 対 的に多 いことから,「社
会 的 影 響 が大 きいシステム」ではこれらの「小 特 性 」についての非 機 能 要 件 が
重 視 されていると言 える.一 方 ,「社 会 的 影 響 が少 ないシステム」では“0”評 価
の RFP が相 対 的に多 く,非 機 能要 件 について明 確 に記 述されていないことが
認 められる.ただし,これらについては評 価対 象 とした 161 件の RFP を分 類 し
た評 価 結 果 であり,複 数 評 価 者 によるより多 くの RFP について分 析し,評 価す
ることが求 められる.次 節 では,4 章 で述 べた「拡 張 TF-IDF」を用 いた評 価 に
ついて述 べる.
84
社会的影響極めて大
社会的影響限定的
社会的影響少
オペレーション
パッチ処理
リカバリ処理
停止処理
応答性
1.6
システム性能
1.4
負荷バランス
1.2
1
障害管理
稼働品質
0.8
障害対策
システム異常…
0.6
0.4
バックアップシ…
障害要因
0.2
0
バックアップ管理
運用管理
RAID構成
システム管理
冗長化
不正アクセス
暗号処理
アクセス権限
セキュリティ管…
情報漏洩対策
ウイルス対策
パスワード管理
セキュリティ対応
認証機能
図 5.1 社 会 的 影 響 別の「小 項目 」の手 動 評 価スコア
表 5.1 社会的影響カテゴリ別の手動評価(一部の NFR 評価指標)
アクセス管理
0評価
1評価
2評価
影響大 影響限定
14
25
22
25
20
6
影響少
27
19
3
セキュリティ管理
0評価
1評価
2評価
影響大 影響限定
21
21
16
18
19
17
影響少
25
10
10
リカバリ処理
0評価
1評価
2評価
影響大 影響限定
14
11
4
25
38
20
影響少
32
15
2
障害対策
0評価
1評価
2評価
影響大 影響限定
37
33
14
18
5
5
影響少
45
4
0
応答性
0評価
1評価
2評価
影響大 影響限定
10
19
14
26
31
11
影響少
13
27
9
負荷バランス
0評価
1評価
2評価
影響大
影響少
16
21
12
85
8
23
25
影響限定
9
23
24
5.3
社会的影響カテゴリ別の評価スコア
4 章 で提 案 した「拡 張 TF-IDF」法 を用 いて,6つの「小 項 目 」について社 会
的 影 響 カテゴリ別 に分 類 された個 別の RFP の評 価を行った結 果を図 5.2(一
部 抜 粋 )に示 す.図 5.2 によると,どの「小 項 目 」の評 価 スコアが高 く,またどの
「小 項 目」の評 価スコアが低 いかについては,社 会 的 影 響カテゴリ別に分 類 され
た個 別 の RFP で大きく異 なることが認 められる.「社 会 的 影 響が極 めて高 い」カ
テゴリの RFP についても,RFP 個 別 にみると評 価スコアが低い RFP(たとえば
「アクセス管 理」についての 3,4,42 番 目 の RFP など)があり,その「小 項 目 」に
ついての非 機 能 要 件 が明 確 に記 述 されていないことが認 められる.また,「社 会
的 影 響が限 定 的 」なカテゴリにおいても,非 常に高 い評 価 スコアの RFP(たとえ
ば RFP「アクセス管 理 」および「セキュリティ管 理 」の 49 や 52 番 目の RFP)が
ある.一 方 ,「社 会 的 影 響 が少 ない」システムであっても「アクセス管 理 」や「応 答
性 」および「負 荷 分 散 」について高 い評 価 スコアとなっている RFP(47 番 目)が
あることが認 められる.これらのことは,社 会 的 影 響 によらず一 部 の非 機 能 要 件
である「小 項 目 」については個 別 の RFP に差 があることを示 している.
次 に,図 5.3 に 6 つの「小 項 目」について社 会 的 影 響カテゴリ別 に分 類 され
た RFP の評 価スコアの箱 ひげ図を示 す.図 5.3 によると個 別の「小 項 目 」につ
いての評 価 スコアをカテゴリ別 にみると,「応 答 性 」と「負 荷 分 散 」については「社
会 的 影 響 が極 めて大 きいシステム」の中 央 値 が高いことが認 められるが,その他
の「小 項 目 」については「社 会 的 影 響 が限 定 的 なシステム」との差 は少 ない.ま
た,「社 会 的 影 響 が限 定 的 なシステム」については,「セキュリティ管 理 」と「リカ
バリ処 理 」に外 れ値 として極 めて高 い評 価 スコア(50 ポイント超 え)の RFP が認
められる.この点 については,社 会 的 影 響 によるカテゴリの分 類 において,一 部
の RFP(たとえば 49 番 目「厚 生 労 働 省 ネットワークシステムの更 改 」や 52 番
目 「職 業 紹 介 サブシステム統 合 運 用 監 視 業 務 」)の社 会 的 影 響 が限 定 的 であ
るか,あるいは極 めて大 きいかの判 断 が困 難 なため,人 の判 断 によるカテゴリ分
類 の要 因 が考 えられる.また,「社 会 的 影 響 が少 ないシステム」についてはすべ
ての「小 項 目 」において低 い中 央 値 (5 ポイント以 下 )となっており,社 会 的 影 響
86
による3つのカテゴリの中 では,非 機 能 要 件 の記 述 内 容 が明 確 でないことがわ
かる.ただし,すべてのカテゴリにおいて評価 スコアの中 央 値 が 10 ポイント以 下
であった.対 象 となった 161 件 の RFP に偏 りがあることも考 えられ,RFP のサン
プル数 に要 因があるかどうかについての検 証 は,さらに多 くの多 様 な RFP によ
る実 験 が今 後の課 題 である.次 節では,「手 動 評 価」との比 較 について述 べる.
社会的影響が極めて大
35
社会的影響が限定的
社会的影響が少
アクセス管理
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
個別のRFP
70
社会的影響が極めて大
60
社会的影響が限定的
社会的影響が少
セキュリティ管理
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
個別のRFP
60
50
40
社会的影響が極めて大
社会的影響が限定的
社会的影響が少
リカバリ処理
30
20
10
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
個別のRFP
図 5.2(a) 社 会 的 影 響カテゴリ別の個 別 RFP の小 項 目 評 価スコア
87
社会的影響が極めて大
35
社会的影響が限定的
社会的影響が少
応答性
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
個別のRFP
社会的影響が極めて大
社会的影響が限定的
社会的影響が少
30
障害対策
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
個別のRFP
社会的影響が極めて大
20
18
16
14
12
10
8
6
4
2
0
社会的影響が限定的
社会的影響が少
負荷分散
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556
個別のRFP
図 5.2(b) 社 会 的 影 響カテゴリ別の個 別 RFP の小 項 目 評 価スコア
88
A
社 会 的 影 響 が限 定 的
A
B
C
D
E
F
70
60
拡張
0
10
20
30
TF-IDF評価スコア
40
50
60
70
社 会 的 影 響 が少
50
TF-IDF評価スコア
40
0
10
20
30
拡張
TF-IDF評価スコア
40
0
10
20
30
拡張
50
60
70
社 会 的 影 響 が極 めて 大
A
B
C
D
E
F
A
B
C
小項目
小項目
D
E
F
小項目
図 5.3 社 会 的 影 響カテゴリ別の個 別 RFP 評 価
5.4
社会的影響カテゴリ別の評価比較
4 章 で評 価 対象 とした 6 つの「小 項 目 」を,社 会 的 影 響 カテゴリ別に「手 動 評
価 」した結 果をレーダチャートで図 5.4(a)に,また,「拡 張 TF-IDF」により評 価
した結 果 をレーダチャートで図 5.4(b)に示 す.図 5.4 によると,「手 動 評 価 」と
「拡 張 TF-IDF」の評 価スコアによる比 較でみると,個 別 の「小項 目」についての
評 価 に相 違 があることが認 められる.これらの相 違 点 は,「小 項 目 」の評 価 を平
均 値 として比 較 した結 果 である.しかし,6 個 の「小 項 目」それぞれについて,要
求 される非 機 能 要 件 の特 徴 が,社 会 的 影 響 度 合 いの差 として評 価 されているこ
とは認 められる.
89
社会的影響が極めて大
社会的影響が限定的
社会的影響が少
アクセス管理
1.6
1.4
1.2
1
負荷分散
0.8
セキュリティ管理
0.6
0.4
0.2
0
障害対策
リカバリ処理
応答性
図5.4(a) 手動評価による社会的影響別の小項目評価スコア
社会的影響が極めて大きい
社会的影響が限定的
社会的影響が少ない
アクセス管理
10
8
負荷分散
6
セキュリティ管理
4
2
0
障害対策
リカバリ処理
応答性
図5.4(b)
社会的影響カテゴリ-別の小項目拡張TF-IDF評価スコア
90
5.5
まとめ
社 会 的 影 響 カテゴリにより,161 件 の情 報 化 対 象 システムである RFP を 3 つ
のカテゴリに分 類 して評 価 した結 果 ,「社 会 的 影 響 が極 めて高 い」カテゴリのシ
ステムであっても非 機 能 要 件 である「小 項 目 」については,明 確 に記 述 されてい
ない RFP があることがわかった.また,同 じカテゴリの RFP であっても「セキュリ
ティ管 理 」や「リカバリ処 理 」については,その評 価 スコアに大 きな差 があり,非機
能 要 件 である「小 項 目 」の記 述 内 容 の明 確 さに差 があることもわかった.これら
のことは,「NFR キーワード評 価 シート」に基 づく評 価 により非 機 能 要 件 の記 述
内 容 の明 確 さにおいて,明 確 さが十 分 でない「小 特 性 」を定 量 評 価 することの
必 要 性 を示 唆 していると言 える.ただし,社 会 的 影 響 によるカテゴリ分 類 は,定
量 的に明 確 ではないため,分 類された個 々の RFP について,そのカテゴリに属
するかどうかについては議 論 の余 地 がある.しかし,社 会 的 影 響 により3つにカ
テゴライズされたそれぞれの評 価 スコアの平 均 値 でみると,「応 答 性 」,「障 害 対
策 」および「負 荷 バランス」において,「社 会 的 影 響 が極 めて高 い」システムにつ
いては評 価 が高 く,一 般 的 な認 識 と一 致 することが認 められた.また,社 会 的 影
響 別 の評 価 結 果 については,社 会 的 影 響 が高 いほど評 価 が高 いことも認 めら
れた.これらのことは, RFP に記 述 されるべき,どの非 機 能 要 件 が明 確 に記 述
されていないかについて定 量 的 に把 握 できることを示 している.したがって,委
託 ソフトウェア開 発 の超 上 流 工 程 で,「要 件 定 義 」をより明 確 にすることを支 援
するために「NFR キーワード評 価 シート」の活 用 は,有 効 な手 法 であると考 える.
91
第6章
結論
本 論 文 では,委 託 ソフトウェア開 発 の超 上 流 工 程 でユーザが作 成 した RFP
の非 機 能 要 件 の記 述 内 容 を定 量 的 に評 価 する評 価 指 標 を示 し, RFP に記
述 されている非 機 能 要 件 の明 確 化 を支 援 することを目 的 として,(1)ユーザにと
って重 要 度 の高 い「保 守 と運 用 に関 する 55 個 の非 機 能 要 件 」で構 成 した「非
機 能 要 件 評 価 シート」による評 価 モデル,(2)RFP テキストファイルから抽 出 し
「非 機 能 要 件 評 価 シート」の「中 項 目 」に対 応 させた「NFR キーワード評 価 シー
ト」を作 成し,NFR キーワード出 現 頻 度による機 械 学 習手 法を用 いた自 動 評 価
モデル,(3)機 械 学 習 によらない 3 つの手 法 による NFR キーワードの重 みで比
較 評 価 し,追 加 実 験 として教 師 なし機 械 学 習 の手 法 であるクラスタリングによる
3 段 階 評価 ,最 後 に(4)RFP を社 会 的影 響 により3つのカテゴリに分 類し,3 つ
の手 法 の中で有 効 であった「拡 張 TF-IDF」により評 価を行 い,「NFR キーワー
ド評 価 シート」による非 機 能 要 件 の評 価の有 効 性を検 証した.
最 初 のステップでは,文 献 およびウェッブに公 開 されている調 査 結 果 をもとに
「非 機 能 要 件 評 価 シート」を作 成し,非 機 能 要 件である「小 項 目 」による RFP の
非 機 能 要 件 の記 述 内 容 の明 確 さの評 価 が可 能 であるかについてケーススタデ
ィを行 った.ケーススタディでは,ウェッブ上 に公 開 されている 29 件 の RFP デー
タを「非 機 能 要 件 評 価 シート」に基 づいて評 価 した結 果 を情 報 化 対 象 ドメインご
とに分 類して比 較 評 価 した.さらに,29 件の RFP 評 価 結 果から,評 価の高 い 3
個 の RFP を評 価 基 準 とした RFP の相対 比 較を行った.RFP の比 較 評 価を行
った結 果 ,どの「小 項 目 」(非 機 能 要 件 )による記 述 内 容 が明 確 でないかについ
て情 報 化 対 象 ドメイン毎 に定 量 的 に視 覚 化 できることがわかった.また,「非 機
能 要 件 評 価 シート」に基 づいて 3 人 の評 価 者 が評 価 した一 部 の「小 項 目 」(非
機 能 要 件 )について,評 価 者 によるばらつきに有 意 差 があり,今 後 はより多 くの
評 価 者による手 動 評 価のばらつきを抑 えることが課 題 である.
第 2 のステップでは, RFP に記 述 されている NFR キーワードの出 現 頻 度を
説 明 変 数 とし,手 動 評 価 結 果 を教 師 データ(目 的 変 数 )としたランダムフォレスト
手 法 による自 動 評 価 実 験を行った.実 験 では,ウェッブ上 に公 開 されている 70
92
件 の RFP データをテキスト変 換 した後 にテキストマイニングによる NFR キーワ
ード抽 出を行った.抽 出した NFR キーワードを関 連 付 けた 26 個 の「小 項 目」
(非 機 能 要 件 )について2段 ,3段 および5段 の手 動 段 階 評 価 を教 師 データとし
てランダムフォレストによる評 価 推 定 実 験を行った.ランダムフォレストによる評 価
推 定 と手 動 評 価 との一 致 率 を比 較 およびκ統 計 値 により検 証 した.実 験 の結
果 ,単 純 比 較による一 致 率は,69.8%であった.また,26 個 の NFR 指 標を平
均 した 3 段 階 評 価のκ統 計 値 は 0.4063 であり,κ統 計 値の判 定 基 準で「中
程 度の一 致 」と判 定 された.これは,2 段 階 評 価および 5 段 階評 価 との比 較に
おいて高 い一 致率 であり,3 段 階 評 価が RFP の NFR キーワードによる自 動 評
価 モデルとして,非 機 能 要 件 の記 述 の明 確 化 を支 援 することに有 効 であること
が分 かった.ただし,NFR キーワードの選 定 や数 を変 えてモデルのチューニン
グを行 い,ランダムフォレストの精 度 を高 めることが今 後 の課 題 である.
第 3 ステップでは,RFP に記 述 されている NFR キーワードによる評 価 法 とし
て「単 純 TF-IDF」,「拡 張 TF-IDF」および「キーワード比 」の 3 つの手 法 を
NFR キーワードの重 みとして評 価 実 験 を行 った.ウェッブ上 に公 開 されている
161 件 の RFP データを収 集し,評 価 結 果を比 較した結 果は,「拡 張 TF-IDF」
手 法で評 価 対 象 とした 6 つの「小 項 目」のすべてにおいて,手 動 評 価 との相 関
係 数 が高 いことが分 かった.しかし,「拡 張 TF-IDF」と「手 動 評 価 」との比 較 に
おいて,各「小 項 目 」に外 れ値 となった RFP があり,NFR キーワードによる評価
に文 章 の前 後関 係 や文 脈も含 めた手 法の改 良が今 後 の課 題 である.
次 に,この実 験 結 果 をもとに k-means 法 によるクラスタリングの追 加 実 験 を
行 った.6 個 の「小 項 目 」についてのクラスタリングと手 動 評 価 との一 致 率 は
60.5%であった.一 方 ,クラスタリングの評 価 尺 度 であるエントロピー及 び純 度
はそれぞれ 0.737 と 0.606 であり,エントロピーを低 く,純 度を高 くするアルゴリ
ズムと組 み合わせることが今 後の課 題 であることが分 かった.
さらに,「NFR キーワード評価 シート」による非 機 能 要件 の評 価 の有 効 性を確
認するために 161 件 の RFP を社 会 的 影 響による 3 つのカテゴリに分 類 して,
第 3 ステップで提 案 した「拡張 TF-IDF」法による評 価 と手 動 評 価の比 較を行
った.算 出 した評 価 スコアにおいて,「社 会 的 影 響 が極 めて大 きいシステム」で
93
あっても非 機 能 要 件 の記 述 が明 確 でない「非 機 能 要 件 」があることが,「社 会 的
影 響 が限 定 されるシステム」や「社 会 的 影 響 が少 ないシステム」との比 較 によっ
て明 らかになった.しかし,さらに多 くの RFP による実 験 と検証 が課 題であること
も分 かった.
本 論 文の成 果 により,超 上 流 工 程 でユーザが作 成 した RFP の非 機 能 要 件
の記 述 内 容 を「非 機 能 要 件 評 価 シート」および「NFR キーワード評 価 シート」を
用 いた提 案 手 法 で定 量 的 に評 価 し,評 価 指 標 とすることを示 すことができた.
今 後 は,提 案 手 法 の精 度 向 上 と有 効 性 を高 め,非 機 能 要 件 の明 確 化 を定 量
評 価 することにより,委 託 ソフトウェア開 発 の超 上 流 工 程 におけるユーザ要 件 定
義 を支 援する研 究を続 けたいと考 えている.
94
謝辞
本 研 究 を進 めるにあたり,ご指 導 ,ご協 力 頂 いた皆 様 に感 謝 の意 を表 したい
と思 います.本 当にありがとうございました.
研 究 の過 程 で,適 宜 懇 切 なご指 導 ,ご助 言 と共 に,適 切 なご指 摘 を賜 りまし
た,奈 良 先 端 科 学 技 術 大 学 院 大 学 情 報 科 学 研 究 科 松 本 健 一 教 授 に,
心 から深 く感 謝 申し上 げます.
本 研 究 を進 めるにあたり,研 究 発 表 での貴 重 なご指 導 ,ご助 言 を賜 りました,
奈 良 先 端 科 学 技 術 大 学 院 大 学 情 報 科 学 研 究 科 藤 川 和 利 教 授 に,心
から深 く感 謝 申し上げます.
本 研 究 を進 めるにあたり,研 究 の方 向 性 を決 める有 益 なご助 言 と終 始 熱 心 に
相 談 に応 じて頂 き,論 文 執 筆 に際 しては丁 寧 なご指 導 をいただきました,奈 良
先 端 科 学 技 術 大 学 院 大 学 情 報 科 学 研 究 科 門 田 暁 人 准 教 授 に,心 か
ら深 く感 謝 申し上げます.
本 研 究 を進 めるにあたり,研 究 発 表 や会 議 での貴 重 なご指 導 ,ご助 言 を賜 り
ました,奈 良 先 端 科 学 技 術 大 学 院 大 学 情 報 科 学 研 究 科 伊 原 彰 紀 助 教
に,心から深 く感 謝 申 し上 げます.
本 研 究 を進 めるにあたり,奈 良 先 端 科 学 技 術 大 学 院 大 学 情 報 科 学 研 究 科
ソフトウェア工 学 講 座 の皆 様には,研 究 活 動 や学 生 生 活 におきましてさまざまな
ご支 援を賜 りました.心から深 く感 謝 申し上 げます.
最 後 に,精 神 的 にも長 く,時 にはくじけそうになった研 究 生 活 と本 稿 執 筆 に至
る道 のりにおいて,支 え励 ましてくれた家 族 である長 男 と次 男 ,そして家 を離 れ
ての学 生 生 活を見 守り,支えてくれた 妻 美 和 子 に心から感 謝します.
95
参考文献
[1] 情 報 処 理 推 進 機 構 ソフトウェア・エンジニアリング・センター,“共 通 フレー
ム 2007”,オーム社 ,2007.
[2] 情 報 処 理 推 進 機 構 ソフトウェア・エンジニアリング・センター,“非 機 能 要 求
の見 える化 と確 認の手 段を実 現する「非 機 能 要 件 グレード」”,2010.
[3] 日 本 情 報 システム・ユーザー協 会 編 ,“非 機 能 要 求 仕 様 定 義 ガイドライン”,
2008.
[4] 日 本 情 報 システム・ユーザー協 会 ,“ソフトウェア開 発 管 理 基 準 に関 する調
査 報 告 書(ソフトウェアメトリクス調 査 )”,2012.
[5] Rick Kazman, Mark Klein, Mario Barbacci, Tom Longstaff,
Howard Lipson, Jeromy Carriere , “The Architecture Tradeoff
Analysis method” , Technical Report CMU/SEI-98-TR-008, ESCTR-98-008, Carnegie Mellon University, Software Engineering
Institute,1998.
[6] 経 済 産 業 省 ソフトウェアメトリクス高 度 化 プロジェクトプロダクト品 質 メトリクス
WG,“システム/ソフトウェア製 品 の品 質 要 求 定 義 と品 質 評 価 のためのメト
リクスに関 する調 査 報 告 書”,2011.
[7] 日 経 ソリューションビジネス編 ,“システム構 築 のトラブルを回 避 するための
IT システム契 約 締 結 の手 順 とポイント”,日 経 BP 社 ,2008.
[8] Bud Porter-Roth(著), 渡 部 洋子 (訳),“RFP 入 門 ―初 めての提 案 依
頼 書”,日 経 BP 社 ,2004.
[9] 齊 藤 康 廣 , 門 田 暁 人 , 松 本 健 一 , “ソフトウェア委 託 開 発 プロジェクトの超
上 流 工 程 における非 機 能 要 件 評 価 に関 する研 究 ”,奈 良 先 端 科 学 技 術 大
学 院 大 学テクニカルレポート,NAIST-IS-TR2013001,2013.
[10] 佐 藤 知 徳 ,鈴 木 俊 一 ,北 澤 直 幸 ,長 田 晃 ,海 谷 治 彦 ,海 尻 賢 二 ,“ソフト
ウェア要 求 仕 様 における品 質 要 求 の含 有 率 測 定 ツールの設 計 ”,電 子 情
96
報 通 信 学 会 技 術 研 究 報 告 (知 能 ソフトウェア工 学 KBSE2007-57),Vol.
107,No.540, 2008,pp.19-24.
[11] 経 済 産 業 省 商 務 情 報 政 策 局 情 報 処 理 振 興 課 , 情 報 処 理 推 進 機 構 ,
“ 情 報 シ ス テ ム 調 達 の た め の 技 術 参 照 モ デ ル( TRM ) 平 成 22 年 度 版 ”
2011.
[12] 今 村 誠 ,高 山 泰 博 ,三 上 崇 志 ,岡 田 康 裕 ,“技 術 文 書 からの用 語 知 識 自
動 獲 得の検 討 ”,情 報 処 理 学 会 研 究 報告 ,2007(34),2007,pp. 25-32.
[13] 小 林 雄 一 郎 ,田 中 省 作 ,冨 浦 洋 一“N-gram を素 性 とするパターン認 識を
用 いた英 語 科 学 論 文 の質 判 定 ”,情 報 処 理 学 会 研 究 報 告 2012-IFAT105,2012, pp.1-6.
[14] 小 林 雄 一 郎 ,田 中 省 作 ,冨 浦 洋 一 “メタ談 話 標 識 を素 性 とするパターン認
識 を用 いた英 語 科 学 論 文 の質 判 定 ”,人 文 科 学 とコンピュータシンポジウム
論 文 集 , 2011,pp.51-58.
[15] 齊 藤 康 廣 ,門田 暁 人 ,松 本 健 一.“Request For Proposal(RFP)におけ
る保 守 ・運 用 要 件 指 標 の 抽 出 と 評 価 ”, 情 報 処 理 学 会 研 究 報 告 2012SE-175(1), 2012, pp.1-10.
[16] 齊 藤 康 廣 ,門 田 彰 人 ,松 本 健 一 , “非 機 能 要 件 構 築 のための データ”,
奈 良 先 端 科 学 技術 大 学 院 大 学 , http://se-naist.jp/NFR/ ,2014.
[17] 金 明 哲 ,村 上 正 勝 .“ランダムフォレスト法 による文 書 書 き手 の同 定 ”,数
理 統 計 ,第 55 巻 第 2 号 , 2007, pp.255-268.
[18] 樋 口 耕 一 ,“KH_Coder2.x レファレンスマニュアル”,2012,pp.84.
[19] 福 田 淳 一 ,“ テキ ストマ イ ニングの シス テム 開 発 上 流 工 程 適 用 の 試 み”,
Journal of the Society of Project management Vol. 13,N0.2,2011.
[20] Agustin Casamayor, Daniela Godoy, Marcelo Campo“Functional
Grouping of Natural Language Requirements for Assistance in
Architectural Software Design”, Knowledge-Based Systems Vol.
97
30, 2012, pp.78–86.
[21] Agustin Casamayor, Daniela Godoy, Marcelo Campo, “ Mining
Textual Requirements to Assist Architectural Software Design: A
State of the Art Review ” , Artificial Intelligence Rev. 38,2012,
pp.173-191.
[22] Carlos Huertas, Reyes Juárez-Ramírez “ NLARE, “A Natural
Language
Processing
Tool
for
Automatic
Requirements
Evaluation ” , Proceeding of International Conference on Cloud
and Ubiquitous
Computing and Emerging Technologies(CUBE’
2012), September 2012, pp.3-5.
[23] Dan Port, Allen Nikora , Jane Huffman Hayes , LiGuo Huang,
“ Text Mining Support for Software Requirements: Traceability
Assurance”,Proceedings of 44th Hawaii International Conference
on System Sciences,2011, pp.1-11.
[24] Leonid Kof, “ Natural Language Processing for Requirements
Engineering: Applicability to Large Requirements Documents”,
http://www4.informatik.tu-muenchen.de/, 2004.
[25] Gokhan Gokyer,Semih Cetin,Cevat Sener,Meltem T. Yondem
“ Non-Functional Requirements to Architectural Concerns: ML
and NLP at Crossroads ” , Proceeding of 3rd International
Conference on Software Engineering Advances,2008, pp.400-406.
[26] Jane Cleland-Huang,Raffaella Settimi,Xuchang Zou,Peter Solc
“ Automated classification of non-functional requirements ” ,
Requirements Engineering12,2007, pp.103-120.
[27] Jane Cleland-Huang,Raffaella Settimi,Xuchang Zou,Peter Solc
“
The
Detection
and
Classification
of
Non-Functional
Requirements with Application to Early Aspects” , Proceeding of
98
14th IEEE International Requirements Engineering Conference
(RE'06),2006, pp.36-45.
[28] Olga Ormandjieva , Ishrar Hussain , Leila Kosseim, “ Toward a
Text Classification System for the Quality Assessment of Software
Requirements Written in Natural Language”,Proceeding of 4th
International
Workshop
on
Software
Quality
Assurance
(SOQUA'07), September 2007, pp.39-45.
[29] Simrandeep Singh Thapar , Hardeep Singh, Karanjeet Singh
Kahlon, “Metrics-Based Evaluation of Quality of Non-Functional
Specifications”,International Journal of Information Technology
and Knowledge Management, Volume 2, No. 1, June 2009, pp.131134.
[30] Yasuhiro Saito, Akito Monden, Kenichi Matsumoto,“Evaluation
of Non Functioanl Requirements in a Request For Posal(RFP) ”,
Proceeding of International Workshop on Software Measurement
and 7th International Conference on Software Process and
Product Measurement (IWSM-MENSURA),Oct. 2012, pp.106 - 111.
[31] Joseph L. Fleiss, “Measuring Nominal Scale Agreement among
Many Rater”, Psychological Bulletin, Vol. 76, No.5, 1971, pp.378–
382.
[32] ローネン・フェルドマン,ジェイムズ・サンガー,辻 井 潤 一 監 訳 ,IBM 東 京
基 礎 研 究 所 ,“テキ ス トマ イ ニ ングハ ンド ブ ック ” ,東 京 電 機 大 学 出 版 局 ,
2010.
[33] Gerard Salton, Michael. J. McGill, “Introduction to Modern
Information Retrieval”, McGraw-Hill, 1983.
[34] Clay Palmeira, Rafael Chaves, Hamilton Cavalcante, Eloi Favero,
“A Requirements Elicitation and Analysis Aided by Text Mining”,
99
International Journal of Computer Science and Network Security
(IJCSNS), Vol.12, No.6,2012, pp.122-128.
[35] Fabrizio Fabbrini, Mario Fusani, Stefania Gnesi, Giuseppe Lami,
“An
Automatic
Quality
Evaluation
for
Natural
Language
Requirements”, Proceedings of 7th International Workshop on
Requirements Engineering: Foundation for Software Quality, 2001,
pp.150-164.
[36] Leonid Kof, “Natural Language Processing: Mature Enough for
Requirements
Documents
Analysis?” , Natural
Language
Processing and Information Systems Lecture Notes in Computer
Science Vol. 3513, 2005, pp.91-102.
[37] Ishrar Hussain, Leila Kosseim, and Olga Ormandjieva, “Using
Linguistic Knowledge to Classify Non-functional Requirements in
SRS documents”, Natural Language and Information Systems
Lecture Notes in Computer Science Vol. 5039, 2008, pp.287-298.
[38] Anna Perini, Angelo Susi, Paolo Avesani, “A Machine Learning
Approach
to
Software
Requirements
Prioritization”,
IEEE
Transactions on Software Engineering Digital Object Indentifier
10.1109/TSE.2012.52, 2012.
[39] 金 明 哲,“フリーソフトによるデータ解 析 ・マイニング 第 60 回 統 計 的 テキ
ス ト 解 析 (5) ~ 統 計 法 則 と 指 標 ~ ” , 統 計 情 報 研 究 開 発 セ ン タ ー
ESTRELA (No.172),July 2008.
[40] 新 納 浩 幸 ,“R で学 ぶクラスタ解 析 ”,オーム社 ,November 2009.
[41] 長 谷 川 亮 ,北 村 元 博 ,海 谷 治 彦 ,佐 伯 元 司 ,“要 求 分 析 のためのドメイン
オントロジ構 築 支 援 ”,電 子 情 報 通 信 学 会 技 術 研 究 報 告 . SS, ソフトウェア
サイエンス 107(176), July 2007, pp.53-58.
[42] 情 報 処 理 機 構 ソフトウェア・エンジニアリング・センター,“非 機 能 要 求 グレ
100
ード利 用ガイド[解 説 編 ]”,April 2010.
[43] 齊 藤 康 廣 , 門 田 暁 人 , 松 本 健 一, “RFP における機 械 学 習による非 機 能
要 件 の 評 価 ” , 研 究 報 告 ソ フ ト ウ ェ ア 工 学 ( SE ) , 2013-SE-179(5),
(2013-03-04), pp.1-7.
[44] Ren ´ e Witte1, Qiangqiang Li1, Yonggang Zhang, and Juergen
Rilling,
“Ontological
Text
Mining
of
Software
Documents”,
Springer-Verlag Berlin Heidelberg 2007 NLDB 2007, LNCS 4592,
(2007), pp.168–180.
[45] 情 報 処 理 機 構 ソフトウェア・エンジニアリング・センター,“IPA/SEC が提
案 する ソフトウェア品 質 指 標 の解 説 ~品 質 作 り込 みガイド(ESQR)の概
要 解 説~”,
www.ipa.go.jp/files/000030337.pdf,January 2013.
[46] Capers Jones 著 ,冨 野 壽 ・小 坂 恭 一 監 訳 ,“ソフトウェア開 発の定 量 化 手
法 第 3 版 ”,共 立 出 版 株 式 会 社 ,July 2010.
[47] Stephen H. Kan 著 ,古 山 恒 夫 ・冨 野 壽 監 訳 ,“ソフトウェア品 質 工 学
の尺 度 とモデル”,共 立 出 版 株 式 会 社,November 2004.
[48] 酒 巻 弘 晃 ,横 山 真 一 郎 ,劉 功 義 ,石 井 信 明 ,田 村 智 幸 ,牛 嶌 一 朗 ,加
藤 俊 ,笠 井 直 貴 ,木 野 泰 伸 ,“RFP の評 価 と品 質 向 上 に関 する研 究 ”,プ
ロジェクトマネジメント学 会 予 稿 集, 2009 春 季 ,pp. 374-379.
[49] 山 本 修 一 郎 ,“~ゴール指 向 による!!~システム要 求 管 理 技 法 ”,株 式
会 社 ソフトウェア・リサーチ・センター,May 2007.
[50] エレン.ゴッテスディナー著 ,三 島 邦 彦 ,前 田 卓 雄 ,宗 雅彦 監 訳 ,成 田
光 彰 訳 ,“要 求 開 発 ワークショップの進め方-ユーザ要 求を引 き出すファ
シリテーション-”,日 経 BP 社 ,July 2007.
101
付録
A. 「NFR キーワード評価シート」1/6
大項目
運用開始の準備要件
中項目
FAT特性
小項目
運用テスト計画
運用テスト実施
運用開始条件
結合テスト
総合テスト
テスト結果評価
システム運用の評価要件
NFRキーワード
APIテスト
結合テスト計画
システムテスト計画書
テスト実施計画書
システムテスト計画
テスト実施スケジュール
システムテスト実施手順書テスト計画書
システムテスト
テスト計画
システム総合テスト
テストシナリオ
総合テスト計画書
受入テスト計画
データ移行計画書
運用テスト計画書
データ移行仕様書
運用テスト手順書
データ移行仕様
運用テスト仕様書
総合テスト仕様書
運用テスト期間
テスト仕様書
運用テストデータ
テスト項目表
テスト実施期間
テスト項目
稼働準備
テスト方法
移行作業マニュアル
テスト範囲
稼働移行
テスト環境
移行手順書
テスト実施
移行環境
ストレステスト
信頼性テスト
再始動テスト
接続テスト
システムレベルテスト
障害対策テスト
システムテスト
操作性テスト
性能テスト
トラブルテスト
データ移行テスト
システム総合テスト
システム稼働
総合テスト
システム移行
システム環境稼動確認テス試験運用
本番環境稼動テスト
テスト実施
システム本番稼動
稼働移行
システム本稼動
テスト運用
システム稼働開始
稼動確認テスト
ユーザ運用テスト
受入テスト
受け入れテスト
受入テスト実施
総合テスト完了報告書
検証システム
テスト報告書
運用前提条件
データ検証
総合テスト終了
システム検証
システム稼働立会報告書
セキュリティテスト計画書
移行実施計画
移行計画
移行手順書
システム移行計画書
システム移行計画
システム移行
運用計画書
試験計画書
接続テスト計画書
結合テスト支援
データ移行
移行データ
データ移行作業
システム移行ツール
移行処理
移行期間
インストールテスト
信頼性テスト
性能評価テスト
セキュリティテスト
結合テスト
稼働テスト
運用テスト実施
テスト稼働
導入テスト
稼働テスト
運用テスト
ユーザテスト
システム稼働立ち会い
稼働日
本番稼働
操作容易特性
オペレーション
操作性
操作マニュアル
システム操作方法
操作方法
操作手順書
システム操作
操作説明書
操作説明
操作手順
システム運用手順書
運用手順書
運用手順
操作環境
入力ミス
操作ガイド
操作ガイド機能
オンラインマニュアル
画面遷移
稼働品質特性
応答性
平均読み出し遅延
転送応答性
応答性
ハードディスク応答性能
画面レスポンス
オンライン応答時間
平均処理応答
スループット
レスポンスタイム
秒程度
性能監視機能
処理速度
システム性能
MPU使用率
CPU使用率
性能目標値
オンライン処理性能
性能
CPU
負荷率
負荷分散性能
負荷分散
負荷許容範囲
最小サーバ負荷
ネットワーク負荷
最大負荷時
負荷予測
稼動実績
安定稼働実績
システム正常性
トランザクションデータ
アクセス頻度
通信速度
稼動安定性
パフォーマンス管理
365日安定稼働
稼動状況
運用スケジュール
稼働期間
24時間365日
最大スループット
安定的レスポンス
最小レスポンス
最小応答
ネットワーク応答
VPNスループット
平均応答
応答時間
秒以内
ms以下
処理性能
アクセス速度
CPU性能
CPU負荷率
性能評価
ネットワーク使用率
%以下
CPU
SPEC
負荷分散方式
負荷分散構成
負荷低減
負荷運用
サーパ負荷
負荷分散装置
負荷監視
ロードバランシング
トランザクション数
トラフィック量
業務稼働率
ダウンタイム
トランザクション管理
アクセス量
平均稼働率
サービス稼働率
稼働状況
安定システム
稼働実績
%以上
サービス稼働率
応答速度確保
メモリ使用率
システム応答速度
データ量
主記憶容量
ハードディスク容量
ネットワーク転送容量
ターンアラウンド
秒以下
MB/s以上
アクセス性能向上
ディスクIO負荷率
性能耐久性
サーバ性能
同時接続数
性能管理機能
演算性能
中央演算処理装置
システム性能
負荷バランス
稼働品質
102
負荷分散機能
負荷計測
動的負荷分散機能
運用負荷
ロードバランス
ピーク時
CPU負荷
稼働率
システム稼働率
年間稼働率
連続稼働
安定運用
連続運転
システム停止許容
正常稼働
システム稼働状況
システム稼動情報
ネットワーク管理状況
%以下
「NFR キーワード評価シート」2/6
大項目
運用監視要件
小項目
中項目
障害検知特性
システム異常検知
障害要因
システム監視特性
運用管理
システム管理
セキュリティ対策特性
不正アクセス
アクセス権限
セキュリティ管理レベル
NFRキーワード
不具合発生
停電信号
状態監視機能
監視機能
異常発生通知
自動運転監視
故障検知
動作監視
トラブル発生
自己診断機能
モニタリング
システム障害
障害要因
障害発生場所
障害発生検知
障害内容
障害情報
障害監視機能
障害の内容
障害切り分け
障害の原因分析
障害システム
障害の分析
プラットフォーム障害
ハードウェア障害
サーバ監視ソフトウェア
ハードディスク障害
電源ユニット障害
プリンタ監視
接続状況監視
状態監視
監視ソフト
異常動作
検知システム
事故発生
統合監視システム
状態情報
システムダウン
システム稼動監視
システム監視
システム停止
障害発生通知
障害発生時点
障害発生箇所
障害通知機能
障害原因
障害監視
障害時
ハード障害発生
障害理由
ネットワーク障害
原因切り分け
ディスク障害
サーバ異常通知機能
ディスク障害用
サーバ故障
ハードウェア障害発生
ネットワークダウン
サーバ異常
運用管理機能
運用監視ソフト
運用監視
運用マニュアル
運用状態
運用権限
運用管理ツール
運転状況
運用スケジュール
上限値警告
監視システム
異常メッセージ
イベント発生
監視内容
システムダウン
運用監視サーバ
システム稼動管理サーバー
システムエラー
異常
障害発生状況
障害発生時刻
障害発生
障害状況
障害検知
障害箇所
システム障害1次切り分け
ソフトウェア障害
障害の切り分け
サーバ障害検出
アプリケーション障害
サーバ障害
電源障害
機器障害
ネットワーク障害
障害検知
データベース機能停止
稼働状況
稼動状態
運用状況
運用維持管理
運用管理要件
運用支援
正常運用
運用管理システム
運用時間
運用管理ソフトウェア
運用管理マニュアル
運用管理ソフト
運用保守
運用権限
運用・管理
運用管理
運用時間帯
運用ルール
運用計画
ファイル監視
システム監視用
ネットワーク監視装置
リモート監視
システム監視機能
ネットワーク監視機能
サーバ運用監視
システム稼働管理
ネットワーク監視機能
サーバ運用管理
システム監視
ネットワーク監視
サーバ管理機能
ネットワークシステム管理 システム管理
サーバ管理
システム管理機能
ネットワーク管理
サーバ監視機能
システム運用管理機能
システム稼働状況
内部機器監視サーバ
システム運用管理
システム運用支援機能
システム監視手順
システム運用管理担当者 システム管理者
運用管理障害監視
運用管理サーバ
運用監視システム
監視ソフトウェア
システム運用機能
稼動監視
遠隔監視
運用監視機能
アクセス制御
漏えい防止
不正アクセス防止
不正アクセス対策
ファイアウォール装置
不正操作対策機能
ファイアウォール機能
不正アクセス対策機器
不正侵入防止
侵入監視
ファイアウォールシステム
不正アクセス
ファイアウォール
アクセス制御機構
侵入対策
利用者パスワード
ファイルアクセス制御
脆弱性
不正アクセス防御対策
不正アクセス対策
脆弱性対策
脆弱性情報
不正アクセス検知
脆弱性
不正侵入
ユーザ数
アクセス権制御
アクセス権限
ユーザ権限
アクセス権管理システム 操作権限
権限レベル
アカウント管理
アクセス権制御
ユーザ権限
利用権限
アクセス権管理機能
アクセスポリシー
利用者権限登録機能
アクセス権
アクセス管理基盤
アクセスコントロール
権限管理
利用者権限管理
管理権限
権限設定
利用者数コントロール
アクセス制限
管理者権限
権限要件
アクセスコントロール機能 制限ユーザ
権限区分
業務権限
権限レベル
情報セキュリティ対策統一基
セキュリティ運用
セキュリティ管理計画書
情報セキュリティ対策基準 セキュリティポリシー管理機能
セキュリティ管理機能
セキュリティ監査
情報セキュリティレベル セキュリティポリシー
情報セキュリティポリシー セキュリティ対策レベル
情報セキュリティ実施手順書
情報セキュリティ実施手順 ローカルセキュリティポリシーセキュリティレベル
セキュリティリスク分析機能
情報セキュリティ管理システセキュリティポリシー
情報セキュリティ管理
セキュリティの確保
インシデント管理
セキュリティー確保
セキュリティリスク
監査業務
セキュリティ管理要領
セキュリティ教育
監査情報
セキュリティ診断
監査証跡
セキュリティの維持
セキュリティに関する研修
セキュリティ確保
セキュリティ管理システム セキュリティ管理
103
「NFR キーワード評価シート」3/6
大項目
運用監視要件
中項目
セキュリティ対策特性
小項目
セキュリティ対応
認証機能
パスワード管理
ウイルス対策
情報漏洩対策
暗号処理
障害対策要件
冗長化特性
冗長化
RAID構成
NFRキーワード
セキュリティワイヤー
セキュリティホール
セキュリティパッチ
セキュリティシステム
スパムブロック機能
サイバー攻撃
シンクライアント方式
セキュリティロック
シンクライアント方式
シンクライアント端末
VPN接続装置
セキュリティパッチ適用
セキュリティ侵害監視
セキュリティ対策レベル
セキュリティテスト
セキュリティ機能
利用者認証機能
本人認証
ユーザID
利用者認証
操作者認証
クライアント認証
生体認証
不正監視
認証方式
認証基盤
認証システム
認証VLAN
ログイン認証
主体認証方式
認証方式
SSLクライアント認証機能
ワンタイムパスワード
パスワード認証
パスワード管理
パスワード情報
パスワードポリシー
パスワードロック
利用者パスワード
旧パスワード
パスワードの変更機能
パスワードの有効期限
不正プログラム
ウィルス検出
ウィルス感染
パターンファイル
ウィルスパターンファイル
ウィルスチェックソフト
ウィルスチェック
ウィルスパターンファイル
検疫ネットワーク機能
検疫サーバ
検疫対象
検疫ネットワーク
検疫エージェント
検疫機能
検疫セグメント
ウィルス除去
情報漏洩対策機器
情報漏洩対策エージェント
情報漏えい防止
改竃防止
データの漏洩
HDD復号化
復号化
暗号化
ハシュ化
ssh暗号化通信
SSL暗号化通信
暗号化通信
暗号方式
二重化構成
電源二重化
多重化対策
多重化
冗長化機構
冗長構成
冗長化構成
冗長化
仮想化技術
ハードウェアRAID-1構成
メモリミラーリング機能
ミラー構成
ミラーリング機能
ミラー化
ミラーリング
ハードウェアRAID
クラスタリング
104
セキュリティチェック
セキュリティモニタリング
セキュリティホール対策
セキュリティパッチ管理
セキュリティゾーン
セキュリティーシステム
シヤドウパスワード機能
VPN接続機能
検疫ネットワーク
セキュリティ実施手順
セキュリティソフトウェア
パッチ管理システム
セキュリティ対策ソフト
セキュリティーレベル
ネットワークセキュリティ
セキュリティソフト
仮想化セキュリティサーバ
セキュリティ設定
データセキュリティ
ネットワークセキュリティ
ネットワークセキュリティシステム
セキュリティ監視
セキュリティ情報
セキュリティ対策状況
セキュリティ対応
セキュリティ対策
セキュリティ侵害監視
セキュリティ侵害
セキュリティレベル
情報セキュリティ対策
情報セキュリティ
セキュリティ脅威
ユーザ認証基盤
ユーザ認証システム
ユーザ認証サービス
ユーザ認証
システムログイン
職員認証
不正ユーザ
利用者認証機構
認証情報
ユーザ認証システム
主体認証情報
ログオン認証
静脈認証
認証機能
端末認証
認証管理
ネットワーク認証
統合認証システム
MAC認証
ネットワーク認証サーバ
サーバ認証
ネットワーク認証
認証サーバ
認証基盤システム
認証データ
認証ソフトウェア
端末認証
認証クライアントソフトウェア 統合認証データサーバ
認証対象者数
パスワード入力
ログインパスワード
パスワード一元管理
ユーザ認証パスワード
初期設定パスワード
パスワード設定
ログイン制御
パスワード変更
ロックアウト処理
認証管理
ログオン制御
パスワード管理機能
利用者のパスワード
パスワード入力
パスワード有効日数
初期パスワード
強制パスワード変更
パスワードの暗号化
パスワード登録
ウィルスソフトウェア
ウィルス監視
ウィルスソフト
攻撃パターン
ウィルススキャンエンジン ウィルス検知報告
ウィルス検知
ウィルスソフト
ウィルスチェック
ウィルスチェックサーバ
ウィルス定義ファイル
ウィルス
アンチウィルスソフトウェア ウィルス定義
アンチウィルス機能
ウイルス対策ソフトウェア ウィルスパターン更新
ウィルス対策システム
ウィルスチェックソフトウェア
ウィルス対策ソフト
ウィルススキャン機能
ウィルス対策
コンピュータウイルス対策
ウィルス対策ソフトWebサーウィルス対策機能
ウィルス対策サーバ
ウィルスチェック対策
ウィルス管理システム
ウィルス監視
ウィルス管理ソフト
ウィルス防御
情報漏洩対策ソフトウェア 情報漏洩対策サーバ
情報漏洩対策
情報漏洩
情報漏えい
データ漏洩
改ざん防止
通信暗号化
公開鍵基盤
鍵管理定義書
鍵管理
秘密鍵
公開キー交換
暗号化キー
暗号化通信路
冗長性
冗長化電源
冗長化度合い
デュアルディスプレイ構成
冗長電源
バックアップ電源
リダンダント機能
ホットスペア
暗号化対策
ファイル暗号ソフトウェア
暗号化通信機能
暗号化強度
鍵管理定義書
暗号通信モード
暗号化ファイルサーバ機能
RAIDコントローラ
RAIDO+1構成
RAIDレベル
RAIDグループ
RAID
RAID機能
RAID構成
クラスタシステム
RAIDレベル
RAIDO1構成
RAID5ストレージ
RAID5構成
RAID5
クラスタ構成
RAID
ディスクアレイシステム
ディスクアレイ
コールドスタンバイ
ホットスペアディスク
コールドスタンバイ方式
分散システム
仮想化管理サーバ
仮想化サーバ
「NFR キーワード評価シート」4/6
大項目
障害対策要件
中項目
データバックアップ特性
小項目
バックアップ管理
バックアップシステム
障害予防特性
障害対策
障害管理
停止処理
障害復旧特性
リカバリ処理
パッチ処理
災害対策要件
災害対策特性
地震対策
災害対策
保守生産性要件
問題点把握及び修正分析 運用ログ
システムログ
NFRキーワード
日中バックアップ
フルバックアップ
データバックアップ機能
定期バックアップ
一括バックアップ
データバックアップ方式
日次バックアップ
フルバックアップイメージ
バックアップ対象データ
定期的バックアップ成功率 フルバックアップ運用
バックアップイメージ
自動バックアップ
フルバックアップ
バックアップデータ
システムバックアップ
暗号化バックアップ機能
バックアップ方式
バックアップデータ
各種ログバックアップ
データバックアップ
データバックアップ
データバックアップスケジューデータ退避保存
差分ブロック
バックアップスケジュール データ保護
差分データ
バックアップデータ項目
バックアップ管理
差分バックアップ
バックアップ期間
バックアップ仕様
世代保管
バックアップ速度
バックアップ運用
差起動
バックアップ手順
データのバックアップ
差分データバックアップ
データバックアップ方法
バックアップ対象
バックアップを自動
定期的にバックアップ
世代管理
バックアップ転送
バックアップソフトウェア
専用バックアップサーバ
バックアップ実行
バックアップソフト
バックアップ専用サーバ
バックアップ機能
バックアップシステム
バックアップ装置
バックアップツール
バックアップソフト
バックアップ媒体
バックアップ統合基盤
バックアップ用
バックアップ電源
バックアップ基盤
バックアップ機構
バックアップ用サーバ
バックアップ処理
データバックアップ用機器 バックアップサーバ
耐障害性
システム障害対策
障害対応
障害予防
故障対策
障害時
障害対応マニュアル
障害未然防止
障害対策マニュアル
雷対策
障害調査
障害切り分けマニュアル
停電対策
障害対応方法
障害検知ソフトウェア
ホットスワップ
障害対策
緊急対応機能
ホットプラグ機能
停電装置
フェイルオーバー機能
システム障害対応
障害履歴
計画停電対応
障害再発防止
障害票
障害発生頻度
障害管理方法
障害手順書
障害事後対策
障害管理
障害対応結果報告書
障害管理機能
障害対応計画
障害再発限度
障害防止管理
電源管理ソフトウェア
障害管理計画
障害発生限度
障害管理サーバ
障害管理台帳
冗長稼働
計画停止
自動シャットダウン用サーバ機能
停止期間
停止システム
自動シャットダウン
停電処理
自動システム停止機能
リモートシャットダウン
停止稼動
計画停電対応
シャットダウン
業務停止
縮退稼働
停電状態
停止処理
保守停止
縮退
非常時緊急運用
通常稼働
正常稼動
障害連絡
緊急停止
マルウエア対策
シャットダウン方式
シャットダウン
システムクローズ処理
システムクローズ
停止順
正常に停止
強制停止
自動停止
正常なシステム停止
復旧方法
システム復旧
回復レベル
復旧対応
システム回復
回復内容
復旧対策
リカバリプロセス
回復作業
復旧状況
リカバリ処理
障害回復用
復旧作業
セッションリカバリ機能
障害回復
復旧作業対応
データリカバリ処理
回復手順
障害復旧
データリカバリ
システム障害回復
復旧対応作業
リカバリーディスク
システム回復作業
復旧処置
自動リカバリ
データ復旧操作
復旧機能
回復処理
データ復旧
フェイルオーバー
リカバリー
迅速な復旧
復旧措置
復旧時間
復旧期限
回復時間
プログラム修正パッチ
パッチ適用
動作確認手順書
パッチ適用管理機能
パッチファイル適用状況
動作確認
プログラム修正パッチ適用対システム起動
バッチプログラム
バッチ管理
パッチ対応
パッチ
修正パッチ
パッチファイル
耐震対策
耐震措置
耐震性能
耐震基準
耐震設備
災害発生
天災地変
災害対策機能
災害対策サービス
災害対策
災害時
規模災害
延焼防止対策
操作日時ログ
アクセスログ機能
ログ収集
操作ログ
アクセス履歴
バッチ処理実施ログ
操作証跡
アクセスログ
ロギング機能
オペレーション記録
アクセス情報
ログ情報
操作履歴
履歴情報
運用ログ保存用領域
操作者名ログ
アクセスログデータ
ログ記録
アクセス記録
アクセス数
ログデータ
アクセスリスト
データ収集機能
履歴記録機能
データベースアクセスログ ログ収集機能
システムログ情報
出力ログ
実行ログ
システム監視記録
変更ログ
エラーログ
システム操作ログ
業務ログ
イベントログ
トランザクション記録
システムログ
セキュリティログ
システム監視記録
イベントログ形式
故障記録
監査ログ
更新ログ
変更履歴
105
「NFR キーワード評価シート」5/6
大項目
保守生産性要件
中項目
小項目
問題点把握及び修正分析 ログ管理・解析
保守容易性
操作マニュアル
運用管理マニュアル
システム管理マニュアル
保守マニュアル
構成管理管理
バージョンアップ
システム構成
パッケージ
モジュール性
業務運用と利用者支援要件 サービス特性
サービス体制
サービス内容
サービスレベル
保守契約条件
ライセンス契約
同時使用ユーザ数
NFRキーワード
履歴管理機能
送信ログ管理
送信ログ管理
履歴管理システム
ログ監視
ログ監視
世代管理
ログ管理
ログ管理
アクセスログバックアップ アクセスログ管理
アクセスログ管理
履歴管理
利用履歴管理機能
利用履歴管理機能
更新ログ管理機能
ログ解析機能
ログ解析機能
故障履歴管理
端末操作マニュアル
オンライン操作マニュアル システム管理者向け操作マニュアル
操作マニュアル
オンラインマニュアル
システム操作マニュアル
利用者マニュアル
操作マニュアル作成
オンラインマニュアル
操作手順書
各種操作マニュアル
各種操作マニュアル
運用マニュアル
運用マニュアル
管理運用マニュアル
業務運用マニュアル
業務運用マニュアル作成 システム運用手順書
稼動運用マニュアル
運用管理マニュアル
システム運用マニュアル
運用マニュアル作成
ユーザマニュアル
運用手順書
業務運用マニュアル
システム管理マニュアル ソフトウェア仕様書
システム管理者向けマニュアル
バックアップマニュアル
システムインストール手順書システム管理者マニュアル
データベース定義書
データペース管理マニュアルシステム利用者マニュアル
データベース仕様書
データベース仕様書
システム管理者用作業マニュアル
ハードウェアマニュアル
インターフェース定義書
システム管理者向けマニュアル
運用保守マニュアル
サポートデスク運用マニュア システム仕様書
ネットワーク機器設定報告書
運用保守向けマニュアル システム取扱説明書
サポートデスク運用マニュア運用保守マニュアル
システム機能仕様書
システム保守手順書
完成図書
システム機能定義書
各種障害対応マニュアル システムドキュメント
取扱説明書
システム構成管理
データベース更新履歴作成構成変更履歴
ハードウェア構成管理機能構成管理機能
構成機器管理
ハードウェア構成情報管理構成情報管理
構成管理
ネットワーク構成情報管理 ソフトウェア構成情報管理 構成情報収集
ソフトウェア構成情報管理 構成管理ファイル
構成変更
ソフトウェア構成管理機能 ハードウェア構成情報管理 構成管理業務
ソフトウェア構成管理
ソフトウェア構成管理
ソフトウェア構成情報
機器構成管理
時刻管理
バージョン管理ツール
バージョン管理システム
バージョン管理機能
バージョンレペル管理
バージョンアップ情報
バージョン管理
バージョンアッププログラム バージョンアップ
バージョンアップ作業
ドキュメント管理
ドキュメント管理業務
システムバージョンアップ ソフトウェアバージョン
システムバージョンアップ
リソース管理機能
システム構造
拡張容易性
システム構成
システム拡張
システム構成図
サーバ構成
ハードウェア構成
ネットワーク構成図
ディスク構成
ハード構成
ネットワークシステム構成 拡張性
データ構造
ネットワーク構成
ネットワーク構成
ソフトウェア構成
ソフトウェア構成図
パッケージ製品
パッケージソフト
ソフトウェアパッケージ
パッケージツール
パッケージ仕様書
パッケージプログラム
パッケージシステム
パッケージソフトウェア
カスタマイズ量
モジュール構成
サーバソフトウェア
リソース管理機能
ソフトウェア構造
システムファイル
システム開発言語
システム基本ソフトウェア データベースソフト
開発言語
システムソフトウェア
データベース管理ソフトウェアFORTRANコンパイラ
オぺレーティングシステム システム基本ソフトウェア Cコンパイラ
ソフトウェアモジュール
データ構造
プログラム開発言語
オペレーションシステム
システムデータ
システム開発言語
窓ロサービス
サポートデスク業務
サービス内容
ヘルプデスク体制
サポートデスク運営
サポート体制
ヘルプデスク業務
サポートデスク
サポートデスク
運用サポート
システムサポート
運用支援
ヘルプデスク
保守サポート
保守支援体制
ヘルプデスク情報
初期サポート
保守体制
ヘルプデスク業務
サポート内容
保守サービス体制
保守点検
保守内容
保守サービス
保守手順書
保守設計
メンテナンス作業
保守計画書
保守作業
定常保守作業
保守計画
保守対象
システム保守運用
操作支援
保守手順
ネットワーク保守
操作指導
保守業務
データ保守
支援業務
保守期間
電子化情報提供システム
目標値サービスレベル
サービスレベル協定
SLA定義書
保守作業履歴
サービスレベル
SLA契約
保守管理
サービスレベル基準値
SLA契約内容
サービスレペル項目
サービス仕様書
保守管理業務
サービスレベル管理
サービスレベル管理
サービス稼働率
サービスレベル設定
サービスレベル協定
使用権
利用許諾ライセンス
ソフトウェアライセンス
使用許諾ライセンス
使用許諾契約
アップグレード権
ライセンス数
使用許諾
ロックライセンス
ライセンス契約書
使用許諾証書
ライセンス証明書
ソフトウェアライセンス管理機
使用許諾ソフトウェア
ソフトウェアライセンス情報
ソフトウェアライセンス管理 現有ライセンス
セカンドライセンス
クライアントライセンス
ライセンス状況
アカデミックライセンス
License方式
ソフトライセンス
ライセンス管理
最大同時接続数
同時ユーザ数
同時接続
同時利用ユーザ数
同時アクセス
同時アクセス数
同時実行数
必要ライセンス数
追加ライセンス
同時アクセスユーザ
ライセンス数
同時接続ユーザ数
同時利用ライセンス数
106
「NFR キーワード評価シート」6/6
大項目
中項目
小項目
保守タイプ
知的財産権
障害対応特性
障害対応
導入教育特性
研修方式
研修内容
研修機材
研修計画
研修対象
NFRキーワード
予防保守計画
アプリケーション保守
定例保守作業
予防保守管理
定期保守作業日
定例保守
定期的保守
定期的保守
運用保守業務
定期保守
リモート保守
定期メンテナンス
オンサイト保守
パッケージシステム保守
ソフトウェア保守
システム保守
システム保守運用
システム保守業務
システムメンテナンス
システム保守体制
著作物
著作権侵害
著作権法
知的財産権
著作権
権利侵害
所有権
著作者
機密保持
著作権者
著作者人格権
知的財産
問い合わせ対応サービス 障害問合せ
非常時対応
故障対応状況
障害対応
ハードウェア障害対応
故障対応
不具合対応
365日障害対応
障害対応体制
保守障害対応
故障対応業務
導入研修
集合研修受講
操作説明会
オンライン研修
操作研修会
操作教育用
操作訓練等導入スケジュー操作教育
集合教育
端末操作研修
操作説明
操作研修場所
操作研修コース
講習会
教育研修内容
研修実施
操作教育
研修項目
研修方法
研修開催
研修受講
教育研修
研修支援業務
教育訓練
研修環境
研修カリキュラム
教育研修環境
研修内容
研修コース
研修会場
教育カリキュラム作成
研修場所
研修用テキスト
研修用クライアント機
研修用サブテキスト
研修教材
端末操作研修用テキスト 研修用資料
操作教育用資料
教育研修用教材コンテンツ
研修マニュアル
教育用資料
研修テキスト
研修用システム
研修用データ
研修用
研修計画書
教育計画書
研修計画
研修環境構築
研修環境構築計画
教育研修作業
教育研修体制
教育訓練
教育訓練計画
教育訓練計画
利用者向け研修
利用者研修
利用者研修
新人研修
担当者向け研修
職員研修
職員研修計画
受講者
受講対象
研修対象職員数
研修対象人数
研修受講者
研修受講者数
運用管理者研修
管理者研修
利用者教育
ユーザ教育
職員向け研修
107
システム運用業務
予防保守
定期保守点検
定期点検
遠隔保守
ハードウェア保守
システム保守業務
システムメンテナンス作業
オンサイト保守
セキュリティ保守
権利帰属
瑕疵担保責任
保守業務委託契約
秘密保持契約
保守契約
365日保守対応
障害対応記録
運用保守業務報告書
保守作業報告
保守報告書
操作研修
集合研修
システム操作研修
システム管理研修
システム運用研修
ネットワーク管理教育
システム導入研修
システム操作研修サービス
教育研修方法
運用管理研修
運用研修
研修プログラム
定期研修
研修回数
研修日程
研修開始日
研修機材
研修資料
研修テキスト操作研修用
操作研修用マニュアル
操作研修マニュアル
操作教育用資料
端末操作研修用テキスト
教育計画書
教育研修計画
教育研修
システム管理者研修
受講対象者
個別研修
研修対象者
教育研修対象
保守運用者研修
システム管理者向け研修会
付録
B.161 件の RFP による「NFR キーワード評価シー
ト」の評価対象「小項目」
応答性
語数:33
リカバリ処理
語数:53
アクセス管理
語数:71
応答性
最小応答
平均応答
最小レスポンス
応答速度確保
安定的レスポンス
転送応答性
端末レスポンス
ネットワーク応答
画面レスポンス
ハードディスク応答性能
平均読み出し遅延
復旧方法
復旧対応
復旧対策
復旧状況
復旧作業
復旧作業対応
障害復旧
復旧対応作業
復旧処置
復旧機能
復旧措置
故障復旧
障害回復用
障害回復
障害復旧対応
回復処理
障害リカバリ手順
回復手順
不正アクセス
不正アクセスを検知する機能
不正アクセスを検知できる機能
不正なアクセス
不正アクセスを発見
不正侵入
不正侵入検知
不正侵入の検知
不正侵入障害発生
不正アクセス監視状況
不正ユーザ
侵入監視
不正アクセス検知
不正ログイン
不正コード
不正アクセス対策
不正アクセス防御対策
不正侵入監視手順
不正侵入障害対応手順
不正接続検知
不正侵入検知パターン適用
不正アクセス防止
不正アクセスを防止
不正アクセスを制御
不正アクセスの監視・記録
侵入対策
不正侵入防止
不正アクセスの解析
不正侵入防止機能
不正侵入保護装置
なりすまし防止
不正アクセス報告
不正アクセス状況
システム応答速度
スループット
スループット目標値
最大スループット
VPNスループット
応答時間
オンライン応答時間
レスポンスタイム
レスポンス目標値
ターンアラウンド
秒程度
秒以内
迅速な復旧
回復作業
データリカバリ処理
データリカバリ
データ復旧操作
データ復旧
データ復元
データ復元ポイント
システム復旧
システム回復
システム障害回復
システム回復作業
システムリカバリ
リカバリプロセス
リカバリ処理
ダウンリカバリ
リカバリ運用
セッションリカバリ機能
権限が設定されたユーザ
更新権限
利用者ごとの権限
利用者の権限
閲覧権限
ユーザ権限
アクセス権
業務権限
権限要件
利用権限
管理者権限
ファイルアクセス権
制限ユーザ
アクセス認証
権限変更
変更権限
アクセス権限機能追加
アクセス権更新
権限変更発生
利用者権限登録機能
アクセス権限設定
権限設定
利用者権限管理
アクセスコントロール
アクセスコントロール機能
アクセス制御
アクセス制限
アクセス制御機構
アクセス制限情報
アクセス管理
ユーザアクセス制御
アクセス制御サーバ
データアクセス制限
108
秒以下
タイムラグ
平均処理応答
フォワーディングレート
メモリ使用率
主記憶容量
ハードディスク容量
ネットワーク転送容量
データ量
リカバリー
起動確認
端末リカバリ
リカバリーディスク
自動リカバリ
リカバリディスク
リカバリディスク作成
リカバリ対象機器
リカバリログ
障害回復用ログファイル
障害回復テスト
復旧時間
回復時間
回復レベル
回復内容
復旧期限
システム管理者権限
アクセス権限管理
権限管理
管理者の承認を要する設定
アクセス権限設定
アクセス権限の設定
アクセス権限の管理機能
アクセス権限の登録
アクセス権限を追加
ログイン試行回数の制限
アカウントの属性履歴
ログイン用アカウント
アクセス数
エンドユーザのアカウント
ユーザアカウント
アカウントデータ
電子メールアカウント
アプリケーションのアカウント
ユーザ・アカウント管理
アカウント管理ツール
ユーザ数
ユーザ制限機能システム
アクセスログ
データベースアクセスログ
アクセスログ管理
アクセスログの管理
アクセスログを分析
アクセスログを監視
アクセスログ解析
アクセスログによる追跡機能
アクセスログを記録
アクセス履歴の管理
アクセス履歴等の管理
アクセス権限
操作権限
権限レベル
アクセス権限を管理
入力等の権限
使用者権限設定
操作者権限
権限を有するもの
負荷バランス
負荷分散
語数:41
負荷分散性能
負荷分散処理
負荷分散機能
負荷分散環境
負荷分散装置
ロードバランス
ロードバランシング
ロード・バランシング
ロードバランス設定
ロードバランシング構成
負荷分散ポリシー
負荷低減
負荷運用
セキュリティ管理 セキュリティ管理
語数:102
セキュリティ確保
セキュリティ運用
セキュリティの確保
セキュリティー確保
セキュリティの維持
セキュリティ設定
セキュリティ運用手順
セキュリティ権限
情報セキュリティ
情報セキュリティ対策統一基準
情報セキュリティ対策基準
情報セキュリティ実施手順書
情報セキュリティ実施手順
セキュリティ実施手順
情報セキュリティ管理
情報セキュリティマネジメントシステム
情報セキュリティ規則
情報セキュリティ対策要領
情報セキュリティ運用マニュアル
セキュリティ管理システム
セキュリティ管理機能
セキュリティ管理計画書
セキュリティ管理要領
セキュリティガイドライン
情報セキュリティ管理区域
セキュリティレベル
セキュリティーレベル
セキュリティ管理レベル
セキュリティ対策レベル
情報セキュリティレベル
インシデント管理システム
インシデント管理サーバ
最新セキュリティパッチ
障害対策
障害処理
語数:76
障害対策
システム障害対策
障害対応方法
障害対応
障害連絡
故障対策
故障対応
エラー処理
マルウエア対策
マルウェア対策ソフトウェア
障害調査
ファイルアクセス制御
アクセス制御ソフトウェア
アクセス管理基盤
アクセスポリシー
アクセス制御管理
システム使用制限
アクセス権管理システム
アクセス権制御
運用負荷
負荷分散システム
負荷分散方式
負荷分散構成
動的負荷分散機能
負荷分散停止
サーバ負荷分散
負荷分散クラスタ
自律負荷バランス機能
サーバロードバランサ
CPU負荷
ネットワーク負荷
ネットワークの負荷
負荷分散対象ノード
インシデント管理ソフトウェア
インシデント管理機能
インシデント項目
インシデント発生分析
インシデント発生件数
インシデント番号
インシデントレポート管理
インシデント管理業務フロー
インシデントレポート
インシデント管理
インシデント発生状況
コンピュータセキュリティインシデント
監査証跡
セキュリティ監査ツール
監査業務
監査情報
セキュリティ監査
情報セキュリティ監査報告書
セキュリティ監査ログ
情報セキュリティ監査
情報セキュリティポリシー
セキュリティポリシー
検疫ポリシー変更手順
ローカルセキュリティポリシー
セキュリティ方針書
情報セキュリティ教育
情報セキュリティ研修
セキュリティ教育
セキュリティに関する研修
セキュリティリスク
セキュリティイベント件数
セキュリティ対策適用箇所一覧
セキュリティチェック項目
セキュリティリスク分析機能
ホットプラグ機能
電源管理ソフトウェア
障害未然防止
障害予防
障害防止管理
障害再発防止
落雷対策
雷対策
停電装置
停電対策
障害発生機器
障害再発
109
アクセスログの記録
アクセス数
アクセス履歴
アクセスログデータ
アクセス解析データサーバ
ネットワーク負荷分散
回線負荷
最大負荷時
負荷率
最小サーバ負荷
ピーク時
ピーク時の負荷
高負荷
負荷許容範囲
負荷監視
負荷検査
負荷予測
負荷計測
セキュリティパッチ機能
セキュリティパッチ提供
セキュリティパッチ適合
セキュリティパッチ配付
セキュリティパッチ管理
セキュリティ修正パッチ
セキュリティパッチ
セキュリティパッチ内容適合
セキュリティパッチ適用計画
セキュリティパッチ対策ソフトウェア
パッチあて
修正パッチ
パッチ適用
バッチプログラム
パッチ評価
データパッチ
手動バッチ
パッチツール
パッチ対応
パッチファイル
バグ修正パッチ
OSパッチ処理
プログラム修正パッチ
システムバッチ
システムバッチログ
バッチ管理
パッチ情報
プログラム修正パッチ適用対応
パッチ適用管理機能
パッチファイル適用状況
システムバッチ実施状況
修正パッチ適用環境
オンラインバッチ処理
障害管理
障害管理機能
障害管理プロセス
耐障害性
障害事後対策
障害判定基準
障害管理サーバ
障害発生日時
障害発生頻度
障害再発限度
障害発生限度
障害分類毎障害件数
システム障害対応
トラブルシューテイング
365日障害対応
緊急対応機能
障害対応状況報告書
故障対応状況
計画停電
計画停電対応
計画停止スケジュール
計画停電テスト
フェイルオーバーテスト
フェイルオーバー機能
リンクアグリゲーション
ホットスワップ
障害再発防止
障害検知ソフトウェア
障害履歴
障害票
障害対応結果報告書
障害管理台帳
アクシデントレポート作成機能
障害報告書
障害記録
障害管理簿
エラーログ管理
障害管理計画
障害対応計画
障害管理方法
110
障害対応工数
ハードウェア障害対応マニュアル
障害対応マニュアル
障害手順書
情報システムダウン対策マニュアル
障害復旧手順
回線障害対応手順
サーバ障害対応手順
不正侵入障害対応手順
障害対策マニュアル
トラブルシューティング機能
障害切り分けマニュアル
Fly UP