...

第 16 回 月例発表会 - 医療情報システム研究室

by user

on
Category: Documents
8

views

Report

Comments

Transcript

第 16 回 月例発表会 - 医療情報システム研究室
Vol.1 No.16 19 .September 2012
The Monthly Lecture Meeting
第 16 回 月例発表会
第 1 巻 16 号
同志社大学生命医学部
医療情報システム研究室
Published by the Medical Information System Laboratory
OF Doshisha University, Kyotanabe, Japan
Medical Information System Laboratory
The Monthly Lecture Meeting
Contents
iGA を用いた快画像抽出システム
松浦 秀行 . . . 1
個人の感性モデルに基づく推薦システムのオンラインショッピングサイトデータへの適用
宮地 正大 . . . 3
多峰性の嗜好を推定する対話型遺伝的アルゴリズムの交叉手法の検討
田中 美里 . . . 7
第 16 回 月例発表会(2012 年 09 月 19 日)
医療情報システム研究室
iGA を用いた快画像抽出システム
松浦 秀行
Hideyuki MATSUURA
背景:人が画像に持つイメージは定性的なものであり,その値を求めることは難しいとされている.
研究目的:難しいとされている人間の感性を求めるような研究をする.
発表の位置づけ:IAPS 画像のうちユーザが快と思われる画像を抽出するシステムを構築した.
方法:人の感性の解析を行うことのできる iGA を用いる.
結果:被験者実験の結果,ある特定の固まったジャンルから快画像をシステムが抽出することができた.
はじめに
1
を生成する.
人間はある画像やイメージが与えられたときに,好き, 2. 評価とは,ユーザフェイスを用いてユーザが主観に基
づいて個体を評価し,各個体に適応度を与える.
嫌いや良い,悪いといった印象を受ける.しかし,そのよ
うな印象というものは定性的なものであり,求めるのは難
3. 選択とは,生物の自然淘汰をモデル化したもので,適
しい.例えば,情動研究に用いられている International
応度にもとづいて個体を増やしたり減らしたりする操
Affective Picture System(IAPS) と呼ばれる感情を喚起
させる画像セットがある.それらの画像は,ある指標に基
作である.
4. 交叉とは,生物が交配によって子孫を残すことをモデ
ル化したもので,個体の一部を入れ替える操作である.
づいてその画像が快を喚起する快画像,不快を喚起する
不快画像というように定められており,それは統計的に定
5. 突然変異とは,生物に見られる遺伝子の突然変異をモ
められたものであり その指標には Valance(誘発性),
デル化したもので,個体の一部を変化させる操作であ
Arrousal(覚醒度),Dominance(支配的主観) があり,3 つ
の指標がより高いほどより快と感じる快画像,Arrousal
る 1) .
のみがより高いほどより不快に感じる不快画像と定義さ
れている.しかし,
、これは万人に共通するとは限らなく,
個々によってどの程度が最も快と感じるかは異なってい
くる.
現在上記のような人間の感性を解析する手法として
iECs(interactive Evolutionary Computations) と呼ばれ
る技術がある.iECs のうち,iGA は多点に対する評価
値を用い,人間の感性を解析していくことを目的として
おり,今回の個人タスクでは,iGA を前段階として iGA
を用いた IAPS 画像における快画像抽出システムを構築
した.このシステムでは,IAPS における快画像のうち
ユーザが最も快と感じる画像を抽出できるシステムであ
る.
本編では,このシステム概要と被験者実験を行った結
Fig. 1 iGA の流れ
果について述べる.
2
iGA とは
3
iGA(interactive Genetic Algorithms) とは対話性遺伝
IAPS
的アルゴリズムのことで GA の遺伝的操作をベースとし
IAPS(International Affective Picture System ) とは,
情動研究に用いられる標準的な画像セットである.IAPS
て,評価部分を人間の主観による評価で置換したもので
における快・不快画像を表す指標として Valance(誘発性),
ある.
Arousal(覚醒),Dominance(支配的主観) がある.今回,
iGA の基本的な操作の流れを Fig.1 に示す.
1. 初期個体生成とは,あらかじめ設定された数だけ個体
快画像の定義としてはこの三つの値が高いものを快画
像,そして Arousal だけが高いものを不快画像としてい
001
る.そのため,今回の実験では不快画像を示す指標であ
いった個人差の生じるものを定量的に判断することは難
る Arousal は使わず,Valance と Dominance を設計変数
しいとされていたが,今回のシステムではその主観的判
として使用している 2) .
断をアルゴリズムの中に組み込むことで人の好みを抽出
することに成功した.
今後の課題としては,今回のシステムのようにユーザ
の好みを抽出するのではなく,ユーザーがどういったも
のを基準として評価しているのかを抽出できるシステム
の構築を目指す.具体的には,医師などが病理画像など
を診断するときに用いる技術や経験を抽出できるように
するといったものである.
参考文献
1) 杉本富利, 村上真, 加藤千恵子. 対話型遺伝的アルゴ
Fig. 2 システムインターフェース
リズムを用いたイメージ検索システムにおけるイン
タラクション戦略. バイオメディカル・ファジィ・シ
実験
4
4.1
ステム学会誌, Vol. 13, No. 2, pp. 9–18.
実験目的
2) 米田浩久, 中野博子, 久住武. 課題実施時に抱く感情
が及ぼす影響について. 日本心身健康科学学会.
構築した快画像抽出システムにより,ユーザが快を感
じる画像を抽出できるかを確認する.
4.2
実験方法
システムのインターフェースを fig.2 に示す.
今回の実験で,ユーザーは 300 枚の画像から選択して
表示された 12 枚の画像を 1 枚ずつ 5 段階評価していき,
12 枚すべて評価し終えた場合は表示ボタンを押して次に
進むことが出来る.
4.3
実験パラメータ
今回の実験のパラメータを Table.1 に示す.
Table. 1 パラメータ
パラメータ
値
個体数
12
世代数
10
ルーレット選択
1.0
選択方法
交叉率
交叉方法
αの値
突然変異
4.4
BLX-α
0.2
なし
実験結果
10 世代後に表示された画像と初めに表示された画像を
を比べると,初めはジャンルも全くバラバラな画像が表
示されていたが,第 10 世代ではユーザが高評価を与え
たジャンルの画像が表示されていることが確認できた.
5
まとめ
今回は,iGA を使った快画像抽出システムにより人の
主観的判断を用いた最適化を図った.本来,快・不快と
002
第 16 回 月例発表会(2012 年 09 月 19 日)
医療情報システム研究室
個人の感性モデルに基づく推薦システムの
オンラインショッピングサイトデータへの適用
宮地 正大
Masahiro MIYAJI
背景:インタラクティブな推薦システムにおけるリアルタイム処理のための計算モデル
研究目的:研究の大目的(最終到達点や研究によって実現できること)50 文字以内で記入
発表の位置づけ:小目的(研究における本発表の到達点)50 文字以内で記入
方法:提案手法(小目的を達成するための手法)50 文字以内で記入
結果:実験結果(提案手法の検証結果)50 文字以内で記入
はじめに
1
ンテンツは推薦される可能性が低くなり,推薦されるコ
ンテンツが集中する問題点もある.
情報化技術の発展により,Web 上に膨大な量の情報が
溢れている.これらの大規模なデータから情報を閲覧す
2.2
内容ベースフィルタリング
るユーザが,求めるコンテンツを的確に得ることは難し
ユーザの行動履歴とコンテンツに含まれるメタ情報(著
い.そのため,一部のオンラインショッピングサイトや
者・出版社・内容など)を特徴ベクトルとしてマッチン
ニュースサイトなどではユーザ個別に推薦内容を変化さ
グさせる手法である.推薦システムがユーザ評価を必要
せるパーソナライズされた推薦システムが組み込まれて
としないため,全コンテンツを公平に推薦対象とするこ
いる 1,
とができ,小規模なシステムへの導入が可能である.
2)
.個人の感性をモデル化することで利用者個
別の嗜好に合わせた推薦が可能であると考えられており,
様々な研究が行われている.
2.3
推薦システムのパーソナライズ
ユーザ個人の感性をモデリングする手法として前述の
本研究では,ユーザの感性に近い推薦を行うことを目
標とする.そのため,コンテンツの特徴ベクトルを設計
内容ベースフィルタリングが有用であると考えられる.
変数とした対話型遺伝的アルゴリズムの要素を取り入れ
ユーザの嗜好に応じてパーソナライズされた推薦を行う
た手法を提案する.
ためには,ユーザの嗜好を表す感性モデルを何らかの方
法で学習・予測する必要がある.代表的な手法としては,
対象問題として,オンラインショッピングサイト (楽天
市場1 ) の商品情報を用いた.シミュレーション実験によ
確率推論に基づく手法であるベイジアンネットワークや
り,本手法により類似したコンテンツが推薦結果に現れ
隠れマルコフモデル,ユーザの求める要素(感性)のパ
る可能性を示す.
ラメータを推定・最適化する手法である対話型遺伝的ア
ルゴリズムなどが挙げられる.
推薦システム
2
2.1
対話型遺伝的アルゴリズム
3
協調フィルタリング
3.1
Amazon2) や Google1) などで用いられており,多数
のユーザの中から行動履歴の類似したユーザを抽出する
ことで,そのユーザの参照したコンテンツを推薦し合う
概要
対話型遺伝的アルゴリズム (iGA: interactive Genetic
アルゴリズムであるため,ユーザが未知の商品が推薦さ
Algorithm) は,多点探索の最適化アルゴリズムである
GA をベースとした対話型最適化手法である.人間の感
性のモデルを設計変数空間のランドスケープとして捉え,
れる場合がある.また,推薦・予測にコンテンツ自体の
その空間における最良点,もしくは最良域を探索する.
先験情報が必要ないため手軽に導入が可能であり,多分
iGA を実装したシステムは,ユーザに対して,多数の候
野のコンテンツが入り交じるシステムでの利用が可能で
補解を提示し,ユーザは感性や好みに基づいてそれらを
ある.しかし,システムの条件としてすべてのコンテン
評価し,その評価値を用いてシステムは遺伝的操作を適
ツをユーザが評価する必要があるため,ユーザが多数い
用する.これらの操作を繰り返すことで,集団全体をユー
ることが必要となる.そのため,誰も評価していないコ
ザの好むものへと変化させる.iGA は感性による評価を
方式である.他のユーザとの好みの類似性を基本とした
必要とするアプリケーションに利用されている.
1 http://www.rakuten.com
003
提示されたすべてのコンテンツの詳細情報を閲覧せずに
Start
ユーザに評価してもらうことは難しい.そのため,提案
Initialize
手法では提示されたコンテンツタイトルの中からユーザ
が次に遷移・閲覧したコンテンツを,遺伝的操作におけ
Evaluation
る評価とする.コンテンツの特徴ベクトルの定義には先
Termination
conditions
Yes
行研究で多く用いられている手法と同様に,コンテンツ
End
に付加されている説明文に出現する単語を特徴ベクトル
No
Selection
とし,重み付けは TF・IDF 法を用いる.本研究におい
ては,それらの組み合わせ及びパラメータをユーザの感
Crossover
性パラメータの候補とする.しかし出現単語数が膨大な
Mutation
数になることから,解探索に悪影響を及ぼすことが予想
される.そのため,膨大な量の設計変数を機械的に扱い
やすい形に変形することで,解探索の性能を向上させる
Fig. 1 遺伝的操作の流れ
研究が行われている.その手法として,設計変数を主成
分分析により,別の主成分へと写像することで次元数を
3.2
アルゴリズムの設計
削減する手法や,初期個体の生成時に予め SVM による
iGA では,他の最適化問題と同様に,最適化の対象と
する候補解を設計変数として表現する.例えば,服飾デ
ユーザ嗜好の学習を行わせることで個体の収束を早める
ザイン支援システムであれば,デザインする服の形状や
本研究では,設計変数間に重みとは異なる関連度を定
色,装飾などが設計変数として定義され,各解は,その
義することで,別次元同士の設計変数での遺伝的操作を
設計変数のベクトルによって構成される.最適化を行う
可能とする手法を用いる.それにより,各コンテンツが
遺伝的操作のフェーズでは,さらにこの設計変数を 01 の
全種類の設計変数を保持する必要がなくなる.単語間の
ビット列や遺伝子の型と実数値などの染色体に修正して
関係性を数値で表す概念ベースを用いることで単語ネッ
用いる.
トワークを作成し,それらの組み合わせ及びパラメータ
手法などが考案されている.
図 1 に遺伝的操作の流れを示す.まず,試行の最初に,
染色体を多数含む母集団を初期化する.そして,この染
を最適化対象とする.
4.2
色体一つ一つに対してユーザによる評価を行う.評価値
特徴単語の重みの決定
コンテンツの特徴ベクトル項目として抽出した単語の
の高い染色体を,親個体として選択し,これらに交叉と
重みを決定する必要がある.その手法として,TF・IDF 法
して情報を組み替える操作を与えることで,より高い評
を用いる.TF・IDF 法とは,単語の出現頻度 (Term Fre-
価が期待される子個体を生成する.また,探索途中に局
所解に陥ることを防ぐために確率的に突然変異を行う.
これらの選択,交叉,突然変異を一連の流れを 1 世代の
quency: TF) 及び逆文書頻度(Inverse Document Frequency: IDF)を用いた文書内での単語の重要度を表す
指標であり,それぞれ式 1∼ 式 3 として表される.
操作とする.何世代か繰り返すことで,徐々に評価の高
ni,j
tf (i, j) = ∑
k nk,j
い集団へと進化させていく.
提案推薦システム
4
4.1
idf (i) = 1 + log2
提案システム概要
|D|
|{d : d 3 ti }|
tf idf = tf × df
本研究では前章で述べた iGA に基づく記事推薦システ
ムを提案する.iGA により,ユーザの感性パラメータを
(1)
(2)
(3)
ni,j は単語 i の文書 j における出現回数,|D| は総ドキュ
メント数,|{d : d 3 ti }| は単語 i を含むドキュメント数で
予測することで,ユーザの感性に近い推薦を行うことを
目標としている.提案手法の流れを以下に示す.
1. 推薦対象のコンテンツを特徴ベクトルとなる単語列に
分解
ある.同一ドキュメント中で頻出な単語は TF 値が高く
なり,多くのドキュメントで用いられている単語は IDF
値が低くなる.
2. ユーザの利用履歴から感性パラメータ候補を生成
4.3
3. 感性パラメータ候補に類似するコンテンツの提示
概念ベースによる単語ネットワークの作成
概念ベースとは,ある単語の意味(概念)をその単語
4. 手順 2,3 を繰り返す
に関連の深い単語群(属性)で定義した単語空間のこと
コンテンツ評価フェーズでは,コンテンツのタイトル
である.例えば,人間は [学校] から「教師」や「生徒」
のみがユーザに推薦コンテンツとして提示されるため,
などの単語を連想できる.この場合,概念ベースでは [学
004
Table. 1 机と椅子の一次属性
概念
机
椅子
一次属性
(学校,0.6) (勉強,0.3) (本棚,0.1)
(勉強,0.5) (教室,0.3) (木,0.2)
Fig. 2 感性パラメータの生成
Table. 2 机と椅子の二次属性
一次属性
学校
勉強
本棚
教室
木
により選択を行う.この際の重みは A・B のノード間で
二次属性
(大学,0.4) (校舎,0.4) (木造,0.2)
(予習,0.5) (試験,0.3) (本,0.2)
(図書,0.6) (書物,0.3) (本,0.1)
(教師,0.4) (校舎,0.4) (生徒,0.2)
(森林,0.5) (木造,0.4) (葉,0.1)
線形となるように与える.また,パラメータ候補から推
薦コンテンツへは,すべての出現単語で構成されるベク
トル空間上のユークリッド距離で最も類似しているコン
テンツを提示する.
実験
5
校] の概念を{教師:0.4,児童:0.3,生徒:0.1,学生:
0.1,…}のように概念の重みあり属性群として格納し
ている.また,その属性を一次属性と呼び,さらにその
属性語の概念を展開したものを二次属性と呼ぶ.例とし
5.1
実験目的および実験環境
本システムによってユーザの履歴から嗜好を学習し,
類似するキーワードを主題とする記事が推薦結果に現れ
ることを明らかにする.
て,表 1,表 2 に机と椅子の一次属性及び二次属性を展
開した表を示す.上記の属性を再帰的に展開することで,
すべての単語における関連度を表したネットワークが表
実験は楽天市場における商品データ (以下,楽天公開
データ) を用いた.楽天公開データの詳細を Table. 3 に
示す.
現される.本稿では,この概念ベースによる単語ネット
ワークを,概念語ネットワークと呼ぶ.概念ベースの自
Table. 3 楽天公開データ詳細
動構築手法なども考案されており,本研究ではコンテン
ツデータから,出現単語の共起確率を用いて作成する.
解析対象とするコンテンツには専門性の高い一般的では
登録商品数
ない名詞が含まれているため,単語辞書に専門用語を追
商品説明文中における
加する必要がある.本研究では予め重要な専門用語を登
出現単語数
10,479,543 単語
録している.
商品説明項目
商品コード, 商品価格, 商品説明文,
60,123,534 件
感性パラメータからの推薦コンテンツの決定
販売方法別説明文, 商品 URL,
本研究における感性パラメータは任意の数の単語及び
レビュー件数, レビュー平均,
4.4
重みで構成される.ユーザがコンテンツへのアクセスを
商品画像 URL, 店舗コード,
行った際に,ユーザの感性パラメータと閲覧コンテンツ
ジャンル ID, 登録年月日
のもつ特徴パラメータから新たに感性パラメータの候補
となる複数の単語の組み合わせを生成する.図 2 に候補
5.2
パラメータ生成の例を示す.
図 2 では現在のユーザの感性パラメータが [GA(0.5),
実験内容
本システムによるユーザのパラメータ推定を加えた推
薦レポートと,パラメータ推定を加えないレポートの持
EC(0.5)] であるとき,[HPC(0.6),MPI(0.3)] の特徴ベク
トルを持つコンテンツを閲覧した状況を表している.GA
と HPC,EC と MPI という単語の組み合わせから新た
つ主キーワードのみを特徴量として用いる手法を比較す
に別の単語を生成し,それらを感性パラメータの候補と
している.
レポートへの初回アクセス時には,コンテンツが持つ
特徴パラメータを重みの合計が 1 になるよう,正規化し
た状態で入力される.図 3 に交叉処理,図 4 に突然変異
処理の例を示す.図 3 の親単語 A・B の交叉では単語の
Fig. 3 交叉の例
関係ネットワーク上での最短経路上からルーレット選択
005
Table. 4 学習なし推薦レポート
推薦レポートタイトル
PSA/AT(GA) の (Ala)10 への適用
自作 SGA と ga2k との解探索の性能比較
SGA の作成と動作確認
MGG と sGA(simple GA)の性能比較
環境分散遺伝的アルゴリズムの検証
Table. 5 学習あり推薦レポート
主キーワード
AT
ga2k
GA
MGG
分散 GA
推薦レポートタイトル
PSA/AN(GA) における遺伝的操作
PTH における力場パラメータの検討
大規模ジョブ問題におけるコーディング
cron によるプログラムの自動実行
ランキングにおける角度パラメータ
る.本実験では提案手法において,類似するキーワード
5.4
を主題とする記事が推薦結果に現れることを明らかにす
主キーワード
AN
パラメータ
ジョブ
実行
個体
感性モデル
GA
パラメータ
ジョブ
実行
パラメータ
考察
るため,概念語ネットワーク導入以外の要素を極力排除
感性パラメータの学習システムを組み込むことによっ
した条件で行う.感性パラメータとなる子個体生成時の
て,推薦結果に違いが見られたが,その要因となってい
突然変異率は 0,学習に用いる感性パラメータ数は 1,推
る感性パラメータの生成について考察する.本手法によ
薦レポート数は 5 とした.なお,学習させるパラメータ
る学習とは,現在閲覧中のレポートのキーワードと,過
数が 1 のため,感性パラメータの重みが 1 に正規化され,
去に推定された感性パラメータとなるキーワードを概念
単語の選択確率は同一となる.
語ネットワーク上で最短経路となる単語の一つに,次世
実験には「The Compact Genetic Algorithm (主キー
代の感性パラメータを遷移することを指す.本実験で感
ワード: GA)」レポートを用い,
「PC クラスタ管理シス
性パラメータ生成の際に用いた,[GA] と [ジョブ] の単
テム Sun Grid Engine の概要 (主キーワード: ジョブ)」
語ネットワーク上での最短経路は [GA]-[パラメータ]-[実
を学習済みのレポートとして用いた.
行]-[ジョブ] で構成されており,それぞれの選択確率はす
5.3
べて同一である.そのため,今までの閲覧レポートの特
実験結果
徴を引き継いだ上で,その単語同士の概念上で間にあた
表 4 に学習を行わない手法,表 5 に提案手法においての
る [パラメータ] や [実行] といったキーワードが用いられ
「The Compact Genetic Algorithm」レポート閲覧時の
た推薦が行われている.しかし,本実験では学習単語数
推薦レポート及び,レポートが主とするキーワードの例
を主キーワード 1 つに制限していたため,極端な推薦結
を示す.提案手法においては「PC クラスタ管理システム
果が得られたと言える.そのため,複数の単語を学習さ
Sun Grid Engine の概要」レポートを学習済みデータとし
て与えており,提案手法によって推定された感性パラメー
せるとこにより,複雑な特徴を受け継いだ推薦がされる
と期待される.
タも記載する.表 4 に示される学習システムを組み込ん
でいない推薦結果では,本来の「The Compact Genetic
参考文献
Algorithm」レポートの主キーワードである [GA] のみを
1) A. Das, M. Datar, A. Garg, and S. Rajaram. Google
news personalization: scalable online collaborative
filtering. In Proceedings of the 16th international
キーワードに全レポートから類似度の高い順に並べた結
果である.そのため,遺伝的アルゴリズム (GA: Genetic
Algorithm) に関連深いレポートが推薦結果として現れ
ている.対して,表 5 に示される学習システムを組み込
んだ推薦結果では,学習済みレポートの主キーワードで
conference on World Wide Web, pp. 271–280, 2007.
2) G. Linden, B. Smith, and J. York. Amazon.com recommendations: item-to-item collaborative filtering.
Internet Computing, IEEE, Vol. 7, No. 1, pp. 76–80,
2003.
ある [ジョブ] と閲覧中のレポートの主キーワードである
[GA] について提案手法によって感性モデルとして新たな
キーワードを生成した上で,そのパラメータに類似する
レポートを推薦結果として表示している.
Fig. 4 突然変異の例
006
第 16 回 月例発表会(2012 年 09 月 19 日)
医療情報システム研究室
多峰性の嗜好を推定する対話型遺伝的アルゴリズムの
交叉手法の検討
田中美里
Misato TANAKA
背景:オンラインショッピングサイトでは売上を向上させるため,様々な検索,推薦技術の導入を進めている
研究目的:人間の感性による最適化を行う対話型遺伝的アルゴリズムによりパーソナライズドな商品の推薦を行う
発表の位置づけ:人間の嗜好に存在する複数の嗜好を反映した対話型遺伝的アルゴリズムの探索手法を開発
方法:クラスタリングにより複数の嗜好を推定し,各嗜好を多次元正規分布を用いて探索する交叉手法を提案
結果:次元数による制約を受けるが,低次元においては複数の峰の推定,探査ともに従来手法よりも優れていた
1
はじめに
感性を組み込む多様なアプリケーション 14,
15, 16, 17, 18)
に使われている.
近年の BtoC の E-commerce では,商品推薦の技術が
その重要性を増している.Web 上で扱われる商品数は増
しかし,前述のように iGAs は唯一の最適点を探索す
加し,各ショッピングサイトでは検索や商品推薦によっ
るように設計されている.本研究のように商品推薦とい
てユーザに呈示する商品を選別することで,売り上げ
う,多数の最適な点をもつことが想定される場合,従来
の向上を図っている.検索ではユーザの入力を受けて,
の iGAs ではユーザの正しいモデルを判定できない.商
ユーザの想定した範囲内の商品を呈示する.一方,商品
品パラメータ空間上において離れた場所にある 2 つ以上
推薦ではユーザの行動履歴からその内的なニーズを解
の商品を最適とするケースが,多数予想されるからであ
析して予測することで,ユーザの入力の負担を防ぎな
る.例えば,同じ T シャツという商品においても生地は
がら,検索ワードなどの入力では思い至らない商品を
青色だけでなく白色も好き,ワンポイントだけでなく縞
呈示するといった特徴を持つ.主な商品推薦技術にはコ
模様も好きと行った多数の好みが存在する.従来の iGA
ンテンツベースフィルタリング 1,
では,これらの内の 1 つの好みを探索するものであり,
2)
や協調フィルタリ
があり,前者は商品の特徴とユーザのプロ
複数の好みを並列的に解析することはできない.そこで
ファイルや行動履歴のマッチング,後者は主には商品間
本研究では,このような複数の好みを並列して探索する
の購買の共起性から商品を推薦する.これらの技術に対
ための iGA の交叉手法を開発した.単一ではなく複数の
して,本研究では,個々のユーザの行動履歴から個人の
離れた極大値を探索するという,今までの iGAs とは一
感性的なモデルを構築し,モデルにフィッティングした
線を画した本手法では,ユーザの感性モデルに合わせた
商品を呈示することを目指す 6) .人間の感性は,対象
多様な好みを呈示することができる.さらに,このよう
の特徴や環境を入力パラメータとし,好き嫌いや印象と
に設計変数空間上で評価の高い領域が分散するとき,そ
いったユーザの主観的な評価を出力とする関数として,
れぞれを分離して探索することは,探索の高速化に寄与
モデリングできると考えられる.その場合,その関数の
すると考えられる.
ング 3,
4, 5)
出力が最大となる点を求めることで,その評価に最も適
本稿では開発した新しい iGA の手法について,実験参
した呈示を行うことができると仮定される.このような
加者を伴う実験による性能の調査を行う.第 2 章で iGAs
感性の関数を解析する手法のひとつが,iECs(interactive
の概要について述べ,第 3 章で提案手法について述べる.
Evolutionary Computations)7) と呼ばれる技術である.
iEC には iESs(interactive Evolutionary Strategies)8) や
第 4 章では従来の iGA との比較を通して,提案手法の性
能調査を擬似ユーザによって行い,第 5 章では実験の結
果について述べる.
9, 10, 11)
iGPs(interactive Genetic Programings)
などあ
るが,本研究ではその中でも多点に対する評価値を用
対話型遺伝的アルゴリズム
2
い,対象のコード化が容易な iGAs(interactive Genetic
概要
Algorithms)7, 12, 13) を商品推薦に適用することを検討し
ている.iGAs は多点に対するユーザによる感性や嗜好の
2.1
評価を元に,唯一の最適点を見つけ出す技術である.数値
伝的アルゴリズム)19) の評価関数を,人間の評価に置き
化の難しい人間の感性を解析する手法として,評価に人の
換えた手法である.人間の嗜好や印象によって解候補を
iGAs は進化をモデリングした計算手法である GAs(遺
007
Fig. 1 iGA を用いた商品推薦システム
Fig. 3 多峰性の感性ランドスケープ
あったり,ユーザに呈示する解候補の表現を指示する値
の組合せとなっている.後者は遺伝子型と呼ばれ,評価
に必要な表現型をコーディングして,遺伝的操作に適し
た数値表現へと変換したものである.この遺伝子型の構
成する空間で新たな解候補は生成されるため,遺伝子型
と表現型の変換は,人間の感性にとって線形,もしくは
それに近い形で行われる必要がある.本稿では,実数値
GA20,
21, 22)
を採用しており,遺伝子型と表現型の間の
変換は行わず,同じ数値表現を扱っている.今後は,解
候補の表現を設計変数と記述する.
Fig. 2 iGA のフロー
2.3
評価することで,数値的な解析が難しい人間の感性に基
多峰性の嗜好と対話型遺伝的アルゴリズム
従来の iGAs は,母集団全体を 1 つの最適解へと収束
づいた最適化が可能であるとされている.
させることを意図していた.これは単峰性の対象問題,
Fig. 1 に iGAs による商品推薦システムのイメージを
または唯一の最適解を持つ多峰性のランドスケープを持
示す.ユーザは,iGA システムのインタフェース上に呈
つ対象問題に対しては問題ない.ランドスケープとは設
示された商品群に対して,自身の感性に従って好きや嫌
計変数に対して与えられた評価値が描く超曲面のことで
い,または欲しい欲しくない,といった評価値をつける.
あり,対象問題の性質や複雑さを表現する指標として扱
システムはその評価値を基に,ユーザの評価の高い商品
われる.
を抽出し,ユーザの嗜好を解析する.その情報を基に選出
本研究では,商品推薦への応用を目指している.この
された新たな商品群はユーザに呈示され,再びユーザは
商品推薦という対象問題では,ユーザの「欲しい」
「好ま
それらを評価する.このように評価と解析を繰り返すこ
しい」の度合を評価値として用いた場合,設計変数の全
とで,ユーザの感性に沿った商品群へと進化させていく.
く異なる商品に同じ適合度値が与えられる可能性がある.
2.2
このような異なる領域におなじ適合度値のピークが存在
アルゴリズム
するようなユーザのランドスケープは Fig. 3 のような多
GAs は,淘汰や世代交代 (Generation Alternation) と
峰性を描くと考えられる.本研究ではこのような感性ラ
いった進化の要素に従って対象を最適化する.これらの
ンドスケープを,多峰性の嗜好と定義する.著者らは,
要素は選択・交叉・突然変異といった遺伝的操作として
このような多峰性の嗜好について,それぞれの峰を分け
モデリングされる.iGAs ではこの遺伝的操作に用いら
て探索することで,ユーザの正しい感性ランドスケープ
れる各解候補の評価値が人間によって与えられるという
の形状を把握し,より満足度の高い個体の呈示が行える
点が,GAs と異なる.iGAs における最適化の全体的な
のではないかと考えた.
流れを,Fig. 2 に示す.淘汰を模倣した選択操作は適合
このような多峰性の峰の各頂点を求める先行研究とし
度の高い解候補を,次世代の親として抽出する操作であ
ては,伊藤らのクラスタリングを用いた手法が挙げられ
る.iGAs ではユーザの評価の高い解候補を選ぶことが
る 23) .伊藤らは,途中世代まで単峰性の探索を行い,そ
多い.世代交代を模倣する交叉操作では,選択された親
こで得られた過去のユーザの選択評価の高い解候補を遺
から子の解候補を生成する.突然変異は遺伝子型の一部
を,ランダムに変更することで,局所解への収束を防ぐ.
GAs では評価と遺伝的操作に用いられる解候補の数値
表現が異なるものとなる.前者は表現型と呼ばれ,iGAs
伝子型の空間上でクラスタリングすることで,峰の範囲
を推定しようとした.この研究では,峰の範囲がクラス
タリングによって推定できる事を示したものの,その後
の峰の頂点を求める探索は行われなかった.本研究では
では例えば色の RGB 値であったり,長さを示す数値で
この手法をさらに拡張し,各世代毎にクラスタリングを
008
などのクラスタリング結果の精度を示す指標を用いる.
後者の指標は,K-means 法 30) など事前にクラスタ数を
与えておく必要のあるクラスタリング手法に,複数のク
ラスタ数を試行して各結果について値を得ることで,適
切なクラスタ数を選択することができる.4 章の実験で
は,クラスタリング手法として K-medoids 法 31) を用い,
そのクラスタ数の決定にシルエット統計量を用いている.
手法の詳細に付いては 4.1.3 にて述べる.
3.2
峰の中の探索
次に推定された峰内を探索するために,確率モデルを
構築して子個体を生成する.1 クラスタに含まれる親の
解候補の分布から多次元正規分布を生成し,子の解候補
を分布に従う正規乱数によって生成させる.このとき,
Fig. 4 クラスタリングによる峰の位置の推定
設計変数空間の相関を反映して多次元正規分布を構築す
るために,主成分分析 32) を行った 33,
行って,峰の範囲を推定しつつ,探索を進めることを検
.
設計変数の数が n で,あるクラスタが m 個の親を含
討する.
むとき,この親は m ∗ n の行列 X として表現される.そ
して,各設計変数の平均値が 0 となるように,X を平行
嗜好の多峰性を推定する交叉手法の提案
3
34)
移動させた行列 T を生成する.この T の分散共分散行
多峰性の嗜好を持つユーザについて,各峰の最適点を
列を S とする.S を主成分分析して固有値と固有ベクト
探索するためには,まず峰の領域を推定し,その上で最
ルを求め,この固有値の絶対値の降順に固有ベクトルを
適な点を探索する必要がある.本研究では,前者を多峰
列として並べた回転行列 A を生成する.平行移動させら
性の検出,後者を峰内の探索と呼び,それぞれを次世代
れた解候補の行列 T に回転行列 A をかけることで,設
の母集団を生成する交叉の手順に含む.
計変数間の相関のない空間に親の解候補を写像すること
多峰性の検出では,設計変数空間上において,ユーザ
ができる.
の評価の高解候補に対してクラスタリングを行うことで,
各クラスタを 1 つの峰として推定する.そして,推定さ
Y = TA
れたそれぞれの峰について,クラスタに所属する解候補
(1)
の分布から主成分分析と多次元正規分布による確率モデ
Y から多次元正規分布を構築し,子の解候補 Yof f spring
ルを構築し,次世代の解候補の生成を行う.このような
の生成を行う.子の解候補を生成する際,そのままの多
交叉を行うことで,ユーザの多峰の位置を推定し,探索
次元正規分布を用いると,生成された子がその空間の原
を進めることができると考えられる.各フェーズの詳細
点付近に収束する.過度の収束をさけるため,多次元正
については,以下に述べる.
規分布の分散値を α 倍することで Yof f spring を広く撒く
3.1
ことができる.後の実験では,この α を 1.4 としている.
多峰の推定
生成した Yof f spring に A の逆行列 A−1 をかけることで,
提案手法では設計変数空間上におけるユーザの評価の
A を基底とした空間から元の空間に写像する.
高い解候補の分布から,峰の領域 (field) を推定する.空
間上の解候補間の距離を元に,各解候補をそれぞれの峰
Xof f spring = Yof f spring A−1
へと識別する.解候補がどの峰に所属するかは事前知識
この Xof f spring に親 X の平均値を加え,次世代の母
にないため,識別には教師無しのクラス識別手法である
集団に追加する.これらの操作を全てのクラスタに対し
クラスタリングを用いる.Fig. 4 に T シャツの設計変
て適用することで,次世代の母集団を決定する.
数空間でのクラスタリングの例を示す.各データは 1 つ
なお,各クラスタの子の解候補の数は,合計が母集団
の解候補を示し,各クラスタは峰の領域の候補として考
のサイズと一致するように,適切な数がクラスタ毎に定
える.
められる必要がある.本稿の実装では,各クラスタが含
なお,人間の多峰の数を事前に決定することは難しい
む親の解候補の数の比率に基づいて,生成される子の解
ため,クラスタ数は分布に応じて自動的に決定すること
候補の数を決定した.
が望ましいと考えられる.具体的には,クラスタ数を自
動的に決定する機構を組み込んだ手法 24,
または,Gap 統計量
26, 27)
25)
を使用する.
やシルエット統計量 28,
(2)
29)
009
(a) 2 峰を持つ擬似感性ランド (b) 4 峰を持つ擬似感性ランド
スケープ
スケープ
Fig. 6 2 次元の擬似感性ランドスケープ
の評価方法に準じたものである.擬似ユーザモジュール
は,擬似的なランドスケープ (pseudo Kansei landscape)
から呈示された解候補の評価値を算出し,その評価値上
位 6 個の評価値を 1 とし,残り全てを 0 とした.
擬似ユーザモジュールが持つ擬似感性ランドスケープ
の例を Fig. 6 に示す.対象問題の次元数が 2 次元である
時の,2 つの峰である場合,または 4 つの峰をもつ場合
の擬似感性ランドスケープを示した.本実験で扱う次元
数は,2,4,6,8 である.各次元に対し,それぞれ 2,4,
6,8 個の峰を配置し,全部で 16 種類の擬似感性ランド
スケープを構築した.感性的なランドスケープの高低は
ガウス関数和で模擬されるとされているため 35) ,複数
Fig. 5 iGA 実験システムの処理フロー
のガウス関数を擬似ランドスケープ内の離れた位置に設
置することで峰を表現した.各ガウス関数の頂点の高さ
は 7.0 とし,分散の大きさは 1000 点でランダムサンプリ
擬似ユーザによる評価実験
4
ングしたとき,10%のサンプリング点の評価値が 5.5 を
提案する交叉手法の挙動を確認するため,商品推薦シ
ステムのプロトタイプ(以降,iGA 実験システムと呼ぶ)
超える値となるように調整した.
4.1.2
を構築した.iGA 実験システムには,最適化に必要なモ
共通フェーズの実装
ジュールが含まれている.今回の実験では,さらにユー
システムの共通部分のパラメータを Table. 1 に示す.
ザの評価を代行する擬似ユーザ (Pseudo-user) モジュー
母集団サイズを 25,世代数を 13 としたのは,後の被験
ルを実装している.複数の次元,複数の峰数の嗜好を設
者実験を考慮し,人間が評価可能なパラメータの範囲内
定された擬似ユーザの評価によって,提案手法がランド
としたためである.
評価フェーズにおいて,評価値 1 を付けられた解候補
スケープ中の複数の峰を探索できるか,また,発見した
はアーカイブに追加される.選択メソッドではこのアー
峰の中の探索が進行するかを確認した.
4.1
カイブから親個体を選出するが,初期のページではアー
実験システム
カイブ内の解候補の数が,交叉を行うには不足している
iGA 実験システムの全体の流れを Fig. 5 に示す.シス
テムには,提案手法と比較する従来手法としてブレンド
場合がある.この交叉に必要な親の数を Selection Size
交叉 20) を実装している.1 試行の間は,交叉手法として
でランダムに解候補を生成するものとした.本実験では
と定義し,一定数の解候補がアーカイブに蓄積されるま
提案手法か従来手法の一方のみを用いるものとし,初期
化,選択,突然変異といった他の処理は全て共通とする.
以降,擬似ユーザモジュール,システムの共通部分,
提案手法と従来手法の実装について順に述べる.
4.1.1
この Selection Size を,母集団サイズの半数である 13 と
している.
Selection Size が満たされるまでは 1 世代目として扱
い,遺伝的操作を開始してから世代数をインクリメント
擬似ユーザモジュール
する.2 世代目以降は総和が 13 個となるまで,過去の
実験回数を増やすため,また実験結果の再現性を保証
ページを遡って親となる解候補を選出した.
するため,解候補の評価は擬似ユーザのモジュールが行っ
た.このシステムでは解候補への評価値を 0 か 1 の 2 値評
価としている.この評価値の付け方は,後の被験者実験
010
Table. 1 実験パラメータ
Population Size
25
Generation Size
Selection Size
Crossover Rate
13
13
1.0
Mutation Size
Mutation Method
5
Uniform mutation
Fig. 8 峰領域の定義
1. ランドスケープ中の複数の峰を探索できるか
2. 発見した峰の中の探索が進行するか
提案手法の主旨はランドスケープ中の複数の峰の位置
を推定することである.しかし,それだけでなく,峰の
頂点を目指して探索が進行していることを示す必要があ
る.そのため,以下の 2 つの指標を評価に用いた.
Fig. 7 ブレンド交叉の概要 (BLX-α)
指標
1 峰面積の比率に基づく理想的な子解候補数
との差分
4.1.3
提案手法の実装
指標
実験システムでは,提案手法のクラスタリング手法と
2 母集団の平均評価値
指標 1 は,ある領域を峰として定義した際,各峰の領
して K-medoids 法を用い,そのクラスタ数の決定にシル
域内で生成されるべき子の解候補の数と,実際に生成さ
エット統計量を用いた.
シルエット統計量は,クラスタリング結果に対して算
れた解候補の数の差分を算出するというものである.各
出する指標であり,K-medoids 法に適しているとされて
峰で生成されるべき子の解候補の数は以下の式で算出す
いる.クラスタリングされたデータ i について,同じクラ
る.i は擬似感性ランドスケープに設定された峰の番号
スタに所属する全てのデータとの距離平均 a(i) と,最近
である.
傍のクラスタに所属する全てのデータとの距離平均 b(i)
Oideal size i =
を求める.そして,以下の数式にて s(i) を算出し,全て
のデータにおける平均を算出する.このシルエット統計
峰の領域は,擬似感性ランドスケープに水準となる超
量が高いほど,分割の精度が高いとされている.
s(i) =
b(i) − a(i)
max{a(i), b(i)}
平面を与え,ランドスケープと超平面の交差する領域を
峰の領域として定義した.Fig. 8 に Fig. 6(b) の峰領域
(3)
を求めた例を示す.本実験ではこの水準平面の高さに,
峰のパラメータを決定する際に用いた (Reffering 4.1.1)
本実験ではクラスタ数を 2 個から 8 個までの間で変
化させて親の解候補を K-means 法でクラスタリングし,
シルエット統計量が最大となる場合のクラスタ数を,そ
評価値 5.5 を用いた.すなわち峰領域の総面積は,総面
積の 1 割に近似される.
本実験では,同一ランドスケープ中の峰の高さ,分散
の世代のクラスタ数として採用した.
4.1.4
peak areai
∗ population size (4)
total peak area
を同じとしたため,この面積は全ての峰で同じとなる.
従来手法の実装
従って峰毎の理想解候補数 Oideal size はほぼ同一である.
従来システムでは,クラスタリングは行わず,子の解
各峰の交差面の中で生成された個体数と,理想解候補数
候補をブレンド交叉によって生成した.ブレンド交叉の
の差の絶対値の総和を世代毎に合計することで,各世代
概要を Fig. 7 に示す.まず,親の解候補からランダムに
の探索の分散性について検証する.この値を以降,Dia
2 個体を復元抽出する.その解候補間の距離 d を設計変
数毎に求め,d を外部に α 倍拡張した超直方体から一様
と記述する.n はランドスケープ中の峰の数である.
に子の解候補を生成するという手法である.本実験では,
Dia =
α 値は 0.2 とした.
4.2
n
∑
|Oideal size i − Oactual size i |
(5)
i=1
また,指標 2 により,探索が進行していることを母集
評価の指標
団の平均評価値が世代交代によって向上する点から確認
実験では,提案手法の有効性を以下の 2 つの観点から
した.
確認する.
011
Fig. 9 各条件における世代毎の理想個体差分の遷移を示す.グラフは横軸が世代で,縦軸が世代毎の理想個体差分
の 100 試行の平均値である.値の標準誤差をバーで示した.赤の実線が提案手法で,青の点線が従来手法である.同
じ行のサブグラフは同じ次元数のランドスケープで探索された結果を示す.同じ列のサブグラフは同じ峰数のランド
スケープで探索された結果を示す.
Fig. 10 各条件における世代毎の母集団の平均評価値を示す.グラフは横軸が世代で,縦軸が母集団の平均評価値
を,さらに 100 試行で平均したものである.値の標準誤差をバーで示した.赤の実線が提案手法で,青の点線が従来
手法である.同じ行のサブグラフは同じ次元数のランドスケープで探索された結果を示す.同じ列のサブグラフは同
じ峰数のランドスケープで探索された結果を示す.
4.3
実験結果
による遷移を示している.指標 1 は,値が低いほど結果
が良好である.従って,8 次元 2 峰の条件を除いて,ほ
Fig. 9 に指標 1 の結果を示す.図中のサブグラフはそ
れぞれ各条件における理想解候補数との差分 Dia の世代
ぼ全ての条件で,各世代の差分が提案手法の方が有意に
012
良いことが確認される.なお,提案手法では後半で Dia
が上がる傾向が見られる.これは擬似ユーザが評価値の
高い順に定数の解候補を選択することが原因である.よ
り多くの親が集まったクラスタからはより多くの子が生
まれ,探索が他のクラスタに比べて早く進行する.必然
的に,その峰の子の解候補が擬似ユーザにより多く選択
されることになり,探索の後半において初期に親解候補
(a) 2 次元 2 峰の擬似ランドス (b) 8 次元 2 峰の擬似ランド
ケープ上における遷移
スケープ上における遷移
が多く振り分けられた峰に探索が収束してしまう傾向が
あった.実際のユーザの評価では,厳密な評価値の昇順
での選択とは成り難いため,このような問題は生じない
Fig. 11 クラスタに所属するメンバ数の世代毎の平均値
と考えられる.
の遷移.黒の点線は次元数+1 を意味し,平均メンバ数
Fig. 10 に指標 2 の結果を示す.サブグラフの配置,凡
はこれを超えていることが望ましい.
例は 9 と同様である.指標 2 は評価値の平均値であるた
め,値が高い程,結果が良好である.8 次元の条件を除い
参考文献
て,各世代の平均が,提案手法の方が有意に良いことが
1) Gerard Salton and Christopher Buckley.
Termweighting approaches in automatic text retrieval. In INFORMATION PROCESSING AND MANAGEMENT,
Vol. 24, pp. 513–523, 1988.
確認される.後半では従来手法が提案手法に追いつく傾
向が見られるが,これはブレンド交叉の探索が 1 つの峰
に収束しているためであり,想定内である.しかし,探
2) Ken Lang. Newsweeder: Learning to filter netnews. In
in Proceedings of the 12th International Machine Learning Conference (ML95, 1995.
索の前半では提案手法の方が評価値の向上が早く,探索
の高速化が成功していると言える.従って,8 次元の条
件を除くと,峰を推定して内部を探索するという機構が,
探索効率を向上させていることが推察される.
4.4
考察
3) Xiaoyuan Su and Taghi M. Khoshgoftaar. A Survey of
Collaborative Filtering Techniques. Advances in Artificial Intelligence, Vol. 2009, No. Section 3, pp. 1–19,
2009.
4) G. Linden, B. Smith, and J. York. Amazon.com recommendations: item-to-item collaborative filtering. IEEE
Internet Computing, Vol. 7, No. 1, pp. 76–80, 2003.
実験結果から,提案手法の 8 次元での探索能力の問題
が確認された.これは提案手法が子解候補の生成に多次
元正規分布を用いていることが原因として考えられる.
提案手法では,親の分布から多次元正規分布を構築する
ため,親の数未満の次元数で探索のための分布が構築さ
れることになる.この分布の延長上に子の解候補も生成
されるため,一度峰を構成する解候補の群が決定すると,
突然変異やクラスタリング結果の変化などの外部要因が
加わらない限り,最初に張られた多次元正規分布の空間
外へと探索が進行しない.すなわち,峰を検出した初期
5) Badrul Sarwar, George Karypis, Joseph Konstan, and
J Reidl. Item-based collaborative filtering recommendation algorithms. Proceedings of the 10th . . . , pp. 285–
295, 2001.
6) Misato Tanaka, Tomoyuki Hiroyasu, Mitsunori Miki,
Yasunari Sasaki, Masato Yoshimi, and Hisatake Yokouchi. Extraction and usage of Kansei meta-data
in interactive Genetic Algorithm. In Proceedings of
WCSMO-9, p. 505 1, 2011.
7) Hideyuki Takagi. Interactive evolutionary computation:
fusion of the capabilities of EC optimization and human
evaluation. Proceedings of the IEEE, Vol. 89, No. 9, pp.
1275–1296, 2001.
グループの探索空間の延長上に峰の頂点付近が含まれな
い限り,探索が停滞してしまう可能性がある.
Fig. 11 に 2 次元 2 峰の条件,および 8 次元 2 峰の条件
での,各クラスタが持つ平均メンバ数を赤線で示す.100
試行の平均であるため,分散をエラーバーで示している.
黒の点線は,その次元の探索に必要な解候補数の水準を
示す.2 次元では,この水準を毎世代超えているが,8 次
元では多くとも 6 個程の解候補しか峰に含まれず,探索
8) Michael Herdy. Evolution strategies with subjective selection. In Hans-Michael Voigt, Werner Ebeling, Ingo
Rechenberg, and Hans-Paul Schwefel, editors, Parallel
Problem Solving from Nature - PPSN IV, Vol. 1141 of
Lecture Notes in Computer Science, pp. 22–31. Springer
Berlin / Heidelberg, 1996.
9) Tatsuo Unemi. SBArt4 - Breeding abstract animations
in realtime. In IEEE Congress on Evolutionary Computation (WCCI 2010 - IEEE CEC 2010), pp. 4004–4009,
Barcelona, Spain, July 2010. Ieee.
が難しいことが分かる.
本提案手法では,探索に十分な数を供給するには,各
クラスタに所属する平均個体数が,次元数を上回ること
10) Karl Sims. Artificial evolution for computer graphics.
ACM SIGGRAPH Computer Graphics, Vol. 25, No. 4,
pp. 319–328, July 1991.
が望ましい.今後,親個体として用いる個体数を決定す
る Selection Size や,クラスタ数を自動決定アルゴリズ
11) John Koza and Riccardo Poli. Genetic programming. In
Edmund K. Burke and Graham Kendall, editors, Search
Methodologies, pp. 127–164. Springer US, 2005.
ムのクラスタ数上限などのパラメータを次元数によって
スケールさせることを検討する必要がある.
013
12) Hideyuki Takagi. Interactive GA for System Optimization: Problems and Solution. In 4th European
Congress on Intelligent Techniques and Soft Computing, pp. 1440–1444, Aachen, Germany, 1996.
27) Julia Handl and Joshua Knowles. Multiobjective clustering with automatic determination of the number of
clusters. Technical Report TR-COMPSYSBIO-200402, UMIST, Manchester, UK, August 2004.
13) Hideyuki Takagi. New Frameworks of Inetractive Evolutionary Computation. In 5th International Workshop
on Computational Intelligence & Applications, p. 2,
2009.
28) Peter J. Rousseeuw. Silhouettes: A graphical aid to
the interpretation and validation of cluster analysis.
Journal of Computational and Applied Mathematics,
Vol. 20, pp. 53–65, November 1987.
14) Hideyuki Takagi and Miho Ohsaki. Interactive Evolutionary Computation-Based Hearing Aid Fitting. IEEE
Transactions on Evolutionary Computation, Vol. 11,
No. 3, pp. 414–427, jun 2007.
29) Andreas Hotho, Alexander Maedche, and Steffen
Staab. Ontology-based Text Document Clustering.
KÜNSTLICHE INTELLIGENZ, Vol. 4, pp. 1–13, 2002.
30) J. A. Hartigan and M. A. Wong. Algorithm AS 136:
A K-Means Clustering Algorithm. Journal of the
Royal Statistical Society. Series C (Applied Statistics),
Vol. 28, No. 1, pp. 100–108, 1979.
15) Hideyuki Takagi. Application of interactive evolutionary computation to optimal tuning of digital hearing
aids. In In Int’l Conf. on Soft Computing (IIZUKA’98).
World Scientic, 1998.
31) Leonard Kaufman and Peter J. Rousseeuw. Clustering
by means of medoids. Statistical Data Analysis Based
on the L1 窶哲 orm and Related Methods, pp. 405–416,
1987.
16) Hee Su Kim and Sung Bae Cho. Application of interactive genetic algorithm to fashion design. Engineering
Applications of Artificial Intelligence, Vol. 13, No. 6,
pp. 635–644, 2000.
32) I. T. Jolliffe. Principal component analysis. Springer,
1986.
17) Sung-Bae Cho. Towards creative evolutionary systems
with interactive genetic algorithm. Applied Intelligence,
Vol. 16, No. 2, pp. 129–138, 2002.
33) Tomoyuki Hiroyasu, Mitsunori Miki, Masaki Sano,
Hisashi Shimosaka, Shigeyoshi Tsutsui, and Jack Dongarra. Distributed Probabilistic Model-Building Genetic Algorithm. In GECCO, Vol. 2723 of Lecture Notes
in Computer Science, pp. 1015–1028. Springer, 2003.
18) T. Nakajima, S. Hashimoto, K. Haruyama, T. Nakamura, and Y. Osana. Office Layout Support System
using Interactive Genetic Algorithm. 2006 IEEE International Conference on Evolutionary Computation, pp.
56–63, 2006.
34) Masato Takahashi and Hajime Kita. A crossover operator using independent component analysis for realcoded genetic algorithms. In Proceedings of the 2001
Congress on Evolutionary Computation, Vol. 1, pp.
643–649. IEEE, 2001.
19) David E. Goldberg. Genetic Algorithms in Search,
Optimization, and Machine Learning. Addison-Wesley
Professional, 1989.
20) Larry J. Eshelman and J. David Schaffer. Real-Coded
Genetic Algorithms and Interval-Schemata. Foundations of Genetic Algorithms, Vol. 2, pp. 187–202, 1993.
35) Hideyuki Takagi. Paired comparison-based Interactive
Differential Evolution. 2009 World Congress on Nature
& Biologically Inspired Computing (NaBIC), pp. 475–
480, 2009.
21) Davis Lawrence. The Handbook of Genetic Algorithms.
Van Nostrand Reinhold, 1991.
22) Isao Ono, Hiroshi Sato, and Shigenobu Kobayashi. A
real-coded genetic algorithm for function optimization
using unimodal normal distribution crossovers. Journal
of Japanese Society for Artificial Intelligence, Vol. 14,
No. 6, pp. 1146–1155, 1999.
23) Fuyuko Ito, Tomoyuki Hiroyasu, Mitsunori Miki, and
Hisatake Yokouchi. Discussion of Offspring Generation
Method for interactive Genetic Algorithms with Consideration of Multimodal Preference (in Japanese). Proceedings of the 7th International Conference on Simulated Evolution and Learning, Vol. 5361, pp. 349–359,
2008.
24) M. Newman and M. Girvan. Finding and evaluating
community structure in networks. Physical Review, Vol.
E 69, No. 2, pp. 1–15, February 2004.
25) Imre Derényi, Gergely Palla, and Tamás Vicsek. Clique
percolation in random networks. Physical Review Letter, Vol. 94, p. 160202, Apr 2005.
26) Robert Tibshirani, Guenther Walther, and Trevor
Hastie. Estimating the number of clusters in a data
set via the gap statistic. Journal of the Royal Statistical Society: Series B (Statistical Methodology), Vol. 63,
No. 2, pp. 411–423, May 2001.
014
Fly UP