多次元尺度法のための画像評価値入力の工数削減法

by user

on 28 марта 2017

Category: Documents

>> Downloads: 1

views

Report

Comments

Description

Download 多次元尺度法のための画像評価値入力の工数削減法

Transcript

多次元尺度法のための画像評価値入力の工数削減法

平成 19 年度
学士学位論文
多次元尺度法のための画像評価値入力の
工数削減法
Manhour Reduction Method of Image Evaluation
Value Input for Multidimensional Scaling
1080348
小川達也
指導教員
木村義政
2008 年 3 月 7 日
高知工科大学情報システム工学科
要旨
多次元尺度法のための画像評価値入力の工数削減法
小川達也
本論文では多次元尺度法を用いた類似画像検索システム作成における画像評価値入力の工
数削減法を提案する. 多次元尺度法を用いるためには, 画像間の主観評価値を入力する必要
があり, 主観評価値は画像間の非類似度で与えられる. しかし, 画像の枚数が増加するに伴い
主観評価値を入力する作業量が膨大になる. そこで, 色特徴 10 次元と形状特徴 20 次元の計
30 次元の特徴から主観評価値を自動で計算する方法を導出することにより入力の工数削減
を行う. その手順を次に示す. (1) 類似している画像のグループを作成し, グループ内の画像
間の主観評価値を入力する, (2) グループの中心となる画像を代表画像とし, 代表画像間の主
観評価値を入力する, (3) グループ間の画像の特徴から主観評価値を算出する. 主観評価値を
人間が投入する方法を方法 1, 主観評価値を特徴を用いて作成する方法を方法 2 とする. 評
価項目としては, 方法 1 と方法 2 の入力工数の差, および, 方法 1,2 で作成した多次元心理空
間で検索された画像の適合率と未検出率を採用する. 類似画像 80 枚, グループ数を 9 とし,
クエリー画像に, 1 グループの代表画像, 2 グループ内で代表画像に最も類似している画像,
3 グループ内で代表画像に最も類似していない画像の 3 種類を用いて実験を行った. 方法 2
はグループの中心近傍にある
1, 2 において人間が入力した主観評価値を用いたシステムの
89%程度の精度で類似画像検索を行いつつ, 入力工数を 88%削減するという結果を得た. こ
れにより提案手法の有用性が確認できた.
キーワード
類似画像検索, 多次元尺度法, 工数削減
—i—
Abstract
Manhour Reduction Method of Image Evaluation Value
Input for Multidimensional Scaling
Tatsuya Ogawa
We proposes a manhour reduction method of image evaluation value input on
making of similar image retrieval system using multidimensional scaling. It’s necessary
to input subjective evaluation of between image to use multidimensional scaling, and
subjective evaluation value is given by dissimilarity between images. However, the
amount of manhour to input subjective evaluation becomes huge as the number of
images increases. Then, a manhour of the input is reduced by introducting the method
of calculating automatically the subjectivity evaluation value from the feature of 30
dimensions in total consisting of color feature of 10 dimensions and shape feature of 20
dimensions. The procedure is performed as follows. (1)The group consisting of similar
images is made, and subjective evaluation between images in group is input. (2)The
image that becomes center of decided as representative image, and subjective evaluation
between representative images is input. (3)Subjective evaluation is calculated from the
feature of the image between groups. The method that human inputs the subjective
evaluation is assumed to be method 1 and the method that the subjective evaluation
is calculated by using the features is assumed to be method 2. Evaluation item is the
following two; difference of manhour between method 1 and method 2, and relevance
ratio and undetection ratio on image retrieval using multidimensional psychological
space obtained by method 1 and 2. On the experiments using 80 images and nine
— ii —
groups, and the following three kinds of the query images; 1 representative image in
group, 2 the most similar image to representative image in group, 3 the most dissimilar
image to representative image in group, the method 2 reduced the input manhour by
88% with the accuracy of about 89% of the similar image retrieval using the system
that people had input image evaluation value for images of 1 and 2 . These results
draw the proposed method is useful.
key words
Similar Image Retrieval, Multidimensional Scaling, Manhour Reduction
— iii —
目次
第1章
序論
1
第2章
類似画像検索
3
2.1
類似画像検索の意義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2
類似画像検索に用いられている特徴 . . . . . . . . . . . . . . . . . . . . .
3
色特徴 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
(1) 色を用いた特徴 [3] . . . . . . . . . . . . . . . . . . . . . . . . .
4
(2)HSL 表色形 [4] . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
形状特徴 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
(1)CCD アルゴリズム [5] . . . . . . . . . . . . . . . . . . . . . . .
5
(2) ペリフェラル特徴 [6] . . . . . . . . . . . . . . . . . . . . . . .
6
2.2.1
2.2.2
2.3
第3章
3.1
3.2
類似画像検索手法
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.3.1
自己組織化マップ [7] . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.3.2
主成分分析 [8] . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
多次元尺度法
多次元尺度法の原理 [6], [9]
13
. . . . . . . . . . . . . . . . . . . . . . . . .
13
3.1.1
多次元尺度法の用途 . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3.1.2
主観値評価 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3.1.3
計量多次元尺度法 . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
3.1.4
非計量多次元尺度法 . . . . . . . . . . . . . . . . . . . . . . . . . .
15
3.1.5
ストレスの設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
多次元尺度法を用いた類似画像検索 . . . . . . . . . . . . . . . . . . . . .
16
画像ナビゲーションによる類似画像検索の原理 . . . . . . . . . . . .
16
3.2.1
— iv —
目次
第4章
3.2.2
画像ナビゲーションのアルゴリズム
. . . . . . . . . . . . . . . . .
17
3.2.3
画像ナビゲーションの使用法 . . . . . . . . . . . . . . . . . . . . .
18
工数削減法
21
4.1
非類似度の投入 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
4.2
工数削減法の原理
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
4.3
主観評価値の計算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
4.4
工数削減法の結果例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
実験結果
27
5.1
実験データ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
5.2
特徴を使用した主観評価値の作成 . . . . . . . . . . . . . . . . . . . . . .
28
5.3
検索システムの作成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5.4
作成した主観評価値の評価実験 . . . . . . . . . . . . . . . . . . . . . . .
29
5.4.1
検索能力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
5.4.2
工数削減 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
5.5.1
検索能力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
5.5.2
工数削減 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
第5章
5.5
第6章
考察
33
第7章
結論
35
謝辞
37
参考文献
38
付録 A
付録環境
39
—v—
図目次
2.1
CCD アルゴリズム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
2.2
ペリフェラル特徴 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.3
自己組織化マップの構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
3.1
主観評価値ファイル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
3.2
計量多次元尺度法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
3.3
多次元空間から 2 次元空間への配置
. . . . . . . . . . . . . . . . . . . . .
17
3.4
画像ナビゲーションのアルゴリズム . . . . . . . . . . . . . . . . . . . . . .
18
3.5
全画像表示画面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
3.6
絞込み後の画面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
4.1
主観評価値の例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
4.2
主観評価値 dij のマトリクス . . . . . . . . . . . . . . . . . . . . . . . . .
22
4.3
多次元心理空間における蝶画像のグループ . . . . . . . . . . . . . . . . . .
23
4.4
全て人間が入力した主観評価値の分布図 . . . . . . . . . . . . . . . . . . .
24
4.5
特徴から変換した主観評価値の分布図
. . . . . . . . . . . . . . . . . . . .
24
4.6
変数変換を適用した主観評価値の分布図 . . . . . . . . . . . . . . . . . . .
25
4.7
全て人間が入力した主観評価値の例 . . . . . . . . . . . . . . . . . . . . . .
26
4.8
特徴から変換して作成した主観評価値の例 . . . . . . . . . . . . . . . . . .
26
5.1
グループ分けの概要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
5.2
グループの代表画像 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
5.3
評価基準 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
5.4
全て人間が入力した主観評価値を使用
. . . . . . . . . . . . . . . . . . . .
31
5.5
特徴から変換した主観評価値を使用 . . . . . . . . . . . . . . . . . . . . . .
32
— vi —
表目次
2.1
m 個の個体に対する n 個の変数を持つデータ . . . . . . . . . . . . . . . .
10
2.2
係数データ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.3
主成分得点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
3.1
カルスカルの評価目安 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
5.1
検索能力の実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
6.1
類似画像に対する検索能力の比較結果
34
— vii —
. . . . . . . . . . . . . . . . . . . .
第1章
序論
コンピュータの記憶容量の大容量化, 処理速度の高速化に伴い大量の画像データをコン
ピュータで扱う画像データベースの構築が行われている. このような場合にユーザが簡便に
画像データベースを利用できるシステムの需要が高まっており, その一つに画像データベー
スから類似した画像を検索する類似画像検索システムがある.
類似画像検索には, 従来は商標登録の際に新規登録しようとしている商標と類似の商標が
すでに登録されていないかを調べる類似商標検索 [1] や栗田らが構築した“ すがすがしい ”,
“ 華麗な ”などの形容詞などを与えて, これを満足する絵画を検索するシステム [2] などの手
法が用いられていた. しかし, キーワード入力による検索は, 人によって付与するキーワード
が異なる場合や検索者と付与者との意図が異なり正確に検索できない場合がある. 特徴を用
いた検索は, 特徴レベルでは似かよった画像が検索されるが, 特徴から選出された画像が必
ずしも人間の感覚に合っているとはいえない問題が残る. そこで人間の感覚に合った画像を
検索する手法として多次元尺度法を用いた類似画像検索が行われている. しかし, この手法
は画像間の主観評価値であるが雑兵価値を人間が入力しなければいけない問題点があり, 工
数入力の削減法の開発が望まれている.
本研究では, 多次元尺度法を用いた類似画像検索の問題点である主観評価値の工数削減
法を提案する. 画像を N 枚としたとき全て人間が主観評価値を入力した場合の工数 m は
m=
N (N−1)
2
となる. これは N 2 に近いオーダで増加するので, N が大きくなると膨大な
労力が必要となる. そこで画像を幾つかのグループに分割することで入力工数を削減するこ
とができると考えた. 分割したグループ数を K とすると 1 グループあたり
N
力する画像間の主観評価値の工数 m′ は m′ = K( K
—1—
N
(K
−1)
)
2
N
K
となるので入
となる. これは N ≫ K のとき
m′
m
∼
=
1
K
となり, 大幅な工数の削減が見込める. そしてグループ間の主観評価値は特徴を擬
似的に主観評価値として変換する方法を提案した. グループの中心となる画像を色・形状特
徴を用いて選出し, その画像をグループの代表画像とした. そして代表画像間の主観評価値
を人間が入力し, グループに属する画像間の主観評価値と代表画像間の主観評価値が比例関
係にあると仮定してそれぞれの画像間における特徴間の距離を用いて算出した. この手法を
用いることで全て人間が入力した主観評価値に近似した主観評価値を作成できると予想され
る. 全て人間が入力した主観評価値を方法 1, 本手法を用いて作成した主観評価値を方法 2
とし, 方法 1 と方法 2 の入力工数の差で工数削減の評価を行い, 方法 1 から得られた多次元
心理空間に類似画像検索を行った結果を基準とし, 方法 2 から得られた多次元心理空間に類
似画像検索を行った結果を適合率で評価した. その結果, 全て人間が入力した場合と同程度
の検索能力を保持しつつ工数を削減することができるという実験結果を得た.
本論分の構成は次の通りである. 第 2 章では従来の類似画像検索手法の説明とその問題点
について述べ, 第 3 章では多次元空間のデータを 2 次元空間に配置する多次元尺度法につい
て説明する. 第 4 章は工数削減法を提案し, 第 5 章で実験結果を示す. 第 6 章では本手法を
用いて実際に類似画像検索を行い人間が入力した場合との比較を行う.
—2—
第2章
類似画像検索
類似画像検索とは, 多量にある画像データからキーとなる画像を与え, その画像に類似し
た画像を検索する方法である. 本章では, 従来行われてきた代表的な類似画像検索で用いら
れる特徴と手法について述べる.
2.1
類似画像検索の意義
従来, 実用されている画像データベースでの画像検索は, 言語情報であるキーワードを検
索キーとして用いている場合が大部分である. しかし, 画像情報は言語情報と比較するとは
るかに多義性やあいまい性が高いため, キーワードを用いた検索だけでは必ずしも満足な検
索結果を得られないことがある. そこで, 画像そのものを検索キーとして用いることにより,
画像データベースの中の画像の内容に直接アクセスし, 類似した画像を検索する方法が望ま
しいといえる. 例としてデジカメで写した写真データが多量になった場合などにキーとなる
画像を与えて類似している写真データを集めることや, ペットショップで飼いたい動物の画
像をキー画像にすることで似ている動物の画像を集めてくることなどが挙げられる. 代表的
な類似画像検索で用いられる特徴としては, 画像の色, 形状が挙げられる. また, 手法におい
ては自己組織化マップ [7] や主成分分析 [8] が用いられている.
2.2
類似画像検索に用いられている特徴
最も一般的に用いられている特徴は, 色, 形状を用いた特徴であり, 以下にその概要を述
べる.
—3—
2.2 類似画像検索に用いられている特徴
2.2.1
色特徴
(1) 色を用いた特徴 [3]
画像の色特徴において一般的に用いられる特徴は以下の 3 つである.
① 画像全体から 256 階調の R, G, B, のヒストグラムを求め, 各色について指定した次元
数に圧縮した特徴量
② 画像全体から 256 階調の色相, 彩度, 明度に関する HSL 特徴量を求め, 各特長量を指定
した次元数に圧縮した特徴量
③ 現画像を HSV 表色形に変換し, HSV 各成分に対して Haar Wevelet 変換による多重解
像度解析を行い抽出した特徴量
画像の一般的な色空間である RGB 表色形と色見本とされている HSL 表色形や HSV 表
色形がよく用いられている. HSL 表色形や HSV 表色形が使用されているのは, RGB 表色
形よりも色相や彩度, 明度という観点から見た場合, HSL 表色形や HSV 表色形の方が自然
とされているからである.
(2)HSL 表色形 [4]
HSL 表色形では H の領域は [0, 2π], S, L の領域は [0, 1] である. 以下の手順で HSL 表色
形での閾値処理により 256 色から 10 色に量子化し, それによる画像中の全画素のカラーヒ
ストグラムをその画像に対する色情報として用いた.
Step1 L(明度) がある値より小さいと人間はほとんど黒と認識する. 逆にある値より大き
いと白と認識する. そこで, 明度に対する一定の閾値を元に黒と白の色領域を決定する.
Step2 S(彩度) がある値より小さい人間は灰色と認識する. これより, 彩度に対する一定
の閾値を元に灰色領域を決定する. ここでは明度の異なる 2 種類の灰色として領域を設
定した.
—4—
2.2 類似画像検索に用いられている特徴
Step3 上記以外の色領域を有彩色とし, ここでは H(色相) を用いて領域を 6 等分し有彩色
の色情報とする.
以上より, 3 次元の色空間を黒, 白, 2 種の灰色, および 6 種の有彩色の計 10 領域に分割し,
そのヒストグラムにより各画素の色情報を 10 次元のベクトルで表した. 以下にベクトル表
現への手順を示す.
Step1 RGB 表色形から HSL 表色形へ変換.
Step2 Step1 で変換した色空間での閾値操作による 10 色への量子化.
Step3 量子化したカラーヒストグラムの生成とそれによる 10 次元ベクトルの算出.
2.2.2
形状特徴
画像の形状特徴において一般的に用いられる特徴は以下の 2 つである.
① 画像の輪郭を追跡し, 画像の中心と輪郭の間の距離を求める CCD アルゴリズム.
② 画像の輪郭を追跡し, 画像の端から輪郭の間の距離を求めるペリフェラル特徴.
(1)CCD アルゴリズム [5]
CCD アルゴリズムは葉の切れ込みや縁のギザギザの程度を表すのに用いられている方法
[5] で, 植物などの細かい箇所が複雑な画像に対して有効な方法である. 以下に例として葉の
画像を CCD アルゴリズムでベクトル表現する手順を示す.
Step1 葉の画像をグレイ・スケール画像に変換する.
Step2 ヒストグラムを作成し, 画像を 2 値画像に変換する.
Step3 メディアン・フィルターでノイズを除去し, 葉のエリアを見つけ, 輪郭追跡を行う.
Step4 重心を計算し, CCD 値を計算し, CCD 値 f (x) = CCD(x) を正規化し, ベクトル
を算出する.
—5—
2.2 類似画像検索に用いられている特徴
以下の図 2.1 に CCD アルゴリズムの例を示す. 重心 G から各方向に走査し, 最後に黒画
素をとった座標までの距離を特徴量とする. 分割数に応じて全方位に走査することができる
ため, 左右上下非対称の画像の輪郭を抽出するのに適している. しかし, 全方位に走査しなく
てはならないため, より鮮明に形状特徴を表そうとした場合, 分割数が増え特徴量の次元数
が多くなってしまう.
図 2.1 CCD アルゴリズム
(2) ペリフェラル特徴 [6]
ペリフェラル特徴は蝶等の輪郭が取れれば形状が確認できるものに対して効果的な方法で
ある. 以下にベクトル表現への手順を示す.
Step1 画像を大津の方法で 2 値化し, 12 近傍の塗りつぶしを行う.
Step2 2 値化した画像を矩形枠で切り出し, 左辺, 下辺を 10 等分割する.
—6—
2.2 類似画像検索に用いられている特徴
Step3 各分割区間において左辺では右方向, 下辺では上方向に走査し, 最初に黒画素到達
するまでの白ランレングスの平均を求められる合計 20 次元のベクトルを算出する.
以下の図 2.2 にペリフェラル特徴の例を示す. 図 2.2 のように 2 値画像の左辺と下辺を H
分割し, それぞれ H 個の区間を作ると区間の幅は V =
M
H
となる. 下辺から Y 方向, 左辺か
ら X 方向に走査し, 第 k 区間の第 a メッシュ目において最初に黒画素に到達するまでの距離
gka (a=1, 2, · · ·, V) を求め, 以下の式 (2.1) に定義される xjk でペリフェラル特徴を求める.
i の特徴ベクトルは xi = (xi1 , · · · , xik , · · · , xim )T (k = 1, 2, · · · , m) で表される.
xik
V
1 1 =
gka
M V a=1
(2.1)
ここでは, ペリフェラル特徴は 2 方向から特徴量を得ているため, 左右対称か上下対象の
画像にする. これは 4 方向からのペリフェラル特徴に比べ形状を表す特徴の次元数を
らすためである.
図 2.2 ペリフェラル特徴
—7—
1
2
に減
2.3 類似画像検索手法
2.3
2.3.1
類似画像検索手法
自己組織化マップ [7]
自己組織化マップ (Self Organizing Map) とは, 教師なしのニューラルネットワーク学習
アルゴリズムであり, 高次元のデータを低次元へ非線形写像するデータ解析法である.
自己組織マップは, 入力層と出力層により構成された 2 層のニューラルネットワークであ
る. 入力層はに分析対象となる固体 j の特徴ベクトル xj = (xj1 , xj2 , · · · , xjn ), 出力層には
k(i = 1, 2, · · · , k) 個のユニットがあるとする. 図 2.3 の (a) で示すように, 出力層における
任意のユニットは, 入力層における特徴ベクトルのすべての変数とリンクしている. 初期段
階では乱数により各変数との間に図 2.3 の (b) に示すように重み mi = (mi1 , mi2 , · · · , min )
が付けられる.
図 2.3 自己組織化マップの構成
自己組織マップの学習アルゴリズムは, 以下の通りである.
Step1 入力 xj と出力層におけるすべての個体の中から最も類似している個体 mc を探し
出し, その個体を勝者とする.
Step2 勝者の個体およびその近傍の個体の重みベクトル mi を更新する.
Step3 Step1 と Step2 を入力された全ての特徴に対して行うことで画像データ間の親近
—8—
2.3 類似画像検索手法
性を表す空間を作り出す.
検索の手順を述べる.
Step1 検索キーとなる画像を入力する.
Step2 検索キーとなる画像から特徴を取り出し, その特徴に対して自己組織化マップを行
い画像データ間の親近性のある空間を作成する.
Step3 Step2 で作成した空間内で検索キーとなる画像がある座標の一定範囲内にある画
像データを類似画像として検出する.
2.3.2
主成分分析 [8]
主成分分析とは, 多くの変数により記述された量的データの変数間の相関を排除し, でき
るだけ少ない情報の損失で, 少数個の無相関な合成変数 (線形結合) に縮約して, 分析を行う
手法である. 通常用いる主成分分析は, データの分散が最大になるように線形結合式の係数
を求める方法がある. 以下の表 2.1 のような j 個の個体に対して n 個のデータ変数を持つ
データセットがある場合, この n 次元のデータをより低い l(l ≦ n) 次元に縮約する線形結合
の一般式は, 変量 x に対して任意の係数 a を用いて, 次のようになる.
—9—
2.3 類似画像検索手法
表 2.1 m 個の個体に対する n 個の変数を持つデータ
x1
x2
···
xj
···
xn
個体１
x11
x12
···
x1j
···
x1n
個体２
x21
..
.
x22
..
.
···
..
.
x2j
..
.
···
..
.
x2n
..
.
..
.
xi1
..
.
xi2
..
.
···
..
.
xij
..
.
···
..
.
xin
..
.
個体 m
xm1
xm2
···
xmj
···
xmn
..
.
個体 i
z1 = a11 x1 + a21 x2 + · · · + an1 xn
z2 = a12 x1 + a22 x2 + · · · + an2 xn
..
.
zj = a1k x1 + a2k x2 + · · · + ank xn
..
.
zl = a1l x1 + a2l x2 + · · · + anl xn
この線形結合式 z1 に用いる係数 a を第 1 主成分, z2 に用いた係数を第 2 主成分と呼ぶ.
これをまとめると表 2.2 のようになる.
— 10 —
2.3 類似画像検索手法
表 2.2 係数データ
主成分
第1
第2
···
第j
···
第l
x1 の係数
a11
a12
···
a1j
···
a1l
x2 の係数
..
.
a21
..
.
a22
..
.
···
..
.
a2j
..
.
···
..
.
a2l
..
.
xi の係数
..
.
ai1
..
.
ai2
..
.
···
..
.
aij
..
.
···
..
.
ail
..
.
xn の係数
an1
an2
···
anj
···
ajl
変量 x と係数 a を線形結合式で求めた値 z を主成分得点と呼ぶ. 主成分得点をまとめると
表 2.3 のようになる. 主成分得点 z と変量 x, 係数 a の関係は z = xa の行列演算となる.
表 2.3 主成分得点
主成分得点
z1
z2
···
zj
···
zl
第1
第2
···
第k
···
第l
個体 1
z11
z12
···
z1j
···
z1l
個体 2
z21
..
.
z22
..
.
···
..
.
z2j
..
.
···
..
.
z2l
..
.
..
.
zi1
..
.
zi2
..
.
···
..
.
zij
..
.
···
..
.
zil
..
.
個体 m
zm1
zm2
···
zmj
···
zml
..
.
個体 i
この主成分得点 z の標準偏差を 2 乗すると固有値が求まる. この固有値が高いほど元の
データの情報を多く含んでいる. 固有値全体の中で各固有値が含まれる割合を寄与率, その
— 11 —
2.3 類似画像検索手法
寄与率を累積したものを累積寄与率として主成分分析を行う際に寄与率と累積寄与率が高く
なる.
検索においては, 検索キーとなる画像と画像データベース上の画像データの特徴を上記の
処理を行い主成分となる軸を取得し特徴空間を作成する. その空間での検索キーとなる画像
がある座標の一定範囲内にある画像データを類似画像として検出する.
— 12 —
第3章
多次元尺度法
多次元尺度法とは，個体間の関係を，2 次元もしくは 3 次元の空間に配置する方法である．
本章では，この多次元尺度法について説明を行うとともにその方法の応用例を説明する．
3.1
3.1.1
多次元尺度法の原理 [6], [9]
多次元尺度法の用途
ある事物に対する感じ方が様々な感性から成り立つような複雑なものである場合，それが
どういった感性で構成されているのか，あるいは，どの感性が最も大きく寄与しているのか
が分からない場合が多い．多次元尺度法は，そういった対象についての類似性に関する判断
結果からデータの中に潜むパターンあるいは構造を探り出すために，また，潜在構造を少数
の次元の空間において幾何学的に表現するために用いる．
3.1.2
主観値評価
主観評価値とは，多次元尺度法を行う際に必要となる各データ間の非類似性を示した数値
である．主観評価値は全てのデータ間での数値が必要なため図 3.1 のようなマトリクス状
のデータファイルとなる．この図はヨーロッパの都市の形状をデータとして用い, データ間
の非類似度を示したものである. 図 3.1 では，”Gibraltar”と”Copenhagen”の主観評価値は
データ間の非類似性が高いため 3196 と大きい値を取るが, ”Hamburg”と”Cologne”の主観
評価値はデータ間の非類似性が低いため 460 と小さくなっている．
— 13 —
3.1 多次元尺度法の原理 [6], [9]
図 3.1 主観評価値ファイル
3.1.3
計量多次元尺度法
計量多次元尺度法は古典的多次元尺度法で主座標分析とも呼ばれ，刺激間の類似あるいは
相違を示す指標が間隔尺度もしくは比率尺度である場合に適用される．例としては，21 都
市の距離データに対して計量多次元尺度法を行い 2 次元平面上に配置したものを図 3.2 に示
す．X 軸は経度，Y 軸は緯度に近い意味を表わしていることが分かる．これより，
“ Lisbon ”
“ Stockholm ”と“ Rome ”は遠くに離れている．これは実際の
と“ madrid ”は近くにあり，
感覚と比べてあまり位置関係が変わっていないことが分かる．
— 14 —
3.1 多次元尺度法の原理 [6], [9]
図 3.2 計量多次元尺度法
3.1.4
非計量多次元尺度法
多次元尺度法の例として非計量多次元尺度法がある. 非計量多次元尺度法は，刺激間の類
似あるいは相違を示す指標になんの制限も設けない．そのため，非計量多次元尺度法の方が
適用範囲が広く心理的なデータ間の類似性を適用することが可能になっている．
3.1.5
ストレスの設定
ストレスとは，適合のよさを表わす測度でありこの値が小さいほど空間内に適切な位置付
けができていることになる．ストレス S の値は距離構造を持つデータマトリクスの要素 dij
を用いて以下の式より求まる．
— 15 —
3.2 多次元尺度法を用いた類似画像検索
S=
(dij − dˆij )2
d2ij
(3.1)
この式で求めたストレス値の評価として以下の表 3.1 がある．次元数が多くなるほど，ス
トレスの値が小さくなるがデータ間の類似性を視覚的に把握するためには次元数を少なくし
なければならないため，ストレスと次元数のバランスが必要となる．
表 3.1 カルスカルの評価目安
3.2
ストレス値
評価
0.2
悪い (poor)
0.1
まずまず (fair)
0.05
良い (good)
0.025
すばらしい (excellent)
0.00
完璧 (perfect)
多次元尺度法を用いた類似画像検索
類似画像検索の手法として, 多次元尺度法の画面に画像ナビゲーション [10] を適用する方
法 [11] がある. 画像ナビゲーションとは, 元来は 1 枚の画像中に複数の物体が写っている場
合, 画像データベースにおいてユーザが目的の画像を見つけるための道しるべとなり, 様々
な方向に誘導することに用いられていた. 本研究では多次元尺度法から得られる検索画面に
画像ナビゲーションのアルゴリズムを適用する方法を以下に述べる.
3.2.1
画像ナビゲーションによる類似画像検索の原理
人間は 1 枚の画像を見たとき, 様々な感覚や印象を持つが, これらの次元数は高次元であ
り, 人によって次元の要素も異なる場合がある. この高次元の要素を取り出すことができれ
— 16 —
3.2 多次元尺度法を用いた類似画像検索
ば効率よく検索が行えると考える. しかし, 高次元であるため, その要素を取り出すことがで
きても要素を視覚することができない. そこで, 図 3.3 に示すように人間の心理により得ら
れた多次元心理空間に存在する画像を 2 次元の検索画面に配置する手法として, 非計量多次
元尺度法を用いた. 全画像データ間の主観評価値を入力したデータに非計量多次元尺度法を
適用することにより k 次元の軸を取得する. そしてその k 次元の内の 2 軸を使用することで
検索画面に画像を配置することを可能にした.
図 3.3 多次元空間から 2 次元空間への配置
3.2.2
画像ナビゲーションのアルゴリズム
画像ナビゲーションは, 類似画像の効率的な検索を目的として作成したシステムである.
画像ナビゲーションの画面遷移を図 3.4 に示す. 2 次元に配置された画像の中から中心とな
る座標値と検索半径 r を入力すると, 中心となる画像, あるいは, その座標値に最も近い画像
を中心として半径 r 内に位置する画像を取り出す. 取り出された画像に対して再度同じ処理
を繰り返す. 以下にアルゴリズムを示す.
Step1 N 枚の画像に対して画像間の非類似度を表す主観評価値を入力したデータを作成
する.
— 17 —
3.2 多次元尺度法を用いた類似画像検索
Step2 Step1 で作成したデータに多次元尺度法を適用し, k 次元の軸と座標値を取得する.
Step3 k 次元の中で多次元尺度法のスコアの分散が最大, および, 次大となる 2 軸を選定
し, 2 次元平面に対応した座標値に画像を配置する.
Step4 中心となる座標値と半径 r を入力すると, 中心となる座標から半径 r 内の画像を検
出する.
Step5 絞り込んだ画像に対し再度 Step3～Step4 を行うことで, 類似画像を検出する.
図 3.4 画像ナビゲーションのアルゴリズム
3.2.3
画像ナビゲーションの使用法
3.2.2 の画像ナビゲーションシステムは, 人間の感覚を反映しているため, 目的の画像が配
置された場所が予想しやすく簡単に類似画像をまとめて検索することが可能となる. また,
一度検出した画像郡の中から非類似画像が多く混入していたとしても再び軸を選定し直し,
画像を再配置することで非類似画像をふるいにかけることが可能になっている. 3.2.2 で作
成したシステムの使用手順を以下に示す.
Step1 多次元尺度法で得られたスコアの分散が最大, 次大の 2 軸が選定され, この 2 軸が
構成される 2 次元平面上に分布図として表示される.
Step2 ユーザはクエリー画像に近いと思われる画像を発見し, その画像と画像からの検索
— 18 —
3.2 多次元尺度法を用いた類似画像検索
半径 r を入力することにより検索結果を得る.
Step3 検索結果からクエリー画像に近い画像をさらに絞り込みたい場合は検索結果に対し
て Step1, Step2 を実行する. クエリー画像に近いと思われる画像が検索できたと判断
した場合は終了する.
図 3.5 は全画像が表示された検索画面を表している. 左上の参照画像がクエリー画像と
なっており, 多次元尺度法で得られたスコアの分散が最大となる軸と次大となる軸を選定し
て画像を表示している. 次区の目盛は図では等距離目盛となっているが, 対数表示も行うこ
とができるようになっている. 画面の赤枠で囲まれた画像はユーザが発見したクエリー画像
に近い画像であり, この画像を中心に半径 r の範囲内にある緑枠で囲まれた画像を検索する
と図 3.6 のようになる. 図では検出された画像の中で多次元尺度法の尺度が最大, 次大とな
る軸を再び選定し, その 2 軸で構成される 2 次元平面上に検出された画像を表示している.
図 3.5 全画像表示画面
— 19 —
3.2 多次元尺度法を用いた類似画像検索
図 3.6 絞込み後の画面
— 20 —
第4章
工数削減法
多次元尺度法を用いた類似画像検索は人間の感覚に合った画像が検索できる長所がある
が, 画像枚数が増加すると非類似度投入の工数が膨大になるという欠点がある. 本章では人
間が入力する主観評価値の数を削減しつつ従来の手法と同程度の性能で類似画像検索を行え
る工数削減法を提案する.
4.1
非類似度の投入
従来の多次元心理空間を用いた類似画像検索を行う場合には画像間の主観評価値となる非
類似度を人間が入力する必要がある. 図 4.1 に投入結果例を示す. 図では SL001 と SL002 と
の非類似度は 80, SL001 と SL003 との非類似度は 110 が与えられており, (SL001,SL002)
間は (SL001,SL003) 間に比べて画像間の主観評価値が小さいことから画像が似ているとい
うことになる.
図 4.1 主観評価値の例
— 21 —
4.2 工数削減法の原理
工数削減法の原理
4.2
画像枚数を N とすると, 入力すべき主観評価値の数 m は m =
N (N −1)
2
となる. これ
は N 2 に近いオーダで増加するので, N が大きくなると膨大な労力が必要となる. 例えば
N = 50 の場合 m = 1, 225 であるが, N = 100 の場合 m = 4, 950 となり N = 500 の場合
m = 249, 500, N = 1000 の場合 m = 499, 500 となる. このように画像枚数が増加すること
で入力する工数が増加する. そこで, 画像枚数を減らすことができれば入力する主観評価値
の工数を削減できると考え, 画像をいくつかのグループに分割することで工数削減を行う方
法を考案した.
画像枚数 N を K 個のグループに分けて 1 グループ当り
N
K
枚の画像にする. 図 4.2 は画
像 i, j の主観評価値 dij のマトリクスである. もし, グループ内の画像およびグループの代
表画像間のみ主観評価値を投入すれば良いとなると, 図 4.2 の斜線部と点の部分のみ投入
となるので, その工数 m′ は m′ =
m′
m
∼
=
1
K
K(K−1)
2
N
+ K( K
(N
K −1)
)
2
となる. これは N ≫ K のとき
となり, 大幅な工数の削減が見込める.
図 4.2 主観評価値 dij のマトリクス
— 22 —
4.3 主観評価値の計算法
4.3
主観評価値の計算法
図 4.2 の斜線部と点部分は人間が手動で入力するが, 斜線部と点部分以外の領域は入力工
数が膨大となり人間が入力するには労力が掛かりすぎる. そこで斜線部と点部分の dij を画
像の特徴を用いて付与する方法を提案する.
N 枚の画像を K 個のグループに手動で分割する. 画像特徴は 2.2 で述べた 10 次元の HSL
表色形と 20 次元ペリフェラル特徴とする. グループの代表画像の選択方法としては, 特徴空
間においてグループ内の中心となる座標を求め, これに最も近い画像とした. いまグループ
Gi , Gj があるものとし, このときのグループの代表画像を gi , gj , 各グループに属する画像
をそれぞれ fu , fv とする. 代表画像 gi , gj 間の主観評価値は s1 で与えられており, gi , gj の
特徴間の距離 dg , fu , fv 間の距離 df は既知であるとする. グループ Gi , Gj に属する代表画
像 gi , gj 間の主観評価値 s1 は, 代表画像の特徴間の距離 dg に比例すると仮定し, グループ
に属する画像 fu , fv 間の特徴間の距離 df を用いると s2 は次式 4.1 で近似的に与えられる.
s2 = (df /dg )s1
(4.1)
図 4.3 多次元心理空間における蝶画像のグループ
この方法で実際に主観評価値を算出すると全て人間が入力した主観評価値との間に誤差
— 23 —
4.3 主観評価値の計算法
が生じていた. その原因は分布にあると考え, 両者の主観評価値のヒストグラムを作成した.
図 4.4 に人間が入力した主観評価値の分布図, 4.5 に特徴から変換した主観評価値の分布図
を示す. 図 4.4 は峰を中心として左右対称形な正規分布に近いのに対し, 図 4.5 は峰が左方
へシフトした形になっている.
図 4.4 全て人間が入力した主観評価値の分布図
図 4.5 特徴から変換した主観評価値の分布図
— 24 —
4.3 主観評価値の計算法
図 4.5 の主観評価値に多次元尺度法を適用した場合, 得られる類似画像検索の結果は全て
人間が入力した主観評価値に多次元尺度法を適用して得られた類似画像検索の結果と異なる
画像が選出された. そこで, 主観評価値に変数変換を適用することで正規分布に近づけ全て
人間が入力した多次元尺度法から得られる結果と同程度の検索結果を得られると考えた. 文
献 [12] から次式のようなべき変換によって主観評価値を変換すると, 正規分布への近似が改
善される.
y = xu (u > 0)
(4.2)
x は変換される主観評価値で u はべき乗を示す. 文献 [12] より最も正規分布へ近くなる
u = 0.4 で行った. 変数変換を適用した主観評価値から得られる分布を図 4.6 に示す. 図よ
り分布の形状は正規分布に近づいていることが分かる. これにより, 全て人間が入力した主
観評価値に特徴を変換した主観評価値近づけることができた.
図 4.6 変数変換を適用した主観評価値の分布図
— 25 —
4.4 工数削減法の結果例
4.4
工数削減法の結果例
4.3 の計算法を用いた工数削減法の実験結果の例を以下に示す. 図 4.7 は全て人間が入力
した主観評価値の例で, 図 4.8 は特徴から変換して作成した主観評価値の例である. 図 4.7,
図 4.8 において赤枠は人間が入力しなければならない主観評価値, 緑枠は特徴から変換した
主観評価値となっている. 図 4.8 緑枠の範囲を図 4.7 と比較すると多少の誤差はあるものの
特徴を擬似的に主観評価値へと変換することができていることが分かる.
図 4.7 全て人間が入力した主観評価値の例
図 4.8 特徴から変換して作成した主観評価値の例
— 26 —
第5章
実験結果
5.1
実験データ
実験には素材辞典 Vol.12 蝶編 [13] の蝶画像の中から類似画像 80 枚を用いることとし,
N=80 とした. 人間の主観で類似画像を 9 グループに分け, K=9 とした. 以下に各グループ
について示す.
図 5.1 グループ分けの概要
Group1
黒く幅が広い蝶
Group2
白に近い蝶
Group3
黒く幅が狭い蝶
Group4
黄色に近く幅が広い蝶
Group5
幅が広く, 縦に細い蝶
Group6
形が四角く, 色が明るい蝶
Group7
形が四角く, 色が暗い蝶
Group8
茶色に近い蝶
Group9
無彩色の模様がある蝶
図 5.2 グループの代表画像
— 27 —
5.2 特徴を使用した主観評価値の作成
5.2
特徴を使用した主観評価値の作成
5.1 で得られた画像を用いて 4.3 の方法で主観評価値を作成する. 以下にその手順を示す.
Step1 用意した 80 枚の画像から HSL 表色形, ペリフェラル特徴の色・形状特徴を取る.
Step2 設計者が全 80 枚の画像を 9 グループに分け, グループ内の画像間の主観評価値を
入力する.
Step3 Step1 で取得した特徴を用いてグループの中心座標を求め中心座標に最も近い画
像を選定し, その画像を代表画像とする.
Step4 決定された代表画像間の主観評価値を入力する.
Step5 Step2 で入力したグループ内の主観評価値を用いてグループ間の画像間の主観評
価値を提案手法である 4.3 の近似式を用いて付与する.
5.3
検索システムの作成
5.1, 5.2 で得たデータを用いて 3.2.1 の方法で蝶の画像を検索する画像ナビゲーションシ
ステムを作成する.
Step1 5.2 で得られた 2 つの主観評価値を, 統計処理ソフト「R」を用いて非計量多次元
尺度法の処理を行いそれぞれ 20 次元の軸取得した. これは, ストレス値は 0.025 以下で
“ excellent ”であり (表 3.1), k=20 とすればストレス値が 0.02 となり“ excellent ”と
なることによる.
Step2 k=20 としたときに多次元尺度法のスコアの分散値が最大となる軸と次大となる軸
を選定する.
Step3 検索対象とする画像集合と選定された 2 軸の座標値を読み込んで, 検索対象とする
画像集合を 2 次元平面の検索画面に配置する.
— 28 —
5.4 作成した主観評価値の評価実験
5.4
5.4.1
作成した主観評価値の評価実験
検索能力
類似画像検索の評価方法については, 検索した画像集合の中で類似画像が含まれる割合に
よる方法 [6] が用いられている. この評価方法は検索した画像集合の質を評価するものであ
るためこの方法を用い, 類似画像検索の結果を適合率と未検出率で評価する.
(1) 適合率
検出された画像 n 枚の中に類似画像 m 枚が含まれる割合である. この割合が高いと類似
画像が効率よく絞り込めたことを表している.
α=
m
× 100%
n
(5.1)
(2) 未検出率
全ての類似画像 M 枚の中で検出されなかった類似画像の割合である. この割合が低いと
選択されなかった画像が少ないことを表している.
β=
M −m
× 100%
M
(5.2)
図 5.3 は適合率, 未検出率を説明する図である. 赤枠で表示された画像は類似画像, 青枠は非
類自画像を示す. 適合率 α は検出された画像 n 枚の中で類似画像 (m 枚) が含まれる割合を
示している. 図 5.3 の場合では N =80, n=9, M =5, m=4 となっており, 式 5.1, 5.2 を用い
て各評価値を求めるとα=44%, β=20%となる. 今回の実験では全て人間が入力した主観評
価値に工数削減法を用いて作成した主観評価値が類似していることを確認したかったので,
図 5.3 で示されている全類似画像 M を全て人間が入力した主観評価値を用いて類似画像検
索を行った結果検出された画像とした.
— 29 —
5.5 実験結果
図 5.3 評価基準
5.4.2
工数削減
工数削減の評価方法については, 全て人間が入力した主観評価値と, 4.3 の提案手法を用
い特徴から変換して作成した主観評価値を比較し, 入力する主観評価値の工数を評価した.
5.5
5.5.1
実験結果
検索能力
全て人間が入力した主観評価値を用いて得られた多次元心理空間から検索された画像を基
準となる類似画像とし, 特徴から変換して作成した主観評価値を用いて得られた多次元心理
空間から検索された画像の評価を行った. 実験結果を以下の表 5.1 に示す. この実験結果か
らグループの中心近傍にあるグループの代表画像, 代表画像に最も類似している画像をクエ
リ画像とした場合人間の 89%の精度で類似画像が検索できたことを確認した. 実際に 2 次元
に配置した結果を図 5.4, 図 5.5 に示す.
— 30 —
5.5 実験結果
表 5.1 検索能力の実験結果
評価項目
クエリー画像
適合率 (%)
未検出率 (%)
代表画像
89
8
代表画像に最も類似している画像
89
22
代表画像に最も類似していない画像
71
28
図 5.4 全て人間が入力した主観評価値を使用
5.5.2
工数削減
画像枚数 N = 80, グループ数 K = 9 で行った結果, 全て人間が入力した主観評価値の場
合の入力工数は 3160, 特徴から変換して作成した主観評価値の場合の入力工数は 386 とな
り, 今回の実験では 88%削減することができた. 実時間で計算した場合, 1 回の入力にかかる
時間を 10 秒とすると全て人間が入力した主観評価値の場合約 9 時間かかり, 特徴から変換
— 31 —
5.5 実験結果
図 5.5 特徴から変換した主観評価値を使用
して作成した主観評価値の場合約 1 時間かかることになる. 実際には入力時の疲労などの要
因を考えると全て人間が入力する場合は更に時間がかかるのでこの工数削減法の有用性を確
認することができた.
— 32 —
第6章
考察
第 5 章では, 全て人間が入力した主観評価値を用いて得られた多次元心理空間から検索さ
れた画像を基準となる類似画像として実験を行った. 本章では人間が選択した類似画像に対
して全て人間が入力した主観評価値と, 特徴から変換して作成した主観評価値の検索能力を
比較・検証する.
クエリー画像である①グループの代表画像, ②グループ内で代表画像に最も類似している
画像, ③グループ内で代表画像に最も類似していない画像の 3 種類の画像に対する類似画像
を数人の主観から選択し, その類似画像に対する類似画像検索を行った. 画像データは第 5
章と同じ実験条件とし, 比較する主観評価値には全て人間が入力したものと色・形状特徴か
ら変換して作成したものを用いた. 第 5 章で得られた実験結果から人間の 89%程度の精度で
類似画像を検索できていたので人間が選択した類似画像に対しても同程度の検索が行えると
考えた.
実験の結果を表 6.1 に示す. 表より今回の実験では, ①の代表画像をクエリー画像とした
とき適合率, 未検出率ともに同程度の検索が行えていることが見て取れる. この結果は第 5
章で得られた実験結果とも一致する. しかし, ②, ③をクエリー画像とした場合に全て人間が
入力した主観評価値と特徴から変換して作成した主観評価値の検索能力に差異がある. ②の
場合, 全て人間が入力した主観評価値での適合率を特徴から変換して作成した主観評価値の
適合率が上回っている原因はグループ分けにあると考える. グループ分けは検索者の主観で
行ったため検索者が類似していると感じる画像が集まるのは当然の結果で, 提案手法ではグ
ループ内の画像間に対して人間が入力し, グループ間は特徴を使用しているためにグループ
間の距離が全て人間が入力した主観評価値の場合より広がり, 類似画像が集中的に固まった
— 33 —
ので特徴から変換して作成した主観評価値を用いた場合の適合率が上回ったと推測する. ③
の場合, 第 5 章の実験で得られた様に適合率, 未検出率において特徴から作成した主観評価
値が人間が入力した主観評価値を下回っている. この原因は特徴を用いた主観評価値の算出
方法にあると考える. 提案方法では代表画像間の主観評価値がグループに属する画像間の主
観評価値と比例関係にあると仮定して主観評価値を計算したが, この方法では代表画像と画
像間の特徴の距離が大きくなるとグループの中心から離れてしまうので, 類似画像検索を行
う際に取りこぼしが多くなるからである. この欠点をなくすため代表画像間の主観評価値の
みでなく, 代表画像とグループに属する画像間の主観評価値と特徴の距離も用いてグループ
に属する画像間の主観評価値を算出する方法を考えている.
表 6.1 類似画像に対する検索能力の比較結果
主観評価値
全て人間が入力
特徴から変換し作成
クエリー画像
適合率 (%)
未検出率 (%)
① 代表画像
86
26
② ①に最も類似している画像
86
33
③ ①に最も類似していない画像
85
39
① 代表画像
84
26
② ①に最も類似している画像
95
40
③ ①に最も類似していない画像
79
42
— 34 —
第7章
結論
多次元尺度法を用いた類似画像検索において主観評価値の工数削減法を提案した. 類似画
像検索に多次元尺度法を適用するため主観評価値を入力する必要があるが, 画像枚数の増加
に伴い主観評価値の入力工数が膨大になる. そこで, 本手法は HSL 表色形とペリフェラル特
徴から色特徴 10 次元と形状特徴 20 次元の計 30 次元の特徴を擬似的に主観評価値に変換す
ることで入力工数の削減を行った.
80 枚の画像に対して人間の主観で 9 グループに分割し, グループの中心となる画像を 30
次元の特徴から選出しその画像を代表画像とした. グループ内の画像間とグループの代表画
像間の主観評価値を人間が入力し, グループの代表画像間の主観評価値と画像間の特徴間の
距離は比例関係にあると仮定しグループに属する画像間の主観評価値を算出した.
評価方法としては, 全て人間が入力した主観評価値を方法 1, 本手法用いて特徴から変換
して作成した主観評価値を方法 2 し, 方法 1 と方法 2 の入力工数の差, 方法 1 と方法 2 の検
索能力を採用する. 方法 1 と方法 2 に多次元尺度法を適用してそれぞれ多次元心理空間を作
成し, 類似画像検索のクエリー画像としてグループの代表画像とグループの中心近傍の画像,
グループの中心以遠の画像の 3 種類を用い類似画像検索を行った. 方法 1 の多次元心理空間
に類似画像検索を行った検索結果を基準とし, 方法 2 の多次元心理空間に類似画像検索の検
索結果の適合率と未検出率を求めた. その結果, 入力工数は方法 1 の場合の 3160 から方法 2
の場合は 386 へと減少し, 工数を 88%削減することができた. 検索能力はグループの中心近
傍の画像をクエリー画像とした場合, 適合率で評価すると人間の 89%程度の精度で検索でき
ることが確認できた. しかし, グループの中心近傍以遠の画像をクエリー画像とした場合に
検索能力が人間のそれより低下する結果が得られた. また工数削減としてグループ分割の自
— 35 —
動化を行う必要がある. これらは今後の課題としたい.
— 36 —
謝辞
本報告書は筆者が高知工科大学工学部情報システム工学科在学中に行った研究活動の成果
をまとめたものである. 研究に関する様々な知識, 研究内容, 本論分の書き方ならびに就職活
動などに至る御指導, 御教示を賜った木村義政教授に深く感謝する. また, お忙しい中, 本研
究の副査を承諾して下さった岡田守教授, 吉田真一講師に深く感謝する. 本研究を行うにあ
たり, 木村研究室の諸氏には, 様々な協力を頂き深く感謝する. 最後にあらゆる場で御指導頂
いた情報システム工学科の全ての先生方と素晴らしい学習環境を用意して頂いた高知工科大
学に深く感謝する.
— 37 —
参考文献
[1] 加藤, 下垣, “ マルチメディア商標・意匠データベース TRADEMARK ”, 電子情報通
信学会技術報告 PRU88-9, 1988.
[2] 栗田, 加藤, 福田, 板倉, “ 印象語によるデータベースの検索 ”, 情報処理学会論文誌,
vol.33, no.11, pp.1373-1383, 1992.
[3] 北研二, 獅子掘正幹, “ １次元自己組織化マップを用いた高次元データの高速近傍検
索 ”, 信学技報, NLC2002-114, 2002.
[4] 日向崇, 西川郁子, “ 自己組織化マップを用いた蝶類標本画像データベースの構築 ”,
日本ファジィ学会誌, vol.14, no.1, pp.74-81, 2002.
[5] ALFIAN MUHANMMAD, 阿部公輝, “ CCD アルゴリズムを用いた葉の形状の特徴
抽出 ”, 信学技報, PRM2007-1, MI2007-1, 2007.
[6] 田邊勝義, 大谷淳, 石井健一郎, “ 多次元心理空間を用いる類似画像検索法 ”, 電子情
報通信学会論文誌 (D-Ⅱ), vol.J75-D-Ⅱ, no.11, pp.1856-1865, 1992.
[7] 金明哲, “ R と自己組織化マップ ”, http://www1.doshisha.ac.jp/mjin/R/
[8] 金明哲, “ R と主成分分析 ”, http://www1.doshisha.ac.jp/mjin/R/
[9] 井口征士, 感性情報処理, オーム社, 1996.
[10] 笠原久嗣, 小池秀樹, “ 画像データベースのナビゲーション機構 ”, 電子情報通信学会
春季全国大会, D-389, 1900.
[11] K. Hirose , N. Ohnishi and Y. Kimura,“ Pictorial Navigation Using Multidimensional Psychological Space ”, Proc. NEINE’07, pp465-468, 2007.
[12] 若林哲史, 鶴岡信治, 木村文隆, 三宅康二, “ 手書き文字認識における特徴量の次元
数と変数変換に関する考察 ”, 電子情報通信学会論文誌 (D-Ⅱ), vol.J76-D-Ⅱ, no.12,
pp.2495-2503, 1992.
[13] 素材辞典 vol.12 蝶編, 株式会社データクラフト.
— 38 —
付録 A
付録環境
— 39 —

多次元尺度法のための画像評価値入力の 工数削減法

Comments

Description

Transcript

多次元尺度法のための画像評価値入力の工数削減法