...

立体透明視における視差情報表現: 心理実験とモデル化

by user

on
Category: Documents
13

views

Report

Comments

Transcript

立体透明視における視差情報表現: 心理実験とモデル化
立体透明視における視差情報表現:
心理実験とモデル化
Neural Representation of Binocular Disparity in Stereo Transparency:
Psychophysics and Modeling
渡部 修
Osamu Watanabe
室蘭工業大学
Muroran Institute of Technology
Abstract: In binocular vision, observers can perceive transparent surfaces by fusing the stereograms generated by overlapping two dot patterns in different depths. In the case that overlapping patterns are identical,
the stereogram has the matching candidates that can generate both transparent and non-transparent (or unitary) surfaces. Here we investigate the transparency perception in this ambiguous stereogram with additional
segragation cues for overlapping surfaces. We also show the population coding model with the hybrid disparity
energy model can explain the psychophysical result.
1
はじめに
位置ずれの双方がある) 視差エネルギーモデル [1, 2] を
用いて拡張した.さらに,透明面および単一面のどちら
初期視覚では様々な奥行手がかりを用いて外界の 3 次
の対応も可能な LPDS (locally-paired-dot stereogram)
元構造の推定が行われる.この中でも,両眼視差は強
と呼ばれる特殊な刺激を用いて,立体透明視の知覚特
力な奥行手がかりの一つである.Ohzawa ら [3] は,視
性を検証した.本モデルは,この LPDS の知覚特性も
差情報を検出するネコ 17 野の両眼性細胞の特性が,視
定性的に説明できることを示す.
差エネルギーモデル (disparity energy model) で定量的
にモデル化できることを示した.これ以降,両眼立体
視の生理学的に妥当なモデルとして,視差エネルギー
立体透明視の神経回路モデル
2
モデルの解析や,これを用いた視差検出アルゴリズム
の研究が精力的に行われてきた (例えば [2, 10, 12]).
2.1
視差エネルギーモデルの定義
一方,脳の両眼視メカニズムの研究では,視野上の同
視差エネルギーモデルは,単純型および複雑型細胞
一の領域において複数の奥行を同時に知覚する立体透明
の 2 層からなる両眼性細胞のモデルである.単純型細
視 (stereo transparency) 現象の重要性が指摘され,心理
胞では左右眼刺激 Il (x), Ir (x) の単純なフィルタリン
物理学的研究も数多く行われてきた (例えば [4, 8, 9, 11]).
グが行われる.この応答を rs とおくと,
Z
rs = dx[fl (x)Il (x) + fr (x)Ir (x)]
立体透明視の問題は,重畳された複数の視差情報をい
かにして符号化・復号化するのかという,脳内の情報表
(1)
現の問題に示唆を与えるものと期待されている.しか
し,立体透明視を扱えるモデルや,立体透明視に関す
と定式化される.ここで,左右眼の受容野形状 fl (x),
る生理学的知見はほとんど存在しない.Watanabe and
fr (x) はガボール関数
Idesawa [12] は,立体透明刺激に対する視差エネルギー
モデルの応答を解析し,重畳する表面パターンが無相
fl (x) = ce− 2σ2 cos(ωx + φl )
関であれば各表面を単独で呈示したときの和で近似で
fr (x) = ce
x2
(x+d)2
− 2σ2
cos(ω(x + d) + φr )
(2)
(3)
きることを示している.また,Tsai and Victor [10] は,
パターンマッチング法による視差検出アルゴリズムで
立体透明視を扱える可能性があることを指摘している.
これらの研究はいずれも phase モデル (左右眼の受容野
に位置ずれがない視差エネルギーモデル) を用いている.
本研究では,Tsai and Victor のパターンマッチングモ
デルをハイブリッド型 (左右眼受容野間に位相差および
で定義される.σ, ω は受容野の大きさおよび最適空間
周波数を定めるパラメータ,φl , φr は左右眼受容野の
位相,c は定数である.一般に,最適空間周波数 ω が
低いほど受容野の大きさ σ は大きくなる.シミュレー
ションでは σ = π/ω とおき,受容野の大きさ σ が最
適空間周波数 ω に反比例するものとする (このとき帯
域幅は約 1.14 オクターブとなる [2]).最適視差は,左
(a) Normalized
response rc
右眼受容野の位相差 ∆φ = φr − φl および位置ずれ d
2
で決まり,∆φ/ω0 − d となる.
1
複雑型細胞では,刺激の呈示位置に依存しない応答
0
が得られる.複雑型細胞は受容野の位相が π/2 異なる
π
π/2
2 つの単純型細胞 rs , r̄s があれば構成できる.この応
答 rc は,次式のように単純型細胞応答の二乗和で定義
0
Phase
-π/2
shift
∆φ (rad) -π
される:
rc = (rs )2 + (r̄s )2 .
2.2
(4)
30
10 20
-10 0
-30 -20
Position shift d (pixel)
(b) Normalized
response rc
ポピュレーション応答
2
いま,視覚刺激 I(x) の左右眼への呈示視差を D と
1
し,Il (x) = I(x), Ir (x) = I(x + D) とおく.視覚刺激
0
π
π/2
I(x) として RDS (random-dot stereogram) を考え,十
分なプーリング (pooling) が行えるとする.このとき,
0
Phase
-π/2
shift
∆φ (rad) -π
(4) 式の複雑型細胞応答は次式で近似できる [10]:
rc ≈ µ [1 + λ cos((∆φ + ωd) − θ)]
·
¸
(D−d)2
= µ 1 + e− 4σ2 cos((∆φ + ωd) − ωD)
(5)
(6)
ここで,ポピュレーションの平均発火率 µ は,入力刺
激 I(x) のエネルギーや,受容野のパラメータ c2 σ に
√
依存する.本モデルでは c = 1/ 2πσ とおき,平均発
火率 µ は刺激のエネルギーのみに比例するものとする.
30
10 20
-10 0
-20
-30
Position shift d (pixel)
図 1: モデルのポピュレーション応答.(a) 単一視差 D = 0 ピクセ
ルに対する応答.(b) 二重視差 D = ±12 ピクセルに対する応答.グ
ラフでは平均発火率 µ = 1 になるよう正規化した.rc -d 面には,各
位置ずれ d における振幅 λ を黒点 (•) で示している.この図では,
最適空間周波数 ω/(2π) = 1/16 cycle/pixel のポピュレーションの
みを表示している.位置ずれ d は −32 ∼ +32 ピクセルの 17 種類
のみを表示している.入力パターンの RDS は,ドットサイズ 1 ピ
クセル,ドット密度 25%とし,単純型細胞への入力に際し平均 0 に
なるよう正規化を行った.
視差情報は,ポピュレーション応答の位相 θ = ωD,お
よび µ = 1 に正規化したときの振幅 λ = e−
(D+d)2
4σ 2
の
あった形状をしている.このため,位置ずれ d = 0 の
二つのパラメータで符号化される.なお,二重視差に
ニューロンでは応答が互いに相殺され,振幅 λ が 0 に
対する応答は,それぞれの視差表面のパターンが無相
近い値になっている.
関であれば,各視差表面を単独で呈示したときの応答
の和で近似できる [12].
シミュレーションでは,1,000 試行の結果をプーリン
2.3
視差情報の復号化
グしポピュレーション応答を求める.最適空間周波数
ポピュレーション符号化のモデルでは,一般に,視差
ω は,0.5 オクターブ刻みで 1/16 ∼ 1/128 cycle/pixel
D に対するポピュレーション応答 rc = {rc (ω, ∆φ, d)}
の 7 種類を用いた.また,両眼性細胞の位相差 ∆φ は,
のふるまいを確率分布 P [rc |D] でモデル化する [6].こ
生理学的にも −π ∼ +π の範囲にわたって分布するこ
こで,rc (ω, ∆φ, d) は最適空間周波数 ω ,位相差 ∆φ,
とが知られていることから [3],π/8 刻みで −π から
位置ずれ d を持つ複雑型細胞の応答である.
7π/8 までの 16 種類を用いた.さらに,位相差 ∆φ と
位置ずれ d にはほとんど相関がなく,d の分布は最適
空間周波数によらずほぼ一定であるという生理学的知
見 [1] より,全ての空間周波数チャネルにおいて,位置
このとき,ベイズ規則より,視差 D の推定値 D̂ は
次式で与えられる:
D̂ = arg max P [D|rc ] = arg max P [rc |D]P [D].
D
D
(7)
ずれ d として 4 ピクセル刻みで −64 ∼ +64 ピクセル
いま,視差 D の出現確率を一様 (P [D] = const.) とし,
の 33 種類を用いた.
ニューロン応答 P [rc |D] を正規分布でモデル化する.各
図 1 に,D = 0 ピクセルの単一視差,および D = ±12
ピクセルの二重視差に対する,ポピュレーション応答
を示す.図 1a より,単一視差に対するポピュレーショ
ン応答は (6) 式で与えられる理論曲線とよく一致するこ
とがわかる.また二重視差に対するポピュレーション
応答 (図 1b) は,図 1a のような単一視差応答が重なり
ニューロンが互いに独立であると仮定すると,上式は
¯
X ¯¯
D̂ = arg min
¯rc (ω, ∆φ, d)
D
¯
ω,∆φ,d
¯
h
i ¯2
(D−d)2
¯
− µ(ω) · 1 + e− 4σ2 cos(∆φ − ω(D − d)) ¯ (8)
¯
となる.ここで,µ(ω) は最適空間周波数 ω を持つニュー
1
0.9
ロンの平均発火率である.
な応答 ((6) 式) との二乗誤差を最小にする視差 D を推
定値 D̂ とする,テンプレートマッチング法 [10] と等価
0.8
Normalized SSE
これは,実際のポピュレーション応答 rc と,理想的
である.ここで,テンプレートとしては単一視差に対す
0.7
0.6
0.5
0.4
0.3
0.2
る応答のみを用いるが,立体透明刺激の場合でも,二
0.1
0
-150
つの視差が十分離れていれば,各視差に対応する二つ
-100
の極小値が生じ,二重視差を検出できると考えられる.
-50
0
50
Template disparity D (pixel)
100
150
ここで,各空間周波数チャネルの二乗誤差の大きさ
は,受容野のサイズ σ = π/ω に比例する [13].これ
によって,Tsai and Victor モデルの 1/f weighting が
自然に実現され,視差推定に際し低空間周波数チャネ
図 2: 様々な RDS に対する,実際のエネルギーモデル応答とテンプ
レートとの二乗誤差 (SSE; sum of squared error).太線は視差 0 の
RDS,細い実線は U-RDS,細い破線は A-RDS を入力したときの
結果を表す.二乗誤差の値は最大値 1 に正規化してある.
0
ない空間周波数に選択性を持つ場合は,µ(ω) ≈ 0 とな
10
るり,推定にほとんど寄与しないことになる.これは,
Tsai and Victor モデルの stimulus dependent weight
に相当する.
Disparity D1 (pixel)
ルの寄与が大きくなる.また刺激中にほとんど存在し
1
20
30
40
0
50
60
モデルの視差検出特性
3
3.1
-100
-50
0
50
Template disparity D (pixel)
100
単一視差
図 2 に視差 0 ピクセルの RDS を入力したときのシ
ミュレーション結果を示す.この RDS に対する二乗誤
差 (太線) は,入力視差である 0 ピクセルで最小値を取
図 3: 二重表面に対する,ポピュレーション応答とテンプレートとの
二乗誤差.グラフでは二乗誤差の大きさをグレーレベルで表し,縦
軸が二重表面のうちの一方の視差 D1 を表す.横軸はテンプレート
の視差 D である.横軸にそって二乗誤差が極小になる点の視差 D
が,D1 の推定視差となる.シミュレーションでは,二表面のドット
密度はそれぞれ 25%とした.
り,テンプレートの視差 D が大きくなるに従って増大
していく.しかし,テンプレートの視差 D がおよそ
差の差 D1 − D2 が 14 ピクセル以上) で二つのピークが
±50 ピクセルをこえると,徐々に二乗誤差が減少して
いく.この二乗誤差の減少は,位置ずれ d が取り得る
得られ,二重視差が検出できることが分かる.心理物理
範囲の制限に起因している.テンプレートの視差 D が
以上では二表面が分離して見えるが,これ以下では厚
大きいときは,これに選択性を持つニューロンがポピュ
みを持った一枚の面にしか見えないことが知られてい
レーションに存在しなくなるため,誤差の大部分が (8)
る [8].Phase モデルのみを用いた Tsai and Victor モ
学的には,視差の差がおよそ 2 ∼ 3 min (gap resolution)
式の計算に繰り込まれない.このため,検出可能な視
デル [10] では,視差の差が小さいときの推定視差が非
差は位置ずれ d の範囲で制限され,本稿で用いたパラ
常に大きくなるという欠点があった.一方,hybrid モ
メータの場合はおよそ ±50 ピクセルになる.
デルを用いると,人間の知覚によく似た特性を示す.
また,左右眼のドットパターンを無相関にした un-
また図では示さないが,二表面のドット密度が異な
correlated RDS (U-RDS; 細い実線) や,左右眼のドッ
トコントラストを反転させた anti-correlated RDS (ARDS; 細い破線) では,明確な極小値が得られていない.
るときは,ドット密度の低い面に対する極小値の二乗
この結果は,U-RDS や A-RDS で視野闘争が生じ奥行
くいという知見 [4] に対応すると考えられる.
を知覚できないという知見に対応すると考えられる.
誤差が大きくなるため,二重視差の検出が困難になる.
これは,二重表面ではドット密度の低い面を知覚しに
さらに,立体透明視においては,重畳された二表面の
奥行差が過小・過大に知覚される attraction/repulsion
3.1.1
立体透明視
次に,二つの視差 D1 , D2 を重畳した立体透明刺激に
ついて考える.図 3 に,視差 D1 (= −D2 ) を 0 ∼ +65
ピクセルの範囲で変化させたときのシミュレーション結
果を示す.図より,視差 D1 がおよそ 7 ピクセル以上 (視
effect と呼ばれる現象が知られている.Stevenson ら [9]
は,二重表面の視差の差がおよそ 6 min までは視差の
差が過小に知覚される attraction effect が,およそ 6 ∼
12 min では過大に知覚される repulsion effect が生じる
と報告している.また,二重表面の一方の面を A-RDS
^ 1 (pixel)
Perceived shift D1-D
6
(図 5 参照).しかし,対応ドットのコントラスト符号を
4
反転すると,二表面を分離する手掛りとして働くと考
2
えられるため,立体透明視が生じやすくなると期待さ
0
れる.
この節では,コントラスト反転率に伴う LPDS の奥
-2
行知覚の変化を,心理物理学実験により検証する.
-4
-6
-8
0
20
40
60
80
100
Separation D1-D2 (pixel)
120
4.1
方法
装置
視覚刺激は PC で作成し,NANAO T766 CRT
モニタ上に呈示した.両眼刺激は MacNaughton 製の
図 4: モデルの attraction/repulsion effect.横軸が二重表面の視
差の差,縦軸が呈示視差と推定視差の差で,正が attraction,負が
repulsion を表す.太い実線が通常の二重表面,太い破線が奥の面を
A-RDS にした場合を表す.
液晶シャッター眼鏡 NuVision 60GX を用い,リフレッ
シュレート 120 Hz で観察した.実験は暗室中で行い,
被験者は顎台で頭部の位置及び方向を緩やかに固定さ
れた状態でモニタを観察した.観察距離は 1 m であり,
にすると,視差の差がおよそ 12 min 以下で repulsion
このときの空間解像度は約 0.02 deg/pixel であった.
effect のみが生じることを報告している.本モデルは,
この attraction/repulsion effect も自然に説明できる.
被験者
図 3 の二乗誤差の極小値は厳密には呈示視差 D1 , D2
らない被験者 3 名の,計 4 名が参加した.
実験には,筆者 1 名,および実験の目的を知
と一致しない.特に二表面の視差の差が小さいときは,
それぞれの表面に対するポピュレーション応答が互いに
干渉するため,実際よりも過大あるいは過小な視差が
検出されることになる (図 1 参照).図 4 にモデルで生
じる attraction/repulsion effect を示す.通常の二重表
面を呈示した場合 (実線),および一方の面を A-RDS に
した場合 (破線) とも,心理学的な知見に合致している.
4
LPDS の奥行知覚特性: 心理実験
刺激
視覚刺激は,灰色背景上に呈示される二つのドッ
トパターンと注視点からなる.注視点は赤色の十字刺
激で,実験中は常に画面中央に呈示される.ドットパ
ターンは,それぞれ一辺 5 deg の正方形領域内に描画
される 700 個のドットからなる.ドットサイズは 0.06
deg である.各ドットパターンにおいて,ドットの半数
は白色,残りの半数は黒色とした.液晶シャッター眼鏡
を通して観察したときの輝度は,背景 4.5 cd/m2 に対
して白色ドット 7.2 cd/m2 ,黒色ドット 1.7 cd/m2 で
あった.ドットパターンは注視点の左右に位置し,ドッ
Watanabe [11] は,二つの重畳面が同一のドットパ
ターンを持つ刺激 (図 5) を用いて,立体透明視の知覚
特性を検証している.この刺激は,ダブルネイル錯視
(double-nail illusion) [5] の RDS 版,あるいは,運動
透明視の実験で用いられる LPD (locally-paired dot)
トパターン中心と注視点との水平距離は 4 deg とした.
二つのドットパターンのうち,一方は LPDS,もう
一方は RDS である.RDS では,全てのドットが同一
の視差を持つ.視差としては −0.16 ∼ 0.22 deg の 7
段階を用いた (正の値が交差性視差を表す).LPDS で
刺激 [7] の両眼視版と見なすことができる.本稿では,
は,ドットの半数が 0.14 deg,残りの半数が −0.14 deg
LPD 刺激に倣い,このステレオグラムを LPDS (locallypaired dot stereogram) と呼ぶこと ni する.
の視差を持つ.二つの奥行面のドット配置は同一とし
立体透明視の研究で通常用いられる RDS 刺激は,重
るいは視差 ±0.14 deg の二重表面となる.LPDS とし
畳する表面パターンをそれぞれ独立に生成するため,こ
ては,二表面間で対応するドットのコントラスト反転
れらの間には全く相関がない.これに対し,重畳パター
率が 0% (C-LPDS; correlated LPDS),50% (U-LPDS;
ンが同一の場合は,透明面を知覚させる対応と,不透
明 (単一) 面を知覚させる対応の,どちらの対応も可能
uncorrelated LPDS),100% (A-LPDS; anti-correlated
LPDS) の 3 種類を用いた.なお,U-LPDS の奥行知覚
になる.このような曖昧な刺激からどちらの知覚が得
と比較するため,ドットの半数が A-LPDS,残りのドッ
られるのかは,透明面検出メカニズムの特性に依存す
トが視差 0 deg の RDS となる刺激も用いた.
た.このとき可能な対応は,視差 0 deg の単一表面,あ
ると考えられる.
この刺激はダブルネイル錯視の RDS 版に相当するた
手続き
実験には恒常法を用いた.被験者は,注視点
め,二表面で対応するドットのコントラスト符号が等
の左右に同時に呈示される LPDS と RDS を比較し,ど
しいときは,偽対応で生じる小さな視差が知覚される
ちらのドットパターンがより手前の奥行を持っている
図 5: LPDS の例.このステレオグラムは,二表面で対応するドットのコントラスト符号が同一の場合 (C-LPDS) である (本文参照).
(a)
表面に知覚されるときはその面の奥行を,透明視が生
トパターンの呈示時間は 2 s とし,被験者へはフィード
バックは与えなかった.28 条件 (LPDS 4 種類 × RDS
0.1
0.2
Threshold (deg)
じるときは手前の面の奥行を判断することになる.ドッ
(b)
Spread parameter (deg)
かを二者強制選択で回答する.従って,LPDS が単一
0.15
0.1
0.05
C-LPDS
U-LPDS
A-LPDS
Stimulus type
関数としては,ロジスティック関数
F (x; α, β) =
1
1 + exp( α−x
β )
(9)
を用いた.α, β はそれぞれ,心理測定関数の位置と傾
A-LPDS
+RDS
C-LPDS
U-LPDS
A-LPDS
A-LPDS
+RDS
Stimulus type
図 6: 心理実験の結果.(a) 知覚された奥行.(b) 心理測定関数の傾
き (β).
て,U-LPDS における透明面知覚は,A-LPDS に単に
視差 0 deg の面を重畳すれば生じるのではなく,重畳
面間の相関が関与していることが示唆される.
この LPDS の種類による知覚視差の差は有意であり
きのパラメータである.α = 50% の点を,知覚された
奥行の推定値とする.
0.04
0
0
LPDS で知覚される奥行を推定するため,得られた
データに心理測定関数をフィッティングした.心理測定
0.06
0.02
視差 7 レベル) の刺激をランダム順で呈示し,被験者は
各条件について 20 試行の実験を行った.
0.08
(two-way ANOVA; F3,9 = 6.85, p < 0.05),Tukey 法
を用いた多重比較検定では U-LPDS と他の三刺激の間
に有意な差が見られた (p < 0.05).この結果は,逆コ
4.2
結果
図 6 に結果を示す.図 6a より,C-LPDS では視差 0
deg の単一表面が,U-LPDS では視差 0.14 deg の二重
表面がそれぞれ知覚されている.A-LPDS では,全て
のドット対のコントラスト符号を反転しているため,可
能な対応は透明面のみとなる.しかし,A-LPDS で知
覚された奥行は平均してほぼ 0 deg であった.このデー
タはばらつきも大きく,U-LPDS と同等の知覚が得ら
ントラスト符号の信号が異なるチャネルで処理される
という単純なモデルでは説明できない.なぜなら,こ
のモデルでは,全てのコントラスト符号が異なる場合
(A-LPDS) に表面分離がより容易になると予測するた
めである.コントラスト反転率により知覚に違いが生
じるということは,この透明面知覚はより大域的な特
徴,例えば重畳パターン間の相関などの影響を受けて
いる可能性がある.
れているとはいい難い.実際,A-LPDS を観察すると視
野闘争が生じやすく,安定した奥行知覚が生じにくい.
図 6b は,心理測定関数の傾き (β) をプロットしたグラ
5
モデルによる考察
フである.β が小さいほど安定した奥行知覚が生じて
実験では,透明面および不透明面のいずれの知覚も
いると見なすことができる.この結果からも,A-LPDS
生じ得る LPDS に,表面分離手掛りとしてコントラス
では安定した奥行知覚が得られていないことがわかる.
ト符号手掛りを付加したときの知覚を検証した.実験
また,ドットの半分が A-LPDS を,残りの半分が視差
結果より,LPDS における透明面検出は,重畳面間の相
0 deg の RDS を構成する刺激 (図 6 の A-LPDS+RDS)
関という大域的な特徴の影響を受けると考えることが
では,RDS の奥行が知覚されていると考えられる.従っ
できる.つまり,正負を問わず重畳パターンが相関を
持つ場合は,小さな視差を持つ対応が知覚されやすい.
1
0.9
特に,相関が負 (A-LPDS) の場合は,逆コントラスト
Normalized SSE
0.8
符号のドットが両眼対応することになるため,視野闘
争が生じる.また,無相関 (U-LPDS) の場合は,重畳
パターン間の相関がない RDS と同様に,透明視が生じ
る.しかし,この知覚はどのようなメカニズムで生じ
0.7
0.6
0.5
0.4
0.3
0.2
0.1
ているのであろうか.
0
-150
最適空間周波数 ω が高いニューロンは鋭いチューニ
-100
-50
0
50
Template disparity D’ (pixel)
100
150
ングカーブを持つため,高空間周波数チャネルでは,全
ての対応候補にピークを持つポピュレーション応答が得
られる.一方,最適空間周波数 ω が低いニューロンは,
視差に対してブロードなチューニングカーブを持つ.こ
のため,一つのニューロンが複数の対応候補に対して
図 7: LPDS に対する hybrid モデル応答とテンプレートとの二乗誤
差.太線が C-LPDS,細い実線が U-LPDS,細い破線が A-LPDS
の結果である.LPDS の視差は ±20 ピクセル,ドット密度は各表
面 10%である.C-LPDS では平均視差に対応する 0 ピクセル (黒矢
印) が,U-LPDS では二重表面の視差 (白矢印) が検出されている.
強く応答することになる.図では示さないが,C-LPDS
に対する低空間周波数チャネルのポピュレーション応答
は,重畳パターン間の相関の影響のため,視差 0 ピクセ
ルの RDS に対する応答と類似した形状になる.また,
A-LPDS に対する応答は,C-LPDS のちょうど逆の形
状となり,A-RDS に対する応答と類似する.これに対
し,U-LPDS に対する応答は,二重視差を持つ RDS に
対する応答と同じになる.以上より,LPDS の知覚は,
高空間周波数チャネル (fine チャネル) における両眼対
応の曖昧さが,低空間周波数チャネル (coarse チャネル)
の影響を強く受けて解消されるというメカニズムで説
明できる [11].
図 7 に LPDS に対するシミュレーション結果を示す.
C-LPDS では視差 0 に,U-LPDS では二重表面の視差
に対応する極小値が得られている.また,A-LPDS の
極小値は U-LPDS に比べ明確ではない.これは,心理
実験と定性的に合う結果であるといえる.
6
むすび
本研究では,Tsai and Victor [10] のテンプレートマッ
チングモデルを拡張し,立体透明視に関する様々な心
理学的知見を定性的によく説明できることを示した.
今後の課題としては,まず立体透明視の閾値や精度
等の心理量との定量的な比較が挙げられる.また,今
回のシミュレーションでは簡単のため 1 次元の RDS お
よび受容野を用いたが,2 次元受容野を用いてモデルの
精緻化を行う必要もある.
参考文献
[1] Anzai, A., Ohzawa, O., & Freeman, R.D. Neural
mechanisms for encoding binocular disparity: receptive field position vs. phase. Journal of Neurophysiology, 82, 874–890 (1999).
[2] Chen, Y. & Qian, N. A coarse-to-fine disparity energy model with both phase-shift and position-shift
receptive field mechanisms. Neural Computation, 16,
1545–1577 (2004).
[3] DeAngelis, G.C., Ohzawa, I., & Freeman, R.D. Depth
is encoded in the visual cortex by a specialized receptive field structure. Nature, 352, 156–159 (1991).
[4] Gepshtein, S. & Cooperman, A. Stereoscopic transparency: a test for binocular vision’s disambiguating
power. Vision Research, 38, 2913–2932 (1998).
[5] Krol, J.D. & van de Grind, W.A. The double-nail
illusion: experiments on binocular vision with nails,
needles, and pins. Perception, 9, 651–669 (1980).
[6] Pouget, A., Dayan, P., & Zemel, R. Information processing with population codes. Nature Reviews Neuroscience, 1, 125–132 (2000).
[7] Qian, N., Andersen, R.A., & Adelson, E.H. Transparent motion as the detection of unbalanced motion
signals. I. psychophysics. Journal of Neuroscience, 14,
7357–7366 (1994).
[8] Stevenson, S.B., Cormack, L.K., & Schor, C.M.
Hyperacuity, superresolution and gap resolution in
human stereopsis. Vision Research, 29, 1597–1605
(1989).
[9] Stevenson, S.B., Cormack, L.K., & Schor, C.M.
Depth attraction and repulsion in random dot stereograms. Vision Research, 31, 805–813 (1991).
[10] Tsai, J.J. & Victor, J.D. Reading a population code:
a multi-scale neural model for representing binocular
disparity. Vision Research, 43, 445–466 (2003).
[11] Watanabe, O. Effect of the correlation between overlapping dot patterns on stereo transparency. Perception, 34 (suppl.), 186–187 (2005).
[12] Watanabe, O. & Idesawa, M. Computational model
for neural representation of multiple disparities. Neural Networks, 16, 25–37 (2003).
[13] 渡部修,浦嵜友寛,ハイブリッド型視差エネルギーモデ
ルを用いた立体透明視の神経回路モデル.電子情報通信
学会技術研究報告, NC2005-131 (2006).
連絡先:
渡部 修
E-mail: [email protected]
Fly UP