...

第4章 自律移動ロボットの群移動のための座標系 平均化手法

by user

on
Category: Documents
5

views

Report

Comments

Transcript

第4章 自律移動ロボットの群移動のための座標系 平均化手法
第 4 章 自律移動ロボットの群移動のための座標系
平均化手法
4.1
はじめに
一般に,1 人の操縦者が群ロボットシステムの移動を操縦するときの指令の与え方に着目したと
き,個々のエージェントに注目して詳細に操作することは現実的ではなく,群全体または特別な
個体のみに何らかの目標ベクトルを与える必要がある.第 2 章で提案した群操縦系では目標位置
がそれに相当する.特に,群全体に均一な目標ベクトルを与える方法は広く用いられており,こ
のときには全エージェントがそれを共通のベクトルとして認識できることが必要となる.つまり,
全エージェントの座標系を共有化させておくことが必要となる.具体例として 4.7 節に詳細は示す
が,座標系共有化がなされていない場合は Fig. 4.12 に示すように群が大きく広がってしまうが,
座標系共有化がなされている場合は Fig. 4.13 に示すように群がまとまって移動できる.実際,本
論文で述べる検討の結果,操縦者とエージェントの平均座標系とのずれは操作によって容易に相
殺できるが,エージェント間の不一致は操作性にとって大きな障害となることが分かった.
座標系を共有化する方法として,全エージェントに GPS などを利用して絶対位置を与える方法が
ある.この絶対位置を得ることができると想定して群の移動を行う研究 [14,23] もある.しかしなが
ら,絶対位置を得る方法は適用できる範囲が少なくない.また,SLAM [33,34] に代表されるように
地図を作り座標系を共有化させるさせる方法があるが,移動する群への適用を考えたときにはその地
図ができるよりも早く移動することがあるため,この方法だけでは解決は難しい.これらに対して,
これまでに提案した座標系共有化手法 COMPASS [35–37] は移動する群への適用の問題が比較的少
なかった.そこで,本章では移動する群に適用させやすく拡張した COMPASS-CC(COMPASS
for Collective Control) を提案する.
ここで,提案する COMPASS-CC は一般的な移動する群への適用を考えているがその効果を検
証するためにはそれをインプリメントする群ロボットシステムが必要となる.そこで本章では,第
2 章で示した群操縦系を例に用いて検証を行う.これは群全体でまとまって移動するという多くの
群で行われている性質を持つと同時に,目標位置への凝集力を働かせて群を生成しているため座
標系の不一致の影響が現れやすいという性質がある.この 2 つの性質は提案する COMPASS-CC
の検証に有効であると考えたためこれを用いる.
本章ではまず,想定する座標系について述べ,次に座標系不一致が群の挙動に及ぼす影響につ
いて解析する.その後,COMPASS-CC の提案を行う.そして,その COMPASS-CC の効果を理
論的に見積もる方法を示し,その有効性を解析的に示す.ここまでは Fig. 2.2 の群のみに着目す
ることとなる.さらに,等速直線移動する群のシミュレーションによって提案アルゴリズムの効果
と理論的見積もりの妥当性を確認する.このときは第 3 章で示した補償器を用いて行うため,Fig.
2.2 の群と補償器を用いている.その後,各エージェントが独自の目的を持って移動する自律行動
70
を行ったとき,その行動が提案手法へ与える影響について検討する.最後に,群操縦シミュレー
タを使って操縦者による操縦実験を行い,本手法の有効性を明らかにする.これは操縦者を含ん
だ Fig. 2.2 全体を対象とすることとなる.
座標系
4.2
本節では,想定する群操縦系における座標系に関する問題を簡単に示し,座標系の定義を行う.
想定するエージェントは自己の位置と与えられた目標位置との相対位置により運動を決めるた
め,自己の位置を計測する必要がある.提案する群操縦系の適用できるクラスをできるだけ広げ
ておくため,想定するエージェントの自己位置計測には適用範囲の広いデッドレコニングを用い
ることとする.しかしながら,この計測方法にはインクリメンタルな誤差が生じるため,各エー
ジェントの持つ座標系に不一致が生じる.
このように座標系の間に不一致が生じることがあるため,必要な座標系の関係と表記について
整理し,その関係を Fig. 4.1 に示す.群の操縦では,操縦者が認識する静止作業座標系と,各エー
ジェントが保持するエージェント座標系が特に重要である.そこで,各座標系を明示するために
変数名の右上添字を付ける.たとえば,位置ベクトル p をエージェント i の座標系で表すときには
pi ,操縦者が想定する座標系上では pw とする.
reference position by agent i
pri
reference position
priw
agent i
piw
y
p
y
w
r
pii
i
xi
∆θ i θ
i
oiw
y
θ
agent i coordinate system
x
ow
θ
average coordinate system
x
0
operator coordinate system
Fig. 4.1: The operator’s, the agents’, and the average coordinate systems.
一方,座標系を明示しないベクトルは空間的意味を持たないベクトル値である.たとえば,各
エージェントはブロードキャストされた目標位置ベクトル pr をそのまま自分の座標系上でのベク
トル値として見なすため,エージェント i にとっての目標位置は pir = pr となる.これを操縦者が想
71
w
w T
定する座標系から見るとき,エージェントによって異なるベクトルとなるので,pw
ri = (prix , priy )
のように表す必要がある.エージェント i の座標系が操縦者が想定する座標系と一致していなけれ
ば pw
ri ̸= pr であることに注意されたい.
これらの表記方法によると,以下の議論で重要な位置ベクトルの関係は,座標回転変換行列 R(¦)
を用いて,
pw
= R(θi ) pii + ow
i
i ,
(4.1)
i
w
w
pw
ri = R(θi ) pri + oi = R(θi ) pr + oi ,
(4.2)
と表わせる.ただし,ow
i はエージェント i の座標系の原点位置ベクトル,θi はその操縦者が想定
する座標系上に対するエージェント i の座標系の偏角である.
4.3
座標系不一致の影響
想定するエージェントはそれぞれの座標系上で運動する.そこで,エージェントと操縦者の想
定する座標系が一致していないときのエージェントの運動を操縦者の想定する座標系上で見た運
動に直した運動モデルを導く.それを元に,座標系の不一致が各エージェントそれぞれの運動と
群の重心の運動へ与える影響を理論的に解析する.
4.3.1
座標系の不一致を考慮した運動モデル
式 (2.3) で示した各エージェントの制御則は,実際にはエージェント座標系上の関係として実装
される.したがって,
i
i
p̈ii + Dṗii = K(pr − pii ) + fai
+ foi
,
(4.3)
である.そして,他のエージェントからの斥力 fai と障害物からの斥力 foi については次の関係が
成り立つ.
i
w
fai
= R−1 (θi )fai
,
i
w
foi
= R−1 (θi )foi
.
(4.4)
これと 4.2 節にて示したエージェントの位置の関係 (式 (4.1)) と目標位置の関係 (式 (4.2)) を用
いて,さらに θi と ow
i の時間変化がエージェントの運動に比べて十分小さいとすると,エージェン
トの運動と群の重心の運動は,操縦者の想定する座標系上では近似的にそれぞれ式 (4.5),式 (4.6)
で表わせる.ただし,以下本章では簡単のため K はスカラであるとする.
w
w
w
w
p̈w
= K (R(θi ) pr + ow
i + D ṗi
i − pi ) + fai + foi ,
((
p̄¨w + Dp̄˙ w = K
1
n
n
∑
)
R(∆θi ) R(θ̄) pr + ōw − p̄w
θ̄ ,
ōw ,
1
n
1
n
i=1
n
∑
+ f¯ow ,
(4.6)
i=1
∆θi , θi − θ̄,
n
∑
(4.5)
)
(4.7)
θi ,
(4.8)
ow
i .
(4.9)
i=1
72
4.3.2
各エージェントの挙動への影響
式 (4.5) をもとに座標系不一致の影響を含めてブロック線図として表すと Fig. 2.3 は Fig. 4.2 の
ようになる.特に,座標系不一致の影響を網掛けにしてある.
swarm
pr
R(θ1 )
o1w
++
R(θ 2 ) +
R(θ n ) +
o2w
+
p1w+
Agent
+
1/ n
pw
p2w+
Agent
+
onw
+
Agent
pnw
Fig. 4.2: Block diagram of the collective control system considering deviations among agent and
operator coordinates.
Fig. 4.2 の網掛け部分の影響として,各エージェントが認識する目標位置が,操縦者の想定す
る座標系上では θi の回転変換と ow
i のバイアスを受けることが分かる.各エージェントは,操縦
者の想定する座標系から見るとこの目標位置に向かって引力を受けるようにふるまうため,エー
ジェント間で座標系が一致しないとそれぞれの目標位置に方向と並進成分の偏差が生じ,群の大
きさが増してしまうことが予測される.これは,操縦者にとって群の重心を把握しにくくし,操
作の障害となる恐れがある.
4.3.3
群の重心の挙動への影響
群の重心の挙動に着目すると,操縦者から見た群操縦の対象システム Fig. 2.8 は各エージェン
トの自律行動がない場合 (p̄m = 0) を想定しているため Fig. 4.3 のようになる.
Fig. 4.3 から,操縦者の想定する座標系と群の平均座標系との不一致によって,群操縦系には
平均回転偏差 θ̄ による回転変換と,ōw によるオフセットが加わることが分かる.操縦者から見る
と,θ̄ は操作器の向きの偏差に,ōw は原点のオフセットに相当する.これらは,操縦者が目標軌
跡と群の挙動の差異を感じることにより,比較的容易に認識・修正できると考えられる.
73
f ow
ow
pr
R(θ )
1
n
n
Σ R(∆θ )
i
i =1
+ + +
−
swarm
+ + ( s 2 + Ds) −1
K
pw
Fig. 4.3: Collective dynamics of the swarm considering deviations of coordinates.
∑
一方, n1 ni=1 R(∆θi ) はエージェント間の座標系の不一致の影響であり,∆θi の群内での分散,
つまり方位の不一致が小さければ単位行列に近いが,これが大きいとノルムが 1 より小さくなる.
これは,目標位置ベクトルに回転拡縮変換が掛かることに相当するが,単なるゲイン変動や回転
変換ではないので操縦者にとって把握しにくく,やはり操作上問題である.この ∆θi の分散の大
∑
きさと n1 ni=1 R(∆θi ) のノルムの関係は付録 A.4 に示す.
4.3.4
操作性への影響のまとめ
以上のように,座標系の不一致は以下の 2 つに分けて考えることができる.
• 操縦者の想定する座標系とエージェント座標系の平均値の間の不一致
– 操縦者から見ると操作器の向きや原点のオフセットと等価になるため,これを操縦者
が認識して修正することは比較的容易であると予想される.
• エージェント座標系間の不一致
– エージェントの挙動の不整合による群の広がりが生じるため群の重心位置の推定を困
∑
難にし,さらに Fig. 4.3 中の n1 ni=1 R(∆θi ) の影響により座標系の不一致がないとき
のモデルからの不明瞭な変動を招くため,より操作の障害となりやすいと予想される.
以上からエージェント間の座標系を一致させるべきであることがわかった.これらの要因の具体的
な影響については,4.6 節のシミュレーションと 4.7 節の群操縦シミュレータを用いた実験によっ
て確認する.
4.4
群移動のための座標系平均化手法 COMPASS-CC
前節で見たように,エージェント同士の座標系の不一致は操作の障害となる恐れがある.一方
これまでに,デッドレコニングだけで自己位置推定を行う自律移動エージェント群について,1
対 1 の近傍通信を使って座標系を平均化して不一致を削減する手法:COMPASS を提案してい
る [35–37].この COMPASS のアルゴリズムを本研究の群操縦系に適用することを考える.
74
まずメリットを挙げる.群全体が移動するときにはその周りの環境が常に変化するため,ラン
ドマークや外界の特徴点などを利用することは難しいが,COMPASS は群内部で座標系を共有化
できる点が大きなメリットである.また,用いる情報交換が 1 対 1 の近傍通信であるため,通信
の際にホストを介す必要がない.そのため,台数が多くなっても通信量の増大の問題が生じない
ことも大きな利点である.
逆に問題となる点は従来の COMPASS では,すべてのエージェントが作業空間全体にわたって
自律的に移動することにより,任意の 2 台がほぼ均等な確率・頻度で遭遇する状況を想定していた
点にある.しかし,移動する群を考えたの場合は群の重心を移動させることが主目的なので,各
エージェントが群の中で相対的に大きく移動することはエネルギー消費面などから望ましくない.
相対移動せずに遠方のエージェントとの平均化を可能にするには,各エージェントが相対位置計
測と通信が可能な範囲を広げる必要があるが,これには費用的にも技術的にも困難が予想され,
現実的でない.そこで本節では,これを移動する群に適用する COMPASS-CC(COMPASS for
Collective Control) を導入し,その効果の評価方法を提案する.
4.4.1
COMPASS の概要
まず,すでに提案している COMPASS について簡潔に述べる.
従来の COMPASS では,多数の自律移動エージェントが共通の行動エリア内で,基本的にデッ
ドレコニングで自己位置推定をしながら,それぞれ自律的に移動し何らかのタスクを実行してい
る状況を想定している.エージェントが単独で自己位置推定しているだけではデッドレコニング
誤差の影響が顕著となるが,群システムの利点を生かして多数台の計測結果を利用できれば誤差
を削減できるはずである.COMPASS では,これらを簡単なアルゴリズムで最大限達成すること
が目的である.
COMPASS の基本アルゴリズムは次のとおり [35].
1. 2 台のエージェントがタスク実行中に所定の視界以下の距離まで接近すると,それぞれが相
手の相対位置を計測し,自分の座標原点と方位の情報とともに 1 対 1 の近距離通信で伝え
合う.
2. 通信が成功すると,各エージェントはお互いの座標系を重み付け平均化し.その結果を新た
な座標系とするような計算処理をそれぞれに行う.
上記の手続きを,座標系平均化とよぶ.
たとえば,最も単純な均等重みによる座標系平均化の場合について具体的に示す.上述のアル
ゴリズムによって,座標系平均化を行う 2 台のエージェント a,b は,座標系原点については等価
的に,
+ w
oa
= + ow
b =
1 (− w − w )
oa + ob ,
2
(4.10)
となるように処理する.ただし,ow
i は作業座標系上でのエージェント i の座標系原点の位置ベク
−
+
トルで,左肩の , は,それぞれ座標系平均化処理の前,後の値であることを表わしている.座
標系の方位 θi についても (スカラになるが) 同様に行う.このように,座標系平均化直後は両エー
75
ジェントの座標系が一致することに注意されたい.ここで,ow
i の群全体での平均 (以下群内平均,
w
定義は式 (4.9)):ō ,および群全体での分散 (以下群内分散):
δ2 ,
n
1∑
|ow − ōw |2 ,
n i=1 i
(4.11)
は,上の座標系平均化処理により,
+ w
ō
=
− w
+ 2
δ
=
− 2
δ
ō ,
(4.12)
−
1 − w − w2
| oa − ob | ,
2n
(4.13)
となることが示せる.すなわち,座標系平均化によって群内平均は影響をうけないが,群内分散
はエージェント間に座標系の偏差がある限り削減されることが分かる.
このような局所的な座標系平均化が,群の中の随時・随所で定常的にある程度以上の頻度で行
われれば,各個体が持つデッドレコニング誤差の影響を座標系平均化によって軽減し,エージェ
ントの座標系の群内分散を抑制できるはずである.これが COMPASS の基本思想である.シミュ
レーションで確認した群内分散の定常的ふるまいの例を示すと Fig. 4.4 のようになる.すなわち,
座標系の群内分散は,各エージェントの自律移動のためデッドレコニング誤差の蓄積によって時
間とともに増加するが,座標系平均化が発生するたびに削減され,両効果の釣り合いによってあ
る上限値以下に抑えられる.
0.0008
−
δ2
+
δ2
Effects of COMPASS-CC
δ2
0.0006
0.0004
0.0002
0
Increment by dead-reckoning error
52000
53000
54000 T
Fig. 4.4: Typical steady-state behavior of the mean square deviation of agent coordinates.
実際,式 (4.10) による座標系平均化の場合,エージェントの遭遇が完全にランダムな組み合わ
せで発生し,各エージェントの偏差が確率的に独立であるとみなすと,座標系平均化 1 回による
座標原点位置の群内分散の削減効果の期待値は,
(
E{+ δ 2 }
)
1
= 1−
E{− δ 2 },
n
76
(4.14)
と見積もれる.座標系の方位 θi についても同様である.詳細は小林 [37] を参照されたいが,これ
より座標系平均化による削減効果は座標系平均化回数の指数関数となるのに対して,デッドレコ
ニング誤差蓄積の影響は移動量の多項式関数となるため,定常状態では必ず群内分散は有界とな
り,その上限値はこれらの効果の平衡条件として計算できる.
4.4.2
COMPASS-CC
しかしながら,COMPASS には 4.4 節の冒頭で述べた問題があり,そのままでは群の移動には
適用は難しい.そこで,この COMPASS のアルゴリズムを拡張することを考える.COMPASS の
適用で問題となるのは任意の 2 台がほぼ均等な確率と頻度で遭遇し座標系平均化することにあっ
た.そこで,移動する群に COMPASS を実装するには,座標系平均化を行うエージェントの組み
合わせをエージェントの近傍に限定するのが妥当と考える.本研究では,座標系平均化の相手を
限定した COMPASS を COMPASS-CC(COMPASS for Collective Control) と名付けた.
ここでは例として想定する群操縦系に適用したときの有用性を検討する.
COMPASS-CC では,COMPASS で仮定したエージェントの機能に加えて,各エージェントが
通信半径内にある他のエージェントの ID を認識できて,各自そのような近傍エージェントのリス
ト:近傍リストを維持し,座標系平均化の直前に毎回刷新しているとする.このとき,以下の手
順で座標系平均化を行う.ここで,通信半径とは相手を認識し,座標系平均化できる範囲とし Rs
と表す.
1. 任意のエージェント i は,直前の座標系平均化からあらかじめ決められた時間:平均化間隔だ
け経つと,近傍リストの中から,後述するパートナー選択規則に従って相手 j を選び,座標
系平均化を打診する.
2. 打診されたエージェント j は,i が自分の近傍リストの中にあって,かつその相対位置が計
測できれば許諾する.
3. この交渉が成立すると,i,j は従来の COMPASS と同様の座標系平均化処理を行う.
4. 交渉が成立しなければ i は相手を選び直し,j は座標系平均化のための計時を続ける.
5. 座標系平均化を終えた 2 台のエージェントは,その座標系平均化の瞬間を基準として次の座
標系平均化のための計時を開始する.
ここで,パートナー選択規則は群内分散に影響すると予想される.本章では,次の 3 種類の単
純な規則を検討する.
ランダム選択 近傍リストから毎回一様な確率でランダムに選択.
履歴順選択 座標系平均化の履歴も記憶しておき,近傍リストの中で最近自分と座標系平均化を
行った時期が最も古いものを選択 (2 者以上同位の場合は,その中から一様ランダム選択).
センシング選択 最後に自分と座標系平均化を行ったエージェントの方位を記憶しておき,近傍リ
ストを方位順に並べ替えたときその方位の隣にあるものを選択 (初期条件での方位は 0)
77
これらはいずれも実装が容易なことと,また,COMPASS ではできるだけ群の中で均等に座標系
平均化を行うことが有効と考えられるので,相手が偏らないことに配慮して選んだものである.こ
こで近傍リストへ ID を登録することを考えると,各エージェント固有の ID でなく,それぞれの
エージェントが独自に通信範囲内にあるエージェントに ID をつけて近傍リストを作成することが
実装上望ましい.履歴順選択では,これまでに座標系平均化を行ったときに通信範囲内にいたエー
ジェントにつけた ID と今回の ID を対応付ける必要があり,これは前回座標系平均化を行ったと
きのエージェントの位置と今回のエージェントの位置を比較して対応付けるなど複雑な処理を伴
う.これに対して,センシング選択は前回座標系平均化を行った相手を特定して識別する必要が
ないためより実装に適した方法といえる.またさらに,ランダム選択はセンシング選択で必要と
なる方位を記録しておく必要もないためこの 3 つのパートナー選択側の中では最も実装が容易な
方法といえる.しかしながら,履歴順選択やセンシング選択とは異なり選ぶ相手に偏りが生じる
場合がある.
なお,COMPASS の原理によれば,群の中で座標系平均化が行われる頻度も群内分散の定常値
を左右する.当然,座標系平均化の頻度が高いほど群内分散は小さくなる.従来の COMPASS で
は,2 台が偶然に接近したときに座標系平均化を行っていた.したがって,座標系平均化の頻度は
エージェントが行動中に出会う確率でほぼ決まっていた.これに対して COMPASS-CC では近傍
のエージェントとの座標系平均化を行うため,平均化間隔を自由に設定できる利点がある.
またここで,COMPASS-CC を群ロボットシステムに適用するための条件を考えることで適用
できる範囲をまとめておく.COMPASS-CC に必要な機能はデッドレコニングによる自己位置計
測機能,近傍のエージェントの認識,そのエージェントとの 1 対 1 の通信であり,これらは群ロ
ボットシステムでは基本的に備えている機能である.ここでは例として本研究で想定する群操縦
系へ適用するが,上記の機能を持つ群ロボットシステムには COMPASS-CC は適用が可能である.
4.5
群内分散定常値のマクロ近似モデル
COMPASS-CC における特徴量と得られる群内分散削減効果の関係を定式化できると,システ
ム設計において有用である.従来の COMPASS の場合は,エージェントの行動にランダム性を仮
定することによって,確率的なモデルで群内分散の定常値を見積ることができた.COMPASS-CC
では座標系平均化が近傍エージェントとの間だけで行われるので,同様のアプローチはとれない.
そこで本節では,まず 1 回の座標系平均化による分散削減効果を確定的に表現し,これとデッド
レコニング誤差の近似モデルを用いて,群内分散の定常値を集合的・事象的な平均として見積る
マクロ近似モデルを導く.
4.5.1
1 回の座標系平均化による群内分散削減効果
本項では,COMPASS-CC において 1 回の局所的座標系平均化によって得られる群内分散の削
減率の上限を,確定的手法によって導く.まず,基準座標系原点の群全体の平均値からの偏差を,
全エージェントについてまとめて次の変数行列で表す.
(
w ···
∆ , o1w − ōw ow
2 − ō
78
)
w .
ow
n − ō
(4.15)
このとき,1 つのペア (たとえば (a, b) とする) の座標系平均化による変化は,次のように表せる.
+
∆ = − ∆ H(a, b),
H(a, b)ij ,



1/2


i = a, b かつ j = a, b
i = j ̸= a, b,
1



0
.
(4.16)
上記以外
一方,n − 1 列の変数行列
(
˜ , ow − ōw ow − ōw · · ·
∆
2
1
)
w ,
ow
n−1 − ō
(4.17)
と式 (4.9) とを用いると,
˜ Λ1 ,
∆=∆

˜ = ∆ Λ2 ,
∆


Λ1 , 
 In−1
−1
.. 
. 
,
(
Λ2 ,
−1
)
In−1
,
0 ··· 0
(4.18)
と書ける.また,oi の群内分散 (式 (4.11) 参照) は,
)
1 ( ˜T ˜
w 2
tr{∆ ∆} + |ow
n − ō |
n
1
˜∆
˜T + ∆
˜ 1n−1 1T
˜T
= tr{∆
n−1 ∆ }
n
1 ˜
= ||∆
Λ3 ||F ,
n
δ2 =
(4.19)
と表せる.ただし,
(
1n−1 , 1 1 · · ·
1
)T
∈ Rn−1 ,
T
Λ3 ΛT
3 = In−1 + 1n−1 1n−1 ,
(4.20)
で,Λ3 は上式を Cholesky 分解することにより求まる n − 1 次の正則行列である.また,|| ¦ ||F は
行列の Frobenius ノルムを表すものとする.
これらの結果を用いると,ペア (a, b) の 1 回の座標系平均化において,前後の群内分散の関係
は次のようになる.
+ 2
δ
1 +˜
1
|| ∆ Λ3 ||F = ||+ ∆ Λ2 Λ3 ||F
n
n
1 −
= || ∆ H(a, b) Λ2 Λ3 ||F
n
1
˜ Λ1 H(a, b) Λ2 Λ3 ||F
= ||− ∆
n
1
˜ Λ3 ||F µ(a, b) = µ(a, b) − δ 2 ,
≤ ||− ∆
n
µ(a, b) , ||Λ−1
3 Λ1 H(a, b) Λ2 Λ3 ||.
=
79
(4.21)
ここで ||¦|| は行列の 2 ノルムを表し,不等号は Frobenius ノルムの一般的な性質:||A B||F ≤||A||F ||B||
による.
以上より,COMPASS-CC において,ペア (a, b) 間の 1 回の座標系平均化によって群内分散を
µ(a, b) 倍以下に削減できることが分かる.ここでは座標原点について述べたが,方位についても
˜ ,H の構造を修正すれば同様の結果が示せる.
∆,∆
4.5.2
群内分散定常値の見積もり
前項では,座標系平均化手続き 1 回当たりの群内分散削減率の上限を求めた.次に,この結果
を用いて群内分散の定常値を見積もる方法を考える.
COMPASS の定常状態は,座標系平均化と移動による誤差の蓄積の平衡状態である.COMPASSCC では,座標系平均化のタイミングに達したと判断したエージェントが,その時点の近接リスト
から選択規則に基づいて選んだ相手とペアとなり,群の中で入れ替わり立ち替わり座標系平均化
を行う.このような局所的な状況の平衡現象を忠実にモデル化することは困難である.
これに対して 4.6 節では,初期条件を変えた多数回のシミュレーション結果の平均を取って平均
的性能を評価する.しかし,実システムのパラメータ値を選定する際には,このようなシミュレー
ションによらず,近似値であってもより簡単に見積もれることが望ましい.そこでここでは,デッ
ドレコニングによる誤差の蓄積がないとして座標系平均化だけを繰り返した場合と,デッドレコ
ニングだけを続けた場合の,それぞれにおける群内分散変化の近似式を求め,定常状態における
群内分散をこれらの平衡点として見積る式を導く.
まず,群全体における連続する 2 回の座標系平均化の間に,デッドレコニング誤差が群内分散の
˜
エージェント間分布にもたらす変化は小さいと仮定する.すなわち,式 (4.21) において − ∆(k+1)
≈
− ∆(k)
˜
とする.ただし,k は群全体での座標系平均化の序数を表す.このとき,長期にわたる座
標系平均化による群内分散の削減効果は,デッドレコニング誤差蓄積がない状況で座標系平均化
だけを繰り返した場合の平均の削減率で近似できるはずである.これは,群の移動速度に対して
座標系平均化の頻度が十分高ければ妥当な近似と考えられる.第 k + 1 回目から k + m 回目まで
m 回 にわたる座標系平均化の効果は,式 (4.21) と同様にして,
+ 2
δ (k
+ m) ≤ M (k, m) δ 2 (k),
°
°


°
°
k+m
∏
° −1
°
°


M (k, m) , °Λ3 Λ1
H(al , bl ) Λ2 Λ3 °
°,
°
°
l=k+1
(4.22)
となる.座標系平均化 1 回当たりの削減効果は,この長期平均モデルの極限として次式で評価で
きる:
+ 2
δ
k
≤ µ −δ2k ,
µ , lim
m→∞
√
m
M (0, m).
(4.23)
ここで,µ が COMPASS-CC による長期にわたる群内分散の平均的な削減効果を表す特徴量とな
る.以下これを平均削減率と呼ぶ.式 (4.22) から,µ はパートナー選択規則に依存する.
次に,デッドレコニングによる群内分散の増加について述べる.一般に,1 台の自律移動エー
ジェントがデッドレコニングによって自己位置を推定しながら,ランダム・ウォークや直進移動な
80
ど一定のパターンを目標として移動するとき,制御周期ごとの移動量の計測誤差が移動量自体に
比べて十分小さければ,自己位置推定値の累積二乗誤差は次の近似モデルで表せる [37]:
δi2 = (α l)β .
(4.24)
ただし,l は累積の移動量 (道のり) で,α,β > 0 はエージェントの運動学や移動パターン,空間
分布や密度などに依存するパラメータである.なお,この近似は左右の車輪の径の違いなど定常
的な誤差が加わる場合でも成り立つ.
本稿で扱うように同じタイプのエージェントがある程度群の重心から離れずに大きく移動する群
では,α,β の値はエージェント間であまり変わらないはずであるから,式 (4.24) の群内平均をとる
ことで,群内分散も同じ形の関数で近似できると考えられる.したがって,以下で COMPASS-CC
を適用する群において,群全体として連続する 2 回の座標系平均化の間に群が移動する量を ∆l と
すると,その間のデッドレコニング誤差による群内分散の増分は,
1
− 2β
δ (k
1
+ 1) = + δ 2 β (k) + α ∆l,
(4.25)
となるはずである.
なお,群における式 (4.24) の妥当性は,4.6.2 項において群移動シミュレーション結果から α,
β を推定することによって確認する.また,実環境ではたとえば車輪の空転やスリップなどによ
り突発的に大きな誤差が加わる場合がある.これは,当のエージェントにとっては一時的に大き
な誤差となるが,COMPASS-CC によれば群全体への影響は集合的・時間的に平均化されるため,
群内分散の定常値に与える影響は大きくないと考えられる.
以上,式 (4.23) と式 (4.25) とを組み合わせることにより,座標系平均化直前の群内分散の最悪
値は,
− 2
δ (k
{
1
+ 1) = (µ − δ 2 (k)) β + α ∆l
}β
,
(4.26)
と見積もれる.ここで,0 < µ < 1 であれば実数列 {− δ 2 (k)} は初期値によらず有界になる.すな
わち,COMPASS-CC において平均の削減率が 0 < µ < 1 であれば,群内分散は事象平均として
収束する.そしてこのとき,平衡条件:− δ 2 (k + 1) = − δ 2 (k) , − δ 2 (∞) を代入することにより,
定常状態における群内分散の極大値,極小値それぞれの長期にわたる平均値として,次のような
マクロ近似モデルが得られる:
(
− 2
δ (∞)
4.6
=
α ∆l
1−µ
1
β
)β
,
+ 2
δ (∞)
= µ − δ 2 (∞).
(4.27)
群移動シミュレーションによる群内分散定常値の検討
前節では,パートナー選択規則の長期平均的効果とデッドレコニング誤差の群平均的近似モデ
ルをもとに,COMPASS-CC による群内分散の定常値を見積る式 (4.27) を導いた.しかしこれは,
COMPASS-CC のアルゴリズムが個々のエージェントの運動に与える効果を考慮していない.個
体の運動則も含まず,あくまでも事象的・集合的平均としてのマクロ近似モデルに過ぎない.そこ
で本節では,COMPASS-CC のアルゴリズムを実行させる群移動シミュレーションによって,前
節のマクロ近似モデルの妥当性を確認する.同時に,COMPASS-CC の基本的なパラメータに対
する群内分散定常値の特性を,シミュレーションデータに基づいて具体的に調べる.
81
4.6.1
群移動シミュレーションの概要
操縦者による操作を含めないで定常状態で群の移動速度が一定になるように目標位置 pr を時間
とともに変化させて行った.シミュレーションの各エピソードは以下の手順で実行した.
群の初期化
• 群の全エージェントに,通しの ID 番号,ランダムな初期位置,等しい基準座標系と目標位
置 (0, 0) を与える.
• デッドレコニング誤差を 0 として,仮想力が釣り合って各エージェントの挙動が落ち着くま
で放置する.
この結果,エージェントはほぼ最密状態になり,エージェントの視界半径 R に対してエージェン
√
ト間距離は R/2,群の半径は Rc , n R/2 と見積もることができる.なお,前章までは視界半
径を小文字の r と表記していたが,本章以降ではこの視界半径を長さの単位として議論するため,
あえて大文字で表記している.なお,エージェントは質点として扱う.
群移動
• 上で得られた定常状態を初期条件として,目標位置を全エージェントにシミュレーション時
刻 t の関数:pr (t) = (VR (t + 9.5 + 10.5 exp(−2t)), 0)T として与える.これにより,目標位
置を単にランプ関数とするよりも早く群の重心を等速移動の状態にすることができる.
• 制御周期 T ごとに,各エージェントの左右の車輪それぞれに一様ランダムな計測誤差 (オド
メトリング誤差) を加えながら,エージェント基準座標系の原点位置および方位について群
内分散を記録する.
• 群として周期 TM ごとに,全エージェントに逐次座標系平均化を行わせる.すなわち,全
エージェントが ID 順に,4.4.2 節で述べたアルゴリズムに従ってパートナーを選んで,基準
座標系を平均化する.シミュレーション・ログとしてペアの ID:(ak , bk ) も記録しておく.
ここで,TM ごとにまとめて全エージェントに座標系平均化を行わせる点が,4.4.2 項で提案した
アルゴリズムとは異なる.これはプログラミングと解析を簡便にするためで,全エージェントに
ID を振るのも便宜上である.実機では,4.4.2 項のアルゴリズムのように,エージェントごとに勝
手に近接リストを作り,独立にタイミングを取る方が実装しやすい.しかし,前に述べたように,
このとき座標系平均化を行うエージェントの組み合わせはわずかな条件の違いで変わるため,こ
れを精密に扱うことは困難である.一方,すべての座標系平均化が成功するとすれば,平均化間
隔ごとの群全体での座標系平均化回数は 4.4.2 項のアルゴリズムでも上のシミュレーション設定で
も同じく TM /n となるから,平均的な性質は大きく変わらないと考えられる.これらの理由から,
ここでは上の設定を採用している.
なお,以下を本節のシミュレーションと次節のシミュレータ実験で共通のパラメータ設定と
した.エージェントのトレッド:0.2R,車軸から参照点までのオフセット:0.2R,目標終速度:
VR = 0.005 R/T ,オドメトリング誤差:±5%.エージェントの運動則に関する係数:D = 1.0,
82
K = 0.1,aa = ao = 0.1 ちなみにこれらは,実験機として実現する場合にも無理のない仕様とい
える.前章では SMC 実験機にパラメータを合わせたが,本章では距離の単位を視界半径 R,時間
の単位をシミュレーションのサンプリング時間 T とした.
4.6.2
群内分散の時間変化
はじめに,デッドレコニング誤差の影響と,COMPASS-CC による群内分散の収束を確認する
ために,群移動シミュレーションで求めたエージェント座標系原点位置の群内分散の時間変化を
Fig. 4.5 に示す.これは,エージェント総数を n = 40 とし,
(1) 座標系平均化なし (図中右上),
(2) 通信半径 RS = 1.2R でランダム選択による COMPASS-CC,
(3) RS = 1.2R で履歴順選択による COMPASS-CC,
(4) RS = 1.2R でセンシング選択による COMPASS-CC,
(5) 視界を制限しないランダム選択による COMPASS-CC(図では便宜上 RS = ∞ と表記)
の場合について,それぞれ 100 エピソード分の平均軌跡をプロットしたものである.縦軸は,群
内分散 δ 2 (k) の平方根を,最密配置と仮定したときの群の半径 Rc で正規化した値としてある.
without coordinate merging
10
Random type
(Rs = 1.2R )
2
δ
Rc
0.2
5
0
0
40000
80000T
40000
60000
80000 T
0.1
0
0
20000
Sequential type
(Rs = 1.2R )
Sensing type
(Rs = 1.2R )
Random type
( Rs= ∞)
Fig. 4.5: Time variation of the mean square deviation of origins.
83
通信半径 RS = 1.2R は,エージェントが最密状態になったときにちょうど 6 台が近接リスト
に入る設定で,過去の実験から,実機実験が十分に可能なレベルである.また,(5) は,どのエー
ジェントもほかのすべてのエージェントを近接リストに含めることができる設定で,実現は困難だ
が性能の上限を見るために採用した.なお,(2)–(5) において座標系平均化間隔は TM = 500 T と
した.これも,(2)–(4) については移動ロボット実験機の能力として無理のない仕様と考えられる.
グラフを見ると,まず座標系平均化を行わない場合には,時間とともに群内分散が発散してい
る.このことから座標系平均化の必要性は明らかである.さらに,このデータから最小二乗法で
式 (4.24) のパラメータを推定すると,α = 1.34 × 10−2 ,β = 2.05 (各変数を SI 単位系で表した場
合) となり,相関係数は 0.998 であった.ただし,∆l は群の中での連続した 2 回の座標系平均化
の間に群が移動した道のりであることから,∆l ≈ VR TM /n と近似した.相関係数の高さは,座
標系平均化を行わない場合の群内分散の増大が確かに式 (4.24) に従うことを示している.以下本
節では群の移動パターンが共通なため,α,β の値として上の推定値を用いる.
一方,座標系平均化を行った場合は,いずれも群内分散が一定レベル以下に抑えられている.定
常値の上限は,視界を制限しないランダム選択の場合が最も小さく,続いて有限視界のセンシン
グ選択,履歴順選択,ランダム選択の順になっている.これらの違いは,1 台のエージェントがど
れだけ多くの相手と均質に座標系平均化を行えるかを反映していると考えられる.ここで,通信
範囲が同じ場合で,性能に差が出る原因について考察する.まず,ランダム選択の性能が低い点
については,同じエージェントが連続で選ばれてるなど,相手の選び方に偏りがあることがひと
つの要因として考えられる.これは座標系平均化の性質として,同じ相手と連続して座標系平均
化しても効果がないなど,偏りなく平均的に行ったほうが効果が高いことに起因する.これに関
する簡単な検証は付録 A.5 につける.次に,センシング選択の効果が高い点については,全エー
ジェントが一定方向へ情報を流すように座標系平均化が行われ,群の中に一種の情報の流れ場の
ようなものができているためと予測されるが,そのはっきりとした要因は解明されておらず,今
後の検討課題となる.
またこの図より,視界を制限しない場合が性能の上限で, Rc に対する群内分散の平方根の比
が,シミュレーション時に個体に加えたデッドレコニング誤差 ±5% と同等レベルに抑えられて
いる.そして,通信半径を RS = 1.2 R とかなり制限した場合でも,上の 2 倍程度:Rc の 10% 以
下に保たれている.実際の移動系における効果は後のシミュレータ実験で確認するが,この結果
から,上記のような無理のないパラメータ設定で,群移動操縦には十分な程度に基準座標系が収
束することが期待できる.なお,オドメトリングにおける突発的誤差や定常的誤差を一部のエー
ジェントに加えたシミュレーションも行ったが,Fig. 4.5 に対して顕著な違いは見受けられなかっ
た.そのシミュレーション結果は付録 A.6 に示す.
4.6.3
座標系平均化間隔の影響
平均化間隔 TM を変えるとその間に増大するデッドレコニング誤差の大きさが変わる.これは,
群内分散のマクロ近似モデル:式 (4.27) では ∆l を変えることに相当する.これを利用して,群
移動シミュレーションの結果との比較によって式 (4.27) の妥当性を確認できる.また,群移動シ
ミュレーションで TM に対する COMPASS-CC の性能の変化を知ることは,座標系平均化の頻度
によって群内分散をどの程度抑えられるかという特性の目安としてそれ自体有用と思われる.
84
0.3
2
δ∞
Rc
0.2
0.1
0
0
200
400
600
800
1000 T
TM
Random type (Rs=1.2R )
Sequential type (Rs=1.2R )
Sensing type (Rs=1.2R )
Random type ( Rs= ∞)
Fig. 4.6: Steady-state mean square deviation of origins w. r. t. interval of coordinate merging
(RS = 1.2 R).
そこで,TM を変えて前項同様に群移動シミュレーションを行った.結果を TM に対してプロッ
トしたものが Fig. 4.6 の実線である.これは,シミュレーションにおいて挙動が定常的になったと
みなせる移動指令入力後 100 TM から 160 TM までの群内分散の平均値を,さらに 100 エピソー
ドにわたって平均し,その平方根を Rc で正規化したものである.当然のことながら,TM が小さ
いほど座標系平均化の頻度が高いので群内分散は小さくなっている.また,COMPASS-CC のタ
イプによる群内分散の値の優劣は,Fig. 4.5 の場合と同じである.
これに対して破線は,マクロ近似モデル:式 (4.27) による極大・極小値の平均値で,以下の手
順で求めた.まず,視界半径 R を辺とする三角格子点上に,群全体の形ができるだけ円に近くな
るよう密に全エージェントを配置した状況を考える.これは第 3 章で示したように,全エージェ
ントの基準座標系が一致している場合,pr を一定として放置すると定常配置がこの形態に近づく
ためである.次に,全エージェントの ID をランダムな順に与え,各エージェントの近接リストを
決定する.そして,全エージェントが ID 順にパートナー選択規則によって座標系平均化相手の選
√
択する手続きを 100 回行い,それに相当する平均削減率の近似値 µ̄ ≈ 100n Mo (100n) を求め,µ̄
の推定値とする.これと前節で求めた α,β の推定値を使って,式 (4.27) から − δ 2 (∞),+ δ 2 (∞)
の平均値を求める.なお,ここで両者の平均を取る理由は,これらは長期にわたる群全体での平
均値で,実際の群内分散定常値がこの範囲に収まるのを保証するものではないことと,平均的な
85
特性の確認が目的でシミュレーション結果も多数回の平均値だからである.
破線を実線と比較すると,TM に対する増大の傾向が,パートナー選択規則による違いも含め
てよく類似している.これは,マクロ近似モデル:式 (4.27) が,COMPASS-CC の性能の簡単な
見積もりとして妥当であることを示している.すなわち,上の手続きに従えば,群の移動シミュ
レーションを行わずにより少ない計算量で,式 (4.27) から群内分散の定常値を見積ることができ
る.群移動シミュレーションを行って Fig. 4.6 の実線 1 本を求めるのに要した時間は 4.7 節に示し
す群操縦シミュレータで用いたパーソナル・コンピュータで約 10,000[s],平均削減率 µ̄ を推定し
て式 (4.27) によって破線 1 本を求めるのには約 30[s] であった.
4.6.4
エージェント総数と通信半径に対する特性
次に,他の基本的なパラメータとして,エージェント総数 n と通信半径 RS の影響について検
討する.これらと群内分散定常値の関係は,COMPASS-CC の基本的な特性として重要である.ま
た,マクロ近似モデル:式 (4.27) では,これらを変えると平均削減率 µ̄ が変化するから,群移動
シミュレーションの結果と比較することによって,前項とは別の側面で式 (4.27) の妥当性を検討
できる.
パートナー選択規則がランダム,履歴順とセンシングのそれぞれについて通信半径を RS = 1.2R,
2.2R とした場合,ランダム選択について RS を十分大きくした場合の計 7 種類の設定を選び,n
による違いを調べた結果を Fig. 4.7 に示す.TM は 4.6.2 節と同じく 500 T とした.ちなみに,
RS = 2.2 R の場合,群が最密の状態において最大 18 台まで視界内に入る.
まず,Fig. 4.7(a) は群移動シミュレーションの結果である.縦軸は,Fig. 4.6 と同様に,群内
分散定常値の平方根を初期条件の違う 100 エピソードについて求め,その平均値と標準偏差を Rc
で正規化して示したものである.これを見ると,RS の制限がなければエージェント数 n が大き
いほど群内分散が小さくなるが,RS を制限した場合,n をある程度以上大きくすると群内分散が
あまり下がらない.その分岐点は,視界に入る最大エージェント数に n がほぼ等しくなる点に相
当すると考えられる.すなわち,ある程度以上 n が大きければ COMPASS-CC の性能は RS に
依存する.RS は,他のエージェントに対する相対位置計測と近傍通信の頻度と距離という点で,
エージェントが要求される能力に直結している.システム設計上は,これらと達成したい座標系
一致度とのトレードオフであることが分かる.なお,ランダム選択,履歴順選択とセンシング選
択の優劣は前節の結果と変わらず,同じ RS ,n で比較すれば後者の方が性能が高いが,RS を大
きくするか n を小さくするとその差はあまりなくなる.
これに対して,マクロ近似モデルによる見積もり値を Fig. 4.7(b) に示す.こちらは,前節と同
様の手順で見積った平均削減率から,式 (4.27) による極大・極小値の平均値を求めてその平方根
を Rc で正規化したものである.Fig. 4.7(a) と比較すると,7 種類とも,特に n を大きくしたと
きに群移動シミュレーションと近い値を示している.群移動シミュレーションでは計算量が n に
対して組み合わせ的に増すと考えられるので,n が大きいときに式 (4.27) による見積もりが有効
であることは実用上好ましい.
86
4.6.5
自律行動の影響
自律的な行動を各エージェントが行うと,群全体が広がり各エージェントの通信範囲内に他の
エージェントが存在しない場合が生じることは 3.3.6 項の結果から分かる.このとき,座標系平均
化が行えなくなるため COMPASS-CC に影響すると考えられる.
そこでまず,各エージェントの行動を決めるパラメータ Vm と全エージェントの自律行動の範囲
を決めるパラメータ Rm を変化させたときにエージェントの通信範囲内に他のエージェントが存
在する確率を検討し,それを踏まえて COMPASS-CC への影響を考察する.次に,それぞれにつ
いてシミュレーションによる確認を行う.
他のエージェントが通信範囲内に存在する確率
まず,Rm が自律行動がないときの群の大きさ Rc よりも小さいときには,Fig. 3.25-a や Fig.
3.26-a に示したようにエージェントが密に集まるため,常に通信範囲内に他のエージェントが存在
するが,Rm が大きくなるにつれて群全体が大きく広がるようになる (Fig. 3.25-b -c,Fig. 3.26-b
-c) ためその確率は下がると考えられる.
次に,Rm を大きくしたときの Vm の影響を考える.Vm が小さければ Fig. 3.25-b や Fig. 3.26-b
に示したようにエージェントの挙動は局所的となる.そのため,他のエージェントが近くにいな
い状態になるとしばらくその状態が続くことが予測され,他のエージェントが通信範囲内に存在
する確率は下がると推測される.逆に,Vm が大きい場合は,Fig. 3.25-c や Fig. 3.26-c に示した
ように,設定された範囲内を動き回るため,その確率は Vm が小さいときほど下がらないと予測
される.
COMPASS-CC への影響の検討
以上より,Rm が Rc よりも小さい場合は Vm にかかわらず,常に通信範囲内に他のエージェン
トが存在し,かつ,群の中で配置を変えるような移動が生じない.つまり,自律行動が起きない
ため影響はないと考えられる.
一方,Rm を大きくしたときには Vm の大きさにより影響に違いが生じると考えられる.まず,
Vm が小さい場合は,通信範囲内に他のエージェントが存在する確率が下がると予測されるため,
COMPASS-CC の効果が小さくなり,Vm が小さいまま Rm を大きくすると群内分散が増大し群は
発散すると予想される.次に,Vm が大きい場合は,群の中で動き回るため,座標系平均化から次
の座標系平均化までの間にデッドレコニング誤差がさらに増大する.しかし,通信範囲内に他の
エージェントが存在する確率は Vm が小さいときほど下がらず,一定の間隔で座標系平均化できる
と考えられる.そのため,COMPASS-CC の効果は下がらず,さらに,座標系平均化する相手が
固定でないため,Rs = ∞ としたときの同じ効果が得られると考えられる.このことから,収束
値が大きくならない可能性はある.
87
シミュレーションによる検証
他のエージェントが通信範囲内に存在する確率 まず,自律行動と通信範囲内にエージェントが
存在する確率の関係を調べる.そこで,群を移動させずにかつ誤差がない状況で Vm と Rm を共に
変化させて 100000T まで目標位置 pr を原点に設定し,群の状態が安定する 20000T 以降,座標系
平均化間隔ごとに通信範囲内にエージェントが存在するか調べ,他のエージェントが存在する確
率を求めた.通信範囲内にエージェントが存在する確率は,初期値を変えて 10 エピソード行い,
それぞれのエピソードで最も低かった確率の平均から求めた.その結果を Fig. 4.8 に示す.上記
の予測どおり,Rm が小さい場合は Vm に関わらず存在する確率は 1 に近い.一方,Rm を大きく
するにつれて Vm の影響が現れ,Rm が大きい場合は Vm が大きいほうが他のエージェントが通信
範囲内に存在する確率は高いことが確認できた.
COMPASS-CC への影響 次に,4.6.3 項や 4.6.4 項と同様の設定で自律行動させながら,群を
移動させたときの群の大きさに対する収束値を求めるためにシミュレーションを行った.エージェ
ント数は 40 台とし,センシング選択を用いた.Rm と Vm を変化させた結果を Fig. 4.9 に示す.ま
ず,Rm が群の大きさよりも小さい範囲では収束値に変化がなく,Rm を大きくするにしたがって,
Vm が小さいものから順に発散することが確認できた.またさらに,この設定では Rm ,Vm をと
もに大きくすると COMPASS-CC の効果とデッドレコニングの影響がつりあって一定値となった.
以上から,自律行動がある場合でも,一定の間隔で座標系平均化を行うことができれば COMPASSCC の効果が保持されることが分かった.
88
0.15
δ 2∞
Rc
0.1
0.05
0
0
20
40
60
80
the number of agents
100
(a) Results of multi-agent simulations.
0.15
δ 2∞
Rc
0.1
0.05
0
0
20
40
60
80
the number of agents
100
(b) Estimation by macro approximation.
Random type (Rs = 1.2R)
Sequential type (Rs = 1.2R)
Sensing type (Rs = 1.2R)
Random type (Rs = ∞ )
Random type (Rs = 2.2R)
Sequential type (Rs = 2.2R)
Sensing type (Rs = 2.2R)
Fig. 4.7: Mean square deviation of origins w. r. t. the number of agents (RS = 1.2 R, 2.2 R, ∞).
89
Probabilty that agents exist
within R s
V m = 0.1
V m = 0.05
V m = 0.02
V m = 0.01
Vm = 0.005
1
0.8
0.6
0.4
0.2
0
0
1
2
R m /R c
3
4
Fig. 4.8: Probability that agents exist within Rs w. r. t Rm and Vm .
0.5
V m = 0.005
V m = 0.01
V m = 0.02
V m = 0.05
V m = 0.1
0.4
2
δ∞
Rm
0.3
0.2
0.1
0
0
1
2
R m /R c
3
4
Fig. 4.9: Mean square deviation of origins w. r. t. Rm and Vm .
90
4.7
群操縦シミュレータを用いた実験による操縦への影響の検討
前節では,エージェントの群に COMPASS-CC を実行させ,定速移動に収束させる群移動シミュ
レーションを行い,座標系の群内分散の定常値の性質を調べて COMPASS-CC の効果を示した.
しかしこれは,操縦者を含めた群全体の制御は行っておらず,いわばその制御対象の特性だけに注
目したものである.操縦者から見た操作性や,操作によるフィードバックがあるときの性質は現
れていない.そこで,想定する群操縦系を模擬して人間が画面上に表示されるエージェント群を
観測して指令を与えて操縦することができる群操縦シミュレータを実現した.これを用いて,操
縦への影響も含めて検討するために操縦実験を行った.本節ではその結果に基づいて,実際の群
の移動操縦における COMPASS-CC の有効性について検討する.
4.7.1
実験システムの概要
2.3.2 項の制御則を離散化したものと,4.4.2 項の COMPASS-CC のアルゴリズムを,全エージェ
ントについて忠実にパーソナル・コンピュータ (CPU:Pentium III 1GHz,OS:Windows XP Pro
Sp2) 上に実装した.
操縦者が群を直接俯瞰している状況を模擬するため,Fig. 4.10 に示すように,液晶プロジェク
タによってスクリーン上に障害物と全エージェント参照点をリアルタイムで表示する.群の目標
軌道を提示する場合はそれも重ねて表示する.ただし,群の重心位置は実験中は表示しない.ス
クリーンは 1,200[mm] × 900[mm] のものを操縦者から 3,500[mm] の位置におき,スクリーン表示
スケールを画面上で R = 5[mm] とした.スクリーン上で水平右向きに作業座標系の x 軸,鉛直上
向きに y 軸をとっている.
被験者は,スクリーン上の表示だけを見て群の重心を直感的に把握しながら,ゲーム用ジョイ
スティック (Microsoft 製 SideWinder Force Feedback 2) を介して x–y の 2 次元に対応する操作
信号を加える.この操作信号は.ジョイスティックの傾きを目標速度 vr として,PC 上に実装し
た 5.4.1 節にて述べる補償器を通して目標位置に変換される.ジョイスティックの操作負荷特性
は最も軽くし (弾性のない設定),操作入力のスケールは,最大操作角度 15 度をスクリーン上で
|vr | = 2.5[mm/s] に対応させた.また,5.4.1 節にて述べる補償器を用いると,全エージェント座
標系が一致してるときにその座標系上で群の重心が,
p̄¨ + D̃p̄˙ = D̃vr ,
(4.28)
すなわち,慣性+粘性負荷としてふるまうように設定できるため,本節ではそれを用いた.これ
は予備実験で自然な操作感が確認されている特性である (ただし, D̃ = 2[1/s]).
なおその他の各種パラメータの設定は 4.6.2 項,4.6.3 項と等しくした.
4.7.2
1 自由度操舵
はじめに,COMPASS-CC の有無による操作性を確認するために,群の操舵だけを行う 1 自由
度の操縦を課題として簡単な実験を行った.シミュレータ内で全エージェントに作業座標系で x
方向に等速直線移動する均質な目標値ベクトルを与え,操縦者の操作入力は y 方向だけに加える.
91
Fig. 4.10: Experiment system for collective control by a human operator using joystick and
projector.
被験者の課題は,スクリーン上の全エージェントの参照点から群の重心を直感的に把握し,同じ
くスクリーン上に示される目標軌道 y = 0 に対して,偏差を最小にすることである.
結果を Fig. 4.11 に示す.破線が座標系の共有化を行わなかった場合,実線が履歴順選択の
COMPASS による場合で,1 名の被験者 (大学院男子学生) による 5 回の試行の結果をそのままプ
ロットしたものである.各エージェントには一様な目標速度:スクリーン上で vr = (2.5, 0)T [mm/s] を
与えた.COMPASS-CC のアルゴリズムは前節のシミュレーションと同じで,通信半径 RS = 1.2 R,
平均化間隔 TM = 50 [s] とした.
この結果から,デッドレコニング誤差によって実際に群の操縦が困難になること,COMPASS-CC
によって操作性が大幅に改善されることが明らかである.前者は,群の重心が把握しにくくなる
という 4.3 節の考察の妥当性を示している.後者は,これを緩和し,群としての操作性を改善する
という COMPASS-CC の有効性を示している.
4.7.3
スラローム操縦
群に曲線軌道や速度の変化を加えると,等速直線運動では現れないふるまいが起こる可能性が
ある.また,障害物に対するときには群が変形し,操作性に大きな影響があると考えられる.そ
こで次に,以下のように様々な障害物を配置した環境でのスラローム操縦実験を行った (長さの単
位は [mm]).
92
Absolute deviation [mm]
200
100
0
0
100
200
time [s]
300
400
Without coordinate merging
Sequential type (Rs=1.2R)
Fig. 4.11: Absolute deviation of the swarm center in 1-dimensional operations.
円形障害物 中心 (100, −100)・半径 10,中心 (600, −100)・半径 55,中心 (700, 0)・半径 55 の 3
体.
分散障害物 380 ≤ x ≤ 420 の範囲に,半径 1 の円形障害物を一辺 10 の三角格子上に 1 つずつ配置.
ゲート状障害物 x = 300 の位置に,−75 ≤ y ≤ −25 と −175 ≤ y ≤ −125 の 2 つの壁面をおく.
スクリーン上には,これらの障害物の輪郭と各エージェントの参照点に加えて,目標軌道として
y = 100(cos 0.01πx − 1) を常時表示した.他のパラメータの設定は前節と同じである.ここで,目
標軌道をすべて被験者に提示するのは,目標の未来値を既知とすることによってフィードバック
補償操作の性能を解析するためで,手動制御系の実験手法に習ったものである.
まず,座標系共有化を行わない場合の結果の例を Fig. 4.12 に示す.実線は,すべてのエージェ
ントの軌跡である.前章の結果以上に,デッドレコニング誤差によって操縦が困難になっている
ようすが見られる.特に,軌道が変化する点や障害物に遭遇したときに群が分散し,移動を続け
るとその影響がさらに拡大してしまうという傾向が明らになっている.これは,エージェント間
で座標系の差が増えることにより群が発散して制御しにくくなるという,4.3 節の考察が正しいこ
とを示している.
これに対して,COMPASS-CC(履歴順選択,RS = 1.2 R,TM = 500 T ) を実行した場合の操縦
結果の一例が,Fig. 4.13 である.軌道の変化や障害物にかかわらず群のサイズが保たれ,目標ど
おりに操縦できている.COMPASS-CC の有効性が顕著に現れているといえる.
93
0
-100 y
0
x
100
200
300
400
500
600
[mm]
700
800
Fig. 4.12: Trajectories of 40 agents without coordinate merging.
0
-100 y
0
x
100
200
300
400
500
600
[mm]
700
800
Fig. 4.13: Trajectories of 40 agents employing sequential-type (Rs = 1.2R).
4.7.4
見学者による操縦と随意操縦
前項の実験では目標軌道を正弦波状とし,スクリーン上に表示した.しかし,実際の群の操縦
では,操縦者が随意に操作するときの操作性が重要である.最後にこの点について述べる.
まず,学士論文研究配属のための研究室紹介や,オープンキャンパスにおける研究公開として実
施した,本学学部学生や一般の多くの見学者による体験操縦について説明する.実験設定は,以
下を除いて前項と同様とした:装置と体験時間の都合上,ジョイスティックを SANWA SUPPLY
製 USB ゲームパッド JY-P41UMB(アナログスティック使用,操作感はばね特性) に変え,制御周
期を T = 0.01[s] ,操作入力のスケールは最大操作角度 15 度をスクリーン上で vr = 25[mm/s] と
した.さらに,90[s] の時間制限をつけ,全エージェントが (800,0)T を中心に半径 25[mm] の円の
中に入るとゴールとみなし,実験が自動的に終了するように設定した.なお,定常状態での群の
大きさは約 16[mm] である.
のべ 50 人以上の見学者がそれぞれ 1 分程度のスラローム操縦を行ったが,COMPASS-CC を実
行した場合は群が分解したり操作不能になる例はなく,まったく初体験でも大きな困難なく目標
軌道に沿って群を操ることができていた.
中には,目標軌跡を無視して移動を試みる見学者も数人いた.制限時間内にゴールした中で目
標軌跡への追従を行っていないと判断した 6 人の重心の軌跡を Fig. 4.14 に示す.この場合も設定
したゴールへ到達できていることから大きな困難なく,また,COMPASS-CC の効果により群が
広がることなく操作できたことが分かる.
94
30
20
10
0
-10
-20
-30
0
50
100
150
obstacles
reference path
6 trajectories of the center of the swarm
Fig. 4.14: The trajectories of 6 operators.
さらに,あえて障害物に繰り返し近づけて,群が保たれるか試すように操作する例も見られた.
このときは制限時間を越えていたためそのときのデータはないが,Fig. 4.15 は,そのときと同様
の操作を,前節までと同じ被験者が操縦者となって再現してみた結果である.Fig. 4.13 と同じ設定
の COMPASS-CC を搭載している.ただし,図中グレーの線が各エージェントの軌跡である.濃
い実線は実験後に算出した実際の群の重心の軌跡で,群のふるまいを見やすくするために示した.
この図からも分かるように,様々なタイプの障害物に繰り返し当たるように随意に操作した場
合でも,Fig. 4.12 のように群が広がることも脱落する個体もなく問題が生じた例はない.
以上の結果は,実際の群移動の操作で COMPASS-CC が有効であること,本論文で用いている
操縦系は群を単純に操作する方式としては妥当であることを示している.
0
-100
y
0
x
100
200
300
400
500
600
[mm]
700 800
Fig. 4.15: Example of free operation with COMPASS-CC (sequential type, RS = 1.2 R).
95
4.8
本章のまとめ
デッドレコニングによって自己位置推定する自律移動エージェントを群としてまとめて操縦する際
の座標系不一致の影響と,自律分散型の座標系平均化によってそれを解消する手法 COMPASS-CC
について述べた.
まず,想定する群操縦系を対象として,エージェント同士や操縦者との座標系不一致が,群の
操縦に及ぼす影響について考察した結果,特にエージェント間の不一致が群の分散の増大を招き,
操縦者に群の重心の認識を難しくさせることが推測された.
次に,作業空間を固定した自律移動エージェント群に対する座標系共有化法としてすでに提案
している COMPASS を,群が移動する場合に拡張する COMPASS-CC を導入した.そして,1 回
の座標系平均化による群内分散削減効果の見積もりと,デッドレコニング誤差を考慮した定常状
態における群内分散の見積もりを理論的に導いた.さらに,群が移動中の状況のシミュレーション
によって,デッドレコニング誤差の影響と COMPASS-CC の効果が理論どおりであることを確認
した.また,各エージェントが自律行動を行う場合について検討し,自律行動と COMPASS-CC
の収束値の傾向を示した.
最後に,シミュレータを用いた操縦者による操縦実験結果を示し,座標系共有化の必要性と
COMPASS-CC の有用性を明らかにした.なお,以上で導いた理論式,シミュレーションおよび
実験データは,実システムに実装する場合のパラメータ設定の目安としても有効と考えられる.
96
Fly UP