...

修士論文 データ損失を考慮したネットワーク型制御系の 解析・設計

by user

on
Category: Documents
9

views

Report

Comments

Transcript

修士論文 データ損失を考慮したネットワーク型制御系の 解析・設計
NAIST-IS-MT0651025
修士論文
データ損失を考慮したネットワーク型制御系の
解析・設計に関する研究
大堀 彰大
2008 年 3 月 14 日
奈良先端科学技術大学院大学
情報科学研究科 情報システム学専攻
本論文は奈良先端科学技術大学院大学情報科学研究科に
修士 (工学) 授与の要件として提出した修士論文である。
大堀 彰大
審査委員:
杉本 謙二 教授
(主指導教員)
西谷 紘一 教授
(副指導教員)
平田 健太郎 准教授
(副指導教員)
データ損失を考慮したネットワーク型制御系の
解析・設計に関する研究∗
大堀 彰大
内容梗概
近年のネットワーク通信技術の普及にともない, ネットワーク通信を活用した
制御系 (ネットワーク型制御系) が数多く見られるようになった.このような制御
系において, 通信路を流れるデータの遅延, 損失, パケットの到着順入れ替え (ね
じれ) 現象, ネットワークの帯域による制限などが問題となる. これらの現象は,
システムの不安定化や制御性能の劣化を引き起こす原因であることが知られてい
る. 本論文では, 制御対象と補償器との間にネットワーク通信路が存在し,その
通信路上を流れるデータに対して損失 (または棄却) のみが生じるネットワーク
型制御系をあつかう.
提案する手法は,データの損失に対して, 損失したデータの代わりに過去に届
いた中で最新のデータを再利用する方策を用いる. これにより,ネットワーク型
制御系の設計問題が不規則な切替えを有する制御系の設計問題へと帰着される.
そこで,このネットワーク型制御系に対して切替え制御系の一設計法である共通
の Lyapunov 関数を用いた設計法を適用する.この設計法では, 連立した線形行
列不等式の解の存在がサンプリング周期に依存することが示せる. そして, ネッ
トワーク型制御系の解析を通して, 系のもつ性質に注目し, 線形行列不等式条件を
解く必要のない簡易な安定化補償器の設計法を提案する. また, 制御性能も考慮
した制御系の設計法への拡張を行う.
∗
奈良先端科学技術大学院大学 情報科学研究科 情報システム学専攻 修士論文, NAIST-IS-
MT0651025, 2008 年 3 月 14 日.
i
キーワード
ネットワーク型制御系, データ損失, 切替え制御系, 共通 Lyapunov 関数, 線形行
列不等式, 可換
ii
Studies on Analysis and Design of
Networked Control Systems
with Considering the Data Losses∗
Akihiro Ohori
Abstract
Recent development of network technologies has enabled us to introduce several
advantages of network applications to our control engineering area. An exhaustive
treatment of transmission delay, data loss and capacity constraint over communication links in a networked control system (NCS) is an untractable problem.
Those phenomena may lead to deterioration and destabilization of the system.
This paper deals with a design problem of the NCS with communication links,
where data is sometimes lost over both of two links from a controller to an actuator and from a sensor to the controller.
Using the last available signal instead of void when the data is lost, the original
design problem can be reduced to one of a kind of randomly-switched system.
Then, a well-known stabilization technique is employed by introducing a common
Lyapunov function and it is shown that an existence of the solution to the linear
matrix inequality (LMI) problem depends on an interval of sampling instances.
After analyzing the stability of the NCS, we propose a simple design method
that needs not solve the LMI, as well as another one that considers not only
stabilization but also control performance.
∗
Master’s Thesis, Department of Information Systems, Graduate School of Information
Science, Nara Institute of Science and Technology, NAIST-IS-MT0651025, March 14, 2008.
iii
Keywords:
networked control system, data loss, switched system, common Lyapunov function, linear matrix inequality, commutativity
iv
目次
1. はじめに
1
1.1 研究背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2 研究目的 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.3 本論文の構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2. 予備的事項
6
2.1 記号の定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
2.2 Schur の補題 (Schur complement) . . . . . . . . . . . . . . . . . .
7
2.3 線形行列不等式 (LMI) . . . . . . . . . . . . . . . . . . . . . . . .
7
2.4 切替え制御系 (Switched system) . . . . . . . . . . . . . . . . . . .
8
2.4.1
安定性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.4.2
可換条件と共通 Lyapunov 関数の関係 . . . . . . . . . . . .
9
3. ネットワーク型制御系に対する安定化補償器の設計
13
3.1 あらまし . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3.2 問題の定式化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3.2.1
制御対象 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
3.2.2
ネットワーク通信路上のデータ損失 . . . . . . . . . . . . .
15
3.2.3
推定器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
3.2.4
設計問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
3.3 切替え制御系への帰着 . . . . . . . . . . . . . . . . . . . . . . . .
18
3.3.1
設計指針 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
3.3.2
補償器の設計 . . . . . . . . . . . . . . . . . . . . . . . . .
21
3.4 外乱が存在する環境下での安定性 . . . . . . . . . . . . . . . . . .
23
3.4.1
問題設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3.4.2
安定性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
3.5 数値例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
従来研究との比較 . . . . . . . . . . . . . . . . . . . . . . .
27
3.5.1
v
DC モータの制御 . . . . . . . . . . . . . . . . . . . . . . .
31
3.6 ネットワーク通信路上のデータ損失を把握できない場合の検討 . .
35
3.6.1
ネットワーク通信路に関する仮定 . . . . . . . . . . . . . .
35
3.6.2
対処法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
3.7 まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
3.5.2
4. ネットワーク型制御系の簡易設計法
37
4.1 あらまし . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
4.2 問題設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
4.2.1
切替え制御系 . . . . . . . . . . . . . . . . . . . . . . . . .
37
4.2.2
ネットワーク型制御系との関係 . . . . . . . . . . . . . . .
40
4.3 スカラーシステム . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
4.3.1
安定性の条件 . . . . . . . . . . . . . . . . . . . . . . . . .
40
4.3.2
簡易設計法 . . . . . . . . . . . . . . . . . . . . . . . . . .
42
4.3.3
サンプリング周期の上限 . . . . . . . . . . . . . . . . . . .
42
4.4 多次元システム . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
4.4.1
(一次) 近似システムの安定性 . . . . . . . . . . . . . . . .
44
4.4.2
実システムの安定性 . . . . . . . . . . . . . . . . . . . . .
47
4.4.3
簡易設計法 . . . . . . . . . . . . . . . . . . . . . . . . . .
47
4.5 数値例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
4.5.1
スカラーシステムの例 . . . . . . . . . . . . . . . . . . . .
51
4.5.2
多次元システムの例 . . . . . . . . . . . . . . . . . . . . .
55
4.6 まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
5. 制御性能を考慮したネットワーク型制御系
62
5.1 あらまし . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
5.2 サーボ系への拡張 . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
5.2.1
設計問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
5.2.2
サーボ系の構成法 . . . . . . . . . . . . . . . . . . . . . . .
63
5.2.3
数値例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
vi
5.3 ノルム性能の考慮 . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
5.3.1
設計問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
5.3.2
補償器の設計 . . . . . . . . . . . . . . . . . . . . . . . . .
71
5.4 まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
6. おわりに
73
6.1 本論文のまとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
6.2 今後の展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
74
謝辞
75
参考文献
77
付録
82
A. Tool Box の使い方
82
B. 従来研究 [2]
87
B.1 問題の定式化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
B.2 有限区間の最適制御 . . . . . . . . . . . . . . . . . . . . . . . . .
88
B.2.1 有限区間の最適補償器 . . . . . . . . . . . . . . . . . . . .
88
B.2.2 導出過程 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
vii
図目次
1
ネットワーク型制御系の構成
. . . . . . . . . . . . . . . . . . . .
3
2
データ損失に対する対処法 . . . . . . . . . . . . . . . . . . . . . .
4
3
二個の安定なサブシステムを有する切替え制御系 . . . . . . . . .
8
4
サブシステムのトラジェクトリー . . . . . . . . . . . . . . . . . .
12
5
切替え制御系のトラジェクトリー . . . . . . . . . . . . . . . . . .
12
6
ネットワーク型制御系のブロック線図
. . . . . . . . . . . . . . .
13
7
制御対象に印加される制御入力の時間応答 . . . . . . . . . . . . .
19
8
データ損失の連続回数に応じて切替えが起きる制御系 . . . . . . .
21
9
従来法 [2] による時間応答 . . . . . . . . . . . . . . . . . . . . . .
29
10
提案法による時間応答 . . . . . . . . . . . . . . . . . . . . . . . .
30
11
データ損失を考慮しない場合
. . . . . . . . . . . . . . . . . . . .
32
12
データ損失を考慮した場合 . . . . . . . . . . . . . . . . . . . . . .
33
13
データ損失の発生回数を確定的に与えた場合 . . . . . . . . . . . .
34
14
サンプリング周期が異なるサブシステムにもつ切替え制御系 . . .
39
15
(一次) 近似システムの極の漸近的性質 . . . . . . . . . . . . . . .
46
16
簡易設計法のフローチャート
49
17
制御対象の安定化だけを考慮し補償器を設計した場合 (スカラーシ
ステム)
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
18
簡易設計法に基づいて補償器を設計した場合 (スカラーシステム)
54
19
G = [41.4000 − 69.8667 ] を用いた場合の全サブシステムの極 . .
57
20
G = [−0.2000 − 3.7333 ] を用いた場合の全サブシステムの極 . .
57
21
制御対象の安定化だけを考慮し補償器を設計した場合 (多次元シス
テム) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
22
簡易設計法に基づいて補償器を設計した場合 (多次元システム) . .
60
23
ネットワーク型制御における拡大系のブロック線図 . . . . . . . .
64
24
データ損失を考慮せずサーボ系を構成した場合 . . . . . . . . . . .
68
25
データ損失を考慮してサーボ系を構成した場合 . . . . . . . . . . .
69
viii
表目次
1
各サブシステムのサンプリング周期と極 (G = [41.4000 − 69.8667 ]) 58
2
各サブシステムのサンプリング周期と極 (G = [−0.2000 − 3.7333 ]) 58
3
引数 A と B の設定 . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
84
1. はじめに
1.1 研究背景
近年のネットワーク通信技術の普及にともない, ネットワーク通信を活用した制
御系が数多く期待されるようになった.たとえば, 遠隔地にいる患者に対し遠隔操
作のロボットを用いて手術や検査などを行う遠隔医療 ( Zeus: Computer Motion
Inc. など ), 災害などにより壊れた建物の瓦礫の奥深くに閉じ込められた人々の捜
索を支援するロボット [37], 無線ネットワークを活用した工場内の遠隔監視 [38]・
遠隔制御など, 多くの応用先が期待されている. その理由としては,ロボットの
遠隔操作によって, 移動時間が短縮されるため作業効率の向上につながる点や過
酷な環境下での作業が可能になる点, 無線ネットワークの活用によって, 敷設の維
持管理が簡便になる点や故障率やコストが低減化される点などが考えられる.
この技術の実現に向けて, さまざまな分野からの研究が盛んに行われている. ロ
ボティクスやネットワークの分野では, 専用線の活用, 対象の機構やネットワーク
のプロトコルの改良など, 制御しやすい環境の構築を目指しハードウェアの立場
から研究され, 多くの成果が報告されている. 一方, 制御工学の分野では, 対象と
ネットワークのダイナミクスを考慮し, 数理的な解析を用いて安定化や制御性能
を達成するアルゴリズムの開発を目指しソフトウェアの立場から研究されている.
本論文では, 制御工学の立場からネットワーク通信路を活用した制御系を扱うた
め, 補償器の設計や系の安定性に注目する.
近年の制御工学の分野では, このようなネットワーク通信路を含む制御系をネッ
トワーク型制御系とよび, 系の解析や設計に関する様々な研究があげられる. た
とえば,文献 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] など. さらに,特集号 [11, 12] や解説記
事 [13, 14] なども挙げられる. このネットワーク型制御系において問題となるの
は, 通信路を流れるデータの遅延, 損失, パケットの到着順入れ替え (ねじれ) 現象,
ネットワークの帯域による制限などである. これらの現象は, システムの不安定
化や制御性能の劣化を引き起こす原因である. また,これらの現象が系のどの部
分でどの現象が生じるかにより, 組み合わせ的に様々な種類の問題設定が考えら
れる.
1
このネットワーク型制御系の解析・設計問題を大別した場合, 制御対象と安定
化や重力補償などを行う補償器が遠隔地にあり, 操作者がネットワーク越しに参
照値を送るタイプ ( 図 1 (a) の系 [8, 9, 10] ), もう一つは, 制御対象だけが遠隔地
にあり, 補償器と制御対象間にネットワーク通信路が存在するタイプ ( 図 1 (b) の
系 [1, 2, 4, 5, 6, 7] ) に分類される.
図 1 (a) のタイプの制御系は, ネットワーク越しに制御を行うことで, 付加機能
を加えることが制御目的になっている. たとえば, 文献 [8] では, 通信遅延を有す
る非線形のテレオペレーションに対し, マスタとスレーブの同期を達成している.
このような制御方式をバイラテラル制御と呼ばれ, この制御系においては, 通信遅
れの補償以外にマスタ・スレーブ間の力と姿勢の追従性などが制御目的とされて
いる. また, 文献 [9] では, 実際の対象を制御する際に問題となる拘束条件に注目
し, 最大出力許容集合 (Maximal Output Admissible set : MOA)[32], リファレン
スガバナ [33], スイッチング制御 [15] を応用して, ネットワーク通信路越しに拘束
条件を守る制御系を構成している. 文献 [10] では, 遅延フィードバック [31] を用
いてネットワーク通信路で生じる遅延を有効活用し, 未知の平衡点での安定化を
行っている.
一方, 図 1 (b) のタイプの制御系は, ネットワーク環境が制御系の性能に大きく
関与するため, ネットワーク環境を考慮して制御系を安定化することや制御性能
を達成することが制御目的になっている. たとえば, 伝送遅延を扱った研究として
は, 文献 [4] があげられる. この文献では, 伝送遅延だけでなくデータ損失も扱っ
ているが, 制御系を連続時間システムとして扱うことにより, 伝送遅延とデータ損
失を含めて時変なむだ時間だと捉え Lyapunov-Krasovski 関数 [29] を用いて補償
器を設計している. ネットワークの帯域による制限の問題を扱った研究としては,
文献 [5, 6, 7] があげられる. 文献 [7] では, 量子化器と停留時間付き切替え制御則
を用いて最小限のデータレートを導出している. また, 最適動的量子化器 [30] と
いう動的な量子化器などの応用も期待される. データ損失を扱った研究としては,
文献 [1, 2] があげられる. 特に, 文献 [2] では, 損失したデータの代わりに零値を
用いる (図 2(a),ũ は,受信・復元された信号を表す) ことで,損失の影響が評価
関数値に現れないよう工夫されている.そのうえで,動的計画法 [34, 35] を採用
2
Plant
Plant
Feedback
Controller
Communication
Network
Communication
Network
Feedback
Controller
Feedforward
Controller
(a) 遠隔地に制御対象と安定化補償器 (b) 遠隔地に制御対象だけがある場合
[1, 2, 4, 5, 6, 7]
がある場合 [8, 9, 10]
図 1 ネットワーク型制御系の構成
して最適な補償器の導出に成功している.このように,損失した制御入力データ
に対し,零値で復元する方法 (図 2(a),ũ は,受信・復元された信号を表す) を採
用している研究としては,そのほかに,文献 [1, 5] などが挙げられる.
このように, ネットワーク型制御系は, 近年盛んに研究されており, ネットワー
クに関連する様々な問題に対して多くの解決法が提案されている.
1.2 研究目的
本論文では,制御対象と補償器との間にネットワーク通信路が存在し (図 1 (b)),
その通信路上を流れるデータに対して損失 (または棄却) のみが生じるネットワー
ク型制御系をあつかう.従来研究 [1, 5] では, データ損失の発生の仕方をある確
率分布で与え, 損失した制御入力データに対し,零値で復元する方法 (図 2(a),ũ
は,受信・復元された信号を表す) を採用することにより確率的な安定性 ( mean
square stable [27] ) を保証する制御系を構成している.
3
~u
Data loss
~
u
Data loss
t
t
(b) Last available control
(a) Zero control
図 2 データ損失に対する対処法
しかしながら,その一方で,制御系を構成する機器のデータ受信部には,過去
の受信データが記憶装置に必ず残っているため,その情報を積極的に制御に用い
ることが可能である (図 2 (b)).また, ネットワーク通信路上で発生するデータ損
失を確率的に与えることにより, 確率的な安定性 ( mean square stable [27] ) を保
証しているが, データ損失が想定した確率分布で生じない場合, 安定性を保証でき
ない.
そこで, 本論文では, 図 2 (b) の方策を用いて, 図 1 (b) に示すネットワーク型
制御系の設計 · 解析を考える.データ損失に関しては, 連続する上限だけを設け,
不規則に発生する場合を扱う. 提案する手法は,制御入力の損失に対しては, 損
失したデータの代わりに過去に届いた中で最新のデータを再利用することにする.
フィードバック情報 (状態) の損失に対しては,損失の復元を目的とした状態推定
器を採用する.これにより,ネットワーク型制御系の設計問題がある種の切替え
制御系の設計問題に帰着される. そこで,ネットワーク型制御系に対して切替え
制御系の一設計法である共通の Lyapunov 関数を用いた設計法を適用する.さら
に,有界な外乱が発生する状況においても,得られた補償器が系の安定性を保証
することを確認する.つぎに, このネットワーク型制御系の解析を行い, この系の
もつ性質に注目し, 線形行列不等式 (linear matrix inequality : LMI ) 条件を解く
必要のない簡易な安定化補償器の設計法を提案する. そして最後に, 安定化だけ
でなく制御性能を考慮した制御系の設計法へ拡張する.
4
1.3 本論文の構成
本稿の構成は,以下のとおりである.
第 2 章:本論文で使用する記号を定義し, 必要な予備的事項を示す.
第 3 章:ネットワーク型制御系の定式化とその設計問題について述べる. まず,
この設計問題を切替え制御系の設計問題へと帰着できることを示したのちに, 共
通の Lyapunov 関数を用いた補償器の設計法を示す. そして, 有界な外乱に対し
ても系が安定性を有していることを確認する.
第 4 章:ネットワーク型制御系の解析を行い, サンプリング周期と系の安定性の
関係を示す. そして, この系のもつ性質に注目することにより, LMI 条件を解く
必要のない簡易な安定化補償器の設計法を提案する.
第 5 章:ネットワーク型制御系の安定化だけでなく制御性能を考慮した制御系の
設計法について述べる. まず, この系をサーボ系へ拡張する方法を示し, つぎに,
ノルム性能を考慮した補償器の設計法を提案する.
第 6 章:本論文のまとめと今後の展望を述べる.
5
2. 予備的事項
はじめに, 本論文で使用する記号を定義する. そして, 補償器の設計などで用い
る Shur の補題や線形行列不等式について触れた後, 本論文の核となる切替え制御
系の安定性についてまとめておく.
2.1 記号の定義
Rm×n : 実数の要素をもつ m × n 行列の全体
Cm×n : 複素数の要素をもつ m × n 行列の全体
Om×n : m × n の零行列
0 : 適切な次元の零ベクトル
Z+ : 非負の整数からなる集合
Z+
n : 0 から n までの整数集合 {0, 1, 2, ..., n}
AT : A の転置行列
A∗ : A の共役転置行列
λi (X) : 行列 X ∈ Cn×n の固有値で絶対値が i 番目に大きい固有値
|| · ||M : 行列に対するノルム
∞
l2 :
| xi |2 < ∞ を満たすすべての列 x = (x0 , x1 , · · · ) の全体の集合
i=0
ln2 :n 次元の l2 空間
∞
l2 ノルム: x l2 = (
| xi |2 )1/2
i=0
注意 1 ( 行列のノルムの例 [22] )
A = [aij ] ∈ Cm×n とする. ただし, aij は, A の i 行 j 列目の要素を表す.
• 誘導ノルム
Au 1
∗ A 1 := sup
= max
| aij |
1≤j≤n
u=0 u 1
i=1
m
∗ A 2 := sup
u=0
Au 2 = λmax (A∗ A)
u 2
6
n
Au ∞
∗ A ∞ := sup
= max
| aij |
1≤i≤m
u=0 u ∞
j=1
• Frobenius ノルム
∗ A F = Trace(A∗ A)
2.2 Schur の補題 (Schur complement)
エルミート行列 X = X ∗ を
X=
X11 X12
∗
X12
X22
と分解しておく. このとき, 以下の命題が成り立つ [22].
X > 0 となるための必要十分条件は, つぎの条件が成立することである.
(a)
−1 ∗
X12 > 0 かつ X22 > 0
X11 − X12 X22
(b)
−1
∗
X11
X12 > 0 かつ X11 > 0
X22 − X12
2.3 線形行列不等式 (LMI)
LMI (linear matrix inequality, 線形行列不等式)[19, 20] とは, つぎの形式
F (x) = F0 +
m
xi Fi > 0
i=1
を有する行列型不等式をいう. ここに, x = [x1 , · · · , xm ]T ∈ Rm は, 変数ベクトル
で, Fi = FiT ∈ Rn×n (i = 1, · · · , m) は, 定数行列である. 不等号は, F (x) が正定
という意味で使われ, F (x) は, 変数ベクトル x に関して線形である特徴をもつ.
LMI は, 内点法などのアルゴリズム [19, 20] で解くことができる.
7
2.4 切替え制御系 (Switched system)
2.4.1 安定性
ここでは, 本論文の核となる切替え制御系の安定性についてまとめる. 離散時
間システムの切替え制御系を
x[k + 1] = Aσ[k] x[k],
Aσ[k] ∈ Rn×n , σ[k] ∈ P, k ∈ Z+
(1)
と記述する. ここで, P は, 有界なインデックスの集合 P = {1, 2, · · · , m} であり,
インデックス σ は, アクティブなサブシステムを表す.
まず, 安定性を考えるために, 図 3 に示す切替え制御系 ( x ∈ R2 , P = {1, 2} )
を例に挙げて説明をする. 各サブシステムは, 図 4 に示すように漸近安定である.
このような安定なサブシステムをあるタイミングで切替えると, 図 5 (a) のよう
に切替え制御系のトラジェクトリーが零へ収束していく. しかし, 切替えるタイ
ミングを変えると図 5 (b) のように切替え制御系のトラジェクトリーが発散して
いく. これにより, 次の事実を導ける.
• すべてのサブシステムが安定であっても, 任意の切替えに対して制御系全体
が安定になるとは限らない [15].
Subsystem A1
Subsystem A 2
図 3 二個の安定なサブシステムを有する切替え制御系
8
このような切替え制御系 (1) が安定となる条件として, つぎの定理が存在する
[15, 17].
定理 1 すべてのサブシステムに対する共通 Lyapunov 関数が存在すれば, 切替え
制御系は大域的一様漸近安定 (GUAS) である.
定理 2 すべてのサブシステムが Schur 安定であるとき, A1 を満たせば切替え制
御系は大域的一様指数安定 (GUES) である.
ここで, A1 とは, 可換条件
Ai Aj = Aj Ai ,
∀i, j ∈ P
のことである.
2.4.2 可換条件と共通 Lyapunov 関数の関係
前節では, 任意の切替えに対して制御系が安定となる条件として, 定理 1, 2
を説明した. この可換条件と共通 Lyapunov 関数には, つぎの関係が存在する
[15, 16, 17].
定理 3 切替え制御系 (1) において, すべてのサブシステムが Schur 安定で A1 を満
たしているとする. 正定対称行列 P0 ∈ Rn×n を与えたとき, P1 , P2 , · · · , Pm ∈ Rn×n
は, つぎの Lyapunov 方程式を満足する唯一の正定解とする.
ATi Pi Ai − Pi = −Pi−1 ,
i = 1, 2, · · · , m
(2)
そのとき, V (x[k]) = x[k]T Pm x[k] は, 切替え制御系 (1) のすべてのサブシステム
に対する共通 Lyapunov 関数である.
(証明)
まず, 単純化のため P = {1, 2} のときの証明を行い, つぎに, P =
{1, 2, · · · , m} のときを示す.
P = {1, 2} のとき, V (x[k]) = x[k]T P2 x[k] とする. ここで, x[k + 1] = A2 x[k]
に対し, (2) 式より,
V (x[k + 1]) − V (x[k]) = xT [k](AT2 P2 A2 − P2 )x[k] = −xT [k]P1 x[k] < 0
9
となる. これより, V は, このシステムに対する Lyapunov 関数である. つぎに,
x[k + 1] = A1 x[k] に対して,
V (x[k + 1]) − V (x[k]) = xT [k](AT1 P2 A1 − P2 )x[k] < 0
が成立するかを確かめる. ここで, (2) 式より,
P0 = AT1 (AT2 P2 A2 − P2 )A1 − (AT2 P2 A2 − P2 )
となる. また, A1 の可換条件を仮定しているので,
P0 = AT2 (AT1 P2 A1 − P2 )A1 − (AT1 P2 A1 − P2 )
となる. これに対して, A2 は, Schur 安定, P0 > 0 より, AT1 P2 A1 − P2 < 0 である
ことが分かる. よって, V (x[k]) = x[k]T P2 x[k] は, 切替え制御系 (1) の二個のサブ
システムに対する共通 Lyapunov 関数である.
P = {1, 2, · · · , m} のとき, x[k + 1] = Ai x[k] に対して,
V (x[k + 1]) − V (x[k]) = xT [k](ATi Pm Ai − Pm )x[k] < 0
(3)
が成立するかを確かめることによって証明をする. ここで, Pij を
Pij := ATi Pj Ai − Pj
と定義する. もし,
Pij < 0,
i = 1, 2, · · · , m,
j = i, i + 1, · · · , m
を示せたとする. そのとき, 任意の i に対して, j = m とすることにより, (3) 式
を示せる. そこで, i ∈ {1, 2, · · · , m} とする. まず, (2) 式より,
Pii = −Pi−1 < 0
である. ここで,
Pij = ATi Pj Ai − Pj < 0,
j ∈ {i, i + 1, · · · , m − 1}
10
と仮定する. そのとき, (2) 式より
Pj = −ATj+1 Pj+1Aj+1 + Pj+1
であるので, Pij は,
Pij = −ATi (ATj+1 Pj+1 Aj+1 − Pj+1 )Ai + (ATj+1 Pj+1 Aj+1 − Pj+1 )
となる. Ai と Aj+1 が可換であり, Aj+1 が Schur 安定であることより,
ATj+1 Pi
であり, これは Pi
j+1
j+1 Aj+1
− Pi
j+1
= −Pij > 0
< 0 を示している. よって, 帰納法により証明される.
11
(a) サブシステム A1
(b) サブシステム A2
図 4 サブシステムのトラジェクトリー
(a) 安定
(b) 不安定
図 5 切替え制御系のトラジェクトリー
12
3. ネットワーク型制御系に対する安定化補償器の設計
3.1 あらまし
本章では, 図 6 に示すネットワーク型制御系の安定化問題を考える. ここで紹
介する手法では, 制御入力の損失に対しては, 過去に届いたなかで最新のデータを
再利用する. そして, 観測信号の損失に対しては, 損失したデータの復元を目的と
した状態推定器を採用する. これにより, ネットワーク型制御系の設計問題があ
る種の切替え制御系の設計問題と等価であることが示せる. ゆえに, ネットワー
ク型制御系に対して共通の Lyapunov 関数を用いた設計法を適用する. さらに, 有
界な外乱が発生する状況においても, 得られた補償器が系の安定性を保証するこ
とを確認する. そして, 数値例を用いて本手法の有効性を確認する.
Sampling period : h
Network
Controller
^x [ k ]
u[k]
u[k]
α [ k ] = 1 or 0
H
Plant
S
x[k]
Estimator
β [ k ] = 1 or 0
図 6 ネットワーク型制御系のブロック線図
3.2 問題の定式化
ネットワーク型制御系のブロック線図を図 6 に示す. 制御対象と補償器または
推定器が互いにネットワーク線でつながれている. また, それぞれの通信路上で
は, データ損失が生じる.
13
3.2.1 制御対象
制御対象は, 線形時不変連続時間システムであり, その状態方程式を
ẋ(t) = Ac x(t) + Bc u(t)
(4)
と記述する. ここで, x ∈ Rnx , u ∈ Rnu は, それぞれ制御対象の状態量, 制御入力
である. 図 6 のサンプリング周期 h で動作する零次ホールド ( 図 6 中の H ) 手
前からサンプラ ( 図 6 中の S ) の後ろまでの離散ダイナミクスは,
x[k + 1] = Ax[k] + Bu[k],
k ∈ Z+
(5)
A = eAc h
h
Ac τ
B=
e dτ Bc
0
となる. また, (A, B) は, 可制御対であり, 状態は, 観測可能とする. さらに, 制御
入力がネットワーク通信路上で損失した場合は, 過去に届いたなかで最新のもの
( 直前の信号値 ) を再利用する. ( 第 1.2 節参照 )
注意 2 ( (5) 式の導出 )
制御対象 (4) の離散時間状態方程式を得るために, 略記法
x[k] = x(kh)
を導入しておく. さて, (4) 式で表されるシステムが, 初期時刻 t0 において初期状
態 x(t0 ) を持っているとする. この (4) 式で与えられる微分方程式の解は,
Ac (t−t0 )
x(t) = e
t
x(t0 ) +
eAc (t−τ ) Bc u(τ )dτ
t0
となる. ここで, t0 = kh, t = (k + 1)h とおき, さらに制御入力 u(t) がサンプル点
間 kh ≤ t < (k + 1)h で, 一定値 u(kh) をとることに注意すれば, 略記法を用いる
ことにより, (5) 式を導出できる [23].
14
3.2.2 ネットワーク通信路上のデータ損失
図 6 で示すネットワーク型制御系において, 補償器と制御対象間, または制御
対象と推定器間のそれぞれの通信路上で生じるデータ損失は, つぎの仮定を満た
すものとする.
仮定 1 連続してデータ損失が起きる回数は有限である. とくに, 制御入力が連続
して損失する最大回数を n ∈ Z+ とする.
注意 3 ( 仮定 1 について )
従来研究 [1, 2, 5] などでは, データ損失の発生に確率的な条件を設けなければ
ならない. しかし, 仮定 1 では, 連続して損失する最大回数を与えるだけである.
つまり, データ損失の発生が確率的な場合以外も扱うことが可能である. (例:確
定的にデータ損失が発生した場合など. )
また, ネットワーク通信路に関して, つぎの仮定を設ける.
仮定 2 ネットワーク通信路上で発生したデータ損失の有無を把握できる.
仮定 2 の損失の有無は, ACKnowledgement (ACK) [36] を利用することで, 把
握することができる. そこで, 損失に関する情報を 0 − 1 離散値変数 α, β で表し
ておく.
α[k] ∈ {0, 1},
β[k] ∈ {0, 1},
k ∈ Z+
ここで,α[k] = 0 は,時刻 k に制御入力 u[k] が損失すること,α[k] = 1 は,u[k]
が制御対象へ無事に到着することを意味する.同様に, β[k] = 0 は,時刻 k に観
測信号 x[k] が損失すること,β[k] = 1 は,x[k] が推定器へ無事にフィードバッ
クされることを意味する.
15
3.2.3 推定器
本節では, 制御対象と推定器を結ぶネットワーク通信路で観測信号が損失した
場合に, その復元を目的とした推定器 [1, 2] を構築する.
推定器は,
⎧
⎪
x[k]
⎪
⎪
⎨
x̂[k] =
if β[k] = 1
Ax̂[k − 1] + α[k − 1]Bu[k − 1]
⎪
⎪
⎪
⎩
+ (1 − α[k − 1]) Bξ[k − 1]
ξ[k] = (1 − α[k − 1]) ξ[k − 1] + α[k − 1]u[k − 1],
(6a)
if β[k] = 0
k ∈ Z+ \ 0
(6b)
と構築できる.ここで, x̂ ∈ Rnx は, 状態の推定値で x̂[0] = x[0] とする.そして,
ξ ∈ Rnu は, 制御対象に到着したなかで最新の制御入力を記憶させておくための
変数であり, (6b) 式がその更新規則を表す. なお,ξ[0] = 0 とする.
このとき,推定器 (6) は,仮定 2 のもとでつぎの命題を与える.
命題 1
x̂[k] = x[k],
∀k ∈ Z+
(証明) 仮定 2 が成り立つとする.まず,ある時刻 k での関係 x̂[k] = x[k] を考え
る.β[k] = 1 のときは,自明である.β[k] = 0 のとき,そして,制御対象に制御入力
が無事に届いている場合 (α[k−1] = 1),更新則 (6a) は,x̂[k] = Ax̂[k−1]+Bu[k−1]
となり,(5) 式と一致する.また,制御入力が損失している場合 (α[k − 1] = 0) に
は,x̂[k] = Ax̂[k − 1] + Bξ[k − 1] となり,一つ過去の制御入力値 ξ が (6b) 式よ
り再現されるので,x̂[k] = x[k] が成り立つ.したがって,k に関して帰納的に考
えれば,x̂[0] = x[0] なので,制御入力信号の損失有無 α にかかわらず,推定器
(6) は,x̂[k] = x[k], ∀k ∈ Z+ を満たすことが分かる.
命題 1 より, 推定器 (6) を用いれば, 制御対象と推定器間の通信路上でのデー
タ損失を考える必要がない.
16
3.2.4 設計問題
仮定 1, 2 を満たすネットワークを介し,推定器 (6) を用いて制御対象 (4) を安
定化する状態フィードバック制御則 u = Gx̂ の設計問題を考える.この制御則
を用いたときのネットワーク型制御系 (図 6) は, つぎのように書き表すことがで
きる.
x[k + 1] = Ax[k] + α[k]BGx̂[k] + (1 − α[k]) Bξ[k]
(7a)
ξ[k + 1] = (1 − α[k]) ξ[k] + α[k]Gx̂[k]
(7b)
ここで,本手法の特徴は,ネットワーク通信路でデータが損失した場合,損失し
たデータの代わりに過去届いたなかで最新の情報を再利用する仕組み (7b) を取り
入れることである.これにより,ネットワーク型制御系 (7) の安定化問題がある
種の切替系の安定化問題へと帰着させることが可能となる.
注意 4 ( ネットワーク型制御系 (7) の補足 )
ネットワーク型制御系 (7) において, 制御入力が無事に到着した場合, α[k] = 1
であるため, (7a) 式は,
x[k + 1] = Ax[k] + BGx̂[k]
となり, 状態は, 現在の入力を利用し更新される. 一方, 制御入力が損失した場合,
α[k] = 0 であるため, (7a) 式は,
x[k + 1] = Ax[k] + (1 − α[k − 1])Bξ[k − 1] + α[k − 1]BGx̂[k − 1]
となる. ここで, 1 ステップ前の入力が無事に到着していた場合, α[k − 1] = 1 で
あるため, (7a) 式は,
x[k + 1] = Ax[k] + BGx̂[k − 1]
となり, 状態は, 一つ過去の入力を再利用し更新される. しかし, 1 ステップ前の
入力も損失していた場合, α[k − 1] = 0 であるため, (7a) 式は,
x[k + 1] = Ax[k] + (1 − α[k − 2])Bξ[k − 2] + α[k − 2]BGx̂[k − 2]
17
となる. つまり, (7) 式は, ネットワーク通信路でデータが損失した場合,損失し
たデータの代わりに過去届いたなかで最新の情報を再利用し, 制御系の状態を更
新する式になっていることが分かる.
3.3 切替え制御系への帰着
3.3.1 設計指針
本節では, 命題 1 より, 制御入力のみが損失する状況を考える. 制御入力の損
失が発生する場合の例として,制御対象に届いた制御入力 ũ の時間応答を図 7
に示す.図 7 (a) は,データ損失がまったく発生しない場合であり,図 7 (b) は,
データ損失が適当に発生した場合を示す.ここで,“◦” は,制御入力の損失を表
す.図 7 (a), (b) から,損失が生じると過去の制御入力が再利用されるため,受
信される制御入力の応答は,損失のタイミングにあわせて値が保持されるように
なることが分かる.
18
~
u
1h
0
1 2 3 4
0
1 2 3 4
.........
.........
.........
τ0 τ 1 τ2 τ3 τ4
k
τ
i
τ i τi+1
(a) データ損失が発生しない場合
Data loss
u~
1h
2h
3h
0
1 2 3 4
0
1
τ0 τ1
τ2 τ3
2 3
.........
τ4 τ5 ...... τi
4h
4 5
τi+1
(b) データ損失が発生した場合
図 7 制御対象に印加される制御入力の時間応答
19
k
τ
i
このとき,制御入力を無事に受信した時刻を τi ∈ Z+ で表し, その時のステッ
プ数を k とする. そして, σ ∈ Z+
n (σ ≤ n) を連続してデータ損失が発生した回数
と定義すれば,つぎの関係が得られる.
τi+1 − τi = (k + 1 + σ[i] − k)h = (1 + σ[i])h, ∀i ∈ Z+
(8)
ただし,τ0 = 0 とする.この (8) 式の左辺 τi+1 − τi は,時変なサンプリング周期
とみなせ,その間の制御入力の値は一定となる.
そこで,ある σ に対して α[k + j] = 0, 1 ≤ j ≤ σ かつ α[k] = 1 とおけば,
(7b) 式は,ξ[k + j] = u[k], 1 ≤ j ≤ σ となる.したがって,ネットワーク型制御
系 (7) は,制御対象の線形性および命題 1 より,時変なサンプリング周期 (8) を
有する制御系として次のように書き表せる.
σ = 0 のとき,
x(τi+1 ) = Ax(τi ) + BGx̂(τi )
σ = 1 のとき,
x(τi+1 ) = A2 x(τi ) + (A + I)BGx̂(τi )
σ = 2 のとき,
x(τi+1 ) = A3 x(τi ) + (A2 + A + I)BGx̂(τi )
...
σ = n のとき,
x(τi+1 ) = An+1 x(τi ) + (An + · · · + A + I)BGx̂(τi )
となる. 命題 1 より, x̂ = x なので, これを一般的に表すと,
x(τi+1 ) = (Aσ[i] + Bσ[i] G)x(τi )
と書き表せる.ただし,係数行列は,σ に依存し,
σ
1+σ
Aσ := A , Bσ :=
Aσ−l B
l=0
である. また,G ∈ R
nu ×nx
は,状態フィードバックゲインである.
20
(9)
1h
Plant
S
2h
Plant
S
3h
Plant
S
ä
ä
ä
H
H (n+1)h
Plant
S
H
Controller
H
図 8 データ損失の連続回数に応じて切替えが起きる制御系
さらに,(9) 式は,σ に応じて係数行列 Aσ , Bσ がそれぞれ変化することから,
n + 1 個のサブシステムを有する切替え制御系 (図 8) とみなせる.また, このサ
ブシステムは, サンプリング周期が異なるサンプル値系となっており, σ の変動特
性が制御系 (9) の切替え時期を与えていることも分かる.
以上の議論から,ネットワーク型制御系の設計問題は,不規則に切替えが起き
る制御系の安定化問題に帰着されることが分かる.このことは,切替え制御系に
対する従来の制御則が,データ損失が発生するようなネットワークを介した遠隔
制御系に対して有効な制御法と成りうることを示している.
3.3.2 補償器の設計
(9) 式のネットワーク型制御系に対し,切替え制御系の一設計法である共通の
Lyapunov 解を用いた補償器の設計 [19] をおこなう.なお,切替え制御系に対す
る他の設計法に関しては,文献 [17, 18] で紹介されている. 結果として, つぎの定
理を導ける.
21
定理 4 仮定 1, 2 が成り立つとする.もし,ネットワーク型制御系 (7) (または
(9)) に対し,つぎの線形行列不等式 ( LMI )
P
P ATσ + X T BσT
Aσ P + Bσ X
P
> 0,
∀σ ∈ Z+
n
(10)
を満たす X ∈ Rnu ×nx および正定対称行列 P ∈ Rnx ×nx が存在するならば,G =
XP −1 となる G に対してネットワーク型制御系の原点は,漸近安定である.
(証明) 仮定 2 のもと命題 1 が成り立つので,本稿で扱うネットワーク型制御
系 (7) がある種の切替え制御系 (9) と等価であることを示した.このことから, 切
替え制御系の設計法をネットワーク型制御系の設計法として採用できる. (10) 式
を満たす X ∈ Rnu ×nx および正定対称行列 P ∈ Rnx ×nx が存在するとする. ここ
で, X = GP より,
P
P (Aσ + Bσ G)T
(Aσ + Bσ G)P
P
> 0 ∀σ ∈ Z+
n
(11)
を得る. この不等式 (11) に対して, Schur complement を行うことで,
P (Aσ + Bσ G)T P −1 (Aσ + Bσ G)P − P < 0,
P −1 > 0,
∀σ ∈ Z+
n
(12)
となり, (12) 式の両辺の左右から P −1 をかけると, (9) 式の制御系に対する n + 1
本の Lyapunov 不等式
(Aσ + Bσ G)T P −1 (Aσ + Bσ G) − P −1 < 0,
P −1 > 0,
∀σ ∈ Z+
n
を得られる. つまり, これは, xT P −1 x が切替え制御系 (9) のすべてのサブシステ
ムに対する共通 Lyapunov 関数となることを示している.よって, (10) 式を満た
す X, P > 0 が存在するならば,Lyapunov 安定定理より,
G = XP −1
(13)
で与えられる G に対し,ネットワーク型制御系の原点は,漸近安定となる. 22
3.4 外乱が存在する環境下での安定性
制御対象に外乱が印加された際, 命題 1 が成立しないため, 未知外乱およびデー
タ損失が系全体に与える影響を調べる必要がある. そこで, 本節では, 外乱が存在
する状況下で系の安定性について解析をおこなう.
3.4.1 問題設定
本節では, 有界な外乱
w[k] ∈ W, ∀k ∈ Z+
(14)
を考え, 制御対象の離散ダイナミクス (5) の代わりに
x[k + 1] = Ax[k] + Bu[k] + Bd w[k], k ∈ Z+
を扱う. ここで,w ∈ Rnw は,未知外乱であり, W ⊂ Rnw は, 有界な集合である.
また, この外乱 (14) の発生するネットワーク型制御は,
x[k + 1] = Ax[k] + α[k]BGx̂[k] + (1 − α[k]) Bξ[k] + Bd w[k]
(15a)
ξ[k + 1] = (1 − α[k]) ξ[k] + α[k]Gx̂[k]
(15b)
と記述される.
注意 5 ( 有界な外乱の例 )
有界な外乱 (14) の一例を示す.
• 定値外乱
• 有界な不規則雑音
∗
正規性白色ノイズ1 は, 正規分布 ( ガウス分布 )[26] に従うため有界で
はない. しかし, 数値例では, 従来研究と比較を行うため, ガウス分布
する乱数から生成した正規乱数配列を用いる. この際, シミュレーショ
ン時間内で有界であることを確認し, その配列を白色ノイズとする.
1
以下のの二つの条件を満たすような w(t) を白色ノイズと定義する.
– E[w(t)] = 0
– E[w(t1)w(t2)] = σ 2 δ(t1 − t2)
ただし, σ 2 は, w の分散で, δ は, ディラックのデルタ関数である.
23
3.4.2 安定性
本節では,有界な外乱 (14) を考え,補償器 (13) で構成されるネットワーク型
制御系 (15) の安定性 [25] を調べる.結果として,つぎの定理が導ける.
定理 5 仮定 1, 2 が成り立つとする.もし,外乱 (14) の発生するネットワーク型
制御系 (15) に対し,線形行列不等式 (10) を満たす行列 X および P = P T > 0 が
存在するならば,ネットワーク型制御系 (15) の原点 x = 0 は,有界入出力安定 (
BIBO 安定 ) である [25].
(証明) ネットワーク型制御系 (15) をサンプリング時刻 τi に沿った形式へと変
形し,その時間応答を調べることで安定性を調べる.まず,ネットワーク型制御
系 (15) を変形する.ある σ に対して α[k + j] = 0, 1 ≤ j ≤ σ ,α[k] = 1 とおけ
ば,(15b) 式は,ξ[k + j] = u[k], 1 ≤ j ≤ σ となる.また,必ずしも x̂ = x が成
立するわけではないので,推定誤差を
e := x − x̂
(16)
で表す.以上より, ネットワーク型制御系 (15) は,時変なサンプリング周期 (8)
を有する制御系として次のように書き表せる.
σ = 0 のとき,
x(τi+1 ) = Ax(τi )+BGx̂(τi )+Bd w(τi )
σ = 1 のとき,
x(τi+1 ) = A2 x(τi )+(A+I)BGx̂(τi )+ ABd Bd
w[k]
w[k + 1]
σ = 2 のとき,
⎡
⎤
w[k]
⎢
⎥
⎥
x(τi+1 ) = A3 x(τi )+(A2 +A+I)BGx̂(τi )+ A2 Bd ABd Bd ⎢
⎣ w[k + 1] ⎦
w[k + 2]
24
...
σ = n のとき,
⎤
⎡
w[k]
x(τi+1 ) = An+1 x(τi )+(An +· · ·+A+I)BGx̂(τi )+ An Bd · · · ABd
⎢
⎢ w[k + 1]
⎢
Bd ⎢
..
⎢
.
⎣
w[k + n]
となる. ここで, 推定誤差 (16) を考慮して, 一般的に表すと,
x(τi+1 ) = Ãσ[i] x(τi ) + wσ[i] (τi ) − Bσ[i] Ge(τi )
(17)
と書き表せる.ただし,Ãσ および wσ は,つぎのとおりである.
Ãσ := Aσ + Bσ G,
wσ [·] :=
σ
Aσ−l Bd w[· + l]
l=0
ここで,推定誤差とデータ損失の間には,つぎの関係
if β[k] = 0
Ae[k − 1] + Bd w[k − 1]
e[k] =
0
if β[k] = 1
(18)
が成り立つ. この (18) 式と仮定 1 より,推定誤差 e は,有界であることが分か
る.つぎに,閉ループ系 (17) の時間応答は,
x(τ0 ) = x[0],
x(τ1 ) = Ãσ[0] x(τ0 ) − Bσ[0] Ge(τ0 ) + wσ[0] (τ0 ),
i−1
i−2 i−2
Ãσ[i−j−1] x(τ0 ) − Bσ[i−1] Ge(τi−1 ) −
Ãσ[i+m−j−1] Bσ[m] Ge(τm )
x(τi ) =
j=0
+
i−2 i−2
m=0
m=0
Ãσ[i+m−j−1] wσ[m] (τm ) + wσ[i−1] (τi−1 )
j=m
25
j=m
(19)
⎥
⎥
⎥
⎥
⎥
⎦
と記述される.ここで,定理 4 で設計した G を用いるため,任意の切替えに対
して,
i−1
Ãσ[i−j−1] → 0,
j=0
M
i−2
i−1
Ãσ[i+m−j−1] → 0,
m=0
j=m
i→∞
i→∞
M
を満たす.ここで, || · ||M は,任意の行列に対するノルムを表す ( 注意 1 参照 ).
また,(14) 式より wσ に関する項も有界,(18) 式と仮定 1 より推定誤差 e に関す
る項も有界である.以上から,||x(τi )|| < ∞, ∀τi ∈ Z + が成り立つ.つまり,切
替え制御系 (17) の状態量は,発散せずにある有界な領域に留まることが分かる.
したがって,切替え制御系 (17) およびネットワーク型制御系 (15) の原点 x = 0
は,有界入出力安定である.
注意 6 ( 閉ループ系 (17) の時間応答の詳細 )
閉ループ系 (17) の時間応答 (19) を導出する.
x(τ0 ) = x[0],
x(τ1 ) = Ãσ[0] x(τ0 ) − Bσ[0] Ge(τ0 ) + wσ[0] (τ0 ),
x(τ2 ) = Ãσ[1] x(τ1 ) − Bσ[1] Ge(τ1 ) + wσ[1] (τ1 )
= Ãσ[1] Ãσ[0] x(τ0 ) − Bσ[1] Ge(τ1 ) − Ãσ[1] Bσ[0] Ge(τ0 ) + Ãσ[1] wσ[0] (τ0 ) + wσ[1] (τ1 ),
x(τ3 ) = Ãσ[2] x(τ2 ) − Bσ[2] Ge(τ2 ) + wσ[2] (τ2 )
= Ãσ[2] Ãσ[1] Ãσ[0] x(τ0 ) − Bσ[2] Ge(τ2 ) − Ãσ[2] Bσ[1] Ge(τ1 ) − Ãσ[2] Ãσ[1] Bσ[0] Ge(τ0 )
+ Ãσ[2] Ãσ[1] wσ[0] (τ0 ) + Ãσ[2] wσ[1] (τ1 ) + wσ[2] (τ2 ),
..
.
x(τn ) = Ãσ[n−1] x(τn−1 ) − Bσ[n−1] Ge(τn−1 ) + wσ[n−1] (τn−1 )
n−1
n−2 n−2
=
Ãσ[n−j−1] x(τ0 ) − Bσ[n−1] Ge(τn−1 ) −
Ãσ[n+m−j−1] Bσ[m] Ge(τm )
j=0
+
n−2 n−2
m=0
m=0
Ãσ[n+m−j−1] wσ[m] (τm ) + wσ[n−1] (τn−1 )
j=m
26
j=m
ここで, i ≥ 2 のとき, (19) 式としてまとめられる.
3.5 数値例
ネットワーク型制御系設計に対して, 切替え制御系の設計法が有効であること
を二つの数値例題により確認する. 例題 1 では,損失に対して零値で信号を復元
する文献 [2] の手法により構成される制御系の応答と比較する.ここで, 文献 [2]
では, “Zero control” に基づいて, ネットワークで発生するデータ損失を考慮した
最適コントローラの導出をおこなっている. つぎに,例題 2 では,実機のモデル
(DC モータ) を用いて損失を考慮した場合としない場合とで得られる結果を比較
する.
なお,本数値例では,データ損失の発生は,ある実数 0 < a < 1, 0 < b < 1 に
対し,
P r(α[k] = 0) = a,
P r(α[k] = 1) = 1 − a,
k ∈ Z+
P r(β[k] = 0) = b,
P r(β[k] = 1) = 1 − b,
k ∈ Z+
の確率過程で与えられるとする [1, 2, 5].ただし,この確率過程に対して,仮定 1
を満たさなければならないので,本数値例では,n を超える連続のデータ損失が
発生する場合は,強制的に n で打ち切ることにした.さらに,例題 2 において,
データ損失の発生回数を確定的に与えた場合の結果も示す.
3.5.1 従来研究との比較
例題 1 : 文献 [2] で紹介されている離散時間システム
x[k + 1] = 2x[k] + u[k] + w[k], k ∈ Z+
を制御対象の離散ダイナミクスとし, サンプリング周期 10 [ms] で数値例を行な
う. 外乱 w は,平均値が 0,分散が 1 の白色ノイズ ( 注意 5 参照 ) とした.ま
た,この数値例では,a = 0.3,b = 0.3 とし,補償器と制御対象間でデータ損失
が連続して発生する最大回数を n = 5 と決定した.このときに得られるシミュ
27
レーション結果を 図 9, 10 に示す.図 9 は,文献 [2] の “Zero control” に基づい
た設計法で得られた時間応答を,図 10 は,提案する設計法で得られた時間応答
をそれぞれ示す.図中の “◦” は,補償器と制御対象間のネットワーク線上で発生
したデータ損失を表す.
図 9, 10 より,状態の収束性が良いのは,文献 [2] の “Zero control” の結果で
あることが分かる.しかしながら,データ損失に伴いインパルス的な制御入力の
生成および状態の変化が起きている.このように信号を急激に変化させる制御法
は,機械系などへの応用を考える場合には好ましくない.一方,提案法では,原
点の収束性について劣っているが,インパルス的な状態変化は,起きていないこ
とが分かる.また, 応答の振幅を比較すると, 提案法は安定性しか考慮していない
にも関わらず, 最適制御である従来法 [2] よりさほど劣っていないため, 比較的良
好な応答が得られていると思われる.
28
40
Input
20
0
-20
-40
0
2
4
6
Time [s]
8
10
8
10
(a) input
40
State
20
0
-20
-40
0
2
4
6
Time [s]
(b) state
図 9 従来法 [2] による時間応答
29
40
Input
20
0
-20
-40
0
2
4
6
Time [s]
8
10
8
10
(a) input
40
State
20
0
-20
-40
0
2
4
6
Time [s]
(b) state
図 10 提案法による時間応答
30
3.5.2 DC モータの制御
例題 2 : 同定実験により得られた DC モータの数理モデルを用いる. 制御対象
の離散ダイナミクスは,状態を x = [ θ θ̇ ] と定義して,
1 0.0099
0.0024
1
x[k + 1] =
x[k] +
u[k] +
w[k]
0 0.9851
0.4863
1
と記述される.ここで,θ,θ̇,u は,それぞれ,モータの回転角度,角速度,モー
タへの入力電圧である.サンプリング周期は, 10 [ms] である.外乱 w は,平均値
が 0,分散が 1 の白色ノイズ (注意 5 参照) を加え, a = 0.5,b = 0,n = 5 とした.
まず,データ損失を考慮せず (a = 0) に制御対象を安定化する補償器
Ga=0 = [ −0.5175 − 2.0283 ]
を用いて得られた時間応答を図 11 に示す.つぎに,提案法の補償器
Ga=0.5 = [ −0.1059 − 0.4561 ]
を用いて得られた時間応答を図 12 に示す.図中の “◦” は,補償器と制御対象間
のネットワークで発生するデータ損失を表す.
図 11, 12 および Ga=0 ,Ga=0.5 より,提案法は,データ損失の発生に応じてあ
らわれるインパルス的な振動が抑えられる程度に低ゲインの補償器を設計してい
ると解釈することができる.
また,制御入力が毎時 5 回連続して損失し,観測信号が毎時 10 回連続して
確定的に損失する状況を想定した結果を図 13 に示す.ここでは,補償器 Ga=0.5
を用いた.図 12,13 から,提案法は,ネットワーク型制御系を安定化するだけで
なく,結果的ではあるが,データ損失の発生を確率的または確定的に与えても,
データ損失で生じるインパルス的な振動を抑制できることがわかった.
以上から,データ損失の発生するネットワーク型制御系設計に対して,切替え
制御系の設計法が有効であることを数値例により確認した.また, 従来法 [1, 2] で
は,データ損失の発生の仕方をある確率分布で与えることにより, 確率的な安定
性 ( mean square stable [27] ) を保証しているが, 本手法では, データ損失の発生
をある確率的に与える必要がなく, データ損失が連続的に発生する回数を有限回
と仮定するだけで, 確定的な安定性を保証できることを確認した.
31
30
angle [rad]
20
10
0
-10
-20
-30
0
2
4
6
8
10
8
10
Time [s]
(a) angle θ[k]
angular velocity [rad/sec]
20
10
0
-10
-20
0
2
4
6
Time [s]
(b) angular velocity θ̇[k]
20
voltage [V]
10
0
-10
-20
0
2
4
6
8
Time [s]
(c) voltage u[k]
図 11 データ損失を考慮しない場合
32
10
30
angle [rad]
20
10
0
-10
-20
-30
0
2
4
6
8
10
8
10
Time [s]
(a) angle θ[k]
angular velocity [rad/sec]
20
10
0
-10
-20
0
2
4
6
Time [s]
(b) angular velocity θ̇[k]
20
voltage [V]
10
0
-10
-20
0
2
6
4
8
Time [s]
(c) voltage u[k]
図 12 データ損失を考慮した場合
33
10
30
angle [rad]
20
10
0
-10
-20
-30
0
2
4
6
Time [s]
8
10
8
10
8
10
(a) angle θ[k]
angular velocity [rad/sec]
20
10
0
-10
-20
0
2
4
6
Time [s]
(b) angular velocity θ̇[k]
20
voltage [V]
10
0
-10
-20
0
2
4
6
Time [s]
(c) voltage u[k]
図 13 データ損失の発生回数を確定的に与えた場合
34
3.6 ネットワーク通信路上のデータ損失を把握できない場合の検討
本章のネットワーク型制御系では, 仮定 2 が成立するという条件下 (たとえば
TCP など) で, 議論をおこない安定化補償器の設計を提案した. しかし, 実際に,
仮定 2 が成立しない場合は, 数多く考えられる (たとえば UDP など) . そのよう
な状況下では, α に関する情報を入手不可能であるため, 推定器 (6) を用いること
ができない.
そこで本節では, 仮定 2 が成立しない場合の検討を行い, その対処法を紹介する.
3.6.1 ネットワーク通信路に関する仮定
仮定 1,2 の代わりに, ネットワーク通信路につぎの仮定を設ける.
仮定 3 最大 m + 1 ∈ Z+ 回のうち 1 回は, 補償器と制御対象間, 制御対象と補償器
(推定器) 間の両通信路上でデータ損失が生じないタイミングがある. (α, β = 1).
3.6.2 対処法
まず, 制御入力の損失に対しては, 過去に届いたなかで最新の入力を再利用する
といった同様の手法を用いる. つぎに, 観測信号の損失に対しては, 仮定 2 が成立
しないため, 推定器 (6) を用いて対処することができない. そこで, 観測信号が損
失した (β = 0) 場合, 補償器は入力を送信せず, 強制的に制御入力が損失した状況
をつくる. これにより, 観測信号の損失を制御入力の損失とみなすことができる.
+
また, 制御入力が届かない状況が連続した回数を ρ ∈ Z+
m とすると, この ρ ∈ Zm
(ρ ≤ m) と制御入力を無事に受信した時刻 τi ∈ Z+ との関係は,
τi+1 − τi = (k + 1 + ρ[i] − k)h = (1 + ρ[i])h, ∀i ∈ Z+
(20)
と表される. ただし, τ0 = 0 とする. これによって, このネットワーク型制御系は,
x(τi+1 ) = (Aρ[i] + Bρ[i] G)x(τi )
35
と記述できる. ただし,
Aρ := A1+ρ ,
Bρ :=
ρ
Aρ−l B
l=0
である.
よって, m + 1 個のサブシステムを有する切替え制御系とみなせるため, 本章で
議論した手法を適用することが可能となる.
3.7 まとめ
本章では,データ損失の発生するネットワーク通信路を含む制御系を考え,そ
の安定化手法について考察した.制御入力の損失に対しては,直前の信号を再利
用し,また,フィードバック情報の損失に対しては,情報の復元を目的とした推
定器を用いることで,ネットワーク型制御系の設計問題がある種の切替え制御系
の設計問題と等価になることを示した.また,その設計法より得られた制御系は,
有界な外乱が発生する場合でも,安定になることを確認した.そして,数値例を
用いて提案法の有効性を確認した.
36
4. ネットワーク型制御系の簡易設計法
4.1 あらまし
第 3 章では, ネットワーク型制御系の設計問題が, サンプリング周期が異なる
サンプル値系をサブシステムにもつ切替え制御系 (図 8) の設計問題と等価である
ことを示した. さらに, 共通 Lyapunov 関数 [19] を用いることで, ネットワーク型
制御系の安定化が可能であるための十分条件を, 連立 LMI の可解条件として与え
ることができた.
実際にいくつかの数値例で検討してみたところ, サンプリング周期を短かくす
れば, 連立 LMI に解が存在し, 所望の状態フィードバックゲインが得られること
が分かった. しかし, 一般に多くの LMI 条件を連立させた場合, 共通解を持つこ
とは稀であるので, これが何らかの必然性に基づくものかどうかは興味深い問題
である. そこで本章では, この必然性を解明するため, サンプリング周期が異なる
サンプル値系をサブシステムにもつ切替え制御系の安定性とサンプリング周期の
関係について議論し, 切替え制御系が安定となる条件を導出する. また, その条件
をもとに, 大きな LMI 条件を解く必要のない簡易な安定化補償器の設計法を提案
する.
まず, 本章では, スカラーのシステム (一次元のシステム) に限定して, 切替え
制御系の安定性について議論を行い, つぎに, それを一般の多次元システムに拡張
する. また, それぞれのシステムに対する安定化補償器の簡易設計法を提案し, 数
値例によりその有効性を検証する.
4.2 問題設定
4.2.1 切替え制御系
本章では, サンプリング周期が異なるサンプル値系をサブシステムにもち, 不
規則に切替えが起きる切替え制御系の安定性について議論する. このブロック線
図を図 14 に示す. 連続時間の制御対象とデジタルコントローラが, サンプリング
37
周期 hi で動作するサンプラ ( 図 14 中の S ) と零次ホールド ( 図 14 中の H ) に
よって連結されている. 制御対象の状態空間表現が
ẋ(t) = Ac x(t) + Bc u(t)
(21)
と与えられているとし, (Ac , Bc ) は, 可制御とする. ここで, x ∈ Rnx , u ∈ Rnu は,
それぞれ状態量, 制御入力である. デジタルコントローラは, 状態フィードバック
u[k] = Gx[k]
とする. 図 14 の零次ホールド (図 14 中の H) 手前からサンプラ (図 14 中の S)
の後ろまでの各サブシステムの離散ダイナミクスは,
x[k + 1] = Ai x[k] + Bi u[k],
Ai = eAc hi ,
hi
Ac τ
Bi =
e dτ Bc
(22)
(23)
0
となる. ここで, サンプリング周期 hi は,
hn > hn−1 > · · · > h2 > h1 > 0
(24)
と定義する. ここで, i ∈ Z+
n \ 0 は, ランダムに決定される変数である. つぎに行
列値関数 (22), (23) をテイラー展開する.
1
1
Ai = I + Ac hi + A2c h2i + A3c h3i + · · ·
2
3!
1
1
Bi = Bc hi + Ac Bc h2i + A2c Bc h3i + · · ·
2
3!
このとき, 閉ループ系は,
1
1
Ai + Bi G = I + Ac hi + A2c h2i + A3c h3i + · · ·
2
3!
1
2
+ Bc Ghi + Ac Bc Ghi + · · ·
2
= Â(hi ) + Δ(hi )
38
(25)
Controller
H
S
h2
Plant
S
h3
Plant
S
Plant
S
ä
Plant
ä
H
h1
ä
H
H
hn
図 14 サンプリング周期が異なるサブシステムにもつ切替え制御系
と表せる. ここで,
Â(hi ) = I + (Ac + Bc G)hi
1
1
Δ(hi ) = Ac (Ac + Bc G)h2i + · · · + Ak−1
(Ac + Bc G)hki + · · ·
2
k! c
(26)
(27)
である. 以上より, 切替え制御系は,
x[k + 1] = (Â(hi ) + Δ(hi ))x[k],
i ∈ Z+
n \0
(28)
と記述できる.
(27) 式の Δ ( テイラー展開の二次以上の項 ) を無視した
x[k + 1] = Â(hi )x[k],
i ∈ Z+
n \0
(29)
を切替え制御系 (28) に対する (一次) 近似システムとする. また, この (一次) 近
似システムに対して, 切替え制御系 (28) を実システムと呼ぶことにする. 本章で
は, 切替え制御系 (28) の安定性を解析する.
39
4.2.2 ネットワーク型制御系との関係
第 3 章で提案した手法より, ネットワーク型制御系を (9) 式として記述できる.
これは, データ損失の連続回数 σ に応じて切替えが起きる制御系である. また, こ
のサブシステムは, サンプリング周期が異なるサンプル値系となっており, 各サブ
システムのサンプリング周期とデータ損失の連続回数 σ の関係は, (8) 式に従う.
以上より, ネットワーク型制御系 (9) は, 切替え制御系 (28) の一クラスであるこ
とが分かる.
4.3 スカラーシステム
本節では, スカラーシステム (x ∈ R, u ∈ R) に限定し, 切替え制御系 (28) の安
定性を解析する.
4.3.1 安定性の条件
スカラーシステムの性質として, つぎの補題を導ける.
補題 1 切替え制御系 (28) がスカラーシステムの場合, 可換条件
{Â(hi )+Δ(hi )}{Â(hj )+Δ(hj )} = {Â(hj )+Δ(hj )}{Â(hi )+Δ(hi )},
∀i, j ∈ Z+
n \0
が成立する.
(証明) {Â(hi ) + Δ(hi )} ∈ R, ∀i ∈ Z+
n \ 0 であるため, 自明である.
補題 1 より, 各サブシステム (サンプル値系) の同時安定化と切替え制御系の
安定化は同値であるので [16, 17], 以降では, 同時安定化について議論を行う. こ
のとき, つぎの定理が成り立つ.
定理 6 hn > 0 が与えられたとき, 制御対象 (21) について, hn 以下のサンプリン
グ周期をもつサンプル値系が G によって同時安定化できるための必要十分条件
は, Ac = 0 のとき,
−
2Ac
< Ac + Bc G < 0
eAc hn − 1
40
(30)
となることであり, Ac = 0 のとき,
−2 < hn Bc G < 0
(31)
となることである.
(証明) 周期 hi のサンプル値系が安定であることは, 以下の各条件と等価である.
−1 < Â(hi ) + Δ(hi ) < 1
1
1
⇔ −1 < 1 + Ac hi + Bc Ghi + A2c h2i + Ac Bc Gh2i + · · · < 1
2
2
1
⇔ −2 < (Ac + Bc G)hi + Ac h2i (Ac + Bc G) + · · · < 0
2
1
1
⇔ −2 < (hi + Ac h2i + A2c h3i + · · · )(Ac + Bc G) < 0
2
3!
(32)
Ac = 0 ならば, (32) 式は,
−2 <
eAc hi − 1
(Ac + Bc G) < 0
Ac
と等価であり, 常に (eAc hi − 1)/Ac > 0 なので,
−
2Ac
< Ac + Bc G < 0
eAc hi − 1
(33)
に等しい. また (24) 式より
−
2Ac
2Ac
< − Ac h n
−1
e
−1
eAc hi
なので, (30) 式が成り立てば, hn 以下の hi についても不等式 (33) が成り立つ. ま
た, Ac = 0 ならば, (32) 式は,
−2 < hi Bc G < 0
となるから, (31) 式が成り立てばよい.
41
4.3.2 簡易設計法
定理 6 より, 切替え制御系 (28) が安定となるための必要十分条件を導出した.
この条件をもとに, スカラーシステム (x ∈ R, u ∈ R) のネットワーク型制御系 (7)
(または (9)) を安定化する補償器の簡易設計法を以下に示す.
スカラーシステムに対する安定化補償器の簡易設計法 ステップ 1 :
仮定 1 と (8) 式より, hn を導出する.
ステップ 2 :
(30) 式もしくは (31) 式の範囲内に, 制御対象 (4) の極を配置す
る補償器 G を設計する.
注意 7 ( 定理 6 について )
定理 4 は, ネットワーク型制御系が安定となるための十分条件である. 一方, 定
理 6 は, ネットワーク型制御系が安定となるための 必要十分条件 である.
4.3.3 サンプリング周期の上限
前節では, あるサンプリング周期の変動の最大値 hn を与えたとき, 系全体を安
定化する補償器の設計について議論した. 反対に, 制御対象 (4) を安定化するあ
る補償器 G を与えれば, その補償器を用いた際, 系全体が安定となるサンプリン
グ周期の変動の上限 hmax を解析的に導出できる.
命題 2 制御対象 (4) を安定化する補償器 G を用いた際, ネットワーク型制御系
(9) の安定性を保証できるサンプリング周期の変動の上限 hmax は, Ac = 0 のとき,
hmax =
1
{ln(−Ac + Bc G) − ln(Ac + Bc G)}
Ac
であり, Ac = 0 のとき
hmax = −
である.
42
2
Bc G
(34)
(35)
(証明) まず, Ac > 0 のときを考える. Ac + Bc G < 0 に注意すると, (30) 式
より,
− 2Ac < (eAc hn − 1)(Ac + Bc G) < 0
⇔ − 2Ac < (Ac + Bc G)eAc hn − (Ac + Bc G) < 0
⇔ − Ac + Bc G < (Ac + Bc G)eAc hn < Ac + Bc G
⇔
−Ac + Bc G
Ac + Bc G
< eAc hn <
Ac + Bc G
Ac + Bc G
⇔ 0 < Ac hn < ln(−Ac + Bc G) − ln(Ac + Bc G)
1
⇔ 0 < hn <
{ln(−Ac + Bc G) − ln(Ac + Bc G)}
Ac
を導出できる. つぎに, Ac < 0 のときを考える. 同様に, Ac + Bc G < 0 に注意す
ると, (30) 式より,
0 < (eAc hn − 1)(Ac + Bc G) < −2Ac
⇔ 0 < (Ac + Bc G)eAc hn − (Ac + Bc G) < −2Ac
⇔ Ac + Bc G < (Ac + Bc G)eAc hn < −Ac + Bc G
⇔
Ac + Bc G
−Ac + Bc G
< eAc hn <
Ac + Bc G
Ac + Bc G
⇔ ln(−Ac + Bc G) − ln(Ac + Bc G) < Ac hn < 0
1
⇔ 0 < hn <
{ln(−Ac + Bc G) − ln(Ac + Bc G)}
Ac
を導出できる. 以上より, Ac = 0 のとき, 制御対象 (4) を安定化するある補償器
G を用いた際のサンプリング周期の変動の上限 hmax は, (34) 式となる. また,
Ac = 0 のときの hmax は, (31) 式より自明である.
43
4.4 多次元システム
本節では, 多次元システム (x ∈ Rnx , u ∈ Rnu ) の切替え制御系 (28) の安定性を
解析する. 解析の流れは, (一次) 近似システム (29) の性質に注目し, この系が安
定となる条件を導出する. そして, その条件をもとに切替え制御系 (28) が安定と
なる条件を導出する. 最後に, 以上の議論をまとめて, ネットワーク型制御系 (9)
を安定化する補償器の簡易設計法を示す.
4.4.1 (一次) 近似システムの安定性
(一次) 近似システム (29) の性質として, つぎの補題を導ける.
補題 2 (一次) 近似システム (29) に対して, 可換条件
Â(hi )Â(hj ) = Â(hj )Â(hi ),
∀i, j ∈ Z+
n \0
(36)
が成立する.
(証明) (26) 式より, (36) 式の左辺を展開すると,
(左辺) = Â(hi )Â(hj )
= {I + (Ac + Bc G)hi }{I + (Ac + Bc G)hj }
= {I + (Ac + Bc G)hi + (Ac + Bc G)hj + (Ac + Bc G)2 hi hj }
= {I + (Ac + Bc G)hi + (Ac + Bc G)hj + (Ac + Bc G)2 hj hi }
= {I + (Ac + Bc G)hj }{I + (Ac + Bc G)hi }
= Â(hj )Â(hi )
∀i, j ∈ Z+
n \0
= (右辺)
となる. よって, 可換条件 (36) が成立する.
補題 2 より, (一次) 近似システム (29) の各サブシステムの同時安定化と系全体
の安定化は同値であるため [16, 17], 同時安定化を考える. このとき, つぎの補題
が成り立つ.
44
補題 3 つぎの条件 (i), (ii) を満たす補償器 G により, (一次) 近似システム (29)
のサブシステムは, 同時安定化可能である.
(i)
Ac + Bc G の固有値の実部を負に配置
(ii) Â(hn ) のすべての固有値を単位円内に配置
(証明) 補償器 G が制御対象 (21) を連続時間の意味で安定化しているとする.
このとき, 極形式で
λk (Ac + Bc G) = rk ejθk
rk , θk ∈ R, rk > 0, π/2 < θk < 3π/2 と表される. また, 極形式において, j は虚数
単位とする. したがって
λk (Â(hi )) = 1 + rk hj ejθk ,
i ∈ {1, 2, · · · n}
となり, Â(hi ) の固有値は, 図 15 中の点 S0 := 1 + j0 を始点とする矢印上に位置
し, S0 との距離は, hi > 0 に比例する. さらに偏角 θk の範囲から, この矢印と単
位円は, S0 以外の交点を必ず持つため, λk (Âc (hi )) が単位円内に入るような区間
0 < hi < h̄k が存在する.
したがって h̄min = mink h̄k とすると, 区間 [0, h̄min ] において Âc (hi ) の固有値は
すべて単位円内に入る. ここで, hn < h̄min であれば, (24) 式より, (一次) 近似シ
ステム (29) のサブシステムは, 同時安定化可能である.
以上より, ある補償器が補題 3 の条件を満足しているとすると, すべてのサブ
システムは, 安定となり, 補題 2 より, 可換条件が成り立っているため, (一次) 近
似システムは, 安定であることが分かる.
また, 文献 [16] では, サブシステムがすべて安定で可換条件が成立している切
替え制御系のすべてのサブシステムに対して, 共通 Lyapunov 関数は, 必ず存在
し, 数値最適化問題を解かずに逐次計算で導出が可能であることが示されている
(定理 3). つまり, この (一次) 近似システム (29) のすべてのサブシステムに対す
る共通の Lyapunov 解は, 必ず存在する. ここで, この共通解を Pap ∈ Rnx ×nx と
45
Im
1
^ i))
λk (A(h
hi
→
0
0
S0
1 Re
hi
→
0
-1
θk
^ i))
λk’(A(h
-1
図 15 (一次) 近似システムの極の漸近的性質
定義しておく. 次節では, この共通解 Pap ∈ Rnx ×nx を用いて, 切替え制御系 (28)
の安定性について議論を行う.
注意 8 ( サンプリング周期と連立 LMI の解との関係 )
ネットワーク型制御系 (7) (または (9)) に対し共通 Lyapunov 関数を用いて補
償器を設計したところ, 本制御問題においては, 多くの LMI 条件を連立させても,
サンプリング周期を短くすれば解の存在が数値例により確かめられていた. この
理由は, つぎのように解釈することができる. 第 4.2.2 節より, このネットワーク
型制御系は, 切替え制御系 (28) の一クラスであることが分かる. この切替え制御
系において, サンプリング周期を短くすると, (27) 式の Δ は,
Δ(hi ) → 0,
hi → 0
となるため, (一次) 近似システム (29) に漸近していく. この (一次) 近似システム
のすべてのサブシステムに対しては, 共通の Lyapunov 解 Pap が必ず存在するこ
46
とを示した. よって, サンプリング周期を短くすると, 連立 LMI の解が存在しや
すくなったと考えられる.
4.4.2 実システムの安定性
前節では, (一次) 近似システム (29) の性質に注目し, この (一次) 近似システム
が安定となる条件を導出した. 本節では, (27) 式の Δ の項を含んだ実システムで
ある切替え制御系 (28) の安定性解析をする. 切替え制御系 (28) が安定となる条
件として, つぎの定理を導ける.
定理 7 (一次) 近似システム (29) が安定であるとする. そのとき, つぎの不等式
を満たせば, 切替え制御系 (28) は, 安定である.
(Â(hi ) + Δ(hi ))T Pap (Â(hi ) + Δ(hi )) − Pap < 0,
∀i ∈ Z+
n
(37)
ただし, Pap は, (一次) 近似システム (29) のすべてのサブシステムに対する共通
の Lyapunov 解である.
(証明) (一次) 近似システム (29) は, 補題 2 より可換条件が成り立つことが分
かる. これより, (一次) 近似システムが安定であるとすると, この (一次) 近似シ
ステムのすべてのサブシステムに対する共通の Lyapunov 解 Pap は, 必ず存在す
る. ここで, (37) の不等式が成立するとは, Pap が切替え制御系 (28) のすべての
サブシステムに対する共通の Lyapunov 解となる. よって, 切替え制御系 (28) は,
安定である.
4.4.3 簡易設計法
前節までの議論をまとめて, 多次元システム (x ∈ Rnx , u ∈ Rnu ) のネットワー
ク型制御系 (7) (または (9)) を安定化する補償器の簡易設計法のフローチャート
を図 16 に, 各ステップの詳細を以下に示す.
47
多次元システムに対する安定化補償器の簡易設計法 ステップ 1 :
任意の k に対して
λk (Ac + Bc G) = rk ejθk
rk , θk ∈ R, rk > 0, π/2 < θk < 3π/2 となるように補償器 G を設
計する.
(Ac + Bc G のすべての固有値の実部を負に配置する G の設計)
ステップ 2 :
Â(hn ) のすべての固有値を単位円内に配置できているかを判定す
る. すべての固有値が単位円内なら, ステップ 3 へ.
一つでも単位円外の固有値があれば, ステップ 5 へ.
ステップ 3 :
(一次) 近似システム (29) のすべてのサブシステムに対する共通
Lyapunov 解 Pap を導出する.
ステップ 4 :
定理 7 で示した切替え制御系 (28) の安定性に関する不等式 (37)
の判定を行う. 不等式が不成立なら, ステップ 5 へ.
成立しているなら終了し, このときの G がネットワーク型制御系
(7)(または, (9)) を安定化する補償器である.
ステップ 5 :
rk をより短く設定する. または, θk をより π の値に近づける
(k ∈ {1, · · · , nx }). このとき, 任意に決定した微小な値 ∈ R に
対して, > rk > 0, ∀k を満足すれば, ステップ 7 へ.
満足しなければ, ステップ 6 へ.
ステップ 6 :
ステップ 5 で設定した rk , θk を用いて, 任意の k に対して,
λk (Ac + Bc G) = rk ejθk
となるように補償器 G を再設計する.
ステップ 7 :
サンプリング周期 h を短くする.
48
㛤ጞ
ࢫࢸࢵࣉ㸵
ࢫࢸࢵࣉ㸴
ࢫࢸࢵࣉ㸯
ࢫࢸࢵࣉ㸰
No
Yes
ࢫࢸࢵࣉ㸳
ࢫࢸࢵࣉ㸱
Yes
No
ࢫࢸࢵࣉ㸲
Yes
⤊஢
図 16 簡易設計法のフローチャート
49
No
注意 9 ( 安定化補償器の簡易設計法について )
安定化補償器の簡易設計法のフローチャート ( 図 16 ) は, とても複雑に見える
が, 設計としては, ステップ 1, または, ステップ 6 にて極配置を用いた補償器の
設計を行っているだけであり, 他のステップでは, 不等式の判定や変数の更新など
を行っているだけである. よって, このような点から簡易設計法になっているこ
とが分かる.
50
4.5 数値例
本章で示した安定化補償器の簡易設計法を用いて, ネットワーク型制御系の数
値例を行い, この設計法の有効性を検証する. まず, 例題 3 としては, 文献 [2] で
紹介されている不安定なスカラーシステムを用いた場合, 例題 4 としては, 不安
定な二次の制御対象を用いた場合のネットワーク型制御系の数値例を示す.
なお, ネットワークの条件として, 仮定 1, 2 を設ける. また, 仮定 2 のもと推
定器 (6) を用いることにより, 観測信号の損失を考慮する必要がなくなるため, 本
数値例では, 制御入力の損失だけを発生させた. このデータ損失の発生は, ある実
数 0 < a < 1 に対し,
P r(α[k] = 0) = a,
P r(α[k] = 1) = 1 − a,
k ∈ Z+
の確率過程で与えられるとする [1, 2, 5].また,この確率過程に対して,仮定 1
を満たさなければならないので,本数値例では,n を超える連続のデータ損失が
発生する場合は,強制的に n で打ち切ることにした.
4.5.1 スカラーシステムの例
例題 3 : 文献 [2] で紹介されている離散時間システム
x[k + 1] = 2x[k] + u[k] + w[k], k ∈ Z+
を制御対象の離散ダイナミクスとし, サンプリング周期 10 [ms] で数値例を行な
う. 外乱 w は,平均値が 0,分散が 1 の白色ノイズ ( 注意 5 参照 ) とした.ま
た,a = 0.4,b = 0 とし,補償器と制御対象間でデータ損失が連続して発生する
最大回数を n = 5 と決定した.
本数値例では, 第 4.3.2 節で示した簡易設計法に基づいた安定化補償器を用いた
場合とデータ損失を考慮せず制御対象のみを安定化する補償器を用いた場合の数
値例を比較をする. サンプリング周期を 10 [ms], ネットワーク通信路上で連続し
てデータ損失が起きる最大回数を n = 5 としているので, (8) 式より, hn = 60[ms]
51
となる. この値を定理 6 の (30) 式に代入すると, ネットワーク型制御系を安定化
可能な極配置の範囲を
−2.2005 < Ac + Bc G < 0
(38)
と導出できる. ここで, 簡易設計法に基づいた安定化補償器を用いた場合とは,
(38) 式の範囲内に制御対象 (4) の極を配置する補償器
G = −1.0289
を用いた場合であり, その時間応答を図 18 に示す. 一方, データ損失を考慮せ
ず制御対象のみを安定化する補償器を用いた場合とは, 制御対象 (4) を安定化し,
(38) 式の範囲外に極を配置する補償器
G = −1.7213
を用いた場合であり, その時間応答を図 17 に示す. 図中の “◦” は,補償器と制御
対象間のネットワーク線上で発生したデータ損失を表す.
図 17 では, 制御対象を安定化しているにも関わらず, 状態の時間応答, 入力の
時間応答ともにデータ損失の影響でインパルス的に激しく振動していることが分
かる. 一方, 図 18 に注目すると, 白色ノイズ w を印加しているため, 多少振動的
になっているが, データ損失の影響で生じるインパルス的な振動を抑制できてい
ることが分かる.
以上から,データ損失が発生するネットワーク型制御系設計 (スカラーシステ
ムの場合) に対して,安定化補償器の簡易設計法が有効であることを数値例によ
り確認した.
52
,QSXW
,QSXW
̻
̻
7LPH
>V@
7LPH>V@
(a) input
6WDWH
6WDWH
̻
̻
7LPH
>V@
7LPH>V@
(b) state
図 17 制御対象の安定化だけを考慮し補償器を設計した場合 (スカラーシステム)
53
,QSXW
,QSXW
̻
̻
7LPH
>V@
7LPH>V@
(a) input
6WDWH
6WDWH
̻
̻
7LPH
>V@
7LPH>V@
(b) state
図 18 簡易設計法に基づいて補償器を設計した場合 (スカラーシステム)
54
4.5.2 多次元システムの例
例題 4 : 不安定な二次の制御対象
2 2
4
ẋ(t) =
x(t) +
u(t)
3 2
3
を用いて数値例を行う. サンプリング周期を 10 [ms] とすると, この制御対象の離
散ダイナミクスは,
1.0205 0.0204
0.0407
1
x[k + 1] =
x[k] +
u[k] +
w[k]
0.0306 1.0205
0.0309
1
(39)
となる. 数値例では, 有界な外乱を印加したときの時間応答を調べるため, 平均値
が 0,分散が 1 の白色ノイズ w ( 注意 5 参照 ) を加えた. また,a = 0.5,b = 0
とし,補償器と制御対象間でデータ損失が連続して発生する最大回数を n = 10
と決定した.
本数値例では, 第 4.4.3 節で示した簡易設計法に基づいた安定化補償器を用い
た場合とデータ損失を考慮せず制御対象のみを安定化する補償器を用いた場合の
数値例を比較をする. 簡易設計法に基づいた安定化補償器を用いた場合とは, 図
16 の流れに沿って設計した補償器
G = [−0.2000
− 3.7333 ]
(40)
を用いた場合であり, そのときのネットワーク型制御系 (9) の全サブシステムの
極を図 20 と表 2 に, その時間応答を図 22 に示す. 一方, データ損失を考慮せず制
御対象のみを安定化する補償器を用いた場合とは, つぎの補償器
G = [41.4000
− 69.8667 ]
(41)
を用いた場合であり, そのときのネットワーク型制御系 (9) の全サブシステムの
極を図 19 と表 1 に, その時間応答を図 21 に示す. 時間応答の図中の “◦” は,補
償器と制御対象間のネットワーク線上で発生したデータ損失を表す.
補償器 (40) (41) を用いたときのネットワーク型制御系 (9) の全サブシステムの
極に注目すると, どちらもサンプリング周期 hi を小さくしていくと, 極が 1 + j0
55
へ漸近していくことが分かる. また, 図 19 に注目すると, サンプリング周期が最
も短いサブシステム (制御対象の離散ダイナミクス (39)) の極は, 単位円内にある
が, サンプリング周期が大きいサブシステムの極が単位円外に配置されているこ
とから, 補償器 (41) は, データ損失を考慮せず制御対象のみを安定化しているこ
とが確認できる.
時間応答に注目すると, 図 21 では, 制御対象を安定化しているにも関わらず,
状態の時間応答, 入力の時間応答ともにデータ損失の影響でインパルス的に激し
く振動していることが分かる. 一方, 図 22 では, 白色ノイズ w を印加しているた
め, 多少振動的になっているが, データ損失の影響で生じるインパルス的な振動を
抑制できていることが分かる.
以上から,データ損失が発生するネットワーク型制御系設計 (多次元システム
の場合) に対しても,安定化補償器の簡易設計法が有効であることを数値例によ
り確認した.
56
hЍ
i
Imaginary axis
1
0
hЍ
i
-1
-1
0
Real axis
1
図 19 G = [41.4000 − 69.8667 ] を用いた場合の全サブシステムの極
hЍ
i
Imaginary axis
1
0
hЍ
i
-1
-1
0
Real axis
1
図 20 G = [−0.2000 − 3.7333 ] を用いた場合の全サブシステムの極
57
表 1 各サブシステムのサンプリング周期と極 (G = [41.4000 − 69.8667 ])
サンプリング周期 [ms]
固有値
10
0.8 + 0.1i
0.8 - 0.1i
20
0.6 + 0.2i
0.6 - 0.2i
30
0.4 + 0.3i
0.4 - 0.3i
40
0.2 + 0.4i
0.2 - 0.4i
50
0 + 0.5i
0 - 0.5i
60
-0.2 + 0.6i
-0.2 - 0.6i
70
-0.4 + 0.7i
-0.4 - 0.7i
80
-0.6 + 0.8i
-0.6 - 0.8i
90
-0.8 + 0.9i
-0.8 - 0.9i
100
-1 + 1i
-1 - 1i
110
-1.2 + 1.1i
-1.2 - 1.1i
表 2 各サブシステムのサンプリング周期と極 (G = [−0.2000 − 3.7333 ])
サンプリング周期 [ms]
固有値
10
0.96 + 0.02i
0.96 - 0.02i
20
0.92 + 0.04i
0.92 - 0.04i
30
0.88 + 0.06i
0.88 - 0.06i
40
0.84 + 0.08i
0.84 - 0.08i
50
0.8 + 0.1i
0.8 - 0.1i
60
0.76 + 0.12i
0.76 - 0.12i
70
0.72 + 0.14i
0.72 - 0.14i
80
0.68 + 0.16i
0.68 - 0.16i
90
0.64 + 0.18i
0.64 - 0.18i
100
0.6 + 0.2i
0.6 - 0.2i
110
0.56 + 0.22i
0.56 - 0.22i
58
x1
[
50
0
̻
-50
0
5
Time
[s]
7LPHb>V@
10
(a) x1 の時間応答
[
x2
50
0
̻
-50
0
5
7LPH
Time>V@
[s]
10
(b) x2 の時間応答
200
X
u
0
̻
̻
-200
0
5
7LPH
Time>V@
[s]
10
(c) u の時間応答
図 21 制御対象の安定化だけを考慮し補償器を設計した場合 (多次元システム)
59
50
x1
[
0
̻
-50
0
5 7LPH
Time>V@
[s]
10
(a) x1 の時間応答
[
x2
50
0
̻
-50
0
5
7LPH
Time>V@
[s]
10
(b) x2 の時間応答
200
X
u
0
̻
̻
-200
0
5
7LPH
Time>V@
[s]
10
(c) u の時間応答
図 22 簡易設計法に基づいて補償器を設計した場合 (多次元システム)
60
4.6 まとめ
本章では, 第 3 章の設計法にて疑問となったサンプリング周期と連立 LMI の解
の関係を解明するため, サンプリング周期が異なるサンプル値系をサブシステム
にもつ切替え制御系の安定性とサンプリング周期の関係について議論した. 解析
の流れとして, まずスカラーシステム (一次元のシステム) に限定し議論を行い,
つぎに, それを多次元システムに拡張した. そして, 導出した切替え制御系が安定
となる条件をもとに, 大きな LMI 条件を解く必要のないネットワーク型制御系に
対する簡易な安定化補償器の設計法を提案し, 数値例にて簡易設計法の有効性を
確認した.
61
5. 制御性能を考慮したネットワーク型制御系
5.1 あらまし
第 3 章では, データ損失が発生するネットワーク型制御系の設計問題を考え,
この系を安定化する補償器の設計法を提案した. 第 4 章では, このネットワーク
型制御系のもつ性質に注目し, 安定性の解析を行った. しかし, 実際に制御系を実
装する際, 安定化だけでなくサーボ系の構成や制御性能を求められることがある.
そこで本章では, この系に対して安定化だけでなく制御性能を付加することを考
える. まず第 5.2 節で, サーボ系へ拡張する方法を示し, つぎに第 5.3 節で, ノル
ム性能を考慮した補償器の設計法を示す.
5.2 サーボ系への拡張
5.2.1 設計問題
(4) 式の制御対象を用いて, その離散ダイナミクスを (5) 式の代わりに
x[k + 1] = Ax[k] + Bu[k] + Bd w,
k ∈ Z+
(42)
と記述する. ただし, w ∈ Rnw は定値外乱, (A, B) は可制御対であり, 状態はすべ
て観測可能とする. また, 評価出力 z ∈ Rnz を
z[k] = Cx[k]
とする. つぎに, ネットワーク環境として, 仮定 3 ( 最大 m + 1 ∈ Z+ 回のうち 1
回は, 補償器と制御対象間, 制御対象と補償器 (推定器) 間の両通信路上で同時に
データ損失が生じない. ) を設ける.
制御目的は, 仮定 3 を満たすネットワーク通信路を介し,
z[k] −→ r,
62
k −→ ∞
(43)
を達成するネットワーク型制御系を設計することである. ここで, r ∈ Rnz は, 参
照値ベクトルであり, nu ≥ nz とする. また, つぎの条件
A−I B
= nx + nu
rank
C
0
(44)
が成立するとする. これは, 制御目的 (43) が物理的に可能とすると, ある状態 x∞
と入力 u∞ が確定し
−Bd w
=
A−I B
C
r
0
x∞
u∞
の関係を満足しているはずである. したがって, どのような w と r に対しても,
x∞ と u∞ が定まる (制御目的を達成する) には, 条件 (44) が成立する必要がある
[24].
5.2.2 サーボ系の構成法
制御目的 (43) を達成するために, 状態フィードバック
u[k] = Gx[k] + GI
k z[τ ] − r
τ =0
を考える. ここで, G ∈ Rnu ×nx , GI ∈ Rnu ×nz は, 状態フィードバックゲインであ
り, 新しい状態量 xI ∈ Rnz を
xI [k + 1] − xI [k] := z[k] − r
(45)
とする. 式 (42), (45) をあわせて, 拡大系
x[k + 1]
xI [k + 1]
=
A 0
C I
x[k]
+
xI [k]
u[k] = Ĝ
63
B
0
x[k]
xI [k]
u[k] +
Bd w
−r
(46a)
(46b)
ρ
Controller
1
Z
1
Z
r
−
xI
1
Z
GI
w
ζ
Plant
Bd
u
x
1
Z
B
G
z
C
A
図 23 ネットワーク型制御における拡大系のブロック線図
を構成する. ただし, Ĝ =
G GI
である.
つぎに, 仮定 3 を満たすネットワークを介して制御系を構成するため, 第 3.6.2
節で説明した対処法 ( 制御入力が損失した場合, 過去に届いたなかで最新の入力
を再利用し, 観測信号が損失した場合, 補償器は入力を送信せず, 強制的に制御入
力が損失した状況をつくる. ) を用いる. そこで, 制御入力を制御対象が受信した
かどうかを 0 − 1 離散値変数 η で表しておく.
η[k] ∈ {0, 1},
k ∈ Z+
ここで,η[k] = 0 は,時刻 k に制御対象が制御入力を受信しないこと,η[k] = 1
は,制御入力を受信することを意味する.
この η と拡大系 (46) より, ネットワーク型制御における拡大系 (図 23) を
x[k + 1]
xI [k + 1]
=
A 0
C I
x[k]
xI [k]
+ η[k]
B
0
+ (1 − η[k])
64
u[k]
B
0
ζ[k] +
Bd w
−r
(47a)
u[k] = Ĝ
x[k]
(47b)
xI [k]
ζ[k + 1] = (1 − η[k])ζ[k] + η[k]u[k]
(47c)
と定式化できる. ここで, ζ ∈ Rnu は, 制御対象に到着したなかで最新の制御入力
を記憶させておくための変数であり, (47c) 式がその更新規則をあらわす. 制御目
的 (43) が達成されたとき,
x∞
x∞
A 0
B
u∞
=
+ η[k]
C I
0
xI∞
xI∞
B
Bd w
+ (1 − η[k])
ζ∞ +
0
−r
u∞ = Ĝ
x∞
(48a)
(48b)
xI∞
ζ∞ = (1 − η[k])ζ∞ + η[k]u∞
(48c)
を得る. ここで, x∞ , xI∞ , u∞ , ζ∞ は, それぞれ状態 x, xI , 入力 u, ζ の最終値で,
適切な次元の定数ベクトルである. (47) 式から (48) 式をひくと偏差系
er [k + 1] = Âer [k] + η[k]B̂ Ĝer [k] + (1 − η[k]) B̂ξ[k]
ξ[k + 1] = (1 − η[k]) ξ[k] + η[k]Ĝer [k]
(49b)
としてまとめられる. ここで,
er [k] :=
ex [k]
=
eI [k]
ξ[k] := ζ[k] − ζ∞ ,
A 0
 :=
,
C I
65
x[k] − x∞
xI [k] − xI∞
B̂ =
B
0
(49a)
,
である. また, 制御入力を無事に受信した時刻 τi ∈ Z+ と制御入力が届かない状況
が連続した回数 ρ ∈ Z+
m との関係 (20) (τi+1 − τi = (1 + ρ[i])h) より, 偏差系 (49)
は, 時変なサンプリング周期 (20) を有する制御系
er (τi+1 ) = (Aρ[i] + Bρ[i] Ĝ)er (τi )
(50)
と書き表せる. ただし,
1+ρ
Aρ := A
,
Bρ :=
ρ
Aρ−l B
l=0
である. (50) 式は,ρ に応じて係数行列 Aρ , Bρ がそれぞれ変化することから,
m + 1 個のサブシステムを有する切替え制御系とみなせる.
よって, ネットワーク型制御における偏差系 (50) に対して, 第 3 章, もしくは
第 4 章で議論した補償器の設計法を用いることにより, 制御目的 (43) を達成でき
ることが分かる.
5.2.3 数値例
例題 5 : 前節で示したネットワーク型制御におけるデータ損失を考慮したサー
ボ系の構成法が有効であるかを数値例により検証する.
ネットワークの条件として, 仮定 3 を設ける. 第 3.6.2 節で示した対処法を用
いることにより, 観測信号の損失を制御入力の損失とみなすことができるため, 本
数値例では, 制御入力の損失だけを発生させた. このデータ損失の発生は, ある確
率 a に対し,
P r(α[k] = 0) = a,
P r(α[k] = 1) = 1 − a,
k ∈ Z+
の確率過程で与えられるとする [1, 2, 5].また,この確率過程に対して,仮定 3 を
満たさなければならないので,m 回以上データ損失が連続して発生する場合は,
強制的に m で打ち切ることにした.
文献 [2] で紹介されている離散時間システム
x[k + 1] = 2x[k] + u[k] + w,
66
k ∈ Z+
を制御対象の離散ダイナミクスとし, サンプリング周期 10 [ms] で数値例を行な
う. 評価出力は,
z[k] = x[k],
k ∈ Z+
とし, 制御目的として,
z[k] −→ r,
k −→ ∞
(51)
を考える. ここで, r は参照値, 外乱 w は定値外乱とする. シミュレーション条件
は, r = 5, w = 1 a = 0.4 とし,制御入力が届かない状況が連続した最大回数を
m = 5 と決定した.
本数値例では, 前節で示したデータ損失を考慮してサーボ系を構成した場合と
データ損失を考慮せずサーボ系を構成した場合の数値例を比較をする. データ損
失を考慮してサーボ系を構成した場合, 補償器は,
G = [−1.0319
− 0.008 ]
となる. 補償器の設計に関しては, 第 3 章で示した設計法を用いる. この補償器
を用いた場合の時間応答を図 25 に示す. 一方, データ損失を考慮せずサーボ系を
構成した場合, 補償器は,
G = [−2.5920
− 0.5780 ]
となる. この補償器を用いた場合の時間応答を図 24 に示す. 図中の “◦” は,制御
入力が届かなかったタイミング, 点線は, 参照値を表す.
図 24 より, データ損失を考慮せずサーボ系を構成した場合, データ損失の影響
で激しく振動し, 制御目的 (51) を達成できていないことが分かる. 一方, 図 25 よ
り,提案手法であるデータ損失を考慮してサーボ系を構成した場合, データ損失
の影響を抑制し, 制御目的 (51) を達成できていることが分かる.
以上より, 前節で示したネットワーク型制御におけるデータ損失を考慮したサー
ボ系の構成法が有効であることを検証できた.
67
30
20
,QSXW
Input
10
0
̻
-10
̻
-20
-30
̻
0
1
2
7LPH
Time>V@
[s]
3
4
3
4
(a) input
30
20
6WDWH
State
10
0
̻
-10
̻
-20
-30
̻
0
1
2
7LPH
Time>V@
[s]
(b) state
図 24 データ損失を考慮せずサーボ系を構成した場合
68
30
20
,QSXW
Input
10
0
̻
-10
̻
-20
-30
̻
0
1
2
7LPH
[s]
Time>V@
3
4
3
4
(a) input
30
20
6WDWH
State
10
0
-10
̻
-20
̻
-30
̻
0
1
2
7LPH
Time>V@
[s]
(b) state
図 25 データ損失を考慮してサーボ系を構成した場合
69
5.3 ノルム性能の考慮
5.3.1 設計問題
(4) 式の制御対象を用いて, その離散ダイナミクスを (5) 式の代わりに
x[k + 1] = Ax[k] + Bu[k] + Bd w[k],
k ∈ Z+
と記述する. ただし, w ∈ ln2 w を満たす外乱, (A, B) は可制御対であり, 状態はす
べて観測可能とする. また, ネットワーク環境として, 仮定 3 を設ける. この仮定
3 を満たすネットワークを介して制御系を構成するため, 第 3.6.2 節で説明した
対処法を用いる. これにより, 制御入力を無事に受信した時刻 τi ∈ Z+ と制御入
力が届かない状況が連続した回数 ρ ∈ Z+
m との関係 (20) から, ネットワーク型制
御系を
x(τi+1 ) = (Aρ[i] + Bρ[i] G)x(τi ) + B̂ρ[i] wρ[i] (τi )
(52)
と記述できる. ただし,
Aρ := Aρ+1 ,
Bρ :=
ρ
Aρ−l B,
l=0
Aρ−1 Bd · · ·
⎤
w[·]
⎥
w[· + 1] ⎥
⎥
⎥
..
⎥
.
⎥
⎥
w[· + ρ] ⎥
⎦
B̂ρ := [Aρ Bd
⎡
⎢
⎢
⎢
⎢
wρ [·] := ⎢
⎢
⎢
⎢
⎣
ABd
Bd
Onx ×(m−ρ)nw ],
O(m−ρ)nw ×1
である. また, 評価出力 z ∈ Rnz を
z(τi ) = Cx(τi ) + Dwρ[i] (τi )
とする. 制御目的は, 評価関数
z l2 < γ wρ l2 ,
(m+1)nw
wρ ∈ l 2
を満足する補償器を設計することである.
70
,
∀ρ ∈ Z+
m
(53)
5.3.2 補償器の設計
定理 8 仮定 3 が成り立つとする.もし,ネットワーク型制御系 (52) に対し,つ
ぎの線形行列不等式 ( LMI )
⎡
P −1
Aρ + Bρ G B̂ρ
0
⎢
⎢ (A + B G)T
P
0 −C T
ρ
ρ
⎢
⎢
⎢
B̂ρT
0
γI −D T
⎣
0
−C
−D γI
⎤
⎥
⎥
⎥
⎥ > 0,
⎥
⎦
∀ρ ∈ Z+
m
(54)
を満たす G ∈ Rnu ×nx および正定対称行列 P ∈ Rnx ×nx が存在するならば,この G
に対してネットワーク型制御系 (52) は, 制御目的 (53) を達成する.
(m+1)nw
(証明) V (x) = xT P̄ x と定義して, 任意の入力 wρ ∈ l2
に対して,
V (x(τi+1 )) − V (x(τi )) + z(τi )T z(τi ) − γ 2 wρ[i] (τi )T wρ[i] (τi ) < 0,
を満たす対称行列 P̄ > 0 が存在したとすると,
V (x) +
zT z < γ 2
wρT wρ
∀i ∈ Z+ (55)
∀ρ ∈ Z+
m
を得る. これは, V (x) ≥ 0 なので, 評価関数 (53) が成立することを意味する.
そこで, (55) 式を計算すると,
((Aρ[i] + Bρ[i] G)x(τi ) + B̂ρ[i] wρ[i] (τi ))T P̄ ((Aρ[i] + Bρ[i] G)x(τi ) + B̂ρ[i] wρ[i] (τi ))
T
(τi )wρ[i] (τi )
− x(τi )P̄ x(τi ) + (Cx(τi ) + Dwρ[i] (τi ))T (Cx(τi ) + Dwρ[i] (τi )) − γ 2 wρ[i]
< 0,
∀i ∈ Z+
となる. つまり,
(Aρ + Bρ G)T P̄ (Aρ + Bρ G) − P̄ + C T C (Aρ + Bρ G)T P̄ B̂ρ + C T D
B̂ρT P̄ B̂ρ + D T D − γ 2 I
B̂ρT P̄ (Aρ + Bρ G) + D T C
< 0,
−1
∀ρ ∈ Z+
m が成立すればよい. 上式を γ > 0 で割り, P := γ P̄ とすると,
(Aρ + Bρ G)T P (Aρ + Bρ G) − P (Aρ + Bρ G)T P B̂ρ
B̂ρT P (Aρ + Bρ G)
−
CT
D
T
B̂ρT P B̂ρ − γI
(−γ −1 I) C D < 0,
71
∀ρ ∈ Z+
m
と変形できる. これに対し, Schur complement を用いると,
⎡
(Aρ + Bρ G)T P (Aρ + Bρ G) − P (Aρ + Bρ G)T P B̂ρ C T
⎢
⎢
B̂ρT P B̂ρ − γI
DT
B̂ρT P (Aρ + Bρ G)
⎣
C
D
−γI
となる. これを
⎡
P
0 −C T
⎢
⎢ 0
γI −D T
⎣
−C −D γI
⎤
⎡
⎥ ⎢
⎥−⎢
⎦ ⎣
(Aρ + Bρ G)T
B̂ρ
⎤
⎥
⎥ < 0,
⎦
∀ρ ∈ Z+
m
⎤
⎥ ⎥ P Aρ + Bρ G B̂ρ 0 > 0, ∀ρ ∈ Z+
m
⎦
0
と変形し, もう一度 Schur complement を用いると, (54) 式の LMI が得られる.
よって, (54) 式を満たす G ∈ Rnu ×nx および正定対称行列 P ∈ Rnx ×nx が存在す
るならば,この G に対してネットワーク型制御系 (52) は, 制御目的 (53) を達成
する.
注意 10 ( 定理 8 の証明について )
定理 8 の証明は, Bounded Real Lemma の証明を参考に行っている [21].
5.4 まとめ
本章では, データ損失が発生するネットワーク型制御系に対して, 安定化だけで
なく制御性能を付加することを考えた. そこで, 第 5.2 節で, サーボ系へ拡張し,
第 5.3 節で, ノルム性能を考慮した補償器の設計法を示した. どちらも基本的な
補償器の設計指針は, 安定化のみを考えるときとほぼ同じで, 条件式が多少異なる
だけである.
これにより, ネットワーク型制御系に対して安定化だけでなく制御性能を考慮
できるようになったため, より多くのアプリケーションへの適用が可能となった
と期待される.
72
6. おわりに
6.1 本論文のまとめ
本論文では, 制御対象と補償器との間にネットワーク通信路が存在し, その通信
路上を流れるデータに対して損失 ( または棄却 ) のみが生じるネットワーク型制
御系の設計 · 解析を行った. データ損失に関しては, 連続する上限だけを設け, 不
規則に発生する場合を扱った.
提案する手法としては, 損失したデータの代わりに過去に届いた中で最新のデー
タを再利用するという方策を用いて, ネットワーク型制御系をサンプリング周期が
異なるサブシステムを有する切替え制御系へ帰着させた. そこで, 第 3 章では, こ
のネットワーク型制御系に対し切替え制御系の一設計法である共通の Lyapunov
関数を用いて, 安定化が可能であるための十分条件を連立 LMI の可解条件として
与えた. さらに,有界な外乱が発生する状況においても,得られた補償器が系の
安定性を保証することを確認した.また, 数値例により, データ損失を確率的, ま
たは確定的に与えても補償器の有効性を検証できた.
この共通 Lyapunov 関数による設計法において, 連立 LMI の解の存在がサンプ
リング周期の大きさに依存しいることが分かった. そこで, 第 4 章では, この連立
LMI の可解性とサンプリング周期の関係を解明するため, サンプリング周期が異
なるサブシステムを有する切替え制御系の安定性について解析を行った. つぎに,
この系が安定となる条件を導出し, これをもとに, 大きな LMI 条件を解く必要の
ないネットワーク型制御系に対する簡易な安定化補償器の設計法を提案した.
実際に制御系を実装する際, 安定化だけでなくサーボ系の構成や制御性能を求
められることがある. そこで, 第 5 章では, 制御性能を考慮した制御系の設計法へ
拡張を行った. まず, サーボ系への拡張を行い, つぎに, ノルム性能を考慮した補
償器の設計法を提案した. これにより, ネットワーク型制御系に対して安定化だ
けでなく制御性能を考慮できるようになったため, より多くのアプリケーション
への適用が可能となったと期待される.
73
6.2 今後の展望
今後の展望として, 提案する制御系の設計法は, 多少保守的な結果であるため,
この保守性の改善が挙げられる. また, ネットワーク型制御系において問題とな
るのは, データ損失だけではないため, 他の問題の対処法も考え, 本手法との融合
を図っていくべきである. さらに, 実際に多くのアプリケーションに実装し, 提案
法の有効性を検討する余地がある.
74
謝辞
奈良先端科学技術大学院大学で研究を行い, 本論文を執筆できるようになった
のも, 多くの方々のご指導とご支援の賜物であり, ここに感謝の意を表します.
杉本 謙二 教授には, 研究についての有益なご助言, 学会投稿時の丁寧なご添削,
また, ご多忙にも関わらず筆者の発表練習に多くの時間を割いてご指導して頂き
ました. 心より感謝致します.
システム制御・管理講座 西谷 紘一 教授には, ご多忙にも関わらず論文の審査
を引き受けてくださり, 厚く御礼を申し上げます.
平田 健太郎 准教授には, 的確で鋭いご指摘, ご教示を賜りました. 先生と研究
の議論を重ねるたびに, 自分の無知な点を実感していき, それが研究のモチベー
ションに繋がりました. たくさんの有益なご指導, ご助言を頂き, 心より感謝致し
ます.
小木曽 公尚 助教には, 研究の進め方や問題の捉え方など, 何も分からない筆者
を研究者として一から育てて頂きました. 研究活動, ならびに本論文を無事書き
終えることができたのは, 小木曽 助教のおかげであります. 深く感謝致します.
橘 拓至 助教には, 定例研究会などで多くのご意見, ご助言を賜りました. 他の
分野の先生から頂くご指導は, 研究を進める上でたいへん貴重なものでした. 厚
く御礼を申し上げます.
秘書の橋本 洋子 さんには, 事務的な手続きを引き受けてくださり, 研究や学生
生活について常に笑顔で励まして頂きました. また, 修士論文の提出間近の筆者
らにお弁当の差し入れまでして頂きました. とても美味しかったです. ありがと
うございました.
博士後期課程三年 Basel Al-Ali さんには, 筆者の拙い英語を理解し易しい英語
でご助言して頂きました. シュクラン ジャズィーラン. ( たいへんありがとうご
ざいます. ) 博士後期課程三年 加藤 健一 さんには, 研究や学生生活について相
談に乗って頂いただけでなく, 卓球を熱くご指導頂きました. 厚く御礼申し上げ
ます. 博士後期課程二年 中村 幸紀 さんには, 研究で悩んでいると, 筆者と一緒に
なって考えて頂き, 大変為になるご助言を賜りました. 厚く御礼申し上げます. ま
た, ご卒業されました先輩方には, 研究や学生生活など様々な場面においてご指導
75
して頂きました. ここに改めて御礼申し上げます.
同期に入学し, 研究や些細なことで議論を行った博士前期課程二年 川村 雄 君,
辰巳 雅紀 君, 冨本 隆 君, 野口 慎 君に御礼申し上げます. こうした日々は, 筆者
にとって大変有益で, 新しい価値観を見出せたように思います. おかげさまで, 有
意義な二年間を過ごすことができました. 本当にありがとうございました.
筆者の覚束無い指導にもかかわらず, 熱心に話を聞いてくれた博士前期課程一
年 糸数 篤 君, 角谷 文章 君, 木下 晴雅 君, 近藤 祐和 君, 土居 優太 君, 長井 健祐
君, 水野 貴志 君, 山田 晃平 君, Oulad Nassar Badr 君に御礼申し上げます. 筆者
に向けてしてくれた多くの質問によって, 再発見することが多々あり, 筆者自身の
勉強にもなりました.
研究の楽しさ・制御工学の面白さを教えてくださった, 宇都宮大学 東 剛人 准
教授に心より感謝いたします.
最後に, 大学院への進学を快諾し大学院生活を支援してくれた親族, たわいも
ない話や相談事に付き合ってくれ, 常に心の支えてなってくれた友人に感謝いた
します. ありがとうございました.
76
参考文献
[1] B. A. Sadjadi: Stability of Networked Control Systems in the Presence of
Packet Losses, Proceedings of the 42nd IEEE Conference on Decision and
Control, pp. 676-681 (2003)
[2] O. C. Imer, S. Yüksel and T. Basar: Optimal control of LTI systems over
unreliable communication links, Automatica, Vol. 42, No. 9, pp. 1429-1439
(2006)
[3] G. C. Goodwin, H. Haimovich, D. E. Quevedo and J. S. Welsh: A moving
horizon approach to networked control system design, IEEE Transactions
on Automatic Control, Vol. 49, No. 9, pp. 1427-1445 (2004)
[4] E. Fridman: Discussion on: “Stabilization of Networked Control Systems with Data Packet Dropout and Transmision Delays: Continuous-Time
Case”, European Journal of Control, Vol. 11, No. 1, pp. 53-55 (2005)
[5] H. Ishii: Stabilization under shared communication with message losses and
its limitations, Proceedings of the 45th IEEE Conference on Decision and
Control, pp. 4974-4979 (2006)
[6] 山本, 河越, 潮:入出力通信に周期時変制約を有する制御系のオブザーバベー
スドコントローラに安定化, システム制御情報学会論文誌,Vol. 15, No. 11,
pp. 593-599 (2002)
[7] 吉田, 石井, 津村:停留時間付き切り替え制御によるデータレートと制御性
能の保証計測自動制御学会論文集 Vol. 43, No. 7, pp. 581-588 (2007)
[8] H. Kawada, K. Yoshida and T. Namerikawa: Synchronized Control for Teleoperation with Different Configurations and Communication Delay, Proceedings of the 46th IEEE Conference on Decision and Control, pp. 2546-2551
(2007)
77
[9] K. Kogiso and K. Hirata: A Remote Control Technique for Constrained
Linear System: An Index Feedback Approach, Proceedings of 46th IEEE
Conference on Decision and Control, pp. 3029-3035 (2007)
[10] 小笠原, 平田, 杉本:LFT 構造に着目したネットワーク制御とその倒立振子
系への適用, 第 50 回 システム制御情報学会 研究発表講演会, pp. 447-448
(2006)
[11] P. Antsaklis and J. Baillieul: Special Issue on Networked Control Systems,
IEEE Transactions on Automatic Control, Vol. 49, No. 9, pp. 1421-1423
(2004)
[12] P. Antsaklis and J. Baillieul: Special Issue on Technology of Networked
Control Systems, Proceedings of the IEEE, Vol. 95, No. 1, pp. 1-4 (2007)
[13] 山下:遠隔制御における伝送遅延情報欠落の補償, 計測と制御,Vol. 41, No.
7, pp. 513-518 (2002)
[14] 汐月:リレー解説 むだ時間システム制御―入門から最新動向まで第 11 回:双
方向遠隔制御におけるむだ時間問題,計測と制御, Vol. 45, No. 9, pp. 827-833
(2006)
[15] D. Liberzon: Switching in Systems and Control, Birkhäuser (2003)
[16] K. S. Narendra and J. Balakrishnan: A common Lyapunov Function for
Stable LTI Systems with Commuting A-Matrices, IEEE Transactions on
Automatic Control, Vol. 39, No. 12, pp. 2469-2471 (1994)
[17] G. Zhai, B. Hu, K. Yasuda and A. N. Michel: 離散時間切替えシステムの
安定性と L2 ゲイン解析,システム制御情報学会論文誌,Vol. 15, No. 3, pp.
117-125 (2002)
[18] M. Margaliot: Stability analysis of switched systems using variational principles: An introduction, Automatica, Vol. 42, No. 12, pp. 2059-2077 (2006)
78
[19] S. Boyd, L. El Ghaoui, E. Feron and V. Valakrishnan: Linear Matrix Inequalities in Systems and Control Theory, SIAM (1994)
[20] 岩崎:LMI と制御, 昭晃堂 (1997)
[21] 藤森:ロバスト制御, コロナ社 (2001)
[22] 劉:線形ロバスト制御, コロナ社 (2002)
[23] 萩原:ディジタル制御入門, コロナ社 (1999)
[24] 梶原:線形システム制御入門, コロナ社 (2000)
[25] 井村:システム制御のための安定論,コロナ社 (2000)
[26] 砂原:確率システム理論 I 基礎編, 朝倉書店, (1981)
[27] 砂原:確率システム理論 II 発展編, 朝倉書店, (1982)
[28] P. Gahinet, A. Nemirovski, A. J. Laub and M. Chilali: LMI Control Toolbox
For Use with MATLAB, The MathWorks (1995)
[29] E. Fridman: New Lyapunov-Krasovskii functionals for stability of linear retarded and neutral type systems, Systems and Control Letters, Vol. 43, No.
4, pp. 309-319 (2001)
[30] 東, 杉江:離散値入力型制御における最適動的量子化器, システム制御情報
学会論文誌, Vol. 20, No. 3, pp. 122-129 (2007)
[31] K. Hirata : A Design Method of Sampled-Data H∞ Delayed Feedback Controller, 17th International Symposiumon Mathematical Theory of Networks
and Systems, pp. 723-729 (2006)
[32] 平田, 藤田:外部入力を有する線形離散時間システムに対する拘束条件の解
析, 電気学会論文誌 C, Vol. 118, No. 3, pp. 384-390 (1998)
79
[33] 平田, 小木曽:拘束条件の達成を考慮したリファレンスガバナの構成, システ
ム制御情報学会論文集, Vol. 14, No. 11, pp. 554-559 (2001)
[34] D. P. Bertsekas: Dynamic Programming and Optimal Control, third edition,
Athena Scientific (2005)
[35] B. Lincoln and A. Rantzer: Relaxing Dynamic Programming, IEEE Transactions on Automatic Control, Vol. 51, No. 8, pp. 1249-1260 (2006)
[36] J. F. Kurose and K. W. Rose: Computer Networking a Top-Down Approach
Featuring the Internet, third edition, Pearson Education, Inc. (2005)
[37] INTERNATIONAL RESCUE SYSTEM : http://www.rescuesystem.org/
[38] 株 式 会 社
日立プラントテクノロジー
pt.co.jp/products/si/zignet/model/plant.html
80
:
http://www.hitachi-
業績リスト
国際学会論文
1. A. Ohori, K. Kogiso and K. Sugimoto : Stabilization of a Networked Control
System under Bounded Disturbances with Unreliable Communication Links
via Common Lyapunov Function Approach, SICE Annual Conference 2007,
pp. 1898-1903 (2007)
口頭発表
1. 東, 大堀:サーカディアンリズムの Robustness 学習機構, 第 6 回 計測自動
制御学会 制御部門大会, pp. 359-362 (2006)
2. 大堀, 小木曽, 杉本:データ損失を考慮したネットワーク型制御 ― スイッ
チングと共通リアプノフ関数による接近 ―, 第 7 回 計測自動制御学会 制
御部門大会, 講演番号 83-2-5 (2007)
3. 大堀, 平田, 小木曽:サンプル値系の同時安定化とネットワーク型制御系へ
の応用, 平成 19 年 電気学会 電子 · 情報 · システム部門大会, pp. 703-706
(2007)
4. 大堀, 平田, 小木曽:ランダムなデータ損失を伴う遠隔制御系の安定性につ
いて ― サンプル値系の同時安定化との関係 ―, 計測自動制御学会 関西支
部 若手研究発表会, pp. 7-10 (2008)
81
付録
A. Tool Box の使い方
MATLAB の LMI Control Toolbox の簡単な説明をする. ( 詳細は, 文献 [28]
を参照. ) ここでは, 連立 LMI を解く場合の基本的な手順と関数の意味を以下に
示す.
1. 連立 LMI 記述の初期化
setlmis([ ])
2. LMI 問題の行列変数を指定
X = lmivar(type, struct)
•
lmivar は, カレントに記述される LMI システムの中に新しい行列変数
X を定義する. オプションの出力引数 X は, この新しい変数をその後
参照するために利用される識別子である.
•
最初の引数 type は, 利用可能な変数の型の中で選択し, 2 番目の引数
struct は, この型に依存した X の構造に関する情報を与える. 利用で
きる変数の型は, つぎのものである.
•
type = 1:ブロック対角構造を持つ対称行列. 各々の対角ブロックは,
フル行列 (任意の対称行列) またはスカラー行列 (単位行列のスカラー
倍または零行列) のいずれかである.
X が R 個の対角ブロックを持っているなら, struct は, R 行 2 列の行
列である.
-
struct(r, 1) は, r 番目のブロックの大きさである.
-
struct(r, 2) は, r 番目のブロックの型 ( フルは 1, スカラーは 0, ゼ
ロブロックは −1 ) である.
•
type = 2:m 行 n 列のフル長方行列で, この場合, struct = [m, n] で
ある.
82
•
type = 3:その他の構造. 複雑な行列変数構造などをタイプ 3 で定義
する. 詳細は, 文献 [22] を参照.
3. 連立 LMI の項の内容を指定
lmiterm(termID, A, B, flag)
•
LMI 項は, つぎの要素を設定する.
-
外部因子
-
定数項 (固定行列)
-
変数項 AXB または AX T B で, ここで X は, 行列変数で, A と B
は, 項係数と言われる既知の行列である.
•
いくつかのブロックを持つ LMI を記述する際, 対角部とその上のブロッ
クの項のみを指定する.
•
lmiterm を呼び出すとき, termID は, 項の配置と含まれる行列変数を
設定する 4 つの整数を要素に持っている.
+p p 番目の LMI の左辺の項
- termID(1) =
−p p 番目の LMI の右辺の項
[0 0] 外側因子
- termID(2 : 3) =
[i, j] 左辺 (右辺) の内側因子の (i, j) ブロックの項
⎧
⎪
⎪
⎨ 0 定数
-
termID(4) =
x 変数 AXB
⎪
⎪
⎩ −x 変数 AX T B
ここで, X は, lmivar により出力される行列変数 X の識別子で
ある.
•
引数 A と B は, 数値データを含み, 表 3 のように設定される.
•
余分な引数 flag は, オプション的なもので, 対角ブロックにおいて, 共
役表現のみに関係する.
-
flag = ’s’ と設定する.
83
表 3 引数 A と B の設定
項のタイプ
A
B
外部因子 N
N の行列値
省略
定数項 C
C の行列値
省略
変数項
A の行列値
B の行列値
(A が設定されていなければ 1 )
(B が設定されていなければ 1 )
AXB または
-
AX T B
例)
lmiterm( [1 1 1 X], A, 1, ’s’ )
は, 最初の LMI の (1, 1) ブロックに対称表現 (AX) + (AX)T を加
える. これは, つぎの 2 つのコマンドを簡略化したものである.
lmiterm( [1 1 1 X], A, 1 )
lmiterm( [1 1 1 −X], 1, A’ )
4. 連立 LMI の内部表現を lmisys に出力
lmisys = getlmis;
5. 与えられた連立 LMI の解の導出
[tmin, xfeas] = feasp(lmisys, options, target)
•
関数 feasp は, 引き数 lmisys で記述される連立 LMI の解 xfeasp を計
算する. ベクトル xfeas は, すべての LMI を満足する決定変数の特別
な値である.
LMI システム
N T L(x)N ≤ M T R(x)M
を与えると, xfeas は, つぎの補助的な凸プログラムを解くことにより
計算される.
N T L(x)N − M T R(x)M ≤ tI の条件化で t を最小にする.
84
このプログラムの大域的最小値は, 関数 feasp の最初の引数として出力
されるスカラー値 tmin である. LMI 制約は, tmin≤ 0 で可解であり,
tmin< 0 で厳密に可解である.
•
オプション引数 target は, tmin に対するターゲット値を設定する. t
の値が, このターゲット値より小さくなると, 最適化コードは, 停止す
る. ( デフォルト値は, target = 0 である. )
•
オプション引数 options は, 最適化アルゴリズムに対する制御パラメー
タにアクセスする. つぎの 5 つの要素からなるベクトルを使う.
-
options(1) は, 使わない.
-
options(2) は, 最適化手続きにより実行される繰り返し回数の最大
値を設定する. ( デフォルト値は, 100 である. )
-
options(3) は, 可解半径を再設定する. R > 0 を満足する値に
options(3) を設定することは, 決定変数ベクトル x = (x1 , · · · , xN )
が球領域
N
x2i < R2
i=1
に入るように制約する. ( デフォルト値は, R = 109 である. )
options(3) に負の値を設定することは, 「適応限界モード」をアク
ティブにする. このモードで, 可解半径は, 初期値として 108 が設
定される. そして, 必要ならば最適化の過程で増加される.
-
options(4) は, 計算の終了を速める. ( デフォルト値は, 10 である.)
このパラメータは, スピードと精度の間のトレードオフになる. 小
さい値 (< 10 ) に設定すると, 精度が保証されなくなるが, 計算は
すぐ終了する. 逆に, 大きい値を設定すると, 繰り返し回数は, 取
り得る最大回数に達するが, 収束は自然な状態になる.
-
options(5)= 1 は, 最適化過程の状況を表示する. この値をゼロ (デ
フォルト値) に設定すると, 表示されなくなる.
6. 決定変数の値を与え, 行列変数の対応する値を引き出す
valX = dec2mat(lmisys, xfeas, X)
85
•
関数 feasp により計算された決定変数のベクトル値 xfeas を与えると,
関数 dec2mat は, 識別子 X をもつ行列変数の対応する値 valX を計算
する.
86
B. 従来研究 [2]
第 3 章の数値例で比較を行っている従来研究 [2] の簡単な説明をする. この文
献では, 損失したデータを零値で復元することで,損失の影響が評価関数値に現
れないよう工夫されている.そのうえで,動的計画法 [34] を採用して最適な補償
器の導出に成功している.ここでは, TCP ネットワーク環境下での有限区間の最
適制御入力を導出する. ただし, 本章で示す記号は, 文献 [2] に合わせるため, 本
文とは多少異なる.
B.1 問題の定式化
制御対象は, 離散時間システムであり, その状態方程式を
xk+1 = Axk + αk Buk + wk ,
yk = βk xk ,
k ∈ Z+
と記述する. ここで, xk ∈ Rnx は, 制御対象の状態量, uk ∈ Rnu は, 制御入力を表
し, nu ≤ nx と仮定する. 外乱 wk ∈ Rnx は, 独立で平均値が 0 である確率ベクト
ル ( independent zero-mean second-order random vectors ) であり, 初期値 x0 も,
確率分布 Px0 によって与えられる確率ベクトルである.
ネットワーク通信路で生じるデータ損失に関する情報を 0 − 1 離散値変数 α, β
で表しておく.
αk ∈ {0, 1},
βk ∈ {0, 1},
k ∈ Z+
ここで,αk = 0 は,時刻 k に制御入力 uk が損失すること,αk = 1 は,uk が制
御対象へ無事に到着することを意味する.同様に, βk = 0 は,時刻 k に観測信号
yk が損失すること,βk = 1 は,yk が推定器へ無事にフィードバックされること
を意味する. また, 確率過程 {αk } は, 独立したベルヌーイ過程で,
P [αk = 0] = α,
P [αk = 1] = 1 − α := ᾱ
87
とする. 確率過程 {βk } も, 同様に独立したベルヌーイ過程で,
P [βk = 0] = β,
P [βk = 1] = 1 − β := β̄
とする. αk と βk は, 互いに独立であるという仮定を設ける.
評価関数は,
Jπ = E xTN F xN +
N
−1
xTk Qxk + αk uTk Ruk
k=0
とし, この評価関数を最小にするような最適な入力を導出することが制御目的で
ある. ここで, R > 0, Q ≥ 0, F ≥ 0 とする.
TCP ネットワーク環境下では, k ステップまでに補償器が得られる情報は, 以
下のとおりである.
IkT CP = (y0 , ..., yk ; u0, ..., uk−1; α0 , ..., αk−1 ; β0 , ..., βk )
k ∈ Z+ \ 0
I0T CP = (y0 , β0 )
B.2 有限区間の最適制御
動的計画法 [34, 35] を採用して最適な補償器の導出を行う.
B.2.1 有限区間の最適補償器
最適な制御則は,
u∗k = Gk E xk IkT CP
である. ただし,
−1
Gk = − R + B T Kk+1 B B T Kk+1 A
−1
Pk = ᾱAT Kk+1 B R + B T Kk+1 B B T Kk+1 A
Kk = AT Kk+1 A + Q − Pk
である.
88
(56)
B.2.2 導出過程
終端コストは,
T CP
T CP
JN (IN
) = E xTN F xN |IN
xN
で, k ステップから k + 1 ステップへのコストは,
Jk (IkT CP )
= min
uk
E
xk ,wk
xTk Qxk
+
αk uTk Ruk
+
T CP T CP
Jk+1 (Ik+1
)Ik
(57)
である.
まず, (57) 式を用いて, N − 1 から N へのコストを計算すると,
T CP
JN −1 (IN
−1 )
= min
E
uN−1 xN−1 ,wN−1
E
= min
uN−1 xN−1 ,wN−1
xTN −1 QxN −1
+
αN −1 uTN −1 RuN −1
+
T CP T CP
JN (IN
)IN −1
xTN −1 QxN −1 + αN −1 uTN −1 RuN −1
+ xTN −1 AT F AxN −1 + αN −1 xTN −1 AT F BuN −1 + xTN −1 AT F T wN −1
+ αN −1 uTN −1 B T F AxN −1 + α2N −1 uTN −1 B T F BuN −1 + αN −1 uTN −1 B T F wN −1
T CP
T
T
+ wN
F
Ax
+
α
w
F
Bu
+
w
F
w
I
N −1
N −1 N −1
N −1
N −1
N −1 N −1
−1
となる. ここで,
E
wN−1
wN −1 = 0,
であるので,
T CP
JN −1 (IN
−1 ) = E
xN−1
!
"
E αN −1 = ᾱ
α2N −1 = αN −1 ,
T CP
T
xTN −1 QxN −1 + xTN −1 AT F AxN −1 IN
+ E wN
−1
−1 F wN −1
wN−1
+ min ᾱuTN −1 RuN −1 + ᾱuTN −1 B T F BuN −1
uN−1
+ E
xN−1
= E
xN−1
T CP
2αN −1 xTN −1 AT F BuN −1 IN
−1
T CP
T
xTN −1 (AT F A + Q)xN −1 IN
+ E wN
−1
−1 F wN −1
wN−1
+ min uTN −1 (ᾱR + ᾱB T F B)uN −1
uN−1
+ 2ᾱ E
xN−1
T CP T T
A F BuN −1
xN −1 IN
−1
89
(58)
である. つぎに, (58) 式を uN −1 について微分すると,
T CP
2ᾱ R + B T F B uN −1 = −2ᾱB T F A E xN −1 IN
−1
xN−1
となる. よって, N − 1 ステップから N ステップへの最適入力は,
u∗N −1 = − R + B T F B
−1
BT F A E
xN−1
T CP
xN −1 IN
−1
(59)
である. (58) 式に (59) 式を代入すると,
T CP
JN −1 (IN
−1 )
= E
xN−1
xTN −1
T CP
T
A F A + Q xN −1 IN −1 + E wN −1 F wN −1
T
wN−1
−1 −1 T
B F
R + BT F B R + BT F B
+ ᾱ E xTN −1 AT F B R + B T F B
xN−1
−1 T
T CP
T CP
B F AxN −1 IN
xTN −1 AT F B R + B T F B
AxN −1 IN
−1 − 2ᾱ x E
−1
N−1
T
T CP
T
T
F
w
+
E
w
= E xN −1 A F A + Q − PN −1 xN −1 IN
N −1
−1
N −1
xN−1
wN−1
−1 T
T CP
B F AxN −1 IN
+ ᾱ E xTN −1 AT F B R + B T F B
−1
xN−1
T
−1 T
T CP
AT F B R + B T F B
B FA
E xN −1 IN
− ᾱ E
−1
xN−1 xN−1
T CP T CP
E xN −1 IN
−1 IN −1
xN−1
となる. ここで,
PN −1
=
ᾱAT F B R + B T F B
KN −1
=
AT F A + Q − PN −1
−1
BT F A
ek := xk − xˆk
xˆk = E xk IkT CP
とおくと, N − 1 ステップから N ステップへの最適入力を与えた時のコストは,
T CP
JN −1 (IN
−1 )
= E
xN−1
T CP
xTN −1 KN −1 xN −1 IN
−1
T
F
w
+ E wN
N
−1
−1
wN−1
となる.
90
+ E
xN−1
T CP
eTN −1 PN −1 eN −1 IN
−1
同様に, N − 2 ステップから N − 1 ステップへのコストは,
T CP
JN −2 (IN
−2 ) = min
T CP T CP
)
xTN −2 QxN −2 + αN −2 uTN −2 RuN −2 + JN −1 (IN
I
−1
N −2
T CP
T
xTN −2 QxN −2 IN
−2 + αN −2 uN −2 RuN −2
E
uN−2 xN−2 ,wN−2
E
= min
uN−2 xN−2 ,wN−2
T CP T CP
xTN −1 KN −1 xN −1 IN
IN −2
−1
xN−2 ,wN−2 xN−1
T CP T CP
E eTN −1 PN −1 eN −1 IN
+
E
I
−1
N −2
xN−2 ,wN−2 xN−1
T
F
w
E wN
+
E
N −1
−1
+
E
E
xN−2 ,wN−2 wN−1
E
= min
uN−2 xN−2
T CP
xTN −2 QxN −2 IN
−2
+ αN −2 uTN −2 RuN −2
(AxN −2 + αN −2 BuN −2 + wN −2 )T KN −1
T CP
(AxN −2 + αN −2 BuN −2 + wN −2 )IN
−2
T CP
T
T
+ E eN −1 PN −1 eN −1 IN −2 + E wN −1 F wN −1
+
E
xN−2 ,wN−2
wN−1
= min
E
uN−2 xN−2
T CP
xTN −2 QxN −2 IN
+ αN −2 uTN −2 RuN −2
−2
T CP
T CP
T
T
x
A
K
Bu
xTN −2 AT KN −1 AxN −2 IN
+
E
α
I
N
−2
N
−1
N
−2
−2
N −2
N −2
xN−2
xN−2
T CP
T CP
xTN −2 AT wN −2 IN
+ E αN −2 uTN −2 B T KN −1 AxN −2 IN
+
E
−2
−2
xN−2 ,wN−2
xN−2
+ α2N −2 uTN −2 B T KN −1 BuN −2 + E αN −2 uTN −2 B T KN −1 wN −2
wN−2
T
T CP
T
KN −1 AxN −2 IN
KN −1 BuN −2
wN
+ E αN −2 wN
+
E
−2
−2
−2
xN−2 ,wN−2
wN−2
T
T
T CP
T
wN
+ E wN
−2 KN −1 wN −2 + E eN −1 PN −1 eN −1 IN −2 + E
−1 F wN −1
+ E
wN−2
wN−1
となる. ここで,
E{wN −2 } = 0,
α2N −2 = αN −2 ,
91
!
"
E αN −2 = ᾱ
であるので,
T CP
JN −2 (IN
−2 ) = min
E
uN−2 xN−2
T CP
xTN −2 QxN −2 IN
+ ᾱuTN −2 RuN −2
−2
T CP
xTN −2 AT KN −1 AxN −2 IN
−2
xN−2
T CP
+ E αN −2 xTN −2 AT KN −1 BuN −2 IN
−2
xN−2
T CP
+ E αN −2 uTN −2 B T KN −1 AxN −2 IN
−2
xN−2
T
K
w
+ ᾱuTN −2 B T KN −1 BuN −2 + E wN
−2 N −1 N −2
wN−2
T CP
T
T
+ E eN −1 PN −1 eN −1 IN −2 + E wN −1 F wN −1
+ E
wN−1
(60)
である. (60) 式を uN −2 について微分すると,
T CP
−2ᾱ R + B T KN −1 B uN −2 = 2ᾱB T Kn−1 A E xn−2 IN
−2
xn−2
となる. よって, N − 2 ステップから N − 1 ステップへの最適入力は,
u∗N −2 = − R + B T KN −1 B
−1
B T KN −1 A E
xN−2
T CP
xN −2 IN
−2
(61)
である. (60) 式に (61) 式を代入すると,
T CP
xTN −2 QxN −2 IN
−2
xN−2
−1 −1
R R + B T KN −1 B
+ ᾱ E xTN −2 AT KN −1 B R + B T KN −1 B
xN−2
T CP
T CP
T
T
B T KN −1 AxN −2 IN
A
K
Ax
+
E
x
I
N −1
N −2 N −2
−2
N −2
xN−2
−1 T
T CP
B KN −1 AxN −2 IN
− E αN −2 xTN −2 AT KN −1 B R + B T KN −1 B
−2
xN−2
−1 T
T CP
B KN −1 AxN −2 IN
− E αN −2 xTN −2 AT KN −1 B R + B T KN −1 B
−2
xN−2
−1 T
B KN −1 B
+ ᾱ E xTN −2 AT KN −1 B R + B T KN −1 B
xN−2
−1 T
T CP
T CP
T
T
B KN −1 AxN −2 IN −2 + E eN −1 PN −1 eN −1 IN
R + B KN −1 B
−2
T
T
K
w
F
w
+
E
w
+ E wN
N −1
−2 N −1 N −2
N −1
T CP
JN −2 (IN
−2 ) = E
wN−2
wN−1
92
T CP
xTN −2 AT KN −1 A + Q xN −2 IN
−2
xN−2
−1 T
T CP
B KN −1 AxN −2 IN
− 2 E αN −2 xTN −2 AT KN −1 B R + B T KN −1 B
−2
xN−2
−1
R + B T KN −1 B
+ ᾱ E xTN −2 AT KN −1 B R + B T KN −1 B
xN−2
−1 T
T CP
T CP
T
I
B KN −1 AxN −2 IN
P
e
+
E
e
R + B T KN −1 B
−2
N −1 N −1 N −1 N −2
T
T
wN
+ E wN
−2 KN −1 wN −2 + E
−1 F wN −1
T CP
JN −2 (IN
−2 ) = E
wN−2
wN−1
となる. ここで,
PN −2 = ᾱAT KN −1 B R + B T KN −1 B
−1
B T KN −1 A
KN −2 = AT KN −1 A + Q − PN −2
とおくと, N − 2 ステップから N − 1 への最適入力を与えた時のコストは,
T CP
T CP
T
P
e
xTN −2 KN −2 xN −2 IN
+
E
e
I
N
−1
N
−1
−2
N −1
N −2
xN−2
T
T
wN
+ E wN
−2 KN −1 wN −2 + E
−1 F wN −1
JN −2 (TNT −2 CP ) = E
wN−2
wN−1
となる.
以上より, 毎ステップごとに最適入力を計算すると, (56) 式が導出できる.
93
Fly UP