Comments
Description
Transcript
複雑系の制御・設計論グループ
複雑系の制御・設計論グループ 第4章 研究成果報告 非線形振動子を用いた歩行ロボットの歩行運動制御 工学研究科航空宇宙工学専攻 青井 伸也 Abstract: The purpose of this study is to achieve dynamic turning necessary for a biped robot to change walking direction while moving forward. Such turning comprises straight and curved walking and the transition of walking patterns between them. First, we propose a locomotion control system that consists of nonlinear oscillators to obtain robust straight and curved walking and investigate the mechanism for robust walking. Next, we verify that the robot accomplishes a smooth transition of walking patterns between straight and curved and then extend the locomotion control system based on a vision system that demonstrates the turning in the real world. Key words: Biped robot, Nonlinear oscillators, Phase reset, Turning, Curved walking, Vision system 1. はじめに 本研究では 2 脚歩行ロボットの自律的な歩行を目的として,まず自由に進行方向を変化させる ために必要な旋回歩行についての考察を行った.人間の旋回歩行,特に緩やかな旋回では,この 運動は直線歩行から一度曲線歩行に移り,更に進行方向の異なる直線歩行に移ることで実現され る [3, 4].つまり,2 脚ロボットにおいてこのような旋回歩行を実現させるには,ロバストな直線, 曲線歩行,そしてこれら歩行パターン間の安定な遷移が必要となる.昨年度までに,非線形振動 子系を用いた 2 脚ロボットの歩行制御系を提案し,歩行速度の変化や歩行面の傾斜角度の変化と いった環境の変化に対してロバストな歩行が実現されることを確認した [2].制御系は運動制御系 と運動生成系から構成され,運動制御系では各関節に取り付けられたモータとモータ制御系を用 いて,局所 Proportional-Derivative (PD) フィードバック制御により各関節を制御した.運動生成系 は,それぞれが安定なリミットサイクルを持つ非線形振動子系から構成され,振動子の位相から の写像を用いてロボットの関節の軌道を構成した.本研究では,更に曲線,旋回歩行を実現させ るために,この位相からの写像にパラメータを導入し,このパラメータに従って写像を修正する ことで必要な関節軌道を生成した.そして,このパラメータを任意に変化させることによって歩 行パターンを変化させた.曲線歩行のように左右の脚の運動が非対称な運動では,例えば遠心力 といった胴体に対して左右の運動に非対称性が生まれ,歩行の不安定化を招く.そこで,外部から のセンサシグナルを用いて,振動子系の位相をリセットし,関節軌道の調整を行うことでこの不 安定化を補償し,またそのメカニズムを解析した.更に,ロバストな曲線歩行,そして直線,曲 線の歩行パターン間の遷移を数値シミュレーション,並びにハードウェア実験で検証し,更に視 覚系を用いてより自律的な歩行の実証を行った. 2. 2 脚ロボットのモデル 2 脚ロボットとして図 1(a) に示す HOAP-1(富士通オートメーション (株)) を用いる.概要図を 図 1(b) に示す.ロボットは 1 リンクの胴体と,左右各 4 リンクの腕,左右各 6 リンクの脚から構 成される.それぞれのリンクは図に示されるような 1 回転自由度の関節で結合されている.各脚 は,脚先に 4 個ずつ接地センサを持ち,頭部に 1 台の CCD カメラを搭載している. 3. 歩行制御系 [1, 5] 3.1 制御系構成 歩行制御系は運動生成系と運動制御系から構成される (図 2(a)).運動生成系は リズム生成系と軌道生成系から構成され,リズム生成系は,腕,脚,胴体の運動を構成する機構 振動子と介在振動子から構成される.機構振動子は介在振動子とそれぞれ相互作用し,脚が接地 した瞬間,脚振動子は脚先の接地センサからフィードバック信号を受け取る (図 2(b)).軌道生成 系は,機構振動子の位相からの写像を用いて各関節の運動を構成し,それを指令値として運動制 御系に送る.運動制御系は各関節に取り付けられたモータとモータ制御系から構成され,送られ CCD Camera 480 Touch Sensor 78 (a) HOAP-1 (富士通オートメーション (株)) (b) ロボット概要図 図 1: 2 脚ロボット Outer Command Locomotion Control System Motion Generator Rhythm Generator Arm1 Osc. Arm2 Osc. Inter Osc. Trajectory Generator Leg1 Osc. Motion Controller Motor Controller Touch Sensor Signal Leg2 Osc. Trunk Osc. Touch sensor signal Touch sensor signal Mechanical System (a) 制御系構成 (b) リズム生成系 図 2: 歩行制御系 た指令値に従って,局所 PD フィードバック制御を用いて各関節を駆動させる.視覚系を用いる場 合は,視覚情報が外部指令として歩行制御系にフィードフォワードに入力される (5 節). 3.2 関節角の軌道設計 軌道生成系において,全ての関節角の軌道を振動子系の位相からの写像 として与える.脚関節の軌道は,まず脚先の軌道を設計し,逆運動学を用いることで構成される. 脚先の軌道は図 3(a) のように遊脚と支持脚から構成される.遊脚軌道は胴体に対して相対的に設 定する基準点 AEP と PEP を含む曲線から構成され,支持脚軌道は実際に着地した点と基準点 PEP を結ぶ直線から構成される.そのため,実現する脚の運動は,脚の接地するタイミングに依存し て変化する.これら脚先の軌道を脚振動子の位相の関数として定義し,逆運動学を用いることで 脚関節の軌道は位相からの写像として与えられる.また,ロボットの腕の質量は全体の質量に比 べて非常に小さく歩行運動にほとんど影響を及ぼさないため,腕は胴体に対して固定する. 曲線歩行を実現させるために,位相から関節軌道への写像にパラメータを導入し,そのパラメー タに従って写像を修正する.緩やかな旋回歩行において人間は,旋回外側の脚で支持している時に その股関節を回転させることで進行方向を変える [4].そこで,パラメータ ξ1 を導入して股関節の 一歩あたりの旋回角度をこのパラメータ ξ1 で定義する.詳細には,ξ1 > 0 で左旋回,ξ1 < 0 で右 旋回,ξ1 = 0 では直進に対応させる.そして,振動子の位相からロボットの股関節への写像にこ のパラメータ ξ1 を導入して軌道を構成する (図 3(b)).更に,人間の旋回歩行の特徴として,胴体 を内側に傾けることが挙げられる [3, 4].これによって旋回時に起こる遠心力などの要素を補償で きると考えられる.そこで,同様にパラメータ ξ2 を導入して,胴体のロールバイアスをこのパラ メータ ξ2 で定義する.そして,ロボットの股関節と足首関節への写像にこのパラメータ ξ2 を導入 第4章 研究成果報告 Joint 4 Landing point Swing phase Turn angle ξ2 Center of Turning Curved to the left Joint 4 Joint 5 PEP AEP AEP Centrifugal Forces Joint 3 Joint 3 Roll bias ξ1 O Joint 5 PEP Curved to the right Straight Landing point Stance phase (b) 旋回角度とロールバイアス (c) ξ1 -ξ2 平面でのパラメータ設計 (a) 脚先の軌道 図 3: 関節角の軌道設計 Phase of Leg Osc. 2π Nominal step cycle Reset value 0 Nominal swing duration Nominal stance duration Time Phase of Actual step cycle Leg Osc. 2π Touch sensor signal Reset value Phase reset 0 Actual swing duration Actual stance duration Time 図 4: 接地センサ信号による脚振動子の位相リセット して軌道を構成する (図 3(b)).これらパラメータ (ξ1 , ξ2) を設定することで,運動学的に直線,曲 線歩行を任意に実現できる (図 3(c)). 3.3 センサ信号フィードバック 脚振動子は脚が接地した瞬間に脚先に取り付けられた接地セン サからフィードバック信号を受け取る.その際,脚振動子の位相を図 4 のように基準値にリセッ トする.そのため,脚の運動だけでなく,実現する遊脚周期,歩行周期も接地タイミングに依存 して変化する. 4. 旋回歩行 4.1 曲線歩行の動力学解析 前述したように,旋回歩行は直線と曲線,そしてそれら歩行パター ンの遷移から構成される.ここでは,特に曲線歩行について調べる.初めに,数値シミュレーショ ンを用いて曲線歩行条件,すなわち旋回角度,ロールバイアスを変化させた場合の振る舞いを調 べる.図 5(a) に旋回角度,ロールバイアスの変化に対して実現した左右の脚のデューティー比 (支 持脚周期と歩行周期の比) の比率 (左/右) の等高線を示している.旋回角度が大きくなるにつれて この比率は小さくなり,ロールバイアスが大きくなるにつれてこの比率は逆に大きくなることが わかる.曲線歩行では,直線歩行と違い左右の脚の運動に非対称性が存在する.そのため,例え ば遠心力といった胴体に対して左右の運動に非対称性が生まれ,歩行の不安定化を招く.つまり, この不安定化を補償するためのメカニズムが必要となる.直線歩行では,接地センサからのフィー ドバック信号による位相リセットを用いて,歩行周期を自律的に変化させてロバストな歩行を実現 してきた [5].この位相リセットでは,図 4 に示すように接地タイミングによって実現する遊脚時 間が変化する.曲線歩行のように胴体に対して左右の運動に非対称性が存在すると,その影響で 左右の脚の接地するタイミングが変化する.その結果,左右の脚で実現する遊脚の時間が変化し, 図 5(a) のように左右のデューティー比に変化が生じている.詳細には,旋回角度が大きくなるにつ れて遠心力が大きくなり,より体が外側に傾くことで外側の脚の接地するタイミングが早まり遊脚 時間が短くなる.その結果,外側 (右脚) のデューティー比が大きくなり,左右の脚のデューティー 比の比率は小さくなる.それに対して,ロールバイアスを大きくするにつれて体がより内側に傾 14 14 1.08 12 1.06 10 8 Roll Bias [deg] Roll Bias [deg] 12 1.04 6 1.02 4 1.00 2 0.98 -16 10 8 -12 -8 6 -4 4 0 2 4 0.96 0 8 0 0 5 10 15 Turning Angle [deg] 20 (a) 左右のデューティー比の比率 (左/右) の等高線 5 0 12 10 15 Turning Angle [deg] 20 (b) 左右の接地タイミング位相差 ∆φ [deg] の等高線 図 5: 曲線歩行での旋回角度とロールバイアスに対して実現する非対称性 Left Right Nominal 0.8 Actual Duty Ratio 0.8 Actual Duty Ratio 0.82 Left Right Nominal 0.82 0.78 0.76 0.74 0.78 0.76 0.74 0.72 0.72 0.7 0.7 0.68 0 5 20 0 1 2 1.05 Left Right Nominal Actual Step Cycle [s] Actual Step Cycle [s] 1.05 10 15 Turning Angle [deg] 1 0.95 0.9 0.85 3 4 5 Roll Bias [deg] 6 7 8 7 8 Left Right Nominal 1 0.95 0.9 0.85 0 5 10 15 Turning Angle [deg] 20 (a) 旋回角度の変化に対する振る舞い 0 1 2 3 4 5 Roll Bias [deg] 6 (b) ロールバイアスの変化に対する振る舞い 図 6: 曲線歩行実験結果 (上段:デューティー比,下段:歩行周期) き,逆のことが起こる.これらの結果から,本制御系においては歩行周期だけでなく左右のデュー ティー比が適応的に変化することでロバストな歩行が実現されると考えられる.更に,歩行にお いては左右の脚の周期はほぼ同じである必要があるので,曲線歩行のように左右の運動に非対称 性を含む運動を安定化する要因としては,デューティー比がより大きな効果を与えると考えられ る.前述したように,この左右のデューティー比の違いの要因は,左右の接地タイミングの違いに 依存するものである.そこで,左右の接地タイミングの位相差として ∆φ = 360◦ × (∆t/T − 1/2) と定義し,図 5(b) に旋回角度,ロールバイアスの変化に対する等高線を示す.ここで,T は歩行 周期であり,∆t は左右の脚の接地する時間差である.∆φ = 0 が左右逆相に対応し,∆φ > 0 は内 側の脚 (左脚) に対して外側の脚 (右脚) の接地タイミングが逆相から遅れていることを示す.この 結果から,曲線歩行条件に対して接地タイミングが適応的に変化していることがわかる.すなわ ち結論として,不安定化を招く非対称な運動を補償するために,左右の歩行リズムを自律的に調 整することでロバストな歩行を実現していると考えられる. 次に,実際にハードウェアを用いてこの検証を行う.図 6 に (a) 旋回角度,(b) ロールバイアス のみを変化させた場合の結果を示す.上段が左右のデューティー比,下段が左右の歩行周期を示 している.これらの結果から,歩行周期にはほとんど変化はないが,曲線歩行条件に従って左右 のデューティー比は大きく変化していることが確認できる. 第4章 研究成果報告 0 [s] 4 [s] 8 [s] 12 [s] 16 [s] 20 [s] 24 [s] 28 [s] 図 7: 直線,曲線の歩行パターン遷移 Actual Duty Ratio 4.2 歩行パターンの遷移 次に,直線,曲線の歩行 0.86 Left Right 0.84 パターン間を安定に遷移することができるかを,実際 Nominal 0.82 にハードウェアを用いて検証する.実験設定としては, Circle to the left Circle to the right 0.8 初めパラメータ ξ1 = ξ2 = 0 に設定し,直線歩行を開 0.78 0.76 始させる.そして,15,30,42,59 歩目にそれぞれ 0.74 ξ を不連続に変化させて,左右曲線,直 パラメータ 1 Straight Straight Straight 0.72 線歩行に変化させる.それぞれの歩数をあらかじめ設 0.7 0.68 定することでロボットは 8 の字を描くように旋回する 10 20 30 40 50 60 (図 7).図 8 にその際実現した左右のデューティー比 Number of Steps を示す.この図から,これまでに得られたのと同じよ 図 8: 直線と曲線の歩行パターンの遷移に うに,歩行条件に従って左右で実現するデューティー おける左右のデューティー比の変化 比が変化し,またこれら歩行パターンの変化もほぼス ムーズに実現されていることが確認できる. 5. 視覚誘導歩行 これまでの結果から,ロバストな直線,曲線歩行,そしてそれら 歩行パターン間の遷移が実現され,すなわち旋回歩行が実現された. 0.9 [m] ここでは更に,視覚系を用いたより自律的な歩行の実現を図る.視 Target 覚系からの情報は外部指令として歩行制御系に入力される (図 2(a)). 前節では旋回歩行を実現させるために,振動子の位相から関節角へ 3.0 [m] の写像にパラメータを導入し,そのパラメータを用いて写像を修正 することによって歩行パターンを変化させた.そこでここでは,外 部指令に従ってそのパラメータを変化させることで歩行パターンを 変化させ,自律的な歩行を実現させる.タスクとしては,床面に固 HOAP-1 定されたターゲットにロボットを自律的に近づかせることを目標と する.実験設定としては,図 9 のように進行方向に 3 m,垂直方向に 図 9: 視覚誘導歩行実験 0.9 m 離れている所から歩行を開始させる.視覚情報としては,1 台 の CCD カメラから取得した画像上での視野中心からの並進距離 x を用いて旋回角度を変化させ, 垂直距離 y を用いて歩幅を変化させる.図 10 に結果を示す.(a) は視覚情報 x,(b) は視覚情報 y の時間履歴を示しており,上段に数値シミュレーション,下段にハードウェア実験の結果をそれ ぞれ示している.これらの結果より,視覚情報 x, y はそれぞれ 0 に収束していき,常に視野中心 にターゲットが来るところまでロボットは近づいていることが確認される. 140 100 80 60 40 20 0 -20 80 60 40 20 0 -40 -60 -20 0 5 10 15 150 20 25 Time [s] 30 35 40 0 100 5 10 15 140 KA=14,DA=0 KA=14,DA=5 Center of vision 50 0 -50 20 25 Time [s] 30 35 40 KA=14,DA=0 KA=14,DA=5 Center of vision 120 Visual Information y Visual Information x KA=14,DA=0 KA=14,DA=5 Center of vision 100 Visual Information y Visual Information x 120 KA=14,DA=0 KA=14,DA=5 Center of vision 120 100 80 60 40 20 0 -100 -20 0 5 10 15 20 Time [s] (a) 視覚情報 x(t) 25 30 0 5 10 15 20 25 30 Time [s] (b) 視覚情報 y(t) 図 10: 視覚誘導歩行実験結果 (上段:数値シミュレーション,下段:ハードウェア実験) 6. まとめ 本研究では,非線形振動子を用いて歩行制御系を設計し,ロバストな直線歩行だけでなく,曲 線歩行,そしてこれら歩行パターン間を安定に遷移させることで旋回歩行の実現を行った.更に 視覚系を用いることで,より自律的な歩行を実現させた.数値シミュレーションやハードウェア 実験の結果,外部からのセンサシグナルに従って,振動子の位相をリセットし,位相からの写像 で与えられる関節軌道を修正することで,旋回,曲線歩行のような左右の運動に非対称性を持つ 運動に対しても,適応的に左右のリズムをそれに合わせて調整することでロバストな歩行が実現 されることが明らかとなった.今後,数値シミュレーションやハードウェア実験だけでなく,歩行 運動や,パターン遷移の安定性,ロバスト性などを理論的に深く解析し,検証していきたいと考 えている. 参考文献 [1] S. Aoi, K. Tsuchiya, and K. Tsujita, Turning Control of a Biped Locomotion Robot using Nonlinear Oscillators, In Proc. of Int. Conf. on Robotics and Automation, pp.3043-3048, 2004. [2] 青井伸也, 非線形振動子を用いた歩行ロボットの歩行運動制御, 21 世紀 COE プログラム「動 的機能機械システムの数理モデルと設計論」―複雑系の科学による機械工学の新たな展開― 平成 15 年度 年次報告書, pp.231-236, 2004. [3] G. Courtine and M. Schieppati, Human walking along a curved path. I. Body trajectory, segment orientation and the effect of vision, Eur. J. Neurosci. 18(1), pp.177-190, 2003. [4] T. Imai, S.T. Moore, T. Raphan, and B. Cohen, Interaction of the body, head, and eyes during walking and turning, Experimental Brain Research 136, pp.1-18, 2001. [5] K. Tsuchiya, S. Aoi and K. Tsujita, Locomotion Control of a Biped Locomotion Robot using Nonlinear Oscillators, In Proc. of Int. Conf. on Intelligent Robots and Systems, pp.1745-1750, 2003. 第4章 研究成果報告 環境適応型自律ロボットのシステム構成原理 工学研究科航空宇宙工学専攻 坂東 麻衣 Abstract: A control system for an autonomous robot, which consists of several cooperative modules whose combination and structures change dynamically through interaction with environment, is discussed in this paper. We propose a method to design a control system by modular learning based on Lyapunov design method. In our method, modules that have different property and the dynamic relations between modules to achieve the task are learned. This paper describes the current experimental results of autonomous aerorobot. In particular, the relation of modules in complicated maneuver is investigated in flight experiments and it is proved that the relations between modules are not fixed but are changing adaptively according to the behavior of each module and environmental changes. Key words: Autonomous Aero-robot, Unmanned Helicopter, Advanced Flight Control, Learning and Adaptation, Environmental Changes 1. はじめに 自律ロボットの動作環境は複雑に変化するために,あらかじめ定められた行動則のみで実現可 能な機能は強い制約を受けるが,環境との物理的なインタラクションを通じてその振舞いを適応 的に生成,あるいは変化させることが必要不可欠である.このため,試行錯誤を通じて環境に適応 する学習制御の枠組である強化学習は自律ロボットの学習に多く用いられている [1].しかし,強 化学習は,制御工学的な見地からは学習や制御の安定性などに問題があり,システムのパフォー マンスや安全性を保証することが必要な問題に対して適用することは難しい [2] .特に実際に自律 ロボットを動かす場合には,学習過程の安定性を保証することが重要となる.Perkins らは, 制御系 の解析において安定性を保証するためによく用いられる Lyapunov の安定定理に基づき,Lyapunov 関数が減少する行動を直接選択することにより学習過程の安全性を保証する強化学習法が提案し ている [2].これに対して,我々は Lyapunov の安定定理に基づいたモジュール型強化学習法を提 案してきた [9]. 本稿では,エアロロボットの複雑なマヌーバにおいてモジュール型強化学習法を適用し,環境 との相互作用からモジュール自体およびモジュール間の関係を適応的に変更することが可能であ ることを明らかにする.エアロロボットには強い非線形特性が存在するために,高度な制御性能 の要求を満たすことは困難である [3].特に複雑なマヌーバを行う場合,単一の制御系で飛行を行 うことは難しい.Feron らはマヌーバの動作計画のために,ライブラリをあらかじめオフラインで 作成しより正確な “動作プリミティブ” のライブラリとそのようなプリミティブのオンラインスケ ジューリングを行う方法が用いて高度なマヌーバに成功している [4].この手法においてシステム は状態量は実行される動作プリミティブにより表され,コントロール入力がそのようなプリミティ ブの間のスイッチに対応する動的システムである.しかし,すべての動作プリミティブを設計す ることは現実的ではないことはすでに冒頭で述べたとおりである.本稿では,Lyapunov の安定定 理に基づき学習過程の安定性を保証するモジュール学習法を提案し,さらにモジュール型強化学 習をエアロロボットに適用し,複雑な運動を行う際のモジュールの変化について考察する. 2. 適応的・学習制御系の構築 2.1 複数のモジュールを用いた強化学習 非線形性,非定常性を持つ環境のもとで,その様々な 状態や動作モードに最適な制御則を学習し,それらを適応的に切り替え,組み合わせる強化学習 方式としてモジュール型強化学習 (MMRL) が提案されている [5, 6].Fig. 1 に MMRL の概略を示 す.本稿では,適切な Lyapunov 関数を設計し学習エージェントの選択する行動を Lyapunov 関数 が減少する方向に限定することにより,学習過程における安定性を保証する学習則を提案する.以 responsibility signal λi predictor softmax controller ui i-th module input u(t) environment output x(t) 図 1: Modular Learning 図 2: Flight Experiment of an Autonomous Aerorobot 下では,Lyapunov の安定定理に基づいた学習則を導出する.次の非線形モデルを考える. ẋ(t) = f (x(t), u(t)) (1) ここで,x(t) は状態変数,u(t) は制御入力である.制御対象 (1) は次のように局所線形化できる とする. (2) ẋ(t) = A(xk , uk )x(t) + B(xk , uk )u(t) ここで, x(t) は状態変数, u(t) は制御入力であり, xk ,uk は基準点である.各モジュールは ˆ ẋ(t) = Âx(t) + B̂u(t) + v (3) により状態を予測する.v は安定性を保証するために導入される疑似入力である.予測モデルの 誤差を Ã = A − Â, B̃ = B − B̂ のように表すと,予測モデルの推定誤差は ė(t) = Ãx(t) + B̃u(t) − v (4) と書ける.推定誤差が小さいほど各モジュールは正しい予測モデルを持つことになる.この推定 誤差を小さくするように学習則を決定する.式 (4) に関して Lyapunov 関数の候補として次の関数 を考える. 1 1 V = eT P e + tr(ÃT ΓA Ã + B̃ T ΓB B̃) (5) 2 2 ここで,P は正定対称行列であり, ΓA , ΓB は正定の重み行列である.式 (5) の時間微分は, V̇ ˙ + B̃ T Γ B̃) ˙ = ėT P e + tr(ÃT ΓA Ã B (6) (4) を (6) に代入すると,次式を得る. V̇ ˙ + B̃ T Γ B̃) ˙ − vT P e = xT ÃT P e + uT B̃ T P e + tr(ÃT ΓA Ã B ˙ + B̃ T (P euT + Γ B̃)] ˙ − vT P e = tr[ÃT (P exT + Γ Ã) A B (7) ˙ ˙ Â, B̂, v を ˙ ˙ = Γ−1 P exT Â = −Ã A ˙ ˙ −1 B̂ = −B̃ = ΓB P euT v = Le (8) 第4章 研究成果報告 のように表すと,式 (7) の第 1 項,第 2 項が消える.このとき,式 (7) は V̇ = −eT LT P e (9) となり,LT P が正定であるとき,負定となることが分かる.よって,式 (8) にしたがってパラメー タの学習を行うことで,予測誤差の漸近収束が保証される.モジュール i の責任信号は予測誤差の softmax 関数により与えられる. exp(−Ei (t)/2σ 2 ) λi (t) = 2 j exp(−Ej (t)/2σ ) (10) ここで,σ はモジュール選択性の鋭さを決定するパラメータである.その責任信号を用いて各モ ジュールの予測モデルの重み付け和をとった ˆ = fˆ(x(t), u(t)) = ẋ λj fj (x(t), u(t)) (11) j が全体としての予測モデルとなる.また,環境への行動は強化学習コントローラの出力 u = −Kx − ĝ (12) の責任信号による重み付け和により決定される.K はリカッチ方程式を解くことにより得られる 最適ゲインであり,予測モデルの変化に伴い変化する.さらに,各モジュールの予測モデルおよ びコントローラの学習は責任信号に比例した割合で行われる. 2.2 自律飛行制御系 本節では,自律型エアロロボットの飛行実験の結果を示す.本研究では,エ アロロボットとしてヤマハ発動機 (株) 製産業用無人ヘリコプタ RMAX をベースに用いた.Fig. 2 にエアロロボットの飛行実験の様子を示す.RMAX 自体はそもそも農薬散布などを目的として開 発された無人ヘリコプタであり,手動で遠隔操作するものであるが,エアロロボットに GPS(Global Positioning System) などのセンサや飛行制御用のコンピュータを搭載することにより高精度で飛行 状態を計測し飛行制御することが可能となっているほか,様々な観測用装置を取り付けることが できるため,防災活動など様々な目的に応用されている [8].しかし,回転翼機は動特性が不安定 で非線形性をもつことから,固定翼機と比べて制御が重要な役割を果たす.さらに,環境条件な どにより特性が変化し,風などの外乱の影響を受けやすいため,自律型エアロロボットにとって 環境の変化に対して適応的な振る舞いをすることが重要となってくる.本稿では,提案手法を複 雑なマヌーバにおける高度方向制御に適用する.モデルを作成する際には何らかの仮定をせねば らならない.ここでは, • メインロータの推力係数は高度や上下速度によらず一定である. • 上下方向の移動には空気抵抗が働き,その大きさは速度に比例する. という仮定を設けた.また,[9] では提案手法により構築した制御系によりエアロロボットの高度 制御を行うことが可能であることを示したが,目標高度への追従に定常偏差が存在した.これは, 高度方向の制御入力であるコレクティブピッチ角のトリムが空気密度や機体重量により変化する ためにトリムのずれが生じていたためである.このような高度誤差に偏りはモジュールの学習に 影響を与える可能性がある.そこで,この問題を解決するために本実験では予測モデルに不確か さの項を考慮し,エアロロボットの高度方向の線形化された運動方程式を ẋ = Âx + B̂u + g x= x1 x2 , Â = 0 1 0 â , B̂ = (13) 0 b̃ , ĝ = 0 ĝ , (14) 140 altitude desired position 120 heading (rad) altitude (m) 45 40 35 30 25 20 15 10 5 0 100 80 60 40 20 0 0 100 200 300 400 500 600 700 800 900 0 100 time (sec) 200 300 400 500 600 700 800 900 time (sec) 図 3: Response to desired position zd (t) in altitude control 図 4: Transition of heading とする.ここで x1 は高度,x2 は鉛直方向速度,u はコレクティブ入力,â, b̂ は空気抵抗および 推力係数に相当するパラメータ, ĝ は不確かさを表す項である.各モジュールの予測モデルのパラ メータの初期値はフライトシミュレータを用いてあらかじめ得られたものを用いた.それぞれの モジュールの強化学習コントローラは u = −Kx − ĝ (15) を用いた.K はリカッチ方程式を解くことにより得られる最適ゲインであり,予測モデルの変化 に伴い変化する.飛行実験において,評価関数 J として J= ∞ 0 x21 (t) + 1.5u2 (t)dt (16) を用いた. 2.3 結果と考察 モジュールの変化を調べるため,以下のように 3 つのフェーズからなる実験を 行った. • フェーズ 1:(0sec∼240sec) エアロロボットは機体軸前方に一定の速度で移動する.同時に,一定角速度で方位角を増加さ せる.その際,高度変化しないものとする.すなわち,このフェーズではエアロロボットは水 平面内で時計回りに円軌道を描く. • フェーズ 2:(240sec∼840sec) 水平方向の目標軌道はフェーズ 1 と同じであるが,追加的に上下方向の命令を加える.その際, 以下のように上昇と下降を周期的に行うこととする.目標高度は 15 秒毎にホバリング → 上昇 → 上昇停止(高度一定)→ 下降 → 下降停止(高度一定)と変化する.したがって,このフェー ズでは周期的な上下運動を伴う旋回,すなわち螺旋状の軌道を描く. • フェーズ 3:(840sec∼) 上下方向の周期運動を停止させ,一定高度に保つ.したがって,このフェーズでの運動はフェー ズ 1 と同じように高度一定とした円軌道である. 提案手法の有効性を確認するため 3 つのモジュールを用いて実験を行った.エアロロボットは提 案手法を用いた高度制御により目標値に十分な精度で追従することができた.この結果から,エ アロロボットは複雑なマヌーバを行うことが可能であるといえる.Fig. 5, 6, 7 にフェーズ 1, 2 に おける飛行経路を示す.また,担当するモジュールにより異なる色で表している.フェーズ 1 では 高度方向の運動は行っていないため,本来モジュールの分化は行われないはずであるが,実際に は 2 つのモジュールに分化していることが Fig. 5 からからわかる.この要因としては,ヨーイン グ運動が考えられる.飛行実験の際には北西風が吹いていた.本実験中に風向きは地球固定座標 系では大きくは変化しなかったが,機体固定座標系では機体のヨーイング運動の影響を受けて大 第4章 研究成果報告 altitude (m) altitude (m) Module A Module B Module C 40 35 30 25 20 15 10 5 0 -5 40 35 30 25 20 15 10 5 0 -5 10 10 5 0 x(m) -5-10 -15 -20-5 0 5 20 25 10 15 y(m) 図 5: Relation between three modules(0∼240sec) Module A Module B Module C 5 0 x(m) -5-10 -15 -20-5 0 5 10 15 y(m) 20 25 図 6: Relation between three modules(240∼ 360sec) きく変化する.機体のヨー角と地球固定座標系の風向きから判断すると,フェーズ 1 では向かい 風を受ける領域でモジュールの変化が起こっている.その際には高度方向の速度が風の影響を受 けて大きく変化しており,これがトリガーとなったものと考えられる.また,異なる環境条件や 異なるマヌーバで実験を行った結果においても,機体に対する風向きがモジュールの関係に影響 を与えていた [10].また,Fig. 6, 7 からフェーズ 2 に移行すると緑色で示したモジュール A が担 当する領域が徐々に増えていくことがわかる.さらに上下運動を続けると,フェーズ 1 で見られ たモジュール B とモジュール C の関係は見られなくなった.フェーズ 2 では旋回運動に上下運動 が加わることにより,フェーズ 1 から飛行状態すなわち環境が変化しているが,この環境の変化 に対してフェーズ 1 では使われていなかったモジュールを用いることにより適応していることが わかる.また,フェーズ 2 ではフェーズ 1 で形成されたモジュールでは環境変化により高度制御 が十分ではなくなったと考えられ,モジュール自体およびその関係を変化させることにより環境 の変化に適応したことがわかる.これらの結果から,提案手法により,環境との相互作用からモ ジュールを適応的に変化させることが可能であることが明らかである.また,モジュール間の関 係は固定的なものではなく,それぞれのモジュールの振る舞いにより適応的に変化するといえる. しかし,モジュールが変化し続けていることは,制御対象に関する情報を保持できず,獲得し た情報を忘却してしまったことを意味する.本実験ではモジュール数が 3 個と十分でなく,与え たタスクにとって冗長なモジュールが存在しなかったといえる.モジュール数が十分でないとき には本実験結果のように獲得した情報を失うことになる.しかし,失った情報は変化した環境を 制御するためには不要な情報であり,そのような不要な情報に固執することは学習が十分に進ま ないことを意味するために好ましくない.本実験の結果は,本手法がすでに十分でなくなった情 報を棄却し学習速度を保つことができることを意味している. 3. おわりに 本稿では複数のモジュールからなる制御系の安定な学習則を Lyapunov の安定定理に基づき導出 し,十分な制御性能をもつ制御器を学習することが可能であることを示した.非線形な制御対象 に対して, すべての動作モードにおいてモデルを求めることにより制御系を設計することは現実的 ではない.このため,オンライン学習を行う複数のモジュールからなる制御系を構築することに より,環境との相互作用からその振る舞いを適応的に生成,変化させることが有効であることを エアロロボットの飛行制御系の構築に適用した例により示した.飛行実験では,3 つのモジュール を用いたが十分ではなかった.しかし,冗長なモジュールを含むことにより,制御対象の事前情 報と獲得情報の両方を保持することが可能になると考えられる.このため,事前情報と獲得情報 altitude (m) Module A Module B Module C 40 35 30 25 20 15 10 5 0 -5 10 5 0 x(m) -5-10 -15 -20-5 0 5 10 15 y(m) 20 25 図 7: Relation between three modules(360∼480sec) の両方を十分に考慮したモジュール構成を学習すること,およびモジュールを統廃合するメカニ ズムが今後の課題である. 参考文献 [1] R. S. Sutton, A. G. Barto 著,三上貞芳,皆川雅章 共訳: 強化学習, (2000), 森北出版. [2] T. Perkins and A. Barto: Lyapunov Design for Safe Reinforcement Learning, Journal of Machine Learning Resarch, vol. 3, (2002), 803-832. [3] B. Kim and A. Calise: Nonlinear Flight Control Using Neural Networks ,Journal of Guidance, Control,and Dynamics, vol.20, no.1, (1997), 26-33,. [4] E. Frazzoli, M. A. Dahleh, and E. Feron: A hybrid control architecture for aggressive maneuvering of autonomous helicopters, IEEE Conference on Decision and Control, December, (1999). [5] M. Haruno, D. Wolpert and M. Kawato: Mosaic model for sensorimotor learning and control, Neural Computation, vol. 13, (2001), 2201-222. [6] K. Doya, K. Samejima, K. Katagiri and M .Kawato: Multiple model-based reinforcement learning, Neural Computation, vol. 14, (2002), 1347-1369. [7] R. E. Kalman and J. E. Bertram: Control system analysis and design via ”second method” of Lyapunov I: Continuous-time systems, Transactions of the ASME: Journal of Basic Engineering, June, (1960), 371-393. [8] H. Nakanishi, H. Hashimoto, N. Hosokawa, K. Inoue and A. Sato: Autonomous Flight Control System for Intelligent Aero-Robot for Disaster Prevention, Journal of Robotics and Mechatronics, vol. 15, no. 5, (2003), 489-497. [9] M. Bando, H. Nakanishi and K. Inoue: A Study on Designing Control System by Modular Learning, Proceedings of SICE Annual conference 2004, (2004), 1071-1074. [10] 坂東麻衣, 中西弘明: リアプノフの方法によるモジュール型強化学習に関する研究, 第 32 回知能システ ムシンポジウム, (2005), 121-126 第4章 研究成果報告 自律ロボットの自発的行為を通じた 創発的機能形成についての研究 工学研究科精密工学専攻 谷口 忠大 Abstract: In this annual report, two major topics are presented; one is about a relationship between symbol emergence and embodiment for an autonomous robot, and the other is about the acquisition of generalized behavioral concepts that are valid even when the surrounding environments dynamically change. We have proposed a model called Dual-Schemata model as a novel machine learning architecture enabling an autonomous robot to form environmental concepts incrementally and to obtain behavioral concepts under a variety of environments. This model is commonly used to deal with both of those topics. Symbol emergence within an autonomous robot can be attributed to its category formation process within a robot, which is then affected much by a variation of surrounding environemnts as well as by their ”visibility” through a robot’s available sensors. The formalization of this dynamic adaptation mechanism ongoing within a living organism is provided based on our Dual-Schemata model, and futher longer time range adaptation (i.e., development of action concepts) is discussed in terms of reinforcement learning validated even when the encountering environments change. Key words: Schema, Generalized behavioral concept, embodiment, and symbol 1. はじめに 人間などの生体のように,自律的に環境と相互作用を行う中で,新たな振る舞いや概念を組織 化していく機械システムの設計論を探求するのが本研究の大きな目標である.このような研究に おいて,近年,階層性やモジュール構造といった内部構造を有した自律学習機械システムの研究が 盛んである.特に強化学習の研究においては多くの研究事例がある.典型的なものとしては,階層 性については状態空間の段階的縮減による学習の効率化,モジュール構造については非線形な系 の局所的な線形ダイナミクスへの分割といったものがある.このような方向性はより高度なロボッ トを作ろうとする制御の効率性,性能の向上を志向したアプローチといえるが,このような方向性 とは異なり,より自律系の構成的 (constructive) な適応能力の実現に重きを置いたアプローチがあ る.つまり,発達的機能形成を可能とするような自律系自身による内部構造の累増的獲得を目指す といういうアプローチである.構成的な立場では,自律的な階層性の獲得や新たなモジュールの 適応的な追加・削除といったダイナミクスを考えることができるが,それらは往々にして,on-line で学習を行うロボットにとっては投機的な行為であり,短期的視野に立てば制御論的な安定性な どを犠牲にする場合が多い.しかし,いわゆる制御パラメータ変更というような単純な適応ダイ ナミクスを超えた,このような構成的な構造変化は,環境変化の認識や獲得知識の汎化などに役 立つ可能性が大いにある.このようなアプローチによる利点ははリアプノフ安定性などの旧来の 制御論に裏打ちされた評価手法では測り難い点が多いことは否めないが,動的機能機械システム の設計論という立場からみると挑戦すべき課題であるといえる. このような文脈のもと,本年度の研究では,主に二つのトピックを扱った.一つは,自律ロボッ トが環境との相互作用を通して行う構成的な概念生成における身体依存性と文脈依存性について であり,もう一つは環境の変化に対して普遍性を保つような行為概念の形成に関してである.2 章において両研究を通して用いられる Dual-Schemata model を概観し,次に3章において前者につ いての報告をする.さらに,4章において後者についての報告を行い,5章でまとめる. 2. Dual-Schemata model(双シェマモデル) 本章では我々が提案している双シェマモデルを簡単に説明する.このモデルは昨年度の報告書 においても報告したが,本稿で報告するものは,本年度の研究の成果である行為シェマの獲得の ために強化学習を用いる手法をこれに追加したものである.この手法を用いることで,自律ロボッ トは前もって埋め込まれた行為を環境適応を通じて発現するのみならず,外部から与えられる報 酬を通じて未知タスクを学習することが可能となる.また,Dual-Schemata model の具体的な立式 は昨年度提案したものから多少の変更を加えた LDS(Light Dual-Schemata model) というモデルを 導入する.この二つには本質的には等価である. 2.1 双シェマモデル Dual-Schemata model(双シェマモデル) は J.Piaget が人間の発達プロセスを説 明する為に提唱したシェマ理論 [6] を元にした,自律ロボットが環境との相互作用を通して環境・対象 の モ デ ル に 相 当 す る シェマ( 概 念 )を 獲 得 す る 累 増 型 モ ジュー ル 学 習 器 で あ る . 自律ロボットは何かしらかのセンサ系 (sensor) とモータ系 (motor) を持つものと仮定する.それぞれの入出力は毎時 有限次元の実数ベクトルで与えられ,それぞれ , とす る.また,自律ロボットは直接的な外部からのセンサ入力 のほかに,短期記憶 (short-term memory) などの参照可能な 入力を持ち,これを とし,これにより拡張された入力を Ý とする (ここで は二つのベクトル空間の直和 空間での自然な和を指す).また,自律ロボットはこれらの 値を自らの持つ固有のサンプリングレートで取得,出力す るものとし,この一周期を とする. のような添え字 の は自律ロボットにとっての離散時間を指し,実際には 図 1: 双シェマモデル この 1step 間に の時間が経過しているとする. 2.1.1 知覚シェマ (Perceptional schema) 自律ロボットが自らを取り巻く環境と相互作用する中 で,知覚シェマの内部関数は相互作用のダイナミクスを自律的に学習していき,その環境のダイ ナミクスを表象する存在となる.n 番目のインデックスを持つ知覚シェマを と呼び,以下の 2つの内部関数を持つとする. Ý (1) ·½ Ý ·½ (2) はしばしば順モデル (forward model) とよばれ, は逆モデル (inverse model) と呼ばれる場合が 多い.自律ロボットにとっての自己と環境との相互作用ダイナミクスは,これらの関数によって 表象される(三項の関係を正しく予測するかぎりにおいて). ここで全ての知覚シェマはこれら 二つの関数をその内部に持ち,継続的にこれを更新し続ける.LDS では内部関数として用いるも のは線形関数に限定する.これは,知覚シェマ内部に順モデルと逆モデルをコヒーレントに獲得 する為である. 2.1.2 行為シェマ (Intentional Schema) もう一方のモジュール群は行為シェマ (intentional schema) と呼ばれる.知覚シェマが環境や行為対象の表象として働くのに対して,行為シェマは自らの振 る舞い,行為の表象として働く.その具体例については後の実験において示す.m 番目のインデッ クスを持つ行為シェマを と表し,内部関数として を持つとする. ·½ Ý (3) この式に於いて ·½ は次の時刻に要求する目標状態(desired value) としての ·½ をあらわす.こ れからもわかるように行為シェマの働きはエージェントの感覚入力を如何に変更していくかとい う指令値を現在の状態を参照しながら,時々刻々知覚シェマに出力し続けることにある.また,環 境のモデルを用いないフィードフォワード的行動を表現する為に知覚シェマを参照しない無知覚 行為シェマ (by-pass intentional schema) が存在するが,本稿では説明を省略する.行為シェマの学 習は主に強化学習を用いて行うことが出来,この時,Dual-Schemata model は階層的モジュール型 強化学習器と見なすことが可能になる [5]. 第4章 研究成果報告 2.1.3 シェマ状態(Schema state) 図 1 に示したように Dual-Schemata model は知覚シェマ選択 器 (perceptional schema switch) と行為シェマ選択器 (intentional schema switch) を持つ.モジュール 型学習器では必ずスイッチング(排他的選択)もしくはゲーティング(重ね合わせの為の重み計 算)の機構が必要となるが,Dual-Schemata model では排他的な選択を行う.あらゆる時刻におい て,それぞれの選択器は一つのシェマを選択する.それぞれの選択器がどのようにシェマを選択 するかについては後ほど述べる.時刻 において知覚シェマ選択器が を,行為シェマ選択器 が を選択したとき,シェマ状態 は以下のように定義される. (4) これらの表記を用いて行動関数 は知覚シェマ に含まれる逆モデル と行為シェマ に 含まれる内部関数 を用いて以下のように表現される. ´ µ Ý Ý Ý (5) 2.2 知覚シェマの適応ダイナミクス 知覚シェマは均衡化 (equilibration)・分化 (differentiation) とい う対になったダイナミクスを通して時変的な環境に対して適応していく.均衡化は同化 (assimilation) と調節 (accommodation) という二組のダイナミクスにより構成され,同化によりシェマが環境と の相互作用を通して生じた経験サンプル ·½ を取り込み,みずからを調節を通して変更 する.シェマは自らが取り込んだ経験を元に,自らが担当する経験サンプルの領域を変化させる. この時,経験サンプルが自らの担当する領域に含まれるか否かは,過去に自らが同化したサンプ ル集合と新たな経験との相対的な関係において決定される.この相対的な誤差を主観的誤差と呼 ぶ.また,知覚シェマは同化されたサンプル群に合わせて自らを変化させていく. 環境との相互作用のダイナミクスが変化し,新たな経験サンプルに対して,全ての既存のシェ マが同化を拒否した場合,新たな知覚シェマが分化のプロセスを通じて作成される. このような適応ダイナミクスは全体としては累増的なモジュール群によるモデル学習として捉え ることが出来る.本稿では紙面の都合上,詳細な立式は述べない. (詳細は文献 [1, 4, 3, 2] を参照) 2.3 行為シェマの適応ダイナミクス 本節では新たに,双シェマモデルのもう一つの構成モジュー ルである行為シェマについて,外部からの報酬を用いた学習手法を提案する. 2.3.1 メタな行為概念 双シェマモデルの枠組みにおいて, 行為シェマは ·½ の二項関係を表す.これは自律主体 にとっての一まとまりの行為系列とは受容される一連のセ ンサ値の系列で決められる状態空間内のアトラクタとして 描かれることを前提とした定義である.行為シェマは自律 ロボットが自力で獲得出来るセンサ空間の中のベクトル場 図 2: 行為シェマの強化学習 として張られ, ,自身の有するアクチュエータ能力としての 実際のモータ出力 とはまったく無縁に定義される.自律主体の行為の自らにとっての意味とは, 自らのセンサ入力のみから認識されると考える.この仮定により,自律ロボットはダイナミクスの 異なる新たな環境下においても,獲得した行為概念を応用することがで出来る.モータ出力 が どのように出力されようとも,その環境への影響の結果が自身のセンサを通して観測できない場 合,有意義な行為としては理解されえない.つまり,行為シェマ の内部関数 ·½ は一段メタな行為であると理解できる.行為シェマは知覚シェマと同様に並列に複数存在し,行 為シェマ選択器によって選択されるが,本稿では行為シェマの一つに外部教示者からの報酬をあ てがうことにより,外部教示者の意図する所望の振る舞いを強化学習により学習させる方法を提 案する. 図 3: 身体性の異なるロボット 図 4: 身体パラメータと表象生成の非 線形な関係 2.3.2 行為シェマの強化学習 強化学習の理論は従来,離散状態空間において定式化されてきた. しかし近年は行動価値ベースの強化学習,状態価値ベースの強化学習ともに連続空間上に拡張す る方法が提案されている.中でも,銅谷らが提案した連続時空間上での Actor-Critic 法 [8] は連続 空間のみならず,連続時間へも拡張することにより,ことなるサンプリング時間で動くロボット に対しても等価な学習係数を設定することが可能になっている.連続空間への拡張は,具体的に は価値関数 (Critic) と方策関数 (Actor) を基底関数の線形和として関数近似することにより実現す る.この手法は通常のモータ出力を出力 として定式化されているが,我々は,この方法におい て,入力を ,出力を ·½ とすることにより,行為シェマの学習手法として利用した(図2). また,通常の手法では,自らの出した出力 を学習時に利用するが,行為シェマにおける学習 の場合,最終的に現れるセンサの次入力としての ·½ は知覚シェマの均衡化の進み具合によって は,知覚シェマに出力される ·½ とは異なる.よって,我々は次入力として得られる ·½ を実際 に行為シェマがとった行為と見なし,actor の学習に利用した.また,局所的にしか与えられない 報酬に対しても対処できるようにするために,適格度トレース (eligibility trace) を critic だけでな く,actor にも導入した.この手法は木村らの方法 [7] と同様である.強化学習の立式の詳細につ いては参考文献 [7, 8] に譲る. 3. シェマ生成の身体依存性と文脈依存性 3.1 シェマ生成の身体依存性 人間の自律系にとっての概念生成において,先天的な範疇はそう 多くなく,後天的な経験や,自らの身体,所属する社会に応じて適応的に変化することが知られ ている.つまり,概念生成とはあくまでも,主体の環境のかかわり方に依存するものであると考 えている.これは人間の発達における,概念形成のモデルとして個々の主観性を陽に見たもので ある.自律ロボットの概念学習において従来のパターン認識的なアプローチでは,社会において 一般的に定義されたカテゴリをどうロボットに教え込ませるかという点に主眼がおかれ, 「なぜそ れが一括りのカテゴリであるのか?」という点については軽視されてきた.しかし,社会におい て定義されたカテゴリも必ずその由来があるはずであり,それはやはり個人の認知的なカテゴリ 形成に端を発すると考えられる.つまり,個人の経験の仕方が初期的なカテゴリ形成に大きく影 響を及ぼすと考えられる.また,これらの経験は個人の身体性に強く影響を受ける.これに対し, 我々は 身体性と内的表象形成についての依存関係 [4],特にその非線形な関係性について仮説(身 体性と表象生成の非線形仮説(図4))を立て,我々の Dual-Schemata model がそのような関係性 を表現する構成論であることを示した [2].非線形名関係性とは図4に示すように,センサーの時 間解像度や身体サイズといった,身体能力が対象に対し相対的に中間的な値を示すときに最も表 象生成をおこなうというものである。説明の詳細は [2] に譲る。 具体的な実験としては,シミュレーション空間上に視野 ( ) と時間解像度 ( ) が異なる ロボットを用意し(図3),4種類の運動モード(静止,縦運動,横運動,円運動)を持つ運動球 を追跡するタスクをあたえた.前章で述べた,知覚シェマの適応ダイナミクスを働かせて,学習 を行わせた結果,内的表象(知覚シェマ)の生成量について図6に示すように,これら2種類の 第4章 研究成果報告 図 5: 身体パラメータとパフォーマン スの変化の関係:自律的な表象生成が 有る場合と無い場合についての比較 図 6: 表象生成の視野の広さと時間解 像度についての非線形な依存性 身体パラメータと表象生成量についての非線形な関係が得られた [2].また,パフォーマンスにつ いても,表象生成が積極的に行われる中庸な身体パラメータを持つロボットに於いて向上すると いう結果を得た(図5).これらは生態学的認識論の研究などにおいて強く示唆されている,身体 性と表象生成の関係を,構成論的な立場から支持する結果であるといえる. 自律ロボットの設計論に於いても,一章で述べたように,このような表象というモジュール構 造を先天的に与えるのではなく,自らの身体に合った形で後天的に獲得させるという考え方は構 成的な視点から重要な考え方といえる. 3.2 シェマ生成の文脈依存性 我々はこのような概念形成が相互作用の文脈にも依存すると考え, これについて検証を行った.我々は Dual-Schemata model を実装したロボットが提示される運動球 の運動モード変化のさせ方に依存して,カテゴリ形成を変化させていくことを確認した.これは Dual-Schemata model のもつ概念生成が決してアプリオリな境界を持たず,適応的にそれを変化さ せていることを示している.その詳細については文献 [3] に譲る. 4. メタな行為概念の獲得:行為シェマの強化学習による獲得 一般的な強化学習などの学習手法では環境が一定であることを仮定し,その環境下での方策を 学習させる.この場合,出力値を直接教えることを教師あり学習と呼び,報酬をとおして間接的 に教えることを強化学習と呼ぶが,そのどちらの手法でも環境が変化した場合の獲得方策の再利 用可能性は保証されない. 一般に教師あり学習で教えられた各教師値以外の値を正しく出力できる性能を学習器の汎化能 力と呼ぶが,学習器がこのような汎化能力を持っていたにしても環境の変化にたいしてはその獲 得知識を応用できるわけではない.これに対して,動的環境下で行動する自律ロボットにとっては 環境の変化に対して柔軟な,すなわち異なる環境下でも利用可能な方策をいかに獲得するかとい う問題が非常に重要である.特に強化学習では一つのタスクを学習する際に膨大な学習ステップ 数を求められる場合が多い.その場合,環境が変化するたびに再度,一から学習しなければなら ないのでは,実際の動的環境下では役立ち難い.我々はこのような方策の他の環境下での再利用 可能性を,学習機構のメタな汎化能力と呼ぶことにする.我々は Dual-Schemata model において, 行為シェマにおける強化学習と知覚シェマにおける均衡化・分化のダイナミクスを並行して走ら せることにより,環境の変化に対して知覚シェマの切り替えを通して柔軟に適用できるメタな汎 化能力を持った方策を獲得することが出来ることを示した [5].実験タスクとしては,前章のもの とほぼ同様のものを用いた.図7に示す,3種類の学習機構を持たせたエージェントに静止球の 追跡を強化学習を通して学習させた後に,円運動の追跡を学習させた.その学習が完了した後に, 強化学習のダイナミクスと均衡化のダイナミクスをオン・オフさせながら環境を切り替えたとき の error 値を図 8 に示す.3 番目のエージェントは Dual-Schemata model の持つ分化のダイナミク スを通して円運動と静止球についての記憶を分散的に保持することが出来ているために,環境の 図 7: 3種類の強化学習:1) 一般的な強 化学習 2) 分化の無い Dual-Schemata model 3)Dual-Schemata model 図 8: 学習ダイナミクスと環境の変化に対するエ ラー値の変化 変化に対して追加学習なしに柔軟に再適応できていることが分かる. 5. 最後に 本稿では,自律ロボットが環境との相互作用を通して行う概念生成における身体依存性と文脈依 存性と,環境の変化に対して普遍性を保つような行為概念の形成に関しての研究を報告した.工場 環境ではなく人間環境のような動的な系へと自律ロボットを導入する際,いかなる内部構造をロ ボットに前もってデザインするべきかは設計者にとって未知である.故に,直接的に機能モジュー ルを設計するよりも,モジュール構造や階層性といった内部構造を環境との相互作用の中で獲得 していくメタな機能をデザインする必要がある.ただし,1章でも述べたように,そのようなド ラスティックな構造変化のメリットを数理的なアプローチで解析するのは現在では困難である.し かし,4章で示したように,そのような内部構造の動的な獲得が,異なる環境下への獲得行為概 念のメタな汎化に役立つという事実が実際にある.制御論的な安定性評価という視点も重要では あるが,動的機能機械の設計論という立場からすれば,このような構成的な機能についての研究 が新たな展開を生んでいくのではないかと我々は考えている.今後は Dual-Schemata model の非線 形系への自然な拡張や,行為シェマの累増的な獲得といった課題に取り組んでいく。 参考文献 [1] 谷口, 椹木: 双シェマモデル; 人工知能学会論文誌, Vol.19, No.6, pp.493–501 (2004) [2] 谷口, 椹木: 身体と環境の相互作用を通した記号創発:表象生成の身体依存性についての構成 論; システム制御情報学会誌,(投稿中) [3] T. Taniguchi, T. Sawaragi: Design and Performance of Symbols Self-Organized within an Autonomous Agent Interacting with Varied Environments; IEEE International Workshop on RO-MAN , (2004) [4] T. Taniguchi, T. Sawaragi: Self-Organization of Inner Symbols for Chase: Symbol Organization and Embodiment; IEEE International Conference on SMC 2004 CD-ROM, (2004) [5] 谷口, 椹木: 顔ロボットの移動物追跡のための運動記憶の動的構成による環境適応, SICE シス テム・情報部門学術講演会 2004 講演論文集,pp.185–190,(2004) [6] John H.Flavell: The Developmental Psychology of Jean Piaget: Van Nostrand Reinhold, 1963, (岸 本 訳:ピアジェ心理学入門, 明治図書,(1969)) [7] H. Kimura, S. Kobayashi, “An Analysis of Actor/Critic Algorithms using Eligibility Traces: Reinforcement Learning with Imperfect Value Function” 15th International Conference on Machine Learning, pp.278-286, (1998) [8] K. Doya, “Reinforcement Learning In Continous Time and Space ”, Neural Computation, Vol.12(1), pp.219-245,(2000) 第4章 研究成果報告 インテリジェントシステムの学習による 複雑な機械システムの制御系設計に関する研究 工学研究科航空宇宙工学専攻 中西 弘明 Abstract: Designing control system for complicated mechanical systems by training of intelligent system is developed. We propose a method to design robust control systems against stochastic uncertainties by use of off-line training of neural networks. Power law scaling, which is widely found in nature and complex systems, can be found in numerical simulations like HOT. Interaction between human operators and autonomous robots will become important to perform various activities, so that human’s operations and their adaptive behavior are analyzed by use of simple experiments for remote operation of an autonomous unmanned helicopters. Key words: Intelligent system, Learning, Robust Controller Design, Power law scaling, Unmanned helicopter 1. はじめに ロボットなどの制御対象や動作環境は一般に複雑であり,完全に正確なモデルが得られること は希である.また,正確であっても複雑すぎるモデルは制御系の設計や実現を困難なものとする ので,多くの場合には近似モデルが使われる.このような近似には近似誤差が伴うのが一般的で あり,このような誤差や未知な動特性は不確かさと呼ばれる.また,環境や制御目的,システム の特性は一般には一定ではなく変化するものである.例えば実験室内のように整えられた環境と は異なり,屋外で活動するロボットは複雑かつ変化しやすい環境下で動作せねばならない.この ように環境や目的の変化などシステムの特性の変化に対応して制御を行うことは一般に容易では ない.本研究では複雑な制御対象モデルを直接扱うことが可能であり,環境によって特性が複雑 に変化する機械システムを有効に制御し機能を実現するための制御系の構築をニューラルネット ワークに代表されるインテリジェントシステムの学習や適応により行う方法を示す.また,パイ ロットは不確かな環境におかれても,上手く適応して操作をする.自律型無人ヘリコプタの遠隔 オペレーションを例にして,オペレータの操作における適応についても調べる. 2. 不確かさに対するロバスト制御系の学習 本研究では (1) で表される制御対象を取り扱う. x(t + 1) = f (x(t), u(t), v(t)) (1) ここで,x(t), u(t) はそれぞれ状態変数,制御入力であり,v(t) は確率的に変化する制御対象の不確 かな成分である.確率的な不確かさ v(t) に対してロバストな制御系を,図 1 に示したようなニュー ラルネットワークを用いた状態フィードバック制御系により構築することを本研究の目的とする. L を正定関数として,一試行の制御結果の評価に J= T L(x(t), u(t)) (2) t=0 を用いる.確率的な不確かさ v が存在しないときは (2) は確定的に定まるが,確率的な不確かさ v により (2) も確率的に変動する.ここで,確率的な不確かさ v としては時間的な変化が早いもの と時間的な変化は十分に緩やかなものが考えられる.外乱や観測雑音は前者の典型的な例である. また,制御対象の不確かなパラメータは後者の例として考えられる. 確率的な不確かさにより,評価関数 (2) の値は試行毎にゆらぐ.その偏差が大きいことは,制御 系が確率的な不確かさにより大きく乱されることを意味するので,その制御系は不確かさに対し てロバストではないといえる.仮に,評価関数の確率的な変動を無くすことができるとすると,完 全に確率的な不確かさの影響を取り除くことができることになるが,制御系によりある程度まで ロバスト性を高めることができても,確率的な不確かさの影響を完全に取り除くことは実際には 不可能であろう.また,一般にロバスト性の向上により制御性能は低下してしまうため,適切な 大きさのロバスト性を持つ制御系の設計も重要である.文献 [1] ではスカラー γ をパラメータとし て含む評価関数 (3) を用いた学習によるロバスト制御系の構築方法を提案している. Jγ = 1 log (E [exp(2γJ)]) 2γ (3) ここで,E[J] は J の期待値である.γ に関する Taylor 展開により,(3) は (4) のよう展開できる. Jγ = E [J] + γV ar [J] + O(γ 2 ) (4) ここで,V ar[J] は J の分散である.(4) より明らかなように,この学習法は γ によって 3 つの場 合に分類することができる. 1. γ = 0 ただし,この場合は Jγ は E[J] とする.評価関数 J の平均のみを考慮する学習方法. 2. γ > 0 評価関数 J の平均値とその分散を考慮する学習法.分散が大きくなることを防ぐこと により,評価関数が期待値から大きく隔たる値が得られることを防ぐ学習方法. 3. γ < 0 評価関数 J の平均値とその分散を考慮する学習法.分散が小さくなることを防ぐこと により,評価関数が期待値から大きく隔たる値が得られることを許容する学習方法. J の平均が小さくてもその分散が大きいということは,その制御系は確率的な不確かさによる影 響が大きいことを意味するので制御系として好ましくない.このために,ロバスト制御系の学習 を行なう際に用いるのは γ ≥ 0 である.(3) の計算のためには指数関数の計算を行う必要がある. このため,計算を行う際に十分に注意をしなければ,計算結果が発散したり数値誤差が大きくな りやすい.このような計算の困難さを避けるために, Jγ = E [J] + γV ar [J] (5) ように評価関数を設定して学習を行なうことも考えられる.しかし,制御対象に存在する不確か さが正規分布に従っても,一般に評価関数 J の分布は正規分布にはならず,また,非線形性のた めにその分布はゆがむ.よって,Jγ を用いる学習では評価関数の平均値や分散などを何らか方法 に基づいて推定する必要がある.最も簡単な方法はモンテカルロシミュレーションを用いること であるが,精度よく求めるためには計算する標本数を多くする必要があり,標本数の増加は学習 に要する計算時間の増加をもたらすという欠点がある.そこで参考文献 [2] などで提案されている Unscented Transformation を用いて平均や分散の推定を行う.Unscented Transformation はサンプリ ングされた標本結果により統計量を推定するものであることはモンテカルロ法と変わらないが,標 本点をランダムに選ぶモンテカルロ法とは異なり戦略的に選択することにより少ないサンプリン グ数にもかかわらず推定の精度がよいことが知られている.しかし,各時刻で独立に変化する不 確かさに対しては次元数が増加することになり Unscented Transformation であっても多くのサンプ リング数が必要となり,モンテカルロ法と比べて優位とは言えなくなるが,時間変化しないパラ メータの不確定性などを考慮する場合には有効な手法である. 簡単な数値シミュレーションにより提案手法の有効性を確認する.制御対象として以下のもの を考える. x1 (t + 1) = x1 (t) + h · x2 (t) x2 (t + 1) = x2 (t) + h c · 1.0 − x21 (t) x2 (t) − k · x1 (t) + b · u(t) |u(t)| ≤ 1.0 (6) (7) (8) 第4章 研究成果報告 表 1: Properties of trained neural networks Neural network Jnom J¯U T E[J] V ar[J] [N] [R](γ = 0) [R](γ = 0.05) 40.69 40.73 40.08 42.12 41.65 41.82 42.22 41.61 41.78 59.61 39.01 37.46 r(t) + - Neural Network u(t) x(t+1) Plant Var[J] a=5 a=4 a=3 a=0.25 z-1 a=0.5 a=2 a=0.75 a=1 図 1: 制御系ブロック図 E[J] 図 2: E[J] と V ar[J] の関係 (logscale) ここで,h = 0.01 であり,c,k ,b は独立である不確かなパラメータであり,それぞれ平均が 1.0, 分散が 0.01 の正規分布に従うとする.また,簡単のために系の初期値は (x1 (0), x2 (0)) = (0.5, 0) とする.c,k ,b がすべて平均値であると仮定して学習したニューラルネットワーク [N] と,提案 手法により学習を行ったニューラルネットワーク [R] を比較する.ここでは評価関数 J として J= 2000 t=0 ax21 (t) + x22 (t) + u2 (t) (9) して学習を行った.また,提案手法では各サンプリング点における (9) の値に Unscented Transformation を用いて評価関数 (3) を得ている.(9) において a = 1 として学習を行った結果を示す.表 1 に公称制御対象の制御結果 Jnom ,Unscented Transformation による J の平均の推定値 J¯U T ,およ び J の平均と分散を示す.この表における平均と分散は多数の標本を用いたモンテカルロ法によ り算出した.[N] は公称対象に対しては制御結果が優れている.しかし,Jnom は J の平均を十分 に推定できていないことが表から分かる.これに対して J¯U T は J の平均を精度よく推定している. また,[N] では J の分散が大きいことから不確かさの影響が大きいが,提案手法により学習した [R] では J の分散は小さくなっていることから,不確かさの影響を軽減することができていること が分かる.γ = 0 としたとき学習の時に分散は考慮されないのだが,公称値に基づく学習結果を上 回る結果が得られたのは,Unscented Transformation を行うために必要な複数のサンプル点の制御 結果に基づいて学習が行われるためだと考えられる. さらに,評価関数 (9) において γ を変化させたときの解について調べた結果を図 2 に示す.評価 関数 (9) において γ を変化させると,各 a の解は右下に移動する.これによりロバスト性の大きさ を γ により調整することができることが分かるのであるが,学習した結果には非常に単純なルー ルが存在していることが図から読み取れる.図 2 は両対数グラフであり,解はある直線にのるこ とから,学習結果に power law が存在していることが分かる.また,a が大きくなるのに伴い各グ 100 10 Z -1 x(t+1) Plant Z u(t) Neural Network NNC proposed method 0.88*(x)**(-0.7) x(t) -1 1/γ v(t) NNG Neural Network 1 0.1 0.01 x(t) 0.1 1 10 100 a 図 3: 競合によるロバスト制御系の学習 図 4: a と γ の下限の関係 (logscale) ラフの傾きが増加していることも分かる.大きな a を用いることにより応答が早い制御を指向す るようになる.つまり,制御性能を重視するにしたがって,制御性能の変化とロバスト性の感度 が大きくなることを意味する. ここで述べた方法の他に,図 3 に含まれる二つのニューラルネットワークを競合させながら学 習させることにより,ロバスト制御系を学習する方法を提案している [3].ここでは制御器として のニューラルネットワークは制御結果を最良にするように,制御対象の不確かさを表すニューラ ルネットワークは制御結果を最悪にするように学習する.つまりロバストな制御系の学習は次の 最適化に帰着される. T min max ||z(t)||2 − γ 2 ||v(t)||2 (10) u(t) v (t) t=0 z(t) = h(x(t), u(t)) (11) ここで z は評価出力である.この学習の結果,対象を安定にすることができる制御器が得られば ニューラルネットワークはロバストな制御系を学習したことになる.γ の大きさによっては学習の 結果得られた系は安定にならないので,安定な系の得られるような大きさの γ を選ぶ必要があり, 安定な制御系が得られる γ には下限がある.その下限は学習により得られるロバスト性の最大値 を示す.この学習法によりロバスト性を保証した制御器がニューラルネットワークにより学習す ることができる.ここでは x1 (t + 1) = x1 (t) + h · x2 (t) x2 (t + 1) = x2 (t) + h 1.0 − x21 (t) x2 (t) − x1 (t) + u(t) + v(t) |u(t)| ≤ 1.0 (12) (13) (14) J= 2000 t=0 ax21 (t) + x22 (t) − γ 2 v 2 (t) (15) として学習を行った結果を示す.(15) に入力の項が陽には含まれないが,このシステムで v = 0 とするとニューラルネットワークは状態空間中である超曲面に拘束される最適特異解を学習する. 学習に用いる a と安定な制御解が得られる γ の下限の関係を図 4 に示すが,a が大きいところに power law が見られる.a にも最小値 amin があるとして a − amin と γ の関係を求めると a が小さ い領域までよくフィットする power law を容易に見つけることができるがここでは割愛する. power law は複数の要素が相互に結合した複雑な系によく見られる.例えば,淘汰に耐えて存在 する生態システムでは様々な危険性に対応する能力などが power law で表されることが多い.power 第4章 研究成果報告 law を生み出す原因として自己組織化臨界現象や自己相似性が知られているが,現実の工学システ ムや生態システムでは自己相似性があるとは考えにくい.また,本研究では制御器にニューラル ネットワークを用いているが,制御系として自己相似性があるとはやはり考えにくい.にも関わら ず,システムの不確定性を考慮したロバスト制御系の学習結果には本稿で示したように power law が現れることが多い.Doyle は自己組織化とは異なる原理に基づき,power law にしたがう対応能 力を持つシステムの設計方法として HOT(Highly Optimized Tolerance) という考えを提案し,簡単 な山火事モデルにより検証を行っている [4].HOT ではシステムに存在する危険性(山火事モデ ルでは落雷)とその発生確率と分布に関する知識を十分に活用し,システムの破壊が広域に広が るのを防御する方策のコストなどの制約条件下で,防御策の最適配置を探索・決定し,power law スケーリング特性をシステム構造の適切さと見なす.筆者が提案している学習も基本的には Doyle の HOT と同じであると言えるが,power law スケーリング特性をシステムが持つことが適切であ るとまでは考えていない.HOT による設計や提案手法により設計された制御系は確かに考慮した 危険や不確かさに対して頑強である.しかし,考慮していない不確かさや戦略的に設定された危 険には非常に弱い.これを Doyle は Robust yet Fragile と呼び,HOT の特徴の一つとしている.こ れは,ロバスト制御系でも頻繁に見られる特徴であり,提案手法により設計した制御系も考慮し ていない不確かさの存在には脆弱である.また,power law に従うということは,不確かさの影響 や危険性がなかなか減少しないという難点もある.このような難点はシステム設計が事前情報に のみ頼り,変化などに柔軟に対応する機能をシステムが備えていないことに原因があると考えて いる.これらの問題点を解消するには環境に対して適応的な振る舞いをするシステムがやはり不 可欠であるといえる.環境の変化などに対して適応するシステムに関する研究については,参考 文献 [5] や本報告書における坂東君の研究報告を参照されたい. 3. 自律型ロボット遠隔操作オペレーション 筆者らは飛行型レスキューロボットとして自律型無人ヘリコプタに関する研究を実施している [6].前節で述べた内容は無人ヘリコプタの自律飛行制御への適用を目的としている.我々の研究 グループでは,飛行型レスキューロボットは主に情報収集に使うことを考えてその開発を行って いるが,災害情報を判断は基本的にオペレータが行う.つまり,自律型無人ヘリコプタから送ら れてくる画像などを基にして被災状況をオペレータが判断し,さまざまな遠隔操作を行うタスク がまず考えられる.そこで,コンピュータシミュレーションにより自律型無人ヘリコプタにより 情報収集するというタスクを被験者に課し,そのオペレーションを解析した.典型的な被験者の 操作履歴と累積コマンド数を図 5 に示す.まず,図 5(a) の累積コマンド数 (cmds) の変化を見ると, ほぼ直線的に増加していることが分かる.(a) の被験者は操作開始後すぐに,一定のリズミックな 操作に引き込まれ,それをタスク完了までずっと行っている.長時間にわたって一定のリズムを 保つのは人間にはそれほど容易なこととは思えないので,このようなリズミックな操作はヘリコ プタの自律飛行制御が原因となっていると思われる.これに対して (b) の被験者は (a) と同様に実 験開始後すぐに一定のリズミックな操作を開始しているが,ある時点で突然そのリズムが変わり, 異なるリズミックな操作法に引き込まれていることが分かる.実験に用いた無人ヘリコプタ操作 インタフェースには二種類の操作入力方法を用意した.図中の button と map がそれぞれの操作方 法をオペレータが使用したことを示す.input は災害情報を入力したことを示すので,操縦方法に は関係しないものである.図よりリズムが変化した時点でオペレータの操作法が変化したことが 分かる.このようにオペレータは操作中にタスクや環境などに適応して操作方法を変えることが ある.この例の場合はオペレータは適応制御の適応則のように微分方程式で表される連続的な適 応ではなく,リーレーやスイッチのような不連続な適応を用いていることが分かる.また,この 例のように時間的な変化ではないが,与えられたタスク内容により,オペレータのヘリコプタの 操作方法が変わるという実験結果もある [6]. 250 5 4 150 3 100 2 50 1 0 0 0 100 200 300 400 500 600 700 800 c md s bu t t o n ma p i n pu t o t h e r s cumulative command number cumulative command number 200 225 9 200 8 175 7 150 6 125 5 100 4 75 3 50 2 25 1 0 0 100 t i me[s ] 200 300 400 c md s but t o n ma p i npu t 0 500 t i me[s ] (a) (b) 図 5: 操作履歴と累積コマンド数 4. おわりに 本稿ではインテリジェントシステムの学習により制御系を構築する方法を述べた.以前,適応 的な飛行制御系を搭載した自律型無人ヘリコプタをオペレータに操縦してもらった経験があるが, 適応機構による応答の変化が早すぎるので少し混乱したという意見を述べた.そのときは,図 5 (b)のようなオペレータの適応的な変化とロボットの制御の適応に位相差があったのではないか と考えられる.それぞれの適応機構が調和的に働くことによりこれまでは実行出来なかったタス クの達成が可能となったり,タスクの質が高くなると思われる.しかし,このためには人間・ロ ボットの両者の適応過程とその相互作用について研究やデータが必要であると考える.また,累 積コマンド数から分かることはそれほど多くはないので,人間の適応過程を観察するために適し た客観的な指標も必要であると考えている. 参考文献 [1] 中西弘明,井上紘一: 確率的な不確かさを伴う系に対するロバストな制御系の学習法,第 14 回インテリジェント・システム・シンポジュウム講演論文集, pp. 205-208, 2004 [2] S. J. Julier and J. K. Uhlmann: A New Extension of the Kalman Filter to Nonlinear Systems, In Proc. of AeroSense: The 11th Int. Symp. on Aerospace/Defence Sensing, Simulation and Controls., 1997. [3] Hiroaki Nakanishi and Koichi Inoue: Design Methods of Robust Feedback Controller by Use of Neural Networks, Proceedings of the International ICSC/IFAC Symposium on NEURAL COMPUTATION(NC’98), pp. 731–736, 1998 [4] J. M. Carlson and J. Doyle, “Highly Optimized Tolerance: A Mechanizm for Power Law in Designed system,” Phys. Rev. E, vol. 60, no. 2, pp. 1412-1427, 1999 [5] Mai Bando, Hiroaki Nakanishi: Modular Learning Based on Lyapunov Design Method for Control System of Autonomous Robot, Proceedings of the IASTED International Conference on Artificial Intelligence and Applications, pp. 609–614, 2005 [6] 中西弘明,坂東麻衣,佐藤彰,井上紘一:自律型無人ヘリコプタによる被災地情報収集活動 に関する研究, 計測自動制御学会論文集(投稿中) 第4章 研究成果報告 歩行面の振動と歩行リズムの相互作用に関する研究 (非線形振動子に振り子と梁,電磁石からなる振動模型を用いた場合) 工学研究科精密工学専攻 宇津野秀夫,梅田 信也 Abstract: The lateral vibration in pedestrian bridge induced by human walking was reported. It was caused by the synchronization of human walking rhythm with lateral vibration in the bridge, but the mechanism of that synchronization has not been cleared yet. In this paper, the synchronization of vibration for the pendulum and several flexural beams with electro-magnetic exciters was studied analytically and was testified experimentally. Flexural beams with exciter, which was controlled by DSP installed with neural oscillators, was used to imitate human walking. Synchronization was occurred and was discussed qualitatively. The beam whose natural frequency is closest to the frequency of the pendulum is synchronized firstly and vibration amplitude of the pendulum becomes large. Then the beam with second closest natural frequency was synchronized. It is natural but testified by simulation and experiments that the process of synchronization can be simulated using neural oscillaters. Key words: Neural oscillators, pendulum, synchronization, human walk, vibration 1. はじめに 本研究では身体運動のリズム生成と深い関係にある神経振動子に着目して,人と外部環境との相互作 用を解析と実験の両面から研究し,動的機械機能システムの数理モデルと設計論の構築に資することを 目的とする.2003 年度の研究では,ロンドンで問題となった歩道橋の横揺れ現象を採り上げ,まず初め に歩行現象を表現するとされる神経振動子に外部環境である歩行面の横揺れを強制入力して数値シミュ レーションを行い,神経振動子はその固有の振動数と入力振動数の 2/n(n:自然数)倍が近いときに引き 込み現象を生じ,その引き込み現象の強さは入力振幅に依存することを示した.次に,人間が加振台上 で足踏みを行い,歩行リズムと神経振動子により生成されるリズムはほぼ等しい特徴を有することを示 した.この神経振動子モデルを人間のリズム生成機構にあてはめ,自由振動する台上で人間が歩行する 場合のシミュレーションおよび実験を行った. しかし 2003 年度に検討したモデルは一人の歩行だけを考えたもので, ロンドンで問題となったように 橋の横揺れの固有振動数が人の歩行リズムに近く,最初は数人が橋の固有振動数に同調して歩行し,そ れによって橋の振幅が増大し,さらに多くの人が同調して横揺れの振幅が増幅していく正のフィードバ ック過程を説明できていなかった.また台上の歩行実験から結論を導き出しているため,個人差や再現 性の点で課題を残した.そこで 2004 年度は,振り子の台上に複数の片持ち梁を垂直に立て,その先端を 電磁石で加振して人の歩行による加振力を模擬するモデルを作成した.台の加速度を入力とし DSP でリ アルタイムに神経振動子の出力を計算し,電磁石への入力電圧とすることで加振力を制御する.8 本の 片持ち梁の神経振動子のリズムを振り子の固有振動数近辺に設定し,片持ち梁のリズムが振り子の固有 振動数に近い順に台の振動に同調し,台の振幅が次第に増幅していく様子をシミュレーションと実験で 確認した.この数理モデルの構築により,横揺れする橋を歩行する人の引き込み現象の発生有無を事前 に検討することが可能となった. 2. 神経振動子 2.1 神経振動子の数学モデル 脊椎動物の脊髄には,歩行などのリズム運動をつかさどる,セントラル パターンジェネレーター(CPGと略す)と呼ばれる神経回路網が存在することが知られている.このCPGを 構成する最小単位が神経振動子である.神経振動子は自律的に非線形振動を生成する性質をもっており, たとえば外部から周期的な入力があると,神経振動子は固有のリズムを変化させ外部の振動数と一致さ せる引き込み現象を生じる.本研究では,神経振動子の数学モデルを用いる. 1u1 u1 f v1 f u2 u0 s 1v1 v1 f u1 (1) (2) 2u 2 u 2 f v 2 f u1 u0 s 2v 2 v 2 f u 2 f u max 0, u (3) (4) (5) ここで,上式の変数,定数は以下のような意味をもつ. u1,2 : 神経素子の内部状態, v1,2 : 神経素子の疲労状態, 1,2 : 内部状態の時定数, : 疲労状態の時定数, : 影響係数, : 神経素子同士の結合強度 1,2 s : 外部入力 u0 : 定常入力, 外部入力 s は神経振動子に対する外部からの刺激であり,定常入力 u0 は CPG 全体の活動を変化させる パラメータである.神経振動子はこの方程式にしたがい,外部からの刺激 s に応じてリズム生成を行う. 神経振動子の出力は u1, u 2 で,一方が屈曲筋,他方が伸展筋の動きに対応する.一般的な値として, 1 2 0 .031 , 1 2 0 .377 , 2.5 , 2 .0 , u 0 6.0 を用いると,外部入力がない場 合,神経振動子は約 1.4Hz の固有なリズムを生成する. 3. 橋の上を歩行する人間のモデル 3.1 解析モデル 人間が橋の上を歩行する際,橋には人間の歩行による横荷重が加わる.一方,橋から 人間への入力は足先で感じる橋の横揺れであり,場合によっては横揺れの大きさに応じて歩調を変化さ せる. つまり人間は橋を加振するアクチュエータとしての機能と, 橋の横揺れを感知するセンサの機能, さらに橋の横揺れに応じて,それを歩行リズムに反映させるコントローラとしての機能を有すると考え られる.そこで本研究では,アクチュエータおよびセンサとしての機能を機械モデルに,コントローラ としての機能を DSP(Digital Signal processor)によって実現し,系全体の解析モデルを構築する.こ の概念図を図 1 に示す.なお DSP には式(1)-(5)で与えられる神経振動子の数学モデルを持たせている. ここで,台は上方から吊るすことで振り子運動する.また,神経振動子からの出力電圧に比例する力 f m によ り梁は加振され,その際の梁の曲げ振動によって台に横加重 が加えられる.なお,人間が橋の上を歩行する現象に対応さ Digital Signal Processor せるため,梁は内力によって加振するものとする.さらに台の 加速度をDSP内部の神経振動子への入力とする.このモデル は上述した人間の機能を全て有しており,橋の上を歩行する 人間を模擬していると考えられる. 3.2 運動方程式の導出 図 2 に示すように, 台上の梁 j の S 神経振動子 錘 fm 線密度,断面積,ヤング率,断面 2 次モーメント,長さ, たわみおよび先端に取り付けた錘の質量を,それぞれ j , 梁 Aj , E j , I j , Lj , w j ( x j , t ) および m j とする.また,図 3 に示すように台を単振子とみなし,その質量を M t ,腕 の長さを l t とする. 台 梁のたわみ w j ( x j , t ) をモード座標に変換すると wj ( x j , t ) ji ( x j ) ji (t ) (6) 図 1 橋の上を歩行する人間のモデル i と表される.台の運動方程式,及び梁 j の i 次の曲げに関する運動方程式はと導かれる. M p m j j j Aj L j l p j Lj j A j 0 ji ( x j ) ji i dx j m j ji ( L j ) ji i M p gl p (7) 第4章 研究成果報告 梁j 梁 1 梁2 mj 永久磁石 j , Aj , E j ・・・・・ 神経振動子 lp ・・・・・ 電磁石 xj スタンド(剛体) wj ( x j , t ) Mp 台 台 図 2 片持ち梁の横振動 ji ji ji j Aj Lj 0 図 3 単振子 図 4 電磁石による内力加振 ji ( xj ) dx j lp m ji ( Lj ) l p f jm ji ( xm ) (8) ただし固有関数 i ( x ) はモード質量で正規化した.また式(8)における ji は梁 j の i 次の曲げにおける 固有振動数, f jm は梁 j への加振力, x jm は加振点の x 座標を表している. 3.3 電磁石による梁への加振力 本研究では梁への加振力 f m として磁力を用いる.電磁石により梁を 加振する際の模式図を図 4 に示す.電磁石はスタンドを介して台に固定されているので, 梁は内力によっ て加振される.電磁石を支えているスタンドは剛体とする. f m を求めるため,まず電磁石に印加する 電圧と流れる電流の関係を導く.電磁石の内部抵抗を R ,インダクタンスを L ,神経振動子から電磁石 に与えられる電圧を v ,電磁石内に流れる電流を I とす れば,キルヒホッフの法則より dI v L RI 0 dt コイル内部領域 in , (9) ここで,角振動数 の交流電圧に対する電磁石のインピ out , 0 ーダンス Z は Z R ( L ) 2 2 (10) で与えられる.本研究において, , L は共に小さいので R L が成立する.よって,式(9)において,インダクタ ンスの寄与分は無視することができるので v I R コイル外部領域 図3.4 コイルの内外領域 図 5 コイルの内外領域 (11) と簡略化することができる.次に,コイルに流れる電流 I を用いて,加振力 f m を求める.以降の記述において, in はコイルの内部領域, out はコイルの外部領域を表す.両者の模式図を図 5 に示す.ソレノイドコイルに おいて, in における磁束密度 Bin は Bin nI で与えられる.ここで は鉄心の透磁率,n は単位長さ あたりの巻き数,I はコイルに流れる電流である. out をコイルの先端に十分近い領域にとると, out においては磁束密度 Bout は一様とみなせる.このとき out と out 境界面の前後で磁束密度は等しいの で, out における磁束密度 Bout に対して Bin Bout が成立する. 一方, out における磁界 H は真空 の透磁率 0 を用いて,H Bout 0 と表される.また,梁に取り付けている磁石の磁荷を P とすると. 電磁石による梁への加振力は f m PH と表される.よって神経振動子の出力電圧 v によって得られる 梁への加振力は比透磁率 r を用いて fm r n P R v (12) で与えられる.これは神経振動子の出力電圧に比例した加振力となっている. 4 人間のモデルを 2 組用いた場合 4.1 数値計算 人間のモデルを 2 組用いた場合における, 神経振動子の出力定常応答および台の変位の 定常応答を調べるために数値計算を行った.諸元は実験装置のものを用いた.その値を表 1 に示す.U1, U2 はそれぞれの人間モデルに対応した神経振動子の出力電圧を表し,S は台の変位を表す.ここで,台 の固有振動数は 0.75Hz である.[U1,U2]の固有振動数が[0.74Hz,0.76Hz],[0.72Hz,0.78Hz],[0.70Hz, 0.80Hz],[0.68Hz,0.82Hz],[0.68Hz,0.76Hz],[0.60Hz,0.76Hz]の場合における数値計算結果をそれ ぞれ図 6(1)∼6(6)に示す.また,それぞれの場合における引き込みの結果を表 2 にまとめた.引き込み の起こった場合については定常状態における神経振動子の振動数も合わせて示した. 図 6(1),(2)において,[U1,U2]の固有振動数は[0.74Hz,0.76Hz],[0.72Hz,0.78Hz]であり,両者 とも台の固有振動数に比較的近い.よって,どちらの場合も U1,U2 共に台の固有振動数に引き込まれる. その結果,台は固有振動数で加振され振幅は大きくなっている. 一方,同図(3),(4)において,[U1,U2]の固有振動数は[0.70Hz,0.80Hz],[0.68Hz,0.82Hz]であり, 両者とも台の固有振動数から比較的離れている.よって,どちらの場合も引き込みは起こらず,U1,U2 はそれぞれ固有振動数を維持している. したがって台は固有振動数から離れた振動数で加振されるため, 振幅は非常に小さい. 同図(5)において,U1(0.68Hz)の固有振動数は台の固有振動数から比較的離れているが,U2(0.76Hz) の固有振動数は台の固有振動数と近い.よって,U2(0.76Hz)が台の固有振動数に引き込まれ,それによ って台の振幅が増大し,U1(0.68Hz)も台の固有振動数に引き込まれると考えられる. ここで同図(6)においても,U2(0.76Hz)は台の固有振動数に引き込まれ,台の振幅は増大する.にもか かわらず U1(0.60Hz)は台の固有振動数に引き込まれていない.これは,U1(0.60Hz)が台の固有振動数か ら離れすぎているためであるが,引き込みの振幅依存性より台の振幅がさらに増大すれば,U1(0.60Hz) も台の固有振動数に引き込まれると考えられる. 表 1 実験装置の諸元(1) 台 梁 錘 電磁石 永久磁石 質量 腕の長さ 長さ 幅 厚さ 密度 ヤング率 質量 巻き数 比透磁率 電気抵抗 磁荷 7.9 kg 4.4×10-1 m 3.3×10-1 m 2.5×10-2 m 2.0×10-3 m 2.7×103 kg/m3 7.2×1010 Pa 2.0×10-1 kg 4.5×102 回 1.0×103 4.8×102 Ω 3.1×10-5 Wb 表 2 神経振動子の振動数と引き込みの有無(数値計算) 神経振動子 (1) (2) (3) (4) (5) (6) U1 U2 U1 U2 U1 U2 U1 U2 U1 U2 U1 U2 固有振動数 (Hz) 0.74 0.76 0.72 0.78 0.70 0.80 0.68 0.82 0.68 0.76 0.60 0.76 引き込みの有無 有(0.75Hz) 有(0.75Hz) 有(0.75Hz) 有(0.75Hz) 無 無 無 無 有(0.75Hz) 有(0.75Hz) 無 有(0.75Hz) -5 -0.03 U1 3 4 5 6 7 8 9 1 2 3 0.03 S 3 4 5 6 7 8 9 5 U2 -5 -0.03 1 2 6 7 8 9 10 Output of the neural oscillator (V) Displacement (m) Output of the neural oscillator (V) 0.03 -0.03 5 3 4 5 6 7 8 9 10 Time (s) -5 4 0.03 U1 0.00 0 0.00 3 10 (4) U1[0.68 Hz],U2[0.82 Hz ] 0 2 9 0 10 S U1 8 S Time (s) 1 7 Time (s) (3) U1[0.70 Hz],U2[0.80 Hz ] 0 6 (2) U1[0.72 Hz],U2[0.78 Hz ] -0.03 U2 5 Time (s) -5 5 4 (1) U1[0.74 Hz],U2[0.76 Hz ] U2 2 -0.03 0 0.00 1 -5 10 0 0 0.00 5 U2 0.03 S U1 0.00 0 Displacement (m) 2 S 0 Output of the neural oscillator (V) 5 1 0.03 U1 U2 Displacement (m) 0.00 5 Displacement (m) 0 Displacement (m) S 0 Output of the neural oscillator (V) 0.03 U1,U2 Output of the neural oscillator (V) 5 Displacement (m) Output of the neural oscillator (V) 第4章 研究成果報告 -0.03 -5 0 Time (s) (5) U1[0.68 Hz],U2[0.76 Hz ] 1 2 3 4 5 6 7 8 9 10 Time (s) (6) U1[0.60 Hz],U2[0.76 Hz ] 図 6 神経振動子の出力定常応答および台の変位の定常応答(数値計算) 5 人間のモデルを 8 組用いた場合の計算と実験の比較 5.1 数値計算 人間のモデルを 8組用いた場合において,台の変位の定常応答および神経振動子の出力定 常応答を調べるため数値計算を行った.梁および永久磁石は表1に示したものと同一であるが,実験の都合 上,台,錘,電磁石は異なるものを用いた.台の固有振動数は 0.75Hz である.定常状態において全ての神経 振動子の出力振動数は台の固有振動数に引き込まれている.ここで,さらに厳密に引き込み現象を考察する ため,過渡状態においても数値計算を行った. 台および神経振動子の振動数の時間変化を図7(1),7(2)に,台の変位の時間変化を図7(3)に示す.台の加振 が始まる時刻を t 0 (s) とする.それぞれの神経振動子の出力振動数が台の固有振動数に引き込まれる時 刻を比較すると,まず t 70 (s) 前後において台と近い固有振動数を有する U2(0.70 Hz)が引き込まれ, U1(0.68 Hz)では t 100 (s) 前後で引き込まれている.これより,台と近い固有振動数を持つ神経振動子から 順に引き込まれていることが確認された.また,台から離れた固有振動数を有する神経振動子の出力振動数 ほど,大きなゆらぎを持ちながら引き込まれていることが分かる.これは前節で述べたように,神経振動子の固 有振動数から離れた振動数の外部入力によって,神経振動子の生成する波形が乱れたものとなっているため である. また図 7(3)より,最初の引き込みが起こる t 60 (s) 前後において引き込みが始まると,台の振幅が 急激に増加していくことが分かる. 5.2 実験 実験装置の写真を図 9 に示す.台は上方から糸で吊るすことで振り子運動する.神経振動子から の出力電圧に比例する電磁力で梁は加振され,その際の梁の曲げ振動によって,台に横加重が加えられる. ここで台の加速度を DSP 内部の神経振動子への入力とする.数値計算に対応する条件で実験を行った.台の 振動数と神経振動子の出力振動数の時間変化を図 8(1),8(2)に示す.また,台の変位の時間変化を図 8(3)に示 す.図 8(1),8(2)より,固有振動数が台に近い神経振動子ほど早い時刻に引き込まれており,数値計算の場合と 近い傾向を示している. 0.90 S Frequency (Hz) Frequency (Hz) 0.90 0.75 U1(0.68 Hz) 0.60 0 50 100 Time (s) 150 S 0.75 U1(0.68 Hz) 0.60 0 200 150 200 0.90 S Frequency (Hz) Frequency (Hz) 100 Time (s) (1)梁 U1 の周波数の時間変 (1)梁 U1 の周波数の時間変 0.90 50 0.75 S 0.75 U2(0.70 Hz) U2(0.70 Hz) 0.60 0.60 0 50 100 Time (s) 150 0 200 50 100 Time (s) 150 200 (2)梁 U2 の周波数の時間変 (2)梁 U2 の周波数の時間変 0.005 Am pli tu de (m ) A m plitud e (m ) 0.005 -0.005 -0.005 0 100 200 300 400 0 100 Time (s) (3)台の変位の時間変化 200 300 400 Time (s) (3)台の変位の時間変化 図 7 数値計算結果 図 8 実験結果 ただし図には載せていないが U4,U5 がほぼ加振開始直後に引き込まれる.これは実験開始時点で台の固 有振動がわずかに励起されており,この固有振動に U4,U5 が引き込まれるためだと考えられる.その結果,台 の振幅は実験開始直後から単調に増加している. 6. 結言 本研究では,複数の人間が橋の上を歩行する際の,橋と歩行 者の相互作用を明らかにすることを目的として,まず身体運動の リズム生成に深く関与する神経振動子に着目し,神経振動子を 模擬した制御力を倒立振り子に加えることで,橋の上を歩行する 人間をモデル化した. 次に,人間のモデルを複数用いることで,数値計算および実 験において多人数の歩行リズムの引き込みを実現し,引き込み の定常応答のみでなく,過渡応答についても考察を行った. 最後に数値計算,実験の結果を通じて橋の振幅と歩行リズム の引き込みの関係が,正のフィードバックシステムを形成してい ることを確認した. 錘 永久磁石 台 電磁石 図 9 実験装置の写真 第4章 研究成果報告 環境適応性に優れたヒトの手足の機能の解明および その機械的実現 工学研究科機械工学専攻 横小路 泰義,才田 崇王 Abstract: For the purpose of realizing the functions of human hand and foot on mechanical systems, fundamental understanding of human hand and foot is necessary through intensive observations of manipulation tasks and walking by humans. In the research of manipulation task, we developed a grasping simulation platform integrating with a visual display system, to investigate human grasping behaviors in virtual environment. We then developed a path planning algorithm for a multifingered encountered-type haptc device. In the research of walking, we focused on the mechanism of robot foot. We developed a special footgear by which movement of human foot can be constrained in various ways. Human walking behaviors with this footgear were observed and the necessary foot mechanism for walking was discussed. Key words: Multi-fingered hand, Legged robot, Grasping and manipulation, Haptic interface, Foot mechanism 1. はじめに ロボティクスにおける1つの究極の目標は,生物を凌ぐダイナミックで適応的なロボットを開 発することにある.特にヒトの手が有する器用な物体の把持操り能力およびヒトの足が有する巧 みな不整地の踏破能力を機械的に実現しようとする数多くの試みがなされている.しかし,これ までに開発された多数のヒトの手足を模したロボットは,未だにヒトの作業の巧みさに比肩して いるとは言い難い.これはそのようなロボットの多くが,単にヒトの手足の外見のみを模倣する ことに重点を置いたまま作られたことが原因と思われる.従って,機械的なロボットの実現を試 みる以前に,ヒトの操り踏破時に生じている手足の情報処理過程を徹底的に解明し,その本質を 露わにすることが肝要と考える.そしてその観測結果に基づき,自律的に器用な操りを行う手お よび巧みな踏破をする足の実現を通して,ヒトの手足の機能に対してのさらなる知見を得たいと いうのが本研究の目的である. 以上の点を踏まえ,本研究課題では(1)把持操り時の指先が物体となす把持パターンに適し た機構の設計論および数理モデルの解明, (2)歩行時の足と地面のダイナミックな相互作用を可 能とする機構の設計論および数理モデルの解明,の2つの研究項目を設定した. 2. 把持操り時の指先が物体となす把持パターンに適した機構の設計論および数理モデル の解明 Velocity 2.1 人間の把持様式の観察結果 Span Velocity Wrist Velocity に基づく多指遭遇型ハプティック 2 3 1 デバイスの軌道計画法 ハプテ ィックデバイスにおいて多指遭遇 型という考え方は,人間の各指 に物体上の把持点近傍を近似す る局所平面パッチを遭遇させる ことで任意形状の物体の把持動 (a) Real World (b) VR World Time 作を模擬しようとするものであ 図 1: 視覚提示と融合し 図 2: 物体把持時における手首と る.本年度は把持を模擬するV た多指遭遇型ハプティッ 指の開きの典型的な速度プロファ Rプラットフォームとして,昨 クデバイス イル 年度に開発した任意形状の物体 の把持の模擬が可能な多指遭遇型ハプティックデバイスに視覚システムを融合し, 図 1 に示すよ うな視覚と触覚の統合システムを構築した.これにより,仮想環境の中でクロマキー処理された 自分の手を見ながら,仮想物体に接近しそれをつかむことが可能となった. 設計した多指遭遇型ハプティックデバイスによって各指先に適切に局所平面パッチを遭遇させ るためには,ユーザの把持動作に応じた合理的なデバイスの動作計画を行う必要がある.昨年度 は,図 2 に示すような中沢らの示した把持動作における手首や指先の速度プロファイル [1] が,一 般的な3次元把持動作でもうまく現れていることを確かめ,把持物体決定フェーズ,接触面決定 フェーズ,接触点決定フェーズの3つのフェーズに分けることを動作計画の基本方針とした. 本年度は,まず把持物体決定フェーズにおけ る動作計画法とその検証を行い [2][3],その後に すべてのフェーズをすべて盛り込んだ動作計画 手法を開発した.そのなかで,把持面決定フェー ズでは,人間の手のプリシェイピングの形状を 利用するのであるが,このプリシェイピングが 把持面の決定だけでなく,把持しようとしてい る物体そのものの選択予測にも有効であること が分かった.つまり「把持物体の決定」と「対 象物の把持面決定」とは密接に関係しているこ とが分かった [4]. 開発した動作計画法に基づき,実際に検証実 験を行った.図 1 のプラットフォームをさらに 発展させ,多指遭遇型ハプティックデバイスを 7自由度の産業用ロボット先端に取り付け,任 図 3: 提案した動作計画法に基づく複数物体の提 意の場所にある仮想物体の提示が可能になって 示と把持の模擬実験の様子 いる.図 3 に,実験の様子を示す.ポヒマスセ ンサ付きのデータグローブを装着したユーザの手の運動から2つのフロッピーディスクケースの どちらをどのようにつかむのかを予測し,デバイスのパッチ面を適切に配置させることで,把持 動作の模擬が実現できている. +PKVKCNRQUKVKQP 5VGR 5VGR 5VGR 4GCNYQTNF 8KTVWCNYQTNF .GHVQDLGEV 4GCNYQTNF 8KTVWCNYQTNF 4KIJVQDLGEV 2.2 折り紙ロボット実現に向けた作業の解析 ヒトの手の外見のみを模倣することなく有用なハ ンドを開発するには,まずハンドに行わせるべきう作業を明確化することが重要である.本研究で は,具体的作業として「折り紙」を取り上げることとする.折り紙作業には,以下の特徴がある. • 単純な折りから複雑な形状の実現まで,作業の困難度にバリエーションがある. • 主に指先のみを用いる作業であり,手のひらや指先を総合的に使う作業に比 べて扱いやすい. • 折り紙は一種の柔軟物体であり,折り紙ロボットの実現は生産現場等でこれ まで人間しかできなかった作業の自動化にもつながる. 本年度は,折り紙ロボット実現に向けた第一歩として,折り紙 を折る作業を詳細に解析して,それを機械的に実現するための方 法を検討した.図 4 に,折り紙を折る際の指先の運びの解析例を 示す.作業解析の結果,折り動作は難易度とともに有限個のクラ スに分類でき,そのクラスに応じた要素動作を組み合わせること で多種の折り紙を表現可能なことが分かった.この結果により,折 り紙の個々の要素動作を実現するにあたっては必ずしも人間ほど 複雑な指構造を必要とせず,比較的単純な機構でも多様な折りを 図 4: 折り紙の手順の解 析 実現する可能性があることが分かった. 㧝㧚৻┵ࠍᛠᜬߒߡ ⋡ޓޓᮡ୯ઃㄭ߳ 㧞㧚ߩࡂࡦ࠼߇ઁߩ ޓޓ႐ᚲࠍߐ߃ࠆ 㧠㧚࿕ቯὐࠍ⒖േ 㧡㧚⟎วࠊߖ 㧟㧚ήℂߥߊᜰࠍᛮߊ ࠆ߈ߢ߇ߣߎޓޓ 㧢㧚࿕ቯὐࠍ㔌ߒ㧘ߎߩ ߣޓޓ᛬ࠅ⋡ࠍߟߌࠆ 第4章 研究成果報告 3. 歩行時の足と地面のダイナミックな相互作用を可能とする機構の設計論および数理モ デルの解明 3.1 ヒトの足指機能の測定 現在, ロボットは平坦な地形をダイナミッ クに歩行することが可能になった が,これには必要最低限度の機構自 由度だけを利用している.このため, 直ちにヒト程の巧みさをロボットに 望むことは出来ないが,ロボットの 足にある機構自由度を増やせば,歩 行技能はさらなる向上を狙うことが 出来る.ロボットの歩行性能を向上 図 6: 足指機能の測定用装具 図 5: 計測システム概要 させ,環境へより柔軟に適応させる ためには,ヒトの足指機能のどの部分が本質的に重要なのかを探り,足の数理モデルとして整理 する必要がある. そこで本研究では,図 5 および 6 に示すような,足指機能を徹底的に計測するシステムを構築 した [5][6].計測システムは靴型装具をヒトとのインターフェースとして持ち,その装具はヒトの 足指を可動・拘束する 2 自由度の爪先機構部と,足指関節角や足裏圧力分布を計測することが可 能な多数のセンサからなる.ヒトは全部で数百にも及ぶ関節や筋肉を有しているが,この靴型装 具を履くことで,地面との力のやりとりにはロボット的な靴型装具の動きだけを最終的に利用す ることになる.さらに,この靴型装具は機構自由度を増減させることが可能なため,その自由度 を適宜変更すれば,直進歩行や旋回歩行時にどの程度の足平自由度が歩行の補助となるかの知見 が得られる. : Potentiometer : Pressure Sensor [Side View] 80mm 170mm 70mm Mechanical Constrained Shoes Hallux Toe 120mm 50mm A/D Interface Heel 2nd | 5th Toes [Bottom View] 3.2 ヒトの歩行時における足指の働きとそのモデル 本研究のようなヒト足指機能計測と同様な 研究には,岩間ら [7] の測定実験が挙げられるが,それらの足指機能の測定は直線歩行だけに注目 し,人間との共生を目指す歩行ロボットには不可欠の動きである旋回動作については言及してい ない.これに対し我々は,数人の被験者に先述の計測システムを装着し,直線や曲線,階段など 数パターンのコースを設定して,歩行速度および足指関節角,足裏圧力分布を実測した.図 7 に 計測データの一部を示す. この計測より次の知見を得た.1:図 7(a) に示した歩行速度やその有意検定から,歩行速度は直進 歩行では爪先 1 自由度以上,方向転換時では爪先 2 自由度以上が歩行速度の向上と相関がある.2: 図 7(b) に示した足指関節のデータから足指は離地と着床時に反ることが分かり,手の pre-shaping 動作に相当する準備動作がある.3:図 7(c) の足裏圧力中心点の動きは,爪先自由度が増すほど, どのようなコースを歩いた場合にも非常に滑らかに踵から爪先まで移動する. この測定結果を整理するにあたり,まずヒトの足平機構モデルを考察した [8].その機構は,足 の骨格図 [9] より,足首部分が脚部の骨格によって左右から強固に締めつけられていることが分か Course1 Course4 H Hallux 2nd - 5th toe H 50 Force [kgf] 1 50 Toe Joint Angle (degree) Velocity (m/s) B S2 S1 S0 L L S S 0 0.1 0 0 0 15 10 0 Subj.1 Subj.2 Subj.3 (a) 爪先自由度と歩行速度 Time Progress (s) (b) 足指関節の動き 図 7: ヒトの歩行解析結果 0.1 CoP [m] CoP [m] 0.2 -0.1 (c) 足裏圧力分布の動き る.このため,ヒトの足首では爪先を上下に動かすピッ チ方向以外の動作は行うことが出来ないが,内外転用の ロール動作に必要な自由度は,5 本の足指を構成するアー チ状の骨格の捻りが作り出している.それを踏まえると, ヒトの足平機構の自由度配置は図 8(b) のように単純化さ れる.対して,従来より提案されている爪先機構を持つ 歩行ロボットは,図 8(a) に示すような自由度配置となる. ( a ) R o b o t i c F o o t (b) Human Foot この旧来のロボットの自由度配置は,足首にかかる大き 図 8: 歩行ロボットとヒトの足平機構の な着地衝撃の大部分を関節のモータで補償する必要があ 数理モデル る.ヒトの場合では,そのような着地衝撃を関節で負担 するのではなく骨格で負担することを優先した構造で,かつ,支持脚期には 2 自由度を有して歩 行性能に必要な自由度を損なわない機構といえる.靴型装具を履いた歩行実験から爪先 2 自由度 が高速歩行に有用であったことを思い出すと,ヒトの足平は理に叶った機構である. 4. おわりに 本報告では,まず手の機能については,ヒトが物体を把持し,操る際の一連の動作の観察結果 から,把持動作を模擬するVRシステムを構築し,器用な動作が可能なロボットシステムの構築 を目指して折り紙作業の解析を行った.足の機能については,ヒトが歩行する際の一連の足の働 きをモーションキャプチャ装置などを利用して徹底的に計測し,その結果に基づいて歩行に必要 な足の各関節や足平の機構モデルを検討した.なお今後は,これら手や足の機能を実現するロボッ ト機構の実現を目指していきたい. 参考文献 [1] 中沢信明, 梶川伸哉, 猪岡光, 池浦良淳, “把持動作における指先軌道の実験的考察,” 日本人間 工学会誌, 36-1, (2000), 19-27. [2] Y.Yokokohji, N.Muramori, Y.Sato, T.Kikura and T.Yoshikawa, “Design and Path Planning of an Encountered-type Haptic Display for Multiple Fingertip Contacts based on the Observation of Human Grasping Behavior,” Proc. IEEE International Conference on Robotics and Automation, (2004), 1986-1991. [3] 木倉崇晴, 佐藤祐司, 横小路泰義, 吉川恒夫, “多指遭遇型ハプティックデバイスの動作計画のた めの把持物体予測手法,” 日本バーチャルリアリティ学会 第 9 回大会論文集, (2004), 25-28. [4] 木倉崇晴, 佐藤祐司, 横小路泰義, 吉川恒夫, “多指遭遇型ハプティックデバイスによる仮想物体 の提示と動作計画,” 第 5 回 計測自動制御学会システムインテグレーション部門講演論文集, (2004), 973-974. [5] T.Saida, H.Ohta, Y.Yokokohji and T.Yosikawa, “Function Analysis of Human-like Mechanical Foot, using Mechanically Constraint Shoes,” Proc. of the IEEE/RSJ International Conference on Intelligent Robots and Systems, (2004), 3847-3852. [6] 太田裕一, 才田崇王, 横小路泰義, 吉川恒夫, “足指関節を拘束する靴型装具を用いた足指の機 能解析,” 第 22 回 日本ロボット学会学術講演会予稿集, (2004), 講演番号 3G17. [7] 岩間博哉, 竹村裕, 上田淳, 松本吉央, 小笠原司, “歩行運動における足指機能の解明,” 日本機械 学会ロボティクス・メカトロニクス講演会 ’03 講演論文集, (2003), 講演番号 1P1-3F-E1. [8] 才田崇王, 横小路泰義, 吉川恒夫, “人間の歩行時における足指機能のモデル化,” 第 22 回 日本 ロボット学会学術講演会予稿集, (2004), 講演番号 2L18. [9] Blandine Calais-Germain, “Anatomy of Movement,” (1993), Eastland Press Inc. 第4章 研究成果報告 人間−自律機械の協働における作業調和を指向した 共適応のための設計論 工学研究科精密工学専攻 堀口 由貴男 Abstract: The author aims at establishing a new design framework of “co”-adaptive human-machine systems for combining and capitalizing on both advantages of human and mechanized controls into their joint activity, wherein their well-coordinated collaboration is expected through dynamic and mutual-shaping processes among them. This report presents the research works to develop a power assist orthosis for an upper limb from that design perspective. Key words: Human-machine collaboration, motion analysis, interactive systems design 1. はじめに 本研究は,人間と機械(自動化)の各々が得意とする作業をうまく組み合わせてシステムとし て統合し,両者の調和した共同作業パフォーマンスを実現するためのシステムの構成論として共̇ 適応(co-adaptation) [1] の概念を柱に据え,人間―機械系設計の問題にアプローチする.ここ で,共適応とは共同作業の実践を通じた人間・機械相互の振る舞いの調整を表す. あるタスクを遂行するためのシステムの機能の一部を機械に委ねる,いわゆる機械化の導入に 際して,技術的に実現可能な部分を機械化するだけでは,設計者が想定しなかった” 副作用” をシ ステムが抱えることになる.これは,ある機能の機械化そのものがシステム内部に新たな機能の発 生をもたらし,ユーザにとってのタスクを質的に全く別のものに変えてしまうことが関係する [2]. 特に,人間と機械の間の「意思疎通」 (主に,ユーザによる機械の状態の正しい理解)が重要にな り,これが達成されていない状況においては機械の振る舞いが人間の操作判断を混乱させる要因 となり得る.両者の間の認識の齟齬に起因する過誤は “automation surprises” [3] と呼ばれるが,そ のような齟齬を解消する役割は,機械の扱いの習熟も含めて人間の側に全て委ねられているのが 現状である.一方で,このことを逆の観点から捉えると,作業の経験を通じて人間ユーザは操作 判断の仕方を変化させていくことになる.そのため,人間との協働のために自動化に求められる 機能は,システムを利用する個人やその個人の習熟,作業の局面によって異なるはずである. 以上の理由から,機械が発揮する機能を作業場での実践を通して動的に調整し,個々のユーザと の「自然な」共同作業の実現のために振る舞いを適応させることが必要かつ有用であると考える. 今年度は,このような調整が求められる人間―機械系の例として,介護動作のパワーアシストを 行う装具を開発し,その介在が人間の動作に与える影響の分析と,個々人の特性の違いがユーザ の意図の推定に与える影響の分析を行ったので,それらについて本稿で報告する. 2. 接面の二重性と作業の自然さ 人が何かしらの人工物(道具)を介して環境に働きかける場合,図 1 に示すように,そこには 2 つの異なる接面(=インタフェース)が想定できる [4].第一の接面は「人間―機械インタフェー ス」であり,人工物システムに操作を加えてそれをコントロールする操作者との接面に対応する. 一方,第二の接面とは「機械―環境インタフェース」であり,人工物システムが作用を及ぼし,あ るいは作用を受ける外界との接面を意味する.人が道具を使いこなすとき,意識の上でこれら 2 つの接面が 1 つになると見なすことができる.すなわち,道具が身体の延長になり,人は道具の 作用点で外界に直接触れているという感覚を持つために,道具の存在自体が「透明」になる(身 体化される). しかしながら,初めて使用する道具であったり,あるいは道具そのものが複雑な処理系として構 成されるなどして,その振る舞いを使い手の側がうまく予測できない状況では,第二接面は(特 に心理的に) 「はるかかなた」に遠ざかることになる.すなわち,機械の振る舞いに予測できない 道具・機械 部分があるかぎり,人間は単にその機械を操作しているものであるとか,世界への操作を実行す るための道具であるというよりは, 「インタラクションに従事しているもの」と見なすはずである. 第二接面とはシステムがその外界と接している領域である.そして,そこからもたらされる認識 とは,ユーザが自らを含む行動主体としてのシステムを「外」の環境の中に位置付けて, 「外」と 「内」とのインタラクションのあり様に他ならない.そして,機械の扱いの習熟とは,第一接面に おいて得られる近接情報の意味を第二接面における遠隔の現象の中に定位するための,ユーザの 解釈の努力に依る [5]. 人間と外界の間に位置する機械がその振る舞 いを調整することの意義は,このような道具の 身体化のための必要な努力を軽減することにあ る.機械の振る舞いの調整が対象とするのは, 外界の状況に即した作業が実現と共同作業者で あるユーザへの適合の両者がある.特に後者に 人 対象 (認識的世界) (物理的世界) 注目した場合,ユーザにとって自然な操作系と は,ユーザの操作(意図)とシステムの振る舞 いの間に同型(isomorphic)な関係が構築され た状態にあると言える.この意味において,機 械の自然な振る舞いの設計は,機械の介在の有 無に対する本来のタスク構造がどれほど質的に 変化するかという観点から評価できると考えら れる. 図 1: 機械の介在と 2 つの接面 第二接面 第一接面 3. パワーアシスト装具の開発 ユーザとの自然な共同作業のために振る舞い の動的な調整が求められる人間―機械系の例として,上肢の屈曲運動をサポートするパワーアシ スト装具を開発した.開発した装具の全体図を図 2 に示す.装具の駆動機構は操作の邪魔になら ぬよう上腕の裏側に集中させた.アクチュエータには AC サーボモータを使用し,それをハーモ ニックドライブ r および駆動軸と屈曲軸を繋ぐタイミングベルトで減速させている.これにより, 肘関節周りに最大トルク 36 Nm,最大速度 18 rpm の動作出力を実現できるように設計している. この装具の仕様は,装着時に 10 kg の荷重を楽に上げ下げできるように,非装着時の上げ下げ動 作の計測データを剛体リンクモデル(図 3)とみなして解析した結果に基づいて設定した.また, 容易に脱着できるようにするために,ユーザの動作意図の読み取りには装具とユーザの身体の間 に発生する接触圧力のセンシング情報を利用する. 肩関節(関節1) θ1 上腕 前腕 θ2 肘関節(関節2) 図 2: 製作した装具 図 3: 荷重持ち上げ動作の実験設定 物体 台 第4章 研究成果報告 4. 動作パターンの同型性の観点から見た装具介在の人間動作に与える影響の分析 一般に,パワーアシスト装具には,ユーザが自分の「身体の自然な拡張」として感じられるよ うな使用感を得られること,そして装具を装着しない場合の通常の身体動作と大差ない動作計画 で装着時にも作業が遂行できること,が求められる.そこで,装具からの動作介入(パワーアシ スト)によって,ユーザの作業意図が変容を受けることがないことを「自然な」アシストと捉え, パワーアシストの有無でユーザの動作構造がどのように変化するかを同型性(isomorphism)の観 点から分析した. 4.1 ヒトの腕の 2 点間到達運動における軌道計画規範と “自然な” 持ち上げ動作 まず,装具によ るアシストを評価する基準として,ヒトの自然な物体持ち上げ動作について定義する必要があっ た.著者らはそのための規範として 2 点間到達運動に注目した.ここでの 2 点間到達運動とは,あ る点からある点まで手先を移動させる動作のことである.この運動が自然に行われている場合,手 先の軌道はほぼ直線を描き,接線方向の速度波形は一つのピークをもつほぼ対称形の釣鐘型で,接 線方向の加速度は運動全体にわたり滑らかに変化することが報告されている [6].そして,このよ うな手先軌道の特徴を説明するモデルとして様々な軌道計画規範が提案されており,それらは独 自に定義した評価関数についてその評価値が最小化になるように腕の軌道が生成されるとしてい る.中でも, 「指令トルク変化最小規範」が 2 点間到達運動におけるヒトの腕の動作を最もよく説 明することが示されている. 本研究では物体の持ち上げ動作をこの種の動作と 捉え,その規範を物体持ち上げ動作に適用し実測デー タと比較した.その結果,物体が片手で楽に持ち上 げられる重量であり,かつ自然な速度で持ち上げ動 作が実行された場合,肘関節まわりの角速度の波形 が 2 点間到達運動の場合と同様に釣鐘型になること を確認した.逆に,不自然にゆっくりとした速さで の持ち上げ動作になるとこの釣鐘型の波形は崩れ, また非常に重い負荷が掛かると角速度の波形は大き く揺らぐことになった.そのため,角速度の波形が 釣鐘型になるかどうかが自然な持ち上げ動作である かどうかの評価基準になると考えた.そして,角速 図 4: アシストの様子 度が大きく揺らぐような重たい物体を持ち上げる場 合においても肘関節まわりの角速度がこの波形を維持できるアシストは,ユーザに装具の介在を 意識させずにその作業をサポートできているとみなす. 4.2 インピーダンス制御によるパワーアシストの評価 パワーアシスト装具装着の有無について 被験者の動作比較のための実験を行った(図 4).装具の制御には,アシスト装具の実装に広く利 用されているインピーダンス制御を用い,特に実装の容易さから位置指令型のインピーダンス制 御を用いた.装具前腕部のベルトの内側に取り付けた力センサから,操作者が装具に加えた力を検 知し,それに応じた制御量を生成することで,装具によるユーザ動作のアシストを実現した.そ の際の装具の機械インピーダンスには,実験によって被験者の感覚に合う適正値を設定した. 表 1: 荷重持ち上げ動作の実験設定 (a) 0 kg (b) 3 kg (c) 7 kg (1) 自然な速さで (1)-(a) (1)-(b) (c) (2) できるだけゆっくりと (2)-(a) (2)-(b) — 持ち上げ荷重 実験は,持ち上げ動作の速さと持ち上げる荷重について表 1 に示す条件を設定した.ただし, 7 kg の物体は自然な速さで持ち上げるには重すぎるため,動作速度に関する条件((2)-(c))は設 (1)-(a) (2)-(a) (1)-(b) (2)-(b) (c) 3 2.5 ]/s dra 2 [度 速角1.5 節関 1 肘 1.6 (1)-(a) (2)-(a) (1)-(b) (2)-(b) (c) 1.4 ]s/ 1.2 dar 1 [度 0.8 速 角 節 0.6 関 肘 0.4 0.5 0.2 0 0 0 0.2 0.4 0.6 正規化された時間 (a) 装具未装着時 0.8 1 0 0.2 0.4 0.6 正規化された時刻 0.8 1 (b) 装具装着時 図 5: 装具装着の有無に対する肘関節まわりの角速度の系列の比較 けなかった.この実験の結果を図 5 に示す.両グラフの横軸は動作の開始から終了までの時間を 1 として正規化した時刻を表し,縦軸は肘関節の角速度を表す.図 5 (a) のグラフより,前節で言 及した動作の中間で極大になる釣鐘型の系列が,非装着時の自然な持ち上げ動作の条件 (1)-(a) と (1)-(b) で確認できる.一方,装具装着時(図 5(b))には,どの条件においても複数の極値や変曲 点が存在する.そして,動作開始から終了までの時間が長いほど,つまり条件 (1) の場合より (2) の場合の方が,波形の極値と変曲点の数が多い.言い換えると,パワーアシスト装具を利用する ことで,肘関節まわりの運動は非装着時の自然な動作に比べて振動的になった.この現象は次の ような周期的な動作の繰り返しが原因と考えられる: • 操作者が持ち上げ動作を開始すると,装具との干渉によって力センサが反応して装具が駆動す る.その結果,操作者は装具からアシスト力を受ける(角速度のグラフが下に凸の状態). • 装具からのアシスト力を受けて,ユーザは持ち上げ動作をある程度装具に委ねて力を抜く.そ の結果,力センサの反応値が低下し,アシスト力も弱まる(角速度のグラフが上に凸の状態). • ユーザはアシスト力が弱まったことを感じ,再び力を強めて装具を駆動させる(角速度のグラ フが下に凸の状態). このような振動的な動作パターンに注目すると,ユーザが装具の介在を意識することなく持ち上 げ動作を実行できたとは言い難い.そして,インピーダンス制御のようにユーザが主導して動作 軌道を生成していくアシストの形態はフィードバック制御に頼るために,ユーザの操作意図に対 して装具の対応が後追いになるという点がその要因となっている. 4.3 協調行為のためのアシスト動作のタイミング 人間同士の協調行為について考えた場合,例 えば二人でテーブルなどの重たい物を運ぶ時には,互いに声をかけあうなどして持ち上げるタイ ミングを合わせることはよく取られる手である.二人の動作が同期しないと,共同作業はぎこちな いものになってしまう.そして,前述の持ち上げ動作をユーザと装具の共同作業とみなすと,装具 は常に受け身であり,二者の動作タイミングが揃うことはない.逆に,アシスト動作のタイミング が適切であれば,装具の介在が人間の自然な動作の妨げにはならないはずである.そこで,ユー ザ自身がアシスト装具の動作を調整できるような設定において,装具装着時のユーザの動作系列 の分析を行った.図 6 に示すように,右手にパワーアシスト装具を装着した被験者が左手に力セ ンサを持ち,随意にアシスト動作をコントロールできるようにした(右手と装具の間に力センサ は配置しない).この状態で左右の動作タイミングを合わせて 3 kg の物体を持ち上げる実験を実 施した. 第4章 研究成果報告 1.8 1回目 2回目 3回目 1.6 1.4 s]/d 1.2 ra[ 1 度速 角節0.8 関肘0.6 0.4 0.2 0 0 図 6: アシスト動作のタイミングに関する実 験設定 0.2 0.4 0.6 正規化された時刻 0.8 図 7: 同期のとれたアシストがある時の肘関 節まわりの角速度の系列 実験結果として,肘関節まわりの角速度の系列を図 7 に示す.このグラフより,角速度の波形 は,動作の中間で一つの極大点を持つ釣鐘型になっていることが分かる.すなわち,パワーアシ ストと右手の動作のタイミングが揃った結果,装具が介在しない場合の自然な動作と同型な動作 構造が確認できた.そして,このような協調行為を機械的に実現するためには,動作についての 予期的な情報をセンシングでき,かつそれをトリガとしたアシスト動作の定型を装具が備えてい る必要がある. 5. 個人差がユーザの意図の推定に与える影響の分析 4.2 節の実験において,持ち上げ動作の一部を装具に委ねるのか,それとも動作を停止して姿勢 を保持するのかの弁別が適切でないことが装具装着時の振動的な振る舞いを招いたように,共同 作業において作業主体間の意思疎通は両者の協調に必須の要件である.開発した装具の振る舞い の制御に関しては,姿勢の保持と腕を伸ばす動作の区別が特に難しい.これについて,力センサ の設置位置を工夫して,ユーザの 2 つの動作意図の識別の向上を図った.実験では,姿勢の固定 された装具を装着した状態から,腕を伸ばす,あるいは負荷を装具に委ねるという動作を被験者 に実行してもらい,その時の力センサの測定電位の変化を記録した.そして,どちらの意図をもっ て動作したかを識別するために,各電位変化を独立変数として動作意図(伸ばす:−1,委ねる: +1)を説明する線形回帰式を実測値より導出した. 図 8 に最終的なセンサの取り付け位置を示す.ここで, 4 は,掌と荷重の接面に設置され,ユーザが物体 センサ を支えるためにかけている力を計測する.実際の介護現 場では抱きかかえや抱き起こしといった作業を受ける被 介護者はまったくの受け身ではなく,身体を委ねたり硬 ④ ばらせたりといったように少なからず自律的に反応する ものである.介護者はそのような動きを五感で感じ取り, ① ③ ② 動作のバランスを保つなどの介護に必要不可欠な行動の 調節をしていると言える.このような視点に立つと,パ 力センサ ワーアシスト装具は,それを装着する介護者に対してだ けでなく,被介護者を含む共同作業場に対する気づきも 図 8: 力センサの取り付け位置 また求められる.そのための情報をユーザとの間で共有 できてこそ,ユーザの意図の的確な汲み取りと,それに 4 はこのような観点から導 裏打ちされた両者の円滑な協調が成立すると考えた(図 9).センサ 入したものである.しかし,このセンサの配置が判別精度の向上に寄与することはなく,50 サン プル中で正答は 42 サンプル(82 %)にとどまった.これは,姿勢を拘束された条件下での動作実 1 行であったために掌にかかる力が判別に利用できるような変動を示さなかったからであるが,今 回の動作タスク自体が作業場に変動要因を含んでいなかったからとも言える. 一方で,センシング情報にはユーザ 被介護者を含む による 2 つの操作の違い以上に,腕 作業場に加えるべき操作 共同作業場 の肉付きや装着の仕方といった被験 者の個人差が大きく影響することが 判断の 判断の 手がかり 手がかり 確認された.そこで,力センサの測 定値を「個人に特有なデータ」と「操 作に固有なデータ」に分離して,後 者のみを用いて判別させることにし た.前者は,両操作について,被験者 全員のセンサパターンの平均をとり, それを各被験者の平均データから除 作業場に加えるべき操作 作業場に加えるべき操作 いたものとして定義した.このデー の判断 の判断 タを用いて動作意図の説明式を回帰 介護者 装具 したところ,50 サンプル中 47 サン 判断の 手がかり プルについて正しい判定が得られた. このように個人の特性や振る舞い の違いは,ユーザと密接に相互作用 するシステムにおいて無視できない 図 9: 介護者―装具―作業場の三者関係の構図 大きな影響を持つ.これを吸収する ためには,事前の機械的な設計の工夫だけでなく,作業遂行におけるシステムの機能的な調整も また必要であると考える. 6. まとめ 本稿では,ユーザとの自然な共同作業のために振る舞いの動的な調整が求められる人間―機械 系の例としてパワーアシスト装具開発の取り組みについて報告した.ユーザの自然な動作実行を 崩さないシステムの振る舞いの実現の一方で,ユーザ個人に適合するための機能的な調整の方法 について追究しなくてはならないと考えている. 謝辞 本報告の内容は,デザインシステム論講座修士 2 回生の小野裕之君と同 4 回生の塚本智司君の 研究成果によるものである. 参考文献 [1] Horiguchi, Y. Design of Co-Adaptive Interface System for Supporting Joint Task by Human and Machine Autonomies. PhD thesis, Kyoto University, 2005. [2] Dekker, S. W. A. and D. D. Woods. MABA-MABA or Abracadabra? Progress on HumanAutomation Co-ordination. Cognition, Technology & Work, Vol. 4, No. 4, pp. 240–244, 2002. [3] Sarter, N. B., D. D. Woods, and C. E. Billings. Automation Surprises. Handbook of Human Factors & Ergonomics (ed.Salvendy, G.). Wiley, 2nd edition, 1997. [4] 佐伯. 機械と人間の情報処理―認知工学序説―. 意味と情報 (竹内(編)), pp. 21–54. 東京大学 出版会, 1988. [5] Polanyi, M. The Tacit Dimension. Routeledge and Kegan Paul, London, 1966. [6] 中野, 今水, 大須, 宇野, 五味, 吉岡, 川人. 多数の軌道データに基づいた軌道計画規範の定量的検 討. 電子情報通信学会技術研究報告, pp. 111–118, 1996. 第4章 研究成果報告 組織再生過程の環境設定による細胞・組織の機能形成に関する研究 工学研究科機械工学専攻 山本 浩司 Abstract: Living tissue maintains its structure and function by adaptive self-remodeling in the environment. This means that the physical environment plays important roles in constructing a functional tissue. In this report, adhesion force of a chondrocyte to substrates was measured, and effects of mechanical stimuli in the process of cartilage regeneration were also investigated. In results of evaluating cell adhesion, the adhesion force per unit contact area to fibroin sponge, which can be used as a scaffold, increased at the early stage of cell culture. In contrast, the adhesion force per unit contact area to glass substrate was low at first, and then increased in proportion to culture time. This might suggest that the change of adhesion force per unit contact area to the substrate can affect the organization of a tissue. Results of evaluating tribological properties of regenerated cartilage showed that the mechanical stimuli loaded on a tissue could affect the maturity of regenerated cartilage and improve the friction durability of regenerated cartilage. It was also suggested that the friction durability of regenerated cartilage under mechanical stimuli matured to adapt to the physical demands of the environment. Key words: Bio-environment designing, Living tissue, Cartilage regeneration, Cell adhesion, Friction durability 1. はじめに 単一の細胞から組織の形態形成および機能の発現に至る過程は,個々の細胞や構成体そのものが有す る内部ダイナミクスと生体内環境および外部環境との相互作用とが相互フィードバックを介して自律適 応的に構成されていく過程であると考えることができる.近年,再生医療の分野において,単一細胞か らの組織形成が生体外環境で数多く試みられているが,組織から単離した細胞が元の組織のように構造 化し且つ機能化していくためには細胞や組織をとりまく『環境を設定』することが重要である.そこで, 本研究では『環境設計』の観点から,単一の細胞が組織を構成する場合の初期接着状態に関する考察, およびその条件の下で構造化していく組織に対して,力学環境を設定することによる適応的機能変化お よび形態形成に関して工学的・組織学的実験を行った. 本研究では,特に軟骨細胞が軟骨組織を形成する過程,および軟骨組織が有する機能の一つとして潤 滑特性が成熟する過程に着目している.一般的に結合組織を構成している細胞は,血管内を浮遊してい る血球系細胞などと異なり,細胞-細胞間の接着や細胞-基質間の接着が増殖や組織構成の前提条件と なる.しかし,軟骨細胞は通常の培養ディッシュなどに一旦接着すると,増殖する過程において脱分化 を起こし軟骨細胞としての形質を失ってしまう.ところが,軟骨細胞を培養担体と呼ばれる特殊なゲル やスポンジに播種すると,その形質を失うことなく 3 次元的な組織を構築し,組織学的にも生体の軟骨 組織と同等のタンパク発現が見られるようになる.つまり,軟骨細胞が組織を構築するためには,細胞 が形質を維持しつつ(脱分化せずに)増殖するという二律背反的な環境が必要であり,軟骨細胞はそれら との相互作用を介して存在していると考えられる.我々は 3 次元の組織化を可能とする培養担体として フィブロインを利用し,フィブロイン表面への初期接着状態と 2 次元平面培養における初期接着状態を 比較することで,3 次元の組織化を可能とする接着状態に関して研究を行った. また,このようなフィブロインを用いて組織化した再生軟骨組織は培養日数を重ねるにつれ初期の摩 擦係数が減少し,生体軟骨組織の摩擦係数に近づくことを昨年度報告した.しかし,摩擦距離が増加す るにつれ組織自体は摩耗していないにも関らず,摩擦係数が増加する傾向が見られた.本年度の研究で は,関節軟骨にせん断や圧縮が動的かつ複合的に負荷されていることを考慮し,せん断力が負荷される 環境下において組織再生を試みた.そしてそれらの環境に対して再生軟骨組織が示す形態変化および機 能変化に関する研究を行ったので報告する. 2. 基質に対する単一細胞の接着力 本実験では,表現型を維持しつつ細胞が増殖する環境としてフィブロインを用い,3次元組織化を可能 とするフィブロイン上における細胞の初期接着状態と,2次元培養における初期接着状態に関して,次に 示す比較実験を行った.その際,2次元培養としてはガラス基板に対する軟骨細胞の接着性を評価した. また3次元培養担体のフィブロインスポンジの溶液をガラス基板にコーティングしたものをフィブロイ ンスポンジ表面の構造と近似し,同様の評価を行った.ただし,両群とも接着活性を変えるために以下 に示す試料を作製した. 2.1 接着面積測定用基質 細胞の接着面積を測定するために細胞と接着する人工基質として18×18mm のカバーガラス(Thickness NO. 1, MUTO PURE CHEMICALS CO. LTD)を用いた.本研究では異なるコ ーティング処理を施した次の4種類のカバーガラス; (a)未処理,(b)フィブロネクチンコーティング, (c)フィブロインコーティング,(d)RGDペプチド含有フィブロインコーティングを用いた.ここで,フ ィブロネクチンとは細胞接着・伸展活性に影響を与えるタンパク質であり,RGDペプチドとはフィブロ ネクチンを構成する接着因子の一つである.(b),(c),(d)のコーティング処理はそれぞれ以下の方法で 行った.また,(a)~(d)のカバーガラスに軟骨細胞を播種したものをそれぞれ,con群,fn群,fib群,rgd 群とした. (b)フィブロネクチンコーティング;フィブロネクチン溶液としてプロネクチンF(632-02761,三洋化成 工業製)を用いた.プロネクチンFをPBSで10μg/mlに希釈した溶液にカバーガラスを浸し,室温で5 分間放置した後,PBSで洗浄した. (c)フィブロインコーティング;絹フィブロイン水溶液にカバーガラスを浸し,室温で乾燥させた後PBS で洗浄した. (d)RGDペプチド含有フィブロインコーティング;精製した絹フィブロイン水溶液にフィブロネクチン の接着因子であるRGDペプチドを9MLiBr溶液に溶解したものを5wt%の濃度で混合し,さらに溶液を 透析して調整した.調整した溶液にカバーガラスを浸し,室温で放置した後,PBSで洗浄した. それぞれのカバーガラスに軟骨細胞を5.0×104cells /mlで播種し,37℃,5%CO2環境下で一定時間培養 したものを測定に用いた. 2.2 接着面積の測定 各種基質上で 3,6,9,12,24 時間培養後,カバーガラス表面を PBS で洗浄し 4% パラホルムアルデヒド(040305,武藤化学性)で細胞を固定した.固定した接着細胞を倒立型ルーチン 顕微鏡(CKX41,OLYMPUS 製)で観察し,顕微鏡画像から画像解析ソフト Scion Image(Beta4.0.2,Scion Corporation 製)を用いて細胞の接着面積を求めた. 2.3 接着力測定装置の開発 本研究で開発した測定装置の概略図を図 1 に示す[1].主な構成は軟骨細胞 が接着した極薄板ガラス(0100, 松浪硝子工業製,ヤング率 E=71.4GPa)と,軟骨細胞を保持・操作する マイクロピペットである.マイクロピペットの位置は XYZ 微動ステージにより微調整でき,X 軸に自 動ステージ(KS101-20HD, 駿河精機製)を用いることで一定速度での引張りを可能とした.また,マイク ロピペットはホルダーを介してマイクロインジェクター(セルトラム Air,eppendorf 製)と接続してあ り,マイクロピペット内を陰圧にすることで軟骨細胞を保持した.基板に接着した細胞をマイクロピペ ットで保持した後一定速度で引張り,剥離するまでの過程をデジタルマイクロスコープにて撮影した. それらの画像から板ガラスの最大たわみ量を求め,接着力を算出した.なお,本実験で用いた板ガラス の厚さは 30μm であり,幅は 1.5mm である.また測定部は pH 調整培養液 Leibovitz’s L-15 Medium (11415-064,GIBCO 製)で満たし,pH よる活性変化の影響を受けないようにした.なお,全ての実験 は室温にて行った. 2.4 接着力の測定 板ガラスに対して 2.1 で示した(a)~(d)コーティングをそれぞれ行い,軟骨細胞を 5.0×104cells /ml で播種した後,インキュベータ内で 3,6,9,12,24 時間静置培養を行った.なお,コ ーティングは先端から 15mm の部分まで行い,コーティングによる材料特性やばね定数に影響がないこ とを確認した.これらの板ガラスをホルダーに固定し,接着細胞をマイクロピペットにて保持した後, 5μm/s の一定速度で引張り試験を行い,剥離するまでの過程を画像解析した. 第4章 研究成果報告 Holder Flat Glass Medium Chamber Stage Chondrocyte Micro Pipette 図 1 Photograph and schematic drawing of apparatus for measuring cell adhesion force. 3. 物理環境の変化による再生組織の耐摩耗性変化 培養担体としてフィブロインスポンジを用いると,軟骨組織がフィブロイン上に構築される.昨年度 の研究では『環境設定』を行わずして構築した再生軟骨組織の潤滑特性に関する実験を行った.その結 果,初期の摩擦係数は培養日数とともに下がるものの,摩擦距離の増大に伴い摩擦係数が急激に上昇す る傾向が見られた.そこですべり刺激によるせん断力が負荷される環境下での組織再生を試み,再生軟 骨組織の形態や機能変化に及ぼす影響を以下の方法で検証した. 3.1 試料 4 週齢の日本白色家兎から大腿骨,脛骨,上腕骨を摘出し,それらの骨頭より軟骨片を採取 した後トリプシン処理ならびにコラゲナーゼ処理により軟骨細胞を単離した.単離した軟骨細胞を,直 再生軟骨). 径8mm, 厚さ1±0.2mmのフィブロインスポンジ上に,1×107cells/mlの濃度で播種した(以下, その後 3 時間インキュベータ内に安置した. 3.2 力学環境設定 すべり刺激が負荷される環境下で再生軟骨を培養するためにマグネチックスター ラー(HP70100,VARIOMAG 製)とそのコントロールユニット(40B,VARIOMAG 製),および直径 60mm のテフロン製円盤型マグネット回転子を用いた.回転子には中心からの距離が 23mmの円周上に直径 8.7mm の縦穴を開け,その中に再生軟骨を設置した.これらをガラス製培養皿の中に培養液とともに入 れ,播種後 72 時間から 5rpm の速度で常時回転させ,37℃,5%CO2 環境下で一定期間培養した.比較 基準としてはすべり刺激を与えずに,同一条件で培養した再生軟骨を使用した.なお,すべり刺激環境 下で培養した組織を stirring 群,静置培養した組織を control 群とする. 3.3 摩擦試験 摩擦試験機の概要は既報[2]の通りである.すべり刺激が負荷された環境下における培 養が,再生軟骨の潤滑特性に及ぼす影響を評価するため,培養 7 日目および 14 日目のすべり刺激群,お よび control 群の試料を用いて摩擦試験を行った.対摩擦面にはステンレス平板(Ra=0.06μm)を用い,垂 直荷重は 0.029N,摩擦速度は 0.8mm/s 一定のもと,片側ストローク 20mm の往復運動にて摩擦試験を行 った.また摩擦距離は 0.96m であり,実験は室温環境下(25±2℃)で行った. 3.4 組織評価 摩擦試験前後の stirring 群および control 群の再生軟骨組織に関して,基質成分を HE 染 色,トルイジンブルー染色,サフラニン-O 染色,Ⅰ型及びⅡ型コラーゲン免疫染色を用いて組織学的に 評価した. 4. 結果 4.1 接触面積の測定結果 con 群,fn 群,fib 群,rgd 群の培養時間に伴う接着面積の変化を図 2 に示す. 全ての群において,培養時間に伴い接着面積が増加した.con 群と fib 群の間では培養 6 時間以外に有意 な差は見られなかった.また rgd 群は fib 群に比べ接着面積は有意に高い値を示した. 4.2 接着力の測定結果 con 群,fn 群,fib 群,rgd 群の培養時間に伴う軟骨細胞の接着力の変化を図 3 に示す.すべての群において,培養時間に伴い接着力が増加した.培養 6,9,12 時間において,fib 群 は con 群に比べ接着力は有意に高い値を示した. また fib 群と rgd 群との間に有意な差は見られなかった. 4.3 摩擦試験の結果 次に,培養 7 日目の摩擦試験結果を図 4(a)に,培養 14 日目の結果を図 4(b)に 示す.培養 7 日目では,stirring 群と control 群との間に顕著な差は見られなかった.しかし,培養 14 日 目になると摩擦初期の摩擦係数は同程度であるのに対して,stirring 群は,摩擦距離が増大しても摩擦係 数を維持する傾向が見られた. 4.4 組織染色の結果 培養 7 日目における組織学的評価の結果を図 5(a)に,培養 14 日目の結果を図 5(b)に示す.培養 14 日目の結果からも明らかなように control 群に比べて stirring 群の組織成熟は早く, 約 2 倍の組織厚となった.また,細胞間の間隔が広く細胞外基質の活発な産生および構造化が行われた と考えられる.また摩擦前後を比較すると,stirring 群,control 群ともに組織自体の厚みの変化は少ない ことがわかる. mean±s.d. 2 Contact Area [ٛm ] 2500 2000 con fn fib rgd * ** n.s. ** n.s. ** n.s. ** 12 24 1500 n.s. n.s. 1000 500 0 3 6 9 Culture Time 図 2 Changes of contact area of a chondrocyte on[h] each substrate with culture time. (*: P<0.05, **: P<0.01, n.s.: P>0.05, by t-test) mean±s.d. n.s. n.s. Adhesion Force [nN] 600 500 400 con fn fib rgd ** n.s. * n.s. ** n.s. 300 200 n.s. n.s. 100 0 3 6 9 12 24 Culture Time [h] 図 3 Changes of adhesion force between a chondrocyte and each substrate with culture time. (*: P<0.05, **: P<0.01, n.s.: P>0.05, by t-test) 第4章 研究成果報告 1 Control group Stirring group 0.8 Friction coefficient Friction coefficient 1 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 Control group Stirring group 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 Sliding distance [m] Sliding distance [m] (a) 7 days cultivation (b) 14 days cultivation 1 図 4 Comparison between transition of friction coefficient in control group and that in stirring group. (a) 7 days cultivation. (b) 14 days cultivation. Before friction test After friction test Control Before friction test After friction test Control group group 100 μm 100 μm Stirring 100 μm 100 μm 100 μm 100 μm Stirring group group 100 μm (a) 7 days cultivation 100 μm (b) 14 days cultivation 図 5 Histological observations of regenerated cartilage tissues in control group and in stirring group. (a) 7 days cultivation. (b) 14 days cultivation. 5. 考察 軟骨細胞は通常の培養ディッシュに播種すると,活発に増殖するものの脱分化を起こし,軟骨細胞と しての表現型が変化することが知られている. また 2 次元細胞培養では, 表現型が変化したまま増殖し, 組織化することができない.つまり,軟骨細胞が 3 次元組織を構築するためには,形質を維持する環境 および 3 次元組織化を開始する環境, そしてその構造を維持できる環境が必要であると考えられ,それら を満たす環境下において細胞が示す挙動を明らかにすることが重要である. 本実験結果において con 群と fib 群を比較すると細胞の接着面積には大きな差が見られないものの,培 養時間によっては接着力に有意な差が現れた. そこで,図 2 と図 3 から各種基板に対して,単一細胞の単 位面積あたりの接着力を算出した.その結果,図 6 に示すようにガラス基板である con 群と fn 群は培 養時間にほぼ比例して増加するのに対して,培養担体をコーティングした fib 群および rgd 群は培養初期 において単位面積あたりの接着力が高い値を示す傾向が見られた.細胞と基質の接着は例えば細胞膜タ ンパクであるインテグリンとフィブロネクチンの結合などによって行われており,これらのタンパクの 発現量は細胞の形態や分裂などの生理活性に影響を与えることが知られている.即ち図 6 に示す結果か ら,3 次元組織が可能な基質への接着では,培養初期においてこれらのタンパクを介した結合密度が上昇 con fib 2 Adhesion Force/ Unit Area [N/m] 400 350 fn rgd 300 250 200 150 100 50 0 0 5 10 15 20 25 Culture Time [h] 図 6 Changes in adhesion force per unit contact area of a chondrocyte on each substrate. する,あるいは結合状態が強くなる可能性が示唆された.一方,ガラス基質への接着ではこのような傾向 は見られず,培養初期の変化が 3 次元組織を構築する初期条件に影響を与えていると推察される. また,すべり刺激環境下における再生組織では,組織の厚みおよび耐摩耗特性の改善が見られた.軟骨 細胞の細胞外基質産出量は圧縮,引張,およびせん断応力や,静水圧などの力学刺激により促進される といった報告がなされている[3][4].今回の実験からでは,与えられた滑り運動のどのような物理量が これらの変化を引き起こしたのかを同定することは困難であり,相乗的効果に因るところが大きいと思 われる. 実際,すべり刺激実験において,より厳密に試料を固定し,均一なすべり刺激が負荷される環境を 設定すると,組織形成が見られなかった. しかし,本実験結果の重要な所は,すべり刺激というせん断力が 負荷される環境において再生した組織は,せん断刺激に対する耐性が向上したという事実である. これは, 単一の細胞が組織構築する過程において,周囲の環境に対して自律適応的な応答をした結果であると考 えられよう.フィブロイン培養担体を利用すると,静置培養における再生軟骨組織でも,培養日数に伴い 組織の厚みが増加し,摩擦初期の摩擦係数が減少する.しかし,これらの現象は外部環境とは無関係に軟 骨細胞が有する生物学的な,あるいは産生された細胞外マトリックスが有する物理化学的な自律作用に 因るところが大きいと考えられる.確かにフィブロインは 3 次元組織化を可能とする初期環境を提供し ていると考えられるが,このようにして構築された組織の持つ形態や機能は,生体内組織が有するもの とは異なり,多くの場合が未熟な組織となる.軟骨細胞が組織化の過程において産生する細胞外マトリ ックスは,組織骨格としての役目を担っているだけではなく,細胞-細胞間情報伝達や細胞-組織間情 報伝達の経路となっている.また血管やリンパ管の存在しない軟骨組織では,栄養分の伝達はマトリッ クスの物理的な変形や生化学的な活性に依存している.即ち,本実験におけるすべり刺激環境では,物理 的な作用だけではなく,運動に伴う培地の流動なども組織構築に影響を与えていると考えられよう. 参考文献 [1] 福田裕介・五十嵐昇・山本浩司・富田直秀・他 4 名,細胞の接着と組織形成に関する研究,年次大 会講論,5(2004),29-30. [2] 山本浩司・森田有亮・富田直秀・他 5 名,再生軟骨の摩擦・摩耗特性,日本臨床バイオメカニクス 学会, (印刷中). [3] Jin M, Frank EH, Quinn TM, Hunziker EB, Grodzinsky AJ.:Tissue shear deformation stimulates proteoglycan and protein biosynthesis in bovine cartilage explants, Arch. Biochem. Biophys., 395, 1, (2001), 41-48. [4] Lane Smith R, Trindade MC, Ikenoue T, Mohtai M, Das P, Carter DR, Goodman SB, Schurman DJ.:Effects of shear stress on articular chondrocyte metabolism, Biorheology, 37, 1-2, (2000), 95-107. 第4章 研究成果報告 斜め蒸着によって形態を制御した TiO2 薄膜上における細胞の挙動 工学研究科機械工学専攻 寺村 聡 Abstract: Instructions for the preparation of manuscripts for annual report are given. Abstract of 150-200 words should be written in 10 point Roman with single space followed by about 5 key words. Left and right margin from title to key words should be 30 mm. Main text will start with a line spacing above. Bio-environment designing is the key factor for successful tissue engineering technology. In this study, the relationship between the cell behavior and the surface topography, which is controlled by dynamic oblique deposition, has been discussed with a special emphasis on the shapes and actin filament synthesis. The SiO2 films with flat, circular and elongated surface morphologies were deposited on a glass substrate. The surface morphology evaluation of the samples was observed using scanning electron microscopy (SEM). The aspect ratio of circular morphology was about 1.2 and spacing between each cluster of column is about 100nm. The aspect ratio and spacing of elongated morphology was about 2.2 and 50-100nm, respectively. Mesenchymal cells derived form bone marrow were seeded on the sample and then adhesion behaviour, shape of cell and actin filament were observed. Adhesion rate of cells on the flat surface sample were higher than on the others. The observation of actin filament showed that cells on the elongated surface revealed much actin filament per unit cell area and had higher aspect ratio than on the circular. Some kind of cell function might be affected by the nano morphologies of the surface. There is the possibility that cell shape and structure can be controlled by nano morphologies of surface. Key words: Cell adhesion behavior, Surface topography, Bio-environment designing, Nanostructured materials, Nano-technology 1. 緒言および目的 再生医療や生体材料分野において,表面・界面の形状をナノスケールで制御し,細胞機能の制御に結びつけよう とする試みが行われている.ナノスケールの表面形状は,細胞の接着1)-3)や移動2),形態4), 5),増殖3)骨格6),アポ トーシス7),遺伝子発現等8)に影響を与えることが報告されている.このような細胞機能を制御することによって, 新薬スクリーニングや様々な細胞デバイスの開発,再生医療分野で必要となる生体組織の生理機能制御技術 の開発などが可能になることが考えられる.この表面形状を制御する研究では,加工の容易さから,材料に高 分子材料が用いられることが多い.本研究では斜め蒸着によって,SiO2の表面形状をナノスケールで制御し, その表面上における細胞の挙動に関する基礎的な知見を得ることを目的とした. 2. 実験方法 2.1 試料 基板としてコーニング 7059 ガラスを用いた.電子ビーム加熱によって SiO2(純度 99.99%,高純度化学研究所) を真空中で蒸発させ,ガラス基板上に蒸着した.ガラス基板の法線方向に対して蒸着方向を 82°傾け,膜厚が 15nm毎に,基板を面内で180°回転させることによって,蒸着面に垂直な方向に細長く伸びた SiO2 のバンドル構造 をもつ試料を作製した(バンドル群)9).また,同じく 82°傾け,10rpm にて面内回転させることによって,円柱状の構 造をもつ試料を作製した(円柱群).コントロールとしては,基板を傾けずに蒸着を行い,表面形状が平坦な試料を 用いた(フラット群). 2.2 細胞培養 培養細胞には,ラットの間葉系間質細胞を用いた.まず,F344ラットの大腿骨より骨髄液を採取し,FBS (Fetal Bovine Serum, JRH Bioscience)を10%,抗生物質 (ペニシリン 10000 units/ml,ストレプトマイシン 10 mg/ml,アムテホリシンB 25 µg/ml,塩化ナトリウム 0.85 %,nacalai tesque)を1%それぞれ添加したD-MEM (Dulbecco’s Modified Eagles Medium,nacalai tesque)とともに,1日培養した.培養環境は,温度37℃,湿度 100%,5% CO2 - 95% Airとした.その後,接着細胞をトリプシン(0.25 % - Trypsin / 1mM - EDTA (Ethyene Diamine Tetraacetic Acidエチレンジアミン四酢酸二ナトリウム) Solution, nacalai tesque)処理によって単離 し,これを5代継代させた細胞を用いた.細胞をフラット,円柱,バンドル各試料上に播種密度が2.0×104 cells / cm2となるように播種した.シリコンゴム製細胞培養チャンバー(ザルトリウス)を用い,0.8cm2の平面培養を行っ た. 2.3 位相差顕微鏡観察,アクチンフィラメント観察 播種後,一定時間毎に位相差顕微鏡観察(CKX41SF,OLYMPUS)を行い,細胞の形態および接着状況を評価し た. また,蛍光標識によりアクチンフィラメントの観察を行った.細胞を 5 日間培養した後,4℃にて,5% paraformaldehyde(武藤化学)中で細胞を 30 分保持し,細胞を固定した.PBS(Dulbecco's Phosophate Bufferd Saline (-) ,nacalai tesque)で3回洗浄した後,室温にて,0.1% Triton-X (Polysciences)中で 10 分保持し,脱膜処理を行 った.その後,上述の培養環境にて,Rhodamine-Phalloidin (Molecular Probes)中で,2 時間 30 分保持し,F-ア クチンを蛍光染色した.余剰の蛍光物質を洗浄するため PBS で 10 分×3 回洗浄した後,PBS 中で観察した. 蛍光観察には,共焦点レーザー走査型蛍光顕微鏡(LSM510,Zeiss)を用い,60 倍の油浸対物レンズを使用 した.画像は,細胞接着底面から,細胞上部までの平面断層画像を 0.39µm 間隔で取得した.取得した平面断 層画像を画像処理にて重ね合わせ,細胞内全体のアクチン細胞骨格を画像化した.得られた画像を Image J (National Institute of Health)を用いて処理し 8bit のグレースケールにおける平均輝度を算出した.本実験で蛍 光標識に用いた Phalloidin は,F-アクチンに特異的に結合するため,ネットワーク構造として組織化されたアク チンフィラメントを,選択的に蛍光染色することが可能である.すなわち,アクチンフィラメントが発達しているほ ど,Rhodamine-Phalloidin 染色による蛍光輝度も高くなり,この蛍光輝度がアクチンフィラメントの発達具合の指 標となる.13), 14)ここでは,各細胞における細胞輪郭内の,アクチン細胞骨格の平均蛍光輝度を算出することに より,アクチン細胞骨格の組織化度を評価した.また,同時に得られた画像より,次式 (i) を用いて真円度を求 めた. circularity = 4π[area/(perimeter)2]. (i) 真円度が 1 の時は真円を示し,0 の時は無限に伸びている形状を有することを示す.観察した細胞数は,それ ぞれの基板上で約 50cells とした. 3. 結果 3.1 薄膜の形態観察 SiO2 を蒸着した試料の SEM 観察の結果を Fig. 1 に示す.Fig. 1 (b)の円柱群の試料表面 には,複数の円柱状のコラムが束になった構 造がみられる.画像から見積もったコラムの アスペクト比は1.2で円柱に近く,円柱の束の 間隔は約100nmであった.また,細胞が接着 できると考えられる円柱の束の部分の面積は 画像全体の面積の 53.2 %であった.一方, Fig.1 (c)のバンドル群の試料表面にはアスペ クト比が 2.2 の異方的な形状のコラムが形成 されており,それらの間隔は 50-100nm であ った.バンドルの面積の割合は 62.6 %であっ た. 3.2 位相差顕微鏡による細胞の接着性, および伸展方向観察 Fig. 2 にそれぞれの試料上で 168 時間培 養した細胞の位相差顕微鏡観察の結果を示 す.培養 6,12,24 時間後の観察では全体的 (a) (c) (b) Fig.1 Surface morphology of each sample observed using SEM. (a) Flat surface morphology. (b) Cylindrical surface morphology. The aspect ratio of this morphology was about 1.2 and spacing between each cluster of column is about 100nm. The ratio of possible adhesive sites of cells (cylinder surface area) is 53.2 % (c) Bundle surface morphology. The average length of the minor axis of these anisotropic columns is 130 nm. The aspect ratio and spacing were about 2.2 and 50-100nm, respectively. The ratio of possible adhesive sites of cells (bundle surface area) is 62.6 %. 第4章 研究成果報告 (a) (b) (c) ** 4. 考察 ** 50000 ** Circularity 0.4 0.2 flat cylinder bundle (a) 75 25000 0 0.0 Mean intensity of actin fiber [8bit gray scale /µm2] 細胞は,糸状仮足(filopodia)によって,接着 に適した場所を探索することが知られている10), 11) .さらに,糸状仮足は,アクチンファイバーに よって活動が促進されることが知られており,細 胞は収縮性のアクチンファイバーを用いて,材 料表面に伸展するとされている12).Dalbyらは, 直径100nm,円柱間の距離230nmのPMMA (Polymetyl-Methacrylate)上で細胞を培養すると, フラットなPMMA上で培養した細胞より,接着面 積が小さく,アクチンファイバーを発現する細胞 の割合が少ない等の結果を報告している13).材 料,表面形状は異なるが,本研究におけるフラ ット群と円柱群の比較は,これらの結果と一致す るものである. 真円度はFig. 3 (a)に示したように,フラット群 とバンドル群とほぼ同じ値を示し,伸展形態に 関して,両群の差は見られなかったが,Fig. 2に 示したように,バンドル群のみ一方向を向いて 伸展していた.さらに,Fig. 3 (a)より,円柱群に 比べ,バンドル群の方が真円度が低い,すなわ ち細胞のアスペクト比が高い結果が得られてい る.また,Fig. 3(b)での細胞の接着面積は,円柱 群よりバンドル群の方が小さいが,アクチンフィ ラメントの発現量を面積で割った値(Fig.3(c))は バンドル群の方が大きかった.すなわち,アス ペクト比の高いバンドル形状を有する試料上の 10µm Fig. 2 A typical cell form on each sample after 120 hours cultivation. (a) flat (b) cylinder (c) bundle group. Only the cells on bundle had anisotropic shape and adhered in one direction. Area [pixel] に接着・伸展する細胞の割合は少なかったが,伸 展した細胞形態が出現する割合は,フラット群が 最も多かった.フラット群,円柱群では細胞伸展の 方向性はみられなかったが,バンドル群では,一 方向に細胞が並ぶ傾向がみられた. 3.2 アクチンフィラメント観察 形態観察,アクチンフィラメント観察の結果を Fig. 3 に示す.細胞の真円度を示す Fig. 3 (a)で は円柱群が最も高く,円柱群の細胞は他の群 に比べて,円形の形状のものが多いことを示し ている.今回用いた細胞は骨髄間質細胞であり, コントロール表面上では針状に伸展するが,Fig. 1-(a)に示すような円柱構造を有する試料上では, 円形の形状のまま接着していたことを示してい る.Fig.3. (b)は細胞の接着面積を示しており,フ ラット群が最も大きく,次いで円柱群,バンドル 群であった.アクチンフィラメントの総発現量を 細胞接着面積で割った Fig. 3 (c)では,フラット 群が最も高く,次いでバンドル群であり,円柱群 は他の群に比べて有意に低かった. (b) ** 50 ** 25 0 flat cylinder bundle (c) flat cylinder bundle Fig. 3 Graphs quantifying cell shape and expression level of actin filament in cells cultured on each samples. (a) Circularity (b) The area of cells (c) The result of mean intensity (grey scale measurement) of actin filament per unit area (mean ±sd.;* * = t-test, p<0.01.) 細胞は,単位面積におけるアクチンフィラメントの発現量が多く,アクチンフィラメントが密に存在していることを 示している.前述したように,細胞は糸状仮足によって,材料表面の形状を認識し,伸展形態等を変化させるこ とが広く知られている1)-8), 13).Fig. 3に示した結果は,糸状仮足が,試料のナノスケールにおける表面形状を認 識し,伸展形状やアクチンフィラメントの発現量に影響を与えているものと考えられる. 細胞が接着できると考えられる部分の面積は,円柱群で全体の面積の53.2 %であり,バンドル郡では62.6 %であ った.このように,今回作製した試料では,円柱群とバンドル群において,細胞が接着できると考えられる部分 の面積が異なる.この面積の違いが,Fig. 2,Fig. 3に示したような結果を生じた可能性もある.さらに,ナノスケ ールにおける試料の表面形状が,糸状仮足や,単位面積あたりのアクチンフィラメントの発現といった細胞の 各種機能に影響を与えている可能性も考えられる. 5. 結言 ナノメートルスケールで表面形状を制御した材料上で細胞培養を行い,細胞の形態観察,アクチンフィラメント観 察を行った.ナノメートルスケールの表面形状によって,細胞の接着形態、伸展方向やアクチンフィラメント量を制御 し得る可能性が示唆された. 参考文献 [1] A. S. G. Curtis, B. Casey et al. Substratum nanotopography and the adhesion of biological cells. Are symmetry or regularity of nanotopography important? Biophys Chem 94 : 275–283, 2001. [2] Barbara L. Richard, Motoyoshi Nomizu et al. Identification of Synthetic Peptides Derived from Laminin a1 and a2 Chains with Cell Type Specificity for Neurite Outgrowth. Experimental Cell Research 228 : 313–325, 1998. [3] M. J. Dalby, M. Riehle et al. Polymer Demixed Nano-Topography: Control of Fibroblast Spreading and Proliferation. Tissue Eng 8 : 1099–1108, 2002. [4] Clark, P., Connoly P et al. Topographical control of cell behaviour: simple step cues Development 99 : 439-499, 1987 [5] Clark P, Connoly P et al. Topographical control of cell behaviour: II. Multiple grooved substrata. Development 108 : 635–644 1990. [6] Dalby M. J., M. O. Riehle et al. Nucleus Alignment and Cell Signalling in Fibroblasts: Response to a Micro-Grroved Topography. Experimental Cell Research 283 : 274–282, 2003. [7] Chen, Christopher S.; Mrksich, Milan Geometric control of cell life and death. Science 276: 1425–1428 1997. [8] Beata Wójciak-Stothard, Adam Curtis et al. Guidance and Activation of Murine Macrophages by Nanometric Scale Topography. Experimental Cell Research 223 : 426–435 1996. [9] Motufumi SUZUKI, Wataru MAEKITA et al Direct Formation of Arrays of Prolate Ag Nanoparticles by Dynamic Oblique Deposition. Jap. J. App. Phy. 44 : 193-195 2005 [10] Dalby MJ, Di Silvio L et al. Increasing hydroxyapatite incorporation into poly(methylmethacrylate) cement increases oseteoblast adhesion and response. Biomaterials 23 : 569–76, 2002. [11] Opara TN, Dalby MJ et al. The effect of varying hydroxyapatite in poly(ethylmethacrylate) bone cement on human osteoblast-like cells. J Mater Sci: Mater Med14 : 277–282, 2003. [12] Burridge K., Chrzanowska-Wodnick M. et al. Focal adhesions, contractility, and signaling. Annu Rev Cell Dev Biol 12 : 463-519, 1996 [13] M. J. Dalby, M. O. Riehle et al. Changes in fibroblast morphology in response to nano-columns produced by colloidal lithography. Biomaterials 25 : 5415-5422, 2004. [14] K. Sato, S. Nishijima, et al., Role of the Organized Cytoslkeletal Actin Fiber Structure in Osteoblastic Response to Mechanical Stimulus, Transactions of the Japanease Society for Medical and Biological Engineering, in Japanese, 4-41 (2003), 211-219 第4章 研究成果報告 動的機能を有する機械構造システムの創成設計法の開発 (マルチフィジックス現象とマイクロストラクチャ構造の検討) 工学研究科精密工学専攻 西脇 眞二 Abstract: Topology optimization methods have been successfully applied to a variety of innovative mechanical structure and system designs. This research proposes new topology optimization methods for the designs of piezoresistive sensors that are composed of piezoresistive devices and flexible structures, and periodic microstructures of electro-magnetic materials as extensions to the multi-physics problems. Several numerical examples are also provided to show the utility of the methodology presented here for the optimal designs for sensors and microstructures using multi-physics phenomena. Key words: Topology Optimization, Multi-physics, Piezoresistive Sensors, Flexible Structures, Periodic Microstructures, and Electro-magnetic Material 1. はじめに 一般の機械構造は,破壊や共振現象を回避し,システムの安定性を確保するため,剛性の最大化や固 有振動数の最大化を目標として設計されることが多い.しかし,機械構造に動的な柔軟性や,特定の固 有振動数と固有モードを有する動的特性を適切に付加することが可能となれば,全く新しい機能を有す る複雑な機械システムを設計することができる.昨年度までに,本研究では,これらの新しい機械シス テムを創成する第 1 段階として,特定の振動特性をもつ機械式レゾネータや,非線形な大変形を伴う柔 軟性をもつコンプライアントメカニズムの創成設計法を開発した.本年度は,前年度の基本的な考え方 をマルチフィジックス現象に展開し,ピエゾ抵抗効果を利用したセンサーと,フォトニックバンドギャ ップ効果をもつマイクロストラクチャ構造の設計へ適用可能な方法論の構築を行う.さらに,簡単な数 値例により,これらの方法の妥当性について検証する. 2. トポロジー最適化と設計空間の緩和法 トポロジー最適化[1]の基本的な考え方は,拡張された固定設計領域 D と,次式で示す特性関数χΩの 導入にある. if x ∈ Ω d ⎧1 ⎩0 if x ∈ D \ Ω d χΩ ( x ) = ⎨ (1) ここで,xは固定設計領域内の位置,Ωdは本来の設計領域を示す. この特性関数χΩと固定設計領域Dを用いることにより,最適設計問題は固定設計領域Dにおける材料分 布問題に置き換えられる.そしてこの特性関数χΩにより,固定設計領域Dにおいて任意の最適形状を表現 することが可能となる.しかし,拡張された固定設計領域Dでは,χΩはいたるところ不連続な特性を持 つことになる.この問題を解決し,大域な観点から連続な値を得る設計空間の緩和方法として,均質化 法[1]やSIMP法[2]が用いられている.ここでは,マルチフィジックス現象を考慮した最初の試みとして, もっとも簡単に定式化が可能であるSIMP法を用いて設計空間の緩和を行う.すなわち,現象を記述する 際に必要な代表物理テンソルを a とすれば, a = ρ p a1 + (1 − ρ ) a0 p (2) として求める.ここで, ρ は正規化された密度で,充填状態で1,空孔状態で 0 をとる.また, a1 は充填状態に おける物理テンソル量, a0 は空孔状態における物理テンソル量を示し, p はペナルティを与えるパラメータで ある.以下に示すピエゾ抵抗効果を利用したセンサーの設計では,弾性テンソル D が代表物理テンソルと なるので, D = ρ p D1 (3) となる.これに対して,フォトニックバンドギャップ効果をもつマイクロストラクチャ構造の設計では,比誘電率 ε r が代表物理テンソルとなるので, ε r = ρ p ε r1 + (1 − ρ ) ε r 0 p (4) と表される. 3. ピエゾ抵抗効果を利用したセンサーの設計問題 ピエゾ抵抗材料[3]は,機械的な荷重や応力を負荷した場合に,材料の電気的抵抗値が変化する材料で, 荷重センサー[4],圧力センサー[5],加速度センサー[6]などの幅広い分野のセンサーに利用されている材料 である.ピエゾ抵抗材料をセンサーとして利用する場合,測定すべき目的の物理量を拡大したり,あるいは物 理量の方向を指定するために,通常,ピエゾ抵抗デバイスに,カンチレバー,薄膜などの柔軟構造と結合した 構造をもつ.ここでは,このピエゾ抵抗デバイスと柔軟構造物を用いたセンサーの最適設計法の開発を行っ た. 3.1 最適化問題の定式化 図1に示すように,2 次元の線形弾性体の境界を完全固定し,境界に表面力 t を作用させた場合について考 える.弾性体は線形な弾性変形をするピエゾ抵抗デバイスに境界を介して結合しているものとする.そして,ピ エゾ抵抗デバイスには,温度補償しつつ抵抗変化を増幅して計測するためホイットストーンブリッジを構成する. ホイットストーンブリッジの印加電圧側はデバイス上の境界 Γ in,1 , Γ in,2 に,出力側は境界 Γ out,1 , Γ out,2 に接続す る.なお,問題の簡略化のため物体力は作用しないものとする. 今,表面力 t の変化によるデバイスの抵抗変化を,ホイットストーンブリッジの出力側の電圧変化 ∆Vout によ る計測するとすることにより,荷重センサーとして利用するとすれば,センサーには荷重変化に対して最大限の 電圧変化を得る性能と,荷重負荷に対して線形弾性体が十分な剛性をもつ性能の2つの性能が要求される. 図 1 ピエゾ抵抗効果を利用したセンサーの性能評価尺度 次に,電圧変化を得る方法を導く.ピエゾ抵抗デバイスにおける電位場の平衡方程式は, ∫ Ωr ∇ϕ :k : ∇φ d Ω = ∫ J ⋅ nϕ d Γ for φ ∈ V r ∀ϕ ∈ V r Γr (5) となる.ここで, V r = {φ =0 on Γin,1 and φ =∆Vin on Γin,2 } (6) 第4章 研究成果報告 で, k は電気伝導率テンソルで,電気抵抗比テンソル ρ の逆マトリクスとなる.さらに, J は電流密度テンソ ル, n は境界に対する法線ベクトルである. また,ピエゾ抵抗デバイスにおける電気抵抗比テンソルとひずみに関する関係は次式となる. ρ = ρ0 ( I m + Π : σ ) = ρ0 ( I m + Π : Dr : ε ) (7) ここで, ρ0 は無ひずみ状態での電気抵抗比テンソルで, I m は対角項のみが1で他の項が0のテンソル, Π はピエゾ抵抗係数テンソル, σ は応力テンソル, Dr はピエゾ抵抗デバイスの弾性テンソル, ε はひずみテン ソルで,ここでは微小ひずみを仮定している. さらに,表面力 t を作用させたことにより,線形弾性体とピエゾ抵抗デバイスの変位ベクトルは,次の平衡 方程式より得られる. ∫ ε (v ) : D : ε ( u) d Ω = ∫ Ω Γt t ⋅ vd Γ for u ∈ V e ∀v ∈ V e (8) ここで, V e = {v = vi ei : v =0 on Γu } (9) Ω は弾性体とピエゾ抵抗デバイスの和の領域で, D はピエゾ抵抗デバイスあるいは弾性体の弾性テンソル である.以上の3つの式を解くことにより,電圧変化を導出することができ,この値を最大化することにより,セン サーの感度は最大化される. 他方,十分な剛性は,次式の平均コンプライアンス l ( u ) を最小化することにより得られる. l ( u ) = ∫ t ⋅ ud Γ Γt (10) 上述のように,この問題は,2つの目標関数の向上を目的とした多目的最適化問題である.ここでは,以下の 新しい多目的な目標関数により最適構造を得る. maximize f1 = w ln ( ∆Vout ) − (1 − w ) ln ( l ( u ) ) (11) 3.2 数値例 簡単な数値例により,本研究で提案する方法の妥当性を検証する. なお,最適化に用いた材料は,設計領 域に関してはアルミニウムを想定し,ヤング率 80Gpa,ポアソン比 0.3 とし,ピエゾ抵抗材料には,表1に示すも のを用いた. 表 1 ピエゾ抵抗材料の材料特性値 図 2 に設計領域を示す.図に示したように,設計領域の左側を完全拘束するとともに,左側上部にピエゾ抵 抗材料を配置し,右側上部に下方向の荷重 500N を負荷する.そして,体積制約を設計領域の 50%とし,出力 電圧 Φ out を最大化するとともに,荷重に対する剛性の最大化を行った.図 3 に,最適構造を示す.この図から わかるように, 本研究で提案する方法により,明瞭な最適構造が得られていることがわかる.なお,この場合, 初期構造では 0.06mV の電位差しかえられなかったものが,最適構造では 1.4mV の電位差が得られるようにな り,性能の大幅な改善が行われた. 以上の結果から,本研究で提案する方法により,ピエゾ抵抗効果を利用したセンサーの最適設計が可能で あることがわかった. 図 2 ピエゾ抵抗センサー設計のための設計領域 図 3 ピエゾ抵抗センサーの最適構造 4. フォトニックバンドギャップ効果をもつマイクロストラクチャ構造の設計問題 近年, 電磁材料の中に周期的な内部構造を作ることにより, アンテナ, 共振器などの高周波コンポーネント の誘電率, 透磁率などの電気特性を最適設計[7]したり, 負の誘電率や透磁率といった新しい特性を持たせた 材料の研究開発[8]が注目されている. ここでは,これらの材料設計の方法を開発する第1段階として,任意の フォトニックバンドギャップ特性をもつ材料の設計法について検討を行った. 4.1 最適化問題の定式化 図 4 に示すような2次元の周期構造に入射波が角度θで入射する場合を考える.ここで Γ1 は入射側境界, Γ 2 は出射側境界を表し, Γ3 , Γ 4 は周期長を d とする周期境界とする. Incident wave θ y z Γ1 Γ3 Ω x Γ4 Γ2 d 図 4 2次元周期構造 この場合の周期構造における電場 E = ( Ex , E y , Ez ) ,磁場 H = ( H x , H y , H z ) の支配方程式を記述すれ ば,次のようになる.まず,TE 波については, T T ∂ 2 Ez ∂ 2 Ez 1 ∂Ez 1 ∂Ez + + k02 E z = 0, H x = − , Hy = − , Ex = E y = H z = 0 2 2 ∂x ∂y jωµ 0 ∂y jωµ 0 ∂x (12) となり TM 波については, 1 ⎛ ∂2 H z ∂2 H z ⎞ 1 ∂H z 1 ∂H z + + k02 H z = 0, E x = − , Ey = − , ⎜ 2 2 ⎟ ε r ⎝ ∂x jωε 0ε r ∂y jωε 0ε ∂x ∂y ⎠ H x = H y = Ez = 0 (13) となる.ここで, ω は角振動数, ε 0 , µ 0 はそれぞれ真空中の誘電率,透磁率, ε r は媒質の比誘電率, k0 は 真空中における波数である. 第4章 研究成果報告 今,入射波と出射波の時間平均ポインンティングベクトル PIn , POut を求めると,それぞれ次式となる. PIn = ∫ d 0 ⎛ 1 ∂Ez , In ⎞ 1 ∂Ez ⎞ ⎤ −1 −1 ⎡ ⎛ Ez , In ⎜ − ⎟ dx, POut = ∫Ωt ℜ ⎢ Ez ⎜ − ⎟ ⎥dx 2 2 ⎢⎣ ⎝ jωµ 0 ∂y ⎠ ⎥⎦ ⎝ jωµ 0 ∂y ⎠ (14) ここで, Ωt は出射波の領域で, ℜ は実部をとるオペレータである. この入射波と出射波の時間平均ポインンティングベクトルをそれぞれの代表面積で正規化した比 S21 ,すな わち, S21 = PIn (15) d POut At は,入射波に対する出射波側からのエネルギー透過量の尺度を意味する.すなわち,この値を最小化するこ とにより,出射波を最小化することができる.本研究では,幾つかの周波数領域におけるサンプリング点で最小 化を可能とするため,次式の目的関数を用いて最適化を行った. n minimize f 2 = ∑ wi S21 i 2 (16) i =1 ここで,n は周波数領域におけるサンプリングの数, wi , S21 i はそれぞれ i 番目の重み係数と S21 である. 4.2 数値例 最初に,入射波が 1 方向のみの場合について最適構造を求める.図 5 に設計領域を示す.図に示したように, 設計領域の左右の境界に周期境界条件を設定し,上の境界より入射角0度で入射平面波を与える.この場合 の下の境界からの出射波を求め,それにより求められる1000で規格化された相対周波数240Hzの S21 を最小 化する.なお,図中の λo は,真空中の光の代表波長を示す.図 6 に最適構造と S21 の周波数特性を示す.こ れより,最適構造は横縞状になっていることがわかる.さらに,周波数特性をみると,指定した周波数の S21 は 最小化されており,バンドギャップ効果が生じていることがわかる. Incident wave 1 0.9 0.8 0.7 0.6 Periodic boundary conditions Design domain 0.5 0.4 3.74 λ 0 0.3 0.2 0.1 0 100 200 300 400 500 600 700 800 900 1000 Frequency (a) 最適構造 図 5 入射波が 1 方向のみの場合の設計領域 (b) 周波数特性 図 6 最適構造と S21 の周波数特性 次に,入射波が 2 方向の場合について,最適構造を求める.図 7 に設計領域を示す.図に示すように,設計 領域の上端,下端に非設計領域を設け,設計領域の左右の境界に周期境界条件を設定し,上部境界から入 射平面波をそれぞれ 30,-30 度方向から別々に与える.この場合の下の境界からの出射波を求め,それにより 求められる 1000 で規格化された相対周波数 375Hz の S21 を最小化する.なお,図中の λg は,誘電体の光の 代表波長を示す.図8に最適構造と S21 の周波数特性を示す.これより,最適構造は粒状の構造になっており 入射波が 1 方向のみの場合は異なる構造であることがわかる.さらに,周波数特性をみると,この場合も指定し た周波数の S21 は最小化されており,バンドギャップ効果が生じていることがわかる. 30° -30° 1 Incident wave 0.9 0.8 Non Design domain λg 0.7 0.6 0.5 0.4 Periodic boundary conditions Design domain 0.3 5λg 0.2 0.1 0 Non Design domain λg 100 200 300 400 500 600 700 800 900 Frequency (a) 最適構造 図 7 入射波が 2 方向のみの場合の設計領域 (b) 周波数特性 図 8 最適構造と S21 の周波数特性 以上の結果から,本研究で提案する方法により,フォトニックバンドギャップ効果をもつマイクロストラクチャ構 造の最適設計が,単純な設計問題については可能であることがわかった. 6. まとめ 本研究では,動的機能を有する機械構造システムの創成設計法の開発する一環として,昨年度までに 開発したトポロジー最適化の方法を新たにマルチフィジックス現象に展開し,ピエゾ抵抗効果を利用し たセンサーと,フォトニックバンドギャップ効果をもつマイクロストラクチャ構造の設計へ適用可能な 方法論の構築を行った.さらに,簡単な数値例により,これらの方法の妥当性について検証した. 参考文献 [1] Bendsøe M. P. and Kikuchi N., Generating optimal topologies in structural design using a homogenization method, Computer Methods in Applied Mechanics and Engineering, 71, (1988), 197-224. [2] Bendsøe, M. P., Optimal shape design as a material distribution problem. Struct. Opt., 1, (1989), 193-202. [3] S. Sze, Semiconductor Sensor, John Wiley & Sons, New York, USA, (2000). [4] L.-P. Chao and K.-T. Chen, Shape optimal design and force sensitivity evaluation of six-axis force sensors, Sensors and Actuators, A-physical, 63, (1997), 105-122. [5] R. Buchhold, R. Gollee, A. Nakladal, and G. Gerlach, A novel approach to modeling the transfer functions of four-terminal-transducer pressure sensors within a single simulation tool, Sensors and Actuators, A-physical, 80(1), (2000), 15-22. [6] J. Plaza, J. Esteve, and C. Cane, Twin –mass accelerometer optimization to reduce the package stresses, Sensors and Actuators, A-physical, 80(3), (2000), 199-207. [7] X. Gong, L.P.B. Katehi, and W. J., Chappell, Effective medium property of finely periodic substrates, IEEE AP-S Int. Antennas and Propagation Sym. Dig., 1,(2003), 489-492 [8] D.R.Smith, W.J. Padilla, D.C. Vier, S.C. Nemat-Nesser, and S.Schultz, Composite medium with simultaneously negative permeability and permittivity', Phys. Rev. Lett., vol.84, (2000), 4184-4187. 1000 第4章 研究成果報告 ヨーロッパ訪問記 工学研究科航空宇宙工学専攻 1. 青井 伸也 はじめに この度,21 世紀 COE プログラム「動的機能機械システムの数理モデルと設計論」―複雑系の 科学による機械工学の新たな展開―における若手武者修行制度の助成を受けて,平成 17 年 10 月 10 日から 21 日までの約 10 日間,ヨーロッパにおいて国際学会に参加し,その後 4 大学,6 研究 室を訪問して参りました.以下にその報告をさせて頂きます. 2. 旅から旅へ 2.1 国際学会 10 月 10 日から 13 日にかけて,オランダのハー グで開かれた国際学会 (IEEE Int. Conf. on Systems, Man and Cybernetics, 図 1) に参加し,口頭発表を行ってきました [1].こ の学会ではコンピュータサイエンス,メカトロニクス,インテリ ジェントシステムなど様々な分野の発表があり,これまで専門分野 に偏りがちであった私にとても新しい風を吹き込んでくれました. また,会場では 14 日に訪問する予定でした研究室などのロボット のデモも行われていましたので参加してきました.非常に多くの 図 1: 学会会場 (ハーグ コン 新しい研究成果を見ることができ,また議論もとても盛んで,楽 グレスセンター) しんで参加することができました. 2.2 デルフト工科大学 14 日はハーグからトラムでほんの 30 分 程度のところにあるデルフト工科大学に向かい,Martijn Wisse 博 士の所属する研究室にお邪魔させて頂きました.この研究室では, 受動歩行と呼ばれるエネルギー効率の良い歩行メカニズムをベース として,ロボットの歩行解析や機構設計などを行っています (図 2). 残念ながら,彼はこのとき半年ほどアメリカに渡っており不在でし たので,彼に紹介して頂いた Ph.D. の学生に私の訪問のお願いを していました.ここでは先日の学会でのデモで見せていただいたロ ボットだけでなく,この研究室でこれまでに設計してきた初代から 現在に至る多くの改良を重ねてきたロボットを見せて頂きました. 図 2: デルフト工科大学の 2 順を追って効率的に且つ合理的に改良がなされており,やはり何事 脚ロボット “Denise” にも明確な目的意識を持って持続させ,やり通すことが肝心であ ると感じました.その後,私の研究の紹介をさせて頂きました.こ こでの聴衆は主に学生だけでしたが,活発に議論することができ, 機構系と制御系の統合的な設計の重要さを再認識できました. 15 日は同じデルフト工科大学にある Van Woerkom 教授の研究 室を訪問させて頂きました.この研究室ではマルチボディシステム の解析,制御,設計等の研究を行っています.また,彼は航空宇宙 機システムの研究にも従事していまして,大規模なフライトシミュ レータ等を見せて頂きました.ここでは 1 時間ほどの講演をさせ て頂きました.光栄にもわざわざ講演案内の資料まで作って頂き, 図 3: 講演案内資料 校内にも貼って下さいました (図 3).聴衆は 20 人ほどでしたが, Wisse 博士とも歩行ロボットの動力学解析などに関して共同研究を行っている Arend L. Schwab 教授らもわざわざ来て下さいまして,非常に有意義な議論を交わすことができました. 2.3 イエナ大学とイルメナウ工科大学 16,17 日の週末にドイツ に向かい,18 日はイルメナウ工科大学の Hartmut Witte 教授の紹 介で,午前中以前彼が勤めていたイエナ大学の研究室にお邪魔させ て頂きました.この研究室では,トレッドミルとモーションキャプ チャ装置を用いて人間の歩行解析などを行っています.この日はキャ ンパス内で募集した学生らを集めて実際に歩行実験を行っていまし たので見学させて頂きました.生物学,生理学的な研究成果は,工 学研究に有益なアイデアを与えてくれますので,実験を見るだけで 図 4: イエナ大学のトレッド ミルとモーションキャプチャ なく多くの話を聞くこともでき非常に貴重な経験ができました. そして午後は,同じイエナ大学の Andre Seyfarth 教授の研究室 装置 に訪問させて頂きました.この研究室にも同じようにトレッドミル があり,歩行や走行の数理モデルを立てて実際のデータとの比較検 証を行っています.残念ながら,彼は時間の都合がつかず不在でし たが,MIT から帰ってきていた Ph.D. の学生を紹介して頂き,こ こでも研究の紹介をさせて頂きました.私の研究でも歩行の数理モ デルを立てて解析的に安定性などを調べていますので,彼らとの議 論は今度の解析方針にも非常に有益でした. 19 日はイルメナウ工科大学に訪問させて頂き,この日はようやく 図 5: イルメナウ工科大学の Witte 教授に会うことができました.彼の研究室ではイエナ大学で 小高い丘の上にある新しい講 行っているような生体力学的な実験や解析などを行っています.こ 堂 こでも,20 人くらいの聴衆に対して 1 時間ほどの講演させて頂きま した.生物学,生理学を専攻している方が多かったので,私の研究 では生物学的なアイデアを用いていかにして工学的に研究を行っているかを少し重点的に話しま した.また,その分野からのコメントも頂き,非常に視野を広げることができたように感じます. 2.4 ローザンヌ工科大学 20 日に急ぎスイスに向かい,21 日に ローザンヌ工科大学の Auke Jan Ijspeert 教授の研究室にお邪魔させ て頂きました.この研究室では,CPG(Central Pattern Generator) と呼ばれる生物のリズム運動を生成する機構のモデルを用いて,様々 な研究を行っています.ここでは,15 人くらいの聴衆に対して 1 時 間ほどの講演させて頂きました.私の研究でも CPG モデルを用い て制御系を設計し,実際にロボットを動かしていますので,共通意 識も多く活発に議論を交わすことができました. 3. 図 6: ローザンヌ工科大学 おわりに 今回多くの研究室を訪問させて頂きましたが,どの研究室でも Ph.D の学生,研究員が非常に多 く,また自国にとどまらず多くの地域から集まってきている印象を受けました.必ずしも英語圏 から来ている訳でもないのに関わらず,活発に議論が交わされており,また学校自体の雰囲気も 非常にオープンで,研究室間の垣根を越えて議論を交わす場も多く用意されていることが印象的 でした.幸運にも,多くの場所に赴き多くの非常に優秀な研究者達と議論する機会を得て,とて も有益な経験をすることができました.今回,このような貴重な機会を与えて下さいました,航 空宇宙工学専攻 土屋和雄教授,精密工学専攻 椹木哲夫教授,そして関係者の皆様に厚く御礼申し 上げます.また,私のような一学生の急な訪問にも関わらず快く受けて頂き,非常に丁寧に且つ 親切に応対して下さった先生方,学生の皆様そして,旅先で出会った多くの方々に感謝の意を述 べさせて頂き,報告を終わらせて頂きたいと思います. 参考文献 [1] S. Aoi and K. Tsuchiya, Stability Analysis of a Simple Walking Model Driven by a Nonlinear Oscillator, In Proc. of Int. Conf. on Systems, Man, and Cybernetics, pp.4450–4455, 2004. 第4章 研究成果報告 オーストリア武者修行報告 工学研究科航空宇宙工学専攻 坂東 麻衣 1. はじめに 私は,21 世紀 COE プログラム「動的機能機械システムの数理モデルと設計論」の助成を受け て,平成 17 年 2 月 14 日から8日間オーストリア共和国インスブルックおよびウィーンに滞在し た.今回の修行のメインの目的は AIA(Artificial Intelligence and Applications) に参加して発表をし てくること,ウィーンにある研究機関 IIASA を訪問することだ. 2. AIA2005 と IIASA 訪問 2 月 14 日から 18 日の間,インスブルックにおいて IASTED(The International Association of Science and Technology for Development) が主催する国際会議 (IASTED International Conference) が開かれた. 期間中,AIA(Artificial Intelligence and Applications) と MIC(Modeling, Indentification, and Control) の2つの会議が開催された.AIA はニューラルネットワーク,遺伝的アルゴリズム,エキスパート システム,インテリジェントシステムなど 16 分野のセッションに分かれ,一般セッション,チュー トリアル,キーノートを含め発表件数は 220 件を超えた.一方 MIC は,ハイブリッドシステム, 適応制御,マシンラーニングなど 12 分野のセッションに分かれ,発表件数は 160 件を超えた.私 は,AIA のインテリジェントシステムのセッションでエアロロボットの飛行制御に関する発表を 行った.私にとってはやや異分野ともいえる学会での発表であったので心配していたが,私の発 表の前後は制御関連の発表が続きほっとした.また,あまり質問もなかろうと鷹をくくっていた が,5 人くらいから質問攻めにあった.なんとか発表を乗り切り席に戻ると,後ろの席の聴講者に 親指をたてられた (中指ではない). 会議中, コーヒーブレイクにオーストリア名物のケーキが数種 類振る舞われたが,発表前は緊張してほとんど味わえなかった.全体ではデータマイニングに関 する発表が多く,膨大な情報と知識を共有・再利用する技術として,知識表現,推論,データマイ ニングの技術が必要であることを具体的なアプリケーションを通して強調していた. 学会の後,列車でウィーンに移動した.ウィーン南駅からバスで 40 分ほどのところにあるウィー ン郊外の Laxenburg にある IIASA(International Institute for Applied Systems Analysis) の Dr. Marek Makowski を訪問した.研究所は宮殿の中身を改築したところで、もとは Laxenburg 宮殿と言われ ていたそうだ.また内部には大きな公園があり、公園の中には湖や城があるそうだが,あいにくの 大雪のため一面真っ白でなにもみえなかった.IIASA では数理モデルによる研究が盛んで,研究 対象は、エネルギーシステム、気候、人口問題、国際政治など幅広い分野にわたっている.IIASA でのランチは研究所近くには皇帝専用の駅を改造したレストランがあり,シャンデリアがある豪華 な部屋でランチをごちそうしていただいた.私自身の行っているモジュール型学習を用いたエアロ ロボットの制御系の構築に関する研究について紹介し,Dr.Marek とディスカッションを行った. 3. おわりに オーストリア滞在中の平均気温は 0 度を下回るほどの寒さだった.インスブルックはとても小さ な町で滞在期間中は会議場,ユースホステル,街中などいたるところで学会参加者と交流をもつ ことができた.ぜひとも次は暖かい季節に行きたい.今回の国際発表と IIASA 訪問に関してご支 援をいただきました土屋和雄拠点リーダに心から感謝致します.また,IIASA 訪問では Dr. Marek, 椹木哲夫グループリーダ,井上紘一名誉教授,中西弘明助手に大変お世話になりました.この場 をかりて感謝の意を表したいと思います. 図 1: インスブルック旧市街 図 2: 大雪の中会場にむかう 図 3: 学会会場からの眺め 図 4: コーヒーブレイクの様子 図 5: IIASA 図 6: Dr. Marek と 第4章 研究成果報告 イギリス・オランダへの武者修行報告 工学研究科精密工学専攻 谷口 忠大 はじめに 2004年10月の始め,京都はこれから紅葉が見所という季節に,私はヨーロッパへ飛び立っ た.当COEの若手育成制度の一環である武者修行制度を利用して,約一ヶ月間ヨーロッパで研 究活動を行う為だ.行程は大きく二つに分かれ,まずオランダで開催された に一 週間ほど参加した後に,人工生命や社会ロボットの研究で著名な 教授(写真2) と 教授(写真3)の所属されるイギリスの 大学に として3週間滞在するためである. !" は日本人の参加者も多いシ ステム系の学会である.今年の会場はオランダのハーグにあるコングレスセンター(写真 #)だっ た.国際学会での発表は私自身にとっては4回目であったが,今までは全て日本国内での国際学 会だったので,それに比べると参加者も外国人が多く,少し異なる空気を味わうことが出来た.S MCまでは,同期の青井君や他の先生方と同行していたが,会期終了後は皆と別れ,単独でオラ ンダのスキポール空港からイギリスに飛んだ.青井君は別のルートで彼の武者修行へと向かって いった. 大学 はロンドンの一つ北の県である.ちょうど京都から見た滋賀県に近い.私は大学 のある $ からバスで # 分ほどの隣町の %! の &'&( に滞在することにし た. 大学には私のような短期滞在者のための宿泊施設は無かったためである.私が 訪問した研究室は構成員が 人ほどいて居室は二つに分かれていた.私は不定期に訪れる研究員 () という)と二人でシェアする形で居室と机を与えられて,そこで自由にしてよいという身分 を与えていただいた.研究室は絨毯がひかれ,十分なスペースとディスカッションしやすい雰囲 気が流れていた.我々の日本の大学の感覚に比べると # * 対等なレベルの教授が2人いる. さまざまな国から研究者が集まっている. 博士課程以上の研究者しかいない. 皆が何らかの給与を受けている. の4点が特徴的に感じられた.まず,一つ目だが,先にも述べた教授が二人居るために,十分な 領域をカバー出来,また研究室の中での絶対的な意見が存在しなくなるために広い視野が保たれ ている感じを受けた.二つ目だが,イギリス人の占める割合は パーセント以下だった.親しく したメンバーもギリシャ,マレーシア,香港,エストニア,フランス,スペイン,スウェーデンと 写真 #+ の会場 写真 + 教授 写真 *+ 教授 写真 ,+ イギリスで一番 写真 -+ 在学証明証大学 古いといわれるパブで送 の事務の手違いの連続で 別飲み会を開いてくれま 結局最後までカードキー した は使うことが出来なかっ た. 実にバリエーション豊かで,構成メンバー全員の話せる言語をリストアップすると *ヶ国語に達 するということだった.なんと国際色豊かなことか.三つ目は,その研究室には基本的に博士課 程の学生とポスドクしかいないということだ.大学自体には学部生から修士の学生も居るのだが. そのため,研究室内の議論と研究へのモチベーションは常に一定以上のものが保たれている感じ が非常に居心地よかった.最後の給与についてだが,構成メンバーは全員が何らかのプロジェク トに参加するようになっており,そのプロジェクトから給与が払われるようになっていた.参加 するプロジェクトなどによりバラつきがあるが,とりあえず生活していける程度は皆がもらって いるようだった.日本の博士課程の学生はヨーロッパの大学に比べて給与を受けるチャンスが少 なく,そのために進学率が低下しているというのは周りの友人,後輩を見てもかなり明白な因果 関係だと思う.この様な仕組みが日本でも組むことができれば,博士課程進学率も改善されるの ではないかと思った 写真 + 講演会の後で 研究室のメンバーとコー ヒーを飲みながらディス カション セミナー 研究室では週に一回,水曜日に3つのセミナーが開かれている.一つ目がいわゆる研究会で %. セミナーと呼ばれている.%. は ! %$ .(身体性人工生命)の略である.身体 性は知能研究において / 年代末から注目されている概念で,未だにその重要性は考察されつづけ ている.二つ目のセミナーはいわゆる講演会であり,毎週一名,大学外部から講演者が呼ばれてい た.最後の一つはいわゆる論文紹介といった感じだ.この %. セミナーで私も自分の研究につい て一時間ほどの発表を行った.英語は相変わらずの出来だったが,非常に共感と関心を持って聞い ていただくことができて,セミナー終了後には多くのメンバーに英語での論文を求められた.た だ,私自身は英語でのジャーナルを執筆しておらず学会の 0 しか手持ちが無かった.彼 らはそれで構わないといってくれたが,このとき初めて実感として英語ジャーナルの執筆の必要 性を感じた. 「英語で書かないとみんなに読んでもらえないんだ. 」という素直な実感である. おわりに,そして後日談 今までこれほど長い海外滞在をしたこともなく,長かったようで短かった1ヶ月であったが,非 常に実りの多い一ヶ月であったのではないかと思う.このような比較的長い海外研究機関におけ る滞在は,日本より外の場所に自分の視点を持つ契機になったと感じられる.我々博士課程の学 生はこれから国際的な学術活動を行っていく立場になっていく.その過程において今回の滞在が 大きな糧となることは間違いないだろう. 日本に帰国後,既に三つの余波があった.一つは から来年度の国際学会の に 招待されたこと.もう一つは,研究室のメンバーの . が一ヶ月間ATRに研究のため来日した 際に再会したこと.最後は,これも向こうでの同僚の がプライベートで来日した際,私の 家に泊まって京都観光をして帰ったことだ.研究において国際性を広げるということは交友につ いても国際性を広げることに他ならないと思う.私は今回の滞在で得た繋がりを元に,より国際 的な広がりを持って行きたい. 第4章 研究成果報告 ドイツ・フランス武者修行報告 工学研究科航空宇宙工学専攻 中西 弘明 1. はじめに 土屋教授,椹木教授のご推薦により,幸いにも本拠点武者修行制度を活用させて頂くことになっ たのであるが,参加している研究プロジェクトのシンポジウムやデモンストレーションなどに参 加する予定がすでに入っていたために,年度末しかまとまった時間をとることができなかった.こ れにより,訪問先をすこし限定してしまったかもしれないが,様々な体験をすることができた貴重 な機会であった.滞在先としては,その研究内容に興味があることはもちろんであるが,現在の私 の研究内容と直接的な関連はそれほど大きくないところも候補にした.それは,そのときには直 接的な関連がそれほど強く感じられなくても,後から強く自身に関連するようになった,あるい は大きな影響を受けることになったということをこれまでに多く経験していたからである.本稿 は,このような経緯で 3 月 6 日から 26 日までドイツのカッセル大学とフランスの IAAS,ONERA を訪問先として武者修行を行ったその報告である. 2. ドイツ カッセル大学 カッセル大学では Gunnar Johannsen 教授が率いるシス テム工学およびマンマシンシステム研究室 [1] に滞在させ てもらった.Johannsen 教授は今年度の初めに本拠点に滞 在し,何回か講演を行っていただいている.また,数年 前には共同研究のために私の研究室に半年滞在したほか, 何度か特別講演のために来学していただいたことがある など私の研究室とは非常に関連が深い先生である.にも 関わらず,実は Johannsen 教授の研究内容は私自身の研究 とはこれまで直接的な関連はなかった.しかし,私が無人 航空機の研究に深く携わるようになってから,Johannsen 教授の研究分野の一つであるヒューマンインタフェース や人間と自律行動機械の相互作用に関して興味を持つよ 図 1: カッセル大学 うになっていた.このような理由から武者修行期間の半 分以上をカッセル大学での滞在に当てた.滞在期間中は Johannsen 教授は不在であったが,教授 の下で多くの研究指導を行っている Dr. Bernd-Burkhard Borys にいろいろとお世話になった.Dr. Borys は Auditory Displays に関して研究を行っており,特に飛行機のコクピットへの適用に関して ルフトハンザ航空などと共同で研究を進めている [2].大学の建物にはいって,研究室の玄関をく ぐると研究紹介のきれいなパネルが整然と並んでいる廊下があり,そこを進むと学生部屋や実験 室,各個室などがある.結局は建物の 1 ブロック全部が研究室となっていたのでかなり使いやすい と感じた.その実験室の一つに,一人乗りであるが本物のヘリコプタのボディから作ったコック ピットモデルがあり,インタフェースの実験に用いている.本物のヘリコプタのボディがおいて あるのにまず驚いたが,よく見るとその周りには竹やシーツで作ったフレームなどがありどう見 ても手作りである.このような手作りの装置があるは間違いなく熱心に研究を実施しており,そ れにより様々な成果をあげている一つの証拠のようなものである.滞在期間中は Dr. Borys をはじ めとしてドクターコースの学生さんたちといろいろ話をしたり,実験にも参加(参加というより は体験に近い)させてもらった.まず,進化的な計算によりそれぞれのユーザに適応するインタ フェース設計について研究している学生とそのシミュレーション実験を行いながら議論を行った. 化学プラントにおける溶液混合・反応というヒューマンインタフェースの設計に関する研究ではよ 図 2: 実験用シミュレータ 図 3: Dr.Bernd-Burkhard Borys く見る例題を用いたが,バルブの開閉などを簡単な幾何学的な情報で示した通常の操作用インタ フェースのほかに,バルブ開閉やコンベアなどの動きをアニメーションで示すバーチャル 3D モデ ル,エコロジカルインタフェース,物質やエネルギーの流れに着目したマルチレベルフローモデル を用いて各要素を表したインタフェースを用意し,オペレータが各要素レベルでどのようなモデ ルを用いるかを自由に選択出来るようになっていた.オペレータがある程度の時間,プラントを 運用し終わったら,その使用状況を元にして進化的な計算を行い,インタフェースに用いるプラ ントの新たな視覚的モデルを自動的に生成,オペレータへその使用を提案するというものである. 要素毎に様々なモデルを使用すると,最終的なプラントモデルの実現方法の組み合わせ数は要素 数の増加に伴い爆発的に増加するので,短い時間の使用履歴からそれぞれのオペレータに合った 新しい視覚的モデルを生成することができると運用効率の向上などをもたらすであろう.進化型 計算に非常に興味があったので,そこについて重点的に聞いたが,適応度関数の選択にはやはり 苦労したようある.また,計算自体は遺伝アルゴリズムと同一であり,解の探索では交差を中心に 用いていたので,解が劇的に変化しやすく探索効率はそれほどよくなかったかもしれない.私の 場合にはバーチャル 3D モデルを中心とした視覚モデルが適しているという計算結果になったが, これはプラント操作になれていない人間の典型例だとのことである.操作に慣れている人ほどシ ンプルなエコロジカルインタフェースモデルなどとの組み合わせが出てくるようだったが,そのよ うな慣れのプロセスへの適応などもできるのでは?などいろいろ興味深かった.Auditory Display については Dr. Borys 自身がデモと説明をしてくれた.私も実験装置のコックピットに座って飛 行シミュレーション実験を行った.主に音により注意を与えることを行っていたが,オペレータ に正確に音の方向を感じさせるために頭の位置の計測に基づく細かな調節も行っているようであ る.このほか,Johannsen 教授が本拠点で講演されたが,音楽によるロボットナビゲーションに関 しても聞くことができた.これらの実験を通じて感じることは,インタフェースの評価を行うと 必ずオペレータの心理が本当はどうなのかは他人には分からないという壁に当たるということで ある.これはヒューマンインタフェースの研究者や心理学者ならば容易に分かることかもしれな いが,私にはオペレータの心理は作業の様子を見ていても分からないことが多い.実際に,私が フライトシミュレータを初めて操作したときには全体としてはなんとか様にはなっていたが,大 変緊張していたのでとても計器パネルと風景の両方を見る余裕はなかった.また,インタフェー ス実験はどうしても学生が被験者となることが多いが,友人あるいは先輩・後輩の研究をそれほ どよくも言えないし,悪くも言えないという日本人らしさによって,実験後のアンケート結果に 偏りが生じる可能性がある.このため,私はどうしても客観的なものにのみ頼りたくなるのであ る.Johannsen 教授の音楽によるロボットナビゲーションも被験者によるアンケート調査を行って いたので,これ以外に方法が今のところ無いのかもしれないがもう少し別の接近方法がないのか と感じる部分である. 滞在中の生活は快適であった.特に,Dr. Borys と研究室秘書の Ms. Feder は訪問する前からド 第4章 研究成果報告 イツの特急列車である ICE の割引やネットを使った予約などについて教えてくれたので旅費も節 約することができた.また,ある日の昼食後には,カッセル市が見渡せるヘラクレス像のところ まで車で連れて行って数年前にこの像の修復の際に無人ヘリコプタが使われたなど私の研究内容 に近い話題の紹介していただいたほか,私がコンピュータや情報機器に関して興味を持っている と知ると,滞在中にハノーバーにて開催されていた世界最大の情報機器の見本市 CeBIT の入場チ ケットの手配までしてくださった.このようなサポートのおかげで,非常に快適に滞在を楽しむ ことができたのであるが,ちょっと困ったのは研究室の皆が帰るのが早いことであった.ちょうど イースターの休暇期間中だったせいもあろうが,17 時には研究室の鍵を閉めるといわれる.ヨー ロッパの大学はそういうものとは聞いていたが,実際に体験するとちょっと早すぎるという感じで ある.そのような雰囲気が感じられたのだろうか,Ms. Feder に日本ではどうなの?と聞かれたと きには,workaholic と思われるのはさすがにいやなのでごまかしたが,もうちょっと遅くまでいさ せて欲しいというのが本心であったことからすると,ヨーロッパの人々からするとやはり余裕の ない workaholic なのかもしれない. 3. フランス LAAS LAAS の研究者 Dr. Simon Lacroix と知り合ったのは 今年 2005 年 1 月 19 日,20 日に神戸で開催された文部 科学省の研究プロジェクトの国際シンポジウムにてであ る.Dr. Simon は Invited Speaker の一人であり,自己位置 同定と環境地図の作製を同時に行う SLAM(Simultaneous Localization and Mapping) の研究者であり,特にステレ オカメラを使った Visual SLAM を研究しており,彼のグ ループでは無人飛行船それをに適用している [3].私の発 表を聞いた彼が関心を持ってくれたおかげで,それまで 全く面識がなかったが 19 日の夕方の懇親会にて彼から話 かけてもらったのがきっかけである.その後,夕食を一 図 4: Dr. Simon Lacroix@Kobe 2005 緒にしたり,21 日には彼の講習会のあとに実施した私の Jan. グループの飛行デモを見学に来てくれたり,連絡先の交 換などをしていた.当初,今回はベルリン工科大学を訪問しようと連絡をとっていたのであるが, うまく先方と都合が合わないことが分かってきて急遽 Dr. Simon に連絡をとったところ,彼自身 は休暇でメキシコに行っていないのだけれどもと断りながらも,グループリーダである Dr. Raja Chatila に紹介などをすぐに引き受けてくれた.LAAS はフランスのトゥールーズにある.カッセ ルからトゥールーズにはフランクフルトから飛行機で移動した.LAAS はトゥールーズ市内から No. 10 のバスを終点まで行ってそこで No. 68 に乗り換えると事前に聞いていたが,Dr. Raja は訪 問の前夜に私のホテルに電話をくれ,No. 68 のバスが頻繁に走っていないからと No. 10 のバスの 終点まで迎えに来てくれた.そこから LAAS まではすぐであったが,彼の車の中で吉川恒夫教授 の古くからの知り合いであることが分かった.Dr. Raja には LAAS の説明や,彼のラボの説明をし ていただいた.LAAS は Laboratory for Anakysis and Architecture of Systems といい CNRS(National Center for Scientific Researc) の一つの部局である.LAAS はナノ・マイクロエンジニアリング,モ デリングや最適化などのシステム工学,ロボット工学,知能工学に関する幾つかの研究室から成っ ている [4].あと流体力学を加えれば本拠点の構成と同じであり,幾つかはかなり近い研究目的や 研究内容であると感じた.また,流体力学についても,Dr. Raja のグループでは飛行船の風洞モ デルの作成,風洞実験による空力特性の算出,飛行船の力学モデルの作成など,流体力学の研究 グループと連携して研究を行っている.このことから本拠点の国際的な交流先として一つとして 挙げられるのではないかと思う.Dr. Raja は Robotics and AI group のリーダであり,20 名の研究 者と 30 名ほどのドクターコースの学生,数名のポスドクと客員研究員が彼のもと研究を行ってお り,フランスでは最も大きくそして歴史のあるロボット工学の研究グループである [5].Dr. Simon 図 5: Dr. Raja Chatila 図 6: Robotics and AI group は休暇でいなかったことはすでに述べたが,彼はメールで以下のように連絡してきた. There is a ”price to pay” to visit Laas... We would appreciate if you can give a short talk (about 45 minutes) on the project you are leading, or on a particular technical aspect you would like to focus on. このようにセミナーなど私のスケジュールをてきぱきとたてた後にメキシコに旅立っていったよ うで,多くの研究者に話を聞いてもらうことはもちろん色々なデモや実験,研究内容に触れるこ ともできた.その中で,COMETS というプロジェクトに興味を持った.COMETS は様々な目的に 利用可能な無人空中移動プラットホームに関する EU の国際研究プロジェクトであり,Dr. Simon の無人飛行船もこのプロジェクトの一環である.準備不足で LAAS が COMETS に参加しているこ とを訪問して初めて知ったのだが,COMETS については本拠点と協定を結んでいる IIASA の Dr. Marek Makowski からプロジェクト名とその目的を以前から聞いていた.プロジェクトに参加して いる研究機関を聞くと LAAS の他にはスウェーデンのリンピン大学や当初訪問を予定していたベ ルリン工科大学が参加しているということである.ベルリン工科大学を今回訪問出来なかったの はこの点からもすこし残念であったといえる.このほかにも非ホロノミック系の制御や適応制御, 障害物検出と回避,環境マッピングなど様々な研究者と議論をすることができたが,いずれも幅 広い視野を持っていることが伝わってくる.この点は見習うべき点であるが,これは LAAS のよ うな様々な研究者が連携して研究を実施しているというすばらしい環境がもたらしていると感じ る.このことから,京都大学でも様々な分野の研究者が連携して研究を行う場の必要性を強く感 じる.特に,制御・設計論 G ではこのように研究者の相互に深く関連を保つ場を作り,それを学 生や若手研究者に提供するは今後の研究の発展に大きく寄与するであろう.COE プログラムを活 用するなどして,LAAS のようなシステム・制御・設計に関する学際的な研究の場の創設すること ができれば・ ・ ・と思いながら LAAS を後にした. 4. フランス ONERA ONERA 訪問は Dr. Simon の推薦によるところが大きい.ONERA は私と同じ無人ヘリコプタを 実験プラットホームとして使っている.このことをシンポジウムの際に Dr. Simon は知っていたの で気を利かせて紹介してくれたのである.共同研究先の企業から ONERA については話だけは聞い ていたが,まさか自分が訪問し,また飛行実験に参加するとは全く予想していなかった.今回は出 発までに連絡を取ることができなかったが,カッセル大学についてからすこし時間に余裕ができた ために Dr. Patrick Fabiani にメールで連絡を取ることができ,無事訪問することができた.ONERA とはフランスの NASA だそうであり,アリアンロケットやエアバス A380 に関する研究・開発を実施 したそうである.確かにトゥールーズはエアバス社の拠点であり [6],空港ではイルカのような独特 な形で有名なエアバス社の超大型貨物機ベルーガを初めて見ることができたが,あれほど多数のベ ルーガを見ることができる空港は珍しいと思う.そのような ONERA を訪問する日は武者修行最後 の日とした.これはこの日ならば飛行実験に行くので一緒に来ないか?と誘ってくれたからである. 第4章 研究成果報告 私の他に一人研究者が訪問するので,彼と時間を合わせ て,ランチを取った後に無人ヘリコプタの飛行実験に行 こうということになっていた.しかし,ONERA に行く 途中のバスの中で小雨が降り出したので,これは飛行実 験は無理だろうと諦めつつあったのだが,天候はすぐに 回復し,いい実験日和となった.他の訪問者というのは フランス海軍の研究機関の若い研究者であったことには 多少驚いたが,差し支えのない範囲で研究内容を聞くと, 気さくに答えてくれた.波の影響により大きく揺れる船 の甲板に小型ヘリコプタを着陸させるための制御が彼の テーマだという.全く同じ話を数年前に UCLA で聞いた 図 7: Dr. Fabiani が,軍関係の研究として共通の課題なのだろう.確かに 少し考えただけでも,地面(甲板)が揺れることにより メインロータの推力に現れる地面効果が複雑に変化し,それに伴い機体に発生するモーメントが 複雑に変化する.このことから固定した地面に着陸する場合と異なり,姿勢角を制御することが 容易ではなくなる.このように複雑に変化する環境に適応あるいは学習する制御というのは私の 興味の対象である.もちろん,彼とは研究目的以外は違うが,研究の内容が密接に関連している ことがわかり,すぐにうち解けることができた.Dr. Fabiani 自身の研究目的はレスキュー活動用の 自律型ヘリコプタの開発であり [7],これは私の研究プロジェクトの研究目的と同じであることか ら話が非常に通じやすい.ONERA の飛行実験場は車で 1 時間ほどの Moressac という小さな村に あった.実験場に着くとすでに先発していた 3 名の陽気な研究者が私たちを迎えてくれた.その 日の主な実験項目はミリ波レーダによる対地高度の測定とそれによる自動着陸だったが,前回ま での実験ではミリ波レーダによる対地高度の測定がうまくいっていないということだった.その 理由はヘリコプタの振動にあり,その影響により距離を測定することができなくなっていた.振 動が発振子に与える影響は,私の前職である企業の開発部からなじみ深くかつ頭の痛い現象であ る.今回は,ヘリコプタの振動を吸振するためにハードディスクに使われているラバーダンパー を使うのだといっていたが,どう見ても固すぎて上手く振動を吸収しそうにない.使用している 無人ヘリコプタは 14Hz あたりと 28Hz あたりロータとエンジンによる振動の大きなピークがある のであるが,ハードディスクのディスク回転による振動の周波数と比べるとかなり低い.これで はうまくいかないような気がしたが,飛行した結果はやはり NG であった.その後,より柔軟なダ ンパー付きの機体に変えたがそれでも固すぎる.何度か実験したがやはり上手くいかず,この実 験項目については中止となった.ミリ波レーダは私も使用してみようと考えたことがある.その ときは車メーカでないと購入することができなかったので仕方なく諦めたのであるが,もし購入 出来ていたら同じ悩みに陥っていたかもしれない.しかし,小型であったので,外界の情報を得 るための魅力的なセンサである.このほかにも今日は Bad GPS Day だといって度々実験が停止し た.見てみると確かに測定値がかなり荒れていた.我々の実験場に比べると高緯度だからだろう か?と思いながら GPS の測定画面を見ると,彼らは EGNOS という静止衛星を使った広域 DGPS を使っていることに気がついた.これは日本では MTSAT の打ち上げまで利用することはできない サービスであるが,興味深かったので GPS 衛星配置が換わるまで色々と聞くことができた.GPS の測定結果が落ち着いてからは,自律飛行実験は順調に実施することができたが,実験をしてい ると時間が経つのが早い.今回も同様であり,いつの間にか 19 時になり太陽がもうほとんど沈ん でしまったころ,一日の実験を終えた.実験後はパスティスという水で割ると白く濁る南仏のお 酒で乾杯したが,その後車で送ってもらわねばならない身であったので,彼の運転は大丈夫かな と内心で思いつつ,初めて味わうお酒をじっくりと味わった.無事にトゥールーズ市の中心部に たどり着き,Dr. Fabiani と分かれたのは 21 時近くであった. 図 8: Flight Test Field 図 9: Flight Experiment 5. おわりに 今回の訪問先ははからずして,すべて航空関連の研究を行っている機関ばかりとなった.また, いずれも研究室のすぐそばに実験室があり,学生はそこで熱心に実験をしている.最近は薄れつ つあるかもしれないが,航空宇宙工学専攻に所属する学生は実験よりも数値シミュレーションを 重視する傾向が他専攻の学生に比べて強いように思う.その学科の卒業生である私もやはりその ような傾向があったと思うが,卒業後程なくしてそれは正しくはないと考えが変わった.それは これまでに訪問した海外の研究機関において体験したことによっている.特に,自分の手でやっ てみる [8] というスタイルには今も強く影響を受けている.今回の修業先でホストになってくだ さった研究室は実験と理論のいずれかに偏ることはなく,ちょうどよい場を学生に提供している と感じた.また,LAAS は一つの研究室だけでもかなり多くの分野の研究者がおり,互いに密接 な関係を保ちながら研究を行っているだけでなく,さらに共同研究も盛んなようである.ONERA は LAAS の近くに位置していることから頻繁に共同で研究を実施しているようである.今回の武 者修行先で見聞きしたことからは,グループ内において研究者の様々な相互作用を強めることに より研究室の枠を超えた研究の新たな方向性を生み出すことができるという可能性を示唆してい るように思える.最後に,先方とのやりとりが short notice になったことが原因で,日程や訪問先 に関する情報が錯綜し,先方はもちろん COE の事務局,物理系事務室の方々にも多くの迷惑をお かけしたことについてお詫びを申し上げたい. 参考文献 [1] http://www.imat.maschinenbau.uni-kassel.de/ [2] B.-B. Borys: Evaluation of Auditory Displays Supporting Aircraft Approach and Landing. In: Johan Stahre & Lena Martensson (Ed.): Automated Systems based on Human Skills and Knowledge, Preprints of the 8th IFAC Symposium, pp. 141-146, 2003 [3] E. Hygounenc, I.-K. Jung, P. Soueres, and S. Lacroix: ”The autonomous blimp project at LAAS/CNRS: achievements in flight control and terrain mapping”, International Journal of Robotics Research, vol. 23, no. 4/5, pp. 473-512, April/May 2004. [4] http://www.laas.fr/ [5] http://www.laas.fr/RIA/ [6] 加藤寛一郎: エアバスの真実―ボーイングを超えたハイテク操縦, 講談社プラスアルファ文庫, 2002 [7] http://www.cert.fr/dcsd/RESSAC/ [8] 金出 武雄: 素人のように考え、玄人として実行する―問題解決のメタ技術, PHP 文庫, 2003