Comments
Description
Transcript
経済数学I
経済数学 I 須賀晃一 2005 年 4 月 目次 第 1 章 ベクトル 2 2 1.1 ベクトルの定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 1.3 ベクトルの演算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 内積 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3 1.4 ベクトルの 1 次独立・1 次従属 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 第 2 章 行列 9 2.1 2.2 行列の定義 2.3 行列の分割 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4 2.5 逆行列と直交行列 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 18 3.1 順列 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 3.2 3.3 行列式の定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 3.5 行列式の展開 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 行列の演算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 行列の階数 第 3 章 行列式 行列式の性質 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 逆行列と行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 第 4 章 連立 1 次方程式 4.1 連立 1 次方程式の解法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 第 5 章 固有値 5.1 固有値と固有ベクトル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 第 6 章 2 次形式 6.1 6.2 9 10 24 27 31 36 39 39 43 43 47 2 次形式と対角比 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 次形式の符号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 第 7 章 極値問題 47 49 7.1 1変数関数の極値問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 55 7.2 多変数関数の極値問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 第 8 章 凹関数と凸関数 59 8.1 8.2 凹関数・凸関数の基本的性質 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 8.4 1変数関数の凹性・凸性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . エピグラフとハイポグラフ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 微分可能な凹関数・凸関数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 59 61 62 65 8.5 多変数関数の凹性・凸性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 8.6 8.7 極大・最大と凹関数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 71 9.1 条件付き極値の必要条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 78 9.2 条件付き極値の十分条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 9.3 スルツキー方程式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 86 準凹関数・準凸関数 第 9 章 制約条件付き極値問題 9.3.1 効用最大化問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.2 9.3.3 所得変化の効果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 価格変化の効果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 第 10 章 包絡線定理 87 88 10.1 包絡線の定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 91 10.2 経済学における包絡線定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 いくつかの例題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 95 10.3.1 消費者の効用最大化行動 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.2 企業の費用最小化問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 96 10.3.3 目的関数の変化率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 第 11 章 一般最適化理論 98 11.1 最初の描写−−非負制約下の最適問題 . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 スラック変数と一般的な不等式制約 . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 98 11.3 キューン=タッカー条件と制約想定 . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 2 第 1 章 ベクトル 1.1 ベクトルの定義 n 個の実数の組を n 次元実数ベクトルといい,太字の小文字 a,b などで表す.n 次元実数ベクト ルの集合を n と書き,n 次元実数ベクトル空間という. a1 a2 a = . あるいは a = .. an a1 a2 .. . an b = (b1 , b2 , . . . , bn ) a(あるいは b) において,第 i 番目の実数 ai (あるいは bi ) を,a(あるいは b) の第 i 成分,もしくは第 i 座標という.a のように各成分を縦に並べたものを列ベクトル (縦ベクトル),b のように各成分を 横に並べたものを行ベクトル (横ベクトル) という.列ベクトルを行ベクトルに (あるいは行ベクトル を列ベクトルに),すなわち縦のものを横に,あるいは横のものを縦にすることを転置といい,転置 記号 (プライム) をつけて表す.上の例では a = (a1 , a2 , . . . , an ) b1 b2 b = .. . bn となる.線形代数学では,ベクトルは普通列ベクトルで表すが,ここでは両者を区別しない. 2 つのベクトル a,b が与えられたとき,一般に両者の大小関係を考えることは不可能である.こ こでは,次のような等号,不等号を定義しておく. a = b ⇐⇒ ai = bi , i = 1, 2, . . . , n (1.1) a ≥ b ⇐⇒ ai ≥ bi , i = 1, 2, . . . , n (1.2) a > b ⇐⇒ a ≥ b (1.3) かつ a = b a b ⇐⇒ ai > bi , i = 1, 2, . . . , n 1.2 (1.4) ベクトルの演算 次に,ベクトルに関する演算を定義しよう.2 つの n 次元ベクトル a,b が与えられたとき,両ベク トルの第 i 成分の和を第 i 成分とする n 次元ベクトルを a と b の和といい,a + b で表す.すなわち a + b = (a1 + b1 , a2 + b2 , . . . , an + bn ) 3 また,a を n 次元ベクトル,λ を任意のスカラーとするとき,λai を第 i 成分とする n 次元ベクト ルを a の λ 倍といい,λa で表す.すなわち λa = (λa1 , λa2 , . . . , λan ) λ,µ をスカラー,a,b,c を n 次元ベクトルとするとき,ベクトル和,スカラー積の定義より,次 の関係が成り立つ. a+b= b+a (1.5) (a + b) + c = a + (b + c) (1.6) λ(µa) = µ(λa) = (λµ)a (1.7) λ(a + b) = λa + λb (1.8) (λ + µ)a = λa + µa (1.9) 成分がすべてゼロに等しい n 次元ベクトルをベクトルを n 次元ゼロベクトルといい,0 で表す.す なわち 0 = (0, 0, . . . ., 0) n個 n 次元ベクトル a に対して,(−1)a を −a と表し,b + (−a) を b − a と表す.任意の n 次元ベク トル a,任意のスカラー λ に対して 1.3 a+0=0+a=a (1.10) 0a = 0 (1.11) λ0 = 0 (1.12) a−a=0 (1.13) 内積 a,b を n 次元ベクトルとするとき,対応する成分の積の和を a と b の内積といい,(a, b) あるい は ab,a · b で表す.すなわち (a, b) = n ai b i = a1 b 1 + a2 b 2 + . . . + an b n i=1 内積の定義より,次の性質が得られる. (a, b) = (b, a) (1.14) (a, b + c) = (a, b) + (a, c) (1.15) λ(a, b) = (λa, b) = (a, λb) (1.16) (a, a) ≥ 0 (1.17) (a, b)2 ≤ (a, a)(b, b) (1.18) (1.18) はシュワルツ (Schwarz) の不等式といわれる.以下,この不等式の証明を与えておく. (証明) x を任意の実数とし,内積 (xa + b, xa + b) を考える.(1.17) より,この内積は非負であ る.x について整理すると (a, a)x2 + 2(a, b)x + (b, b) ≥ 0 4 x2 a2 a − b b2 b1 a1 0 x1 図 1.1: 2 点間の距離 a = 0 のとき (a, b)2 = (a, a)(b, b) となり,(1.18) は明らかに成立する.a = 0 のとき,任意の x に対して上式が成立するためには,判別式が非正でなければならない. (a, b)2 − (a, a)(b, b) ≤ 0 が得られるので,(1.18) が示せた.□ 内積の定義より,(a, b) は正負またはゼロの値をとりうる.しかし,(a, a) は非負の値であり,a = 0 のときのみゼロとなる.この平方根は通常の距離の概念を一般化したものであり,a のノルム (長さ) と呼ばれ,a で表される. a = (a, a) = a21 + a22 + . . . + a2n 同様に,2 つの n 次元ベクトル a, b の距離は a − b で表され, a − b = (a − b, a − b) = (a1 − b1 )2 + (a2 − b2 )2 + . . . + (an − bn )2 である.距離をこのように定義したとき,n を n 次元ユークリッド空間という.以後,n と書け ば,n 次元ユークリッド空間のことである.したがって,n 次元ベクトルと n 次元ユークリッド空間 の点とを同一視することになる.図 1.1 を参照せよ. a, b を 0 でない n 次元ベクトルとし,a, b のなす角を θ cos θ = (0 ≤ θ < π) としたとき, (a, b) ab である.以下,これをを示しておく. まず,図による証明.図 1.2 のようにベクトル a, b, 原点 0 をとる.a と b のなす角を θ とし, x, y を図 1.2 で示した大きさとする.このとき x2 + y 2 = a2 a cos θ = x, 5 a a−b y 0 b − x x 図 1.2: cos θ の求め方 b 三平方の定理より (b − x)2 + y 2 = a − b2 = (a − b, a − b) ∴ bx = (a, b) ∴ cos θ = (a, b) ab あるいは,余弦定理を用いれば a − b2 = a2 + b2 − 2ab cos θ となるので,これを cos θ について解けばよい. (a, b) cos θ = を用いると,次の関係が成り立つ. ab (a, b) > 0 ⇐⇒ θは鋭角 (π/2 より小さい) (a, b) = 0 ⇐⇒ θは直角 (π/2 に等しい) (a, b) < 0 ⇐⇒ θは鈍角 (π/2 より大きい) ベクトル a,b のなす角が π/2,すなわち両者が直交するとき,a⊥b と書く. λ をスカラー,a, b を n 次元ベクトルとするとき,ノルムの定義より,次の性質が成り立つ. a ≥ 0 (1.19) a = 0 ⇐⇒ a = 0 (1.20) λa = |λ|a (1.21) a + b ≤ a + b (1.22) (1.22) は (1.18) を用いて証明することができる.また,a = 1 のとき,a は正規であるという. n 次元の正規ベクトルの中で次のものは,基本単位ベクトルといわれる. e1 = (1, 0, . . . , 0) e2 = (0, 1, 0, . . . , 0) 6 ······ en = (0, . . . , 0, 1) この中から任意に異なる2つのベクトル ei ,ej をとると,(ei , ej ) = 0 が成り立つから,直交して いることがわかる.また,ei = 1 (i = 1, 2, . . . , n) よりノルムはすべて1である.このように, 直交性と正規性を満たす n 個の n 次元ベクトルを正規直交系という. 1.4 ベクトルの 1 次独立・1 次従属 n 次元ベクトル a1 , a2 , · · · , am をそれぞれスカラー倍して加えた和 λ1 a1 + λ2 a2 + · · · + λm am を a1 , a2 , · · · , am の1次結合という. m 個の n 次元ベクトルの組 a1 , a2 , · · · , am に対して,すべてが同時にゼロにはならない定数の組 λ1 , λ2 , · · · , λm を用いて, λ1 a1 + λ2 a2 + · · · + λm am = 0 を成立させることができるとき,a1 , a2 , · · · , am は1次従属 (linearly dependent) であるという.1 次従属でないとき,すなわち上式を作ったとき必ず λ1 = λ2 = · · · = λm = 0 となるならば,それら は1次独立 (linearly independent) であるという. 例 1.1 e1 = (1, 0),e2 = (0, 1) は 1 次独立である.なぜなら,λ1 e1 + λ2 e2 = (λ1 , λ2 ) = (0, 0) とす ると,λ1 = 0, λ2 = 0 となるからである. 例 1.2 e1 = (1, 0),e2 = (0, 1),b = (−1, −1) は 1 次従属である.なぜなら,λ1 = λ2 = λ3 = 1 と すると,λ1 e1 + λ2 e2 + λ3 b = (0, 0) となるからである. 定理 1.1 ベクトル a が 1 次独立であるための必要十分条件は,a = 0 である.逆に,a が 1 次従属 であるための必要十分条件は,a = 0 である. 定理 1.2 ベクトル a1 , a2 , · · · , am が 1 次独立であるための必要条件は,任意の i = 1, 2, · · · , m に対 して ai = 0 である.逆に,0 を含むベクトルの組は 1 次従属である. 定理 1.3 ベクトル a1 , a2 , · · · , am が 1 次独立ならば,その一部分 ai1 , ai2 , · · · , air (1 ≤ i1 < · · · < ir ≤ m) も 1 次独立である.逆に,a1 , a2 , · · · , ar が 1 次従属ならば,それらを含む a1 , a2 , · · · , ar , ar+1 , · · · , am も 1 次従属である. 定理 1.4 ベクトル a1 , a2 , · · · , am が 1 次独立であるための必要十分条件は,a1 , a2 , · · · , am の中のど のベクトルも残りの m − 1 個のベクトルの 1 次結合として表せないことである.逆に,a1 , a2 , · · · , ar が 1 次従属であるための必要十分条件は,a1 , a2 , ·, am の中のあるベクトルが残りの m − 1 個のベク トルの 1 次結合として表せることである. (証明) 前半は後半の対偶になっているので,いずれか一方のみを証明すればよい.そこで,後半を証 明する. 必要性:a1 , a2 , · · · , am が 1 次従属であるから, λ1 a1 + λ2 a2 + · · · + λm am = 0 7 となるような同時に 0 でない係数が少なくとも 1 つ存在する.一般性を失うことなく λm = 0 と仮定 すれば, am = −λ1 −λ2 −λm−1 a1 + a2 + · · · + am−1 λm λm λm となる.したがって,am は残りの m − 1 個のベクトル a1 , a2 , · · · , am−1 の 1 次結合で表される. 十分性:たとえば,am が m − 1 個のベクトル a1 , a2 , · · · , am−1 の 1 次結合で表されるとすると, am = λ1 a1 + λ2 a2 + · · · + λm−1 am−1 この式を整理すれば λ1 a1 + λ2 a2 + · · · + λm−1 am−1 + (−1)am = 0 を得る.よって,a1 , a2 , · · · , am は 1 次従属である.□ 定理 1.5 ベクトル a1 , a2 , · · · , am が 1 次独立であるとする.a が a1 , a2 , · · · , am の 1 次結合として 表せないならば,a, a1 , a2 , · · · , am は 1 次独立である.逆に,a, a1 , a2 , · · · , am が 1 次従属ならば, a は a1 , a2 , · · · , am の 1 次結合として表せる. (証明) 前半は後半の対偶になっているので,いずれか一方のみを証明すればよい.そこで,前半を証 明する. 背理法で証明する.結論を否定して,a, a1 , a2 , · · · , am が 1 次従属であると仮定する.そのとき, すべてが同時に 0 ではない係数 λ0 , λ1 , · · · , λm が存在して, λ0 a + λ1 a1 + · · · + λm am = 0 が成り立つ.ここに λ0 = 0 である.なぜなら,λ0 = 0 なら a1 , a2 , · · · , am が 1 次従属となって,仮 定に反するからである.λ0 = 0 で割って整理すると, a= −λ1 −λ2 −λm a1 + a2 + · · · + am λ0 λ0 λ0 これは a が a1 , a2 , · · · , am の 1 次結合として表されることを示しており,矛盾である.□ 練習問題 1.ベクトルの性質 (1.5)∼(1.17) を証明せよ. 2.ノルムの性質 (1.19)∼(1.22) を証明せよ. 3.a = (1, 2, 3),b = (1, 0, 2),c = (0, 4, 5) のとき,次の問に答えよ. (1) 3(a + b) − c を計算せよ. (2) (a, b) + 3(b, c) を計算せよ. (3) a − c を求めよ. 4.次の関係を証明せよ. (a, b) > 0 ⇐⇒ θは鋭角 (π/2 より小さい) (a, b) = 0 ⇐⇒ θは直角 (π/2 に等しい) (a, b) < 0 ⇐⇒ θは鈍角 (π/2 より大きい) 5.a = (−1, 1, 2),b = (1, 0, −1) の内積,長さ,およびなす角を求めよ. 6.a = (2, 1, −1, 0),b = (1, 1, −3, −1) の内積,長さ,およびなす角を求めよ. 8 7.a = (3, 5, −2, −7, 1),b = (−4, −1, 2, 0, −1) の内積,長さ,およびなす角を求めよ. π 8.a = (3, 2, 2, −1, −2, 2) と b = (x, 1, x, −3, −4, x) のなす角が になるように x の値を定めよ. 3 9.ベクトル a,b に対して,次を示せ. (1) a + b2 + a − b2 = 2(a2 + b2 ) (2) a⊥b ⇐⇒ a + b2 = a2 + b2 10.ベクトル a,b に対して,次を示せ. (1) (a + b)⊥(a − b) ⇐⇒ a = b (2) a⊥bかつ a = b = 1 =⇒ a − b = 2 11.次のベクトルの組が 1 次独立であるか,1 次従属であるかを判定せよ. (1) a = (4, 3),b = (2, 3) (2) a = (1, 2, 3),b = (1, 0, 2),c = (0, 4, 5) (3) a = (0, 1, 1),b = (1, 0, 1),c = (1, 1, 0) (4) a = (1, 1, 1, 1), b = (2, 0, 1, −1), c = (4, 2, 3, 1) (5) a = (1, 1, 4, −1), b = (−1, 1, 2, 3), c = (1, 0, 1, −2) (6) a = (1, 2, 0, −1), b = (−1, 1, 0, 2), c = (0, 3, 1, 0), d = (1, 1, 0, 2) 12.次のベクトルの組が 1 次従属になるように,x の値を定めよ. (1) a = (1, 0, 1),b = (1, 1, 0),c = (−1, 1, x) (2) a = (1, 2, 3),b = (1, 0, 2),c = (0, 3, x) (3) a = (0, 4, 5),b = (1, −1, 2),c = (x, 2, 3) 13.a1 ,a2 , a3 ,a4 が 1 次独立のとき,次の組は 1 次独立であるか,1 次従属であるかを判定せよ. (1) a1 + a2 ,a2 + a3 , a3 + a4 ,a4 + a1 (2) a1 ,a1 + 2a2 , a1 + 2a2 + 3a3 ,a1 + 2a2 + 3a3 + 4a4 (3) a1 + 2a2 ,2a2 + 3a3 , 3a3 + 4a4 9 第 2 章 行列 2.1 行列の定義 mn 個の実数を次のように並べたものを行列 (matrix) といい, a11 a12 · · · a1n a11 a21 a22 · · · a2n a21 A= あるいは A = .. .. .. .. . . . . am1 am2 · · · amn am1 a12 a22 .. . am2 ··· ··· ··· a1n a2n .. . amn で表す.正確には,(m, n) 型行列あるいは m × n 行列といい,(aij ) とも表す.行列 A は n 個の m 次元列ベクトル a1 , a2 , · · · , an を並べたものと考えることができる. A = (a1 , a2 , · · · a1j a2j aj = .. . amj , an ) また,m 個の n 次元ベクトル b1 , b2 , · · · , bm でも表すことができる. b1 b2 A= . .. bm b1 = (a11 , a12 , . . . , a1n ) ········· bm = (am1 , am2 , . . . , amn ) 行と列の数が同じ行列を正方行列という.(n, n) 型正方行列を n 次正方行列という. n 正方行列 A において aii (i = 1, · · · , n) を対角成分という.対角成分の和 a11 + a22 + · · · + ann をトレースといい,tr(A) で表す.対角成分以外の成分がすべて 0 である行列を対角行列という.対 角成分がすべて 1 で,他はすべて 0 である対角行列を単位行列といい,I あるいは In で表す.すな わち I= 1 0 ··· 0 .. . 1 .. . ··· 0 ··· 0 10 1 0 .. . 0 1 単位行列の第 j 列を基本単位ベクトル ej で表すと, In = [e1 , e2 , · · · , en ] となる.クロネッカーのデルタを用いて単位行列の要素を表すことができる.それは δij で表される 記号で,i と j が等しいときは 1,i と j が異なるときは 0 の値をとるものである. 1 (i = j ) δij = 0 (i = j ) この場合,単位行列は, δ11 δ12 ··· δ1n δn1 δn2 ··· δnn δ21 δ22 · · · δ2n In = [δij ] = . . . . . . . . . . . . . . . . . . . n 次正方行列 A において,aji = aij ,あるいは A = A となるような行列を対称行列という.この 行列では,対角線に関して対称の位置にある要素はすべて等しくなる. 4 1 2 例 2.1 A = 1 5 3 は対称行列である. 2 3 6 A の行と列を入れかえることを,A を転置するといい,転置記号 (プライム) をつけて表す.一般 に,A = A だが,A = A が成り立つ場合,A を対称行列という. また,すべての成分が 0 であるような (m, n) 型行列をゼロ行列といい,0mn ,あるいは単に 0 と 書く. 2.2 行列の演算 行列と行列の間や行列とスカラーの間には,和,スカラー積,積などの演算が定義される.まず, 行列の相当についいて定義し,以下順にこれらの演算を定義していこう. [行列の相等] (m, n) 型の行列 A = [aij ] と (p, q) 型の行列 B = [bij ] は,それらの型が同じで,し かも対応する要素がすべて等しいとき,即ち, m = p, n = q aij = bij (i = 1, 2, · · · , m, j = 1, 2, · · · , n) が成立するとき,かつそのときに限り等しいといい,A = B で表す. [行列の和] A = [aij ], B = [bij ] を同じ (m, n) 型行列とするとき,A と B の (i, j) 要素 aij と bij の和,aij + bij を (i, j) 要素とする (m, n) 型行列を A と B の和といって,A + B で表わす. a12 + b12 · · · a1n + b1n a11 + b11 a21 + b21 a22 + b22 · · · a2n + b2n A + B = [aij ] = [bij ] = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . am1 + bm1 am2 + bm2 · · · amn + bmn 11 異なる型の行列の間の和は定義されないことに注意せよ. [スカラー積] A = [aij ] を (m, n) 型行列,λ を任意のスカラーとするとき,λaij を (m, n) 型行 列 A の λ 倍といい,λA で表わす. λa11 λa12 ··· λa1n λa21 λa22 · · · λa2n λA = [λaij ] = . . . . . . . . . . . . . . . . . . . . . . . . . λam1 λam2 · · · λamn 1 2 4 例 2.2 A = , −3 1 4 −1 2 1 B= , λ = 2 とするとき, 0 3 −4 1 + (−1) 2 + 2 4+1 0 A+B = = −3 + 0 1 + 3 4 + (−4) −3 2×1 2×2 2×4 2 4 λA = = 2 × (−3) 2 × 1 2 × 4 −6 2 4 5 4 0 8 8 行列の和とスカラー積の定義から,ただちに次の性質が得られる. (i) (A + B) + C = A + (B + C) (ii) (iii) A+B =B+A A + Om,n = Om.n + A = A (iv) (v) A − A = Om,n λ(A + B) = λA + λB (vi) (λ + µ)A = λA + µA (vii) (viii) (λµ)A = λ(µA) 1A = A ここで,A, B, C はすべて (m, n) 型の行列,λ, µ はスカラー,−A = (−1)A である. [行列の積] A = [aij ] を (m, n) 型の行列,B = [bij ] を (n, p) 型の行列とするとき, cij = ai1 b1j + ai2 b2j + · · · + ain bnj = n aik bkj (i = 1, · · · , m; j = 1, · · · , p) k=1 を (i, j) 要素とする (m, p) 型の行列を A と B の積といい,AB で表わす. c11 c21 . . AB = . . .. c12 ··· c22 ··· cm1 cm2 ··· n n n k=1 k=1 k=1 a1k bk1 , a1k bk2 , · · · a1k bkp k=1 k=1 k=1 n n n c2p a2k bk1 , a2k bk2 , · · · a2k bkp .. . = k=1 k=1 k=1 .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n n n cmp amk bk1 , amk bk2 , · · · amk bkp c1p A と B の積 AB が定義できるのは,A の列の個数と B の行の個数が等しいときに限るのであり, AB が定義できても,BA が定義できるとは限らない.また,AB と BA が定義できても AB = BA は一般に成立しない. 12 1 −1 3 1 例 2.3 A = 2 1 2 , B = 2 1 2 1 5 −3 1 とするとき,A は (3, 3) 型,B は (3, 2) 型であるから AB 4 が作れて, 1 × 1 + (−1) × 2 + 3 × 5, 1 × (−3) + (−1) × 1 + 3 × 4 14 8 AB = 2 × 1 + 1 × 2 + 2 × 5, 2 × (−3) + 1 × 1 + 2 × 4 = 14 3 1 × 1 + 2 × 2 + 1 × 5, 1 × (−3) + 2 × 1 + 1 × 4 10 3 例 2.4 A = 1 −2 2 1 ,B= 3 1 4 2 とすると,AB ,BA がともに定義され, 1 × 3 + (−2) × 4 AB = 2×3+1×4 3×1+1×2 BA = 4×1+2×2 1 × 1 + (−2) × 2 −5 −3 = 2×1+1×2 10 4 3 × (−2) + 1 × 1 5 −5 = 4 × (−2) + 2 × 1 8 −6 となる.AB ,BA ともに (2, 2) 型であるが,AB = BA. A が正方行列のとき,AA を A2 ,A2 A を A3 ,一般に An−1 A = An (n = 2, 3, . . .) と書き,A の累乗という.A が m 次正方行列ならば,A の累乗も m 次正方行列である. 行列の積に関して,次の性質が得られる. (i)A,B,C をそれぞれ (m, n) 型,(n, p) 型, (p, q) 型の行列とすると, (AB)C = A(BC) (ii) A を (m, n) 型,B, C を (n, p) 型の行列とすると, A(B + C) = AB + AC (iii) A,B を (m, n) 型, C を (n, p) 型の行列とすると, (A + B)C = AC + BC (iv) A を (m, n) 型の行列とすると, Im A = AIn = A (証明) A = [aij ], B = [bij ], C = [cij ] としよう. (i) いま,AB = [dij ], BC = [eij ] とすると,(AB)C, A(BC) の (i, j) 要素はそれぞれ, ph=1 dih chj , n n p k=1 aik ekj である.ここで,dih = k=1 aik bkh , ekj = h=1 bkh chj を代入すると, p p p n n n dih chj = aik bkh chj = aik bkh chj = aik ekj h=1 h=1 k=1 k=1 したがって,(AB)C = A(BC). (ii),(iii) についても同様に証明できる. 13 h=1 k=1 (iv) Im A の (i, j) 要素を考えると,Im = [δij ] より, m δik akj = δi1 a1j + · · · + δi,i−1 ai−1j + δii aij + δi,i+1 ai+1j + · · · + δim amj k=1 であり,δij の性質より右辺において δii 以外は 0 であるから, m δik akj = δii aij = aij (∵ δii = 1) k=1 ゆえに,Im A = A を得る.同様にして AIn = A も成立する. ところで,行列の場合,積の逆演算としての商は一般的には定義できない.つまり,行列 A と B に対して,AX = B(あるいは,Y A = B) をみたすような行列 X(あるいは Y ) が一意的に存在する かというと,A = 0 であっても一般には存在しないし,また存在したとしてもそれは一意的であると は限らない.A が (m, n) 型の場合,AX = B なる X が存在するためには,まず,X が (n, p) 型で なければならないが,次の例で示されるとおり,それだけでは十分でないのである. 1 0 2 例 2.5 A = 0 1 , B = 1 とする.AX = B なる X が存在するとすれば,それは (2, 1) 型で 1 1 4 x x とおくと,AX = y となるから,AX = B とはなり得ない.つまり, あるから,X = y x+y AX = B なる X は存在しない. 4 0 2 1 3 9 4 ,B = とする. C = 1 1 とすると,AC = B となるが, 例 2.6 A = −1 3 2 −1 5 0 1 3 2 D = 0 3 としても,AD = B となるから,AX = B をみたす X は存在するが,一意的で 1 −1 ない. 行列の和,スカラー積,行列の積と転置行列の間では,次の性質が得られる. (i)A,B が (m, n) 型行列ならば, (A + B) = A + B (ii) 任意の行列 A と任意のスカラー λ に対し, (λA) = λA (iii) A と B の積を定義できるとき,B と A の積 B A が定義でき, (AB) = B A (証明) (i),(ii) は簡単であるから,(iii) のみを証明しよう.A を (m, n) 型とすると,AB が定 義できることから B は (n, p) 型である.したがって,B は (p, n) 型,A は (n, m) 型となる.故に, 14 B A が定義できる.さて,A = [aij ], B = [bij ], AB = [cij ], A = [aij ], B = [bij ], B A = [cij ] n とすると,(AB) の (i, j) 要素は cji であり,積の定義より,cji = k=1 ajk bki である.ところが, ajk = akj , bki = bik より, cji = n akj bik = k=1 n bik akj = cij k=1 となる.ゆえに,(AB) = B A である. ところで,転置行列をさらに転置させると,もとの行列に戻ることは明らかである.これを,(iv) として加えておこう. (iv) 任意の行列 A に対して, (A ) = A 対称行列と (n, 1) 型行列 (Rn のベクトル) との積について,次の性質が得られる.A を (n, n) 型の 対称行列,x, y を Rn のベクトルとすれば, (Ax, y) = (Ay, x) ここで,(Ax, y) は Ax と y の内積である. (証明) 内積を行列の積になおすと,(Ax, y) = (Ax) y, (Ay, x) = (x, Ay) = x (Ay). 転置行列 の性質 (iii) と,A = A を考慮すれば, (Ax, y) = x A y = x Ay = (Ay, x) n ところで,Ay の第 i 要素は, j=1 aij yj であるから, (Ay, x) = n i=1 n n n xi aij yj = aij xi yj j=1 i=1 j=1 となる.ここで,y = x とおくと, (Ax, x) = x Ax = n n aij xi xj i=1 j=1 となる.これは2次形式と呼ばれるものである(詳細は後述). 2.3 行列の分割 行列 A をいくつかの縦線および横線によって区切ってみよう.区切られた一つの部分は A の要素 が矩形に配置されているから一つの行列とみることができる.この行列を A の小行列といい,一般 に Aij と表す. 例 2.7 A = . 1 2 3 .. 4 . 1 1 1 .. 1 .............. . 5 6 7 .. 8 を点線で示したように区分すれば,次の 4 つの小行列ができる. 15 A11 1 = 1 2 3 4 A12 = A21 = 5 6 1 1 1 A11 7 A22 = 8 このとき,A = A21 A12 A22 で表さ れる. 行列 A を小行列 Aij を使って, A11 ··· A12 A1q A21 A22 · · · A2q A= . . . . . . . . . . . . . . . . . . . . Ap1 Ap2 · · · Apq と表したとき,同じ行に並んだ小行列 Ai1 , Ai2 , · · · Aiq の行の数はすべて等しく,同じ列に並んだ 小行列 A1j , A2j , · · · Apj の列の数はすべて等しくなければならないことに注意しなければならない. たとえば,例 2.7 の A を, .. 1 2 3 . 4 ........... . A = 1 1 1 .. 1 .. . ··· .. 5 6 7 . 8 のように区切らない.小行列に分けて行列を表すときは, . . . A11 .. A12 .. · · · .. A14 ............................. .. .. .. .. .. .. . . . . . . A= ............................. .. .. .. A . A . . A p1 p2 pq のように区切るのである. 行列をこのように分割すると,演算が簡単になることが多い.いま,2つの (m, n) 型行列 A, B が 同じように分割されているとしよう. A= A11 A12 A21 A22 , B= B11 B12 B21 B22 (2.1) ここで,A11 ,B11 は (m1 , n1 ) 型行列,A12 ,B12 は (m1 , n2 ) 型行列,A21 ,B21 は (m2 , n1 ) 型行列, A22 , B22 は (m2 , n2 ) 型行列で,m1 + m2 = m, n1 + n2 = n である.このとき2つの行列の和は, A11 + B11 A+B = A21 + B21 A12 + B12 A22 + B22 のように分割される. 2つの行列の積について考えよう.A を (m, n) 型行列,B を (n, p) 型行列とし,それぞれ,(2.1) のように分割されているものとする.ここで,B11 は (n1 , p1 ) 型,B12 は (n1 , p2 ) 型,B21 は (n2 , p1 ) 型,B22 は (n2 , p2 ) 型行列で,n1 + n2 = n,p1 + p2 = p である.このとき, 16 A11 A21 A12 A22 B11 B21 B12 A11 B11 + A12 B21 = B22 A21 B11 + A22 B21 A11 B12 + A12 B22 A21 B12 + A22 B22 である. .. 1 2 . 0 1 2 0 ... 1 0 例 2.8 A = .............. . 1 1 .. 2 1 AB = = , B = 2 0 1 + 1 1 0 2 + 2, 1 1, 1 1 5 4 7 5 1 2 2 0 . 2 .. 2 . 1 .. 0 ....... . 3 .. 1 . 1 .. 2 のとき, 3 1 2 , 1 2 0 3 , 1, 1 1 2 0 1 + 0 1 0 2 + 2, 1 0 1 2 1 2 10 6 2.4 逆行列と直交行列 行列の積の演算のところで,逆演算としての商が一般的に定義できないことを示した.そこでは, AX = B をみたす X は,一般的に存在しないし,たとえ,存在したとしても,一意的であるとは限 らない. ここでは,A を n 次正方行列,B を n 次の単位行列 In に限定してみよう.このとき, XA = AX = In (2.2) をみたす n 次正方行列 X を A の逆行列といい,A−1 で表す.この場合でも,任意の A に対して,こ のような逆行列が,いつも存在するとは限らない.たとえば,A をゼロ行列とすると,どんな行列を 左あるいは右からかけても,ゼロ行列となってしまい,式 (2.2) をみたす行列 (逆行列) は存在しない のである. もちろん,A を適当にとれば,A の逆行列が存在するかもしれない. 例 2.9 A= 1 −2 2 0 とするとき,A の逆行列は存在し, −1 A = 0 − 12 である. 17 1 2 1 4 1 2 1 4 0 ∵ − 12 1 −2 1 −2 0 = − 12 2 0 2 0 1 2 1 4 1 = 0 0 1 この例のように,A の逆行列が存在するとき,あるいは同じことであるが,A が逆行列をもつと き,A は正則であるという(A が正則であるための必要十分条件は定理 2.4 で与えられる). A が正則であれば,A の逆行列はただ一つであるということが言える(逆行列の一意性).なぜなら, X, Y を A の逆行列とすると,(2.2) より,XAY = (XA)Y = In Y = Y ,XAY = X(AY ) = XIn = X となり,X = Y が得られるからである. 逆行列の定義から,次の性質が得られる. (i) (A−1 )−1 = A (ii) (AB)−1 = B −1 A−1 (iii) (A )−1 = (A−1 ) (証明) 簡単であるから,(iii) についてのみ与えておこう.(A )(A )−1 =In の両辺を転置し,In = In , (A ) = A を使えば, (A )−1 A = In を得る.したがって,A の逆行列が, (A )−1 であることと −1 なる.即ち, (A ) = A−1 . これを,さらに転置させると,(A )−1 = (A−1 ) . A を n 次正方行列としよう.そして,A の各列を a1 · · · · · · an で表すと, A = [a1 · · · · · · an ] となる.このとき,各 ai に関して,(ai , ai ) = 1 (i = 1, 2, · · · , n), (ai , aj ) = 0 (i = j, i, j = 1, 2, · · · , n) が成立するとき,即ち,Rn のベクトル a1 · · · an が正規直交系であるとき,この A を直 交行列という. − √1 12 例 2.10 A = −2 √1 2 − 21 1 2 1 2 1 1 √ 0 − √2 2 1 1 1 1 √ のとき,a1 = − 2 , a2 = − 2 , a3 = √2 とおくと, 2 0 1 2 √1 2 1 2 √1 2 (ai , ai ) = 1 (i = 1, 2, 3), (ai , aj ) = 0 (i = j, i, j = 1, 2, 3) である.したがって,この A は直交行 列である. 直交行列に関して,次の性質が得られる. (i) A = A−1 (ii) (Ax, Ay) = (x, y) (iii) Ax = x (証明) (i) A A をベクトル表示し,各要素を内積で表すと, a1 (a1 , a1 ) (a1 , a2 ) · · · · · · (a1 , an ) (a2 , a1 ) (a2 , a2 ) · · · · · · (a2 , an ) a2 A A = . a1 , · · · , an = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. (an , a1 ) (an , a2 ) · · · · · · (an , an ) an (ai , ai ) = 1, (ai , aj ) = 0 (i = j) を考慮すると,A A = In が得られる. (ii) (Ax, Ay) を行列の積で表示すると,(Ax, Ay) = (Ay) Ax = y (A A)x を得る.直交行列の 性質 (i) より,明らかに,(Ax, Ay) = y x = (x, y). (iii) x = y とおいて,(ii) と同じようにすれば,得られる. 18 2.5 行列の階数 (m, n) 型行列を,n 個の列ベクトル (Rm のベクトル) で表そう. A = [a1 , a2 , · · · an ] この n 個の列ベクトルのうち,1 次独立なものの最大個数を行列 A の階数(ランク)といい,r(A) で表す.定義よりただちに,階数の範囲が, 0 ≤ r(A) ≤ min{m, n} (2.3) であることを得る. 例 2.11 n 次の単位行列 In の階数は r(In ) = n である.なぜなら,In = [e1 , · · · en ], ei ∈ Rn (i = 1, 2, · · · , n) となり,n 個の Rn の基本単位ベクトル e1 , · · · en は,1次独立であるから. 任意の n 次の正方行列の階数を見出すため,次の列や行に対する基本変形と呼ばれるものを定義 しておこう. 行列 A に対して,次の 3 つを列に関する基本変形という. (i) A の任意の 2 つの列を入れかえる. (ii) A の 1 つの列に 0 でない数をかける. (iii) A の 1 つの列を何倍かして他の列に加える. 同様に,次の 3 つを行に関する基本変形という. (i ) A の任意の 2 つの行を入れかえる. (ii ) A の 1 つの行に 0 でない数をかける. (iii ) A の 1 つの行を何倍かして他の行に加える. いま,n 次の単位行列 In の第 i 列と第 j 列を入れかえた行列を In;i,j で表わそう. 第i列 第j列 .. .. 第i列 1 . . .. . . . .. .. .. 1 . .. .. . 0 1 . .. I In;i,j = λ = . λ n;i 1 0 .. .. .. . 0 . . .. .. . . 1 1 = .. . 第i列 .. . .. . 第j列 .. . .. . .. . 1 1 λ .. .. . . .. . 1 .. .. .. . . . .. .. . . 1 列に関する (i) の操作は,n 次正方行列 A と In;i,j の積を作ることであり,(ii) は,A と In;i,j λ との 積を作ることであり,(iii) は,A と In;i,j λ との積を作ることと同じである.同様に,行に関する基本 In;i,j λ 形 (i),(ii),(iii) は,それぞれ In;i,j A, A,In;iλ A, A と In;i,j λ A の形の積を作ることと同じである. 19 定理 2.1 行列 A, B をそれぞれ,n 次の正方行列とし,B は正則であるとする.このとき, r(AB) = r(A) が成立する. (証明) r(A) = r, r(AB) = r とおき,r = r を示そう.AB の列ベクトルは A の列ベクトルの1 次結合であるから,それらは A の1次独立な r 個のベクトルの1次結合として表すことができる.し たがって,r ≥ r . なぜなら,a1 , · · · ar に AB のベクトルをつけ加えた r + 1 個のベクトルが1次独 立,即ち r > r ならば,この r + 1 個のベクトルは,1次結合で表せないからである.また,A は AB の右に B −1 をかけたものであるから,A の列ベクトルは AB の列ベクトルの1次結合で表わせ る.したがって,r ≥ r. 以上を総合すると,r = r が得られる. ところで,行列 In;i,j ,In;iλ , In;i,j λ は,すべて正則である.というのは,X1 , X2 ,X3 を .. .. .. .. 1 . . 1 . . . . . . .. . .. .. . . .. .. . .. 1 . . .. 1 −λ . .. 0 1 . . 1 .. .. .. , X3 = X1 = , X2 = . λ .. .. . . 1 0 . 1 . . .. .. . . . .. . .. . . . .. . 1 .. .. .. .. . . 1 . . .. . 1 とすると,X1 In;i,j = In;i,j X1 = In , X2 In;iλ = In;iλ X2 = In , X3 = In;i.j λ = In;i,j λ X3 = In となる からである.したがって次の系を得る. 系 2.1 列に関する基本変形によって,階数はかわらない. 定理 2.1 と同様にして,r(CA) = r(A) が得られる.したがって,行に関する基本変形によっても, 階数はかわらない. 列および行に関する基本変形によって得られる行列が,もし,単位行列やゼロ行列の形で得られる ならば,当該の行列の階数は直ちに知られるであろう. 定理 2.2 n 次の正方行列 A に,列と行に関する基本変形を繰り返し行うことによって,A を Ir Or,n−r On−r,r On−r,n−r (2.4) の形の n 次正方行列に変形することができる.ここで,Ir , Or,n−r , On−r,r , On−r,n−r は小行列で, それぞれ,r 次の単位行列,(r, n − r) 型,(n − r, r) 型,(n − r, n − r) 型のゼロ行列である. (証明) A = [aij ] とする.A = 0 のときは,A はすでに (2.4) の形である.A = 0 としよう.こ のとき,A の要素のうち 0 でないものが少なくとも 1 個存在するから,それを aij としたとき,第 1 列と第 j 列を入れかえ,第 1 行と第 i 行を入れかえることによって,aij の要素が第 1 行第 1 列に位 置する行列が得られる.そこで,その行列の第 1 行と第 i 行を入れかえることによって,aij の要素 が第 1 行第 1 列に位置する行列が得られる.そこで,その行列の第 1 列に 1/aij をかけて得られる行 列を Ā = [āij ] とすると,ā11 = 1 である.Ā において順次第 1 列に −ā1j をかけて第 j 列に加え,次 に第 1 行に −āi1 をかけて第 i 行に加えると,次の形の行列が得られる. 20 1 O O A1 ここで,A1 は (n − 1) 次の正方行列である.A1 = O ならば A1 に対して,上述と同じ手続きをと ることによって, O A2 I2 O が得られる.ここで A2 は (n − 2) 次の正方行列である.このことを繰り返し行うことによって,最 終的に式 (2.4) を得る. −3 0 4 4 例 2.12 A = 7 7 2, (i ) 第 1 行 2 2 とする.(i) 第 1 列と第 2 列を入れかえると, 2 1 11 6 11 1 6 1 11 6 と第 3 行を入れかえると 2 7 2 ,(iii) 第 1 列を −11 倍,−6 倍して,それぞれ,第 2 列, 第 0 −3 −3 0 4 1 0 0 3 列に加えると 2 −15 −10 ,(iii ) 第 1 行を −2 倍,3 倍して,それぞれ,第 2 行,第 3 行に −3 33 22 1 0 0 1 0 0 1 をかけると 0 3 2 , (iii ) 第 2 行 加えると,0 −15 −10 , (ii ) 第 2 行に − 15 , 第 3 行に 11 0 33 22 0 3 2 1 0 0 1 0 0 を −1 倍し,第 3 行に加えると,0 3 2 ,(ii) 第 2 列に 13 , 第 3 列に 12 をかけると,0 1 1, 0 0 0 1 (iii) 第 2 列を (−1) 倍し,第 3 列に加えると,0 0 0 I2 0 0 1 0 = O 0 0 O 0 0 0 となる.したがって,行列 A の階数は 2 である. (2.4) 式の形をとくに,行列の標準形という.この行列において,1 次独立な列ベクトルの最大個 数と,1 次独立な行ベクトルの最大個数が一致することが,直ちにわかる.したがって,次の定理を 得る. 定理 2.3 n 次正方行列 A において r(A) = r(A ) 標準形は,先に示したように A の左及び右に In;i,j , In;iλ , In;i,j λ を繰り返しかけることによって得 られる.いま,行に関する基本変形に対応する正則行列,列に関する基本変形に対応する正則行列を それぞれ,X, Y としよう.このとき,標準形は, XAY = Ir On−r,r 21 Or,n−r On−r,n−r (2.5) で表すことができる.A が正則であれば,XAY は正則であり,(2.1) の右辺の 1 つの行 (列) がすべ て 0 となることはないから,右辺は n 次の単位行列となる. 定理 2.4 n 次正方行列 A が正則であるための必要十分条件は,r(A) = n となることである. (証明) 必要性)A が正則であるとしよう.上で示したように,標準形は In となる.基本形によっ て階数は変わらないから,r(A) = r(In ) = n. 十分性) r(A) = n とすると,標準形の階数も n である.したがって,XAY = In . X, Y は正則で あるから,X −1 , Y −1 も正則.A = X −1 Y −1 より,A は明らかに正則である. 1 −2 例 2.13 例 2.9 の行列を使って,A が正則ならば,r(A) = 2 となることを確かめよう.A = 2 0 1 0 1 0 , 第 1 列を-2 倍し第 2 行に加えると, , において,第 1 列を 2 倍し第 2 列に加えると, 2 4 0 4 1 0 1 第 2 列に 4 をかけると, . したがって,標準形は I2 で r(A) = r(I2 ) = 2. 0 1 練習問題 1. 次の行列の転置行列を求めよ.また,それらの転置行列のうちで正方行列であるもののトレー スを求めよ. 1 1 2 3 (1) (2) 4 4 5 6 7 2 5 8 3 1 6 (3) 2 9 4 2 1 3 4 1 3 (4) 0 1 0 3 1 1 1 0 0 2 3 2 2. 次の行列 A の転置行列を求め,A = A であることを確かめよ. 1 2 3 4 2 0 2 A= 3 2 0 4 1 3 1 2 5 2 −2 1 2 , , C= , B= 3. A = 2 −4 7 4 3 3 1 せよ. 1 3 1 D= 3 4 1 6 −2 5 とするとき,次の計算を (1) A + B (2) 2A − 3B (3) C + 2D (4) AB (5) BA (6) (BC)D 3 2 1 1 −1 2 0 1 4. A = 1 0, B = 6 −3, C = ,x= とするとき,次の計算をせよ. 5 1 4 2 2 1 0 2 (1) AC (2) 3A − 2B (3) BC (4) (AC) (5) Ax (6) A B 2 3 1 2 5. A = , a= , b= とするとき,次の行列を小行列を使わずに書け. −1 1 3 7 (1) a, Ab (2) a, b, A 22 A (3) I2 I2 O A (4) b a O 6. 行列の積に関する性質 (ii), (iii) を証明せよ. 7. 逆行列の性質 (i), (ii) を証明せよ. 8. 例 2.10 で与えた行列の逆行列を求めよ. 9. 次の行列の階数を基本変形を行うことによって,求めよ. 1 2 3 1 2 (2) 4 5 6 (1) 3 4 7 8 9 1 2 1 10. A = 2 1 2 について次の問いに答えよ. 1 3 x (1) A の階数が 3 であるための x の条件を求めよ. (2) A の階数が 1 になることはあるか. 11. A, AB がともに正則ならば,B も正則で B −1 = (AB)−1 A となることを示せ. 12. 正方行列 A, B に対して,AB が正則ならば,A も B もともに正則になることを示せ. 23 第 3 章 行列式 3.1 順列 行列式の定義を与える前に,順列の説明をしておこう. n 個の異なるもの(ここでは,n 個の自然数 1, 2, · · · , n をとろう)を,勝手な順に並べたものを 1, 2, · · · , n の順列といい,一般に,(p1 , p2 , · · · , pn ) で表わす.たとえば,2 個の自然数 1,2 の順列 は,(1,2),(2,1) の 2 個であり,3 個の自然数の 1,2,3 の順列は,(1,2,3),(1,3,2),(2,1,3),(2,3,1), (3,1,2),(3,2,1) の 6 個である.n 個の自然数の順列の個数は,はじめに p1 としてとりうるものが n 個,次に p2 としてとりうるものが (n − 1) 個,以下同様にして,pk としてとりうるものは,(n − k + 1) 個であるから,全体として,これらの積 n(n − 1)(n − 2) · · · · · · 3 · 2 · 1 = n! の個数だけの順列がある. 順列 (p1 , · · · , pn ) において,2 つの数 p, q を入れ換えることを互換といい,(p, q) で表わす.互換 に関して,次の性質が得られる. 性質 3.1 任意の 2 つの順列が与えられたとき,その一方に何回かの互換をほどこすことによって, 他の順列を得ることができる. (証明) 帰納法により証明しよう.n = 2 の場合は,互換は (1,2) だけで,これを順列 (1,2) にほど こせば,(2,1) となる.いま (n − 1) 個の数の順列については,すでに上の結論が成立すると仮定す る.そして与えられた二つの順列を (p1 , · · · , pn ),(q1 , · · · , qn ) とする.p1 = q1 であれば,(n − 1) 個の数 p2 , · · · , pn と q2 , · · · , qn は全体として一致するから,帰納法の仮定より (p2 , · · · , pn ) に何回 かの互換をほどこすことによって,(q2 , · · · , qn ) に移ることができる.したがって,(p1 , · · · , pn ) は (p1 , q2 , · · · , qn ) = (q1 , q2 , · · · , qn ) に移る.次に,p1 = q1 としよう.(p1 , · · · , pn ) に互換 (p1 , q1 ) をほ どこしたものを (q1 , r2 , · · · , rn ) とすれば,r2 , r3 , · · · , rn は全体として,q2 , q3 , · · · , qn に一致するか ら,同じく,帰納法の仮定より (r2 , · · · , rn ) に何回かの互換をほどこしてに移すことができる.この とき,(q1 , r2 , · · · , rn ) は (q1 , q2 , · · · , qn ) に移るから,結局,(p1 , · · · , pn ) に何回かの互換をほどこし て (q1 , · · · , qn ) を得ることができる. 例 3.1 3 個の自然数の 2 つの順列,(1,2,3),(2,3,1) について,(1,2,3) に互換 (1,2),(1,3) をほどこ せば (2,3,1) が得られる.また,この順列について,互換 (1,3),(2,3) をほどこせば,(1,2,3) が得ら れる. この例が示すとおり,一般に,互換をほどこして,ある順列から別の順列に移る方法は,幾通りも ある.これについて,次の性質を得る. 性質 3.2 (1, · · · , n) から (p1 , · · · , pn ) に移るのに必要とする互換の数は,つねに偶数であるか,ま たはつねに奇数である. 24 (証明) 次の多項式 P を考えよう. P = (x1 − x2 )(x1 − x3 ) · · ·(x1 − xn ) ×(x2 − x3 ) · · ·(x2 − xn ) ············ ×(xn−1 − xn ) x の添字 1, 2, · · · , n に一つの互換 (i, j) をほどこせば,xi と xj が入れかわる.互換 (i, j) と (j, i) は 同じであるから i < j とできる.P の因子のうちで xi または xj を含むものは, (xk − xi )(xk − xj ), 1 ≤ k ≤ i − 1; (xi − xk )(xk − xj ), i + 1 ≤ k ≤ j − 1; xi − xj ; (xi − xk )(xj − xk ), j + 1 ≤ k ≤ n であるから,xi と xj と入れ換えると P は −P となる.ゆえに,(1, 2, · · · , n) に k 回の互換をほどこ し (p1 , · · · , pn ) に移ったとすると,P は (−1)k P に移る.さて,P における x の添字 1, 2, · · · , n を それぞれ,p1 , p2 , · · · , pn で置き換えると,P の定義より,P は P または −P となる.P が変わらな いときは (−1)k = 1 で k は偶数,P が −P になるときは (−1)k = −1 で k は奇数である.□ この性質より,順列 (p1 , · · · , pn ) が (p1 , p2 , · · · , pn ) に偶数回の互換をほどこして得られる順列(こ れを偶順列という)と奇数回の互換をほどこして得られる順列(これを奇順列という)の 2 種類に分 けられることが明らかになった. 順列 (p1 , · · · , pn ) が (p1 , p2 , · · · , pn ) に e 回の互換をほどこして得られるものとして, ε(p1 , · · · , pn ) = (−1)e とおけば,(p1 , · · · , pn ) が偶順列のとき,ε(p1 , · · · , pn ) = 1 , (p1 , · · · , pn ) が奇順列のとき,ε(p1 , · · · , pn ) = −1 となる. これについて次の性質が得られる. 性質 3.3 1, 2, · · · , n の n! 個の順列のうち,偶順列と奇順列の個数は一致し,n!/2 個である. 偶順列,奇順列の個数をそれぞれ,n1 ,n2 とする.偶順列に互換 (1,2) をほどこせば,奇順列とな り,相異なる偶順列は,相異なる奇順列に移り,n1 ≤ n2 となる.同様にして,奇順列に互換をほど こすと,n2 ≤ n1 .n1 + n2 = n! であるから,n1 = n2 = n! 2 .□ 例 3.2 1,2,3 の 6 個の順列において,(1,2,3)(2,3,1)(3,1,2) は偶順列,(1,3,2)(2,1,3)(3,2,1) は奇順列 である. 3.2 行列式の定義 行列式は,もともと連立 1 次方程式の解の公式をわかりやすい形で表すために考えられたもので ある.このことを,次の簡単な 2 元 1 次方程式で説明しよう. a11 x1 + a12 x2 = b1 a21 x1 + a22 x2 = b2 25 (3.1) まず,(第 1 式)×a22 −(第 2 式)×a12 を作ると, x2 が消去され,(a11 a22 −a21 a12 )x1 = b1 ·a22 −b2 ·a11 a b を得る.いま,a · d − b · c の形の式を という形に書くことにすれば,a11 a22 − a21 a12 = 0 の c d とき,求める解の公式は, b a a 12 1 11 b1 b2 a22 a21 b2 , x2 = x1 = a a11 a12 11 a12 a21 a22 a21 a22 となる.この分母に,先で説明した順列の概念を使ってみよう. a 11 a21 a12 = a11 a22 − a12 a21 a22 (3.2) 各 aij の右の添字 j = 1, 2 は 2 個の自然数であるから,順列 (1,2),(2,1) を考えることができる. (1,2) は偶順列であるから,ε(1, 2) = 1,(2,1) は ε(2, 1) = −1 となる.したがって,式 (3.2) は, a 11 a12 = a11 a22 − a12 a21 = ε(1, 2)a11 a22 + ε(2, 1)a12 a21 a21 a22 となる.この式の左辺を 2 次の正方行列 A = [aij ] の行列式といい,|A|, det A,あるいは det[aij ] で 表す. さて,一般の n 次の正方行列について行列式の定義を与えよう.n 次正方行列, a11 a12 · · · a1n a21 a22 · · · a2n A= .. .. .. . . . an1 an2 ··· ann において,A の各行及び各列から要素を 1 つづつ選んで積を作ると, a1,p1 a2,p2 · · · · · · an,pn (3.3) ここで,(p1 , p2 , · · · , pn ) は,自然数 1, 2, · · · , n の順列で,n! 個あるから,積 (3.3) の個数も n! 個あ る.それらに符号 ε(p1 , · · · , pn ) をつけて加えたものを行列式といい, |A| = det A = det[aij ] = で表す.ここで, ε(p1 , · · · , pn )a1,p1 a2,p2 · · · · · · an,pn (3.4) はすべての順列についての和を表わすとする.行列式は正方行列についてのみ 定義されるものであることに注意しなければならない. 例 3.3 3 次の行列 A = [aij ] について |A| =ε(1, 2, 3)a11 a22 a33 + ε(2, 3, 1)a12 a23 a31 + ε(3, 1, 2)a13a21 a32 + ε(2, 1, 3)a12a21 a33 + ε(1, 3, 2)a11 a23 a32 + ε(3, 2, 1)a13 a22 a31 =a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a12 a21 a33 − a11 a23 a32 − a13 a22 a31 これは,次のような図 3.1 の形で記憶しておけばよい.しかし,4 次以上の行列式には適用できない ことに注意せよ. 26 a11 a12 a13 a21 a22 a23 a31 a32 a33 − − + + − + 図 3.1: サラスの公式 1 2 たとえば,A = 4 5 7 8 3 6 の行列式 |A| は, 9 |A| = (1 × 5 × 9) + (7 × 2 × 6) + (3 × 4 × 8) − (3 × 5 × 7) − (1 × 6 × 8) − (9 × 2 × 4) =0 行列式の一般的な定義は上でみたように,順列を用いて与えられるが,次のような定義もある.n 次 正方行列を,n 個の列ベクトル ai ∈ Rn で表わし, A = [a1 , · · · · · · , an ] とする.このとき,A の行列式 |A| = D(a1 , · · · , an ) は,次の条件をみたす,Rn から R への写像と して定義される. (イ)D は A の列の線形関数である.すなわち, D(a1 , · · · , αai + βbi , · · · , an ) = αD(a1 , · · · , ai , · · · , an ) + βD(a1 , · · · , bi , · · · , an ) (ロ)任意の 2 つの列ベクトル ak , al (k = l) について, D(· · · ak , · · · , al , · · · ) = −D(· · · al , · · · , ak , · · · ) (ハ)e1 , · · · , en を基本単位ベクトルとすれば, D(e1 , · · · , en ) = 1 ここで,α,β はスカラーである. 実際,このようにして定義された関数は (3.4) の右辺の形となることが示されるから,いずれの定 義を使ってもよいことになる. 27 3.3 行列式の性質 行列式の定義からわかるように,具体的に行列式を計算することは必ずしも容易ではない.した がって,計算を容易にするため,次に与える様々な性質が利用されることになる.以下,A は n 次 正方行列とする. 性質 3.1 A と A の行列式は等しい,すなわち, |A| = |A | (証明) 行列式の定義より,|A | = ε(p1 , · · · , pn )ap1 ,1 ap2 ,2 · · · apn ,n である.ここで,順列 (p1 , p2 , · · · , pn ) の互換の回数を e とすると,ε(p1 , · · · , pn ) = (−1)e .次に,(p1 , p2 , · · · , pn ) に逆の互換を順次行 うと,(1, 2, · · · , n) が得られる.そこで,pi とともに api ,j をも動かすと,ap1 ,1 ap2 ,2 · · · apn ,n は a1,q1 a2,q2 · · · an,qn となる.a の 2 番目の添字をみると,(1, 2, · · · , n) に並んでいたものが e 回の互換 により,(q1 , q2 , · · · , qn ) になっている.ゆえに ε(q1 , · · · , qn ) = (−1)e .さらに,a1,q1 a2,q2 · · · an,qn = ap1 ,1 ap2 ,2 · · · apn ,n である.したがって, |A | = = ε(q1 , · · · , qn )a1,q1 a2,q2 · · · an,qn ε(p1 , · · · , pn )a1,p1 a2,p2 · · · an,pn = |A| 例 3.4 6 2 4 2 3 6 2 3 1 = 2 3 5 6 3 1 4 5 6 この性質より,行列式において行に関して成立する性質は,そのまま列についても成立することが 保障される. 性質 3.2 行列のある行(列)を α 倍すると,行列式も α 倍となる. (証明) αai1 αai2 · · · αain ....................... an1 an2 · · · ann a12 · · · a1n a11 ....................... の行列式は定義より, ε(p1 , · · · , pn )a1,p1 · · · αai,pi · · · an,pn = α ε(p1 , · · · , pn )a1,p1 · · · ai,pi · · · an,pn = α|A|. □ 例 3.5 6 2 4 2 3 5 3 3 1 = 2 1 2 6 28 2 3 5 3 1 6 性質 3.3 行列の 2 つの行(列)を入れかえると,行列式の符号が逆になる.すなわち, a11 a12 · · · a1n a11 a12 · · · a1n .................... .................... ak1 ak2 · · · akn ai1 ai2 · · · ain .................... = − .................... ai1 ai2 · · · ain ak1 ak2 · · · akn .................... .................... an1 an2 · · · ann an1 an2 · · · ann (証明) ε(p1 , · · · , pi , · · · , pk , · · · , pn ) = −ε(p1 , · · · , pk , · · · , pi , · · · , pn ) であるから, ε(p1 , · · · , pi , · · · , pk , · · · , pn )a1,p1 · · · αai,pi · · · αak,pk · · · an,pn =− ε(p1 , · · · , pk , · · · , pi , · · · , pn )a1,p1 · · · αak,pk · · · αai,pi · · · an,pn が成り立つ.□ 例 3.6 3 2 1 3 2 5 1 3 1 = − 3 2 6 3 1 2 3 5 6 性質 3.4 2 つの行(列)が等しい行列の行列式は 0 である. (証明) 性質 3.3 より,等しい 2 行を入れかえると行列式の符号がかわる.したがって,第 i 行と第 k 行が等しいものとすると, a11 a12 · · · a1n .................... ai1 ai2 · · · ain .................... ai1 ai2 · · · ain .................... an1 an2 · · · ann = − ai1 ai2 · · · ain .................... ai1 ai2 · · · ain .................... an1 an2 · · · ann a11 a12 · · · a1n .................... となり,|A| = −|A|.ゆえに,|A| = 0 □ 例 3.7 1 3 2 3 1 2 3 = 0 5 2 性質 3.5 行列のある行(列)を α 倍して他の行(列)に加えても行列式の値は変わらない.すなわ ち,第 i 行を α 倍し第 k 行に加えると, a12 ··· a1n a11 ......................................... ai2 ··· ain ai1 ......................................... ak1 + αai1 ak2 + αai2 · · · akn + αain ......................................... an2 ··· ann an1 29 = a1n .................... ai1 ai2 · · · ain .................... ak1 ak2 · · · akn .................... an1 an2 · · · ann a11 a12 ··· (証明) 左辺 = ε(p1 , · · · , pi , · · · , pk , · · · , pn )a1,p1 · · · ai,pi · · · (ak,pk + αai,pk ) · · · an,pn ε(p1 , · · · , pi , · · · , pk , · · · , pn )a1,p1 · · · ai,pi · · · ak,pk · · · an,pn +α ε(p1 , · · · , pi , · · · , pk , · · · , pn )a1,p1 · · · ai,pi · · · ai,pk · · · an,pn = ε(p1 , · · · , pi , · · · , pk , · · · , pn )a1,p1 · · · ai,pi · · · ak,pk · · · an,pn = 右辺 = なぜなら,性質 3.4 より α にかかる項は 0 だからである.□ 3 2 3 例 3.8 1 3 1 において,第 1 列を-1 倍し,第 3 列に加えると, 2 5 6 3 1 2 2 0 3 2 3 0 = 1 3 5 4 2 5 3 1 6 性質 3.6 行列のある行(列)のすべての要素が 2 つの数の和になるとき,行列式はその和の各項を 成分とする 2 つの行列式の和になる.すなわち,第 i 行の要素が aij + aij のようになっているとき, a11 a12 · · · a1n a11 a12 · · · a1n a12 ··· a1n a11 ................................... .................... .................... ai1 + a ai2 + ai2 · · · ain + ain = ai1 ai2 · · · ain + ai1 ai2 · · · ain i1 ................................... .................... .................... an1 an2 · · · ann an1 an2 · · · ann an2 ··· ann an1 (証明) ε(p1 , · · · , pi , · · · , pn )a1,p1 · · · (ai,pi + ai,pi ) · · · an,pn = ε(p1 , · · · , pi , · · · , pn )a1,p1 · · · ai,pi · · · an,pn + ε(p1 , · · · , pi , · · · , pn )a1,p1 · · · ai,pi · · · an,pn 左辺 = =右辺 例 3.9 3 1 2 2 3 5 0 2 0 = 1 4 2 2 0 1 3 0 + 1 5 4 2 0 3 0 0 4 5 1 2 3 以上の性質のいくつかを利用して,|A| = 4 5 6 を解いてみよう. 7 8 9 1 2 3 |A| = 4 (性質 3.5 において,第 2 行を − 2 倍し,第 3 行を加える) 5 6 −1 −2 −3 1 2 3 = − 4 5 6 (性質 3.2 より) 1 2 3 =0 (性質 3.4 より) 30 ところで,|A| = 0 となるような行列は,どんな性質を有しているのだろうか.次の性質は,これ の十分条件を与えるものである. 性質 3.7 行列の n 個の行(列)が 1 次従属ならば,行列式は 0 になる. (証明) 行列 A の第 i 行を ai ∈ Rn とすると,一次従属性の仮定より,λ1 a1 + λ2 a2 + · · · + λn an = 0 をみたす,すべてが 0 でない λi (i = 1, 2, · · · , n) が存在する.したがって,一般性を失うことなく λi = 0 とすると, ai = − λ1 λi−1 λi+1 λn a1 + · · · + ai−1 + ai+1 + · · · + an λi λi λi λi ゆえに,行列式の性質 3.4 と 3.6 を逐次利用すると,所望の結論を得る.□ さて,最後に行列の積に関する行列式の性質を示しておこう.この性質を示す前に,次の定理を証 明しておく. 定理 3.1 n 個の Rn のベクトル a1 , · · · , an の関数で,条件 (イ),(ロ),(ハ) をみたすものは,行列 式以外にない. (証明) f (a1 , · · · , an ) を条件 (イ),(ロ),(ハ) を満たす関数とする.f (e1 , · · · , en ) = 1 であるが, (ロ) より,任意の 2 つの ek , el に互換をほどこせば,f の符号が変わる.ゆえに,(p1 , p2 , · · · , pn ) を 1, 2, · · · , n の順列とすれば, f (ep1 , ep2 , · · · , epn ) = ε(p1 , p2 , · · · , pn ) (3.5) 同じく,(ロ) より,ak = al ならば,行列式の性質 3.4 の証明と同様にして, f (· · · , ak , · · · , al , · · · ) = 0 を得る.いま,a1 = n i=1 ai1 ei , a2 = n i=1 ai2 ei , · · · , an = (3.6) n i=1 ain ei とし,これを f に代入する と,(イ) より n n n f (a1 , a2 , · · · , an ) = f ( ai1 ei , ai2 ei , · · · , ain ei ) i=1 = i=1 i=1 ap1 ,1 ap2 ,2 · · · apn ,n f (ep1 , ep2 , · · · , epn ) この式の右辺は nn 個の和であるが,(3.6) より,そのうちで添字 p1 , p2 , · · · , pn が 1, 2, · · · , n の順列 となっているものだけとなる.ゆえに, f (a1 , a2 , · · · , an ) = ε(p1 , p2 , · · · , pn )ap1 ,1 ap2 ,2 · · · apn ,n 性質 3.1 から,この右辺は |A| となる.□ ところで,この f が (イ),(ロ) をみたし,必ずしも (ハ) をみたさないときは,f (e1 , · · · , en ) = c とおくと,上記の証明と同様にして, f (a1 , a2 , · · · , an ) = c|A| を得る.ここで c は任意のスカラーである. 31 (3.7) 性質 3.8 A, B を n 次正方行列とすると, |AB| = |BA| = |A| |B| (証明) A = [a1 , a2 , · · · , an ] とすると,BA = [Ba1 , Ba2 , · · · , Ban ] となる.したがって,定理 3.1 より |BA| = D(Ba1 , Ba2 , · · · , Ban ) で表わすことができる.いま B を一定とし,a1 , a2 , · · · , an を変数と考え,f (a1 , a2 , · · · , an ) = D(Ba1 , Ba2 , · · · , Ban ) とおくと,この f は条件 (イ),(ロ) をみたす.また,f (e1 , e2 , · · · , en ) = D(Be1 , Be2 , · · · , Ben ) = |BI| = |B|.ゆえに,(3.7) より, f (a1 , a2 , · · · , an ) = |B| |A|.したがって,|BA| = |B| |A|.A と B を入れかえて同様の手続きをと ると,|AB| = |A| |B|.|A|, |B| は実数であるから,|A||B| = |B| |A|.ゆえに, |AB| = |BA| = |A| |B| 3.4 行列式の展開 前節では,行列式の諸性質を利用することによって,行列式の計算が容易になることを示した.し かし,次数の高い行列式の計算は,たとえこのような性質を利用したとしても,一般的にいって,困 難であろう.ここでは,次数の高い行列式が,ある方法を使うことによって,次数の低い行列式で計 算できることを示そう. n 次正方行列 A の第 i 行と第 j 列を取り除いた n − 1 次の小行列の行列式に (−1)i+j をかけたもの を正方行列 A の,あるいは行列式 |A| の (i, j) 余因子といい,|Aij | で表わす. 6 例 3.10 A = 2 4 3 5 2 |A12 | = (−1)1+2 4 2+1 2 |A21 | = (−1) 5 2+3 6 |A23 | = (−1) 4 6 |A32 | = (−1)3+2 2 1+1 3 1 = 18 − 5 = 13, 1 のとき,|A11 | = (−1) 5 6 6 2 3 1 = (−1)(12 − 4) = −8, |A13 | = (−1)1+3 = 10 − 12 = −2, 4 5 6 3 2+2 6 3 = (−1)(12 − 15) = 3, |A22 | = (−1) = 36 − 12 = 24, 4 6 6 2 3+1 2 3 = (−1)(30 − 8) = −22, |A31 | = (−1) = 2 − 9 = −7, 3 1 5 6 2 3 = (−1)(6 − 6) = 0, |A33 | = (−1)3+3 = 18 − 4 = 14. 1 2 3 2 3 n 次の行列式 |A| の (i, j) 余因子を |Aij | とすると,上の定義より, i+j |Aij | = (−1) ai−1,1 ai−1,2 · · · ai−1,j−1 ai−1,j+1 · · · ai−1,n ai+1,1 ai+1,2 · · · ai+1,j−1 ai+1,j+1 · · · ai+1,n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . an2 ··· an,j−1 an,j+1 · · · ann an1 a11 a12 ··· a1,j−1 a1,j+1 ··· a1n .................................................... である.|A| において,a12 = · · · = a1n = 0 としてみると, 32 (3.8) a22 · · · a2n = ε(1, p , · · · , p )a a · · · a = a 2 n 11 2,p2 n,pn 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . an1 · · · ann an1 an2 · · · ann a11 a21 ··· ··· 0 a22 0 a2n (3.9) となる.一般に,|A| において,ai1 = 0, · · · , ai,j−1 = 0, ai,j+1 = 0, · · · , ain = 0 とするとき,行と列 を入れかえて,aij を第 1 行第 1 列にもってくることができる.すなわち, 第 i 行 aij a1n a1j ......................... i+j 0 = (−1) ai−1,j 0 · · · ai,j · · · ai+1,j ......................... anj an1 · · · an,j · · · ann a11 ··· a1,j ··· 0 ··· 0 0 ··· 0 a11 a1,j−1 ai−1,j−1 a1,j+1 ai−1,j+1 ··· ··· a1n ai−1,1 ··· ··· ai−1,n ai+1,1 an1 ··· ··· ai+1,j−1 an,j−1 ai+1,j+1 an,j+1 ··· ··· ai+1,n ann したがって,式 (3.8),(3.9) を考慮すれば, 0 · · · aij · · · 0 = aij |Aij | ......................... an1 · · · anj · · · ann a11 · · · a1j · · · a1n ......................... (3.10) を得る.列についても全く同様にして, ai1 · · · ai,j · · · ain = aij |Aij | ......................... an1 · · · 0 · · · ann a11 · · · 0 · · · a1n ......................... (3.11) を得る. 行列式の性質 3.6 を適用すれば, |A| = = a1n .................... ai1 ai2 · · · ain .................... an1 an2 · · · ann a11 a12 · · · a1n .................... 0 ··· 0 + ai1 .................... an1 an2 · · · ann a11 a12 ··· a1n .................... 0 + · · · + 0 ai2 · · · .................... an1 an2 · · · ann a11 a12 ··· 33 a1n .................... 0 0 · · · ain .................... an1 an2 · · · ann a11 a12 ··· となるから,余因子を使えば, |A| = ai1 |Ai1 | + ai2 |Ai2 | + · · · + ain |Ain | = n aij |Aij | (3.12) akj |Akj | (3.13) j=1 を得る.同様に,第 j 列について,行列式の性質 3.6 を適用すると, |A| = a1j |A1j | + a2j |A2j | + · · · + anj |Anj | = n k=1 を得る.したがって,任意の n 次の行列式 |A| は,式 (3.12) または (3.13) で表わすことができる. (3.12) を |A| の第 i 行による余因子展開,(3.13) を |A| の第 j 行による余因子展開という.なお,i,j は 1, 2, · · · , n の任意の値でかまわない.なぜならば, |A| = = n j=1 n a1j |A1j | = · · · = ak1 |Ak1 | = · · · = n j=1 n k=1 anj |Anj | akn |Akn | k=1 が成立するからである. 例 3.11 例 3.10 の行列 A の行列式は,第 1 行で展開すると, |A| = 6 × |A11 | + 2 × |A12 | + 3 × |A13 | 3 1 2 1 2 = 6 × (−1)1+1 + 2 × (−1)1+2 + 3 × (−1)1+3 5 6 4 6 4 3 5 = 6 × 13 + 2 × (−8) + 3 × (−2) = 56 第 2 行で展開すると, |A| = 2 × |A21 | + 3 × |A22 | + 1 × |A23 | 2+1 2 3 2+2 6 3 2+3 6 = 2 × (−1) + 3 × (−1) + 1 × (−1) 5 6 4 6 4 2 5 = 2 × 3 + 3 × 24 + 1 × (−22) = 56 第 1 列で展開すると, |A| = 6 × |A11 | + 2 × |A21 | + 4 × |A31 | 2 1 2 3 2 = 6 × (−1)1+1 + 2 × (−1)2+1 + 4 × (−1)3+1 5 6 5 6 3 3 1 = 6 × 13 + 2 × 3 + (−7) = 56 このような余因子展開をする前に,行列式の性質を使って 1 つの行または列において 0 の数をで きるだけ多くした上で,その行または列で余因子展開するといった手続きを繰り返せば,行列式の計 算はさらに容易となる. 34 例 3.12 例 3.10 の行列式を計算する. 3 2 |A| = 2 1 3 2 5 3 2 3 1 = 2 1 3 2 5 6 0 0 4 第 3 列で展開すると, |A| = 2 × 1 (3+3) 3 4 × (−1) 2 3 = 2 × 4 × 7 = 56 1 1 例 3.13 |A| = 1 0 0 1 0 0 1 0 −1 |A| = 1 −1 −1 1 0 0 0 1 1 1 1 1 0 0 0 0 1 1 1 0 0 0 1 1 1 を計算する.まず,第 2 列,第 3 列からそれぞれ第 1 列を引くと, 1 1 1 0 0 0 0 −1 0 0 0 1 −1 −1 1 1 , ここで,第 4 列に第 2 列 1 1 , 第 1 行で展開すると,|A| = 1 1 1 0 1 1 1 1 1 0 1 0 0 −1 0 1 −1 1 0 −1 −1 1 0 = (−1) × (−1)1+2 0 1 2.これ を加え,それを第 1 行で展開すると,|A| = 1 1 2 0 1 1 1 1 1 1 1 −1 0 0 1 2 の第 1 列を第 2 列に加えると,|A| = 0 1 2, 第 1 行で展開すると,|A| = (−1) = 3. 2 1 1 2 1 さて,余因子のもつ性質をいくつかあげておこう. 性質 3.1 n 次の行列式 |A| の余因子を |Aij | とするとき,任意の i 行または j 列(i = j )について, ai1 |Aj1 | + ai2 |Aj2 | + · · · + ain |Ajn | = a1i |A1j | + a2i |A2j | + · · · + ani |Anj | = n k=1 n aik |Ajk | = 0 (3.14) akj |Akj | = 0 (3.15) k=1 が成立する. (証明) まず,(3.14) を証明しよう.|A| を第 j 行で展開すると,(3.12) より, |A| = aj1 |Aj1 | + · · · + ajn |Ajn | 35 となる.ここで,|Aj1 |, · · · , |Ajn | の中には aj1 , · · · , ajn は含まれていないので,aj1 , · · · , ajn を ai1 , · · · , ain で置き換えても |Aj1 |, · · · , |Ajn | の値は変わらず, a11 a12 · · · a1n .................... ai1 ai2 · · · ain .................... ai1 ai2 · · · ain .................... an1 an2 · · · ann n aik |Ajk | = k=1 となるが,行列式の性質 3.4 より,この行列式の左辺は 0 となる.したがって,(3.14) が得られる. (3.15) についても,上と同様な手続きをとることによって得られる.□ |Aij | を (i, j) 要素とする n 次正方行列を考えよう.この行列の転置行列を,A の余因子行列 (adjugate matrix) といい,adjA で表わす.すなわち, |A11 | |A21 | ··· |An1 | |A12 | |A22 | · · · |An2 | adjA = ......................... |A1n | |A2n | · · · |Ann | このとき,次の性質を得る. 性質 3.2 A と余因子行列との積は,単位行列の |A| 倍となる.すなわち, |A| 0 A · adjA = adjA · A = .. . 0 ··· 0 |A| .. . ··· 0 .. . 0 ··· |A| 0 = |A|In (3.16) (証明) A · adjA の (i, j) 要素を cij とし,adjA の (i, j) 要素を bij とすると,bij = |Aji | であるから, cii = n aik bki = k=1 n aik |Aik | k=1 となる.したがって,(3.12) より,cii = |A|.また cij (i = j) については, cij = n aik bki = k=1 n aik |Ajk | k=1 であるから,(3.14) を考慮すれば,cij = 0.ゆえに,|A|In が得られる.同様に,adjA · A の (i, j) 要素を dij とすると,dii = |A|, dij (i = j) = 0 となり,|A|In が得られる.□ 13 例 3.14 例 3.10 の行列をとろう.このとき,A の余因子行列 adjA は,adjA = −8 6 なる.一方,A · adjA = 2 4 2 3 13 3 3 1 −8 24 5 6 −2 −22 −7 1 0 = 56 0 14 36 0 3 24 −2 −22 −7 0 と 14 0 0 1 0 = |A|I3 . 同じく,adjA · A = 0 1 13 −8 −2 3.5 3 24 −22 −7 6 2 0 2 3 3 1 0 1 = 56 0 1 0 0 = |A|I3 である. 14 6 1 4 5 0 0 逆行列と行列式 n 次の正方行列 A とその行列式 |A| との間には,次のような重要な関係がある. 定理 3.2 行列 A の逆行列が存在する(行列 A が正則である)ための必要十分条件は,|A| = 0 とな ることである. (証明) 必要性)A の逆行列 A−1 が存在すれば,逆行列の定義より AA−1 = In である.ゆえに |In | = 1 を考慮すれば, |AA−1 | = |In | = 1 ところで,行列式の性質 3.8 より |AA−1 | = |A||A−1 | であるから,|A||A−1 | = 1 となり,|A| = 0 を 得る. 十分性)|A| = 0 とすると,余因子の性質 3.2 より,A · adjA = adjA · A = |A|In であるから, 1 1 adjA = adjA A = In A |A| |A| を得る.したがって A の逆行列が存在して, 1 adjA |A| A−1 = となる. 例 3.15 例 3.10 の行列 A の逆行列は, 13 3 −7 1 A−1 = 56 0 である. −8 24 −2 −22 14 ところで,行列に関する定理 2.4 によれば,n 次正方行列が正則であるための必要十分条件は r(A) = n となることであった.そして r(A) とは,一次独立な列(行)ベクトルの最大個数であっ た.したがって,定理 3.2 と合わせれば,次の定理を得る. 定理 3.3 n 次正方行列 A の n 個の列ベクトル(行ベクトル)が 1 次独立であるための必要十分条件 は |A| = 0 となることである. 6 2 3 例 3.16 例 3.10 の行列 A の 3 個の列ベクトル 2 , 3 , 1 は 1 次独立である.3 個の 4 5 6 行ベクトル (6,2,3),(2,3,1),(4,5,6) も 1 次独立である. A を n 次正方行列,x,b をそれぞれ,Rn の列ベクトルとするとき, Ax = b 37 なる形式を考えよう.いま |A| = 0 とすると,定理 3.2 より,A−1 が存在する.そこで,この両辺に 左から A−1 をかけると, A−1 Ax = A−1 b が得られる.A−1 = 1 |A| adjA (3.17) であるから, x= 1 adjAb |A| (3.18) を得る. 最後に,一般の行列と行列式との関係を考えよう.(m, n) 型行列 A から,第 i1 行,第 i2 行,· · · 第 is 行の合計 s 行をとり,第 j1 列,第 j2 列,· · · 第 js 列の合計 s 列をとって得られる行列を A の s 次の小行列といい, A i1 , ··· , is j1 , · · · , js で表わす.また,その行列の行列式を A の s 次の小行列式といい, i1 , · · · , is A j1 , · · · , js で表わす.ただし,1 ≤ i1 ≤ i2 · · · ≤ is ≤ m, 1 ≤ j1 ≤ j2 · · · ≤ js ≤ n である. 6 2 3 1, 2 とすると,2 次の小行列は,A = 例 3.17 (2,3)型行列を A = 2 3 1 1, 2 1, 2 6 3 1, 2 2 3 であり,小行列式は,それぞれ,A A = ,A = 1, 3 2 1 2, 3 3 1 1, 2 1, 2 14, A = −7 である. = 0, A 2, 3 1, 3 6 2 2 3 , 1, 2 = 1, 2 この小行列式と行列の階数との間にも重要な関係がある. 定理 3.4 (m, n) 型の行列 A の階数が r(r ≤ m ≤ n) であるための必要十分条件は,A の r 次の小行 列式のなかに,少なくとも 1 つその値が 0 でないものが存在し,(r + 1) 次以上の小行列式の値が, すべて 0 となることである. (証明) 必要性)A の階数が r であることとは,A = [a1 , a2 , · · · , an ] としたとき,n 個の列ベクト ル a1 , a2 , · · · , an の中に r 個の 1 次独立なベクトルが存在し,r + 1 個以上のベクトルはいずれも 1 次従属になるということであるから,定理 3.3 より,r 次の小行列式の中で 0 とならないものが存在 するし,(r + 1) 次以上の小行列式の値はすべて 0 となる. 十分性)必要性の証明の逆をたどれば,直ちに得られる.□ 例 3.18 例 3.17 の行列の階数は 2 である.なぜならば,2 次の小行列で 0 でないものが存在するか らである. 練習問題 1. 自然数 1,2,3,4 の順列 (p1 , p2 , p3 , p4 ) をすべてあげ,それらを偶順列と奇順列に分類し,そ れらの個数が一致することを確かめよ. 2. 次の行列式を計算せよ. 38 1 (2) 2 4 10 9 (1) 8 7 a11 ··· a12 1 1 −1 −3 5 6 4 3 (3) 3 3 3 4 3 3 3 3 4 3 3 3 3 4 a1n 0 a22 · · · a2n 3. A = . .. .. のとき(この A を n 次三角行列という),|A| を求めよ. . . . . 0 0 · · · ann a c b a + b c + a b + c 4. b + c a + b c + a = 2 b a c となることを,行列式の性質を使って証明せよ. c b a c + a b + c a + b b a 11 b12 11 a12 5. A = , B = とするとき,|AB| = |A||B| を,行列式の性質 3.2,3.3,3.4 b21 b22 a21 a22 および 3.6 を使って証明せよ. 2 2 6 1 3 0 4 7 の (1,2) 余因子,(4,3) 余因子を求めよ. 6. 4 4 9 2 1 3 2 5 7. 次の行列式を余因子展開によって計算せよ. −1 0 (1) 0 1 1 2 3 4 5 2 1 (2) 3 1 0 2 1 1 2 1 3 2 2 2 1 0 −1 1 1 1 1 1 −1 1 1 1 (3) 1 1 −1 1 1 1 1 1 −1 1 1 1 1 1 −1 2 1 0 3 x1 8. A = 2 3 1 ,b = 2 ,x = x2 とするとき, 1 2 3 x3 1 (1)|A| を計算せよ. (2)adjA および A−1 を求めよ. (3)A−1 b を計算することにより,Ax = b を解け. 6 −3 2 3 9.A = 2 −1 3 1 とするとき, (1) A 4 1 2 3 4 −2 5 2 を求めよ. (2) A 1 2 1 2 3 3 39 を求めよ. (3) r(A) = 2 を示せ. 第 4 章 連立 1 次方程式 4.1 連立 1 次方程式の解法 a11 x1 + a12 x2 + · · · + a1n xn = b1 a x + a x + · · · + a x = b 21 1 22 2 2n n 2 ······ a x + a x + · · · + a x = b m1 1 m2 2 mn n n が与えられたとき,行列 a11 a21 .. . am1 A= ··· ··· .. . ··· a1n a2n .. . amn (4.1) を用いて表すと, Ax = b となる. ここで, x= x1 x2 .. . xn (4.2) b= b1 b2 .. . bn である.また, A = (a1 , a2 , · · · , an ) a1 = a11 a21 .. . am1 , · · · , an = a1n a2n .. . amn とおけば,(4.1) は a1 x1 + a2 x2 + · · · + an xn = b と書くことができる. もし A が正則行列ならば (この場合 m = n),逆行列 A−1 を両辺にかけて A−1 Ax = A−1 b 40 (4.3) ∴ x = A−1 b 1 adjAb ∴x= |A| (4.4) (4.2)(あるいは (4.2),(4.3)) の解 x が一意的に決まる. ところで,(4.4) を書き下すと, |A11 | |A21 | · · · |An1 | x2 1 1 |A12 | |A22 | · · · |An2 | .. = |A| adjAb = |A| . . . . . . . . . . . . . . . . . . . . . . . . . . |A1n | |A2n | · · · |Ann | xn x1 b1 b2 .. . bn となる.すなわち, xj = 1 (b1 |A1j | + b2 |A2j | + · · · + bn |Anj |) , |A| である.括弧内は行列式 j = 1, 2, · · · , n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . an1 an2 · · · an,j−1 bn an,j+1 · · · ann a11 a21 a12 a22 ··· ··· a1,j−1 a2,j−1 b1 b2 a1,j+1 a2,j+1 ··· ··· a1n a2n の第 j 列による因子展開に等しくなっており,これはまた,n 次正方行列 A の第 j 列を b で置き換 えた行列の行列式である.これを次の定理としてまとめておく. 定理 4.1 (クラメールの公式) 連立 1 次方程式 (4.1) はその係数が作る行列 A が |A| = 0 のときただ 1 組の解 x1 , x2 , · · · , xn をもち, b a 1 a12 · · · a1n 11 · · · b1 · · · a1n 1 b2 a22 · · · a2n 1 a21 · · · b2 · · · a2n , · · · , x x1 = = j |A| . . . . . . . . . . . . . . . . . . . |A| . . . . . . . . . . . . . . . . . . . . . . . . bn an2 · · · ann an1 · · · bn · · · ann a 11 · · · a1,n−1 b1 1 a21 · · · a2,n−1 b2 xn = |A| . . . . . . . . . . . . . . . . . . . . . an1 · · · an,n−1 bn 例 4.1 連立 1 次方程式が 6x + 2x2 + 3x3 = 1 1 2x1 + 3x2 + x3 = 2 4x + 5x + 6x = 1 1 2 3 で与えられているとき,x1 , x2 , x3 を求める. 41 ,··· , (4.5) (4.6) 6 2 A= 2 3 1 5 3 1 1 ,b = 2 とおくと,|A| = 56 = 0 よりクラメールの公式が使えて, 6 1 1 x1 = 56 1 x3 = 56 1 2 1 6 2 4 2 3 3 12 = , 3 1 = 56 14 5 6 2 1 32 4 =− 3 2 =− 56 7 5 1 1 3 5 40 = , 2 1 = 56 7 1 6 6 1 x2 = 2 56 4 以上の議論で得られたベクトル,行列,行列式の関連について,まとめておく. 定理 4.2 n 次正方行列において, 行 (あるいは列) ベクトルが1次独立 ⇐⇒ r(A) = n ⇐⇒ A が正則行列 (A−1 が存在する) ⇐⇒ |A| = 0 定理 4.3 連立1次方程式 (4.1)(あるいは (4.2),(4.3)) が解をもつための必要十分条件は,A = (a1 , a2 , · · · , an ) の階数と (A, b) = (a1 , a2 , · · · , an , b) の階数が等しいことである. 一般の連立1次方程式の場合,定理 4.2 より次のようにして解くことができる.解が存在するため の条件から,r(A) = r(A, b) = r とおけば,適当に行と列の番号を付け替えることにより,(A, b) の はじめの r 行は1次独立で,r + 1 行から n 行までははじめの r 行の1次結合として表すことができ る.ゆえに,(4.1) の解と a11 x1 + a12 x2 + · · · + a1n xn = b1 a x + a x + · · · + a x = b 21 1 22 2 2n n 2 ········· a x + a x + · · · + a x = b r1 1 r2 2 rn n r の解とは完全に一致する.(4.7) を書き改めると a11 . . . ar1 ··· ··· ··· a1r x1 .. . . .. = xr arr a1j b1 n . .. − xj .. . j=r+1 br arj 左辺の行列の行列式の値は 0 ではないので,その逆行列をかけると x1 a11 . . . = . . . xr ar1 ··· ··· ··· −1 a1r .. . arr b1 a11 n . .. − xj .. . j=r+1 br ar1 を得る.これが連立1次方程式の解を求める公式である. 42 ··· ··· ··· −1 a1r a1j .. .. . . arj arr (4.7) 練習問題 1.次の連立 1 次方程式を,クラメールの公式を用いて解け. x1 + x2 + x3 = 0 x + x = 1 (2) x1 − 2x2 − x3 = 10 1 2 (1) x + 4x = 1 x − 2x = 7 1 2 3 2 x1 + x2 = 1 5x1 − x2 + x3 = 0 (3) −x2 + 2x3 = 8 (4) −x1 + x2 = 2 x + 3x = 8 x + x + 2x = 0 1 3 2 3 1 x + 3x2 + 2x3 = 13 x1 + 2x2 = 2 1 4x + x = −1 (5) 2x1 − 5x2 + x3 = −10 2 4 (6) 4x1 + x2 − 3x3 = 8 2x1 + 3x3 + 2x4 = 8 x + 2x + x = 5 2 3 4 2.次の連立 1 次方程式が与えられたとする. (1) その中で,解をもつものはどれか.また,ただ1つの解をもつものはどれか. x1 + x2 + x3 + x4 = 1 x1 + x3 + 2x4 = 1 x + x = 2 2x + x − x = 2 1 2 4 1 3 (b) (a) x1 + x2 − x3 + x4 = 2 x2 + x4 = 1 x − x + x − x = 2 x + x + x = 1 2 4 2 3 4 1 1 x1 + 2x2 + x3 = 1 x1 + x2 + x3 = 3 (c) 2x1 + x2 + 2x3 = 2 (d) x1 + 2x2 + x3 = 2 x − x + x = −1 x − x + x = 5 1 2 3 1 2 3 (2) 上の連立一次方程式の中で,解をもつものについて,その解を求めよ. 43 第 5 章 固有値 5.1 固有値と固有ベクトル A を n 次の正方行列,x を Rn のベクトル,λ をスカラーとし,次の式を考察しよう. Ax = λx (5.1) この式をみたす λ を A の固有値,x = 0 を固有値 λ に対する固有 (列) ベクトルという (もちろん, x = 0 は (5.1) をみたすが,このような自明解は除外する).In を利用して (5.1) を書き換えると, (λIn − A)x = 0 (5.2) となる.非自明解 x = 0 が存在するための必要十分条件は, |λIn − A| = 0 (5.3) であり,この式を A の固有方程式という.(5.1) をみたす λ は,この固有方程式の解となる.いま, A を 2 次の正方行列としよう.このとき,固有方程式は, λ − a −a12 11 =0 −a21 λ − a22 となる.つまり, λ2 − (a11 + a22 )λ + (a11 a22 − a12 a21 ) = 0 となる.これを解けば,2 つの根 λ1 ,λ2 について, 1 λ1 = (a11 + a22 ) + (a11 + a22 )2 − 4(a11 a22 − a12 a21 ) 2 1 λ2 = (a11 + a22 ) − (a11 + a22 )2 − 4(a11 a22 − a12 a21 ) 2 を得る. 例 5.1 A = 4 2 2 1 の固有値と固有ベクトルを求める. (λ − 4)(λ − 1) − 4 = λ2 − 5λ = 0 よって λ1 = 5, λ2 = 0 となるから,A の固有値は,5,0 である.λ1 = 5 に対する固有ベクトルは, (5I − A)x = 0 44 をみたすベクトルであるから, 1 −2 x1 −2 4 = 0 0 2 x1 − 2x2 = 0 より,x = c1 ,ここで c1 は任意の実数である.一方,固有値が 0 のとき, 1 x2 −4 −2 x1 −2 −1 −4x1 − 2x2 = 0 より,x = c2 −1 2 x2 = 0 0 ,ここで c2 は任意の実数である. いま,(5.1) の代わりに,次の式を考えよう. A x = λx (5.4) 固有方程式は |λIn − A | = |(λIn − A ) | = |λIn − A| = 0 となるから,A の固有値と A の固有値は一致する.また, x A = λx (5.5) において,x = 0 が存在するための必要十分条件は,|λ I − A| = 0 である.この x (= 0) を固有 値 λ に対する固有行ベクトルという. (5.5) の両辺を転置させると, A x = λx となるから,固有行ベクトル x を転置した x は,固有値 λ に対する A の固有列ベクトルとなる. ところで,(5.3) は λ に関する n 次方程式であるから,等根を重複して数えれば,一般に n 個の根 をもつ.したがって,行列 A はその次数だけの固有値をもつことになる.n 次正方行列の固有値を λ1 , λ2 , · · · , λn としよう.このとき,次の定理を得る. 定理 5.1 n 次正方行列 A の固有値 λi に対する固有列ベクトルを xi ,固有行ベクトルを xi とし, λi = λj (i = j; i, j = 1, 2, · · · , n) としょう.このとき, xi xj = (xi , xj ) = 0 (i = j; i, j = 1, 2, · · · , n) が成り立つ. (証明) xi A = λi xi の両辺の右から xj を乗ずると, xi Axj = λi xi xj Axj = λj xj の両辺の左から xi を乗ずると, xi Axj = xi λj xj = λj xi xj したがって,λi xi xj = λj xi xj ,すなわち, (λi − λj )xi xj = 0 45 仮定より λi = λj であるから,xi xj = (x, xj ) = 0 となる.□ この定理は,n 個の相異なる固有値 λ1 , λ2 , · · · , λn に対する n 個の固有列 (行) ベクトルが直交系 であることを示している.いま,n 個の固有列ベクトルをとり,1 次結合 α1 x1 + α2 x2 + · · · + αn xn = 0 を考えよう.任意の xi (i = 1, 2, · · · , n) に対し i = j ならば (xi , xj ) = 0 であるから, 0 = (0, xi ) =(α1 x1 + · · · + αn xn , xi ) =α1 (x1 , xi ) + · · · + αn (xn , xi ) =αi (xi , xi ) となる.xi = 0 より,(xi , xi ) = 0 だから αi =0.i は任意であるから,α1 = · · · = αn = 0 となり, x1 , · · · , xn が 1 次独立であることがわかる.したがって,定理 5.1 は次の形に書き換えられる. 定理 5.2 n 次正方行列 A の固有値 λ1 , λ2 , · · · , λn が相異なるとき,これらに対する固有列ベクトル x1 , x2 , · · · , xn は 1 次独立である. 例 5.2 例 5.1 における 2 つの固有ベクトル x = c1 2 1 と x = c2 −1 2 は 1 次独立である. ところで,行列 A の要素がすべて実数であっても,その固有値がすべて実数であるとは限らない. 次の例を考えよう. λ 0 −1 例 5.3 A = の固有方程式は −1 1 0 ある.ここで i = − 1. 1 = λ2 + 1 = 0 である.ゆえに,固有値は i と −i で λ いま,A=A なる n 次の対称行列を考えよう.このとき,次の定理を得る. 定理 5.3 対称行列の固有値はすべて実数である. (証明) A の固有値を λ,λ に対する固有ベクトルを x とし,λ の共役複素数を λ̄,x の共役複素ベ クトルを x̄ とする.(5.1) の両辺の共役複素数をとると,A の要素は実数であるから, Ax̄ = λ̄x̄ となる.この式の両辺を転置して,A =A を考慮すると, x̄ A = λ̄x̄ 両辺に右から x をかけると, x̄ Ax = λ̄x̄ x 一方,(5.1) の両辺に左から x̄ をかけると, x̄ Ax = λx̄ x したがって, (λ − λ̄)x̄ x = 0 x = 0 で,x = a + ib としたとき,x̄ = (a − ib) であるから (ここで a, b は実ベクトル),x̄ x > 0 となり,λ − λ̄ = 0 が得られる.λ = α + iβ ,λ̄ = α − iβ とすると (ここで,α, β は実数),λ = λ̄ = α. すなわち,固有値 λ は実数である.□- 46 a 例 5.4 A = b b とすると, c λ − a |λI − A| = −b −b = λ2 − (a + c)λ + ac − b2 λ − c であるから,|λI − A| = 0 の判別式は, (a + c)2 − 4(ac − b2 ) = (a − c)2 + 4b2 ≥ 0 となり,A の固有値は実数である. 定理 5.4 n 正方行列 A の固有値を λ1 , λ2 , · · · , λn とすると, λ1 + λ2 + · · · + λn = tr(A) λ1 λ2 · · · λn = |A|. 練習問題 1.次の行列の固有値とそれに対する固有ベクトルを求めよ. 1 −3 3 1 2 (1) (2) 3 −5 3 3 2 6 −6 4 2.次の行列の固有値が実数であること,およびその階数が固有値の数 (重根は重複度だけ数える) に等しいことを確かめよ. 1 −1 1 −1 1 1 1 1 47 1 第 6 章 2 次形式 6.1 2 次形式と対角比 A を n 次の対称行列,xを Rn のベクトルとし,積 x Ax を考えよう.これを成分表示すれば, x Ax n n = aij xi xj i=1 j=1 = a11 x21 + a12 x1 x2 + · · · + a1n x1 xn +a21 x2 x1 + a22 x22 + · · · + a2n x2 xn ············ +an1 xn x1 + an2 xn x2 + · · · + ann x2n = a11 x21 + a22 x22 + · · · + ann x2n + 2 aij xi xj i<j となる.これは x1 , x2 , · · · , xn に関して 2 次の同次式となっている.このような x Ax を x の 2 次形 式といい, Q(x) = x Ax で表わす. 1 2 例 6.1 A = のとき,2 次形式 Q(x) は 2 −2 1 2 x1 Q(x) = (x1 , x2 ) = x21 − 2x22 + 4x1 x2 2 −2 x2 である. 対称行列の固有値は実数である.以下では,2 次形式と固有値の関係を考察しよう. 定理 6.1 n 次の正方行列 A において,正則行列 P によって P −1 AP を対角行列にする (これを A の 対角化という) ための必要十分条件は,A が 1 次独立な n 個の固有ベクトルを持つことである.この とき,P −1 AP の対角要素は A の固有値になる. (証明) 必要性) A に対し, P −1 λ1 0 ··· 0 0 λ2 · · · 0 AP = D = ................. 0 · · · · · · λn (6.1) となる正則行列 P が存在したとする.この P を列ベクトルに分け, P = [x1 , x2 , · · · , xn ] 48 (6.2) とおくと,(6.1) は AP = P D となり, Ax1 = λ1 x1 ,Ax2 = λ2 x2 ,· · · ,Axn = λn xn と書ける.したがって,λ1 , λ2 , · · · , λn は A の固有値であり,x1 , x2 , · · · , xn は A の固有ベクトルで なければならない.仮定より P は正則だから,この n 個の固有ベクトルは 1 次独立である. 十分性) A に 1 次独立な n 個の固有ベクトルがあれば,(6.2) のように P をおき,AP = P D の 両辺に左から P −1 をかけることにより (6.1) が成立する.□ A の固有値は 例 6.2 例 6.1 において,P −1 AP を求めてみよう. -3,2 であるから,これに対する固 1 2 ,2 のとき t となる.ここで s,t は任意の数であ 有ベクトルを求めてみると,-3 のとき s −2 1 る.いま, 1 2 x1 = , x2 = −2 1 とおいて,P = [x1 , x2 ] とすると, P −1 AP = 1 5 2 5 − 25 1 5 1 2 1 2 −3 0 = 2 −2 −2 1 0 2 を得る. もし P が直交行列ならば,P −1 = P であるから,P AP を (6.1) の形の対角行列にすることがで きる.このとき,次の定理を得る. 定理 6.2 2 次形式 Q(x) = x Ax に対し,正則直交行列 P をとれば,(正則)1 次変換 x = P y に よって, x Ax = y By = λ1 y 21 + λ2 y 22 + · · · + λn y 2n とすることができる.ここで B = P AP , λi (6.3) (i = 1, 2, · · · , n) は A の固有値である.(6.3) を 2 次形 式の標準形という. (証明) 1 次変換 x = P y をほどこすと, x Ax = (P y) AP y = y (P AP )y となる.ここで B = P AP とおき,P −1 = P および定理 6.1 を考慮すれば, λ1 0 · · · 0 0 λ2 · · · 0 B= . . . . . . . . . . . . . . . . . 0 · · · · · · λn となるから,(6.3) が得られる.□ √1 x 5 1 例 6.3 例 6.2 において,−3 に対する固有ベクトルを z 1 = x1 = ,−2 に対する固有ベク − √25 √2 x 2 トルを z 2 = x2 = 15 とおき,P = [z 1 , z 2 ] とすると,これは直交行列となる. √ 5 P AP = √1 5 √2 5 − √25 √1 5 1 2 2 −2 49 √1 5 − √25 √2 5 √1 5 = −3 0 0 2 であるから, Q(x) = x Ax = [y1 , y2 ] −3 0 y1 0 2 y2 = −3y12 + 2y22 を得る.ここで,y = P −1 x である. この例と同様にして,n 個の 1 次独立な固有ベクトルからなる行列 [x1 , x2 , · · · , xn ] は,z i = xi /xi (i =, 2, · · · , n) とおくことにより,直交行列 [z 1 , z 2 , · · · , z n ] に作り変えられる.この方法 をシュミットの直交化法という. 6.2 2 次形式の符号 2 次形式 Q(x) = x Ax について,次の符号を定義しよう. (1) 任意の x = 0 に対して Q(x) > 0 となるとき,Q は正値定符号であるという. (2) 任意の x に対して Q(x) ≥ 0 となるとき,Q は非負値定符号または半正値定符号という. (3) 任意の x = 0 に対して,Q(x) < 0 となるとき,Q は負値定符号であるという. (4) 任意の x に対して,Q(x) ≤ 0 となるとき,Q は非正値定符号または半負値定符号という. (5) 任意の x = 0 に対し,Q(x) > 0 となったり,Q(x) < 0 となったりするとき,Q は不定値であ るという. 例 6.4 x21 + 3x22 ,x21 − 2x1 x2 + x22 ,−x21 − x22 ,−4x21 + 4x1 x2 − x22 はそれぞれ,正値,非負値,負 値,非正値である.一方,例 6.1 の 2 次形式 x21 − 2x22 + 4x1 x2 は不定値である. ところで,2 次形式において, Q(kx) = (kx) A(kx) = k 2 x Ax = k 2 Q(x) が成立するから,x = 0 に対する Q(x) の符号は,x̄ = 1 であるような x̄ (x̄ = x/x) 対しての み調べれば十分である. 定理 6.3 x = 1 の下で Q(x) = x Ax の最大値は A の最大固有値に,最小値は A の最小固有値に 等しい. (証明) 1 次変換 x = P y により, Q(x) = y P AP y = y By = λ1 y12 + · · · + λn yn2 となる.x = P y = y = 1 であるから,y について証明すればよい.いま,λ1 ≤ λ2 ≤ · · · ≤ λn とすると, y By − λ1 = (λ1 − λ1 )y12 + (λ2 − λ1 )y22 + · · · + (λn − λ1 )yn2 ≥ 0 y By − λn = (λ1 − λn )y12 + (λ2 − λn )y22 + · · · + (λn − λn )yn2 ≤ 0 となるから,λ1 ≤ y By ≤ λn が成り立つ.y = e1 のとき Q = λ1 ,y = en のとき Q = λn である から,Q の最小値は λ1 ,最大値は λn となる.□ この定理から直ちに,次の定理が得られる. 50 定理 6.4 2 次形式 Q(x) = x Ax において,A の固有値を λ1 , λ2 , · · · , λn とすると, (i) Q が正値 ⇐⇒ λi > 0 (i = 1, 2, · · · , n) (ii) Q が非負値 ⇐⇒ λi ≥ 0 (iii) Q が負値 ⇐⇒ λi < 0 (iv) Q が非正値 ⇐⇒ λi ≤ 0 が成立する. 4 例 6.5 行列 2 (i = 1, 2, · · · , n) (i = 1, 2, · · · , n) (i = 1, 2, · · · , n) 2 の 2 次形式 4x21 + x22 + 4x1 x2 は非負値である. 1 以上は,標準形を利用して 2 次形式の符号を判定する方法であった.次の定理は行列式を使ってそ の符号を判定する方法である. 定理 6.5 2 次形式 Q(x) = x Ax が正値であるための必要十分条件は,A のすべての主小行列式 |Ar | (r = 1, 2, · · · , n) が正となることである.すなわち, |A1 | = a11 > 0, a 11 |A2 | = a21 a11 · · · a12 a12 > 0, · · · · · · , |An | = . . . . . . . . . . . . . . > 0 a22 an1 · · · ann (証明) 必要性) x Ax を正値とすると,定理 6.4 より λi > 0 (i = 1, 2, · · · , n) である.また,定 理 6.1,定理 6.2 より,P AP を対角行列にすることができるから, λ 1 0 ··· 0 0 λ2 · · · 0 = λ1 λ2 · · · λn > 0 |P AP | = . . . . . . . . . . . . . . . . . 0 0 · · · λn となる.|P AP | = |P |2 |A| で P は正則であるから,|P |2 > 0.したがって,|A| > 0 を得る.一方, a11 · · · a1r Ar = . . . . . . . . . . . . . . (r = 1, 2, · · · , n − 1) は,2 次形式 x Ax において,xr+1 = · · · = xn = 0 ar1 · · · arr として得られる 2 次形式 x̄ Ax̄ の行列であるから,x Ax が正値ならば,x̄ Ax̄ も正値である.ゆえ に,|Ar | > 0 (r = 1, 2, · · · , n − 1) を得る.ここで,x̄ = (x1 , · · · , xr , 0, · · · , 0) である. (r = 1, 2, · · · , n) ならば,適当に P を選んで対角行列 P AP を作ったとき,そ の対角要素がすべて正となることを示せばよい.いま,A を小行列に分割し, a An−1 A= ann a 十分性) |Ar | > 0 とする.ここで a は Rn−1 の列ベクトルである.A を対角化する操作を (n, n) 要素からはじめよう. An−1 A の 1, · · · , (n − 1) 列にそれぞれある数をかけて n 列に加えることは,行列 に,ある Rn−1 a の列ベクトルを右からかけて,n 列に加えることである.|An−1 | = 0 であるから,この列ベクトル として,(−A−1 n−1 a) をとると, A→ An−1 0 a λn 51 の形になる.次に,(−a A−1 n−1 ) を左から [An−1 , 0] にかけ,第 n 行に加えると, An−1 0 0 λn となる.この操作は行と列について対称的であるから,この行列は P1 をある正則行列とすれば, P1 AP1 に等しい.したがって, |P1 AP1 | = |A| |P1 |2 = |An−1 |λn 仮定より |A| > 0,|An−1 | > 0 であるから λn > 0. 次に,(n − 1) 行と (n − 1) 列に関して,同様の操作を施すと, O2 An−2 λn−1 0 P2 (P1 AP1 )P2 = O 0 λn 2 となり,|An−2 | > 0 から,λn−1 > 0. この操作をくり返し,P を P1 ,P2 · · · の積とおくと,P AP が対角行列となり,対角要素 λn , λn−1 , · · · , λ1 はすべて正となる.□ 2 次形式 x Ax が負値ならば x (−A)x は正値となるから,ただちに次の定理を得る. 定理 6.6 2 次形式 Q(x) = x Ax が負値であるための必要十分条件は,主小行列式 |Ar | が条件 (−1)r |Ar | > 0 (r = 1, 2, · · · , n) を満たすことである.すなわち, |A1 | = a11 < 0, a 11 |A2 | = a21 a11 · · · a1n a12 > 0, · · · · · · , (−1)n |An | = (−1)n . . . . . . . . . . . . . . > 0 a22 an1 · · · ann a b 例 6.6 行列 の 2 次形式は ax21 + cx22 + 2bx1 x2 となる.このとき, b c a > 0,ac − b2 > 0 ならば正値 a < 0,ac − b2 > 0 ならば負値 となる. 最後に,x に, b x = b1 x1 + b2 x2 + · · · + bn xn = 0, b1 = 0 という条件がついている場合に,2 次形式 Q(x) = x Ax の符号に関する定理を与えておく. 定理 6.7 2 次形式 Q(x) = x Ax が b x = 0 という条件の下で (i) 正値となるための必要十分条件は,|Er | < 0 (r = 2, 3, · · · , n) となることである. (ii) 負値となるための必要十分条件は,(−1)r |Er | > 0 ここで, 0 b2 b1 (r = 2, 3, · · · , n) となることである. ··· br b1 a11 a12 · · · a1r Er = b2 a21 a22 · · · a2r ....................... br ar1 ar2 · · · arr 52 (6.4) (証明) いま,s2 = −b2 /b1 ,s3 = −b3 /b1 , · · · , sn = −bn /b1 , s2 sn s3 1 0 0 0 .. 1 . s2 = .. , s3 = , · · · , sn = . 0 . . . . . . . . . 0 0 0 1 とおくと,s2 , s3 , · · · , sn は (6.4) の 1 次独立な解となっている.この s2 , s3 , · · · , sn を用いて次の ような行列を作る. 1 s2 s3 · · · sn 0 1 0 · · · 0 P = 0 0 1 · · · 0 = [e1 , s2 , s3 , · · · , sn ] . . . . . . . . . . . . . . . . . . . 0 0 0 ··· 1 明らかに |P | = 1 であるから,P は正則である.いま,1 次変換 x = P y により b x と x Ax を変換 すると, b x = b P y = (b e1 , b s2 , · · · , b sn )y = b1 y1 e1 Ae1 e1 As2 · · · e1 Asn s2 As2 · · · s2 Asn s2 Ae1 y x Ax = y P AP y = y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . sn Ae1 sn As2 · · · sn Asn したがって,b x = 0 のときの Q の符号は,y1 = 0 のときの Q の符号と一致し,n−1 個の y2 , y3 , · · · , yn の 2 次形式 y2 s2 As2 · · · s2 Asn y3 Q̄ = (y2 , y3 , · · · , yn ) . . . . . . . . . . . . . . . . . . . . .. . sn As2 · · · sn Asn yn の符号と一致する. 定理 6.5 より,Q̄ が正値となるための必要十分条件として, s As2 · · · s Asr 2 2 |Dr | = . . . . . . . . . . . . . . . . . . . . > 0 (r = 2, 3, · · · , n) s As2 · · · s Asr r r を得る.|Dr | > 0 という条件を次のように書き換える.r + 1 番目から先の成分をすべて 0 とする Rn のベクトル p,q をとり, p = (p1 , p2 , , · · · , pr , 0. · · · , 0) = (p̃ , 0 ) q = (q1 , q2 , , · · · , qr , 0. · · · , 0) = (q̃ , 0 ) とすると, p Aq = (p̃ , 0 ) Ar à 53 à q̃ = p̃ Ar q̃ Ø 0 ˜ となる.ここで,à は (r, n − r) 型,à は (n − r, n − r) 型の行列である. s2 , s3 , · · · , sn の r + 1 番目から先の成分はすべて 0 であるから, s̃ As̃2 · · · s̃ As̃r 2 2 |Dr | = . . . . . . . . . . . . . . . . . . . . s̃ As̃2 · · · s̃ As̃r r となる.いま, r 0 b1 · · · br b1 a11 · · · a1r Er = b2 a21 · · · a2r .................. = 0 b̃r · · · arr 1 0 0 ··· 0 0 1 s2 · · · sr 1 0 S= 0 0 1 · · · 0 = 0 e 1 . . . . . . . . . . . . . . . . . . 0 0 0 ··· 1 br b̃r Ar ar1 0 ··· 0 s2 ··· sr とおくと, 0 b1 ··· 0 b1 s̃2 Ar s̃2 · · · s̃2 Ar s̃r . . . . . . . . . . . . . . . . . . . . . . . . . . 0 s̃r Ar s̃2 · · · s̃r Ar s̃r |S | |Er | |S| = |S Er S| = −b21 |Dr | = を得る.|S| = |S | = 1, b1 = 0 を考慮すれば,|Dr | > 0 の必要十分条件として |Er | < 0 が得られる. (ii) についても,定理 6.6 から同様にして得られる.□ 1 2 のときの 2 次形式 Q(x) に,条件 x1 + 2x2 = 0 が付加されたとき,符号がど 例 6.7 A = 2 −2 うなるかを考えよう. 0 1 |E2 | = 1 1 2 2 2 2 =6>0 −2 であるから (E3 は存在しない),2 次形式の符号は負値となる. 練習問題 1.次の行列の 2 次形式を求めよ. 1 −1 1 1 −2 (1) (2) −1 1 1 (3) −2 4 1 1 1 1 2 2 0 3 1 1 2 54 3 1 1 2 0 1 1 1 2.次の行列の 2 次形式を標準形に直し,符号を判定せよ. 0 1 1 1 −2 (1) (2) 1 0 1 −2 4 1 1 0 3.次の行列の 2 次形式の符号を,主小行列式を求めることによって判定せよ. 1 2 3 1 3 1 −2 2 0 1 2 (1) 1 3 −2 (2) 3 1 0 1 −2 −2 6 1 2 1 1 0 1 −1 x1 4.A = 1 0 0 で,b x = (1, −2, 3) x2 = 0 なる制約条件が付加されたときの 2 次形式 −1 0 1 の符号を判定せよ. x3 55 第 7 章 極値問題 7.1 1変数関数の極値問題 周知のように,極値のための必要条件は,次の定理によって与えられる. 定理 7.1 関数 f (x) は開区間 I におい微分可能とする.f (x) が x = a ∈ I において極値をとるなら ば f (a) = 0 である. 次に,十分条件を考えてみよう. 定理 7.2 関数 f (x) が開区間 I において2回連続微分可能であるとする.このとき,任意の a ∈ I 対 して f (a) = 0, f (a) < 0 ならば a で極大値をとる. (7.1) f (a) = 0, f (a) > 0 ならば a で極小値をとる. (7.2) (証明) テーラーの定理より,a + ∆x ∈ I なる ∆x = 0 に対して, 1 f (a + ∆x) = f (a) + f (a)∆x + f (a + θ∆x)(∆x)2 2 を満たす θ ∈ (0, 1) が存在する.f (a) = 0 より f (a + ∆x) − f (a) = 1 f (a + θ∆x)(∆x)2 2 定理??より f (x) は I において連続だから,f (a) と f (a + θ∆x) は同符号である.したがって, f (a) < 0 ならば f (x) は a において極大値をとり,f (a) > 0 ならば a において極小値をとる.□ 上の定理では,f (x) = f (x) = 0 となる点で極値をとるのかどうかは判定できない (図 7.1 を参 照せよ).一般に n 回微分可能あるとき,極値の判定を与えるのが次の定理である. 定理 7.3 関数 f (x) が開区間 I において n 回連続微分可能とする.このとき,f (a) = f (a) = · · · = f (n−1) (a) = 0 で,f (n) (a) = 0 であるならば,次が成り立つ. n が偶数で f (n) (a) > 0 ならば,f (x) は x = a で極小値,f (n) (a) < 0 ならば,極大値をとる. n が奇数ならば,x = a で極値をとらない. (証明) テーラーの定理に条件を適用すると,a + ∆x ∈ I なる ∆x = 0 に対して f (a + ∆x) = f (a) + f (n) (a + θ∆x) (∆x)n n! を満たす θ ∈ (0, 1) が存在する.このとき,f (n) (a + θ∆x) は f (n) (a) と同符号をもつ. (i) n が偶数のとき,f (x) − f (a) の符号は f (n) (a + θ∆x),したがって f (n) (a) の符号に一致する. よって f (n) (a) > 0 ならば,f (x) は x = a において極小値をとり,f (n) (a) < 0 ならば極大値をとる. 56 y 極大 どちらでもない 極小 0 x 図 7.1: 極値 (ii) n が奇数のとき,f (x) − f (a) は,f (n) (a + θ∆x) > 0,したがって f (n) (a) > 0 ならば,x − a と同符号をもつので,f (x) は x = a において増加の状態にある.f (n) (a) < 0 ならば,f (x) − f (a) は x − a は異符号をもつので,f (x) は x = a において減少の状態にある.いずれの場合にも,x = a において極値をとらない.□ 7.2 多変数関数の極値問題 まず,必要条件については1変数の場合と同様の条件が成り立つ. 定理 7.4 関数 f (x) が点 a の近傍 U (a) において,すべての i に対して xi で偏微分可能とする.f (x) が a において (狭義の) 極値をとれば,fi (a) = 0, (i = 1, 2, · · · , n). (証明) a の近傍 U (a) で xi で偏微分可能だから,fi (x) をもつ.fi (a1 , · · · ai−1 , xi , ai+1 , · · · , an ) は xi の関数であり,xi = ai で極値をもつから, fi (a) = 0 他の j = i についても同様.□ 次に,定理 7.2 に対応する十分条件を示す. 定理 7.5 関数 f (x) は点 a の近傍 U (a) において2回連続微分可能で,fi (a) = 0 する.このとき f11 (a) f12 (a) H(a) = .. . f1n (a) f12 (a) ··· f1n (a) f22 (a) .. . ··· .. . f2n (a) .. . f2n (a) ··· fnn (a) とおけば, (i) H(a) が正値定符号のとき,f (x) は a で狭義の極小となる. 57 (i = 1, · · · , n) と (ii) H(a) が負値定符号のとき,f (x) は a で狭義の極大となる. (iii) H(a) が不定符号のとき,a において極値をとらない. (証明) m = 2 のとして,テーラー展開を作る.|∆xi | (i = 1, · · · , n) が十分小さいとき,fi (a) = 0 より, 2 1 ∂ ∂ f (a + ∆x) = f (a) + + · · · + ∆xn f (a + θ∆x) ∆x1 2 ∂x1 ∂xn n 1 = f (a) + (∆xi )2 fii (a + θ∆x) + ∆xi ∆xj fij (a + θ∆x) 2 i=1 i>j となる θ ∈ (0, 1) が存在する.ただし,2回連続微分可能だから,fij = fji が成り立つことを用い た.まず (i) を証明しよう.fij (x) は a において連続であるから,∆x が 0 に近い限り, f11 (a + θ∆x) > 0 f (a + θ∆x) f (a + θ∆x) 11 12 f12 (a + θ∆x) f22 (a + θ∆x) ············ f (a + θ∆x) · · · 11 .. .. . . f1n (a + θ∆x) · · · >0 f1n (a + θ∆x) .. . fnn (a + θ∆x) >0 が成り立つ.H(a) は正値定符号であるから,H(a + θ∆x) も正値定符号となる.したがって,ここ で選ばれた ∆x に対しても, n n = ∆xi ∆xj fij (a + θ∆x) i=1 j=1 n (∆xi )2 fii (a + θ∆x) + 2 ∆xi ∆xj fij (a + θ∆x) > 0 i=1 i>j ゆえに f (a + ∆x) > f (a).これは f (a) が狭義の極小値であることを示している. (ii) も同様に証明できる. (iii) H(a) は不定符号だから,y = (y1 , · · · , yn ) とすると, h(y) = = n n yi yj fij (a) i=1 j=1 n yi2 fii (a) + 2 yi yj fij (a) i=1 i>j は,y によって正負が替わる.2点 a, y を結ぶ直線を考える. g(t) = f (a + ty) とおくと, g (0) = g (0) = n yi fi (a) i=1 n n =0 yi yj fij (a) = h(y) i=1 j=1 58 f (x) の 2 回連続微分可能性より,g (t) は t = 0 で連続である.定理 7.2 より,h(y) < 0 なる y に対 しては t = 0 で g(t) は極大,すなわち f (x) は x = a で極大となる.また,h(y) > 0 なる y に対し ては t = 0 で g(t) は極小,すなわち f (x) は x = a で極小となる.□ 練習問題 1.次の関数の極値を求めよ. (1) f (x) = e−x cos x (2) f (x) = x4 − 4x3 + x2 (3) f (x) = x1/x (x > 0) (4) f (x) = |x|ex 2.次の関数の極値を求めよ. (1) f (x1 , x2 ) = x21 − 2x1 x2 + 2x22 (2) f (x1 , x2 ) = (x1 + x2 )(x21 + x22 − 6) (3) f (x1 , x2 ) = ax21 + bx22 + c (4) f (x1 , x2 ) = x31 + x32 − 3(x1 + x2 ) + 1 59 第 8 章 凹関数と凸関数 8.1 凹関数・凸関数の基本的性質 ある凸集合 A ⊂ n で定義され で値をとる関数 f (x) を考えよう.任意の相異なる2点 x,y ∈ A, 任意の実数 α ∈ (0, 1) に対して f (αx + (1 − α)y) ≥ αf (x) + (1 − α)f (y) (8.1) が成り立つとき,f は凹関数 (concave function) であるという.逆に, f (αx + (1 − α)y) ≤ αf (x) + (1 − α)f (y) (8.2) が成り立つとき,f は凸関数 (convex function) であるという. ところで,線形関数 (例えば,直線を表す1次式) は凹関数であり,かつ凸関数でもある.関数が 直線で表されたり,フラットな部分をもつ場合を排除するには,凹関数,凸関数を強めた概念が必要 となる.それらが次のものである.すなわち f (αx + (1 − α)y) > αf (x) + (1 − α)f (y) (8.3) が成り立つとき,f は厳密な凹関数 (strictly concave function) であるという.また, f (αx + (1 − α)y) < αf (x) + (1 − α)f (y) (8.4) が成り立つとき,f は厳密な凸関数 (strictly convex function) であるという.3 節の図 8.2 には 上 の厳密な凹関数の例が,図 8.3 には 上の厳密な凸関数の例が示されている.上に向かって膨らん でいるのが凹関数,下に向かって膨らんでいるのが凸関数である. 任意の生産量の下で限界生産物が正となる生産関数が,厳密な凹関数ならば規模に関して収穫逓 減,厳密な凸関数ならば規模に関して収穫逓増であるといわれる.そして,凹性・凸性は利潤最大化 の 2 階の条件と密接な関連をもつ.凹関数について述べる性質は,符号を替えて凸関数について成り 立つ点に注意しておこう. 定理 8.1 凸集合 A ⊂ n で定義された実数値関数 f が凹関数であるための必要十分条件は,任意の m x1 ,x2 ,· · · , xm ∈ A,および αi ≥ 0 (i = 1, · · · m), αi = 1 を満たす任意の実数 α1 , α2 ,· · · , i=1 αm に対して f m i=1 i αi x ≥ m αi f (xi ) (8.5) i=1 が成り立つことである.凸関数であるための必要十分条件は不等号の向きが逆になる. (証明) 十分性:条件が満たされているとする.α1 > 0,α2 > 0,α1 + α2 = 1 なる α1 , α2 をとれば, f (α1 x1 + α2 x2 ) ≥ α1 f (x1 ) + α2 f (x2 ) 60 よって f は凹関数である. 必要性:f が凹関数であるとする.m = 1 のとき明らかに成り立つ.m = k のとき成り立つとし て,m = k + 1 のときを考える. (α1 , · · · , αk+1 ), αi ≥ 0, k+1 αi = 1 i=1 x1 ,· · · , xk+1 ∈ A を満たすものをとる.αk+1 = 1 とする (αk+1 = 1 なら明らかだから). k+1 i αi x = i=1 k i k+1 αi x + αk+1 x = i=1 k αi y + αk+1 xk+1 i=1 ここで y= k αi xi k i=1 αj j=1 とおいた.f は凹だから f k+1 αi x i k αi f (y) + αk+1 f (xk+1 ) ≥ i=1 i=1 ところで,帰納法の仮定より f (y) ≥ k αi f (xi ) k i=1 αj j=1 が成り立つ.したがって f k+1 αi xi i=1 ≥ k+1 αi f (xi ) □ i=1 定理 8.2 凸集合 A ⊂ n で定義された実数値関数 f が凹 (凸) であるための必要十分条件は,任意 の x1 , x2 ∈ A に対して関数 g を g(α) = f (αx1 + (1 − α)x2 ) (8.6) によって定義したとき,g(α) が [0,1] において凹 (凸) 関数になること,すなわち,任意の実数 β ∈ (0, 1) に対して g(βα1 + (1 − β)α2 ) ≥ βg(α1 ) + (1 − β)g(α2 ) (≤) が成り立つことである. (証明) 十分性:g(α) が [0,1] で凹とする.任意の x1 , x2 ∈ A,α ∈ (0, 1) に対して f (αx1 + (1 − α)x2 ) = g(α) = ≥ g(1 × α + 0 × (1 − α)) αg(1) + (1 − α)g(0) = αf (x1 ) + (1 − α)f (x2 ) 61 したがって,f は凹関数である. 必要性:f は A において凹とする.任意の α1 ,α2 ∈ [0, 1],x1 ,x2 ∈ A をとる.さらに,y 1 ,y 2 を y1 = α1 x1 + (1 − α1 )x2 y2 = α2 x1 + (1 − α2 )x2 によって定義する.A は凸集合だから y 1 ,y 2 ∈ A,および β ∈ (0, 1) を任意にとると,βy 1 +(1−β)y2 ∈ A であり βy 1 + (1 − β)y 2 = βα1 x1 + β(1 − α1 )x2 + (1 − β)α2 x1 + (1 − β)(1 − α)x2 = {βα1 + (1 − β)α2 }x1 + {1 − βα1 − (1 − β)α2 }x2 さらに f (βy 1 + (1 − β)y 2 ) g(βα1 + (1 − β)α2 ) = βf (y 1 ) + (1 − β)f (y 2 ) βg(α1 ) + (1 − β)g(α2 ) ≥ = よって,g は [0,1] において凹関数である.□ 8.2 エピグラフとハイポグラフ 凹関数,凸関数を別の観点から特徴づけてみよう.n の部分集合 A 上で定義された実数値関数 f が与えられたとき,定義域 A と値域 f (A) で作られる n+1 の部分集合 (A, f (A)) が f の凹性,凸性 に対する重要な情報を提供してくれる. 凸集合 A ⊂ n 上で定義された実数値関数 f (x) に対して,n+1 の部分集合 Gf = {(x,y)|y ≥ f (x), x ∈ A} (8.7) を f (x) のエピグラフ (epigraph) という.また,部分集合 Hf = {(x,y)|y ≤ f (x), x ∈ A} (8.8) を f (x) のハイポグラフ (hypograph) という.図 8.1(a),(b) は,n=1 の場合にエピグラフ,ハイポグ ラフがどう描けるかを示している.経済学で登場するエピグラフの例としては,ある消費財バンドル より望ましいか無差別であるようなバンドルの集合を表す上位集合がある.ハイポグラフの例とし ては,生産集合や生産可能性集合がある. 定理 8.3 n の凸部分集合 A 上で定義された実数値関数 f (x) が凸であるための必要十分条件は,Gf が凸集合になることである. (証明) 必要性:f (x) が凸関数であると仮定する. y ≥ f (x ) y ≥ f (x), を満たす異なる2点 (x, y), (x , y ) をとると,Gf の定義より (x, y), (x , y ) ∈ Gf である.f (x) の凸 性より,任意の α ∈ [0, 1] に対して αy + (1 − α)y ≥ αf (x) + (1 − α)f (x ) ≥ f (αx + (1 − α)x ) 62 Gf Hf A A (a) (b) 図 8.1: エピグラフとハイポグラフ よって,(αx + (1 − α)x , αy + (1 − α)y ) ∈ Gf となるから,Gf は凸集合である. 十分性:Gf が凸集合であると仮定する. y = f (x ) y = f (x), を満たす異なる2点 (x, y), (x , y) ∈ Gf をとる.Gf は凸集合だから,任意の α ∈ [0, 1] に対して α(x, y) + (1 − α)(x , y ) ∈ Gf ∴ (αx + (1 − α)x , αy + (1 − α)y ) ∈ Gf したがって,Gf の定義より αf (x) + (1 − α)f (x ) = αy + (1 − α)y ≥ f (αx + (1 − α)x ) となるから,f (x) は凸関数である.□ 定理 8.4 n の凸部分集合 A 上で定義された実数値関数 f (x) が凹であるための必要十分条件は,Hf が凸集合になることである. (証明) 定理 8.3 と全く同様にして証明できる.□ 8.3 1変数関数の凹性・凸性 A ⊂ を凸集合 (つまり区間) とする.A で定義された関数 f (x) を考えよう.f (x) が,凹関数な らば,a < b < c を満たす任意の3点 a, b, c ∈ A をとると, f (c) − f (a) f (c) − f (b) f (b) − f (a) ≥ ≥ b−a c−a c−b (8.9) が成り立つ (図 8.2 参照).これは次のようにして示すことができる.いま b が線分 [a, c] を 1 − α : α に内分している (0 < α < 1) とすると,b = αa + (1 − α)c となる.f (x) は凹関数だから f (b) ≥ αf (a) + (1 − α)f (c) 63 したがって, f (b) − f (a) b−a ≥ αf (a) + (1 − α)f (c) − f (a) αa + (1 − α)c − a = (1 − α){f (c) − f (a)} (1 − α)(c − a) = f (c) − f (b) c−a ≤ = f (c) − f (a) c−a f (c) − αf (a) − (1 − α)f (c) c − αa − (1 − α)c α{f (c) − f (a)} α(c − a) f (c) − f (a) c−a 逆に A に属する任意の3点 a, b, c に対して,a < b < c かつ (8.9) が成り立つならば,f (x) は凹関数 である.これを示すために同様に,b = αa + (1 − α)c とおくと,0 < α < 1 である. = ところで (8.9) より f (b) − f (a) b−a = f (b) − f (a) (1 − α)(c − a) f (c) − f (b) c−b = f (c) − f (b) α(c − a) f (c) − f (b) f (b) − f (a) ≥ (1 − α)(c − a) α(c − a) c > a より α{f (b) − f (a)} ≥ (1 − α){f (c) − f (b)} ∴ f (b) ≥ αf (a) + (1 − α)f (c) ∴ f (αa + (1 − α)c) ≥ αf (a) + (1 − α)f (c) 等号を含んだ不等式を厳密な不等式に置き換えれば,同様の主張を厳密な凹関数に対してなしうる. 以上の結果を定理としてまとめておこう. 定理 8.5 区間 A で定義された関数 f (x) について,次の2つは同値である. i) f (x) は凹関数である. ii) a < b < c を満たす任意の a, b, c ∈ A に対して, f (c) − f (a) f (c) − f (b) f (b) − f (a) ≥ ≥ b−a c−a c−b 厳密な凹関数については,ii) が厳密な不等号として成り立つ. f (x) が (厳密な) 凸関数である場合,定理 8.5 は次のように変更される (図 8.3 参照). 定理 8.6 区間 A で定義された関数 f (x) について,次の2つは同値である. i) f (x) は凸関数である. ii) a < b < c を満たす任意の a, b, c ∈ A に対して f (c) − f (a) f (c) − f (b) f (b) − f (a) ≤ ≤ b−a c−a c−b 厳密な凸関数については,ii) が厳密な不等号として成り立つ. 64 f (x) f (x) 0 b a c x 図 8.2: 凹関数 f (x) f (x) 0 a b 図 8.3: 凸関数 65 c x f (x) f (x) 0 a b x c x 図 8.4: 凹関数の連続性 定理 8.5 において,左端 a を固定してみると,平均変化率が (厳密な) 単調減少であり,左端 c を 固定してみると,平均変化率が (厳密な) 単調減少であることがわかる. 定理 8.7 開区間 A で定義された凹 (凸) 関数は A において連続である. (証明) 任意の a ∈ A をとると,A は開区間であるから,b < a < c なる b, c ∈ A がとれ,また a と 異なる x で b < x < c を満たす A の要素がとれる (図 8.4 参照).定理 8.5 より,x < a のとき f (a) − f (x) f (c) − f (a) f (a) − f (b) ≥ ≥ a−b a−x c−a また x > a のとき f (x) − f (a) f (c) − f (a) f (a) − f (b) ≥ ≥ a−b x−a c−a & % f (b) − f (a) f (c) − f (a) , とおけば, したがって,M = max b−a c−a f (x) − f (a) x−a ≤M が成り立つ1 .M は有限の値だから |f (x) − f (a)| ≤ M |x − a| において x → a とすれば f (x) → f (a) となる.よって,f (x) は x = a において連続である.□ 8.4 微分可能な凹関数・凸関数 次に,凹関数 f (x) が開区間 A において微分可能とする.凹関数の定義 (1) を書き換えると,任意 の相異なる2点 a, x ∈ A,任意の α ∈ (0, 1) に対して, f (αx + (1 − α)a) − f (a) ≥ f (x) − f (a) α 1 任意の 3 つの実数 a, b, c に対して,a ≤ b ≤ c ならば |b| ≤ max{|a|, |c|} 66 (8.10) f (x) f (x) y = f (a) + f (a)(x − a) f (x) f (x) 0 x 0 x (b) (a) 図 8.5: 微分可能な凹関数・凸関数 αx + (1 − α)a = a + α(x − a) であるから, (x − a) f (a + α(x − a)) − f (a) ≥ f (x) − f (a) α(x − a) ここで α → 0 とすると,f (x) の微分可能性より lim α→0 f (a + α(x − a)) − f (a) = f (a) α(x − a) が成り立つので, (x − a)f (a) ≥ f (x) − f (a) ∴ f (x) ≤ f (a) + (x − a)f (a) (8.11) ところで,点 (a, f (a)) における接線の方程式は y = f (a) + (x − a)f (a) (8.12) であったから,(8.11) より f (x) が凹関数であることは,f のグラフが接線の下側に位置することを 意味している.一方,f (x) が凸関数ならば,f のグラフは任意の点の接線の上側に位置することに なる.図 8.5(a),(b) を参照せよ. 定理 8.8 閉区間 A = [a, b] で連続,その内部 (a, b) で2回微分可能な関数 f (x) が A において凹関数 になるための必要十分条件は,A の内部で f (x) ≤ 0 となることである. (証明) 必要性:a < x1 < x2 < x3 < b を満たす x1 , x2 , x3 ∈ A をとる.定理 8.5 より, f (x3 ) − f (x2 ) f (x2 ) − f (x1 ) ≥ x2 − x1 x3 − x2 (8.13) である.また平均値の定理より f (x2 ) − f (x1 ) = f (y1 ), x2 − x1 f (x3 ) − f (x2 ) = f (y2 ) x3 − x2 67 (8.14) を満たす y1 ∈ (x1 , x2 ),y2 ∈ (x2 , x3 ) が存在する.仮定より y1 < y2 であるから,(8.13) より f (y1 ) ≥ f (y2 ) となる.したがって,f (x) は (a, b) において単調減少関数である.また f (x) は微 分可能だから,定理??より f (x) ≤ 0. 十分性:(a, b) の各点において f (x) ≤ 0 であるとする.[a, b] に属し,x1 < x2 < x3 を満たす任 意の3点をとる.平均値の定理より f (x2 ) − f (x1 ) = f (y1 ), x2 − x1 f (x3 ) − f (x2 ) = f (y2 ) x3 − x2 (8.15) となる y1 ∈ (x1 , x2 ),y2 ∈ (x2 , x3 ) が存在する.y1 < y2 であり,また任意の x ∈ (a, b) に対して f (x) ≤ 0 であるから,f (y1 ) ≥ f (y2 ).したがって f (x3 ) − f (x2 ) f (x2 ) − f (x1 ) ≥ x2 − x1 x3 − x2 f (x) ≤ 0 を考慮すると, f (x2 ) − f (x1 ) f (x3 ) − f (x1 ) f (x3 ) − f (x2 ) ≥ ≥ x2 − x1 x3 − x1 x3 − x2 ゆえに定理 8.5 より,f は (a, b) において凹関数.□ 定理 8.9 閉区間 A で連続,その内部で2回微分可能な関数 f (x) が A において凸関数になるための 必要十分条件は,A の内部で f (x) ≥ 0 となることである. 厳密な凹性 (凸性) の場合には,定理 8.8 は次のように修正されなければならない. 定理 8.10 関数 f (x) が閉区間 A = [a, b] で連続で,その内部 (a, b) で2回微分可能であるとする. f (x) が A において厳密な凹関数ならば,(a, b) に属する任意の x に対して,f (x) ≤ 0.(a, b) に属 する任意の x に対して f (x) < 0 ならば厳密な凹関数である. 必要条件が f (x) ≤ 0 であって f (x) < 0 でない点に注意せよ.f (x) が区間 (a, b) において厳密 な単調減少関数であることは,定理 8.3 の証明をたどれば明らかだが,それだけでは f (x) < 0 が保 証されないのである.任意にとられた x に対して ∆x > 0 を十分小さくとれば,x + ∆x ∈ (a, b) で あり,f (x + ∆x) − f (x) < 0 となる.ところが極限をとると f (x + ∆x) − f (x) ≤0 ∆x→0 ∆x f (x) = lim となって,等号の可能性が排除できないのである. 関数 f (x) が x = a の近傍で2回微分可能であるとすると,テーラーの定理より |∆x| が十分小さ い ∆x に対し, 1 f (a + ∆x) = f (a) + f (a)∆x + f (a + θ∆x)(∆x)2 2 となる θ ∈ (0, 1) が存在する.x = a において極値をとるなら f (a) = 0 である. また,連続性の仮定より,x = a の近傍で f (x) < 0 0 (f (x) > 0) ならば f (a + θ∆x) < (f (a + θ∆x) > 0) である.そのとき f (a + ∆x) < f (a) (f (a + ∆x) > f (a)) が成り立つ.したがって,関数 f (x) が x = a において極大値をとるならば,a の近くで凹関数になっ ており,x = a において極小値をとるならば,a の近くで f (x) は凸関数になっているといえる.(狭 義の極値と厳密な凹性・凸性についても同様のことがいえる.) 68 8.5 多変数関数の凹性・凸性 1 変数で成立した定理 8.5∼8.10 は,多変数の場合,どのように修正されるであろうか. 定理 8.11 開凸集合 A ⊂ n で定義された凹 (凸) 関数 f (x) は,A において連続である. (証明) 任意の a ∈ A をとると,A は開凸集合だから, a = αx1 + (1 − α)x2 を満たす x1 , x2 ∈ A,および α ∈ (0, 1) が存在する.ここで f (a) = f (αx1 + (1 − α)x2 ) = g(α) とおく.さらに,β < α < γ を満たす β, γ ∈ (0, 1) がとれて,x1 , x2 を結ぶ線分上に βx1 + (1 − β)x2 , γx1 + (1 − γ)x2 は存在する.したがって f (βx1 + (1 − β)x2 ) = g(β), f (γx1 + (1 − γ)x2 ) = g(γ) である.定理 8.2 より,g は [0,1] で凹関数であるから,定理 8.7 を用いると,g が α において連続で あること,すなわち f (x) が任意の a において連続であることが示せる.凸関数の場合も同様である. □ この定理は,定理 8.7 を利用することにより,定理 8.5,8.6 が多変数の場合にも成立することから も証明できる. 凹関数 f (x) が開凸集合 A ⊂ n で全微分可能とする.定義 (8.1) より,任意の相異なる2点 x, a ∈ A, 任意の α ∈ (0, 1) に対し f (a + α(x − a)) − f (a) ≥ f (x) − f (a) α (8.16) g(α) ≡ f (a + α(x − a)) とおくと,f (x) は全微分可能だから,g(α) は区間 (0,1) で微分可能で, g(0) = f (a),g(1) = f (x) が成り立っている.書き換えると g(α) − g(0) ≥ g(1) − g(0) = f (x) − f (a) α α → 0+ とすると,定理??より左辺は g+ (0) = n ∂f i=1 したがって凹関数ならば ∂xi n i=1 n (a) dxi ∂f (0) = (xi − ai ) (a) dα ∂x i i=1 (xi − ai ) (8.17) ∂f (a) ≥ f (x) − f (a) ∂xi ゆえに f (x) ≤ f (a) + n (xi − ai ) i=1 69 ∂f (a) ∂xi (8.18) 点 (a, f (a)) における接超平面の方程式は y = f (a) + n (xi − ai ) i=1 ∂f (a) ∂xi (8.19) であったから,(8.18) より f (x) が凹関数であるならば,接超平面の下側に位置することになる. 一方,f (x) が凸関数ならば f (x) ≥ f (a) + n (xi − ai ) i=1 ∂f (a) ∂xi (8.20) が成り立ち,接超平面の上側に位置することになる. 以上の逆も成立する.もし定義域 A の各点aにおいて (8.18) が成り立っているならば,換言する と任意の (a, f (a)) において f (x) の曲面がその点での接平面よりも下方にあるならば凹関数になる. また (8.20) より,上方にあるならば凸関数になる.したがって (8.18) は f (x) が凹関数であることと 同値,(8.20) は f (x) が凸関数であることと同値になる.a 点における勾配ベクトルを ∂f ∂f ∂f ∇f (a) = (a), (a), · · · , (a) ∂x1 ∂x2 ∂xn によって定義する.∇f (a) を用いて書き換えると,(8.18) は f (x) ≤ f (a) + ∇f (a)(x − a) (8.21) f (x) ≥ f (a) + ∇f (a)(x − a) (8.22) となる.一方,(8.20) は となる.(8.21)(あるいは (8.18)) を用いて,凹関数のケースを証明しておく. x, a ∈ A,0 < α < 1 とすると,A は凸集合だから, αx + (1 − α)a ∈ A である.そのとき (8.21) より, f (x) ≤ f (αx + (1 − α)a) + (1 − α)∇f (αx + (1 − α)a)(x − a) (8.23) f (a) ≤ f (αx + (1 − α)a) − α∇f (αx + (1 − α)a)(x − a) (8.24) (8.23) の両辺に α をかけ,(8.24) の両辺に (1 − α) をかけ辺々を加えると, αf (x) + (1 − α)f (a) ≤ f (αx + (1 − α)a) よって f (x) は凹関数である. 以上の内容を定理として述べておこう (図 8.5(a),(b) を参照せよ). 定理 8.12 開凸集合 A ⊂ n 上で定義された実数値関数 f (x) が A において全微分可能であるとす る.このとき,f (x) が A 上で凹関数であるための必要十分条件は,任意の x, a ∈ A に対して, f (x) ≤ f (a) + ∇f (a)(x − a) が成り立つことである.また,凸関数であるための必要十分条件は,逆の不等号が成立することで ある. 70 この定理は,厳密な凹 (凸) 関数に対して,容易に拡張することができる.証明は定理 8.12 とほと んど同じである. 定理 8.13 開凸集合 A ⊂ n 上で定義された実数値関数 f (x) が A において全微分可能であるとす る.このとき,f (x) が A 上で厳密な凹関数となるための必要十分条件は,任意の異なる x, a ∈ A に 対して, f (x) < f (a) + ∇f (a)(x − a) (8.25) が成り立つことである.また,凸関数であるための必要十分条件は,逆の厳密な不等号が成立するこ とである. 次に,2階偏導関数を用いた凹関数,凸関数の特徴づけについて述べよう. 定理 8.14 関数 f(x) は開凸集合 A ⊂ n 上で2回連続微分可能であるとする.このとき f (x) が A において凹 (凸) 関数になっていることと,ヘッセ行列 f11 (x) f12 (x) f12 (x) f22 (x) H(x) = .. .. . . f1n (x) ··· ··· .. . f2n (x) · · · f1n (x) f2n (x) .. . fnn (x) が A の各点で半負値 (半正値) 定符号になることは同値である. (証明) 任意の a ∈ A をとり,固定する.a と異なる x ∈ A を任意にとったとき,f (x) が凹であるな らば,a と x を結んだ線分上の任意の点に関して,1 変数のケースで示した定理が満たされているは ずである.このような点は α ∈ (0, 1) として,αx + (1 − α)a と表される. f (αx + (1 − α)a) ≡ g(α) とおくと,定理 8.8 より g(α) が (0,1) で,すなわち f (x) が A で凹となるための必要十分条件は任意 の α ∈ (0, 1) に対して g (α) ≤ 0 が成り立つことである. g (α) = n n fij (αx + (1 − α)a)(xi − ai )(xj − aj ) ≤ 0 (8.26) i=1 i=1 これがすべての a, x ∈ A について成り立つので,任意の x ∈ A,任意の ∆x = (∆x1 , · · · , ∆xn ) = 0 に対して n n fij (x)∆xi ∆xj ≤ 0 i=1 i=1 ところで,f (x) は2回連続微分可能だから,fij = fji .したがってより f11 (x) f12 (x) · · · f1n (x) f12 (x) f22 (x) · · · f2n (x) H(x) = .. .. .. .. . . . . f1n (x) f2n (x) · · · fnn (x) が半負値定符号となる.凸関数の場合も同様.□ 厳密な凹 (凸) 性の場合に,単純な必要十分が成り立たないのは,1 変数のケースと同様である.多 変数のケースでどのような条件となるかは,各自確認してほしい.すなわち, H が負値定符号 71 → 厳密な凹 8.6 極大・最大と凹関数 これまで述べてきたことから明かだが,a で極大値をとるならば f (x) は a の近くで凹関数,a で 極小値をとるならば f (x) は a の近くで凸関数になっている点に注意しよう.ところで,経済学では 極大値 (極小値) よりも最大値 (最小値) に関心がある.次の定理は極大値が最大値に,極小値が最小 値になるための1つの条件が,関数の凹性・凸性であることを物語っている. 定理 8.15 凸集合 A ⊂ n で定義された凹関数 f (x) が x∗ において極大値をとるならば,f (x) は x∗ で最大値をとる. (証明) 背理法を用いて証明する.f (x) は x∗ において極大値をとるが,f (x∗ ) が最大値でないと仮 定する.このとき f (x0 ) > f (x∗ ) を満たす x0 ∈ A が存在する.f (x) は凹関数であるから,任意の α ∈ (0, 1) に対して f (αx0 + (1 − α)x∗ ) ≥ αf (x0 ) + (1 − α)f (x∗ ) > f (x∗ ) (8.27) が成り立つ.ここで α を 0 に十分近くとると,(8.27) は x∗ の任意の近傍に f (x) > f (x∗ ) を満たす x が存在することを含意する.これは f (x) が x∗ において極大値をとることに矛盾する. □ 定理 8.16 凸集合 A ⊂ n で定義された凸関数 f (x) が x∗ において極小値をとるならば,f (x) は x∗ で最小値をとる. 定理 8.15,8.16 は,狭義の極大値 (極小値) と狭義の最大値 (最小値) の関係として述べ直すことが できる.すなわち定理において,凹関数を厳密な凹関数に,凸関数を厳密な凸関数に置き換えればよ い.ただし,このような操作の結果,定理 8.15,8.16 は最大値や最小値の一意性を含意することに なる. 8.7 準凹関数・準凸関数 凸集合 A ⊂ n 上で定義された実数値関数 f が任意の2点 x, y ∈ A,任意の α ∈ (0, 1) に対して, f (x) ≥ f (y) =⇒ f (αx + (1 − α)y) ≥ f (y) (8.28) が成り立つとき,f は準凹関数 (quasi-concave function) であるという.また f (x) ≥ f (y) =⇒ f (αx + (1 − α)y) ≤ f (x) (8.29) が成り立つとき,f は準凸関数 (quasi-convex function) であるという.図 8.6 には準凹関数の例が示 されている.(a) では厚みをもつ無差別曲線,(b) では原点方向へ移動するほど高い選好に対応する ような無差別曲線が出現している. 72 x2 x2 x1 0 x1 0 (a) (b) 図 8.6: 準凹関数 このような状況を排除するためには,さらに条件を強める必要がある.準凹関数,準凸関数を強 めた概念が,次の2つである.凸集合 A ⊂ n 上で定義された実数値関数 f が任意の異なる2点 x, y ∈ A,任意の α ∈ (0, 1) に対して f (x) ≥ f (y) =⇒ f (αx + (1 − α)y) > f (y) (8.30) が成り立つとき,f は厳密な準凹関数 (strictly quasi-concave function) という.また, f (x) ≥ f (y) =⇒ f (αx + (1 − α)y) < f (x) (8.31) が成り立つとき,f は厳密な準凸関数 (strictly quasi-convex function) であるという. 定理 8.17 凸集合 A ⊂ n 上で定義された実数値関数 f に対して Aµ = {x ∈ A|f (x) ≥ µ} A−1 µ = {x ∈ A|f (x) ≤ µ} とする.このとき, f が A 上で準凹 ⇐⇒ 任意の µ ∈ に対して,Aµ が凸集合 f が A 上で準凸 ⇐⇒ 任意の µ ∈ に対して,A−1 µ が凸集合 が成り立つ. (証明) 準凹関数についてのみ証明する. 必要性:f が A 上で準凹とする.任意の実数 µ をとる.Aµ が空集合ならばそれは凸集合だから証了. そこで A は非空とする.Aµ に属する任意の2点 x, y をとる.一般性を損なうことなく f (x) ≥ f (y) と仮定してよい.x, y ∈ Aµ より f (x) ≥ f (y) ≥ µ である.f は A 上の準凹関数だから,任意の α ∈ (0, 1) に対して f (αx + (1 − α)y) ≥ f (y) ≥ µ となり,αx + (1 − α)y ∈ Aµ ,また x, y ∈ Aµ であったから αx + (1 − α)y ∈ Aµ , 0 ≤ α ≤ 1. 73 すなわち,Aµ は凸集合である. 十分性:任意の x, y ∈ A をとる.一般性を損なうことなく,f (x) ≥ f (y) = µ と仮定できる. 0 < α < 1 に対し,Aµ が凸集合であることから,αx + (1 − α)y ∈ Aµ .したがって f (αx + (1 − α)y) ≥ µ = f (y) ゆえに,f は準凹関数である.□ 容易に確認できるように,凹関数は準凹関数であり,凸関数は準凸関数である. 次の定理は,極大値 (極小値) と最大値 (最小値) の関係を述べたものである.凹関数,凸関数と同 様の主張が成立する点に注意しよう. 定理 8.18 開凸集合 A ⊂ n で定義された厳密な準凹関数 f (x) が x∗ において極大値をとるならば, f (x) は x∗ で最大値をとる. (証明) 背理法を用いて証明する.f (x) は x∗ において極大値をとるが,f (x∗ ) が最大値でないと仮定 する.このとき f (x0 ) > f (x∗ ) を満たす x0 ∈ A が存在する.f (x) は厳密な準凹関数であるから,任意の α ∈ (0, 1) に対して f (αx0 + (1 − α)x∗ ) > f (x∗ ) が成り立つ.ここで α を 0 に十分近くとると,x∗ の近傍に f (x) > f (x∗ ) を満たす x が存在することになる.これは f (x) が x∗ において極大値をとることに矛盾する.□ 定理 8.19 開凸集合 A ⊂ n で定義された厳密な準凸関数 f (x) が x∗ において極小値をとるならば, f (x) は x∗ で最小値をとる. 定理 8.18,8.19 は,凹関数・凸関数とは異なり,広義の極大と広義の最大値,広義の極小値と広 義の最小値の関係として述べ直すことはできない.この点については,厚みをもつ無差別曲線を思い 出してもらえばよい. 次に,f は開凸集合 A ⊂ n 上で定義された実数値関数で,A において全微分可能であると仮定す る.前節と同様に,任意の2点 x, a ∈ A,α ∈ [0, 1] に対して g(α) ≡ f (αx + (1 − α)a) と定義する.g(0) = f (a),g(1) = f (x) である.g(α) は [0,1] 上で微分可能である.f が準凹関数な らば,f (x) ≥ f (a), α = 0 として f (αx + (1 − α)a) − f (a) g(α) − g(0) = ≥0 α α α → 0+ とすれば,g は微分可能だから g+ (0) = n ∂f ∂xi i=1 (a) 74 dxi (0) ≥ 0 dα dxi (0) = xi − ai dα (i = 1, 2, · · · , n) より n (xi − ai ) i=1 ∂f (a) ≥ 0 ∂xi (8.32) あるいは勾配ベクトルを用いて ∇f (a)(x − a) ≥ 0 (8.33) と書ける. 同様に,f が準凸関数ならば,f (a) ≥ f (x), α = 0 として n (xi − ai ) i=1 ∂f (a) ≤ 0 ∂xi (8.34) あるいは勾配ベクトルを用いて ∇f (a)(x − a) ≤ 0 (8.35) と書ける. 逆に,f (x) ≥ f (a) のとき (8.32) あるいは (8.33) が成り立っているならば,f (x) は準凹関数にな ること,また f (x) ≤ f (a) のとき (8.34) あるいは (8.35) が成り立っているならば, f (x) は準凸関数 になることが示せる. 証明には背理法を用いる.そこで (8.30) が成り立っているとする.このとき,f (x) が準凹関数で ないとすると f (y 0 ) < f (a) (8.36) y 0 = αx + (1 − α)a, 0 < α < 1 (8.37) を満たす y 0 が存在する.このような点の集合を B とする. 任意の y ∈ B に対して,f (y) < f (a) ≤ f (x) が成り立つから,(8.33) が満たされるという仮定に より, ∇f (y)(a − y) ≥ 0 ∇f (y)(x − y) ≥ 0 ある α ∈ (0, 1) に対して y = α x + (1 − α )a だから,上式を書き換えると −α ∇f (y)(x − a) ≥ 0 (1 − α )∇f (y)(x − a) ≥ 0 したがって ∇f (y)(x − a) = 0 (8.38) となる. ところで,f は A 上で全微分可能だから連続である.よって,y 0 と a を結んだ線分上に,f (x0 ) = f (a) を満たす x0 が存在する.すなわち, x0 = βy 0 + (1 − β)a,0 ≤ β < 1 75 x0 と y 0 について,平均値の定理を適用すれば f (x0 ) − f (y 0 ) = ∇f (z)(x0 − y 0 ) (8.39) となる z = γx0 + (1 − γ)y 0 ,0 < γ < 1 が存在する.明らかに z ∈ B である.(8.36),(8.37) より < f (x0 ) − f (y 0 ) = ∇f (z)(x0 − y 0 ) 0 = (1 − β)∇f (z)(a − y 0 ) = −α(1 − β)∇f (z)(x − a) 0 < α < 1,0 ≤ β < 1 より ∇f (z)(x − a) < 0 (8.40) z ∈ B より,これは (8.38) に矛盾する.□ 以上を定理として述べておこう. 定理 8.20 開凸集合 A ⊂ n で定義された厳密な準凹関数 f (x) が A において全微分可能であるな らば,f (x) ≥ f (a) のとき, n (xi − ai ) i=1 ∂f (a) ≥ 0 ∂xi あるいは勾配ベクトルを用いて ∇f (a)(x − a) ≥ 0 定理 8.21 開凸集合 A ⊂ n で定義された厳密な準凸関数 f (x) が A において全微分可能であるな らば,f (a) ≥ f (x) のとき, n i=1 (xi − ai ) ∂f (a) ≤ 0 ∂xi あるいは勾配ベクトルを用いて ∇f (a)(x − a) ≤ 0 (8.41) 図 8.7(a),(b) には準凹関数の例が示されている.(a) で示された関数は x が大きくなるにつれて f の値が大きくなり,(b) で示された関数は x の値が小さくなるにつれて f の値が大きくなるような 関数である.(a) の例としては f (x1 , x2 ) = x21 x22 , (b) の例としては f (x1 , x2 ) = 25 − x21 − x22 がある (ただし,両者とも定義域は x1 > 0,x2 > 0 である). また,図 8.8(a),(b) には準凸関数の例が示されている.(a) で示された関数は x が小さくなるに つれて f の値が大きくなり,(b) で示された関数は x の値が大きくなるにつれて f の値が大きくなる ような関数である.(a) の例としては f (x1 , x2 ) = 100 − x21 x22 , (b) の例としては f (x1 , x2 ) = x21 + x22 がある (ただし,両者とも定義域は x1 > 0,x2 > 0 である). 開凸集合 A で定義された実数値関数 f が全微分可能であるとき,厳密な準凹,準凸は次のように 書き換えられる.すなわち,任意の異なる x, a ∈ A に対して f (x) ≥ f (a) =⇒ ∇f (a)(x − a) > 0 76 (8.42) x2 x2 x ∇f (a) ∇f (a) x a x1 0 a x1 0 (a) (b) 図 8.7: 微分可能な準凹関数 x2 x2 ∇f (a) x x a a ∇f (a) x1 0 x1 0 (a) (b) 図 8.8: 微分可能な準凸関数 77 が成り立つとき,f は厳密な準凹関数であり, f (a) ≥ f (x) =⇒ ∇f (a)(x − a) < 0 (8.43) が成り立つとき,f は厳密な準凸関数である. 練習問題 1.次の関数は凹関数か凸関数か,あるいはそのいずれでもないか.判定せよ. (1) f (x) = |x − 1| (2) f (x) = x2 + |x + 2| (3) f (x) = x3 − |x − 1| (4) f (x) = x4 + x2 + 1 2.定理 8.13 を証明せよ. 3.定理 8.15(定理 8.16) において厳密な凹関数 (厳密な凸関数) に替えれば,最大値 (最小値) は一意 である.これを証明せよ. 4.定理 8.18(定理 8.19) において厳密な準凹関数 (厳密な準凸関数) に替えれば,最大値 (最小値) は 一意である.これを証明せよ. 5.凹関数は準凹関数,凸関数は準凸関数である.これを証明せよ. 6.準凹関数 (準凸関数) は必ずしも凹関数 (凸関数) ではない.その例を挙げよ. 7.凹関数 (準凹関数) が最大値をとるならば,それを与える点の集合は凸集合である.これを証明 せよ. 78 第 9 章 制約条件付き極値問題 経済学に登場する多くの問題は,条件付き最大化問題として定式化することができる.ここでは,そ のような問題の解法としてしばしば利用されるラグランジュ未定乗数法について説明する. 9.1 条件付き極値の必要条件 まず,次のような2変数1制約の極大化問題を考えてみよう. max f (x1 , x2 ) x1 ,x2 s.t. g(x1 , x2 ) = 0 ただし,f, g はともに連続微分可能であると仮定する.また,内点 x∗ において極大値をとるとする. x∗ の近くの点で制約 g(x1 , x2 ) = 0 を満たす点を x∗ + dx = (x∗1 + dx1 , x∗2 + dx2 ) = x∗ とすれば g1 (x∗ )dx1 + g2 (x∗ )dx2 = 0 (9.1) を満たす.f (x) は x∗ において極大値をとるから,このような任意の dx = 0 に対して f1 (x∗ )dx1 + f2 (x∗ )dx2 = 0 (9.2) が成り立たなければならない.このことは,図 9.1 の x のような点を考えてみれば明らかだろう.す なわち,x では (9.2) において x∗ を x に代えた式が成り立たないため,より大きな f (x) の値を与 える点が存在するからである. そこで,∇g(x∗ ) = (g1 (x∗ ), g2 (x∗ )) = 0 と仮定すると,(9.1) と (9.2) は ∇g(x∗ ), ∇f (x∗ ) = (f1 (x∗ ), f2 (x∗ )) が dx と直行することを意味している.したがって,ある実数 λ∗ に対して ∇f (x∗ ) = −λ∗ ∇g(x∗ ) (9.3) あるいは f1 (x∗ ) = −λ∗ g1 (x∗ ), f2 (x∗ ) = −λ∗ g2 (x∗ ) (9.4) が成り立つ.これが,制約 g(x) = 0 の下で f (x) が x∗ において極大値をとるための必要条件である. 条件 (9.3) あるいは (9.4) は次のようなラグランジュ関数を作ることによって導くことができる. L(x, λ) = f (x) + λg(x) (9.5) この関数の x1 , x2 , λ に関する偏導関数を求め,x∗1 , x∗2 ならびに (9.3) あるいは (9.4) を満たす λ∗ を代 入すれば, ∂ L(x∗ , λ∗ ) = fi (x∗ ) + λ∗ gi (x∗ ) = 0 (i = 1, 2) ∂xi ∂ L(x∗ , λ∗ ) = g(x∗ ) = 0 ∂λ が成り立つ.最後の式は確かに制約が満たされていることを示している.この方法の一般化として, 次の定理を証明することができる. 79 x2 ∇f (x∗ ) dx x x∗ ∇f (x∗∗ ) ∇g(x∗ ) x∗∗ ∇g(x∗∗ ) x1 0 g(x) 図 9.1: 条件付き極値 定理 9.1 n 変数実数値関数 f, g 1 , g 2 , · · · , g m (1 ≤ m < n) が x∗ = (x∗1 , x∗2 , · · · , x∗n ) のある近傍で 連続微分可能で,かつ 1 ∗ g1 (x ) g21 (x∗ ) · · · 2 ∗ g1 (x ) g22 (x∗ ) · · · .. .. .. . . . g m (x∗ ) g m (x∗ ) · · · 1 2 1 gm (x∗ ) 2 gm (x∗ ) = 0 .. . m ∗ g (x ) (9.6) m とする1 .このとき問題 max f (x) x ( あるいは min f (x)) x s.t. g j (x) = 0 (j = 1, 2, · · · , m) が内点解 x∗ をもつとすれば,m 個の独立変数 λ = (λ1 , λ2 , · · · , λm ) を新たに導入して,関数 L(x, λ1 , λ2 , · · · , λm ) = L(x, λ) = f (x) + m λj g j (x) (9.7) j=1 を作ると,ある λ∗ = (λ∗1 , λ∗2 , · · · , λ∗m ) に対して ∂ L(x∗ , λ∗ ) = 0 ∂xi ∂ L(x∗ , λ∗ ) = 0 ∂λj (i = 1, 2, · · · , n) (9.8) (j = 1, 2, · · · , m) (9.9) が成り立つ. 1 この仮定は,行列 “ ” G = gij (x∗ ) のランクが m であるという条件に緩めることができる.定理 9.4 の条件でも同様で ある. 80 (証明) m = 2 の場合で証明を与える.このとき (9.6) は g 1 (x∗ ) g 1 (x∗ ) 1 2 2 ∗ = 0 g1 (x ) g22 (x∗ ) (9.10) となる.g1 , g2 は x∗ の近傍で連続微分可能だから2つの連続微分可能な関数 h1 , h2 が一意に定まり, x∗j = hj (x∗3 , · · · , x∗n ) (j = 1, 2) (9.11) かつ,(x∗3 , · · · , x∗n ) の近傍で恒等的に g j (h1 (x3 , · · · , xn ), h2 (x3 , · · · , xn ), x3 , · · · , xn ) = 0 (j = 1, 2) が成り立つ.そして g1 g1 2 h1k = − k2 gk g22 g1 1 ÷ 2 g1 g21 , g22 ところで xj = hj (x3 , · · · , xn ) g1 h2k = − 12 g1 gk1 g11 ÷ gk2 g12 g21 g22 (k = 3, · · · , n) (9.12) (9.13) (j = 1, 2) だから,f (x) が条件 g j (x) = 0 (j = 1, 2) の下で x∗ において極大値をとることと, f (h1 (x3 , · · · , xn ), h2 (x3 , · · · , xn ), x3 , · · · , xn ) (9.14) が (x∗3 , · · · , x∗n ) において極大値をとることは同値になる.したがって,(9.14) を xk (k = 3, · · · , n) で偏微分し,(x3 , · · · , xn ) = (x∗3 , · · · , x∗n ) を代入すれば f1 (x∗ )h1k (x∗3 , · · · , x∗n ) + f2 (x∗ )h2k (x∗3 , · · · , x∗n ) + fk (x∗ ) = 0 (k = 3, · · · , n) (9.15) を得る.ところで (9.13) を x = x∗ で評価すると g11 (x∗ )h1k (x∗3 , · · · , x∗n ) + g21 (x∗ )h2k (x∗3 , · · · , x∗n ) + gk1 (x∗ ) = 0 g12 (x∗ )h1k (x∗3 , · · · , x∗n ) + g22 (x∗ )h2k (x∗3 , · · · , x∗n ) + gk2 (x∗ ) = 0 (k = 3, · · · , n) (9.16) (9.17) が成り立つ.(9.10) より λ1 , λ2 に関する連立方程式 g 1 (x∗ )λ + g 2 (x∗ )λ = −f (x∗ ) 1 2 1 1 1 g 1 (x∗ )λ + g 2 (x∗ )λ = −f (x∗ ) 2 1 2 2 2 は解をもつ.その解を λ∗1 , λ∗2 とおく.ここで (9.16)×λ∗1 +(9.17)×λ∗2 を作ると (λ∗1 g11 + λ∗2 g12 )h1k + (λ∗1 g21 + λ2∗ g22 )h2k + λ∗1 gk1 + λ∗2 gk2 = 0 これを (9.15) と比較すれば,(9.18) を満たす解 λ∗1 , λ∗2 に対して λ∗1 gk1 (x∗ ) + λ∗2 gk2 (x∗ ) = −fk (x∗ ) (k = 3, · · · , n) が成り立たなければならない.よって,関数 L(x, λ1 , λ2 ) = f (x) + λ1 g 1 (x) + λ2 g 2 (x) を作ったとき,(9.8),(9.9) が成り立つ. □ 81 (9.18) この定理より,内点解を仮定した場合,条件付き極大値 (あるいは極小値) の候補者を求めるため には,(9.7) 式を作って,連立方程式 ∂ L(x, λ) = 0 (i = 1, 2, · · · , n) ∂xi ∂ (x, λ) = 0 ∂λj (j = 1, 2, · · · , m) を x1 , x2 , · · · , xn , λ1 , · · · , λm について解けばよい.このように,新たな独立変数を導入して条件付 き極値問題を解く方法をラグランジュ未定乗数法といい,λj をラグランジュ乗数という. ここで,ラグランジュ乗数の意味を考えるために,次のような2変数,2制約式の極大化問題を考 える. max f (x) x1 ,x2 s.t. g1 (x) = a1 , g2 (x) = a2 ここで,定理 9.1 の条件はすべて満たされていると仮定する.x∗ において極大値が与えられるとし, 対応するラグランジュ乗数の値を λ∗1 , λ∗2 とすれば f (x∗ ) − λ∗ g 1 (x∗ ) − λ∗ g 2 (x∗ ) = 0 1 1 1 2 1 f (x∗ ) − λ∗ g 1 (x∗ ) − λ∗ g 2 (x∗ ) = 0 2 1 2 2 2 が成り立つ.f は x∗ の近傍で連続微分可能だから全微分可能である.f の x∗ における全微分を作 り (9.19), (9.19) を考慮すれば, df (x∗ ) = = f1 (x∗ )dx1 + f2 (x∗ )dx2 λ∗1 {g11 (x∗ )dx1 + g21 (x∗ )dx2 } + λ∗2 {g12 (x∗ )dx1 + g22 (x∗ )dx2 } また制約式の全微分をとると da = g 1 (x∗ )dx + g 1 (x∗ )dx 1 1 2 1 2 da = g 2 (x∗ )dx + g 2 (x∗ )dx 2 1 1 2 (9.19) (9.20) 2 これを (9.19) に代入すると df (x∗ ) = λ∗1 da1 + λ∗2 da2 を得る.極大値 f (x∗ ) を a1 , a2 の関数と見れば ∂ f (x∗ ) = λ∗1 , ∂a1 ∂ f (x∗ ) = λ∗2 ∂a2 と書いてよいだろう.すなわち,ラグランジュ乗数は対応する制約式の値 aj (j = 1, 2) が変化したと きの,極大値 f (x∗ ) の変化率になっている.このことから,ラグランジュ乗数はしばしば制約式の 影の価格 (shadow price) とか潜在価値とかいわれる. 9.2 条件付き極値の十分条件 定理 9.1 では,極値の候補がラグランジュ未定乗数法によって求められることを示した.そこで導 かれた条件は必要条件であって,それだけでは極大値なのか極小値なのか,あるいはそのいずれでも ないのかを判定することはできない.ここでは,極大値 (極小値) のための十分条件を考えてみよう. まず,1つの十分条件を示す.それは,ある (x∗ , λ∗ ) がラグランジュ関数 L(x, λ) の鞍点 (saddle point) になっているとき,x∗ が条件つき極大値であることを示している. 82 定理 9.2 n 変数関数 f (x), g j (x) (j = 1, 2, · · · , m) が与えられたとする.極大化問題 maxf (x) x s.t. g j (x) = 0 (j = 1, 2, · · · , m) に対してラグランジュ関数 L(x, λ) = f (x) + m λj g j (x) j=1 を作ったとき,ある x∗ , λ∗ に対して L(x∗ , λ) ≥ L(x∗ , λ∗ ) ≥ L(x, λ∗ ) (9.21) が成り立つとき,x∗ は極大化問題の解である. (証明) L(x∗ , λ) ≥ L(x∗ , λ∗ ) より,任意の λ ∈ m に対して m λj g j (x∗ ) ≥ j=1 m λ∗j g j (x∗ ) (9.22) j=1 もしある j に対して g j (x∗ ) < 0 ならば,正数 λj を十分大きく,またもし g j (x∗ ) > 0 ならば,負数 λj を十分小さくとることによって (9.22) は成立しなくなる.よって (9.22) が満たされる限り g j (x∗ ) = 0 (j = 1, 2, · · · , m) (9.23) このとき,L(x∗ , λ∗ ) ≥ L(x, λ∗ ) より f (x∗ ) ≥ f (x) + m λ∗j g j (x) j=1 となる.したがって,制約条件 g j (x) = 0 (j = 1, 2, · · · , m) を満たす x に対して f (x∗ ) ≥ f (x) が 成り立つ.すなわち,x∗ は極大化問題の解である.□ この定理では,微分可能性が必要でない点に注意しておこう.そこで次に,目的関数と制約条件が 微分可能である場合,極値の十分条件がどのようになるかを考えよう.2変数1制約の場合,次の定 理が成り立つ. 定理 9.3 2変数関数 f (x), g(x) が x∗ の近傍で2回連続微分可能で,偏導関数 g1 , g2 は同時にはゼ ロにならないとする.ラグランジュ関数 L(x, λ) = f (x) + λg(x) を作り,必要条件を満たす (x∗ , λ∗ ) で評価した偏導関数の値からなる行列 H を 0 g1 (x∗ ) g2 (x∗ ) H = g1 (x∗ ) L11 (x∗ , λ∗ ) L12 (x∗ , λ∗ ) g2 (x∗ ) L12 (x∗ , λ∗ ) L22 (x∗ , λ∗ ) と定義し,H の行列式を |H| とする.このとき (i) |H| > 0 ならば,x∗ において極大値をとる. 83 (ii) |H| < 0 ならば,x∗ において極小値をとる. (証明)ラグランジュ関数 L(x, λ) = f (x) + λg(x) を作ったとき,極値の必要条件を満たす (x∗ , λ∗ ) において Li (x∗ , λ∗ ) = fi (x∗ ) + λ∗ gi (x∗ ) = 0 Lλ (x∗ , λ∗ ) = g(x∗ ) = 0 (i = 1, 2) が成り立つ.いま,点 x∗ の近傍にあり,かつ制約条件 g(x∗ + dx) = 0 を満たす任意の十分小さな dx = (dx1 , dx2 ) = 0 をとる.テーラーの定理 (テーラー展開) により,ある θ (0 < θ < 1) に対して L(x∗ + dx, λ∗ ) = L(x∗ , λ∗ ) + 2 2 2 Li (x∗ , λ∗ )dxi i=1 1 + Lij (x∗ + θdx, λ∗ )dxi dxj 2! i=1 i=1 が成り立つ.ここで,Li = ∂L/∂xi , Lij = ∂ 2 L/∂xi ∂xj である. 仮定より Li (x∗ , λ∗ ) = 0 (i = 1, 2, 3) でる.また f, g は2回連続微分可能だから,Lij は連続で あり,2点 x∗ と x∗ + θdx は十分に近いから,ゼロでない限り Lij (x∗ , λ∗ ) と Lij (x∗ + θdx, λ∗ ) の 符号は一致する.したがって L(x∗ + dx, λ∗ ) < L(x∗ , λ∗ ) (>) ⇐⇒ 2 2 Lij (x∗ + θdx, λ∗ )dxi dxj < 0 i=1 i=1 (>) ⇐⇒ 2 2 Lij (x∗ , λ∗ )dxi dxj < 0 i=1 i=1 (>) が成り立つ.ところで,dx のとり方により g(x∗ + dx) = g(x∗ ) = 0 であったから, ⇐⇒ f (x∗ + dx) < f (x∗ ) (>) となる.また,dx = (dx1 , dx2 ) は g1 (x∗ )dx1 + g2 (x∗ )dx2 = 0 を満たす.仮定により g1 (x∗ ), g2 (x∗ ) の少なくとも一方はゼロではないから,一般性を損なうこと なく,g1 (x∗ ) = 0 としてよい.このとき dx1 = − g2 (x∗ ) dx2 g1 (x∗ ) である.代入すると 2 2 Lij (x∗ , λ∗ )dxi dxj i=1 i=1 = (dx2 )2 [L11 (x∗ , λ∗ ){g2 (x∗ )}2 − 2L12 (x∗ , λ∗ )g1 (x∗ )g2 (x∗ ) {g1 (x∗ )}2 + L22 (x∗ , λ∗ ){g1 (x∗ )}2 ] 84 を得る.ここで,L12 = L21 を用いた.dx2 = 0 より,上式が負値(正値)であることと [ ] の中が 負値(正値)であるととは同値である.ゆえに, ⇐⇒ L11 (x∗ , λ∗ ){g2 (x∗ )}2 − 2L12 (x∗ , λ∗ )g1 (x∗ )g2 (x∗ ) + L22 (x∗ , λ∗ ){g1 (x∗ )}2 < 0 (> 0) となる.これを行列を用いて書き換えると, 0 g1 (x∗ ) g1 (x∗ ) L11 (x∗ , λ∗ ) g2 (x∗ ) L12 (x∗ , λ∗ ) >0 ∗ ∗ L22 (x , λ ) g2 (x∗ ) L12 (x∗ , λ∗ ) (< 0) を得る.□ この行列式は,制約条件のない多変数関数の十分条件に登場したヘッセ行列に,制約条件の偏微分 係数を縁どりとして加えてできる行列の行列式になっている.このような行列を縁つきヘッセ行列と いう. ところで,定理 9.3 では |H| = 0 のとき極値をとるかどうかは判定できない.この点は,条件なし の極値問題について述べた注意がそのまま当てはまる.定理 9.4 の場合も同様である. この定理の一般化を考えるため,3つの3変数関数 f (x), g 1 (x), g 2 (x) が x∗ の近傍で2回連続微 分可能とし,制約条件 g 1 (x), g 2 (x) の下で f (x) の極大値を求めるという問題を取り上げる.ラグラ ンジュ関数 L(x, λ) = f (x) + λ1 g 1 (x) + λ2 g 2 (x) を作ったとき,(x∗ , λ∗ ) において Li (x∗ , λ∗ ) = fi (x∗ ) + λ∗1 gi1 (x∗ ) + λ∗2 gi2 (x∗ ) = 0 Lλj (x∗ , λ∗ ) = g j (x∗ ) = 0 (j = 1, 2) (i = 1, 2, 3) が成り立つとする. 定理 9.3 と同様の方法で,極大値 (極小値) の条件を考えよう.そのためには,点 x∗ の近傍にあり, かつ制約条件を満たす任意の点 x∗ + dx に対して f (x∗ + dx) < f (x∗ ) (>) が成り立つ条件を探せばよい.まず,点 x∗ + dx が2つの制約条件を満たさなければならないこと から, g 1 (x∗ )dx + g 1 (x∗ )dx + g 1 (x∗ )dx = 0 1 2 3 1 2 3 g 2 (x∗ )dx + g 2 (x∗ )dx + g 2 (x∗ )dx = 0 1 2 3 1 2 3 が成り立つ.この連立方程式が解をもつためには,例えば g 1 (x∗ ) g 1 (x∗ ) 1 2 2 ∗ = 0 g1 (x ) g22 (x∗ ) (9.24) が必要である.(9.24) が成り立つとき, dx1 = g21 (x∗ )g32 (x∗ ) − g31 (x∗ )g22 (x∗ ) dx3 g11 (x∗ )g22 (x∗ ) − g21 (x∗ )g12 (x∗ ) 85 (9.25) dx2 = g11 (x∗ )g32 (x∗ ) − g31 (x∗ )g12 (x∗ ) dx3 g11 (x∗ )g22 (x∗ ) − g21 (x∗ )g12 (x∗ ) (9.26) である.すなわち,任意に選んだ dx3 = 0 に対して,制約条件を満たすように dx1 ,dx2 の値が決ま ることになる. 次に,ラグランジュ関数に目を転じよう.テーラー展開より,ある θ (0 < θ < 1) に対して L(x∗ + dx, λ∗ ) = L(x∗ , λ∗ ) + 3 3 Li (x∗ , λ∗ )dxi i=1 3 1 + Lij (x∗ + θdx, λ∗ )dxi dxj 2! i=1 i=1 が成り立つ.ここで,Li = ∂L/∂xi , Lij = ∂ 2 L/∂xi ∂xj である.仮定より Li (x∗ , λ∗ ) = 0 であり,dx のとり方により g j (x∗ + dx) = g j (x∗ ) = 0 (i = 1, 2, 3) (j = 1, 2) である.また f, g は2回連続微分 可能だから,Lij は連続であり,2点 x∗ と x∗ + θdx は十分に近いから,ゼロでない限り Lij (x∗ , λ∗ ) と Lij (x∗ + θdx, λ∗ ) の符号は一致する.したがって L(x∗ + dx, λ∗ ) < L(x∗ , λ∗ ) (>) 3 3 ⇐⇒ Lij (x∗ + θdx, λ∗ )dxi dxj < 0 i=1 i=1 (>) 3 3 ⇐⇒ Lij (x∗ , λ∗ )dxi dxj < 0 i=1 i=1 (>) ∗ ⇐⇒ f (x + dx) ∗ < f (x ) (>) が成り立つ. 以上のことから,次のようにいえよう.点 x∗ において極大値 (極小値) をとるためには,条件 (9.24) が満たされるという仮定の下で,(9.25),(9.26) を満たす任意の dx= (dx1 , dx2 , dx3 ) に対して 3 3 Lij (x∗ , λ∗ )dxi dxj < 0 i=1 i=1 (>) が成り立たなければならない.一般の場合には,次のように述べることができる. 定理 9.4 n 変数関数 f, g 1 , · · · , g m (n > m ≥ 1) は x∗ の近傍で2回連続微分可能とする.ラグラ ンジュ関数 L(x, λ) = f (x) + m λj g j (x) i=1 ∗ ∗ が (x , λ ) において Li (x∗ , λ∗ ) = fi (x∗ ) + m i=1 Lλj (x∗ , λ∗ ) = g j (x∗ ) = 0 λ∗j gij (x∗ ) = 0 (i = 1, 2, · · · , n) (j = 1, 2, · · · , m) 86 を満たし, 1 ∗ g1 (x ) g21 (x∗ ) · · · 2 ∗ g1 (x ) g22 (x∗ ) · · · .. .. .. . . . g m (x∗ ) g m (x∗ ) · · · 1 2 ∗ 1 gm (x∗ ) 2 gm (x∗ ) = 0 .. . m ∗ g (x ) m ∗ とする.さらに L(x , λ ) の縁つきヘッセ行列 Hn ,およびその k 次の小行列 Hk が (−1)k |Hk | > 0 (k = m + 1, · · · , n) (あるいは, (−1)m |Hk | > 0 (k = m + 1, · · · , n)) を満たすならば,f (x∗ ) は極大値 (あるいは極小値) である.ここで Hk は次のように定義され,(x∗ , λ∗ ) で評価される. 0 . .. 0 Hk = g1 1 . . . gk1 9.3 9.3.1 ··· .. . 0 .. . g11 .. . ··· .. . ··· ··· .. . 0 g1m .. . gkm g1m L11 .. . L1k ··· ··· .. . ··· ··· gk1 .. . gkm L1k .. . Lkk スルツキー方程式 効用最大化問題 消費者の効用最大化問題を取り上げよう.n 種類の消費財があり,その購入量を xi ≥ 0 (i = 1, 2, · · · , n),消費ベクトルを x = (x1 , x2 , · · · , xn ) とする.また各財の価格を pi > 0 (i = 1, 2, · · · , n), 価格ベクトルを p = (p1 , p2 , · · · , pn ) とする.所得を M > 0 をすると,予算制約は n pi xi = M あるいは p·x= M i=1 となる.当該消費者は消費財を効用関数 u(x1 , x2 , · · · , xn ) = u(x) で評価するとし,u は 2 回連続微 分可能な厳密な準凹関数で,単調増加と仮定する.すなわち,ui > 0, uii < 0 (i = 1, 2, · · · , n).こ のとき,消費者の効用最大化問題は, max u(x) x n s.t. pi xi = M (j = 1, 2, · · · , m) i=1 となる.これが内点解 x∗ をもつと仮定し,新たに独立変数 λ を導入して,関数 n L(x, λ) = u(x) + λ pi xi − M i=1 87 (9.27) を作る.最大値をもたらす消費ベクトル x∗ では,ある λ∗ に対して ∂ L(x∗ , λ∗ ) = ui (x∗ ) + λ∗ pi = 0 (i = 1, 2, · · · , n) ∂xi n ∂ L(x∗ , λ∗ ) = pi x∗i − M = 0 (j = 1, 2, · · · , m) ∂λ i=1 (9.28) (9.29) が成り立つ.これを用いて,所得の変化,価格の変化を見よう. 9.3.2 所得変化の効果 所得が変化したとき,各財の需要がどう変化するかは ∂xi (i = 1, 2, · · · , n) を調べればよい.(9.29) ∂M と (9.28) を M で偏微分すると, ∂x ∂x ∂x p1 1 + p2 2 + · · · + pn n = 1 ∂M ∂M ∂M ∂x1 ∂x2 ∂xn ∂λ p1 + u11 + u12 + · · · + u1n =0 ∂M ∂M ∂M ∂M ············ pn ∂λ + un1 ∂x1 + un2 ∂x2 + · · · + unn ∂xn = 0 ∂M ∂M ∂M ∂M (9.30) が得られる.この連立 1 次方程式をクラメールの公式により解く.行列 A を 0 p1 p2 · · · pn p1 u11 u12 · · · u1n A= p2 u21 u22 · · · u2n ......................... pn un1 ··· un2 unn とおく.効用関数 u は厳密な準凹関数であったから,u のヘッセ行列は条件付き負値定符号になる. 1 0 したがって,縁付き行列の性質より,(−1)n |A| > 0 となる.行列 A の第 j 列を .. で置き換えた行 . 0 列を 0 p1 ··· 1 ··· pn p1 u11 · · · 0 · · · u1n Bj = p2 u21 · · · 0 · · · u2n ............................ pn un1 · · · 0 · · · unn とすると,クラメールの公式より |Bi+1 | ∂xi = ∂M |A| (i = 1, 2, · · · , n) (9.31) である.あるいは,行列式 |A| の第 (i, j) 余因子を |Aij | とすれば, |A1,i+1 | ∂xi = ∂M |A| (i = 1, 2, · · · , n) (9.32) と書ける.余因子が |A1,i+1 | > 0 を満たすとき,第 i 財の需要量は所得の増加とともに増大すること が分かる.このような財を上級財あるいは正常財という. 88 9.3.3 価格変化の効果 次に,価格が変化したとき,各財の需要がどう変化するかを調べよう. 1, 2, · · · , n) を求める.(9.29) と (9.28) を pj で偏微分すると, ∂x1 ∂x2 ∂xn p1 + p2 + · · · + pn = −xj ∂pj ∂pj ∂pj ∂λ ∂x1 ∂x2 ∂xn p1 + u11 + u12 + · · · + u1n =0 ∂p ∂p ∂p ∂pj j j j ·················· p ∂λ + u ∂x1 + u ∂x2 + · · · + u ∂xn = 0 i i1 i2 in ∂pj ∂pj ∂pj ∂pj ·················· ∂λ ∂x1 ∂x2 ∂xn + uj1 + uj2 + · · · + ujn = −λ pj ∂pj ∂pj ∂pj ∂pj · · · · · · · · · · · · · · · · · · ∂λ ∂x1 ∂x2 ∂xn pn + un1 + un2 + · · · + unn =0 ∂pj ∂pj ∂pj ∂pj ∂xi (i = 1, 2, · · · , n; j = ∂pj (9.33) が得られる.(9.33) 式の左辺の係数行列は (9.30) 式の左辺の係数行列に等しく,右辺のみが異なる. (9.33) の右辺の n + 1 次元列ベクトルは −xj 0 . 0 1 . . .. . 0 = −xj . − λ 1 = −xj e1 − λej+1 λ . . . .. . . 0 . 0 0 となるので,連立 1 次方程式 (9.33) の解は (9.30) の解を −xj 倍したものと λ 倍したものの和になる. −xj−1 0 .. . 実際に (9.33) をクラメールの公式により解いてみよう.行列 A の第 j 列を −λ で置き換えた . . . 0 行列を Cj = 0 p1 ··· −xj−1 ··· pn pj uj1 · · · −λ · · · ujn ................................. pn un1 · · · 0 · · · unn p1 u11 · · · 0 · · · u1n ................................. とすると,クラメールの公式より ∂xi |Ci+1 | = ∂pj |A| (i = 1, 2, · · · , n; j = 1, 2, · · · , n) 89 (9.34) である.あるいは,行列式 |A| の第 (i, j) 余因子を |Aij | とすれば, |Aj+1,i+1 | ∂xi |A1,i+1 | −λ = −xj ∂pj |A| |A| (i = 1, 2, · · · , n; j = 1, 2, · · · , n) (9.35) |A1,i+1 | |Aj+1,i+1 | が所得効果,−λ が代替効果を表している. |A| |A| ところで,仮定より A は対称行列であるから,Aj+1,i+1 = Ai+1,j+1 が成り立つ.すなわち,代替 効果は対称的である.したがって と書ける.ここで,−xj ∂xj ∂xi ∂xi ∂xj = + xj + xi ∂pj ∂M ∂pi ∂pi (i = 1, 2, · · · , n; j = 1, 2, · · · , n) (9.36) (9.35) 式の右辺第 2 項を説明するために,価格の上昇 ∆pj を相殺する補償所得 ∆M が与えられた としよう.すなわち,∆M = xj ∆pj である.この変化の極限をとると, ∂M = xj ∂pj (9.37) が成り立つ.補償所得が与えられた下での需要の変化を ∂hi ∂xi ∂xi ∂M ∂xi ∂xi xj = + = + ∂pj ∂pj ∂M ∂pj ∂pj ∂M と表せば,(9.30) 式の両辺を xj 倍して (9.33) 式に加えることにより, ∂h1 ∂h2 ∂hn p1 + p2 + · · · + pn =0 ∂p ∂p ∂pj j j ∂µ ∂h1 ∂h2 ∂hn p1 + u11 + u12 + · · · + u1n =0 ∂p ∂p ∂p ∂pj j j j ·················· p ∂µ + u ∂h1 + u ∂h2 + · · · + u ∂hn = 0 i i1 i2 in ∂pj ∂pj ∂pj ∂pj ·················· ∂µ ∂h1 ∂h2 ∂hn pj ∂pj + uj1 ∂pj + uj2 ∂pj + · · · + ujn ∂pj = −λ ·················· ∂µ ∂h1 ∂h2 ∂hn pn + un1 + un2 + · · · + unn =0 ∂pj ∂pj ∂pj ∂pj (9.38) (9.39) が得られる. この連立 1 次方程式の係数行列は (9.32) 式の左辺の係数行列に等しく,右辺のみが異なる.(9.39) の右辺の列ベクトルが単位ベクトルであることに注意すると, ∂hi |Aj+1,i+1 | = −λ ∂pj |A| (9.40) (9.40) 式を (9.35) 式に代入すると, ∂xi ∂xi ∂hi = − xj ∂pj ∂pj ∂M (i, j = 1, 2, · · · , n) を得る.この (9.41) 式をスルツキー方程式という. 練習問題 90 (9.41) 1.制約条件 g(x1 , x2 ) = 0 の下で f (x1 , x2 ) の極値を求めよ. (1) f (x1 , x2 ) = 4x1 + 3x2 + 2, g(x1 , x2 ) = 25 − (x1 − 1)2 − (x2 − 1)2 (2) f (x1 , x2 ) = (x1 − 1)2 + (x2 − 1)2 , g(x1 , x2 ) = 1 − 3x1 − 4x2 (3) f (x1 , x2 ) = 3x21 + 4x1 x2 + 3x22 , g(x1 , x2 ) = 1 − x21 − x22 (4) f (x1 , x2 ) = x31 + x32 , g(x1 , x2 ) = 2 − x1 − x2 (5) f (x1 , x2 ) = x1 x2 , g(x1 , x2 ) = a2 − x21 − x22 (a は正の定数) 2.制約条件 x1 x2 + x2 x3 + x3 x1 = 4, x1 + x2 + x3 = 4 の下で,x1 x2 x3 の極値を求めよ. 3.制約条件 x1 + x2 + x3 = 1 の下で,x21 + x22 + x23 の最小値を求めよ. 4.効用水準を一定として支出を最小化する問題を解くことにより,(9.35) 式右辺の第 2 項を表現し 直せ.それによりスルツキー方程式を導け. 91 第 10 章 包絡線定理 10.1 包絡線の定義 α をパラメターとする微分可能な関数 f (x1 , x2 , α) が与えられたとき, f (x1 , x2 , α) = 0 (10.1) によって曲線群が定まる.すなわち,α をある値に固定すれば,(10.1) を満たす x1 と x2 の関係を 表す曲線が 1 つ定まる.α も値を変えれば,別の曲線が定められるので,(10.1) は α をパラメター とする曲線群を示していると考えられる.α を連続的に変えたとき,この曲線の位置や形は連続的 に変れる.ある曲線が,上の各曲線 (10.1) に接し,しかも接点の軌跡となっているとき,その曲線 (10.1) を満たす曲線群の包絡線という. いま曲線群 (10.1) が包絡線をもつとすれば,接点 (x1 , x2 ) は α の関数として x1 = g(α), x2 = h(α) (10.2) と表される.これが α を媒介変数とした包絡線の方程式である.これを (10.1) に代入すると f (g(α), h(α), α) = 0 (10.3) を得る.また,(10.2) の (x1 , x2 ) = (g(α), h(α)) における接線の傾きは dx2 h (α) = dx1 g (α) (10.4) さらに,(10.1) の任意の点 (x1 , x2 ) における接線の傾きは dx2 f1 (x1 , x2 , α) =− dx1 f2 (x1 , x2 , α) (10.5) したがって,(g(α), h(α)) においては f1 (x1 , x2 , α) h (α) =− g (α) f2 (x1 , x2 , α) (10.6) f1 (x1 , x2 , α)g (α) + f2 (x1 , x2 , α)h (α) = 0 (10.7) が成り立つ.すなわち, (10.3) は恒等的に成り立つので,α で微分すると f1 (x1 , x2 , α)g (α) + f2 (x1 , x2 , α)h (α) + fα (x1 , x2 , α) = 0 (10.8) を得る.(10.7),(10.8) より fα (x1 , x2 , α) = 0 92 (10.9) ゆえに,包絡線は (10.3) と (10.9) を x1 , x2 について解いたものである. 逆に, f (x1 , x2 , α) = 0, fα (x1 , x2 , α) = 0 を x1 , x2 について解いたとき x1 = g(α), x2 = h(α) が得られたとする.このように表記できるためには, f f2 1 = 0 fα1 fα2 が上式 (10.1) を満たすすべての (x1 , x2 , α) に対して成立しなければならない.このとき,g, hは 連続で恒等的に f (g(α), h(α), α) = 0, fα (g(α), h(α), α) = 0 が成り立つ.したがって,f (g(α), h(α), α) = 0 を α で偏微分すると, f1 g (α) + f2 h (α) + fα = 0 fα = 0 より f1 g (α) + f2 h (α) = 0 よって,f1 = f2 = 0 でないなら,両者は接することになる. 以上を定理の形にまとめておこう. 定理 10.1 α をパラメータとする微分可能な関数 f (x1 , x2 , α) が f1 = 0,f2 = 0 を満たすとする.こ のとき f (x1 , x2 , α) = 0 によって定められる曲線群の包絡線は f (x1 , x2 , α) = 0, fα (x1 , x2 , α) = 0 を x1 ,x2 について解くことにより求められる. 例 10.1 短期費用曲線が α をパラメータとして C = とする.このとき,長期費用曲線は連立方程式 C− y2 + α,(y > 0, α > 0) によって表されている α 1 2 y −α=0 α 1 2 y −1=0 α2 (10.10) (10.11) を解くことによって与えられる.y > 0,α > 0 より (10.11) から α = y となるので,これを (10.10) に代入すると C = 2y を得る.これが長期費用曲線の式である (図 10.1 を参照せよ). 93 C C = 2y y 0 図 10.1: 包絡線 10.2 経済学における包絡線定理 ところで,経済学では最適化行動の結果としてさまざまな関数が導かれる.例えば,費用関数は所 与の生産量のもとで企業が費用最小化行動をとることによって得られるし,支出関数も消費者の同様 の行動から得られる.これらの最適化行動の背後に潜む包絡線定理を示すことが,次の課題である. まず,最も単純なケースを考えよう.目的関数が2つの変数 x1 ,x2 と1つのパラメータ α の連続微 分可能な実数値関数 f (x1 , x2 , α),制約条件が2つの変数 x1 ,x2 の連続微分可能な関数 g(x1 , x2 ) = 0 で表されているとする.ただし,任意の (x1 , x2 ) に対して g1 (x1 , x2 ) = 0 とする.ここでの問題は maxf (x1 , x2 , α) x1 ,x2 (10.12) s.t. g(x1 , x2 ) = 0 である.さらに,この問題の解が内点で与えられ,2階の条件は満たされているとする.陰関数定理 より,制約条件から x2 = h(x1 ) なる連続微分可能な関数 h の存在がいえる.これを目的関数に代入 すると maxf (x1 , h(x1 ), α) x1 のように,制約なしの最大化問題に書き換えることができる.内点解の仮定により,所与の α に対 し解において ∂f ∂f + h =0 ∂x1 ∂x2 (10.13) が成り立つ.(10.13) を x1 について解くことにより,α の関数として解 x∗1 (α),これを h に代入して x∗2 (α) が得られる.あるいは,ラグランジュ未定乗数法を用いても,同一の解を得ることができる. さて,最大値関数 (maximum value function) F (α) を F (α) ≡ f (x∗1 (α), x∗2 (α), α) によって定義する.合成関数の微分の公式より dF dα = = ∂f dx∗1 ∂f dx∗2 ∂f + + · · ∂x1 dα ∂x2 dα ∂α ∂f ∂f ∂f dx∗2 dx∗1 + + · ∗ ∂x1 ∂x2 dx1 dα ∂α 94 (10.14) となる.したがって (10.13) より ∂ d F (α) = f (x∗1 (α), x∗2 (α), α) dα ∂α (10.15) が成り立つ. (10.15) の意味を考えてみよう.α = α1 に対応する問題 (10.12) の解を (x11 , x12 ) とすると,α = α1 のときのみ F (α1 ) = f (x11 , x12 , α1 ) が成り立ち,そこでの2つの関数の微分係数は一致する.そして α = α1 ならば F (α) ≥ f (x11 , x12 , α) が成り立つ.任意に固定された α に対しても同様のことが成り立つので,最大値関数は目的関数の 族の包絡線になっていることがわかる.これが包絡線定理と呼ばれるゆえんである. 第2に,(10.15) 式は,パラメータの変化によってもたらされる最大値関数の変化は,制約条件が パラメータに影響されない限り,パラメータの変化による目的関数の元の最大値の直接的変化に等し い,と述べている.一般に,パラメータの変化は問題 (10.12) の解の変化を通じて最大値関数の値に 間接的に影響するが,(10.15) によれば,この間接的影響を無視して直接的な影響 (∂f /∂α) のみを考 えればよいことになる.すなわち包絡線定理は,パラメータ変化の影響を単純化して捉えることを保 証するものである. 同様の主張は,制約条件がパラメータに依存して変化する場合にも成立する.(10.12) と類似の次 のような最大化問題を考えよう. maxf (x1 , x2 , α) (10.16) x1 ,x2 s.t. g(x1 , x2 , α) = 0 ここで f ,g は連続微分可能な実数値関数である.ラグランジュ関数 L(x1 , x2 , α, λ) = f (x1 , x2 , α) + λg(x1 , x2 , α) を作る.(10.16) が内点解 (x∗1 , x∗2 ) をもつという仮定の下では,適当な λ∗ に対して ∂ L(x∗1 , x∗2 , α, λ∗ ) = fi (x∗1 , x∗2 , α) + λ∗ gi (x∗1 , x∗2 , α) = 0 ∂xi ∂ L(x∗1 , x∗2 , α, λ∗ ) = g(x∗1 , x∗2 , α) = 0 ∂λ (i = 1, 2) (10.17) (10.18) が成り立つ.もちろん,これらの方程式は所与の α に対して解を特徴づけるものであるから,解は (x∗1 (α), x∗2 (α), λ∗ (α)) と書くことができる.ここで,(10.14) で定義された最大値関数 F (α) の α に関する変化率を計算し てみよう.(10.17) より dF dα = = ∂f dx∗1 ∂f dx∗2 ∂f + + · · ∂x1 dα ∂x2 dα ∂α ∂f ∂f ∂f dx∗2 dx∗1 ∗ + −λ + · ∂x1 ∂x2 dx∗1 dα ∂α 95 ところで,(10.18) より ∂g dx∗1 ∂g dx∗2 ∂g + + =0 · · ∂x1 dα ∂x2 dα ∂α であるから d F (α) dα ∂ ∂ g(x∗1 (α), x∗2 (α), α) + f (x∗1 (α), x∗2 (α), α) ∂α ∂α = λ∗ (α) = ∂ L(x∗1 (α), x∗2 (α), α, λ∗ (α)) ∂α (10.19) が成り立つ.(10.19) も (10.15) と同様の意味をもっている.制約条件がパラメータに依存するため 若干複雑になっているとはいえ,やはりパラメータ変化の直接的影響だけを見れば最大値関数の変化 率がわかることを主張するものである. 以上の観察を一般化すると,次の定理が成り立つ. 定理 10.2 (包絡線定理) (n + k) 変数実数値関数 f (x, α),g 1 (x, α),· · · ,g m (x, α) (1 ≤ m < n) が連続微分可能で,かつ 1 1 g1 g21 · · · gm 2 2 g1 g22 · · · gm . .. = 0 .. .. . . . . . gm gm · · · gm 1 2 m とし,問題 maxf (x, α) (あるいは minf (x, α)) x x s.t. g j (x, α) = 0 (j = 1, 2, · · · , m) が内点解 x∗ をもつとする.λ = (λ1 , λ2 , · · · , λm ) を新たに導入して,ラグランジュ関数 L(x, α, λ) = f (x, α) + m λj g j (x, α) j=1 を作り F (α) ≡ f (x(α), α) L(α) ≡ L(x(α), α, λ(α)) とおく.ただし,x(α) = (x1 (α), · · · , xn (α)),λ(α) = (λ1 (α), · · · , λm (α)) である.このとき, ∂ ∂ ∂ F (α) = L(α) = L(x, α, λ) ∂αi ∂αi ∂αi が成り立つ. 10.3 いくつかの例題 10.3.1 消費者の効用最大化行動 消費者の効用最大化行動を考え,間接効用関数からロワの恒等式を導く. max u(x) x ≥0 s.t. p · x = M 96 ∂u > 0 が成 ∂xi り立つと仮定する.さらに p = (p1 , p2 , · · · , pn ) 0, M > 0 とする.これらの仮定の下では最大化 問題に解が存在する.ラグランジュ関数 と表される.u は2回連続微分可能な,厳密な準凹関数とし,すべての i に対し ui = L(x, λ) = u(x) + λ(M − p · x) を作ると,解は x∗i = x∗i (p, M ) と表せる.これを効用関数に代入すると間接効用関数は x∗ = (x∗1 , x∗2 , · · · , x∗n ) として v(p, M ) ≡ u(x∗ (p, M )) と表せる.定理 10.2 において α = (p, M ) とおく.定理 10.2 の主張するところでは, ∂v ∂L = ∂αj ∂αj が成り立つので, ∂L ∂v = =λ ∂M ∂M ∂v ∂L = = −λxi , ∂pi ∂pi を得る.よって ∂v ∂v =0 + xi ∂pi ∂M (i = 1, 2, · · · , m) これはロワの恒等式に他ならない. 10.3.2 企業の費用最小化問題 企業の費用最小化問題を考え,費用最小化行動からシェパードの補題を示す. min w · x x ≥0 s.t.f (x) = y と表された.w 0 と仮定し,f は 2 回連続微分可能な厳密な凹関数で,すべての i について ∂f fi = > 0 と仮定する.これらの仮定の下ではこの最小化問題には解が存在する.ラグランジュ ∂xi 関数 L(x, λ) = w · x + λ(f (x) − y) を作れば,解は w, y をパラメータとして x∗i = x∗i (w, y) と表せる.このとき費用関数は x∗ = (x∗1 , x∗2 , · · · , x∗n ) として C(w, y) = w · x∗ (w, y) となる.定理 10.2 において α = (w, y) とおく.定理 10.2 は最大化問題として定式化されているが, 目的関数の符号を替えればそのまま最小化問題についても当てはまる点に注意しておく.定理 10.2 ∂C ∂L より = が成り立つので ∂αj ∂αj ∂C ∂L = = xi ∂wi ∂wi (i = 1, 2, · · · , n) これはシェパードの補題に他ならない. 97 10.3.3 目的関数の変化率 ラグランジュ関数 L(x, λ) = f (x) + n λj (αj − gj (x)) j=1 を作る.ここで λ = (λ1 , λ2 , · · · , λm ) である.解を x(α), λ(α) とすると,最大値関数は F (α) ≡ f (x(α)) となる.定理 10.2 より ∂L ∂F = = λj ∂αj ∂αj よって,λj はパラメータ αj の変化に対する目的関数の最大値の変化率に等しい. 練習問題 1.α をパラメータとするとき,次の式で表される曲線群の包絡線を求めよ. (1) (x1 − α)2 + x22 = r2 (r は定数) 1 (2) (x1 − α)2 + x22 = α2 2 1 (3) x2 = αx1 + α (4) x2 = αx21 + 1 α 98 第 11 章 一般最適化理論 すでに制約条件付き極大化(極小化)問題の解法については,制約が等式の場合を取り上げた.ここ では,制約が不等式で与えられる一般的なケースを扱う.ラグランジュ未定乗数法を拡張したキュー ン=タッカー条件を導出することが,ここでの目標である. 11.1 最初の描写−−非負制約下の最適問題 まず,不等式制約下の最大化問題の例として,非負制約下の最大化問題を取り上げることにしよ う.これを用いて,不等式制約の捉え方に対する基本的な考え方を見ておく. f (x) は R から R への関数で,定義域の全域で微分可能であるとする.いま,x ≥ 0 の下で f (x) を最大化するとしよう.図 11.1 には可能なケースが描かれている.(a) は内点解のケースであり,解 x∗ > 0 において f (x∗ ) = 0 が成立している.(b),(c) は端点解のケースであり,解は x∗ = 0 であ る.ここでは,f (x∗ ) ≤ 0 が成立している.これらすべてのケースを含む最適条件は, f (x∗ ) ≤ 0, x∗ ≥ 0, x∗ f (x∗ ) = 0 (11.1) と書くことができる.定義域の下限である 0 において最大となるとき,f (x∗ ) は最大でも 0 を超え ることはない.(d) は上限がある場合の端点解のケースを示している.このとき,f (x∗ ) は正になり うるし,(11.1) のようには書けない.一般的な表現は次節で考える. 条件 (11.1) を多変数のケースに拡張してみよう.f (x1 , x2 ) は R2 から R への関数で,定義域の全 域で微分可能であり,x1 ≥ 0, x2 ≥ 0 の下で f (x1 , x2 ) を最大化するとしよう.fi (i = 1, 2) を第 i 偏 導関数とすれば,解 x∗1 , x∗2 では, fi (x∗1 , x∗2 ) ≤ 0, x∗i ≥ 0, x∗i fi (x∗1 , x∗2 ) = 0 (11.2) が成り立つ.全部で 9 つの可能性があるが,図 11.2 の (a),(b),(c) に 3 つのケースが描かれてい る.(a) は内点解のケースだが,(b),(c) は端点解のケースであり,解は x∗2 = 0,また (d) も端点解 のケースで,解は x∗1 = 0 である. 11.2 スラック変数と一般的な不等式制約 次に,非負条件を 1 つの例として含む一般的な不等式制約の下での一般最適化問題の必要条件を 考えるために,前節の 2 変数 1 不等式制約の極大化問題を取り上げよう. max f (x1 , x2 ) x1 ,x2 (11.3) s.t. g(x1 , x2 ) ≥ 0 99 (a) f (x) (b) x∗ x > 0, f (x∗ ) = 0 ∗ x∗ x (d) (c) x∗ ∗ ∗ x x∗ = 0, f (x∗ ) < 0 x ∗ x = 0, f (x ) = 0 ∗ x > 0, f (x ) > 0 図 11.1: 1 変数の一般最適化 100 x∗ x (a) x2 (b) x2 x∗1 x1 x∗2 M M x∗1 x∗1 > 0, f1 (x∗ ) = 0 x∗2 > 0, f2 (x∗ ) = 0 x∗1 > 0, f1 (x∗ ) = 0 x∗2 = 0, f2 (x∗ ) < 0 x1 (d) (c) x2 x∗1 x2 M M x∗2 x1 x∗1 > 0, f1 (x∗ ) = 0 x∗2 = 0, f2 (x∗ ) = 0 x∗1 = 0, f1 (x∗ ) < 0 x∗2 > 0, f2 (x∗ ) = 0 図 11.2: 2 変数の一般最適化 101 x1 ただし,f, g はともに微分可能であると仮定する.スラック変数 s を導入して,問題 (11.3) を非負 条件付き等式制約問題に書き換えよう. max f (x1 , x2 ) x1 ,x2 s.t. (11.4) g(x1 , x2 ) − s = 0, s≥0 この問題 (11.4) をラグランジュ未定乗数法の考え方によって解く.いま,解を x∗ ,s∗ とし,x∗ の 近くの点で制約 g(x1 , x2 ) − s = 0 を満たす点を x∗ + dx = (x∗1 + dx1 , x∗2 + dx2 ) = x∗ とすれば g1 (x∗ )dx1 + g2 (x∗ )dx2 − ds = 0 (11.5) が成り立つ.ここで g1 (x∗ ) = 0 と仮定する.そのとき, dx1 = − g2 (x∗ ) 1 dx2 + ds ∗ g1 (x ) g1 (x∗ ) f (x) は x∗ において極大値をとるから, f (x∗ + dx) − f (x∗ ) =f1 (x∗ )dx1 + f2 (x∗ )dx2 % & ∗ f1 (x∗ ) ∗ g2 (x ) ∗ + f ds ≤ 0 = −f1 (x ) (x ) dx + 2 2 g1 (x∗ ) g1 (x∗ ) まず,ds = 0,dx2 = 0 のときを考える.dx2 は正負いずれの値もとりうるから, −f1 (x∗ ) g2 (x∗ ) + f2 (x∗ ) = 0 g1 (x∗ ) (11.6) 次に,dx2 = 0,ds = 0 のときを考える.s∗ = 0 のとき ds > 0 のみ可能だが,s∗ > 0 のときは ds は正負いずれの値もとりうる.したがって,s∗ > 0 のとき f1 (x∗ ) =0 g1 (x∗ ) (11.7) f1 (x∗ ) ≤0 g1 (x∗ ) (11.8) s∗ = 0 のとき となる.等式制約付き極大化問題と同様に, f1 (x∗ ) = −λ∗ とおくと, g1 (x∗ ) f1 (x∗ ) + λ∗ g1 (x∗ ) = 0 (11.9) f2 (x∗ ) + λ∗ g2 (x∗ ) = 0 (11.10) (11.6) より, また,(11.7),(11.8) より λ∗ ≥ 0 (11.11) λ∗ s∗ = 0 (11.12) が成り立つ.これが,制約 g(x) − s = 0 の下で f (x) が x∗ において極大値をとるための必要条件で ある. 102 x2 ∇f (x∗ ) x ∇g(x∗ ) g(x) ≥ 0 x1 図 11.3: 一般最適化 (1) いま,ラグランジュ関数を L(x, λ) = f (x) + λg(x) (11.13) とおくと,s∗ = g(x∗ ) より,(11.9),(11.10) および s ≥ 0 なる条件は次のように書ける. ∂ L(x∗ , λ∗ ) = fi (x∗ ) + λ∗ gi (x∗ ) = 0 ∂xi (i = 1, 2) ∂ L(x∗ , λ∗ ) = g(x∗ ) ≥ 0 ∂λ λ∗ (11.14) ∂ L(x∗ , λ∗ ) = λ∗ g(x∗ ) (= λ∗ s∗ ) = 0 ∂λ λ∗ ≥ 0 が成り立つ.これらの条件はキューン=タッカー条件 (Kuhn=Tucker condition) と呼ばれる.図 11.3 は制約条件が 1 つで,かつ拘束的であるケースを示している.図 11.4 にはスラック変数が存在する ケースを示している.以上の議論は制約条件が複数になったときにも容易に拡張することができる. 2 つの不等式制約与えられたときを考えよう.図 11.5 は,2 つの制約がともに拘束的で, f (x∗ ) + λ∗ g 1 (x∗ ) + λ∗ g 1 (x∗ ) = 0 1 1 1 2 2 (11.15) f (x∗ ) + λ∗ g 2 (x∗ ) + λ∗ g 2 (x∗ ) = 0 2 1 1 2 2 を満たすケースである.すなわち,∇f (x∗ ) は ∇g1 (x∗ ) と ∇g2 (x∗ ) の 1 次結合として表されている. もちろん,そのためには ∇g1 (x∗ ) と ∇g2 (x∗ ) が 1 次独立でなければならない. 一般的な不等式制約の下で求められたキューン=タッカー条件 (11.14) と,前節の非負制約におけ る極大値の必要条件 (11.2) にはいかなる関係があるであろうか.非負制約は一般的な不等式制約の 1 つであるから,条件 (11.14) から条件 (11.2) は導かれるはずである.そこでラグランジュ関数を, xi ≥ 0 (i = 1, 2) として, L(x, λ) = f (x) + λx 103 x2 スラック g(x) = 0 x1 g(x) = s 図 11.4: スラックの存在 ∇f x2 g 1 (x) = 0 −∇g 1 −∇g 2 ∇g 2 ∇g 1 g 2 (x) = 0 x1 図 11.5: 一般最適化 (2) 104 とおくと,(11.14) より,キューン=タッカー条件は ∂ L(x∗ , λ∗ ) = fi (x∗ ) + λ∗i = 0 ∂xi ∂ L(x∗ , λ∗ ) = x∗i ≥ 0 ∂λi λ∗i (i = 1, 2) ∂ L(x∗ , λ∗ ) = λ∗i x∗i = 0 ∂λi λ∗i ≥ 0 (i = 1, 2) (i = 1, 2) (i = 1, 2) となる.これらより fi (x∗ ) = −λ∗i ≤ 0 x∗i fi (x∗ ) = −λ∗i x∗i = 0 であるから,非負制約下の最大の必要条件は fi (x∗ ) ≤ 0 x∗i fi (x∗ ) = 0 x∗i ≥ 0 (i = 1, 2) となる. では,非負制約と不等式制約の両方がある場合は,どのような条件になるであろうか. L+ (x, λ, µ) = f (x) + λg(x) + µx とおくと,キューン=タッカー条件より ∂ + ∗ ∗ ∗ L (x , λ , µ ) = fi (x∗ ) + λgi (x∗ ) + µ∗i = 0 ∂xi ∂ + ∗ ∗ ∗ L (x , λ , µ ) = g(x∗ ) ≥ 0 ∂λ λ∗ ∂ + ∗ ∗ ∗ L (x , λ , µ ) = λ∗ g(x∗ ) = 0 ∂λ λ∗ ≥ 0 ∂ + ∗ ∗ ∗ L (x , λ , µ ) = x∗i ≥ 0 ∂µi µ∗i ∂ + ∗ ∗ ∗ L (x , λ , µ ) = µ∗i x∗i = 0 ∂µi µ∗i ≥ 0 となる.µ∗i ≥ 0 より (i = 1, 2) (i = 1, 2) (i = 1, 2) (i = 1, 2) fi (x∗ ) + λ∗ gi (x∗ ) ≤ 0 また, fi (x∗ ) + λ∗ gi (x∗ ) = −µ∗i 105 (i = 1, 2) の両辺に x∗i をかけると x∗i [fi (x∗ ) + λ∗ gi (x∗ )] = −µ∗i x∗i = 0 が成り立つ.まとめると,ラグランジュ関数 L(x, λ) = f (x) + λg(x) を作り, ∂ L(x∗ , λ∗ ) = fi (x∗ ) + λgi (x∗ ) ≤ 0 ∂xi x∗i (i = 1, 2) ∂ L(x∗ , λ∗ ) = x∗i [fi (x∗ ) + λ∗ gi (x∗ )] = 0 ∂xi x∗i ≥ 0 (i = 1, 2) (i = 1, 2) ∂ L(x∗ , λ∗ ) = g(x∗ ) ≥ 0 ∂λ λ∗ ∂ L(x∗ , λ∗ ) = λ∗ g(x∗ ) = 0 ∂λ λ∗ ≥ 0 となる x∗ , λ∗ を見つけることである. 例 11.1 max (x1 + 3)x2 x1 ≥0,x2 ≥0 s.t. 1 − x1 − x2 ≥ 0 を解く.ラグランジュ関数を作ると, L = (x1 + 3)x2 + λ(1 − x1 − x2 ) となる.xi (i = 1, 2), λ で L を偏微分したものをそれぞれ Li , Lλ で表せば, L1 = x2 − λ ≤ 0 x1 L1 = x1 (x2 − λ) = 0 x1 ≥ 0 L2 = x1 + 3 − λ ≤ 0 x2 L2 = x2 (x1 + 3 − λ) = 0 x2 ≥ 0 Lλ = 1 − x1 − x2 ≥ 0 λLλ = λ(1 − x1 − x2 ) = 0 λ≥0 まず,x1 > 0 と仮定すると,x2 = λ.このとき,x2 ≥ x1 + 3 が成り立つから 1 ≥ x1 + x2 ≥ 2x1 + 3 > 3 これは矛盾.よって,x1 = 0. 106 次に,1 − x1 − x2 > 0 とすると,λ = 0.このとき,x1 + 3 ≤ 0.これは x1 = 0 に矛盾.よって, 1 − x1 − x2 = 0.x1 = 0 より x2 = 1.そのとき,λ = 3, (x1 + 3)x2 = 3. 比較のために,次の問題を解こう. max (x1 + 3)x2 x1 ,x2 s.t. 1 − x1 − x2 = 0 ラグランジュ関数は L = (x1 + 3)x2 + λ(1 − x1 − x2 ) であるから, L1 = x2 − λ = 0 L2 = x1 + 3 − λ = 0 Lλ = 1 − x1 − x2 = 0 まず,最初の 2 つの式より x2 = x1 + 3 が成り立つ.それを 3 番目の式に代入すると,x1 = −1, x2 = 2, (x1 + 3)x2 = 4. 例 11.2 max f (x1 , x2 ) = −x21 − x22 + 4x1 + x2 s.t. − x21 + 4x1 − x2 ≥ 0 を解く.ラグランジュ関数 L = −x21 − x22 + 4x1 + x2 + λ(−x21 + 4x1 − x2 ) を作る.xi (i = 1, 2), λ で L を偏微分したものをそれぞれ Li , Lλ で表せば, L1 = −2x1 + 4 − 2λx1 + 4λ = 0 L2 = −2x2 + 1 − λ = 0 Lλ = −x21 + 4x1 − x2 ≥ 0 λLλ = λ(−x21 + 4x1 − x2 ) = 0 λ≥0 まず,λ > 0 と仮定すると,−x21 + 4x1 − x2 = 0.また,第 1,2 式より − 2x1 + 4 + (−2x1 + 4)λ = 0 (−2x1 + 4)(λ + 1) = 0 (−2x1 + 4)(−2x2 + 2) = 0 ∴ x1 = 2, x2 = 1 x1 = 2 のとき,x2 = 4 であるから λ = −7 となるが,これは矛盾. 次に,x2 = 1 とすると,λ = −1 < 0.これは矛盾. そこで,λ = 0 とする.このとき,−2x1 + 1 = 0,−2x2 + 1 = 0.よって x1 = 2,x2 = 12 .その とき,f = 17 4 . 107 g 2 (x) x2 共通接線 1 g (x) 尖点 f (x) x1 図 11.6: 尖点の存在 x2 f (x) ∇g g 1 (x) = 0 1 ∇f ∇g 2 g 2 (x) = 0 x1 図 11.7: 退化のケース 11.3 キューン=タッカー条件と制約想定 極値を特徴づけるキューン=タッカー条件は常に成立するわけではない.前節の (11.5) において g1 (x∗ ) = 0 が仮定されていたし,(11.15) では, g 1 (x∗ ) g 1 (x∗ ) 1 2 (11.16) 2 ∗ = 0 g1 (x ) g22 (x∗ ) が必要である.その他,尖点のケース(図 11.6)や退化のケース(図 11.7)を排除する必要がある. このように,キューン=タッカー条件が極値の必要条件となるためには,制約条件に何らかの制約を 加える必要がある.これを制約想定という. 第 1 の制約想定は正規条件と呼ばれるものである.添字の集合 I(x) を I(x∗ ) = {j| g j (x∗ ) = 0} と定義する. 108 定義 11.1 正規条件 (regularity condition) x∗ において導関数の集合 {∇g j | j ∈ I(x∗ )} の要素が 1 次独立であるとき,x∗ において正規条件 が満たされるという. これを用いて,次の定理を証明することができる. 定理 11.1 定義域において連続微分可能な n 変数実数値関数 f, g 1 , g 2 , · · · , g m が与えられたとする. 問題 max f (x) x ( あるいは min f (x)) x s.t. g j (x) ≥ 0 (j = 1, 2, · · · , m) が内点解 x∗ をもち,x∗ = (x∗1 , x∗2 , · · · , x∗m ) において正規条件が成り立つとする.このとき m 個の 独立変数 λ = (λ1 , λ2 , · · · , λm ) を新たに導入して,関数 L(x, λ1 , λ2 , · · · , λm ) = L(x, λ) = f (x) + m λj g j (x) (11.17) (i = 1, 2, · · · , n) (11.18) j=1 を作ると,ある λ∗ = (λ∗1 , λ∗2 , · · · , λ∗m ) に対して m ∂ L(x∗ , λ∗ ) = fi (x∗ ) + λ∗j gij (x∗ ) = 0 ∂xi j=1 ∂ L(x∗ , λ∗ ) = g j (x∗ ) ≥ 0 (j = 1, 2, · · · , m) ∂λj ∂ λ∗j L(x∗ , λ∗ ) = λ∗j g j (x∗ ) = 0 (j = 1, 2, · · · , m) ∂λj λ∗j ≥ 0 (j = 1, 2, · · · , m) (11.19) (11.20) (11.21) が成り立つ. (証明)x∗ において極大値をとり,m 個の制約式が拘束的であるとする.すなわち, g j (x∗ ) = 0 (j = 1, 2, · · · , m ≤ m) 拘束的ではない制約式を無視してラグランジュ関数を作る. L(x, λ) = f (x) + m λj g j (x) (11.22) j=1 このとき,ラグランジュ未定乗数法より,ある (λ∗1 , λ∗2 , · · · , λ∗ m ) に対して m ∂ L(x∗ , λ∗ ) = fi (x∗ ) + λ∗j gij (x∗ ) = 0 (i = 1, 2, · · · , n) ∂xi j=1 (11.23) ∂ L(x∗ , λ∗ ) = g j (x∗ ) = 0 ∂λj (11.24) (j = 1, 2, · · · , m ) まず,(11.24) に付随する乗数が,λ∗j ≥ 0 となることを示す.いま g j (x∗ ) − αk ≥ 0 (k = 1, 2, · · · , m ) 109 とし,付随する乗数を λk とする.αk は最初は 0 で,ごくわずか > 0 だけ増加させるとする.これ により実行可能領域は縮小するので,目的関数の最大値は増大することはない.よって, df (x∗ ) ≤ 0 k = 1, 2, · · · , m dαk ところで,ラグランジュ関数を Lα (x, λ) = f (x) + m λk {g k (x) − αk } (11.25) k=1 とすれば,包絡線定理より df (x∗ ) ∂Lα = = −λk ≤ 0 dαk ∂αk ∴ λk ≥ 0 (11.26) となる.ここで,g j (x) > 0 となる制約に付随する乗数に対しては λj = 0,すなわち λm +1 = λm +2 = · · · = λm = 0 とすると L(x, λ) = f (x) + m λj g j (x) j=1 = f (x) + m λj g j (x) j=1 したがって,極大化の 1 階の条件 (11.24) は λ∗j ≥ 0, g j (x∗ ) ≥ 0, λ∗j g j (x∗ ) = 0 (j = 1, 2, · · · , m) 条件 (11.23) は m ∂ L(x∗ , λ∗ ) = fi (x∗ ) + λ∗j gij (x∗ ) = 0 (i = 1, 2, · · · , n) ∂xi j=1 よって,定理が成立する. 正規条件は ∇g1 (x∗ ) と ∇g2 (x∗ ) が 1 次従属ならば, 使うことができない.そのようなケースでは 別の制約想定が必要とされる.それが次の条件である. 定義 11.2 スレーター条件 (Slater’s condition) すべての j = 1, 2, · · · , m に対して g j (x) が凹関数であり,g j (x̄) > 0 となる x̄ > 0 が存在する. 練習問題 キューン=タッカー条件を導き,解を求めよ. 1. max x1 ≥0,x2 ≥0 ln x1 + ln(x2 + 5) s.t. 4 − x1 − x2 ≥ 0 2. max 6x1 − 2x21 + 2x1 x2 − 2x22 x1 ≥0,x2 ≥0 s.t. x1 + 2x2 ≤ 2, 1 + x1 − x22 ≥ 0 110 3. max x1 ≥0,x2 ≥0 − 8x21 − 10x22 + 12x1 x2 − 50x1 + 80x2 s.t. x1 + x2 ≤ 1, 4. max x1 ≥0,x2 ≥0 − x21 − 3x22 + 3x1 x2 + x1 + 2x2 s.t. 2x1 + x2 ≤ 2, 5. max x1 ≥0,x2 ≥0 max −x1 + x2 ≤ −1 − 2x21 − 2x22 + 2x1 x2 + 6x1 s.t. 3x1 + 4x2 ≤ 6, 6. 8x21 + x22 ≤ 2.25 −x1 + 4x22 ≤ − 1 3 100 + ln x1 + ln x2 x1 ≥0,x2 ≥0 s.t. 98 − x21 − x22 ≥ 0, 418 − x21 − 6x22 ≥ 0 111