この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "ラグランジュの未定乗数法"
ラグランジュの未定乗数法(ラグランジュのみていじょうすうほう、英: method of Lagrange multiplier)とは、束縛条件のもとで最適化を行うための数学(解析学)的な方法である。いくつかの変数に対して、いくつかの関数の値を固定するという束縛条件のもとで、別のある1つの関数の極値を求めるという問題を考える。各束縛条件に対して定数(未定乗数、Lagrange multiplier)を用意し、これらを係数とする線形結合を新しい関数(未定乗数も新たな変数とする)として考えることで、束縛問題を普通の極値問題として解くことができる方法である。 ラグランジュの未定乗数法は、次のような定理として記述される。 束縛条件 g(x, y) = 0 の下で、f(x, y) が最大値となる点 (a , b) を求める問題、つまりmaximize f ( x , y ) , {\displaystyle f(x,y),} subject to g ( x , y ) = 0 {\displaystyle g(x,y)=0} という問題を考える。ラグランジュ乗数を λ とし、 F ( x , y , λ ) = f ( x , y ) − λ g ( x , y ) {\displaystyle F(x,y,\lambda )=f(x,y)-\lambda g(x,y)} とおく。点 (a, b) で .mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output .sfrac.tion,.mw-parser-output .sfrac .tion{display:inline-block;vertical-align:-0.5em;font-size:85%;text-align:center}.mw-parser-output .sfrac .num,.mw-parser-output .sfrac .den{display:block;line-height:1em;margin:0 0.1em}.mw-parser-output .sfrac .den{border-top:1px solid}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);height:1px;margin:-1px;overflow:hidden;padding:0;position:absolute;width:1px}∂g/∂x と ∂g/∂y の少なくとも一方が 0 でないならば、α が存在して点 (a, b, α) で ∂ F ∂ x = ∂ F ∂ y = ∂ F ∂ λ = 0 {\displaystyle {\frac {\partial F}{\partial x}}={\frac {\partial F}{\partial y}}={\frac {\partial F}{\partial \lambda }}=0} が成り立つ[1]。 n 次元空間の点 x = (x1, …, xn) のある領域 R を定義域とする被評価関数 z = f(x) が、同じ領域を定義域とする m 次元ベクトル値関数 G ( x ) = ( g 1 ( x 1 , … , x n ) ⋮ g m ( x 1 , … , x n ) ) = 0 ( 1 ) {\displaystyle {\boldsymbol {G}}({\boldsymbol {x}})={\begin{pmatrix}g_{1}(x_{1},\dots ,x_{n})\\\vdots \\g_{m}(x_{1},\dots ,x_{n})\end{pmatrix}}={\boldsymbol {0}}\qquad (1)} の下で、R 内の点 x において極値をとるための必要条件は、その点における f の勾配ベクトル ∇ f = t ( ∂ f ∂ x 1 , … , ∂ f ∂ x n ) {\displaystyle \nabla f={}^{t}{\begin{pmatrix}{\dfrac {\partial f}{\partial x_{1}}},\dots ,{\dfrac {\partial f}{\partial x_{n}}}\end{pmatrix}}} が、その点で、m 個の gi それぞれの勾配ベクトルが張る m 次元線型部分空間に含まれること、すなわち、スカラーの組 λ = (λ1, …, λm) を用いて、 ∇ f = ∑ i = 1 m λ i ∇ g i ( 2 ) {\displaystyle \nabla f=\sum _{i=1}^{m}\lambda _{i}\nabla g_{i}\qquad (2)} が成り立つことである。移項して ∇ を取れば、 f ( x ) − ∑ i = 1 m λ i g i ( x ) {\displaystyle f({\boldsymbol {x}})-\sum _{i=1}^{m}\lambda _{i}g_{i}({\boldsymbol {x}})} が停留点をとることである。ただし、{∇g1, …, ∇gm} は一次独立、すなわち dim ( ∇ g 1 , … , ∇ g m ) = m {\displaystyle \dim(\nabla g_{1},\dots ,\nabla g_{m})=m} でなければならない。式(1)の m 本と式(2)の n 本の式を連立させて、x と λ の (n + m) 個の未知数について解けば、f の極値を与える候補点が得られる[2]。 簡単のため2次元の場合を考えよう。g (x, y) = c(ここで c は与えられた定数である)という条件の下、関数 f (x, y) を最大化するものとしよう。f の値を高さとしたグラフを考えると、高さが d の f の等高線は f (x, y) = d で与えられる。ここで、任意の曲線に沿って移動する点を考えると、この点が等高線を横切る場合、必ず f (x, y) は増加、もしくは減少するが、この点が等高線に沿って移動する場合は f (x, y) は変化しないことが分かる。この条件と通常の極値の条件を合わせて考えれば、曲線上で f (x, y) が最大をとる点では、f の等高線の接線と曲線の接線が平行となっているか、f の勾配がゼロとなっていることが分かる。ここで g (x, y) = c の接線は、g の勾配ベクトル ∇x,y g と直交し、また f の等高線 f (x, y) = d の接線は f の勾配ベクトル ∇x,y f と直交することを踏まえると、前述の条件は ∇ x , y f = λ ∇ x , y g {\displaystyle \nabla _{x,y}f=\lambda \nabla _{x,y}g} と書ける。ここで ∇ x , y f = ( ∂ f ∂ x , ∂ f ∂ y ) , ∇ x , y g = ( ∂ g ∂ x , ∂ g ∂ y ) {\displaystyle \nabla _{x,y}f=\left({\frac {\partial f}{\partial x}},{\frac {\partial f}{\partial y}}\right),\qquad \nabla _{x,y}g=\left({\frac {\partial g}{\partial x}},{\frac {\partial g}{\partial y}}\right)} である。定数 λ は f の勾配ベクトルと g の勾配ベクトルが平行ではあるが長さが一般に異なるために必要である。λ = 0 の場合、f (x, y) の勾配がゼロとなる条件になる。
定理
2次元の場合
一般の多次元の場合
解釈
幾何学的な説明図1:束縛条件 g (x,y ) = c に対して関数 f (x,y ) を最大化する場合。図2:図1の等高線地図。赤い線は束縛条件 g(x, y) = c を示す。青い線は f(x, y) の等高線。赤い線が青い等高線に接する点が解。
Size:39 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)』
担当:undef