Lagrange(拉格朗日,1736∼1813)18世紀最偉大的數學家之二,另一位是長他29歲的 Euler(尤拉,1707∼1783)。Euler 賞識 Lagrange,在1766年和 d'Alembert 一起推薦 Lagrange 為(柏林科學院)Euler 的繼承人。

在他一生浩瀚的工作中,最為所有數學家熟知的發明就是 Lagrange multiplier(拉格朗日乘數)或 Lagrange multiplier method,這是一個求極值的方法。比方在兩個變數的時候,我們要找 f(x,y) 的極值,一個必要的條件是:

\begin{displaymath}
\frac{\partial f}{\partial x}=\frac{\partial f}{\partial y}=0
\end{displaymath}

但是如果 x,y 的範圍一開始就被另一個函數 g(x,y)=0 所限制,Lagrange 提出以 $f(x,y)+\lambda g(x,y)$xy 的偏導數為 0,來代替 $\frac{\partial f}{\partial x}=\frac{\partial f}{\partial y}=0$ 作為在 g(x,y)=0 上面尋找 f(x,y) 極值的條件。式中引入的 λ 是一個待定的數,稱為乘數,因為是乘在 g 的前面而得名。

首先我們注意,要解的是 x,y 和 λ 三個變數,而

\begin{eqnarray*}
&&\frac{\partial f}{\partial x}+\lambda\frac{\partial g}{\part...
...partial y}+\lambda\frac{\partial g}{\partial y}=0 \\
&&g(x,y)=0
\end{eqnarray*}


雖然有三個方程式,原則上是可以解得出來的。

f(x,y)=x g(x,y)=x2+y2-1 為例,當 x,y 被限制在 x2+y2-1=0 上活動時,對下面三個方程式求解

\begin{eqnarray*}
&&\frac{\partial}{\partial x}[x+\lambda(x^2+y^2-1)]=1+2\lambda...
...l}{\partial y}[x+\lambda(x^2+y^2-1)]=2\lambda y\\
&&x^2+y^2-1=0
\end{eqnarray*}


答案有兩組,分別是 x=1y=0 $\lambda=-\frac{1}{2}$x=-1y=0 $\lambda=\frac{1}{2}$。 對應的是 x2+y2-1=0 這個圓的左、右兩個端點。它們的 x 坐標分別是 1-1,一個是最大可能,另一個是最小可能。

讀者可能認為為何不把 x2+y2-1=0 這個限制改寫為 $x=\cos\theta$$y=\sin\theta$ 來代入得到 $f(x,y)=f(\cos\theta ,\sin\theta)$,然後令對 θ 的微分等於 0 來求解呢?對以上的這個例子而言,當然是可以的,但是如果 g(x,y) 是相當一般的形式,而無法以 x,y 的參數式代入滿足,或是再更多變數加上更多限制的時候,舊的代參數式方法通常是失效的 註1

這個方法的意義為何?原來在 g(x,y)=0 的時候,不妨把 y 想成是 x 的隱函數,而有 g(x,y(x))=0,並且 f(x,y) 也變成了 f(x,y(x))。令 $\frac{d}{dx}f(x,y(x))=0$ 根據連鎖法則,我們得到

\begin{displaymath}
f_x+f_y\frac{dy}{dx}=0
\end{displaymath}

和(因為 $\frac{d}{dx} g(x,y(x))$ 恆等於 0)

\begin{displaymath}
g_x+g_y\frac{dy}{dx}=0
\end{displaymath}

因此有行列式為 0 的結論。

\begin{displaymath}
\left\vert
\begin{array}{cc}
f_x&f_y\\
g_x&g_y
\end{array}\right\vert
=0
\end{displaymath}

這表示 fx,fygx,gy 成比例,所以有 λ 註2

\begin{displaymath}
\begin{array}{lll}
f_x&=&\lambda g_x\\
f_y&=&\lambda g_y
\end{array}\end{displaymath}

另外一個解釋是幾何圖形的角度來考量。我們考慮 f(x,y) 的等位曲線,亦即 f(x,y)=c 諸曲線,如果曲線 f(x,y)=cg(x,y)=0 互相穿過,亦即如果互不相切,則 f(x,y) 稍稍大於 c(或稍稍小於 c)都會持續穿過 g(x,y)=0,這就表示在 g(x,y)=0 之上,c 不可能是一個極值,反過來說,如果 c 是極值的話,f(x,y)=c 這條曲線和 g(x,y)=0 一定互相切著,會有相同的切線,也可以說有相同的法線。但是 f(x,y)=cg(x,y)=0 的法線方向分別是 $(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y})$ $(\frac{\partial g}{\partial x},\frac{\partial g}{\partial y})$,它們必須平行,因此

\begin{displaymath}
(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y}...
... (\frac{\partial g}{\partial x},\frac{\partial g}{\partial y})
\end{displaymath}

λ 待定。從這裡也可以看出萬一 $(\frac{\partial g}{\partial x},\frac{\partial g}{\partial y})=(0,0)$ 那 λ 多半是求不出來的。然而 $(\frac{\partial g}{\partial x},\frac{\partial g}{\partial y})\neq
(0,0)$ 恰好保證了 yxxy 的隱函數,這又回到了上一段以隱函數為出發點來解釋乘數法的前提。

乘數法有許多用處,舉凡在若干限制條件之下求極值的問題,都可以考慮引用這個方法。當然如前所述,引用本法雖然有若干限制,這些限制反映了問題本身的特質,本來就是問題的一部分,值得好好推敲。

Lagrange 一生貢獻無數,Boyer 註3 讚美他是

... the keenest mathematician of the eighteenth century ...
(十八世紀最敏銳的數學家)

他所發明的乘數法展現了他對這類問題敏銳的洞察力。這正是 "keenest" 最佳的詮釋。



Footnotes

...註1
如果在 g1(x,y,z)=0g2(x,y,z)=0 這樣的限制之下求f(x,y,z) 的極值。Lagrange 乘數法需列出下面五個方程式

\begin{eqnarray*}
\frac{\partial}{\partial x} [f+\lambda_1 g_1+\lambda_2 g_2] &=...
...f+\lambda_1 g_1+\lambda_2 g_2] &=& 0 \\
g_1 &=& 0 \\
g_2 &=& 0
\end{eqnarray*}


要解的變數有 x,y,z $\lambda_1,\lambda_2$ 一共五個。
...註2
當然也可以寫成 $f_x+\lambda g_x=0$ $f_y+\lambda g_y=0$。只是要注意,這裡有一個先決條件就是 gx,gy 不能同時為 0,同時為 0 會使 yx 無法表成對方的反函數,請看下面的例子:設 f(x,y)=x, g(x,y)=y2-x3,則

\begin{eqnarray*}
&&\frac{\partial}{\partial x}[x+\lambda(y^2-x^3)]=1-3\lambda x...
...rtial}{\partial y}[x+\lambda(y^2-x^3)]=2\lambda y\\
&&y^2-x^3=0
\end{eqnarray*}


易見這個方程式無解,但 f(x,y) 的極值是有的,它發生在 (0,0) 之處,只不過在 (0,0)gx=0=gy,所以乘數法是失效的。
...註3
Carl B. Boyer:《A History of Mathematics》, Princeton University Press.
hsuehc 2001-09-04