上頁 12345 次頁

凸函數、Jensen 不等式與 Legendre 變換 (第 2 頁)

林琦焜

 

首頁 | 搜尋

.原載於數學傳播第十九卷第四期
.作者當時任教於成大數學系
對外搜尋關鍵字
 
二、凸函數

我們從凸函數之定義開始

定義: f 為一定義在區間 $I\subseteq \mathbf{R}$ 上之一實值函數 (real-valued function)

\begin{displaymath}
f : I \rightarrow \mathbf{R}
\end{displaymath}

若對任意的 $0 < \lambda < 1$, $a,b \in I$f 滿足下式

\begin{displaymath}
f(\lambda a + (1-\lambda) b) \; \leq \; \lambda f(a) + (1-\lambda) f(b)
\eqno{(1)}
\end{displaymath}

則稱 f 為一凸函數 (convex function)。



圖一

其幾何意義為連接 (a,f(a)),(b,f(b)) 兩點的弦,永遠在弧 y=f(x) 之上(圖一)。

利用分點公式我們可將(1)式表為下列之形式:

\begin{displaymath}
\begin{eqalign}
f(x) & \leq \frac{b-x}{b-a} f(a) + \frac{x-a...
... &= f(b) + \frac{f(b)-f(a)}{b-a}(x-b)
\end{eqalign} \eqno{(2)}
\end{displaymath}

由(2)式可得

\begin{eqnarray*}
&& f(x)-f(a)\leq\frac{f(b)-f(a)}{b-a}(x-a) \\
&& \frac{f(b)-f(a)}{b-a}(b-x)\leq f(b)-f(x)
\end{eqnarray*}



\begin{displaymath}
\frac{f(x)-f(a)}{x-a} \leq \frac{f(b)-f(a)}{b-a}
\leq \frac{f(b)-f(x)}{b-x}
\eqno{(3)}
\end{displaymath}



圖二

其幾何意義從圖形上之斜率可知。

我們的主要目的在於如何將(1)式推廣至一般情形。首先同時也是自然而然地(在數學上 2 與 n 是沒有差別的)將(1)式推廣至 n 個點 x1,…,xn。(可用歸納法)

\begin{displaymath}
f \left( \sum_{i=1}^n \lambda_i x_i \right)
\leq \sum_{i=1}^n \lambda_i f(x_i)
\eqno{(4)}
\end{displaymath}

其中 $x_i \in I$, $\lambda_i \geq 0$, $\sum_{i=1}^n \lambda_i=1$,$1\leq i\leq n$。有時候我們(有目的地)令

\begin{displaymath}
\lambda_i = \frac{p_i}{\sum_{j=1}^n p_j}
\eqno{(5)}
\end{displaymath}

則(4)式可改寫為

\begin{displaymath}
f \left( \frac{\sum_{i=1}^np_ix_i}{\sum_{j=1}^np_j} \right)
\leq \frac{\sum_{i=1}^np_if(x_i)}{\sum_{j=1}^np_j}
\eqno{(6)}
\end{displaymath}

這就是 Jensen 不等式之一形式。若取特殊的 pi,例如:

\begin{displaymath}
p_i=1,\quad i=1,2,\cdots,n
\end{displaymath}

則(6)式可表為

\begin{displaymath}
f \left( \frac{\sum_{i=1}^nx_i}{n} \right)
\leq \frac{1}{n}\sum_{i=1}^nf(x_i)
\eqno{(7)}
\end{displaymath}

典型的凸函數有底下的類型:

\begin{displaymath}
f(x)=x^n,e^x,x\log x,-\log x, \quad n>1
\eqno{(8)}
\end{displaymath}

在尚未做進一步推廣前,Jensen 不等式最直接的應用就是幾何平均與算數平均之關係;讀者可自行練習

例題 1:(幾何-算數平均) 試證
(a) $(\prod_{i=1}^n a_i)^{\frac{1}{n}}
\leq \frac{1}{n} \sum_{i=1}^n a_i, \quad a_i>0$
(b) $\prod_{i=1}^n y_i^{\alpha_i}
\leq \sum_{i=1}^n \alpha_i y_i, \quad
\alpha_i>0, y_i>0, \sum_{i=1}^n \alpha_i = 1$

   

上頁 12345 次頁

回頁首
 
(若有指正、疑問……,可以在此 留言寫信 給我們。)
EpisteMath

EpisteMath (c) 2000 中央研究院數學所、台大數學系
各網頁文章內容之著作權為原著作人所有


編輯:黃信元 / 繪圖:張琇惠、簡立欣 最後修改日期:4/26/2002