上頁 123 次頁

蓋理論(Theory of Majorization)及其在不等式上的應用 (第 2 頁)

楊重駿;楊照崑

 


首頁 | 搜尋

.原載於數學傳播第六卷第四期

註釋
對外搜尋關鍵字
 
凸函數的定義及其性質

為方便計我們以 R 代表所有實數的集合,R+ 表所有正實數及 0 的集合。以下所討論的函數,都是實函數,若不特別聲明其定義域 (domain of definition) 則自然指 R

定義:
g(x) 為一定義在區間 (a,b) 上的函數, 若過於任何在 (a,b) 中的兩點 x,y, 下面不等式:

\begin{displaymath}g(\lambda x+\mu y)\leq \lambda g(x)+\mu g(y)\quad \mu \geq 0,\quad \lambda \geq 0,\quad \mu +\lambda=1\eqno{(1)}\end{displaymath}

恆成立。如此的 g 稱為在 (a,b) 上的一凸函數。

我們要特別對此種函數的圖形作一觀察,也好使讀者明瞭為何稱滿足不等式(1)式者的函數為凸函數或上凹函數。如圖(1),我們將證明任何在



圖1

(a,b) 區間之三點 A(x),B(y)C(z),設 x<z<y, 則 g(z) 之值必位於連結 D(x,g(x))F(y,g(y)) 兩點之直線下方。 這個證明很簡單。由 A,B,C 作垂線分別交 $\overline{DF}$D,F,E,又由 D 作平行於 x 軸之直線交 $\overline{EC}$$\overline{EB}$GH。若令

\begin{displaymath}\mu =\frac{z-x}{y-x},\quad \lambda=\frac{y-z}{y-x}\end{displaymath}

$\mu \geq 0$$\lambda \geq 0$$\mu +\lambda =1$。又由此例知

\begin{displaymath}\frac{\overline{EG}}{\overline{FH}}=\mu\end{displaymath}


\begin{displaymath}\begin{array}{rcl}
EC&=&EG+GC=\mu FH+GC\\
&=&\mu (FH+HB)+(1-\mu)DA\\
&=&\mu g(y)+\lambda g(x)\\
\end{array}\end{displaymath}

由(1)及 $z=\mu y+\lambda x$

\begin{displaymath}g(z)=g(\mu y+\lambda x)\leq\mu g(y)+\lambda g(x)=EC\end{displaymath}

故直線 $\overline{DF}$ 上的點高於點 (z,g(z));x<z<y。這個限制,使得 g 的圖形,自然非得向內凹陷,也就是所謂的凸(或上凹)函數名稱的由來。

知道滿足條件(1)的函數為凸函數。但問題是有時我們無法利用它來判定某些函數是否為凸函數。 因(1)本身涉及的是任何兩個介於 (a,b) 中的點,我們也不可能逐一地檢驗。好在由於上面凸函數的幾何性質, 我們有時可以利用求一個函數的第二階導函數,來判定一個函數是否為凸函數? 假定 g(x)(a,b) 上有定義且其第二階導函數 g''(x)(a,b) 上到處存在 (注意:不見得每個函數的第二階導函數存在,但在一般所見到的函數,只要不是精工巧構的,總有第二階或更高階的導函數), 若 $g''(x)\geq 0$, $\forall x\in (a,b)$,則 g(x)(a,b) 上的一凸函數,例如 $g(x)=\log x(0<x<\infty)$

\begin{displaymath}g'(x)=-\frac{1}{x},\quad g''(x)=\frac{1}{x^2}>0,\quad\forall x\in(0,\infty).\end{displaymath}

讀者不妨試描繪 g(x) 的圖形大要。

對於無微分觀念的讀者,我們提供下面一個凸函數的試驗法:設 g(x) 為定義在區間 (a,b) 上的一函數,且滿足 $\vert g(x)\vert\leq M<\infty$, $\forall x\in (a,b)$,(即 g 為有界的)若 g(a,b) 上滿足: $\forall x,y\in(a,b)$

\begin{displaymath}g(\frac{x+y}{2})\leq \frac{1}{2}g(x)+\frac{1}{2}g(y)\end{displaymath}

g(a,b) 上的一凸函數。

這個證明涉及極限,連續等概念,讀者姑且信之,以後我們會用此條件,來檢驗某些函數是否為凸函數。

由於我們以後的討論,不僅限於一個變數,一般會在 n ($n\geq 2$) 度的實向量空間 Rn$R^{\textstyle n^+}$ 中。下面首先證明(1)式可以推廣到 n>2 的一般情形。

定理1:
g(a,b) 上的一凸函數, 則 $\forall x_i \in(a,b)$, (i=1,2,…,n); $\lambda_i\geq 0$, (i=1,2,…,n), $\sum^n_{i=1}\lambda_i = 1$,

\begin{displaymath}\begin{array}{rcl}
&&g(\lambda_1x_1+\lambda_2x_2+\cdots\cdots...
...ng(x_n)\\
&=&\sum^n_{i=1}\lambda_ig(x_i)
\end{array}\eqno{(2)}\end{displaymath}

證:
用數學歸納法。很顯然(2)式對 n=1,2 時皆成立。 假設(2)式對 n=k-1 時成立,我們將證對 n=k 時(2)式亦成立。 令 $\lambda_1x_1+\lambda_2x_2=\lambda y$, $\lambda=\lambda_1+\lambda_2$ 則由歸納法假設得知

\begin{displaymath}\begin{array}{rcl}
&&g(\lambda_1x_1+\lambda_2x_2+\cdots\cdots...
...
&\leq&\lambda g(y)+\sum^n_{i=1}\lambda_ig(x_i)\\
\end{array}\end{displaymath}

因為 $\lambda +\lambda_3 +\lambda_4+\cdots +\lambda_k=1$k-1 項,又

\begin{displaymath}\begin{array}{rcl}
\lambda g(y)&=&\lambda g(\frac{\lambda_1}{...
...mbda}g(x_2)\}\\
&=&\lambda_1g(x_1)+\lambda_2g(x_2)
\end{array}\end{displaymath}

此式及上式得知(2)式對 n=k 亦成立。故由歸納法原理知(2)式恆成立。

我們現在舉些有關凸函數的應用。

定理2:(Arithematic-Geometric Mean Inequality)
$a_i\in R^+$i=1,2,…,n,則

\begin{displaymath}\frac{a_1+a_2+\cdots+a_n}{n}\geq\sqrt[n]{a_1a_2\cdots\cdots a_n}\end{displaymath}

註:
這就是所謂的算術平均大於幾何平均。
證:
很明顯若 ai 中有一為 0 則不等式自然成立,故可設 ai>0$y=g(x)=-\log x$, x>0 則依據圖形或考慮 $g''(x)=\frac{1}{x^2}$ 得知 g$(0,\infty)$ 上為一凸函數。於是

\begin{displaymath}g(\frac{a_1}{n}+\frac{a_2}{n}+\cdots +\frac{a_n}{n})<\sum\frac{1}{n}g(a_i)\eqno(3)\end{displaymath}


\begin{displaymath}g(\frac{a_1}{n}+\frac{a_2}{n}+\cdots +\frac{a_n}{n})=-\log(\frac{a_1+a_2+\cdots+a_n}{n})\end{displaymath}


\begin{displaymath}\sum_{i=1}^n\frac{g(a_i)}{n}=\frac{-1}{n}\sum_{i=1}^n\log a_1\end{displaymath}

於是

\begin{displaymath}
\log (\frac{a_1+a_2+\cdots+a_n}{n}) > \log \sqrt[n]{a_1a_2 \cdots a_n}
\end{displaymath}

$\log$ 為正實數的遞增函數,所以由上式得

\begin{displaymath}
\frac{a_1+a_2+\cdots+a_n}{n} \geq \sqrt[n]{a_1a_2 \cdots a_n}
\end{displaymath}

定理3 (Cauchy 不等式)
ai (i=1,2,…,n) 及 bi (i=1,2,…,n) 為兩組正實數, 則

\begin{displaymath}(\sum_{i=1}^n a_ib_i)^2\leq (\sum_{i=1}^n a_i^2)(\sum_{i=1}^n b_i^2)\end{displaymath}

證:
y=g(x)=x2,則易知 g 為一凸函數。令 $x_i=\frac{a_i}{b_i}$ti=bi2$t=\sum_{i=1}^nt_i$$\lambda_i=\frac{t_i}{t}$i=1,2,…,n 則由定理1可得

\begin{displaymath}(\sum_{i=1}^n\lambda_ix_i)^2\leq\sum_{i=1}^n\lambda_ix_i^2\end{displaymath}


\begin{displaymath}\begin{array}{rcl}
(\sum_{i=1}^nt_ix_i)^2&\leq&t^2\sum_{i=1}^...
...i^2)\\
&=&(\sum_{i=1}^n b_i^2)(\sum_{i=1}^n a_i^2)
\end{array}\end{displaymath}

原式得證。

註:
原命題對所有的實數皆成立,在此為簡明計,假設所有的bi不為零,不然可把為0的bi代以$\varepsilon_i$(充分小的參數)將結果取極限,仍可得原式。

現在我們討論具有下列形式的不等式:

\begin{displaymath}\phi (\overbrace{\overline{x},\overline{x},\cdots,\overline{x...
...}\selectfont \char 95}}})\leq\phi(x_1,x_2,\cdots,x_n)\eqno{(4)}\end{displaymath}

其中 $\overline{x}=\frac{x_1+x_2+\cdots+x_n}{n}$, x1,x2,…,xn 為實數。如果我們令

\begin{displaymath}\phi(y_1,y_2,\cdots,y_n)=\sum_{i=1}^n g(y_i)\end{displaymath}

則前面的(3)式就可表成(4)的形式。由於(4)的特殊形式, 使得我們不妨考慮下面更廣泛的形式:

\begin{displaymath}\phi(y_1,y_2,\cdots,y_n)\leq\phi(x_1,x_2,\cdots,x_n)\eqno(5)\end{displaymath}

此時 y1,y2,…,yn 不一定要相等,但它們在某些意義上 (這是我們將要進一步討論的地方)比 x1,x2,…,xn 要來得緊湊些, 即沒有 x1,x2,…,xn 來得分散。我們主要問的就是 {xi}i=1n{yi}i=1n 在何種條件下,對何種函數 $\phi$,(5)式總成立?

   

上頁 123 次頁

回頁首
 
(若有指正、疑問……,可以在此 留言寫信 給我們。)
EpisteMath

EpisteMath (c) 2000 中央研究院數學所、台大數學系
各網頁文章內容之著作權為原著作人所有


編輯:鄧惠文 最後修改日期:5/26/2002