1│2│3│4 |
.原載於數學傳播十三卷三期 .作者當時任教於美國密西根州立大學數學系 | ||
熵 (Entropy)
李天岩 |
在我們日常生活中,似乎經常存在看「不確定性」的問題。比方說,天氣預報員常說「明天下雨的可能性是 70%。這是我們習以為常的「不確定性」問題的一個例子。一般不確定性問題所包含「不確定」(uncertainty) 的程度可以用數學來定量地描述嗎?在多數的情況下是可以的。本世紀40年代末,由於信息理論 (information theory) 的需要而首次出現的 Shannon 熵,50年代末以解決遍歷理論 (ergodic theory) 經典問題而嶄露頭角的 Kolmogorov 熵,以及60年代中期,為研究拓樸動力系統 (topological dynamical system) 而產生的拓樸熵 (topological entropy) 等概念,都是關於不確定性的數學度量。它們在現代動力系統和遍歷理論中,扮演看十分重要的角色。在自然科學和社會科學中的應用也日趨廣泛。本文的主旨在於引導盡量多的讀者在這一引人入勝的領域中尋幽訪勝,而不必在艱深的數學語言中躑躅不前。物理、化學家們也許對他們早已熟悉的熱力學熵更覺親切。我們在最後一節也將給古典的 Boltzmann 熵作一番數學的描述。
設想我們有兩枚五分硬幣,一枚硬幣表面光滑,材料均勻,而另一枚硬幣則表面粗糙,奇形怪狀。我們把硬幣上有人頭的那面叫正面,另一面稱反面。然後在一個光滑的桌面上旋轉硬幣,等它停下來後,看是正面或是反面。這是一個不確定性的問題:可能是正面,可能是反面。第一枚硬幣,由於正面和反面的對稱性,正面或反面朝上的機率各為一半。但對第二枚硬幣來說,由於材料磨損,正面和反面不再對稱。可能正面朝上的機率為 70%,反面朝上的機率為 30%。 對「究竟會是正面?或會是反面?」這一不確定性問題來說, 第一枚硬幣「不確定」的程度顯然比第二枚硬幣要大了許多。 若要下賭注的話,我想還是下第二枚硬幣的正面朝上,較為保險,不是嗎? 現在假設鑄幣局的先生們別出心裁,把硬幣設計成圖1-1所示的形狀, 其上為正,其下為反,則無論我們怎樣旋轉它,最終總是正面朝上。 它「不確定」的度量應該為零-其結果在未旋轉前都已確定, 那來什麼「不」確定度呢?
有了這些直接的觀察,我們可以在數學上做文章了。 假設樣本空間 (Sample space) X 有 n 的基本事件 (events), 其基本事件 wi 的概率為 pi, i=1,2,…,n。 我們記之為 。 當然,我們有基本關係式 , i=1,2,…,n。 我們要定義一個函數 H 它的定義域是所有的樣本空間, 它在樣本空間 的值, 我們用 來表示(X 省略掉) 我們要拿這個數來刻劃具有概率分別為 p1,p2, …, pn 的事件 w1,w2,…,wn 的樣本空間的「不確定度」。 若要精確地反映試驗結果的不確定度,似乎必須滿足下列三個基本條件:
下面我們來證明一個重要結論:
由定理中(*)式可知,若對某一個 i 有 pi=1,則 , 這正好和我們的願望相符:pi=1 意味著對應的事件總是發生的,因而不確定度為零。 因此,我們可以給出如下關於熵的定義,這個定義的熵 (entropy),又稱為 shannon 熵。
在本節之初,我們已知旋轉光滑硬幣時,正面朝上有 的機率, 反面朝上也有 的機率,它的不確定度有最大。 既然熵是關於不確定度的一種數學度量,這就自然地要求當 時,H 給出最大值。 要注意的是,我們在推導 H 表達式的三個基本條件中,並無強加此項要求。現在我們要證明:這個直觀的要求,事實上可由上述三個基本條件推出結論。
這節定義的熵起源於信息理論的研究。是 C. Shannon 在1948年引進的。 在此基礎上,蘇聯數學家 A.N. Kolmogorov 在1958年給出了動力系統熵的概念。 從而揭開了現代遍歷理論研究的新篇章。
|
對外搜尋關鍵字: .信息理論 .遍歷理論 .Shannon .Kolmogorov .Lebesgue .Bernoulli .Clausius .Boltzmann .中央極限定理 |
|
(若有指正、疑問……,可以在此 留言 或 寫信 給我們。) |
EpisteMath (c) 2000 中央研究院數學所、台大數學系 各網頁文章內容之著作權為原著作人所有 |
編輯:朱安強 / 繪圖:簡立欣 | 最後修改日期:5/6/2002 |