上頁 1234 次頁

機率與訊息 (第 2 頁)

劉豐哲

 


首頁 | 搜尋

.原載於數學傳播第二卷第三期
.作者當時任職於中研院數學所

註釋
對外搜尋關鍵字
 
二、機率論的基本概念

我們假定讀者具有最基本的機率論的常識。本節的目的是利用簡化的一般性討論來得到我們所需要的簡單模型──有限機率空間。機率空間與實際問題之間的關係是初學者最感迷惑的東西;初學者常常問:為什麼需要機率空間?的確,在通常的實際問題中,事件的機率都非常顯明易見,我們只不過是採用一些計算機率的「規則」,以某些已知事件的機率來求出另外一些事件的機率。界定機率空間似乎是小題大作,多此一舉,徒然擾亂方寸(心)!關於這個問題,我們要從兩個層面來做總結的說明。第一個層面是計算機率時所採用的「規則」的合法性。這些規則所依靠的一些概念(例如隨機獨立性)常依各人的詮釋而異,因而產生了許多詭論。(請參閱熊昭教授文:〈 淺談幾個或然率上的詭論〉──原《數播》編者)機率空間的提出就在建造一個適當的體系,使得相關的主要概念都能具有明確的意義,並且把大家默許的,不經意所採用的計算規則做一個清楚的說明,以確定它的角色與地位。第二個層面是我們所建造的機率空間到底跟原先所出發的實際問題有什麼關係,是不是充分的描述了原先的問題。這是一個哲學性的問題;對於科學工作者而言,這個問題的掌握便是實踐。 其實,每一門數學都有這兩個層面;機率論的這兩個層面較難領會,一來機率論的年齡尚輕,我們的實踐還不充分,二來機率論的經驗基礎和其它數學比較起來,是在人類生活體驗中屬於較高層面的。這些問題的討論不是本文的目的。我們的重點是在傳達給讀者一個簡單而有用的觀點: 在觀察隨機現象時,我們得到了許多資料,將這些資料去蕪存菁,最後所列出來的簡明「圖表」就是機率空間。換句話說,一個機率空間就是觀察某個隨機現象的實驗總結

在下面的討論中,例子很少。我們相信由讀者自己提供例子,更易達到本節的目的。

在電阻為一歐姆的電阻器的兩端施以一伏特的電壓,然後量一量通過的電流強度,即得一安培;如果施以二伏特之電壓,量得的電流強度則為二安培。在這個實驗中,決定電流強度的要件是電阻器兩端的電位差;由於電位差是我們能控制的,所以電流強度也是我們所能控制的。但是有的實驗卻不這樣,它的結果依著一些我們不知道的,或者我們無法控制的因素而變化;我們無法預知結果。例如隨手丟擲一枚硬幣時,我們無法預知最後出現的是正面還是反面,因為它是由硬幣丟出瞬間的狀態、所落地面以及硬幣的各種物理性質決定;而這些因素,對隨手丟出硬幣者來講,是未知的或無法控制的因素。另外,觀察孕婦生男生女,觀察丟擲骰子出現的點數,也就是屬於這類性質的實驗。我們把這類實驗稱為隨機實驗,或簡稱試驗

我們可以把試驗看成是對其一隨機現象的片面觀察,例如在丟擲兩顆骰子時,觀察它們出現點數之和,或觀察點數和為奇或為偶數,都是對「丟擲兩顆骰子」這個隨機現象的片面觀察。科學上只考慮能夠一再地予以獨立觀察的現象,因為只有這種現象才有可能做科學分析。我們所考慮的隨機現象也必須如此。譬如說,丟擲銅板便是一個可以重覆獨立觀察的現象,不同的人可以各自獨立地丟擲銅板,觀察銅板最後出現的面,或者同一個人也可以一再丟擲同一銅板,這些都不會影響現象本身的狀況。我們在這兒介紹的是機率論的簡單部份,因此此段假定試驗的可能結果只有有限多個。我們知道試驗的目的是在瞭解現象,如果我們無法從試驗的各個結果找出任何規律,那麼就不可能對相關的現象提出科學性的結論,這種現象對人們而便是迷惑的現象,須要做進一步的觀察才行。在這裡,我們只考慮具有下述規律的試驗(以後稱之為隨機規律性):

假設 A1, A2,…,An 為某一試驗的所有可能結果。如果在多次獨立地觀察這個試驗的結果時,各個結果 Ai 出現的次數與試驗次數之比圍繞在某個固定數 pi 的附近,則我們說這個試驗具有隨機規律性。p1, p2,…,pn 這些數表現了 A1,A2,…,An 這些結果出現的規律性。當然,$p_i\geq0$$\sum_{i=1}^n p_i=1$pi 稱為 Ai 出現的機率,或簡稱為 Ai 的機率。A1, A2,…,Anp1,p2,…,pn 是多次獨立地觀察試驗所得資料的總結,因此我們用

\begin{displaymath}\left<
\begin{array}{c}
A_1, A_2, \cdots, A_n \\
p_1, p_2, \cdots, p_n
\end{array}\right>
\end{displaymath}

表示這個試驗,或簡記為之 $\left< A_1 , A_2 , \cdots , A_n \right>$

為了簡單起見,我們只考慮某個隨機現象的有限多個試驗。在下面的討論中,我們先固定一個隨機現象;假設 $\alpha_1, \alpha_2$,…,$\alpha_n$,代表 m 個該隨機現象的試驗。我們用符號把 $\alpha_i$ 寫成 $\alpha_i$= $<A_1^{(i)} , A_2^{(i)} , \cdots , A_n^{(i)}>$。也就是說,在 $\alpha_i$ 這個試驗堙A一共有 ni 種可能的結果,我們分別把它們用 A1(i), A2(i),…,An(i) 表示出來。另一方面,我們可以把這 m 個試驗合在一起,看成是一個新的試驗。在新的試驗堙A觀察的結果將如下表示: ( AJ1(1), AJ2(2),…,AJm(m)),其中 $1\leq
j_i\leq n_i$。也就是說, 在我們用這 m 個試驗來觀察同一隨機現象時,如果依次觀察到結果分別是 AJ1(1), AJ2(2),…,AJm(m),則把它們集在一塊,看成是一個新的試驗的結果。我們用 $\alpha_1 \vee \alpha_2 \vee \cdots \vee \alpha_m$ 來表示以所有的 ( AJ1(1),AJ2(2),…,AJm(m)) 為可能結果的這個新的試驗。

舉個例吧!在隨手丟擲兩顆可分辨的骰子時,我們用 $\alpha_1$$\alpha_2$ 分別表示觀察第一顆及第二顆骰子出現的點數。即

\begin{displaymath}
\alpha_1=<A_1^{(1)}, A_2^{(1)}, \cdots, A_6^{(1)}>, \alpha_2=<A_1^{(2)}, A_2^{(2)}, \cdots, A_6^{(2)}>
\end{displaymath}

其中 Ai(1)Ai(2) 分別表示第一顆與第二顆骰子出現之點的情形。這時,

\begin{displaymath}
\alpha_1\vee\alpha_2=<(A_1^{(1)}, A_1^{(2)}), (A_2^{(1)}, A_2^{(2)}), \cdots, (A_6^{(1)}, A_6^{(2)})>
\end{displaymath}

平常我們是把 <Ai(1),Aj(2)> 寫成 (i,j),把 $\alpha_1\vee\alpha_2$ 寫成 $<(1,1),(1,2), \cdots, (1,6),(2,1), \cdots, (6,6)>$。一般來說,我們把 $\alpha_1$,…,$\alpha_m$ 想成是觀察同一隨機現象的 m 個儀器的記錄,那麼 $\alpha_1\vee\alpha_m$,就是這 m 個儀器的綜合記錄。以後我們將 $\alpha_1\vee\cdots\vee\alpha_m$ 的每個可能結果稱為基本事件。 當然,在觀察 $\alpha_1\vee\cdots\vee\alpha_m$ 時,有一個而且僅有一個基本事件出現。為了方便起見,我們將每個基本事件視為一點,而將所有這些點合攏起來記作 {$\omega_1$,$\omega_2$,…},這是個具有 $n_1\times n_2\times\cdots\times n_m$ 個點的集合,記之為 Ω。Ω 的任一子集 A 可用來表示落於 A 的那些基本事件的聯合事件,聯合事件 A 發生的意思是指 A 中的某個基本事件發生了。在上面隨手丟擲兩顆骰子的例子中,{(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)} 即表示第一顆骰子出現 1 點的事件。從現在起就稱 Ω 的子集為事件,Ω 的空子集 $\emptyset$ 為不可能事件,Ω 本身為必然事件,而 {$\omega_i$} 為基本事件。為了符號上的方便,我們常常不分辨 {$\omega_i$} 和 $\omega_i$。如果 A,B 為兩個事件,則 $A\bigcup B$ 稱為 AB 的聯合事件,$A\bigcap B$ 稱為 AB 的共同事件; $A\bigcap B=\emptyset$ 時,稱 AB 為互斥事件。

我們強調過,我們只考慮具有隨機規律性的試驗,因此,我們要求 Ω 的每個點 $\omega_i$ 具有機率 pi,當然,如 $p_i\geq0$,$\sum_ip_i=1$。如果 $A\subset\Omega$,令 $P(A) = \sum_{\omega_i\in A}p_i$,這兒 $\sum_{\omega_i\in A}p_i$ 是指所有落於 A 的基本事件的機率的和;P(A) 稱為事件 A 的機率。根據前面所說的 pi 的意義,就知道在多次獨立觀察試驗 $\alpha_1 \vee \alpha_2 \vee \cdots \vee \alpha_m$ 時,事件 A 出現的頻率將會圍繞於 P(A) 的附近。

機率論的目的是在研究隨機現象婺g驗規律的數學關係及其應用。由於上述的集合 Ω 與基本事件的機率綜合地表達了多次獨立觀察 $\alpha_1, \alpha_2$,…,$\alpha_m$ 所得到的經驗規律,原先隨機現象的規律變成了事件的機率,因此,機率論的目的也就是在研究機率所滿足的數學關係及其應用;就好像三角學研究的是三角函數間的關係及其應用一樣。

從數學的觀點來看,我們的起點是一個有限集合 Ω,而對 Ω 的每一子集 A,我們都附上了一個數 P(A),這些滿足下述的關係:

(1) $0\leq P(A)\leq1$, $P(\emptyset)=0$,$P(\Omega)=1$
(2)如果 AB 為 Ω 之子集,且 $A\bigcap B=\emptyset$,則 $P(A\bigcup B)=P(A)+P(B)$

換句話說,有限集合 Ω 及滿足(1)和(2)的函數 P 就是數學的起點。Ω 和 P 合起來稱為機率空間,簡記作 ($\Omega,P$)。這時的機率空間 ($\Omega,P$) 可以不具有任何實際意義,它僅僅是個數學系統;雖然如此,我們仍將 ($\Omega,P$) 解釋為對某個隨機現象作有限多個試驗所觀察到的經驗規律的總結,因此 Ω 的點仍然稱為基本事件,Ω 的子集稱為事件,P(A) 稱為 A 的機率,……。我們在機率空間媟s得到的結論,在經過這樣的解釋(翻譯)之後,就可以用來描述和預測某些隨機現象,這點非常重要,否則機率空間的研究就像是下棋,玩牌了,無法在人類文明的發展中產生積極的作用。我們抽象地研究機率空間,是希望能夠一目瞭然地看出機率與其相關概念間的關係;免得被形形色色的個別例子掩蓋了要點。我們須要適當的解釋機率空間,才能走向正確的方向(瞭解隨機現象),使得我們的心智活動不至於淪為單純的數學遊戲。這一點,各門數學都一樣,我們不想多言。

以下我們形式地定義一些最有用的概念,而將唇齒相關的直覺意義,留給讀者自己去補上。(同時請參閱楊維哲先生撰:〈機率一講〉──原《數播》編者。)

[定義]
(1)如果 $P(A\bigcap B)=P(A)\cdot P(B)$;則我們說事件 AB 互為隨機獨立。(或簡稱獨立)。

(2)如果 $P(B)\neq 0$,則 $ \frac{P(A\bigcap B)}{P(B)}$ 稱為 A 在已知 B 時的條件機率,記作 P(A|B)
(3)如果 A1,…,Ann 個互斥的事件,而且 $A_1\bigcup\cdots\bigcup A_n$ = Ω。則稱 A1,…,An 組成 Ω 的一個分割,並記之為〈A1,…,An〉。分割又稱試驗,這時為了明白表示每個事件 Ai 的機率,我們常把試驗記作

\begin{displaymath}\left<
\begin{array}{ccc}
A_1,&\cdots&,A_n\\
P(A_1),&\cdots&,P(A_n)
\end{array}\right>
\end{displaymath}

(4)設

\begin{displaymath}\alpha=\left<
\begin{array}{ccc}
A_1,&\cdots&,A_n\\
P(A_1),&...
...
B_1,&\cdots&,B_n\\
P(B_1),&\cdots&,P(B_n)
\end{array}\right>
\end{displaymath}

為兩個試驗,則

\begin{displaymath}\left<
\begin{array}{ccc}
A_1\bigcap B_1,&\cdots&,A_n\bigcap ...
...(A_1\bigcap B_1),&\cdots&,P(A_n\bigcap B_m)
\end{array}\right>
\end{displaymath}

稱為 α 和 β 的合成試驗,記作 $\alpha\vee\beta$ 如果任何 Ai 和任何 Bj 都是隨機獨立的,即 $P(A_i\bigcap B_j)=P(A_i)\cdot P(B_j)$,i=1,…,n;j=1,…,m。則稱 α 和 β 互為隨機獨立(或簡稱獨立)。

(5)我們把定義在 Ω 上的任一實數值函數叫做隨機變數。通常用 x,y,z 等小寫字母來表示隨機變數。假設 x 是隨機變數,則 $\sum_{\omega\in\Omega}x(\omega)P(\omega)$ 稱為 x 的期望值,記作 Ex;如果 r 是個實數,則用 {x=r} 來表示 { $\omega\in\Omega: x(\omega)=r$} 以節省筆墨,{x=r}是 x 取值為 r 的事件。假設 r1,…,rnx 所可能取的值,則 < {x=r1 },…, { x = rn }> 稱為由 x 所決定之試驗。如果 x 所決定的試驗與 y 所決定的試驗是獨立的話,則稱 xy 互為獨立的隨機變數(或簡稱 xy 為獨立變數)。

(6)為了方便起見,如果 $B\subset\Omega$ 是個事件,則如下定義的函數 XB 稱為 B 的指示函數:$X_B(\omega)=1$,如果 $\omega\in B$;否則 $X_B(\omega)=0$。如果 x 是個隨機變數,<{ x=r1 },…,{ x=rn } >x 所決定的試驗,則 x 可表成

\begin{displaymath}x=\sum_{i=1}^n r_iX_{\{x=r_i\}}\mbox{;}\end{displaymath}


\begin{displaymath}Ex=\sum_{i=1}^n r_iP\{x=r_i\} \: .\end{displaymath}

   

上頁 1234 次頁

回頁首
 
(若有指正、疑問……,可以在此 留言寫信 給我們。)
EpisteMath

EpisteMath (c) 2000 中央研究院數學所、台大數學系
各網頁文章內容之著作權為原著作人所有


編輯:黃信元 最後修改日期:4/26/2002