.原載於科學月刊第十六卷第六期 .作者當時任教於台大數學系 ‧註釋 | |||
二項分布與大數法則
理論與實際相連 曹亮吉 |
在〈藥效如何〉(《科學月刊》第十六卷第五期)一文裏,我們假設某藥的治療率為 0.6,然後算出 10 人中有 x 人痊癒的機率為 C10x(0.6)x(0.4)10-x。這是一種機率分布;我們的目的是把試驗的結果拿來和此機率分布模型相對照,以決定治癒率為 0.6 的假說是否合理。
上面這種機率分布稱為二項分布。一般的二項分布是這樣的:
假設某事件的發生率為 p,而試驗做了 n 次。則 n 次中,某事件發生 x 次的機率為
b(x;n,p)=Cxnpx(1-p)n-x
通常我們把 n、p 固定,讓 x 變動,以研究其機率變動的情形。這種機率分布之稱為二項分布。因為它可經由二項式 (p+(1-p))n 的展開式而得:
![]() (上式的左邊等於 1;這正表示各種可能的 x 值,其發生的機率之和為 1。) 因此有關二項分布的理論與計算和二項係數 Cxn 的性質有密切的關係。
讓 x 變動,則 b(x;n,p) 變化的情形如何?我們以 n=10,p=0.6 為例,列成下表
我們發現 b(x;10,0.6) 之值隨著 x 之值逐漸升高,到了 x=6 時最大,然後又逐漸變小。這種現象毋寧說是預期的,因為 n=10,p=0.6,所以預期 x=np=6 最可能發生,而 x 離開 6 愈遠愈不可能發生。
一般的 n,p 也有類似的現象。直接從公式來看,我們可以這樣解釋: ![]() 當 x 小的時候,這個比值會大於 1,而當 x 大過某種程度後,這個比值會小於 1,這只表示 b(x;n,p) 之值由小變大,然後再變小。什麼時候達到最大值?當上述比值由大於 1 變成小於等於 1 的時候。假設 ![]() 則 np-x>-p 而 ![]() ![]()
我們可以從另一個觀點來看 np 這個值。由於我們有 b(x;n,p) 的機率得到 x 值,所以平均起來得到的 x 值應為
![]() ![]()
雖然 x 的期望值是 np,但這不就表示 x 值常出現在 μ 值附近。也許有很多 x 值比 μ 小得多,而正好有很多 x 值比 μ 大得多,兩相抵消,平均起來,x 值就在 μ 附近。為了估計 μ 與 p 差多少,又兼顧 x 值發生的機率,我們要引進方差
註1
![]() 若 c 為正數,我們要估計有多大的機會, ![]() ![]() 因此我們就得到 Chebyshev 不等式: ![]() 假設 ![]() ![]() ![]() 因為上式的右邊也隨著 n 增大而趨近於 0,所以無論 ![]() ![]() ![]() ![]() 這就是所謂的大數法則:在二項分布的機率模型假定之下,只要實驗的次數 n 夠大,則事件發生的次數比 ![]()
二項分布 b(x;n,p) 的 p 是個非常重要,但不容易理解的概念。譬如我們說一個「公正」的骰子其出現 1 的機率為
又譬如說,某藥的治癒率是什麼呢?我們下能試完所有的人以決定 p 值,我們只能假定有個 p 值,使得藥效的數據遵行二項分布 b(x;n,p)。所以這個 p 值是抽象的、未知確值的假定值。
Bernoulli 的大數法則首先把這種基於定義、理想中的的數學產物 p 和實際的、實驗的結果
二項分布的起源與賭博有密切的關係。當然二項分布的應用自不限於賭博,藥效的檢定、產品好壞的檢定等等莫不涉及。此外二項分布還可以導出其他的機率分布,著名的 Poisson 分布就是。這正是我們下次的話題。
|
對外搜尋關鍵字: .二項分布 .Chebyshev不等式 .大數法則 .Jakob Bernoulli .Chebyshev .Poisson分布 |
|
![]() |
(若有指正、疑問……,可以在此 留言 或 寫信 給我們。) |
![]() |
EpisteMath (c) 2000 中央研究院數學所、台大數學系 各網頁文章內容之著作權為原著作人所有 |
編輯:朱安強 | 最後修改日期:2/17/2002 |