.原載於數學傳播十一卷一期 .作者當時任教於台大數學系 •註釋 | |||
從一個賭徒問題談統計推測之重要性
姚景星 |
首先我們來回顧賭博的起源,早在1600B.C.於埃及以及1300B.C.於中國均有關於賭博遊戲之記載。爾後在十七世紀,法國貴族社會流行以投骰子作賭博,於投骰子中,反覆投幾回後經驗覺得有些結果不太一樣。因此對當時之哲學者又是數學者間物理學者之 Pascal 及 Fermat 提出質疑且請求解釋。 於是這些學者乃開創了機率之概念且解出種種的賭博問題。 在同時期 Huygens 之著作《骰子賭博之理論》以及 Jakob Bernoulli 之著作《推論法》等書均涉及機率理論之討論。 到 Laplace(1749-1827)時完成古典機率論。
現在我們考慮下列一個賭博問題「今有一個圓銅板(不一定公正),設正面及反面發生之機率各為
此問題屬於動態計畫之問題,可利用最適性原理如下解此問題。
此問題是由初期財產 a 元及計畫期間 N 回(以 (a,N) 表示此問題),
求出每回採用之最適打賭金額,及其最大利益 fN(a),
因此若初期財產為 x 元,沒有打賭(期間0)時之最大利益為
第一次打賭金額b元,
![]() 第一回打賭後賭徒持有財產為 T(a,b),此為第二回至第 N 回之 N-1 回期間之初期財產, 故對此問題 (T(a,n),N-1) 之最大利益為 fN-1(T(a,b)), 因為 T(a,b) 有兩種情形(正、反面)各以機率 p,q 發生, 故第一回打賭 b 元後第二回到第 N 回之 N-1 回期間之最大利益期望值為 pfN-1(a+b)+qfN-1(a-b)。 因此對問題 (a,N) 之第一回打賭金額 b 決定使 pfN-1(a+b)+qfN-1(a-b) 之值最大者,如此可得下列式(最適性原理) ![]() 如上述使(1)是成立之 b 為問題 (a,N) 之第一回打賭的最適金額,但無法直接由(1)式求出,可利用(1)之遞迴關係式如下解之。下列分為兩種情形考慮。
(A) ![]() 利用微分 ![]() 可求得 b 值(設為 b1*(x))及 f1(x) 如下: ![]() 在此 ![]()
其次考慮問題 (x,2),即在(1)式中 a=x, N=2 及由(2)可得
![]() 如上利用微分,可求得 b 值(設為 b2*(x))及 f2(x) 如下: ![]() 如此由歸納法,對問題 (x,n) 可得 ![]() 即 ![]() 利用(3),(4)式可得問題 (a,N) 之最適賭博政策如下。
若 ![]() 故第一回打賭金額採用 b10=(p-q)a,即持有財產 a 之 (p-q) 倍。 第一回打賭完畢後持有財產變為 T(a,b10),此為問題 (T(a,b10),N-1) 之初期持有財產,故由(3),(4)式中設 x=T(a,b10),n=N-1, b20=bN-1*(T(a,b10))=(p-q)T(a,b10), 即可得問題 (a,N) 之第2回最適打賭金額,如此可得下列結論:
當
(B)
雖然此問題利用動態計劃已得答案,但在實際問題中 p 值是無法得知。
因此除非推測 p 值,否則此問題是無法獲得完全解決的。
欲推測 p 值需要利用統計學之「點推測」方法,若得 p 之推測值
當
為了討論點推測之方便,先設圓銅板投第 k 回之結果之隨機變數 Xk, 當第 k 回投出正面時 Xk=1,反面時 Xk=0,k=1,2,…,M。
由題意得知 Pr(Xr=1)=p,
Pr(Xr=0)=q=1-p,即
![]() 為了求 p 之推測值,先獨立投圓銅板 M 回,設其結果為 x1,x2,…,xM(稱為樣本值),其機率,由獨立投擲之性質可得下式 ![]() 定義最概函數 (likelihood function) 如下:
將樣本值 x1,x2,…,xM 固定,定義下列函數:
![]() (5)與(6)式之差別是在(5)式中 p 固定 ( ![]() ![]() ![]() 此 ![]() ![]() ![]() ![]() 亦即當正面出現機率為 ![]() ![]()
欲求使(6)式為最大之 p 值,可由下式求出:設
![]() ![]() 則得 ![]()
此推測之統計量
有很多實際問題雖然已建立模型(如上例最適賭博政策),且此模型中含有為之參數無法完全解決時通常利用統計學中推測方法可獲得解決。這就是為何我們需要學統計學的理由之一。
|
對外搜尋關鍵字: .Pascal .Fermat .Huygens .Jakob Bernoulli .Laplace |
|
![]() |
(若有指正、疑問……,可以在此 留言 或 寫信 給我們。) |
![]() |
EpisteMath (c) 2000 中央研究院數學所、台大數學系 各網頁文章內容之著作權為原著作人所有 |
編輯:劉建明 / 校對:黃怡碧 / 繪圖:簡立欣 | 最後修改日期:4/26/2002 |