問題的敘述雖很簡單,但細思之下,卻發現其並不很簡單。這道理不難明白,因為可下注的方法實在太多了,要一一比較是不可能的。
為了要克服上面所說的困難,數學家首先考慮幾種比較可能為人們採用的方法,
這些方法所以較常採用,泰半是由於直覺上認為它們可被採行。當然,直覺的認定往往是不可靠的,所以最好能有理論支持。下面就介紹三種可能的方法,並比較其優劣。
- 方法一、每次甲均下賭注 1 元。(顯然,這樣的下注法最保守,我們稱之為保守型下注法。)
- 方法二、首先甲下 1 元賭注。若他贏了,則下次仍下 1 元;若輸了,則將賭注加倍,依此類推。換言之,往後只要一贏,他就下 1 元,否則就把下注金額加倍。當然,我們假設所下金額是合理的。(顯然持這種下法的理由是因為只要一贏,那麼非但所有輸的金額即全撈回來,並且反多贏 1 元,我們姑且稱之為輸不起型下注法。)
- 方法三、只要許可,甲就將所有賭本下注,因此只要一輪,某甲就血本無歸。(顯然這種方法是最大膽的,我們就稱之為極端型下注法。)
你會採用哪種方法呢?能說個道理出來嗎?事實上,答案並不簡單,它跟 p 究竟大於、等於或小於 1/2 有關,也即跟你是否比莊家強有關。我們就舉 c=2 的例子來說明。為方便計,我們以「+」表甲贏,以「-」表甲輸,並以+、-所形成之中列表示甲在整賽局輸贏的順序。
首先我們考慮保守型下注法,此時只有在下列諸場合,甲才會贏(即莊家賭本輸光)。
++,
+-++,-+++,
+-+-++,+-+++,-++-++,-+-+++,
。
在第一列 ++ 中,甲連贏兩次,此次機率為 。在第二列中,甲贏了三次,輸了一次,並且有兩種可能性,所以其機率為
(q 為輸的機率,故 p+q=1)。依此推導可得在第 n 列中,甲贏了 n+1 次,而輸了 n-1 次,並且有 2n-1 種可能性,所以其機率為
2n-1pn+1qn-1。因此可得在整個賽局中,甲贏的機率為
現在讓我們考慮輸不起型下注法。此時只有在下列諸場合,甲才會贏。
++,+-+,
-+++,-++-+,(注意:甲第二次僅能下注 1 元)
-+-+++,-+-++-+,
,
,
。
仿上之計算,可得此時甲贏的機率為
最後設某甲採極端法,則甲第一次即下注2元,因此一次就決定了輸贏,所以甲贏的機率為 p 。
現在我們再回到原問題:究竟在這三種方法中,以那種方法最好?由於相對應贏的機率公式已求得,所以我們只需將 p 值代入,進而比較其大小即可,舉例來說,當 時,三者之值皆為 ;而當 時,三者之值依序為 、 、 ;至於當 時,則其值依序為 、 、 。
這些數值告訴我們,當 時,三種下注法沒影響甲贏的機會;當 時,則以保守法較好;當 時,卻以極端法最佳,保守法最差。
這些結論,是不是有些出你意料呢?其實問題還沒全部解決,迄今我們僅就保守、輸不起、極端三型來作比較。是否尚有其他型的下注法會使得答案更好?還有,我們僅就特例來考慮,在一般的情形下,答案又是怎樣呢?
現在,先把最一般性的結果寫在下面,其中 代表當甲有 i 元時會贏的機率。
- 情況一:
此時不論甲如何下注, 恒等於 c/(m+c)。
- 情況二:
此時不論甲如何下注,
,而右端為保守型下注法贏的機率。因此,在此情況以保守型的下注法為最穩當。另一方面,極端下注法的贏面最低。
- 情況三:
此時以極端法最佳,保守法最差。同樣地,保守型下注法贏的機率為
。
現在我們就來研究,為什麼會有這個結論!這用到了一些數學工具,不過對其中較複雜的部分,因顧及本文的可讀性,筆者只很扼要的敘述一下。
由於在上面的結論裏,保守法處於一個居中的地位,所以我們先就此法進行討論,
然後再進一步研究整個問題。
如同以前, 代表當甲所擁有的資本達 i 元時,他會贏的機率。由於甲及莊家的總資本額為 m+c 元,所以 i 之可能值為 i = 0, 1, …, m + c。顯然地, , ,而 為我們最早所想求得之機率。
- 情況一:
假定某甲現有 i 元,那麼有 的機會,他的資本會成為 i+1 或 i-1 元。因此
這樣的函數 ν,在數學上是一個線性函數,因此解的通式為 。由於, 、 ,得 a=0、
。因此
,亦即甲的贏面為 c/(m+c)。
- 情況二:
令 q=1-p。此時對 ν 我們有方程式
這樣的一組方程式,在數學上稱作是差分方程式。它也有一個求解的一般方法,但其道理較深。為此之故,我們特採用下面的方法。
利用p+q=1,上組方程式可改寫為
兩邊相加,並利用 、 ,得
若取前 c 項相加,則得
- 情況三:
仿二之解法,可求得
保守法的 已求得,現在我們來研究為什麼在情況二時,以保守下注法的 為最大;
而在情況三時,反以保守下注法的 為最小;同時另一方面,在情況二時,則無論何種下注法, 皆一樣。
首先我們引進一個定理。令 Sn 代表在第 n 次賽局時,甲所擁有之資本額,因此 Sn 是一個隨機變數。我們並設 S0=c,即原資本。令 N 表結束賽局所需之時間,因此 SN=0 或 c+m。我們並以 E 表期望值。
- 定理:
- 設 f 為一定義於 Sn 上之有界函數。若在 Sn 之條件下,f(Sn+1) 之期望值
E[f(Sn+1)] = f(Sn),則
E[f(SN)] = f(S0) = f(c)。
若將「=」改為「
」,則結論亦真。
此定理在機率學上,即著名的選擇樣本定理 (optional sampling theorem),它的證明已超過本刊程度,所以略去不證,但它的直觀意義卻不難了解。就拿「=」的情形來說,其實是說若你的第 n+1 次賽局,平均而言並不能改變在第 n 次賽局時 f 之值,則當整個賽局結束時,f 的平均值也與原先值一樣。另一方面,若在「 」的情況,亦即你的第 n+1 次賽局平均而言會改進 f 先前之值,則當賽局結束時,f 的平均值也曾比原先值為佳。
現在我們就拿這定理來證明先前我們所下之結論。
首先,我們考慮情況一。此時取 f(Sn)=Sn,則不論對何種下注法,因勝負機會均等,
,
所以若給定 Sn,則
ESn+1 = Sn。因此由上定理知 ESN = c。但
= ,
所以知不論以何種方法,
。
至於在情況二或三時,我們取
。此時若給定 Sn,則
其中 為所下注之金額。利用
可得不論以何種下注法下注,若給定 Sn,則
。所以由定理知
。
但
因此可得在情況二, 時,
而在情況三, 時,
但
為採用保守下注法時贏的機率,所以知在情況二時,以保守法的 為最大;但在情況三時,卻以保守法的 為最小。
至於為什麼在情況二時,以極端法的贏面為最低;但在情況三時,卻以極端法的贏面為最大。這其中又牽涉到更深的理論,只好從略了。
|