上頁 1234 次頁

聖經真的藏有密碼嗎? (第 3 頁)

魏慶榮

 

首頁 | 搜尋

.原載於科學月刊第三十二卷第一期
.作者當時任職於中研院統計科學研究所

註釋
對外搜尋關鍵字
 
正式反駁

事情演變到此,卓思寧似乎略居下風,但是這件事並沒有完全解決,原因在於對原先魏茨滕等人的那一篇〈聖經創世記裡的等距字母序列〉並沒有直接的推翻。因為這三個人的確很用心在設計他們的實驗,而且很仔細地做統計分析;而他們也認為卓思寧有些地方太寬鬆,做了一些統計不顯著的結果。因此想反駁他們,一定要提得出道理,說明他們的作法到底有那裡出了問題,否則光是用那些圖表的方式或是拉姆西定理,恐怕還是沒有辦法讓人心服口服;更何況芮普斯也一直表示,只有〈創世記〉裡有聖經密碼,想反駁這一點,也勢必要回歸到原先的這一篇文章來。

而經過同儕審核的期刊文章,還是要由期刊文章,而且最好是由同一期刊的文章來反駁,比較有公信力與說服力。1998年馬凱與兩位希伯來大學的學者,巴希蕾(Bar-Hillel)及巴納丹(Bar-Natan),首先在一通俗性的統計期刊《Chance》,針對魏茨滕等的文章做全面的反駁,裡面沒有太多技術性(統計)的探討,但是描述了整個事件的來龍去脈,攻擊言辭猛烈,並且宣稱在《戰爭與和平》的希伯來文版,也可以發現密碼,這跟魏茨滕等人的論文結果相反。 接著在1999年,馬凱等三人再加上希伯來大學的數學教授卡萊(Kalai),在《Statistical Science》發表了一篇學術文章:〈解決聖經密碼的疑惑〉(Solving the Bible Code Puzzle),為《Chance》的文章提供了統計學上的依據。他們在這篇文章中表示,魏茨滕等人在1994年發表的那一篇文章有相當嚴重的缺陷,特別是實驗的設計和數據的收集。有什麼問題呢?這時就要回過頭來看看,統計裡對實驗設計有哪些要求。

   
 
(一)實驗設計與議定書

統計學中討論實驗設計時,通常都會提到:找尋最佳生產配方的工業實驗設計,以及找尋新藥的藥物試驗設計。關於後者,由於過去幾十年來對臨床實驗新藥的經驗,學界和醫界已經訂立了相當嚴格的標準,這些標準的規範,都寫在議定書 (protocol) 裡。首先要知道,做醫學實驗,或藥廠試驗新藥前,一定要先寫議定書,而且必須在議定書批准後才能開始進行。通常議定書裡必須寫明實驗的目的是什麼,整個的設計是什麼,又要如何執行。以下所列的十四個項目,是波克 (S.J. Pocok) 在《臨床試驗》(Clinical Trials) 中列舉的:

(1)背景與一般目的(Background and general aims)。
(2)特殊目的(Specific objectives)。
(3)選取病人的標準(Patient selection criteria)。
(4)療程(Treatment schedules)。
(5)評估的方法(Methods of patient evaluation)。
(6)試驗設計(Trial design)。
(7)病人的註冊及隨機分配(Registration and randomization of patients)。
(8)病人的同意(Patient consent)。
(9)研究需要的數量(Required size of study)。
(10)試驗進展的監控(Monitoring of trial progress)。
(11)表格與數據的處理(Forms and data handling)。
(12)協議的偏離(Protocol deviations)。
(13)統計分析的規畫(Plans for statistical analysis)。
(14)行政責任(Administrative responsibilities)。

以下選出跟密碼問題有關的幾項,稍作說明。

首先,當然要說明實驗的背景和目的是什麼。魏茨滕等人的主要目的,是要證明上帝在〈創世紀〉裡藏有密碼。論文的特殊目的就是想證明,拉比的名字與其出生日期很靠近,並不是偶然的事件。

其次的幾項與病人的處理有關,其中病人的選取對應到論文裡拉比的選取。而魏茨滕等人是用什麼標準來選取這些拉比的?這牽涉到許多事情,包括拉比名字的拼法,如何依此去估算出前面所提到的距離,其中的細節留待後面再敘。在醫學實驗裡,如果選取的病人一開始就很虛弱,且併發症不少的話,那麼即使藥再靈,效應恐怕都不會很好;但是如果病人的病症很輕微,看來很強壯的話,那麼「藥到病除」和「不藥而癒」的情況都有可能。因此病人和拉比的選取,會直接影響所有的分析結果。

再來是討論試驗的設計,而這關係到之後要如何做實驗。例如魏茨滕是透過配對,以及對照實驗的方法來進行的。對照實驗是一種比較實驗,除了處理因素(如藥效或上帝預示)外,其他可能會影響實驗結果的因素都必須控制得完全一樣。所以魏茨滕等人利用《戰爭與和平》做對照實驗 時,採用希伯來文版,而且將字數選得一樣多,就是這個目的。另外。有人可能聽過「雙盲設計」(double blind design),主要是說,如果要實驗兩種可能的藥物時(當然包括安慰劑),那麼除了病人本身不知道他吃的是什麼藥,免得心理作用之外,連醫生也不知道病人服用的是不是安慰劑,以免醫生因為知道病人「有吃藥」的前題,而使診斷不自覺的傾向有效的判斷,認為病人會因此變得比較好。因此雙盲(或者叫雙瞞)的主要目的,也是要求在實驗的過程中,盡可能避開人為的偏見。而在對病人次序的編排上,譬如單數吃藥,雙數吃安慰劑等,也有可能產生這種不自覺的偏見 5 ,所以有必要弄亂吃藥者的編排(隨機化),使其不是順著一個固定的模式進行。由於隨機的安排,病人有可能因此沒吃藥。所以必須讓病人事先同意整個過程。

還有,這樣的實驗到底需要多少病人,也是一個很有趣的問題。例如。魏茨滕的實驗選了三十二個拉比,這樣夠不夠?少一點是否也能證明相同的結論?或者為了周全,必須把整個百科全書裡的人都選進來?這點很值得思考,表格和數據處理看起來不起眼,其實非常重要。例如許多表格常要填寫出生年、月、日,而論文中拉比的資料只有出生的月和日,並不包括年,處理這樣的資料時就要特別小心。此外,萬一實驗與議定書有所偏差時,例如應該進來的病人沒有進來,需要的樣本少一個時怎麼辦?諸如此類的事情,在議定書裡都要表示清楚。

第十三項規定怎麼做統計分析,這一項很清楚不用多說。最後是責任的問題。換句話說,這洋洋灑灑的十四項,其實只有一個目的,就是所有實驗的進行,都應該是在嚴格的規範下操作的,否則很可能會出問題。

   
 
(二)針鋒相對

瞭解實驗設計後,再回過頭來看看馬凱他們的批評: 第一、魏茨滕等人所用的統計方法,如果一小部分的數據稍微變動一下,就會很敏感。 第二、最大的麻煩出在拉比的稱呼,以及它的拼法如何選擇上。 以我們的現任總統為例,可以稱呼他陳水扁,陳總統水扁,陳水扁先生或是阿扁,甚至還有種種別名,到底要選哪一個?在西方社會裡,還有縮寫的問題哩!

魏茨滕實驗所分析的拉比,是根據一位名叫 Havlin的教授所準備的名單。但是另一位研究拉比的學者 M. Cohen卻說,這種取法是沒有科學根據的,完全是不一致的,而且是一個隨意選取的結果。他同時也準備了一分名單。不過更好玩的是,另一位學者認為,這兩分名單「一樣令人訝異!」由此看來,光是名字這一部分,仔細推敲就產生很大的問題了,更何況猶太人對日、月還有各種不同的講法,就如同我們有一月、正月和元月等講法。所以在議定書裡,諸如此類的規定就要事先制訂好,否則就有很大的伸縮空間;一旦有了伸縮空間,解釋就多,往往就無法控制了。但也有可能殊途同歸,達到相同的結果。

因此,下一步要問的就是,假如真有這樣的自由度可以發揮的話,它所產生的後果是什麼?馬凱等人依照上述的自由度,應用在《戰爭與和平》的版本上,把那些拉比的名字稍微變動一下, 得到的數據結果卻是 p <0.05。換句話說,《戰爭與和平》從沒有顯著的結果,變成有顯著結果。

再來,就〈創世紀〉的實驗來說,它原先的方法為什麼是對的?是不是它的自由發揮得太過度了呢?馬凱等人認為是的。而且他們還測試了很多小小的變動,譬如把出生的年分加進去、用別的稱呼等,結果發現大部份的結果都變弱了,有些變得不太顯著,有些甚至已經不顯著了。種種現象,似乎指向作者對數據的選擇,有固定的偏好,像是去挑撿一些特別的拉比,才得到這樣的結果。馬凱甚至表示,魏茨滕他們其實作了一些「調整」(tuning)。這種現象的另一種說法是「直覺的統計期望」。意思是說,當你知道一個現象的理論結果是什麼的時候,做出來的實驗結果往往就會是如此;因為有了這樣的心理傾向,就會產生了一些自覺或不自覺的「調整」行為。所以受到這樣心理影響的實驗報告,就會過於完美,必須特別小心這樣的結果是不是真的。

這一類的事件在統計界也發生過,其中最有名的,就是統計學家兼遺傳學家費雪(Fisher)對孟德爾(Mendel)碗豆實驗的數據所產生的懷疑。費雪甚至表示,當初孟德爾可能為了理論,調整了數據;原始的數據,不應該那麼漂亮。不過還好,最後孟德爾的理論是對的。這表示,即使數據真的是製造出來的。結果也不見得是錯的;但是實驗的結果那麼好,總會令人懷疑這些數據是被動過手腳的。因此調整的另外一個講法,就叫「動手腳」。不過費雪的懷疑是有其理論基礎的,因為這樣完美的結果表示,它的結果是不允許抽樣帶來的合理誤差。事實上,每個樣本都會對應一個統計量,通常不同樣本的統計量,彼此並不完全相同。就像用望遠鏡去量測天空中某個星球的距離,量測次數一多時,即使再怎麼努力調整儀器,結果多少都會有一些起伏的。這種起伏就是抽樣誤差造成的,也有人歸因於廣義的雜訊 (noise)。真正的度量難免會摻雜著噪音,而有噪音的數據,其所對應的定 p 值就不應該太小。而魏茨滕的 p 值小到 10-6(百萬分之一),因而讓人對於其數據的取得產生一些疑問。

   
 
(三)最後一擊

最後,馬凱等人又從歷史的角度,再度批評了一番。由於目前這個《聖經》的版本, 並不是一天定下來的,它與《孟子》、《老子》這些書一樣,都是源遠流傳的,創作始於兩、三千年前。以1947到1951年間,在死海的西北端發現的《死海古卷》來說,那是一個寫在羊皮上,相當古老的的《聖經》原文,很可能是目前所知最古老的《聖經》書籍。書裡的〈以賽亞書〉相當完整,還有很多〈創世記〉的片段,但大都是殘卷。後來的《聖經》版本很可能是根據這些殘卷再修正的,因此,經文如果有密碼,這個密碼也不可能從最原始的版本流傳至今。因為經文在流傳的過程,難免會經過刪減和插增, 如果先前定義的躍距 d很小的話,選出的 ELS不變的機會就很大,密碼就不會被刪掉;可是如果 d很大的話,只要中間刪掉一個字母,就不再是一個完整的 ELS。例如,卓思寧在找出拉賓被剌這個密碼時用的 d=4,772,在間隔這麼長的字串中,要保證沒有被插入或刪除實在很難。所以從文獻流傳的觀點來看,也沒辦法保證密碼不是後天造成的。

最後馬凱他們下了兩個結論。首先,他們認為這篇文章不是故意找一個檢定方法來配合數據的。也就是說,並不是數據已經在那邊,然後再故意找一個方法將推論做得很好。舉例來說,如果要用平均值(方法),來代表王永慶先生與筆者的財富狀況(數據),那麼筆者當然就會顯得很有錢,可是那個平均值一定不能代表筆者的收入,這個方法只是故意要造成筆者很有錢的結論。這就是所謂的,用方法來配合數據,雖然數據是客觀的,方法卻是為了產生特定的效果而制定的。馬凱他們表示,目前這篇文章並不是這樣的,它是透過拉比的選取,因而調整了數據來配合這個檢定的。就像是前述王永慶和筆者的例子,把王永慶換成一位比他窮一點的人,再用一位比筆者富有一點的人來取代筆者,使兩者間的收入差異不大,這時用平均值來做代表,自然就合乎統計的道理了。

第二個結論則是全篇文章的總結。他們認為並沒有證據顯示,有辦法從 ELS找到密碼。 拉比的名字跟生日這些配對的安排相近與否,純屬機運。主編卡斯也對此做了回應, 他在馬凱等人的文章之前是這麼介紹的 :「…正如他們所下的結論,這個謎題的確像是解決了。」《Statistical Science》似乎有意為這場論戰譜上休止符,而不想再爭辯下去了。

   

上頁 1234 次頁

回頁首
 
(若有指正、疑問……,可以在此 留言寫信 給我們。)
EpisteMath

EpisteMath (c) 2000 中央研究院數學所、台大數學系
各網頁文章內容之著作權為原著作人所有


編輯:陳文是 最後修改日期:5/25/2002