聖經真的藏有密碼嗎？ (第 3 頁)

　1│2│3│4　

聖經真的藏有密碼嗎？（第 3 頁）

魏慶榮

首頁 | 搜尋

．原載於科學月刊第三十二卷第一期
．作者當時任職於中研院統計科學研究所

‧註釋
‧對外搜尋關鍵字

正式反駁

事情演變到此，卓思寧似乎略居下風，但是這件事並沒有完全解決，原因在於對原先魏茨滕等人的那一篇〈聖經創世記裡的等距字母序列〉並沒有直接的推翻。因為這三個人的確很用心在設計他們的實驗，而且很仔細地做統計分析;而他們也認為卓思寧有些地方太寬鬆，做了一些統計不顯著的結果。因此想反駁他們，一定要提得出道理，說明他們的作法到底有那裡出了問題，否則光是用那些圖表的方式或是拉姆西定理，恐怕還是沒有辦法讓人心服口服;更何況芮普斯也一直表示，只有〈創世記〉裡有聖經密碼，想反駁這一點，也勢必要回歸到原先的這一篇文章來。

而經過同儕審核的期刊文章，還是要由期刊文章，而且最好是由同一期刊的文章來反駁，比較有公信力與說服力。1998年馬凱與兩位希伯來大學的學者，巴希蕾(Bar-Hillel)及巴納丹(Bar-Natan)，首先在一通俗性的統計期刊《Chance》，針對魏茨滕等的文章做全面的反駁，裡面沒有太多技術性(統計)的探討，但是描述了整個事件的來龍去脈，攻擊言辭猛烈，並且宣稱在《戰爭與和平》的希伯來文版，也可以發現密碼，這跟魏茨滕等人的論文結果相反。接著在1999年，馬凱等三人再加上希伯來大學的數學教授卡萊(Kalai)，在《Statistical Science》發表了一篇學術文章：〈解決聖經密碼的疑惑〉(Solving the Bible Code Puzzle)，為《Chance》的文章提供了統計學上的依據。他們在這篇文章中表示，魏茨滕等人在1994年發表的那一篇文章有相當嚴重的缺陷，特別是實驗的設計和數據的收集。有什麼問題呢？這時就要回過頭來看看，統計裡對實驗設計有哪些要求。

(一)實驗設計與議定書

統計學中討論實驗設計時，通常都會提到：找尋最佳生產配方的工業實驗設計，以及找尋新藥的藥物試驗設計。關於後者，由於過去幾十年來對臨床實驗新藥的經驗，學界和醫界已經訂立了相當嚴格的標準，這些標準的規範，都寫在議定書 (protocol) 裡。首先要知道，做醫學實驗，或藥廠試驗新藥前，一定要先寫議定書，而且必須在議定書批准後才能開始進行。通常議定書裡必須寫明實驗的目的是什麼，整個的設計是什麼，又要如何執行。以下所列的十四個項目，是波克 (S.J. Pocok) 在《臨床試驗》(Clinical Trials) 中列舉的：

: (1)背景與一般目的(Background and general aims)。
: (2)特殊目的(Specific objectives)。
: (3)選取病人的標準(Patient selection criteria)。
: (4)療程(Treatment schedules)。
: (5)評估的方法(Methods of patient evaluation)。
: (6)試驗設計(Trial design)。
: (7)病人的註冊及隨機分配(Registration and randomization of patients)。
: (8)病人的同意(Patient consent)。
: (9)研究需要的數量(Required size of study)。
: (10)試驗進展的監控(Monitoring of trial progress)。
: (11)表格與數據的處理(Forms and data handling)。
: (12)協議的偏離(Protocol deviations)。
: (13)統計分析的規畫(Plans for statistical analysis)。
: (14)行政責任(Administrative responsibilities)。

以下選出跟密碼問題有關的幾項，稍作說明。

首先，當然要說明實驗的背景和目的是什麼。魏茨滕等人的主要目的，是要證明上帝在〈創世紀〉裡藏有密碼。論文的特殊目的就是想證明，拉比的名字與其出生日期很靠近，並不是偶然的事件。

其次的幾項與病人的處理有關，其中病人的選取對應到論文裡拉比的選取。而魏茨滕等人是用什麼標準來選取這些拉比的?這牽涉到許多事情，包括拉比名字的拼法，如何依此去估算出前面所提到的距離，其中的細節留待後面再敘。在醫學實驗裡，如果選取的病人一開始就很虛弱，且併發症不少的話，那麼即使藥再靈，效應恐怕都不會很好;但是如果病人的病症很輕微，看來很強壯的話，那麼「藥到病除」和「不藥而癒」的情況都有可能。因此病人和拉比的選取，會直接影響所有的分析結果。

再來是討論試驗的設計，而這關係到之後要如何做實驗。例如魏茨滕是透過配對，以及對照實驗的方法來進行的。對照實驗是一種比較實驗，除了處理因素(如藥效或上帝預示)外，其他可能會影響實驗結果的因素都必須控制得完全一樣。所以魏茨滕等人利用《戰爭與和平》做對照實驗時，採用希伯來文版，而且將字數選得一樣多，就是這個目的。另外。有人可能聽過「雙盲設計」(double blind design)，主要是說，如果要實驗兩種可能的藥物時(當然包括安慰劑)，那麼除了病人本身不知道他吃的是什麼藥，免得心理作用之外，連醫生也不知道病人服用的是不是安慰劑，以免醫生因為知道病人「有吃藥」的前題，而使診斷不自覺的傾向有效的判斷，認為病人會因此變得比較好。因此雙盲(或者叫雙瞞)的主要目的，也是要求在實驗的過程中，盡可能避開人為的偏見。而在對病人次序的編排上，譬如單數吃藥，雙數吃安慰劑等，也有可能產生這種不自覺的偏見 ⁵ ，所以有必要弄亂吃藥者的編排(隨機化)，使其不是順著一個固定的模式進行。由於隨機的安排，病人有可能因此沒吃藥。所以必須讓病人事先同意整個過程。

還有，這樣的實驗到底需要多少病人，也是一個很有趣的問題。例如。魏茨滕的實驗選了三十二個拉比，這樣夠不夠?少一點是否也能證明相同的結論?或者為了周全，必須把整個百科全書裡的人都選進來?這點很值得思考，表格和數據處理看起來不起眼，其實非常重要。例如許多表格常要填寫出生年、月、日，而論文中拉比的資料只有出生的月和日，並不包括年，處理這樣的資料時就要特別小心。此外，萬一實驗與議定書有所偏差時，例如應該進來的病人沒有進來，需要的樣本少一個時怎麼辦?諸如此類的事情，在議定書裡都要表示清楚。

第十三項規定怎麼做統計分析，這一項很清楚不用多說。最後是責任的問題。換句話說，這洋洋灑灑的十四項，其實只有一個目的，就是所有實驗的進行，都應該是在嚴格的規範下操作的，否則很可能會出問題。

(二)針鋒相對

瞭解實驗設計後，再回過頭來看看馬凱他們的批評：第一、魏茨滕等人所用的統計方法，如果一小部分的數據稍微變動一下，就會很敏感。第二、最大的麻煩出在拉比的稱呼，以及它的拼法如何選擇上。以我們的現任總統為例，可以稱呼他陳水扁，陳總統水扁，陳水扁先生或是阿扁，甚至還有種種別名，到底要選哪一個？在西方社會裡，還有縮寫的問題哩！

魏茨滕實驗所分析的拉比，是根據一位名叫 Havlin的教授所準備的名單。但是另一位研究拉比的學者 M. Cohen卻說，這種取法是沒有科學根據的，完全是不一致的，而且是一個隨意選取的結果。他同時也準備了一分名單。不過更好玩的是，另一位學者認為，這兩分名單「一樣令人訝異!」由此看來，光是名字這一部分，仔細推敲就產生很大的問題了，更何況猶太人對日、月還有各種不同的講法，就如同我們有一月、正月和元月等講法。所以在議定書裡，諸如此類的規定就要事先制訂好，否則就有很大的伸縮空間;一旦有了伸縮空間，解釋就多，往往就無法控制了。但也有可能殊途同歸，達到相同的結果。

因此，下一步要問的就是，假如真有這樣的自由度可以發揮的話，它所產生的後果是什麼？馬凱等人依照上述的自由度，應用在《戰爭與和平》的版本上，把那些拉比的名字稍微變動一下，得到的數據結果卻是 p <0.05。換句話說，《戰爭與和平》從沒有顯著的結果，變成有顯著結果。

再來，就〈創世紀〉的實驗來說，它原先的方法為什麼是對的？是不是它的自由發揮得太過度了呢？馬凱等人認為是的。而且他們還測試了很多小小的變動，譬如把出生的年分加進去、用別的稱呼等，結果發現大部份的結果都變弱了，有些變得不太顯著，有些甚至已經不顯著了。種種現象，似乎指向作者對數據的選擇，有固定的偏好，像是去挑撿一些特別的拉比，才得到這樣的結果。馬凱甚至表示，魏茨滕他們其實作了一些「調整」(tuning)。這種現象的另一種說法是「直覺的統計期望」。意思是說，當你知道一個現象的理論結果是什麼的時候，做出來的實驗結果往往就會是如此；因為有了這樣的心理傾向，就會產生了一些自覺或不自覺的「調整」行為。所以受到這樣心理影響的實驗報告，就會過於完美，必須特別小心這樣的結果是不是真的。

這一類的事件在統計界也發生過，其中最有名的，就是統計學家兼遺傳學家費雪(Fisher)對孟德爾(Mendel)碗豆實驗的數據所產生的懷疑。費雪甚至表示，當初孟德爾可能為了理論，調整了數據；原始的數據，不應該那麼漂亮。不過還好，最後孟德爾的理論是對的。這表示，即使數據真的是製造出來的。結果也不見得是錯的；但是實驗的結果那麼好，總會令人懷疑這些數據是被動過手腳的。因此調整的另外一個講法，就叫「動手腳」。不過費雪的懷疑是有其理論基礎的，因為這樣完美的結果表示，它的結果是不允許抽樣帶來的合理誤差。事實上，每個樣本都會對應一個統計量，通常不同樣本的統計量，彼此並不完全相同。就像用望遠鏡去量測天空中某個星球的距離，量測次數一多時，即使再怎麼努力調整儀器，結果多少都會有一些起伏的。這種起伏就是抽樣誤差造成的，也有人歸因於廣義的雜訊 (noise)。真正的度量難免會摻雜著噪音，而有噪音的數據，其所對應的定 p 值就不應該太小。而魏茨滕的 p 值小到 10^-6(百萬分之一)，因而讓人對於其數據的取得產生一些疑問。

(三)最後一擊

最後，馬凱等人又從歷史的角度，再度批評了一番。由於目前這個《聖經》的版本，並不是一天定下來的，它與《孟子》、《老子》這些書一樣，都是源遠流傳的，創作始於兩、三千年前。以1947到1951年間，在死海的西北端發現的《死海古卷》來說，那是一個寫在羊皮上，相當古老的的《聖經》原文，很可能是目前所知最古老的《聖經》書籍。書裡的〈以賽亞書〉相當完整，還有很多〈創世記〉的片段，但大都是殘卷。後來的《聖經》版本很可能是根據這些殘卷再修正的，因此，經文如果有密碼，這個密碼也不可能從最原始的版本流傳至今。因為經文在流傳的過程，難免會經過刪減和插增，如果先前定義的躍距 d很小的話，選出的 ELS不變的機會就很大，密碼就不會被刪掉;可是如果 d很大的話，只要中間刪掉一個字母，就不再是一個完整的 ELS。例如，卓思寧在找出拉賓被剌這個密碼時用的 d=4,772，在間隔這麼長的字串中，要保證沒有被插入或刪除實在很難。所以從文獻流傳的觀點來看，也沒辦法保證密碼不是後天造成的。

最後馬凱他們下了兩個結論。首先，他們認為這篇文章不是故意找一個檢定方法來配合數據的。也就是說，並不是數據已經在那邊，然後再故意找一個方法將推論做得很好。舉例來說，如果要用平均值(方法)，來代表王永慶先生與筆者的財富狀況(數據)，那麼筆者當然就會顯得很有錢，可是那個平均值一定不能代表筆者的收入，這個方法只是故意要造成筆者很有錢的結論。這就是所謂的，用方法來配合數據，雖然數據是客觀的，方法卻是為了產生特定的效果而制定的。馬凱他們表示，目前這篇文章並不是這樣的，它是透過拉比的選取，因而調整了數據來配合這個檢定的。就像是前述王永慶和筆者的例子，把王永慶換成一位比他窮一點的人，再用一位比筆者富有一點的人來取代筆者，使兩者間的收入差異不大，這時用平均值來做代表，自然就合乎統計的道理了。

第二個結論則是全篇文章的總結。他們認為並沒有證據顯示，有辦法從 ELS找到密碼。拉比的名字跟生日這些配對的安排相近與否，純屬機運。主編卡斯也對此做了回應，他在馬凱等人的文章之前是這麼介紹的 :「…正如他們所下的結論，這個謎題的確像是解決了。」《Statistical Science》似乎有意為這場論戰譜上休止符，而不想再爭辯下去了。

　1│2│3│4　


	（若有指正、疑問……，可以在此留言或寫信給我們。）

EpisteMath (c) 2000 中央研究院數學所、台大數學系
各網頁文章內容之著作權為原著作人所有

編輯：陳文是

最後修改日期：5/25/2002