聖經真的藏有密碼嗎? (第 3 頁) 魏慶榮
|
.原載於科學月刊第三十二卷第一期 .作者當時任職於中研院統計科學研究所 •註釋 •對外搜尋關鍵字 |
統計學中討論實驗設計時,通常都會提到:找尋最佳生產配方的工業實驗設計,以及找尋新藥的藥物試驗設計。關於後者,由於過去幾十年來對臨床實驗新藥的經驗,學界和醫界已經訂立了相當嚴格的標準,這些標準的規範,都寫在議定書 (protocol) 裡。首先要知道,做醫學實驗,或藥廠試驗新藥前,一定要先寫議定書,而且必須在議定書批准後才能開始進行。通常議定書裡必須寫明實驗的目的是什麼,整個的設計是什麼,又要如何執行。以下所列的十四個項目,是波克 (S.J. Pocok) 在《臨床試驗》(Clinical Trials) 中列舉的:
以下選出跟密碼問題有關的幾項,稍作說明。
首先,當然要說明實驗的背景和目的是什麼。魏茨滕等人的主要目的,是要證明上帝在〈創世紀〉裡藏有密碼。論文的特殊目的就是想證明,拉比的名字與其出生日期很靠近,並不是偶然的事件。
其次的幾項與病人的處理有關,其中病人的選取對應到論文裡拉比的選取。而魏茨滕等人是用什麼標準來選取這些拉比的?這牽涉到許多事情,包括拉比名字的拼法,如何依此去估算出前面所提到的距離,其中的細節留待後面再敘。在醫學實驗裡,如果選取的病人一開始就很虛弱,且併發症不少的話,那麼即使藥再靈,效應恐怕都不會很好;但是如果病人的病症很輕微,看來很強壯的話,那麼「藥到病除」和「不藥而癒」的情況都有可能。因此病人和拉比的選取,會直接影響所有的分析結果。
再來是討論試驗的設計,而這關係到之後要如何做實驗。例如魏茨滕是透過配對,以及對照實驗的方法來進行的。對照實驗是一種比較實驗,除了處理因素(如藥效或上帝預示)外,其他可能會影響實驗結果的因素都必須控制得完全一樣。所以魏茨滕等人利用《戰爭與和平》做對照實驗 時,採用希伯來文版,而且將字數選得一樣多,就是這個目的。另外。有人可能聽過「雙盲設計」(double blind design),主要是說,如果要實驗兩種可能的藥物時(當然包括安慰劑),那麼除了病人本身不知道他吃的是什麼藥,免得心理作用之外,連醫生也不知道病人服用的是不是安慰劑,以免醫生因為知道病人「有吃藥」的前題,而使診斷不自覺的傾向有效的判斷,認為病人會因此變得比較好。因此雙盲(或者叫雙瞞)的主要目的,也是要求在實驗的過程中,盡可能避開人為的偏見。而在對病人次序的編排上,譬如單數吃藥,雙數吃安慰劑等,也有可能產生這種不自覺的偏見 5 ,所以有必要弄亂吃藥者的編排(隨機化),使其不是順著一個固定的模式進行。由於隨機的安排,病人有可能因此沒吃藥。所以必須讓病人事先同意整個過程。
還有,這樣的實驗到底需要多少病人,也是一個很有趣的問題。例如。魏茨滕的實驗選了三十二個拉比,這樣夠不夠?少一點是否也能證明相同的結論?或者為了周全,必須把整個百科全書裡的人都選進來?這點很值得思考,表格和數據處理看起來不起眼,其實非常重要。例如許多表格常要填寫出生年、月、日,而論文中拉比的資料只有出生的月和日,並不包括年,處理這樣的資料時就要特別小心。此外,萬一實驗與議定書有所偏差時,例如應該進來的病人沒有進來,需要的樣本少一個時怎麼辦?諸如此類的事情,在議定書裡都要表示清楚。
第十三項規定怎麼做統計分析,這一項很清楚不用多說。最後是責任的問題。換句話說,這洋洋灑灑的十四項,其實只有一個目的,就是所有實驗的進行,都應該是在嚴格的規範下操作的,否則很可能會出問題。
|
瞭解實驗設計後,再回過頭來看看馬凱他們的批評: 第一、魏茨滕等人所用的統計方法,如果一小部分的數據稍微變動一下,就會很敏感。 第二、最大的麻煩出在拉比的稱呼,以及它的拼法如何選擇上。 以我們的現任總統為例,可以稱呼他陳水扁,陳總統水扁,陳水扁先生或是阿扁,甚至還有種種別名,到底要選哪一個?在西方社會裡,還有縮寫的問題哩!
魏茨滕實驗所分析的拉比,是根據一位名叫 Havlin的教授所準備的名單。但是另一位研究拉比的學者 M. Cohen卻說,這種取法是沒有科學根據的,完全是不一致的,而且是一個隨意選取的結果。他同時也準備了一分名單。不過更好玩的是,另一位學者認為,這兩分名單「一樣令人訝異!」由此看來,光是名字這一部分,仔細推敲就產生很大的問題了,更何況猶太人對日、月還有各種不同的講法,就如同我們有一月、正月和元月等講法。所以在議定書裡,諸如此類的規定就要事先制訂好,否則就有很大的伸縮空間;一旦有了伸縮空間,解釋就多,往往就無法控制了。但也有可能殊途同歸,達到相同的結果。
因此,下一步要問的就是,假如真有這樣的自由度可以發揮的話,它所產生的後果是什麼?馬凱等人依照上述的自由度,應用在《戰爭與和平》的版本上,把那些拉比的名字稍微變動一下, 得到的數據結果卻是 p <0.05。換句話說,《戰爭與和平》從沒有顯著的結果,變成有顯著結果。
再來,就〈創世紀〉的實驗來說,它原先的方法為什麼是對的?是不是它的自由發揮得太過度了呢?馬凱等人認為是的。而且他們還測試了很多小小的變動,譬如把出生的年分加進去、用別的稱呼等,結果發現大部份的結果都變弱了,有些變得不太顯著,有些甚至已經不顯著了。種種現象,似乎指向作者對數據的選擇,有固定的偏好,像是去挑撿一些特別的拉比,才得到這樣的結果。馬凱甚至表示,魏茨滕他們其實作了一些「調整」(tuning)。這種現象的另一種說法是「直覺的統計期望」。意思是說,當你知道一個現象的理論結果是什麼的時候,做出來的實驗結果往往就會是如此;因為有了這樣的心理傾向,就會產生了一些自覺或不自覺的「調整」行為。所以受到這樣心理影響的實驗報告,就會過於完美,必須特別小心這樣的結果是不是真的。
這一類的事件在統計界也發生過,其中最有名的,就是統計學家兼遺傳學家費雪(Fisher)對孟德爾(Mendel)碗豆實驗的數據所產生的懷疑。費雪甚至表示,當初孟德爾可能為了理論,調整了數據;原始的數據,不應該那麼漂亮。不過還好,最後孟德爾的理論是對的。這表示,即使數據真的是製造出來的。結果也不見得是錯的;但是實驗的結果那麼好,總會令人懷疑這些數據是被動過手腳的。因此調整的另外一個講法,就叫「動手腳」。不過費雪的懷疑是有其理論基礎的,因為這樣完美的結果表示,它的結果是不允許抽樣帶來的合理誤差。事實上,每個樣本都會對應一個統計量,通常不同樣本的統計量,彼此並不完全相同。就像用望遠鏡去量測天空中某個星球的距離,量測次數一多時,即使再怎麼努力調整儀器,結果多少都會有一些起伏的。這種起伏就是抽樣誤差造成的,也有人歸因於廣義的雜訊 (noise)。真正的度量難免會摻雜著噪音,而有噪音的數據,其所對應的定 p 值就不應該太小。而魏茨滕的 p 值小到 10-6(百萬分之一),因而讓人對於其數據的取得產生一些疑問。
|
最後,馬凱等人又從歷史的角度,再度批評了一番。由於目前這個《聖經》的版本, 並不是一天定下來的,它與《孟子》、《老子》這些書一樣,都是源遠流傳的,創作始於兩、三千年前。以1947到1951年間,在死海的西北端發現的《死海古卷》來說,那是一個寫在羊皮上,相當古老的的《聖經》原文,很可能是目前所知最古老的《聖經》書籍。書裡的〈以賽亞書〉相當完整,還有很多〈創世記〉的片段,但大都是殘卷。後來的《聖經》版本很可能是根據這些殘卷再修正的,因此,經文如果有密碼,這個密碼也不可能從最原始的版本流傳至今。因為經文在流傳的過程,難免會經過刪減和插增, 如果先前定義的躍距 d很小的話,選出的 ELS不變的機會就很大,密碼就不會被刪掉;可是如果 d很大的話,只要中間刪掉一個字母,就不再是一個完整的 ELS。例如,卓思寧在找出拉賓被剌這個密碼時用的 d=4,772,在間隔這麼長的字串中,要保證沒有被插入或刪除實在很難。所以從文獻流傳的觀點來看,也沒辦法保證密碼不是後天造成的。
最後馬凱他們下了兩個結論。首先,他們認為這篇文章不是故意找一個檢定方法來配合數據的。也就是說,並不是數據已經在那邊,然後再故意找一個方法將推論做得很好。舉例來說,如果要用平均值(方法),來代表王永慶先生與筆者的財富狀況(數據),那麼筆者當然就會顯得很有錢,可是那個平均值一定不能代表筆者的收入,這個方法只是故意要造成筆者很有錢的結論。這就是所謂的,用方法來配合數據,雖然數據是客觀的,方法卻是為了產生特定的效果而制定的。馬凱他們表示,目前這篇文章並不是這樣的,它是透過拉比的選取,因而調整了數據來配合這個檢定的。就像是前述王永慶和筆者的例子,把王永慶換成一位比他窮一點的人,再用一位比筆者富有一點的人來取代筆者,使兩者間的收入差異不大,這時用平均值來做代表,自然就合乎統計的道理了。
第二個結論則是全篇文章的總結。他們認為並沒有證據顯示,有辦法從 ELS找到密碼。 拉比的名字跟生日這些配對的安排相近與否,純屬機運。主編卡斯也對此做了回應, 他在馬凱等人的文章之前是這麼介紹的 :「…正如他們所下的結論,這個謎題的確像是解決了。」《Statistical Science》似乎有意為這場論戰譜上休止符,而不想再爭辯下去了。
|
|
(若有指正、疑問……,可以在此 留言 或 寫信 給我們。) |
EpisteMath (c) 2000 中央研究院數學所、台大數學系 各網頁文章內容之著作權為原著作人所有 |
編輯:陳文是 | 最後修改日期:5/25/2002 |