假如我們所調查的問題涉及個人名譽道德、私人秘密及其他利害相關的事項,被調
查的人多半不會忠實回答,若勉強直接調查,也難獲得可靠的資料。例如:我們想
瞭解商人的逃稅率,如果直接詢問他們所得到的答案,必然是否定的。諸如此類
的問題,我們要如何設計調查方式,以獲取被調查者的坦誠合作,提高調查效果?
在此我們舉個例子來談談如何利用一種「隨檢問答」
(randomized response) 的技巧,以消除被調查者的疑慮;爭取精誠合作。
如果我們要調查商人的逃稅率,我們可設計兩個問題:
問題1,為敏感性的問題-「你是否曾經逃稅?」,
問題2,為無關的問題-「你的身份證號碼是否為奇數?」
對每一個被調查的商人,我們可請他自行在放有 7個紅球, 3個白球的袋中任意選取一球,然後按照下列規則
回答問題:
注意:被調查者只需回答「是」或「否」,而不須告訴我們選到何種球、所回答的是
何種問題,如此我們即無法確知對方所回答的是何種問題,因此被調查者可以毫無顧忌
的回答問題。
這種調查方式,雖然我們並不知道被調查者個別回答的問題是何種問題,但是在全體
上,我們利用簡單的機率理論,即可輕易地求得所要調查的問題,茲說明如下:
設 P(X)表示陳述 X成立的機率, P(X|Y)表示陳述 Y成立時陳述 X成立的條件
機率,則
或者寫得更簡潔點
式中λ表示回答「是」的機率,π表示商人中曾逃稅過的比率,p表示選到敏感性問題的機率
,而θ表示商人之身分證號碼為奇數的機率。假設調查統計的結果,得到回答
「是」的比率為 0.44,也就是
0.44則將p=0.70,及0.50代入公式3中,得
因此我們可估計商人中曾逃稅的比率為41%。
上面我們所用的方法,若碰到一位多疑,而身分證號碼又不是奇數的商人,儘管事實
上我們不知道他的身分證號碼,而他依然很可能會害怕:假如他回答「是」,而我們若
查出他的身分證號碼,那不就證明他曾逃稅嗎?我們為了避免因此而產生資料的偏差
,可以再應用下面的例子。
假如我們想研究贊成墮胎的比率,那麼可以將均一的紅色、白色及藍色玻璃珠放
入盒中,已知各色玻璃珠出現的機率為 pr、pw、pb。我們可設計如下的隨
機問答,被調查者先從盒中隨機抽取一玻璃珠,然後按下列規則回答。
同前例,我們可以得到下列的數學模型
式中λ表示回答「是」的機率,π表示贊成墮胎的機率。因為公式4中的
pr與pw為已知,因此只要計算回答「是」的比率,即可求得π的估計值。這種
方式的隨機問題,可以完全消除被調查者的疑慮,也可利用
的關係
,檢定調查的資料是否可靠。
上面我們提到一些簡單的統計應用,而實際從事統計工作,那經常是一件十分繁雜的
工作,而且稍微不小心,常會鬧笑話。例如: (1)當日光燈剛問世時,一些人深信,暴露
在日光燈的幅射下將喪失生殖能力。某條鐵路已裝妥日光燈,為了破除這個觀念,承辦了
一次實驗,將老鼠分成兩組,一組暴露在白熱燈下,另一組生活在日光燈下,經過一段
時間,在白熱燈下的老鼠已有了正常數目的子孫,但是另一組卻沒有一個後代,這個實
驗反而更加令人相信,暴露在日光燈下將喪失生殖能力。後來經過一些懷疑者重新詳
細的檢驗,卻意外地發現第二組的老鼠竟然都是同性的。
讓我們再舉個例子來談談把因果關係顛倒所造成的笑話。 (2)新希伯利德的土著們相信
虱子有益於身體健康,因為根據他們數百年的觀察經驗,身體好的人都有虱子,只有
生病的人身上沒有。於是他們由此推論:虱子使人健康,每個人都該有一些。這種
推論顯然有問題,但是他們卻是確信不移。後來經過一些有經驗的人仔細研究之後,發現
在新希伯利德地方差不多每個人都長虱子,可是常有人生病發燒的時候,因為體溫
太高,虱子們便喬遷他去,另覓住宅。這個例子告訴我們,如果把因(生病發燒)與
果 (身上沒虱子)顛倒,混淆一談,所得的結論將令人啼笑皆非。
這類的例子很多,又如: (3)曾經有人費了很多工夫找出在大學生中,吸煙學生的成積是要比不吸煙的差,於是許多人(尤其是不吸煙的家長)就很高興的推論:如果要成績好的話,大學生非戒煙不可。事實上,這個推論是以「抽煙」為因,「成績差」為果所導得的,但是這樣的假設是毫無根據的。我們同樣可以把因果關係顛倒過來,以「成積差」為因,「抽煙」為果,也就是說:學生因成積差,只好藉煙解愁。如此一來,就是把煙戒了也無法提高成績。
- 1.科技發展小組,《統計能為你做些什麼》,文理出版社發行。
- 2.夏沛然,《統計魔術》,科學月刊發行。
|