上頁 123 已在最後一頁

談統計應用 (第 3 頁)

鄧進財

 


首頁 | 搜尋

.原載於數學傳播第三卷第三期
對外搜尋關鍵字
 
例題3. 如何調查敏感性的問題

假如我們所調查的問題涉及個人名譽道德、私人秘密及其他利害相關的事項,被調 查的人多半不會忠實回答,若勉強直接調查,也難獲得可靠的資料。例如:我們想 瞭解商人的逃稅率,如果直接詢問他們所得到的答案,必然是否定的。諸如此類 的問題,我們要如何設計調查方式,以獲取被調查者的坦誠合作,提高調查效果? 在此我們舉個例子來談談如何利用一種「隨檢問答」 (randomized response) 的技巧,以消除被調查者的疑慮;爭取精誠合作。

如果我們要調查商人的逃稅率,我們可設計兩個問題: 問題1,為敏感性的問題-「你是否曾經逃稅?」, 問題2,為無關的問題-「你的身份證號碼是否為奇數?」

對每一個被調查的商人,我們可請他自行在放有 7個紅球, 3個白球的袋中任意選取一球,然後按照下列規則 回答問題:

\begin{displaymath}
\begin{array}{l}
\mbox{{\fontfamily{cwM2}\fontseries{m}\sele...
...family{cwM0}\fontseries{m}\selectfont \char 1}} \\
\end{array}\end{displaymath}

注意:被調查者只需回答「是」或「否」,而不須告訴我們選到何種球、所回答的是 何種問題,如此我們即無法確知對方所回答的是何種問題,因此被調查者可以毫無顧忌 的回答問題。

這種調查方式,雖然我們並不知道被調查者個別回答的問題是何種問題,但是在全體 上,我們利用簡單的機率理論,即可輕易地求得所要調查的問題,茲說明如下:

P(X)表示陳述 X成立的機率, P(X|Y)表示陳述 Y成立時陳述 X成立的條件 機率,則

\begin{displaymath}
\begin{array}{cr}
P(\mbox{{\fontfamily{cwM4}\fontseries{m}\s...
...ly{cwM2}\fontseries{m}\selectfont \char 230}2}) \\
\end{array}\end{displaymath}

或者寫得更簡潔點

\begin{displaymath}
\lambda =p\pi +(1-p)\theta \quad (\mbox{{\fontfamily{cwM0}\f...
...0.1pt{\fontfamily{cwM1}\fontseries{m}\selectfont \char 31}} 3)
\end{displaymath}

式中λ表示回答「是」的機率,π表示商人中曾逃稅過的比率,p表示選到敏感性問題的機率 ,而θ表示商人之身分證號碼為奇數的機率。假設調查統計的結果,得到回答 「是」的比率為 0.44,也就是 $\lambda\approx$0.44則將p=0.70,及$\theta =$0.50代入公式3中,得

\begin{displaymath}
0.44=0.70\times\pi +(1-0.70)\times 0.50\Longrightarrow \pi =0.41
\end{displaymath}

因此我們可估計商人中曾逃稅的比率為41%。

上面我們所用的方法,若碰到一位多疑,而身分證號碼又不是奇數的商人,儘管事實 上我們不知道他的身分證號碼,而他依然很可能會害怕:假如他回答「是」,而我們若 查出他的身分證號碼,那不就證明他曾逃稅嗎?我們為了避免因此而產生資料的偏差 ,可以再應用下面的例子。

假如我們想研究贊成墮胎的比率,那麼可以將均一的紅色、白色及藍色玻璃珠放 入盒中,已知各色玻璃珠出現的機率為 prpwpb。我們可設計如下的隨 機問答,被調查者先從盒中隨機抽取一玻璃珠,然後按下列規則回答。

\begin{displaymath}
\begin{array}{l}
\mbox{{\fontfamily{cwM0}\fontseries{m}\sele...
...family{cwM0}\fontseries{m}\selectfont \char 1}} \\
\end{array}\end{displaymath}

同前例,我們可以得到下列的數學模型

\begin{displaymath}
\lambda =p_r\times\pi +p_w\times 1+p_b\times 0 \quad (\mbox{...
...s0.1pt{\fontfamily{cwM1}\fontseries{m}\selectfont \char 31}}4)
\end{displaymath}

式中λ表示回答「是」的機率,π表示贊成墮胎的機率。因為公式4中的 prpw為已知,因此只要計算回答「是」的比率,即可求得π的估計值。這種 方式的隨機問題,可以完全消除被調查者的疑慮,也可利用 $\pi\lambda\geq p_w$的關係 ,檢定調查的資料是否可靠。

上面我們提到一些簡單的統計應用,而實際從事統計工作,那經常是一件十分繁雜的 工作,而且稍微不小心,常會鬧笑話。例如: (1)當日光燈剛問世時,一些人深信,暴露 在日光燈的幅射下將喪失生殖能力。某條鐵路已裝妥日光燈,為了破除這個觀念,承辦了 一次實驗,將老鼠分成兩組,一組暴露在白熱燈下,另一組生活在日光燈下,經過一段 時間,在白熱燈下的老鼠已有了正常數目的子孫,但是另一組卻沒有一個後代,這個實 驗反而更加令人相信,暴露在日光燈下將喪失生殖能力。後來經過一些懷疑者重新詳 細的檢驗,卻意外地發現第二組的老鼠竟然都是同性的。

讓我們再舉個例子來談談把因果關係顛倒所造成的笑話。 (2)新希伯利德的土著們相信 虱子有益於身體健康,因為根據他們數百年的觀察經驗,身體好的人都有虱子,只有 生病的人身上沒有。於是他們由此推論:虱子使人健康,每個人都該有一些。這種 推論顯然有問題,但是他們卻是確信不移。後來經過一些有經驗的人仔細研究之後,發現 在新希伯利德地方差不多每個人都長虱子,可是常有人生病發燒的時候,因為體溫 太高,虱子們便喬遷他去,另覓住宅。這個例子告訴我們,如果把因(生病發燒)與 果 (身上沒虱子)顛倒,混淆一談,所得的結論將令人啼笑皆非。

這類的例子很多,又如: (3)曾經有人費了很多工夫找出在大學生中,吸煙學生的成積是要比不吸煙的差,於是許多人(尤其是不吸煙的家長)就很高興的推論:如果要成績好的話,大學生非戒煙不可。事實上,這個推論是以「抽煙」為因,「成績差」為果所導得的,但是這樣的假設是毫無根據的。我們同樣可以把因果關係顛倒過來,以「成積差」為因,「抽煙」為果,也就是說:學生因成積差,只好藉煙解愁。如此一來,就是把煙戒了也無法提高成績。

1.科技發展小組,《統計能為你做些什麼》,文理出版社發行。
2.夏沛然,《統計魔術》,科學月刊發行。

   

上頁 123 已在最後一頁

回頁首
 
(若有指正、疑問……,可以在此 留言寫信 給我們。)
EpisteMath

EpisteMath (c) 2000 中央研究院數學所、台大數學系
各網頁文章內容之著作權為原著作人所有


編輯:陳文是 最後修改日期:4/26/2002