【認識民意調查】 洪永泰 2019 ►下載文章 docx. pdf.
壹、認識民意調查
一、重要環節
- 調查目的
- 調查母體定義
- 資料蒐集方式
- 抽樣
- 資料衡量工具(問卷設計)
- 工作人員訓練
- 試測
- 資料蒐集
- 資料處理與加權
- 資料分析與報告撰寫
貳、一些基本議題
請參考:
曾憲立、洪永泰、朱斌妤、黃東益、謝翠娟,2018,〈多元民意調查方法的比較研究〉,《調查研究》,41:87-117。
洪永泰、俞振華、高世垣,2017,〈數位時代下地方民意探索之挑戰與回應〉。台北市政府研考會委託專題研究報告。
一、資料蒐集方式
(一)面訪:優點是問卷可容納的題目多且深入,訪員可和受訪者面對面溝通;缺點是花費太大,行政管理不易,用人太多,資料品質難以控制,執行期間較長,訪問失敗問題嚴重等。
(二)電話訪問:包括住宅電話與手機。優點是花費較低,易於監控,資料品質較好,快速簡便,無遠弗屆;缺點是住宅電話和手機都有其母體涵蓋率的缺失以及越來越嚴重的訪問失敗問題,樣本代表性不佳,問卷題目少且不能深入。
請見附錄及張鐙文、黃東益、洪永泰,2017,〈住宅電話與手機雙底冊調查的組合估計:以2016總統選舉預測為例〉,《選舉研究》,24 (2):65-96。
(三)郵寄問卷:費用低,但訪問失敗問題最嚴重,資料品質差,樣本代表性堪慮,除非是特定團體有接近百分之百的回收率,否則這種方式應極力避免。
(四)面訪留置問卷或自填問卷:可以節省大量的訪問費用,但抽樣工作一定要確實執行,排除自願樣本,搭配良好的問卷設計和高回收率,可以是成本效益和效率極高的抽樣調查,缺點是問卷由受訪者自行填答,資料品質不易控制。
(五)網路調查:如果是由研究者以機率抽樣方式抽取研究對象的電腦帳號發出問卷,則形同郵寄問卷,除了高成本效益和高效率的資料處理優點之外,這種方式也有所有郵寄問卷調查的缺點。如果是將問卷放在網路上讓人填答,則根本不是合格的抽樣調查。網路調查通常都有嚴重的「母體定義」問題。
(六)電話錄音訪問(又稱語音調查):由受訪者按鍵選擇答案的調查方式在台灣已經有人使用,不過這種資料蒐集方式的母體涵蓋性、樣本代表性、和資料品質無從驗證,也無法評估。
二、抽樣
(一)機率抽樣與非機率抽樣:要判斷一個民意調查抽樣工作是否恰當有個很簡單的方法,只需問:「這個調查的母體有沒有明確定義?母體之中的每一個成員是不是都有一個不為零的中選機率?每一個成員的中選機率是多少?」受過專業訓練的人一定可以回答這些問題。從這個簡單的標準來看,便利抽樣、立意抽樣、自願樣本、Call in樣本、配額樣本等等都不是科學的抽樣,因為有太多的母體成員中選機率是零,有的甚至連調查母體的定義都寫不出來。
(二)據以抽樣的母體清冊(frame)與涵蓋率(coverage):以台灣地區民眾為抽樣調查對象的母體清冊常見的有以下幾種:
1. 戶籍資料:理論上涵蓋率最完整,但實務上執行困難,花費大;另外還會有戶籍登記者、常住者、與現住者的定義難題。
2. 選舉人名冊:同戶籍資料,但執行較容易,是與選舉有關的調查研究最理想的抽樣清冊。
3. 電話簿:涵蓋率不足,且因地而異。
4. 隨機撥號(Random Digit Dialing, RDD):理論上涵蓋所有電話用戶(但不是所有民眾),因空號,機關或營業用戶而使用戶接通成本增加,且地區性範圍定義困難,代價更高。
5. 電話資料庫:涵蓋率不足。
電話調查的涵蓋率議題
P1表示母體之中只有住宅電話沒有手機者的百分比,
P2表示母體之中有住宅電話也有手機者的百分比,
P3表示母體之中沒有住宅電話只有手機者的百分比,
P4表示母體之中沒有住宅電話也沒有手機者的百分比。
(一)以面訪估計:
A 「請問您經常住的地方共有幾線家用電話號碼?(不包括手機、傳真或上網專用電話)」。
B 「請問您經常使用的手機門號有幾個?」
C 「請問您平常在家或工作時使用電話的情形是下列哪一種? 1全部都是有線電話,不用手機,2大部分是有線電話,少部分是手機電話,3一半一半,4少部分是有線電話,大部分是手機電話,5全部都是用手機接電話,但是其中有一些從有線電話轉接過來的,6全部都是用手機接電話,不用有線電話,7平常沒在使用電話及手機。」
(題目C是沿用美國面訪調查的標準題目,訪問時訪員使用show cards提示受訪者。這一題定義在「使用」基礎上。)
表1 近年來關於民眾各種電話擁有百分比的面訪調查結果1(A和B交叉)
調查 |
樣本數 |
P1估 |
P2估 |
P3估 |
P4估 |
2008中研院社會變遷卷一 |
1941 |
5.2% |
92.4% |
2.1% |
0.4% |
2010中研院社會變遷卷一 |
1853 |
19.1% |
73.0% |
7.4% |
0.5% |
2011中研院社會變遷卷二 |
2145 |
23.2% |
58.0% |
18.2% |
0.6% |
2013中研院前瞻計畫 |
2013 |
13.0% |
76.7% |
10.2% |
0.1% |
2013 TEDS |
2292 |
9.5% |
84.2% |
5.9% |
0.4% |
2015中研院社會變遷卷一 |
1953 |
18.2% |
63.0% |
16.4% |
2.4% |
註1:為方便比較,所有的調查資料都選取年齡在20歲及以上樣本為計算範圍。
註2:使用問卷中A和B兩題交叉。
註3:TEDS(Taiwan’s Election and Democratization Study 台灣選舉與民主化調查)。
表2 近年來關於民眾各種電話使用百分比的面訪調查結果2(A和C交叉)
調查 |
樣本數 |
P1估 |
P2估 |
P3估 |
P4估 |
2013 TEDS |
2292 |
9.5% |
85.7% |
4.5% |
0.3% |
2017 TEDS戶籍資料抽樣 |
1186 |
8.2% |
82.8% |
8.2% |
0.2% |
2017 TEDS門牌地址抽樣 |
1166 |
10.6% |
78.4% |
10.7% |
0.3% |
表3 近年來關於民眾各種電話使用行為的面訪調查結果3(只用C)
調查 |
樣本數 |
P1估 |
P2估 |
P3估 |
P4估 |
2009~10國民健康調查 |
19776 |
15.0% |
73.7% |
9.3% |
2.0% |
2013 TEDS |
2292 |
9.5% |
66.7% |
18.9% |
0.6% |
2017 TEDS戶籍資料抽樣 |
1186 |
8.8% |
62.5% |
26.5% |
1.9% |
2017 TEDS門牌地址抽樣 |
1166 |
10.6% |
62.7% |
25.2% |
1.3% |
註1:國民健康調查以年齡在18歲及以上者為資料擷取範圍,TEDS則是20歲及以上。
優點:獨立估計。
缺點:
1嚴重的訪問失敗問題。
2完訪樣本都是住在戶籍地的人。從邏輯上我們知道「唯手機族(P3)」比較有可能是因為工作、求學或其他原因而不住在戶籍地,這些人通常也是較難在面訪調查中被接觸到和完訪的一群。以戶籍資料為主的面訪調查對P3的估計極可能低估。表4是台北市的例子,「人在籍不在者」唯手機族估計是70.88%,而「人在籍在者」唯手機族估計才23.55%而已。
表4 人、籍及電話擁有率的估計:台北市雙底冊調查2017年8月
住宅電話調查 |
手機調查 |
P1 唯住宅 估計 |
P2 兩者 估計 |
P3 唯手機 估計 |
|||||
唯住宅 |
兩者 |
合計 |
兩者 |
唯手機 |
合計 |
||||
人在籍在 |
108 |
836 |
944 |
506 |
176 |
682 |
8.75 |
67.70 |
23.55 |
人在籍不在 |
2 |
54 |
56 |
61 |
154 |
215 |
1.04 |
28.08 |
70.88 |
人不在籍在 |
0 |
7 |
7 |
61 |
42 |
103 |
0.00 |
59.22 |
40.78 |
全體 |
110 |
897 |
1007 |
628 |
372 |
1000 |
7.15 |
58.31 |
34.54 |
(二)以電話訪問估計:
問卷題目:
住宅電話題目是「請問您有使用手機嗎?」,
手機訪問題目是「請問您現在住的地方有住宅電話嗎?」
在未失一般性的情況下,假設 P4=0,亦即 P1+P2+P3=100。住宅電話調查理論上只能涵蓋 P1+P2,手機調查理論上只能涵蓋 P2+P3。
以x、y、z 分別表示雙底冊電話調查產生的樣本統計值,x+y+z=100。
x是P1的估計,y是P2的估計,z是P3的估計。
住宅電話訪問結果得到「唯住宅電話族」樣本數n1,「兩者都用者」樣本數n2,手機調查結果得到「兩者都用者」樣本數n3,「唯手機族」樣本數n4。
令 n1/(n1+n2)=a,或x/(x+y)= a,(1)
n4/(n3+n4)=b,或 z/(y+z)= b,(2)
x+y+z=100, (3)
解聯立方程式,得到x、y、z,亦即P1、P2、P3的估計。
優點是調查以「現在人口」為對象,彌補了以戶籍資料為抽樣底冊的缺失,
缺點是住宅電話和手機訪問各有其涵蓋率的盲點和嚴重的訪問失敗問題。
表5 電子治理中心雙底冊電話調查結果與組合估計2015~2017
|
住宅電話調查 |
手機調查 |
樣本數 |
組合估計 |
|||||
只用住宅電話不用手機 |
用住宅電話也用手機 |
用手機也用住宅電話 |
只用手機不用住宅電話 |
唯住宅 P1 |
兩者皆用 P2 |
唯手機 P3 |
|||
2015 |
n |
186 |
822 |
|
|
1008 |
13.1 |
57.7 |
29.2 |
橫% |
18.5% |
81.5% |
|
|
100.0% |
||||
n |
|
|
665 |
337 |
1002 |
||||
橫% |
|
|
66.4% |
33.6% |
100.0% |
||||
2016 |
n |
231 |
980 |
|
|
1211 |
14.0 |
59.2 |
26.8 |
橫% |
19.1% |
80.9% |
|
|
100.0% |
||||
n |
|
|
823 |
373 |
1196 |
||||
橫% |
|
|
68.8% |
31.2% |
100.0% |
||||
2017 |
n |
509 |
6531 |
|
|
7040 |
|
|
|
橫% |
7.2% |
92.8% |
|
|
100.0% |
|
|
|
|
n |
|
|
770 |
389 |
1159 |
|
|
|
|
橫% |
|
|
66.4% |
33.6% |
100.0% |
4.9 |
63.2 |
31.9 |
註1:問卷題目都相同,住宅電話題目是「請問您有使用手機嗎?」,手機訪問題目是「請問您現在住的地方有住宅電話嗎?」
以台灣地區20歲以上民眾為母體,從涵蓋率來看,以個人(不是家戶)為計算單位,綜合各種估計:住宅電話的涵蓋率大概是在65%至75%之間,手機涵蓋率在85%至95%之間。換個方向說,也就是有25%至35%是只用手機不用住宅電話的人(唯手機族,cell phone only),5%至15%只用住宅電話不用手機。另外一個重要參考變數是「是否住在戶籍地」,不住在戶籍地的人通常也有很高比例的「唯手機族」。
(三)戶中選樣:凡是等機率抽戶而戶中合格受訪者不只一位時,必須進行戶中選樣才算是完成抽樣程序。常見的戶中選樣方式有以下幾種:
1. 任意成人:可能沒有隨機性。
2. 上(下)一位過生日者:美國常用,台灣較困難。
3. 配額:破壞隨機性,但在台灣最常用。
4. Kish 戶中選樣表:如表6,自1949迄今仍在使用,較有侵犯性。
表6 Kish 戶中選樣表
表序 |
使用機率 |
戶中合格人數 |
|||||
1 |
2 |
3 |
4 |
5 |
6或以上 |
||
選擇合格受訪者之年齡大小序位 |
|||||||
1 |
1/6 |
1 |
1 |
1 |
1 |
1 |
1 |
2 |
1/12 |
1 |
1 |
1 |
1 |
2 |
2 |
3 |
1/12 |
1 |
1 |
1 |
2 |
2 |
2 |
4 |
1/6 |
1 |
1 |
2 |
2 |
3 |
3 |
5 |
1/6 |
1 |
2 |
2 |
3 |
4 |
4 |
6 |
1/12 |
1 |
2 |
3 |
3 |
3 |
5 |
7 |
1/12 |
1 |
2 |
3 |
4 |
5 |
5 |
8 |
1/6 |
1 |
2 |
3 |
4 |
5 |
6 |
Kish Table 的優點是在理論上堅持了機率抽樣的原則,使得每一位合格者都有一個不為零的中選機會,其次,透過如此精巧的設計可以使每人中選機率雖不相等,但近乎相等,不必有加權處理的困擾。
缺點是:
(一)表格複雜,除了表6之外,仍需戶中成員登錄紀錄,這對訪員是一個不小的負擔;
(二)訪員素質與訓練關係重大,影響整個抽樣與資料蒐集工作的成敗,通常調查計畫主持人並不樂意見到訪員有如此大的自主空間;
(三)由於訪問的第一件事即是詢問戶中每一位合格人士的名字、性別、與年齡,造成對受訪者相當程度的冒犯,影響訪問品質甚至造成拒訪;
(四)整個戶中選樣過程繁瑣,加長訪問時間與困難度,尤其在電話訪問方面所產生的困擾更大。
5. 依電話號碼尾數與戶中人口結構決定受訪者,如表7。
表 7 控制性別後以電話號碼尾數為隨機機制的戶中選樣表
戶中男/女性合格人數 |
電話號碼尾數 |
選擇受訪者 |
0 |
|
改以女/男性為受訪者 |
1 |
|
唯一合格者 |
2 |
單數 |
較年輕者 |
雙數 |
較年長者 |
|
3 |
01-33 |
最年輕者 |
34-66 |
次年長者 |
|
67-00 |
最年長者 |
|
4 |
01-25 |
最年輕者 |
26-50 |
次年輕者 |
|
51-75 |
次年長者 |
|
76-00 |
最年長者 |
|
5 |
01-20 |
最年輕者 |
21-40 |
次年輕者 |
|
41-60 |
第三大者 |
|
61-80 |
次年長者 |
|
81-00 |
最年長者 |
|
6及以上 |
01-16 |
最年輕者 |
17-32 |
次年輕者 |
|
33-50 |
第四大者 |
|
51-66 |
第三大者 |
|
67-82 |
次年長者 |
|
83-00 |
最年長者 |
*本表適用之性別須隨機設定,每格人數內之受訪者次序應經常輪換。
(四)兩階段以上的抽樣(例如先抽單位再抽人):因為極易造成不等機率抽樣,影響推論正確性,所以一定要請專家處理,千萬不要憑常識抽樣。表8是一個虛擬的依常識抽樣的例子,假設母體是某大學有30個系。第一階段先隨機抽1/3,也就是10個系,第二階段每個中選的系抽10人。
表 8 一個不等機率抽樣下不加權與加權的比較
中選學系 |
學生數 |
樣本數 |
吸菸人數 |
抽取率 |
權值 |
推估 |
1 |
250 |
10 |
3 |
(10/30)*(10/250) |
75 |
225 |
2 |
120 |
10 |
2 |
(10/30)*(10/120) |
36 |
72 |
3 |
560 |
10 |
5 |
(10/30)*(10/560) |
168 |
840 |
4 |
420 |
10 |
4 |
(10/30)*(10/420) |
126 |
504 |
5 |
180 |
10 |
1 |
(10/30)*(10/180) |
54 |
54 |
6 |
220 |
10 |
4 |
(10/30)*(10/220) |
66 |
264 |
7 |
480 |
10 |
3 |
(10/30)*(10/480) |
144 |
432 |
8 |
360 |
10 |
1 |
(10/30)*(10/360) |
108 |
108 |
9 |
240 |
10 |
2 |
(10/30)*(10/240) |
72 |
144 |
10 |
520 |
10 |
6 |
(10/30)*(10/520) |
156 |
936 |
合計 |
3350 |
100 |
31 |
10050(=3350*3) |
|
3579 |
估計母群體吸菸率不加權 31% (=31/100) |
三、樣本數的決定
(一)抽樣誤差:如果非抽樣誤差(譬如問卷設計不當、訪員作假、資料鍵入錯誤)不存在,只計算因抽樣而來的估計θ和母體參數θ的差異量,通常用平均差方(Mean Squared Error,MSE)表示,MSE - E( ^θ - θ2 ),E表示期待值或平均數,則MSE=var(^θ)+bias2,第一項是^θ的變異數,表示每次抽樣都會得到不同的^θ,如果做很多次,這些^θ就會有集中或分散的現象,用var(^θ)示之,是對母體參數估計的穩定程度或可靠度的意思;bias表示偏差,如果做許多次抽樣的話,會有許多個^θ,這些^θ的平均數和被估計的母體參數θ的差即是偏差。一般情況下,偏差均可透過統計方法控制為零,所以抽樣誤差一般也指估計的穩定程度。不同的抽樣設計和估計方法會有不同的抽樣誤差,直接影響到對母體推估的精確程度。樣本數越大,得到的估計值越穩定,抽樣誤差也越小,但它們之間並不成簡單的比例,所以必須諮詢專家,決定最有效率的樣本數和可以容忍的推論誤差。常見到的抽樣誤差表達方式,是換算成對母體參數區間估計的上下限,例如我們常會見到「以95%信賴度估計,對母體的各項推論最大抽樣誤差不會超過正負3%(或是正負 1/ √n,n是樣本數)」即是。
(二)經費、工作量、和時效:在現實世界裡資源有限,樣本數的大小通常由可運用資源的多寡來決定,必須和前一項抽樣誤差妥協。
(三)次母體推論的精確度:抽樣調查的目的有時也包括對次母體的推論,譬如以台灣地區民眾為對象的抽樣調查,會以各縣市為推論次母體,若每一縣市的推論都要達到相當程度的精確度,則每一縣市就需要相當於那個精確度的樣本數,如此一來,全台灣地區的樣本數勢必要膨脹。同樣的道理,這些次母體有時候可以是地區、城鄉、行業、公私立別等等。
(四)深入研究的必要性:有時候整個調查計畫的目的在做深入的比較分析,例如選民的投票意向會和教育程度、省籍、性別、行職業、地區、收入、年齡等有密切的關係。欲深入研究其間之交互作用,則這些因素交叉之後每個組合交集必須要有起碼的樣本數,以此最低要求反向推估所需的樣本總數。這種性質的調查比起單純的母體百分比推估所需的樣本數顯然較大。
(五)抽取率:從理論上來看,樣本數的決定和抽取率並無太大關係,實際上,每100人抽1人和每500人抽1人,如果樣本數相同,雖然母體大小相差很大,但兩者的抽樣精確度是可認定為完全相同的。只有在抽取率高於每20人抽1人時,才要考慮到這個因素。
(六)樣本的累積:有些按月、季、年調查的抽樣設計,每次調查的樣本數是可以累積的,譬如國民營養狀況調查、健康衛生和疾病調查、傳播媒體閱聽調查等。可以累積的理由是:這些性質的調查對象生活習慣不會在短期內有重大的改變。不過要注意的是每次調查的母體定義必須相同,以免每次推論都是以偏概全,造成嚴重的偏差。
(七)時間序列的抽樣設計:我們經常會有機會針對同樣的主題做時間序列方式的抽樣調查,藉以了解時代的脈動和民意的走向。由於在兩個時間點所進行的兩個獨立調查,只能觀察到整體差異,無法偵測出個體差異,使得抽樣設計必須做些改變。例如5年前吸菸人口有22%,目前則有20%,整體差異下降了兩個百分點,但我們無法知道有多少人在這段期間戒了菸,而又有多少人新加入吸菸的行列,這5年也許人口結構有了變化,也許人們改變了認知、態度與行為。欲弄清楚其中緣故,Duncan and Kalton(1987)介紹了幾種可行的抽樣設計和它們可達成的目標,這些方法有:
1. 重複進行獨立的抽樣設計。
2. 固定樣本連續訪問。
3. 樣本輪換,按每月、季、年,依序更換一部分樣本,重疊一部分樣本。
4. 混合設計,某一部分設定為固定樣本,某一部分設定為輪換樣本。
上述這些方法可視為樣本重疊設計,重疊的百分比從百分之百(固定樣本連續訪問)到零(獨立抽樣)。至於如何決定重疊的百分比,則要看調查目的、資源和容許的抽誤差而定。
四、問卷設計
(一)步驟
1. 決定研究目的,建立分析架構。
2. 根據研究目的,決定題組,一定要有受訪者基本資料題組。
3. 決定採取何種型式的問卷:直接、間接;封閉、開放、半封閉;單選、複選;事實、意見、態度。
4. 編擬初稿。
5. 邀請專家討論與修訂。
6. 試測。
7. 定稿,撰寫使用說明。
- 原則
1. 口語化(台語版)。
2. 公正客觀。
3. 切題。
4. 合邏輯。
5. 避免誘導。
6. 完整,周延、互斥。
7. 避免「社會正義感」或「社會贊許」性質的問題。
8. 一個問題問一個概念。
9. 提供選項則將選項含在題目中唸出,不提供選項則完全不提示。
10. 不適用、不知道、無意見、很難說、看情形、與拒絕回答
(三)題序,選項排序(通常CATI系統都可以處理)
(四)機構效應
(五)敏感性問題
(六)衡量工具:名義類別、等第、區間、比率;
Thurstone 兩兩相比、Likert 態度量表、Guttman 量表;
0(or 1)到10 v.s 0-100 衡量;提示5 or 60分?有無中間選項;
贊成(同意)的程度:從「一點也不」到「非常」;
非常贊成到非常反對,含中立、無意見;
贊成或反對?續問強度。
(七)信度與效度
1. 信度:再測信度,折半信度,平行測量工具測試。
2. 效度:建構效度,效標關聯效度。
五、訪問失敗的處理
訪問失敗有兩種:
Unit nonresponse;個案無反應,通常以加權(weighting)補救。
Item nonresponse:項目無反應,通常以插補(imputation)或模型推估補救。
前提:隨機性失敗,成功者和失敗者無差異。
Bias=W2*(P1 – P2)
推論偏差=失敗率*(成功者和失敗者的差異)
母體有 N 個人,其中有 N1 個人會訪問成功,N2 個人會訪問失敗,
N = N1 + N2
母體參數 P =X / N =(X1 + X2 )/ N
=(X1 / N1 )( N1 / N) + ( X2 / N2 )( N2 / N )
= P1 ( N1 / N) + P2 ( N2 / N )
樣本有 n 個人, 其中有 n1 個人訪問成功,n2 個人訪問失敗,n=n1+n2
p1 = x1 / n1 ,如果以成功樣本得到的統計值 p1 對母體參數 P 估計,則
E( p1 )- P = Bias
E( p1 )- P = P1 - P
= P1 – (P1 ( N1 / N) + P2 ( N2 / N ))
= P1 – P1 ( N1 / N) - P2 ( N2 / N )
= P1 ( 1 - N1 / N) - P2 ( N2 / N )
= P1 ( N2 / N) - P2 ( N2 / N )
= ( N2 / N )(P1 - P2 )
= W2 (P1 - P2 )
Bias=W2*(P1 – P2)
例如 0.90*(0.40 – 0.30)=0.09,
0.40*(0.40 – 0.30)=0.04,
0.40*(0.40 – 0.35)=0.02。
所有的抽樣調查在執行時都一定會有訪問失敗的現象,不同的處理方式會有不同的推論後果。
(一)不處理:這是最常見的做法,如果逕以成功樣本推論母體則可能造成偏差估計。理論上,推論偏差等於失敗率乘以訪問成功者和失敗者之間的差異量。
(二)依一定次序替代樣本,可能惡化估計偏差。
(三)使用隨機樣本替代,亦可能惡化估計偏差,因為調查結果會比較傾向訪問成功者。
(四)事先膨脹樣本,事後追蹤失敗樣本,估計並修正成功樣本對母體推論的偏差。這是最正確的作法,但有一定代價。
(五)加權處理(個案無反應的補救措施)。
(六)插補處理(項目無反應的補救措施)。
六、樣本代表性的檢定和補救辦法
資料清理完成之後的第一件事情就是樣本代表性的檢定,通常要處理的有地區、性別、年齡及教育程度的分布,因為這些數據有政府的統計報告來驗証;其次是因調查目的而指定的一些參數分布,這些只能依執行機構自行建立的指標做為參考。
樣本代表性失真的情況之下對母體進行推論勢必無法使人信服,通常的補救辦法就是加權處理。常見的加權處理方式有:依抽取率的倒數加權,事後分層加權(post-stratification),多變項反複加權(raking),和調整訪問成功率加權等。
參、解讀民意調查資料的一些概念
一、解讀數字一定要有「區間估計」的觀念。
抽樣調查的基本原理就是不會天真到以為一次調查的數據就能命中母體中那個不知道的參數值。凡是科學的抽樣調查一定有其理論上存在的抽樣誤差,統計學家們在推論母體時把數學原理上的誤差轉換成具有相當程度信賴水準的區間,也就是白話文裡的上下限,任何一個負責的抽樣調查一定會公布這個上下限的寬度,解讀數據的人必須以這個上下限為出發點去看資料。如果要比較的數據差距沒有超過這個區間,則這個差距是在抽樣誤差的範圍之內,也就是說,就母體而言,誰大誰小都是可能的;有部分傳播媒體喜歡把民意調查得來的數據依大小排名都犯了這個錯誤。
二、分母設定與百分比的計算
幾乎所有的民意調查項目都會有受訪者回報以「不知道、沒意見、看情形、很難說、沒有回答」等答案,通稱「無反應」;有的項目因跳題只問一部分人所以也會有「不適用」的選項,從資料解讀的完整性而言,這些項目不但應該展示,而且應列出百分比,有時還應同時列出各項答案佔全體百分比和適用該題的百分比;如果無反應者不是少數,顯示這是有意義的選項,在進一步的交叉列表分析時仍應照列,算是選項之一。傳播媒體上常見到許多報導只列出以表達意見者為分母的各項百分比,造成解讀資料的嚴重誤導。
附錄:雙底冊電話調查與事後分層的組合估計
Post-stratified weighting procedures for dual-frame telephone surveys
雙底冊抽樣調查所取得的樣本在加權處理時較一般的加權程序複雜。首先得依照完訪樣本的性別、年齡、教育程度做交叉組合,例如表9的34種事後分層組合。然後依據每一個組合的樣本使用電話行為的比例(唯住宅電話、兩者都使用、唯手機)估計進行併檔。併檔之後的資料處理則將依照研究調查的目的進行適宜的估計方案。讓我們考慮以下四種處理方式:
(一)W1:以住宅電話為主、手機為輔的合併處理。具體一點說是以住宅電話的所有完訪資料為主體,再併入手機調查資料中「唯手機族」的完訪個案,排除其「手機和住宅電話都使用」的資料,也就是(n1+n2)+n4。當然這個作法的主要考量是在手機調查規劃時即因為資源分配緣故只訪問「唯手機族」以節省成本。要留意的是受訪者如果是「兩者都用」的人,仍然需要詢問其基本資料後再停止訪問,否則缺乏表9之中的人口特徵數據將無法估計各個組合的權重。
(二)W2:以手機為主、住宅電話為輔的合併處理。這是以手機調查的所有完訪資料為主體,再併入住宅電話調查資料中「唯住宅電話族」的完訪個案,排除其「住宅電話和手機都使用」的資料,也就是n1+(n3+n4)。同樣地,當進行住宅電話訪問時雖然只需要訪問「唯住宅電話族」,但是受訪者如果是「兩者都用」的人,仍然需要詢問其基本資料後再停止訪問。
(三)W3:住宅電話和手機調查資料併檔,但是兩種調查的「兩者都用」資料分開處理,估計時各佔一半的P2。也就是(n1+n2)+(n3+n4),其中n2和n3受訪者個案分開處理其權值。若n2及n3樣本數量差距較大時,為了使n2及n3樣本可獨立估計,建議使用W3。
(四)W4:住宅電話和手機調查資料併檔,其中兩種調查的「兩者都用」合併為一類。也就是n1+(n2+n3)+n4,其中n2和n3先合併後視為一類再處理權值。若n2及n3樣本數量差距較大時,為了使n2及n3樣本可獨立估計,不建議使用W4。
以下以張鐙文等(2017)為例說明組合估計及其結果。
表 9 各種人口特徵的電話使用行為:34類事後分層分組
人口特徵組合 |
住宅電話 |
手機 |
p1估 |
p2估 |
p3估 |
||||
n1 |
n2 |
計 |
n3 |
n4 |
計 |
||||
1 男20至29歲高中職及以下 |
2 |
1 |
3 |
7 |
9 |
16 |
0.0 |
58.9 |
41.1 |
2 男20至29歲專科及以上 |
0 |
28 |
28 |
37 |
53 |
90 |
11.8 |
47.1 |
41.2 |
3 男30至39歲高中職及以下 |
2 |
8 |
10 |
7 |
8 |
15 |
0.0 |
56.7 |
43.3 |
4 男30至39歲專科 |
0 |
31 |
31 |
39 |
51 |
90 |
0.0 |
62.5 |
37.5 |
5 男30至39歲大學及以上 |
0 |
3 |
3 |
6 |
10 |
16 |
0.0 |
50.0 |
50.0 |
6 男40至49歲初中職及以下 |
0 |
12 |
12 |
15 |
15 |
30 |
0.0 |
74.4 |
25.6 |
7 男40至49歲高中職 |
0 |
32 |
32 |
11 |
32 |
43 |
0.0 |
77.8 |
22.2 |
8 男40至49歲專科 |
0 |
12 |
12 |
6 |
21 |
27 |
0.0 |
66.7 |
33.3 |
9 男40至49歲大學及以上 |
0 |
17 |
17 |
14 |
28 |
42 |
7.1 |
49.6 |
43.4 |
10 男50至59歲初中及以下 |
1 |
7 |
8 |
7 |
8 |
15 |
0.0 |
80.0 |
20.0 |
11 男50至59歲高中職 |
0 |
21 |
21 |
5 |
20 |
25 |
6.5 |
71.5 |
22.0 |
12 男50至59歲專科 |
2 |
22 |
24 |
4 |
13 |
17 |
7.8 |
62.4 |
29.8 |
13 男50至59歲大學及以上 |
4 |
32 |
36 |
11 |
23 |
34 |
13.9 |
41.7 |
44.4 |
14 男60歲及以上小學及以下 |
6 |
18 |
24 |
16 |
15 |
31 |
18.3 |
67.6 |
14.1 |
15 男60歲及以上初中職 |
13 |
48 |
61 |
5 |
24 |
29 |
17.8 |
76.5 |
5.7 |
16 男60歲及以上高中職 |
10 |
43 |
53 |
2 |
27 |
29 |
11.3 |
67.8 |
20.9 |
17 男60歲及以上專科及以上 |
4 |
24 |
28 |
4 |
13 |
17 |
43.1 |
37.9 |
19.0 |
18 女20至29歲高中及以下 |
33 |
29 |
62 |
9 |
18 |
27 |
0.0 |
61.7 |
38.3 |
19 女20至29歲專科及以上 |
0 |
31 |
31 |
31 |
50 |
81 |
0.0 |
45.5 |
54.5 |
20 女30至39歲高中及以下 |
0 |
3 |
3 |
6 |
5 |
11 |
1.5 |
58.8 |
39.7 |
21 女30至39歲專科 |
1 |
40 |
41 |
27 |
40 |
67 |
0.0 |
66.7 |
33.3 |
22 女30至39歲大學及以上 |
0 |
6 |
6 |
3 |
6 |
9 |
0.0 |
50.0 |
50.0 |
23 女40至49歲初中及以下 |
0 |
14 |
14 |
7 |
7 |
14 |
0.0 |
65.7 |
34.3 |
24 女40至49歲高中職 |
0 |
40 |
40 |
12 |
23 |
35 |
0.0 |
69.2 |
30.8 |
25 女40至49歲專科 |
0 |
20 |
20 |
4 |
9 |
13 |
4.8 |
57.9 |
37.2 |
26 女40至49歲大學及以上 |
2 |
24 |
26 |
9 |
14 |
23 |
60.0 |
40.0 |
0.0 |
27 女50至59歲小學及以下 |
3 |
2 |
5 |
0 |
2 |
2 |
0.0 |
70.0 |
30.0 |
28 女50至59歲初中職 |
0 |
51 |
51 |
9 |
21 |
30 |
3.9 |
75.0 |
21.0 |
29 女50至59歲高中職 |
3 |
57 |
60 |
7 |
25 |
32 |
16.0 |
77.0 |
7.0 |
30 女50至59歲專科及以上 |
5 |
24 |
29 |
1 |
11 |
12 |
29.4 |
58.8 |
11.8 |
31 女60歲及以上小學及以下 |
3 |
6 |
9 |
1 |
5 |
6 |
0.0 |
94.1 |
5.9 |
32 女60歲及以上初中職 |
0 |
28 |
28 |
1 |
16 |
17 |
27.4 |
62.7 |
9.9 |
33 女60歲及以上高中職 |
14 |
32 |
46 |
3 |
19 |
22 |
29.6 |
56.3 |
14.1 |
34 女60歲及以上專科及以上 |
10 |
19 |
29 |
2 |
8 |
10 |
54.0 |
29.4 |
16.5 |
0 缺失值 |
68 |
37 |
105 |
9 |
16 |
25 |
52.9 |
26.5 |
20.6 |
合計 |
186 |
822 |
1008 |
337 |
665 |
1002 |
13.1 |
57.7 |
29.2 |
註:請留意50至59歲組男女分類方式並不一致。
張鐙文、黃東益、洪永泰,2017,〈住宅電話與手機雙底冊調查的組合估計:以2016總統選舉預測為例〉,《選舉研究》,24 (2):65-96。
表10 雙底冊電話調查結果(2016年1月11日):樣本人口結構
原始資料 |
依照戶籍資料 加權 |
W1住宅電話為主手機為輔 |
W2手機為主住宅電話為輔 |
W3住宅電話與手機合併 |
||||
住宅 電話 |
手機 |
住宅 電話 |
手機 |
|||||
樣本數 |
1008 |
1002 |
1008 |
1002 |
1354 |
1189 |
2010 |
|
性別 |
1 男性 |
45.8% |
58.2% |
49.4% |
49.2% |
49.2% |
55.3% |
52.0% |
2 女性 |
54.2% |
41.8% |
50.6% |
50.8% |
50.8% |
44.7% |
48.0% |
|
年齡 |
1 20-29歲 |
7.1% |
20.0% |
16.7% |
17.2% |
11.4% |
17.0% |
13.5% |
2 30-39歲 |
10.6% |
23.0% |
20.6% |
21.3% |
15.3% |
19.4% |
16.7% |
|
3 40-49歲 |
15.9% |
20.3% |
19.2% |
19.5% |
16.7% |
17.5% |
18.0% |
|
4 50-59歲 |
25.3% |
18.9% |
19.3% |
19.2% |
23.1% |
18.0% |
22.2% |
|
5 60歲以上 |
41.1% |
17.8% |
24.2% |
22.8% |
33.5% |
28.1% |
29.6% |
|
教育 程度 |
1 小學或以下 |
18.6% |
6.9% |
15.5% |
15.1% |
15.9% |
15.0% |
12.9% |
2 初中、國中 |
11.2% |
8.9% |
13.1% |
12.6% |
10.5% |
9.6% |
10.0% |
|
3 高中、高職 |
27.5% |
24.6% |
28.3% |
28.9% |
26.4% |
23.7% |
26.0% |
|
4 專科 |
10.7% |
12.1% |
12.3% |
11.6% |
10.3% |
10.7% |
11.6% |
|
5 大學及以上 |
31.9% |
47.5% |
30.8% |
31.7% |
36.8% |
40.9% |
39.5% |
|
職業八分類 |
1 軍公教人員 |
12.0% |
11.5% |
9.0% |
8.6% |
11.8% |
10.8% |
12.0% |
2 私部門管理階層及專業人員 |
15.8% |
20.5% |
13.3% |
15.3% |
16.3% |
18.6% |
17.9% |
|
3 私部門職員 |
23.3% |
31.7% |
26.5% |
30.8% |
27.0% |
28.3% |
28.4% |
|
4 私部門勞工 |
14.6% |
15.4% |
17.3% |
19.5% |
15.3% |
16.1% |
15.1% |
|
5 農林漁牧 |
5.6% |
2.7% |
4.9% |
3.0% |
4.3% |
4.1% |
3.9% |
|
6 學生 |
1.7% |
6.9% |
4.0% |
5.4% |
3.1% |
5.9% |
4.2% |
|
7 家管 |
21.1% |
8.3% |
18.0% |
14.2% |
16.5% |
12.4% |
14.0% |
|
8 失業及其他 |
5.9% |
2.9% |
7.0% |
3.3% |
5.6% |
3.8% |
4.6% |
|
六大地區 |
1 大台北基隆 |
31.5% |
30.3% |
30.3% |
28.0% |
28.2% |
29.3% |
29.0% |
2 桃竹苗 |
12.6% |
15.2% |
15.0% |
14.9% |
14.2% |
15.0% |
14.7% |
|
3 中彰投 |
20.9% |
21.3% |
19.0% |
23.1% |
22.3% |
21.5% |
21.6% |
|
4 雲嘉南 |
14.7% |
13.5% |
14.6% |
14.2% |
14.3% |
13.9% |
14.1% |
|
5 高屏澎 |
16.5% |
15.4% |
16.8% |
15.3% |
16.6% |
15.9% |
16.3% |
|
6 宜花東 |
3.8% |
4.3% |
4.3% |
4.4% |
4.4% |
4.5% |
4.4% |
W1:住宅電話+手機調查中的唯手機族。W2:手機調查+住宅電話調查中的唯住宅電話族。
W3:住宅電話(唯住宅電話族+0.5兩者都用)+手機調查(0.5兩者都用+唯手機族)。
手機調查的「選樣偏誤 (selection bias)」:
手機調查受訪者比住宅電話受訪者更容易受到網路和社群媒體影響,也比較傾向接受民意調查訪問。
表11 2016年總統選舉選前5天雙底冊電話調查:網路行為與投票意向
網路行為 /投票意向 橫% |
手機調查2016年1月9日至11日 |
住宅電話調查2016年1月9日至11日 |
||||||||||
1 |
2 蔡英文 |
3 宋楚瑜 |
4 未表態 |
樣本數 |
樣本 直% |
1 朱立倫 |
2 蔡英文 |
3 宋楚瑜 |
4 未表態 |
樣本數 |
樣本 直% |
|
不上網 |
21.2 |
40.0 |
7.6 |
31.2 |
175 |
17.6 |
16.7 |
38.4 |
6.4 |
38.4 |
371 |
37.1 |
上網 |
17.8 |
43.3 |
19.2 |
19.7 |
822 |
82.4 |
22.5 |
41.3 |
13.1 |
23.2 |
629 |
62.9 |
合計 |
18.4 |
42.7 |
17.1 |
21.8 |
997 |
100 |
20.3 |
40.2 |
10.6 |
28.9 |
1000 |
100 |
選舉結果1催票率 |
20.3 |
36.7 |
8.4 |
33.7 未投票 |
20.3 |
36.7 |
8.4 |
33.7 未投票 |
||||
選舉結果2得票率 |
31.0 |
56.1 |
12.8 |
31.0 |
56.1 |
12.8 |
|
選舉結果1:催票率(得票數/合格選民數),民意調查以全體合格選民為調查母體。
選舉結果2:得票率(得票數/有效票數)。
以下以曾憲立等(2018)為例說明雙底冊調查結果的差異。
表12 不同民意調查方法-同性婚姻合法化議題
有人說,「相同性別可以結婚」,請問您贊不贊成? |
||||||
|
電話調查 |
手機 調查 |
網路 調查1 |
網路 調查2 |
||
未加權 |
依戶籍資料加權 |
+唯手機族組合 |
||||
非常不贊成 |
21.9% |
19.9% |
19.6% |
17.7% |
10.9% |
7.7% |
不贊成 |
27.9% |
24.9% |
25.2% |
19.6% |
14.9% |
14.2% |
贊成 |
27.8% |
32.6% |
29.8% |
35.3% |
48.0% |
48.5% |
非常贊成 |
7.3% |
10.2% |
9.9% |
14.5% |
16.1% |
16.5% |
不知道、拒答 |
15.1% |
12.3% |
15.5% |
12.8% |
10.1% |
13.2% |
20歲以上樣本數 |
1211 |
1211 |
1584 |
1196 |
1029 |
1808 |
Chi-square = 506.4, df = 20; p-value=0.00 |
資料來源:電子治理中心2016年調查,曾憲立等(2018)。
網路調查1是委託民間公司所蒐集之網路實名會員為調查對象。
網路調查2則透過政府入口網「my egov」會員電子報邀請會員填答。