到底是 3% 還是 6%

聲明: 這篇文章不討論任何政治傾向,本篇文章純粹以統計理論角度出發撰寫2024年總統大選民調合理的計算方式,並且含有大量個人假設(因為我不知道他們原本的討論到底是啥)。另外,以下含有大量數學計算,會有文字說明,但討厭數學者請謹慎服用。

PS. 歡迎直接拉到最下面看結論

背景故事

在2024年台灣總統大選的選戰之中,原本預計的參選者有: 賴清德+蕭美琴 (民進黨),柯文哲+吳欣盈 (民眾黨)以及侯友宜+趙少康 (國民黨)三組候選人。然而在 2023/11/15 ,民眾黨候選人與國民黨候選人宣布兩組候選人要一起合作,並以民調的方式來決定誰正誰副。然而就在民調結果出爐之後,雙方卻對於抽樣誤差的概念爭執不下,因而衍伸出了有名的 3%、6%爭議事件

參考新聞連結
2024台灣大選:「藍白合」卡關,為何遲遲未能決定「侯柯配」還是「柯侯配」
藍白合6民調「3:3」 統計學博士費鴻泰曝原因:沒有模糊空間

問題定義

首先我們先來定義要調查甚麼東西,這樣後續的計算才能進行,我自己對這次民調的目的定義如下: 請問侯柯配跟柯侯配哪個組合對上賴蕭配的勝算較大 ?

藉由這個定義,我們應該是要選出對上賴蕭配能夠贏的最多的組合

數學定義

假設全台可投票人數為 N,抽出樣本數為 n。在每次的電訪之中,受訪者會被詢問兩個問題

  1. 如果是柯侯配對上賴蕭配,你會投誰 ?
  2. 如果是侯柯配對上賴蕭配,你會投誰 ?

接著我們將這些結果依問題分類

  1. 針對第一個問題,令母體中會回答柯侯配的人的比例為 p_{11},回答賴蕭配的人的比例為 p_{12}
  2. 針對第二個問題,令母體中會回答侯柯配的人的比例為 p_{21},回答賴蕭配的人的比例為 p_{22}

接著我們令 p_1 = p_{11} - p_{12}p_2 = p_{21} - p_{22}。那為甚麼要這樣設,我們回到原問題。我們希望能夠選出對上賴蕭配能夠贏的最多的組合,因此我們將 p_{i1} - p_{i2} 就能得到第 i 個組合能贏賴蕭配多少,便可以在加以拿這個值來做比較。所以我們要估計的東西就出來了,我們其實就是要估計

    \[p = p_1 - p_2\]

這個母體參數

數學推導

接下來,因為樣本數算蠻大的,符合下面這些情況

    \[n_1p_1 \ge 5, n_1(1-p_1)\ge5, n_2p_2\ge5, n_2(1-p_2)\ge5\]

因此我們可以假設 p 的抽樣分布 \hat{p} 近似常態,可寫成

    \[\hat{p} \rightarrow N(p_1 - p_2, Var(\hat{p_1} - \hat{p_2}))\]

接下來算是一個稍有問題的地方,我們需要考量 Cov(\hat{p_1}, \hat{p_2}) 的值,因為這個值顯然不為 0。但是因為後續計算發現這裡會使得 Var(\hat{p}) 為負的情況,因此我這裡還是假設 Cov(\hat{p_1}, \hat{p_2}) = 0,此時 \hat{p} 的分布又可改寫成

    \[\hat{p} \rightarrow N(p_1 - p_2, Var(\hat{p_1}) + Var(\hat{p_2}))\]

    \[\begin{aligned} Var(\hat{p_1}) = \frac{p_1(1-p_1)}{n} \\ Var(\hat{p_2}) = \frac{p_2(1-p_2)}{n} \end{aligned}\]

但因為 p_1, p_2 皆為母體參數,我們無從得知其值,所以用 \hat{p_1}, \hat{p_2} 來估計,因此會得到

    \[\begin{aligned} \hat{Var(\hat{p_1})} = \frac{\hat{p_1}(1-\hat{p_1})}{n} \\ \hat{Var(\hat{p_2})} = \frac{\hat{p_2}(1-\hat{p_2})}{n} \end{aligned}\]

這個時候差不多可以來建造信賴區間惹,\hat{p} 的 95% 信賴區間為

    \[-1.96 \le \frac{\hat{p} - (p_1 - p_2)}{\sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n} + \frac{\hat{p_2}(1-\hat{p_2})}{n}}} \le 1.96\]

阿這裡還是有母體參數 p_1, p_2,我們隨手把它假設成 p_1 = p_2。至於為甚麼不能用 \hat{p_1},\hat{p_2} 來取代,因為你會發現它變成 0 了,所以上式又可以改寫成

實際計算

以下計算皆參考這張圖表

我們拿第一列 匯流(趨勢) 的資料來做運算。此時

    \[\begin{aligned} \hat{p} = 0.046 \\ \hat{p_1} = 0.091 \\ \hat{p_2} = 0.045 \end{aligned}\]

因此,\hat{Var(\hat{p})} 的值便為

\begin{aligned} \hat{Var(\hat{p})} &= \sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n} + \frac{\hat{p_2}(1-\hat{p_2})}{n}} \\ &= \sqrt{\frac{0.091 \ \text{x} \ 0.909}{2046} + \frac{0.045 \ \text{x} \ 0.955 }{2046}} \\ &=0.00784 \end{aligned}

所以我們就可以得到 \hat{p} 的 95% 信賴區間為

\begin{aligned} &= \hat{p} \pm 1.96 \sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n} + \frac{\hat{p_2}(1-\hat{p_2})}{n}} \\ &= \hat{p} \pm 1.96 \ \text{x} \ 0.00784 \\ &= \hat{p} \pm 0.0154 \\ &= 0.046 \pm 0.0154 \end{aligned}

結果詮釋

所以,上面那個結果到底是甚麼意思 ?

其實 p 代表的就是在母體之中,柯侯配 的支持比例減掉 賴蕭配 的支持比例與 侯柯配 的支持比例減掉 賴蕭配 的支持比例的 差值。當 p>0,我們就越傾向 柯侯配 是比較有勝算的組合。反之當 p < 0,我們就越傾向 侯柯配 是比較有勝算的組合。而經過估計,\hat{p} 的 95% 信賴區間為

    \[[0.0306, 0.0614]\]

而這個信賴區間落在大於 0 的範圍,因此我們會認定 柯侯配 是比較好的選擇

那 3% 跟 6% 去哪了 ?

首先必須要先解釋一下 3% 這個數字到底是怎麼來的。假設我們不要管前面一大對有的沒的東西相減,我們想要估計 藍白合 在母體之中的支持度,並假設這個值為 p,然後抽了 n 個樣本

考慮 np \ge 5,此時可以將 p 的抽樣分配近似常態,寫成

    \[\hat{p} \rightarrow N(p, \frac{p(1-p)}{n})\]

此時跟前面一樣巧妙的算法,我們先把 p 假設成 0.5 用來估計 \frac{p(1-p)}{n}。再把 p 假設成 0。我們就可以得到 \hat{p} 的 95% 信賴區間為

    \[-1.96\le\frac{\hat{p}}{\sqrt{\frac{0.25}{n}}} \le 1.96\]

又可以寫成

    \[\hat{p} \pm 1.96\sqrt{\frac{0.25}{n}}\]

這時我們只要把民調最常用的 n = 1068 帶入你就會發現

    \[\begin{aligned} &= \hat{p} \pm 1.96 \sqrt{\frac{0.25}{n}}\\ &= \hat{p} \pm 1.96\sqrt{\frac{0.25}{1068}} \\ &= \hat{p} \pm 0.02999 \approx 3\% \end{aligned}\]

大家所吵的 3% 就這麼跑出來了,接下來我們來用這個公式算算看下面的資料,看看他們是不是真的這樣算。這邊要變動的其實就只有 n 的值而已

  • 匯流(趨勢): 1.96\sqrt{\frac{0.25}{2046}} = 0.02167 \approx 2.17\%
  • 聯合報: 1.96\sqrt{\frac{0.25}{1149}} = 0.02891 \approx 2.9\%
  • 鏡新聞(大地)、競爭力(世新): 1.96\sqrt{\frac{0.25}{1112}} = 0.02939 \approx 2.94\%
  • TPP 內參: 1.96\sqrt{\frac{0.25}{1082}} = 0.02979 \approx 2.98\%
  • KMT 內參: 1.96\sqrt{\frac{0.25}{1484}} = 0.02544 \approx 2.55\%

可以發現他們真的是採用這個算法,然而從前面的推導我們可以知道這個算法根本沒辦法用在這次的比較上,因為這次民調比較的內容是 母體比例的差值 而不是 母體比例本身

好但沒關係,我們姑且相信專業,我們把圖中所計算出來的邊際誤差拿來當作 95% 的信賴區間。此時圖片中 (7) 的的 95% 信賴區間就可以寫成

  • 匯流(趨勢): 0.046 \pm 0.0217 \rightarrow [0.0243, 0.0677]
  • 聯合報: 0 \pm 0.029 \rightarrow [-0.029, 0.029]
  • 鏡新聞(大地): 0.019 \pm 0.0294 \rightarrow [-0.0104, 0.0484]
  • 競爭力(世新): 0.0883 \pm 0.0294 \rightarrow [0.0589, 0.1177]
  • TPP(內參): 0.053 \pm 0.0298 \rightarrow [0.0232, 0.0828]
  • KMT(內參): 0.019 \pm 0.0255 \rightarrow [-0.0065, 0.0445]

若依照新聞的說法: 「雙方同意,若超過統計誤差,由勝者得一點;若在統計誤差範圍內,由侯柯配得一點」 這個邏輯的話,那民調結果確實是 3:3 雙方平手。

為甚麼 ?

因為我們可以看到上面六個計算結果,有三個包含了 0 這個值。也就是說在 聯合報、鏡新聞(大地)、KMT(內參) 這三家的民調之中,若將誤差邊際考慮進去的話,我們沒辦法確定哪種組合的獲勝可能比較高,也就代表 侯柯配 會在這三家民調結果上拿下一點。剩下的則是由 柯侯配 拿下

結論

  1. 設定 3% 為誤差範圍在這次的比較中是不合理的,應以估計母體比例差值的公式計算
  2. 假設 3% 是合理的,民調結果為 3:3,不存在 5:1 的情形