生活裡那些不科學的事 - 統一發票中獎魔人之謎
| | | 0 | |
大家都知道我是篤信科學之人,認為世間所有的事幾乎都能透過科學或數學提出合理解釋。對,只是「幾乎」,從小到大有件事一直在挑戰我的信仰,猜很多人有也跟我有一樣的困惑 - 你是否有個中獎運超狂的朋友,難以用數學機率及科學理論解釋的那種?
我有位月月中發票,月平均中獎金額 1400 元的朋友,是我心中挑戰科學理論的經典案例,我請當事人提供過去一年的中獎統計供我進行分析:(註:外行人的非專業分析,如有錯請鞭小力一點)
| 期數 | 發票數量 (中獎) | 發票數量 (總計) | 中獎金額 (200) | 中獎金額 (500) | 中獎金額 (1000) | 中獎金額 (總計) |
|---|---|---|---|---|---|---|
| 11401-02 | 3 | 211 | 2 | 1 | 0 | 900 |
| 11403-04 | 2 | 218 | 1 | 0 | 1 | 1200 |
| 11405-06 | 3 | 285 | 0 | 3 | 0 | 1500 |
| 11407-08 | 4 | 273 | 3 | 1 | 0 | 1100 |
| 11409-10 | 2 | 248 | 0 | 1 | 1 | 1500 |
| 11411-12 | 4 | 233 | 1 | 2 | 1 | 2200 |
| 11501-02 | 4 | 215 | 1 | 3 | 0 | 1700 |
這機率是不是高得有點離譜?至於有多離譜,來實際算一下:
- 中 200 元發票(末三碼,3 組)的中獎率約為 0.3%
- 中 1000 元發票(末四碼,3 組)的中獎率約為 0.03%
- 雲端發票不是對號碼,是走隨機抽獎模式,依據新聞,2025 年雲端發票開立張數為 63.31 億張,平均一個月約 5.28 億張,而 500 元雲端獎每月有 315 萬組(2026 提高到 385 萬組),中獎率約為 0.6% (2026 為 0.73%) (註:2019 新聞當時中獎率為 0.5% / 0.7%,此推估值應屬合理)
粗淺研究,統計分析會用標準化殘差(Standardized Residuals,也稱為皮爾森殘差 Pearson Residuals) 衡量「實際值」偏離「期望值」程度,計算公式為 「(實際值 - 期望值) / 期望值平方根」,在本案例正值代表實際中獎張數高於預期(運氣較好),負值代表實際中獎張數低於預期(運氣較差)。而依據常態分佈理論,當其絕對值大於 1.96 代表「該差異在 5% 的顯著水準下達到顯著」,超過 2.58 (發生機率只有 1%) 則代表代表差異極為顯著。
「該差異在 5% 的顯著水準下達到顯著」這句話有點繞口,請 AI 白話解釋可想成:
- 「5% 顯著水準」是科學家設定的懷疑紅線,當機率低於 5% 還發生,統計學家傾向認為這背後存在某種特定原因 (例如真的有偏好或某種規律),不是純粹隨機巧合。
- 「這項差異太大,大到我們有 95% 的信心認為這不是隨機發生的,而是有特定原因造成的。」
- 「如果這件事純粹靠運氣,要出現這種結果的機率不到 5%。所以我們相信這不是運氣,而是真的有某種趨勢或偏好存在。」
- 「這不是小誤差,這是一個值得注意的異常訊號。」
我分別計算五、六、雲端獎中獎率乘張數計算期望值,再用實際中獎張數計算標準化殘差,得到結果如下:

| 標準化殘差 | 單尾機率 P(Z > z) | 信心水準 (雙尾) | 顯著水準 (雙尾 P 值) | 統計意義描述 |
|---|---|---|---|---|
| 0 | 50% | 0% | 100% | 完全符合期望值 |
| 0.28 | 61.03% | 22.05% | 77.95% | 接近預期,屬常見隨機波動。 |
| 0.67 | 25% | 50% | 50% | 正常的隨機波動 |
| 1.00 | 15.8% | 68.3% | 31.7% | 常見情形 (1 個標準差內) |
| 1.31 | 9.51% | 80.98% | 19.02% | 小幅優於預期 |
| 1.645 | 5.0% | 90% | 10% | 稍微偏離預期 |
| 1.96 | 2.5% | 95% | 5% | 統計學上的顯著差異 |
| 2.33 | 1.0% | 98% | 2% | 相當罕見 |
| 2.58 | 0.5% | 99% | 1% | 極為顯著 (非常罕見) |
| 3.00 | 0.13% | 99.7% | 0.27% | 千分之三的發生率 |
| 3.29 | 0.05% | 99.9% | 0.1% | 萬分之一的發生率 |
| 3.51 | 0.02% | 99.95% | 0.045% | 十萬分之 4.5 (超強運) |
最下面一列為用七期張數加總計算的結果,樣本數多一點,結果可參考性更高。從標準化殘差來看,雲端獎(0.28)的中獎率其實還好,信心水準只有 22.05%;六奬(1.31)則來到近 81%,我們有八成把握說,這案情恐怕不單純;最恐怖的是五獎 1000 元,七期總張數 1,683 張,理論期望值只會中 0.5 張,實際中三張讓標準化殘差上升到 3.51,發生機率為十萬分之 4.5,我們有 99.95% 的信心可以推論,這背後肯定有什麼神祕力量啊啊啊...
不過,以上分析存在瑕疵,樣本過少時標準化殘差易受小數法則影響 (分母趨近於 0,分子微小變化會被過度放大,另個角度是 難以辨識是真正的異常資料還是因樣本少導致偶發偏誤),故當期望值小於五時可能影響參考價值。查了資料說這類低期望值案例可改用費雪精確檢定或卜瓦松分佈檢定中獎張數是否異常。但我決定採行的策略是 - 取得更多數據以獲取更可靠的分析結果,故已通告朋友下月起全力消費、提高發票累積速度,早日累計 17,000 張讓五獎中獎期望值達到 5 張,我會再分析一次,屆時就能為大家解開這個世紀之謎,敬請期待。
Comments
Be the first to post a comment