補腦算算鍋/數字會說話也會說謊 - 聯合學苑

文╱洪介興

●問問你╱統計是什麼? 統計有何用?

「統計」這個詞時常出現在我們的生活中，據你所知，統計是什麼？作用又是什麼呢？

如果你的回答類似這樣：「統計就是將資料進行統整與合計，運用數據或圖表等簡明的方式，呈現資料的全貌。」以上描述算是相當正確，可惜這樣只提及了統計學的一小部分，稱為「敘述統計」；另一部分威力更強大的，稱為「推論統計」，它的作用至少有：

①從試驗數據推測未知，像是用出賽成績衡量球員的能力、或是疫苗開發的臨床試驗。

②從部分情形推測整體，像是商家對消費者進行滿意度調查，或是公職選舉前的民意調查。

③從歷史資料和現況推測未來，像是根據大氣數據進行氣象預測，或是根據景氣指標進行經濟預測。

推論統計的模型多不勝數，但這邊我們只先討論平時最常見、也最簡單的一種，也就是根據試驗數據或部分資料，進行真實機率或整體比率的推估，像是前面提及的球員能力衡量、疫苗臨床試驗，以及各種抽樣調查都是。

推論統計之所以站得住腳，是因為有機率論為它背書，由機率論我們知道一個重要的事實：當試驗次數或資料筆數越多，測得的機率或比率就越接近真實機率或整體比例。上述事實是怎麼支撐起推論統計的呢？且用以下的故事說明。

假設我們有一個抽籤盒子，叫做「天機盒」，裡面有10支籤，盒子上有一個按鈕，按下按鈕就會冒出一支籤，放開按鈕那支籤就會回到盒子裡並自動搖勻。天機盒的設計很精良，因此10支籤被抽出的機會相等，其中有一部分是紅色的好籤，剩下的是白色的壞籤，但各別數量不明，只有天知道！如果你想知道裡面的籤有幾紅幾白，唯一線索只有實際抽籤試試看。

●上帝視角╱10支籤內 3支紅的抽中紅籤多少比率？

我們先偷偷切換到上帝視角，假設裡面其實是3支紅籤、7支白籤，由於每支籤被抽出的機會相等，因此抽到紅籤的機率就是30%，這是否表示實際抽的時候，抽到紅籤的比率總會是30%呢？其實不然，正確而言應該是抽到紅籤的次數比率「通常會在30%附近」才對；而前面引號中這句話，其實就帶來了兩個問題：

①「多常」叫做「通常」？

②「多近」叫做「附近」？

實務上，常以95%這個機率作為前述的「通常」（編按：本文也採用這項設定，簡化討論過程），至於多近叫做附近，則和試驗次數有關。試驗次數越多，落差範圍就越小。根據計算，以抽到紅籤的機率為30%而言，若抽籤40次，約有95%的機率，抽到紅籤的比率會在30%±12.5%的範圍內（請見右圖）；若抽籤80次，約有95%的機率，抽到紅籤的比率會在30%±10%的範圍內；而若抽籤400次，則約有95%的機率，抽到紅籤的比率會在30%±4.25%的範圍內。

前面從上帝視角切入所進行的討論，都還只停留在機率論的範疇，接下來才要前進到推論統計的思維。

●人類視角╱37.5%抽到紅籤請問紅籤有幾支

切回人類視角，假設我們為了要知道天機盒裡面的10支籤當中有幾支是紅籤，因而做了多次試驗，其中有37.5%的比率是抽到紅籤，那麼我們應該猜天機盒中有幾支紅籤呢？

這個問題事實上還跟抽籤的次數有關，抽籤40、80或400次，會有不同的推論結果。

如果是抽籤40次，我們會猜天機盒裡有3支、4支或5支紅籤，因為從機率的角度來看，不論天機盒裡是3支、4支還是5支紅籤，抽籤40次中有37.5%紅籤都不會是很意外的結果。以前一節所述為例：若天機盒中有3支紅籤，並抽籤40次，則抽到紅籤的比率約有95%的機率，會介於30%±12.5%的範圍內，因為37.5%是落在這個範圍，所以我們會接受3支紅籤這個猜測。

另外，同樣是在抽籤40次的前提下：若天機盒中有4支紅籤，則抽到紅籤的比率約有95%的機率，會介於40%±15%的範圍內；而若天機盒中有5支紅籤，則抽到紅籤的比率約有95%的機率，會介於50%±15%的範圍內；因為37.5%也有落在兩個範圍內，所以4支紅籤和5支紅籤這兩個猜測也合理。

但如果是抽籤80次，我們只會猜天機盒裡有3支或4支紅籤。因為若天機盒中有5支紅籤，並抽籤80次，則抽到紅籤的比率約有95%的機率，會介於50%±10%的範圍內，這個範圍不包含試驗結果的37.5%；也就是說，如果天機盒中真的是有5支紅籤，那麼得到37.5%這個試驗結果的可能性非常低，所以我們拒絕這個猜測，只接受3支籤（30%±10%）和4支籤（40%±10%）這兩個假設。

如果抽籤400次，我們只會猜天機盒裡有4支紅籤。因為若是天機盒裡有3支紅籤，經過400次抽籤後，抽到紅籤的比率約有95%的機率，會介於30%±4.25%的範圍內，試驗結果的37.5%沒有被包含在內，因此3支紅籤這個猜測被我們排除；最後只有4支紅籤（40%±4.75%）這個猜測被接受。

●提醒1╱越精準的預測試驗次數要越多

從前面的分析可以知道，想得到越精準的預測，試驗次數就要越多，這也是為什麼公職選舉的民意調查總是動輒上千份問卷，因為這樣才能確保誤差控制在3%以內。

樣本數較少的時候，我們要注意不能過度解讀統計數據。譬如，今年職棒球季進行到一半，如果有兩位穩定先發的打者，分別都有大約200個打數，其中A球員的安打率為0.26，大約是全部球員的平均成績，而B球員的安打率為0.32，是可以擠進打擊排行榜前幾名的成績，這是否代表B球員遠比A球員強呢？事實上，根據機率計算，就算A、B兩人的實力和狀態相當，也有高達25%，也就是4分之1的機率，會看到兩人成績出現如此懸殊的落差。

就連200個打數的樣本都還有如此大的誤差，更別說一些樣本更小的數據了，參考價值只會更低。因此作為一個明智的閱聽人，應當注意小樣本數據是否被過度放大解讀。

●提醒2╱即使樣本夠大抽樣也會有偏誤

我們現在已經很清楚大樣本的重要性，但不是樣本夠大就沒問題了，推論統計還有一個很常見的陷阱，稱為「抽樣偏誤」。

試想，假如我們想了解全國每人每年平均閱讀幾本讀物，於是到大型圖書館發問卷進行調查，可想而知，不論蒐集再多份問卷，這個調查結果都一定會遠遠高估實際狀況。或是我們用另一個方法，把問卷貼在社群上請好友們填寫，那麼調查對象很可能多是和自己年齡、資歷、興趣相近的人，也無法反映整體國民的情形。

網路媒體常見的網路民調，均由讀者自願填答，這樣的抽樣方式通常也會造成很大的偏頗，因為一般來說，意見比較強烈的人會比較傾向主動表達，另一方面，由於特定媒體的讀者群往往有其傾向，因此這類的網路民調只能反應特定族群內的意見，很難反應整體情形。

●提醒3╱小心「偷渡」概念導致錯誤解讀

另一個很常見、也是筆者認為最可怕的謬誤，是偷渡或偷換概念，以試圖帶動輿論風向的解讀。

曾有媒體報導關於甲疫苗和乙疫苗，對抗變種新冠病毒效力比較的新聞，新聞引用某國一項大規模研究中的數據，指出甲疫苗在預防住院和死亡方面，均優於乙疫苗。

報導引用的數據是接種疫苗且染疫者的住院率，接種甲疫苗者是1.52%，而接種乙疫苗者是1.99%。然而，數據分母是染疫者，而非全體接種者，因此不能解讀成甲疫苗預防住院比較好。事實上，從論文的原始數據可看出，接種甲疫苗者的住院率是萬分之5.42，比接種乙疫苗者的萬分之2.55高出一倍之多，報導卻以錯誤的解讀得出相反結論，刻意誤導讀者。

資訊爆炸的年代，運用推論統計的文章或報導不勝枚舉，面對如此龐雜的資訊，我們更要謹慎以待，千萬別被帶風向的錯誤內容誤導了。

●作者為教育部適性教學計畫「數學建築活動」教案設計人，任教北市石牌國中

原文出自《好讀周報》634期

You Might Also Like

數感實驗室／我們都討厭失敗帶來的挫折感

閱讀數學／真的那麼無敵？ 精算下誕生的無敵大麥克

數感實驗室／老師的加班狀況

閱讀數學／真的那麼無敵？精算下誕生的無敵大麥克