補腦算算鍋/數字會說話 也會說謊

補腦算算鍋/數字會說話 也會說謊

文╱洪介興

●問問你╱統計是什麼? 統計有何用?

「統計」這個詞時常出現在我們的生活中,據你所知,統計是什麼?作用又是什麼呢?

如果你的回答類似這樣:「統計就是將資料進行統整與合計,運用數據或圖表等簡明的方式,呈現資料的全貌。」以上描述算是相當正確,可惜這樣只提及了統計學的一小部分,稱為「敘述統計」;另一部分威力更強大的,稱為「推論統計」,它的作用至少有:

①從試驗數據推測未知,像是用出賽成績衡量球員的能力、或是疫苗開發的臨床試驗。

②從部分情形推測整體,像是商家對消費者進行滿意度調查,或是公職選舉前的民意調查。

③從歷史資料和現況推測未來,像是根據大氣數據進行氣象預測,或是根據景氣指標進行經濟預測。

推論統計的模型多不勝數,但這邊我們只先討論平時最常見、也最簡單的一種,也就是根據試驗數據或部分資料,進行真實機率或整體比率的推估,像是前面提及的球員能力衡量、疫苗臨床試驗,以及各種抽樣調查都是。

推論統計之所以站得住腳,是因為有機率論為它背書,由機率論我們知道一個重要的事實:當試驗次數或資料筆數越多,測得的機率或比率就越接近真實機率或整體比例。上述事實是怎麼支撐起推論統計的呢?且用以下的故事說明。

假設我們有一個抽籤盒子,叫做「天機盒」,裡面有10支籤,盒子上有一個按鈕,按下按鈕就會冒出一支籤,放開按鈕那支籤就會回到盒子裡並自動搖勻。天機盒的設計很精良,因此10支籤被抽出的機會相等,其中有一部分是紅色的好籤,剩下的是白色的壞籤,但各別數量不明,只有天知道!如果你想知道裡面的籤有幾紅幾白,唯一線索只有實際抽籤試試看。

●上帝視角╱10支籤內 3支紅的 抽中紅籤 多少比率?

我們先偷偷切換到上帝視角,假設裡面其實是3支紅籤、7支白籤,由於每支籤被抽出的機會相等,因此抽到紅籤的機率就是30%,這是否表示實際抽的時候,抽到紅籤的比率總會是30%呢?其實不然,正確而言應該是抽到紅籤的次數比率「通常會在30%附近」才對;而前面引號中這句話,其實就帶來了兩個問題:

①「多常」叫做「通常」?

②「多近」叫做「附近」?

實務上,常以95%這個機率作為前述的「通常」(編按:本文也採用這項設定,簡化討論過程),至於多近叫做附近,則和試驗次數有關。試驗次數越多,落差範圍就越小。根據計算,以抽到紅籤的機率為30%而言,若抽籤40次,約有95%的機率,抽到紅籤的比率會在30%±12.5%的範圍內(請見右圖);若抽籤80次,約有95%的機率,抽到紅籤的比率會在30%±10%的範圍內;而若抽籤400次,則約有95%的機率,抽到紅籤的比率會在30%±4.25%的範圍內。

前面從上帝視角切入所進行的討論,都還只停留在機率論的範疇,接下來才要前進到推論統計的思維。

●人類視角╱37.5%抽到紅籤 請問紅籤有幾支

切回人類視角,假設我們為了要知道天機盒裡面的10支籤當中有幾支是紅籤,因而做了多次試驗,其中有37.5%的比率是抽到紅籤,那麼我們應該猜天機盒中有幾支紅籤呢?

這個問題事實上還跟抽籤的次數有關,抽籤40、80或400次,會有不同的推論結果。

如果是抽籤40次,我們會猜天機盒裡有3支、4支或5支紅籤,因為從機率的角度來看,不論天機盒裡是3支、4支還是5支紅籤,抽籤40次中有37.5%紅籤都不會是很意外的結果。以前一節所述為例:若天機盒中有3支紅籤,並抽籤40次,則抽到紅籤的比率約有95%的機率,會介於30%±12.5%的範圍內,因為37.5%是落在這個範圍,所以我們會接受3支紅籤這個猜測。

另外,同樣是在抽籤40次的前提下:若天機盒中有4支紅籤,則抽到紅籤的比率約有95%的機率,會介於40%±15%的範圍內;而若天機盒中有5支紅籤,則抽到紅籤的比率約有95%的機率,會介於50%±15%的範圍內;因為37.5%也有落在兩個範圍內,所以4支紅籤和5支紅籤這兩個猜測也合理。

但如果是抽籤80次,我們只會猜天機盒裡有3支或4支紅籤。因為若天機盒中有5支紅籤,並抽籤80次,則抽到紅籤的比率約有95%的機率,會介於50%±10%的範圍內,這個範圍不包含試驗結果的37.5%;也就是說,如果天機盒中真的是有5支紅籤,那麼得到37.5%這個試驗結果的可能性非常低,所以我們拒絕這個猜測,只接受3支籤(30%±10%)和4支籤(40%±10%)這兩個假設。

如果抽籤400次,我們只會猜天機盒裡有4支紅籤。因為若是天機盒裡有3支紅籤,經過400次抽籤後,抽到紅籤的比率約有95%的機率,會介於30%±4.25%的範圍內,試驗結果的37.5%沒有被包含在內,因此3支紅籤這個猜測被我們排除;最後只有4支紅籤(40%±4.75%)這個猜測被接受。

●提醒1╱越精準的預測 試驗次數要越多

從前面的分析可以知道,想得到越精準的預測,試驗次數就要越多,這也是為什麼公職選舉的民意調查總是動輒上千份問卷,因為這樣才能確保誤差控制在3%以內。

樣本數較少的時候,我們要注意不能過度解讀統計數據。譬如,今年職棒球季進行到一半,如果有兩位穩定先發的打者,分別都有大約200個打數,其中A球員的安打率為0.26,大約是全部球員的平均成績,而B球員的安打率為0.32,是可以擠進打擊排行榜前幾名的成績,這是否代表B球員遠比A球員強呢?事實上,根據機率計算,就算A、B兩人的實力和狀態相當,也有高達25%,也就是4分之1的機率,會看到兩人成績出現如此懸殊的落差。

就連200個打數的樣本都還有如此大的誤差,更別說一些樣本更小的數據了,參考價值只會更低。因此作為一個明智的閱聽人,應當注意小樣本數據是否被過度放大解讀。

●提醒2╱即使樣本夠大 抽樣也會有偏誤

我們現在已經很清楚大樣本的重要性,但不是樣本夠大就沒問題了,推論統計還有一個很常見的陷阱,稱為「抽樣偏誤」。

試想,假如我們想了解全國每人每年平均閱讀幾本讀物,於是到大型圖書館發問卷進行調查,可想而知,不論蒐集再多份問卷,這個調查結果都一定會遠遠高估實際狀況。或是我們用另一個方法,把問卷貼在社群上請好友們填寫,那麼調查對象很可能多是和自己年齡、資歷、興趣相近的人,也無法反映整體國民的情形。

網路媒體常見的網路民調,均由讀者自願填答,這樣的抽樣方式通常也會造成很大的偏頗,因為一般來說,意見比較強烈的人會比較傾向主動表達,另一方面,由於特定媒體的讀者群往往有其傾向,因此這類的網路民調只能反應特定族群內的意見,很難反應整體情形。

●提醒3╱小心「偷渡」概念 導致錯誤解讀

另一個很常見、也是筆者認為最可怕的謬誤,是偷渡或偷換概念,以試圖帶動輿論風向的解讀。

曾有媒體報導關於甲疫苗和乙疫苗,對抗變種新冠病毒效力比較的新聞,新聞引用某國一項大規模研究中的數據,指出甲疫苗在預防住院和死亡方面,均優於乙疫苗。

報導引用的數據是接種疫苗且染疫者的住院率,接種甲疫苗者是1.52%,而接種乙疫苗者是1.99%。然而,數據分母是染疫者,而非全體接種者,因此不能解讀成甲疫苗預防住院比較好。事實上,從論文的原始數據可看出,接種甲疫苗者的住院率是萬分之5.42,比接種乙疫苗者的萬分之2.55高出一倍之多,報導卻以錯誤的解讀得出相反結論,刻意誤導讀者。

資訊爆炸的年代,運用推論統計的文章或報導不勝枚舉,面對如此龐雜的資訊,我們更要謹慎以待,千萬別被帶風向的錯誤內容誤導了。

●作者為教育部適性教學計畫「數學建築活動」教案設計人,任教北市石牌國中

原文出自《好讀周報》634期