誤差的迷思/補腦算算鍋
圓周率π的小數點後面的數字無限且不重複。目前科學家已可計算到π的數百甚至數千萬-位。圖/取自網路

誤差的迷思/補腦算算鍋

文/曾慶良(阿亮老師)

在我們的日常生活中,「測量」和「檢測」無所不在。無論是學校的考試成績,還是家中廚房的食材分量,甚至是體育課的跑步時間,我們總是使用各種數據來評估和比較。但你有沒有想過,有些檢測數據的結果可能存在誤差?就在最近的一個新聞事件,談到了食品安全檢測中的「零檢出」議題,這不僅是一個科學問題,更深入地反映了數學在我們生活中的重要性。

今天我們就來探討檢測誤差的意義與概念,從基本的數學概念到生活中的應用,再到跨學科的視角,讓你更充分的理解誤差,並學會如何在生活中智慧地處理這些看似微小但卻極其重要的數字。

●數學科學中的誤差 測量與實際的差異

提到「誤差」這個詞,你可能會想到一些小小的錯誤或偏差,比如打籃球的時候偏離目標的那一投,或者是烹飪時誤加了多一點的鹽。其實,在數學和科學中,誤差有著更具體和重要的意義。具體來說,誤差是指測量值和實際值之間的差異。想像一下,你在體育課測量100米的跑步時間,可能因為手錶的反應時間,或是啟動計時器的瞬間差異,而與真正的跑步時間有所不同。這裡的「不同」,就是我們所謂的誤差。

但誤差並不總是壞事。它其實是一個非常有用的概念,幫助我們理解和改進測量方法。就像科學家在實驗中會不斷地調整儀器,藉以減少誤差,從而獲得更精準的數據一樣。而在數學中,也會用一些有趣的方法來計算和分析誤差,讓我們能更深入地理解測量的本質。接著來看一個簡單但引人入勝的例子:「圓周率π的計算」。

圓周率π是一個無理數,這意味著它的小數點後面的數字無限且不重複。因此,我們無法精確地計算π的真實值,只能逼近它。想像一下,如果我們用「22除以7」來近似π,我們得到的值大約是3.142857。而實際上,π的前幾位是3.141592……在這裡,我們用到的近似值和π的真實值之間的差異,就是一種誤差。雖然這個近似值對於日常生活中的大多數計算來說已經足夠精確,但在一些需要非常高精度的科學和工程計算中,這種誤差可能會導致重大的差異。

隨著數學和計算技術的進步,科學家們已經計算出π的數百甚至數千萬位。但這依然只是對π的一個逼近,因為π是無限的。每一次進一步的計算,都在減少我們的近似值與π真實值之間的誤差,但完全消除這個誤差是不可能的。

●系統誤差 軟硬體造成 隨機誤差 通常不可控

檢測誤差的基本類型有:系統誤差和隨機誤差。

所謂的「系統誤差」通常是由不完善的測量設備或者不正確的操作方法所導致。例如用一把彎曲的尺測量長度所得到的數據自然會有誤差。而「隨機誤差」則通常是由無法控制的外部因素造成的,例如氣溫波動或是測量者測量時的操作所產生。這裡讓我們來認識數學中誤差概念的幾個專有名詞:

①平均值:是一組數據的平均值,可以幫助我們了解數據的一般趨勢。

②標準差:描述數據與其平均值的平均差異程度,用來量化數據的「分散程度」。

③變異數:是標準差的平方,它也反映了數據的分散程度。

例如,假設小亮同學的數學單元小考中,連續5次得分分別為:85、90、88、87和91分。我們可以計算這些分數的平均值,幫助我們了解小亮的一般表現水準,而標準差則能顯示小亮成績的穩定性。

上面的3個數據中,平均值的計算為:

總分/次數=(85+90+88+87+91)/5=88.2分

標準差的計算為:(每次分數與平均值的差)的平方加總所得後,除以次數的數值結果再開根號,將計算過程列出如圖。

因此,我們知道小亮5次考試平均分數為88.2分,標準差為2.14分。如果我們又得到另一位同學丘陵的5次考試平均分數為91.5分,標準差為16.25分。則我們可以這樣子推論:

就5次的平均值來說,丘陵同學比小亮同學成績較高,但是由標準差的結果可以得知丘陵同學的各單元程度不一、變化非常大,表示丘陵同學有些單元非常拿手,有些單元卻需要多加強。

因此,透過檢測的數據結果,我們可以清楚地描述實際狀況,進而做出應對或改善措施。

除了數據誤差,實驗中也有許多的誤差;例如在物理實驗中,測量小球落下的時間,由於人眼對快速運動反應的延遲,測量結果可能會略有不同(這種差異就是隨機誤差的一個例子),因此,需要以其他儀器(例如紅外線感測)來輔助實驗。

選舉中經常看到的民意調查,施測單位進行調查時,通常只能訪問一部份的人,然後用這些數據(稱為樣本)來代表整個群體(稱為母體),由於抽樣的限制或樣本的偏差,這些結果可能無法完全代表所有人的意見,這種抽樣的誤差(稱為標準誤差)差異數值可以透過計算而得出。例如,某數位平台對於某候選人的支持度調查中,填表人數總共為253人,候選人支持度p為35%,因為調查抽樣的標準差公式為√p(1-p),我們可以計算標準差為√0.35(1-0.35)≈0.4769,又因為標準誤差的公式是(標準差/√抽樣數),,因此我們可以計算得到標準誤差為(0.4769/√253)≈0.03=3%。民調抽樣中有這樣的論述:在95%的信心水準下,真正支持度會落在此次抽樣的支持度正負兩個標準差之間;這個例子就是(47.69%-2×3%,47.69%+2×3%),所以是41.69%與53.69%間。

●原料機器 產生影響 誤差範圍 處處可見

日常生活中,也會看到存在著一定誤差範圍如±3%的誤差數字。例如,你去便利商店購買的零食包裝,包裝上印有「300g±5%」的標示。這表示實際的重量可能會在285g到315g之間。因為300g的5%是15g,所以當你購買這包零食時,真正的實際重量與標示的300g可能會有所出入,只要不超過這個5%的誤差範圍,就算在正常規範標準之內。而這個誤差的原因,可能因為原料的微小差異、機器的精準度,甚至是環境因素,如溫度和濕度的變化等,而影響產品的重量。

●殘留量 技術驗不出 零檢出 並非不存在

最後,讓我們回到一開始談的「零檢出」議題,它在食品安全檢測中是一個重要的概念。當一項檢測結果為「零檢出」時,並非該樣本中完全沒有被測量的物質,而是該物質的含量低於檢測儀器的檢測限度。換句話說,即使樣本中有微量的物質存在,但如果其含量低於檢測設備可以檢測到的最小限度,則檢測結果就會標示為「零」。

這項概念對於理解食品安全標準非常關鍵,例如,政府在檢查某種農產品是否殘留農藥時,「零檢出」的報告可能讓消費者放心,但這並不代表該農產品絕對沒有任何農藥殘留,而是表示這些殘留量低於檢測技術的範圍。

舉一個實際的例子,如果某種食品的農藥殘留標準是每公斤0.01毫克,那麼在檢測過程中,如果一個樣本中的農藥含量低於這一標準,即使實際上有微量農藥存在,結果也會被標示為「零檢出」。

●訓練過程也有誤差 AI模型非十全十美

在人工智慧和機器學習領域,AI模型在訓練過程中不可避免地會產生誤差,這些誤差可能來自數據的不完整性、模型的不精確性,甚至是演算法本身的局限性。例如我們對於醫學診斷、股市預測,或是在語言翻譯和影像識別中,AI模型生成的誤差都可能影響對辨識結果的處置。因此,我們應當學會在不完美的世界中尋求更高的精度和真理,同時也應該認識到某些情況下的局限性,從而使我們能夠更智慧地與這個充滿數據的世界互動。

作者為教育部高中數學學科中心研究教師、台北市3A教學基地中心主任,獲北市特殊優良教師。

原文出自《好讀周報》762期