機率可靠嗎?/補腦算算鍋

機率可靠嗎?/補腦算算鍋

文/林秋華

愛因斯坦曾說:「上帝是不丟骰子的!」 霍金博士卻說:「上帝不但丟骰子,他還把骰子丟到我們看不見的地方去!」 1927年,丹麥物理學家波耳為首的哥本哈根學派,以「不確定性原理」解釋量子力學: 宇宙是一個充滿不確定的能量世界,直到你看見,它才存在。 從此開啟另一扇數學大門:機率論,今天我們就先來看看機率是如何發展成預測未來的重要工具。

●巴斯卡與費馬 古典機率奠基人

首先介紹最早的自學大師──布列斯巴斯卡。巴斯卡1623年6月19日出生於法國,巴斯卡從小不曾受過學校的正規教育,但他天賦極高,8歲就已經在父親的指導下完成國小課程。1631年,巴斯卡舉家遷居到法國科學文化的中心巴黎。兩年後,11歲的巴斯卡,寫出了第一篇論文〈論聲音〉,闡述了物體振動發聲的原理。

巴斯卡可以說是自學的資優生,14歲的巴斯卡就跟著父親參加梅森學院(巴黎皇家科學院前身)。當時歐洲的許多國家,貴族之間盛行某種娛樂(其實是賭博),擲骰子是他們常用的一種方式。此時,一位熱衷於擲骰子遊戲的法國貴族德•梅樂,他和友人相約玩擲骰子遊戲,各自押注32枚金幣作為賭注。雙方開始輪流擲骰子,約定若梅雷先擲出10次6點,或友人先擲出10次4點,誰就能贏得全部賭注。

遊戲進行了一段時間,梅樂已擲出了8次6點,友人也擲出了7次4點。這時,梅樂接到命令,要立即去陪國王接見外賓,於是這場遊戲只好被迫中斷,以退還彼此的金幣作罷。

只是在退還金幣時梅樂不甘心,他覺得他比友人更接近勝利,照道理他應該贏得所有金幣,因而不願意接受退還彼此金幣的方案;同樣地,友人雖然稍微落敗,但他不認為最終會輸,也是有機會後來居上,因此也不願意將金幣全部交給梅樂。

在他們爭執不下的情況下,梅樂決定請教當時才華洋溢的巴斯卡。他向巴斯卡寫了一封信,說明上述狀況,希望巴斯卡能幫忙解決這個問題:他們應該如何分配這64枚金幣才算公平呢?

巴斯卡提出類似窮舉法來看所有可能的結果,再將獎金依比例3:1退還。當時的業餘數學家費馬也認同這樣的思維,但這樣的思維是建立在甲乙雙方獲勝的機率都是1/2的情況下。關於梅樂的問題,帕斯卡和費馬還親自做了一樣的遊戲實驗,完整地解決「分賭注問題」。

他們發現,如果把擲出「4」和「6」之外的情況都看作無效局,只計算擲出「4」和「6」的有效局,那麼梅雷和賭友最多還需4局決出勝負,這4局裡所有可能會出現的情況合計是16種:

(6,6,6,6) (4,6,6,6) (6,4,6,6) (6,6,4,6)

(6,6,6,4) (4,4,6,6) (4,6,4,6) (4,6,6,4)

(6,4,4,6) (6,4,6,4) (6,6,4,4) (6,4,4,4)

(4,6,4,4) (4,4,6,4) (4,4,4,6) (4,4,4,4)

其中,梅樂獲勝的結果有11種,友人獲勝的結果有5種,所以梅樂與賭友贏的機率之比為11:5。因此應按11:5的比例來分賭注,即梅樂44枚,友人20枚,這都是建立在丟出6點和4點的機率是一樣(都是1/6)的情況下。問題得到解決的同時,機率論的雛形也得以浮現。

後來,人們把巴斯卡與費馬通信討論的日子1654年7月29日作為機率論的生日,公認巴斯卡與費馬為現代機率論的奠基人。

●相對頻率機率 重複試驗看頻率

巴斯卡和費馬所奠定的機率基礎是屬於古典機率,也就是假設樣本空間中每個事件出現的機率是一樣的。例如:丟一個骰子,出現1點的機率是1/6,丟一枚硬幣,出現正面的機率是1/2,有了機率的概念,我們開始從「不可知」進入不確定性,再進入「可預測」的世界。

我們以簡單的丟一個骰子,押賭金為例,透過機率的性質,我們可以這麼做:

第一次押1元在1點上,若沒中,

第二次押2元在1點上,若沒中,

第三次押4元在1點上,若沒中……

依此類推,只要莊家不小心擲出一次1點,那麼不止贏回所有的賭金,還會額外得到1元獲利。而這是建立在1點必然會出現在遊戲中的假設下。

古典機率雖然讓事件變得可預測,但,現實生活裡,並不是所有的事情都建立在機會均等下,假設有一顆不公正的骰子,但我們並不知道它如何不公正,那我們還能預測嗎?於是,數學家開始以重複試驗來看機率,隨著試驗次數的增加,一個事件出現的頻率,我們稱之為相對頻率機率。今天,如果一個骰子丟了100次都沒有出現1點,你還相信1點必然會出現嗎?還是你會選擇相信這是一個不公正的骰子呢?

新的觀點帶來新的發展,我們不再以古典機率的眼光看事情,我們開始搜集資料,研究可觀察的現象用以預測未來。著名的法國數學家拉普拉斯曾說大部分生活中最重要的疑問,都只是「機率的問題」。

●貝葉斯提逆概問題 把條件機率做轉換

現代科技不斷預測人類的行為和各種事件發生的可能性,這跟機率又有什麼關係呢?這就要介紹影響現今人工智慧科技的數學家「托馬斯貝葉斯」。

托馬斯貝葉斯是18世紀的英國數學家。他在1742年成為英國皇家學會會員。貝葉斯以其在概率論領域的研究聞名於世,他提出的貝葉斯定理對於現代概率論和數理統計的發展有重要的影響。

貝葉斯只是在自己的文章中指出,當時的人們已經能夠計算「正向概率」,也就是假設袋子裡面有a個白球,b個黑球,當你伸手進去抽取一顆球,取出是黑球的機率是多少這種問題。

但他提出了一個有趣的反問問題:如果我們事先並不知道袋子裡面黑白球的比例,而是隨機抽出一顆(或好幾顆)球,然後觀察這些取出來的球的顏色之後,那麼我們可以就此對袋子裡面黑白球的比例作出推測嗎?

這個問題,就是所謂的「逆概問題」。這是個很有趣的問題,我們並不知道袋中有多少比例的球,光憑抽出來的球的顏色,我們可以預測袋中球的顏色比例嗎?

貝葉斯將「條件機率」做了一個轉換,假定事件A和事件B發生的機率分別是P(A)和P(B),則在事件B已經發生的前提之下,事件A發生的機率是P(B│A),則

P(A│B)P(B)= P(B│A)P(A)

也就是說如果我們想知道在事件B已經發生的前提之下,事件A發生的機率,我們可以透過計算在事件A已經發生的前提之下,事件B發生的機率來轉換,就是現今有名的「貝氏定理」。

●貝葉斯的主觀機率 機器學習核心方法

實際上,貝葉斯當時並沒有意識到這裡包含著深刻的思想,這樣的想法居然大大影響了現在的人工智慧。貝葉斯方法改變了舊有的思維,現在所有需要作出概率預測的地方都可以見到貝葉斯方法的影子,特別,貝葉斯是人工智慧中機器學習和大數據分析的重要核心方法。

貝葉斯提出的新觀點,後人通常稱之為「主觀機率」,而它為什麼能取代古典機率成為機率論主流呢?因為生活中太多時候,我們並不知道事情的全貌,我們進行的其實都是逆概問題,比方:出門時看見陰天,所以決定帶傘,是因為過往的經驗告訴我們看見陰天,下雨的機率很大。又比方說,疾病篩檢時,我們無法確認整個樣本空間,只能根據患病人數及相關檢驗結果判讀及診斷,所以愈少出現的案例,愈容易出現誤判的情況。英國數學家哈羅德•傑弗里斯說:「貝氏定理之於機率論,就像是畢氏定理之於幾何學」,足見貝氏定理的重要性。

而當今科技相信,當我們掌握足夠多的訊息,就可以預測未來,但我們真的能預測未來嗎?會不會有我們無法想像的事情尚未被察覺呢?

原文出自《好讀周報》814期