圖與文/聯經出版提供
增強式學習 為人工智慧升級
在我們提供給人工智慧的題目當中,有些問題並沒有明確的標準答案。舉例來說,電玩遊戲以打倒敵人、賺取分數為目的,但達到這個目的所用的方法、過程,並沒有所謂的正確或不正確。
在這樣的遊戲當中,玩家會因為達成目的而獲得某些報酬,例如「打倒敵人就有經驗值」、「過關就能得到分數」或「過關所用的時間越短,分數越高」等等。於是玩家就會為了拿到更高的報酬而設法找密技,好讓自己的表現更出色。
這個概念,可以直接應用在人工智慧的學習上──它是一套名叫「增強式學習」的學習方法,依據學習成果給予相對的報酬,好讓學習者的傑出表現得到增強。例如我們設定「遊戲若能在10分鐘內過關,就加10分」、「若在20分鐘內破關,就加5分」等條件,人工智慧就會去加強自己快速過關時的做法,避免再用那些太花時間的辦法,逐漸進步、成長。
「增強式學習」會讓學習者多次重複同一個行為,並在每個行為之後去蕪存菁,應用到下一次的行動上。這一點和人類在現實世界學習的方法很相似,容易套用在現實世界的學習上,是它的一大優勢。
這樣的學習方法,其實也已經運用在現代人工智慧的學習上。負責執行下圍棋、西洋棋、將棋、電玩遊戲、駕駛汽車及操縱機器人等任務的人工智慧,能有超越人類的傑出表現,增強式學習的應用是一大主因。
電玩世界裡 人類不敵人工智慧?
在遊戲的世界裡,已有多款能戰勝人類的人工智慧相繼問世,包括1996年的深藍(西洋棋)、2011年的華生(益智問答),以及2016年的阿爾法圍棋(圍棋)等。
深藍是一款典型的理論派產品。它會鉅細靡遺地查遍所有可能的棋路,是一款仰賴電腦運算能力維生的人工智慧。然而,由於當時的電腦運算能力有限,因此這種做法,無法運用在每局對弈要用到較多棋步的將棋或圍棋上。
華生是一款專門用來處理自然語言的人工智慧。此外,它還運用網路,取得了極為龐大的知識資料庫。它在益智問答時,是以「分析」每個題目的答案而戰勝了人類。人類要憑著有限的知識,贏過記憶容量遠勝過自己的人工智慧,恐怕已經相當困難。
而以往被視為是人工智慧界一大難題的圍棋,也因為阿爾法圍棋的出現,使得人工智慧大勝人類。阿爾法圍棋運用深度學習技術進行特訓,學習掌握「致勝棋步」和「有利局面」的特徵。人類的圍棋棋士也會使用棋譜來進行訓練,而阿爾法所做的,就是與人類同樣的努力。再加上它不斷地與人類或電腦對弈,並且運用增強式學習的技術,從中找出「未知的特徵」,也就是自行找出棋譜上所沒有,但其實曾帶來好結果的棋步,更因此而戰勝人類。此後,情勢將會轉變成是由人類來研究人工智慧所創造出的棋步。
龐大資料中 AI能找出有用的東西
當您想從藏書量多達數萬冊的圖書館裡,找出自己想要的一本書時,您會怎麼做?絕大多數的情況下,找書不會花我們太多的力氣,畢竟圖書館為了方便讀者找書,所有館藏都分門別類,依序陳列。電子數據資料也一樣,只要書名、類別、作者和出版社等資訊已經過整理,我們就可從中找出一些線索。
此外,有時我們還沒有清楚的定見,不確定自己究竟想讀哪一本書。這時就要告訴圖書館的館員,說「我想讀這樣的書」,請他們代為尋書。其實這就是一種搜尋引擎,至於能不能找到我們想要的資訊,就要看那位館員(搜尋引擎)的功力如何了。
若是未經整理的資訊,情況又會如何呢?當圖書館裡的書排列得亂七八糟,封面上連書名或作者名都沒寫時,我們要從中找出想要的資訊,就得逐一拿出每本書籍,確認書中內容才行。這就是所謂的「大海撈針」。要人類在這樣的狀態下找出需要的資訊,幾乎是不可能的任務。不過,人工智慧可就不同了。它除了能滴水不漏地搜尋龐雜的資訊,找出我們想要的內容,還可以替人類整理資訊。
有了人工智慧,就能讓人類原本認為無用武之地的數據資料,身價突然翻漲。人工智慧挖掘、整理出來的這些資料,既可透過機器學習,用來幫助人工智慧變得更聰明,又能運用在人類的研究或商業活動上。而這種取得資料的方法,就稱為「資料探勘」(data mining),也就是「挖掘資訊」的意思,目前在多種領域都已廣為使用。
深度學習 讓AI勝任感受性任務
深度學習和既往幾種人工智慧技術的不同之處,在於它擅長辨認特徵。人工智慧本來其實較不擅長「辨認圖片」、「聽聲辨別」等偏重感受性的任務,而幫助它克服這個弱點的,就是深度學習。
舉例來說,人類在分辨其他人的長相時,是看對方的眼睛、鼻子和嘴巴等特徵來判斷,也就是透過準確記憶他人的個別長相特徵,進而記住對方的長相。這種行為,我們稱之為掌握特徵的能力(特徵萃取力)。
換言之,就是因為有了深度學習,才讓人工智慧獲得了遠比以往強大的特徵萃取力。
為了能正確辨認圖片,深度學習所做的「學習」,並不是鉅細靡遺地把人的長相或物體的形狀硬背下來,而是做了「懂得如何掌握容貌或物體特徵的學習」。所謂的特徵,說穿了就是與眾不同的部分。而想知道哪些部分與眾不同,首先得知道「普通」或「平均值」究竟是多少。人類會從平時的經驗當中,下意識地學會「普通」的概念,進而找出他人或物體的特徵所在。然而,這種行為其實是一種相當高超的技術。
要讓人工智慧學會辨識,需要的樣本數量遠超過人類。因為深度學習問世而帶給人工智慧的「特徵萃取力」,水準其實並不如人類這麼高超。但是,只要蒐集到足供學習的樣本數,人工智慧其實也能夠發揮出超越人類的實力。
本文摘自聯經出版《全圖解!AI知識一本通:用故事讓你三小時輕鬆搞懂人工智慧》