3小時搞懂AI - 聯合學苑｜閱讀‧寫作‧跨域學習

圖與文／聯經出版提供

增強式學習為人工智慧升級

在我們提供給人工智慧的題目當中，有些問題並沒有明確的標準答案。舉例來說，電玩遊戲以打倒敵人、賺取分數為目的，但達到這個目的所用的方法、過程，並沒有所謂的正確或不正確。

在這樣的遊戲當中，玩家會因為達成目的而獲得某些報酬，例如「打倒敵人就有經驗值」、「過關就能得到分數」或「過關所用的時間越短，分數越高」等等。於是玩家就會為了拿到更高的報酬而設法找密技，好讓自己的表現更出色。

這個概念，可以直接應用在人工智慧的學習上──它是一套名叫「增強式學習」的學習方法，依據學習成果給予相對的報酬，好讓學習者的傑出表現得到增強。例如我們設定「遊戲若能在10分鐘內過關，就加10分」、「若在20分鐘內破關，就加5分」等條件，人工智慧就會去加強自己快速過關時的做法，避免再用那些太花時間的辦法，逐漸進步、成長。

「增強式學習」會讓學習者多次重複同一個行為，並在每個行為之後去蕪存菁，應用到下一次的行動上。這一點和人類在現實世界學習的方法很相似，容易套用在現實世界的學習上，是它的一大優勢。

這樣的學習方法，其實也已經運用在現代人工智慧的學習上。負責執行下圍棋、西洋棋、將棋、電玩遊戲、駕駛汽車及操縱機器人等任務的人工智慧，能有超越人類的傑出表現，增強式學習的應用是一大主因。

電玩世界裡人類不敵人工智慧？

在遊戲的世界裡，已有多款能戰勝人類的人工智慧相繼問世，包括1996年的深藍（西洋棋）、2011年的華生（益智問答），以及2016年的阿爾法圍棋（圍棋）等。

深藍是一款典型的理論派產品。它會鉅細靡遺地查遍所有可能的棋路，是一款仰賴電腦運算能力維生的人工智慧。然而，由於當時的電腦運算能力有限，因此這種做法，無法運用在每局對弈要用到較多棋步的將棋或圍棋上。

華生是一款專門用來處理自然語言的人工智慧。此外，它還運用網路，取得了極為龐大的知識資料庫。它在益智問答時，是以「分析」每個題目的答案而戰勝了人類。人類要憑著有限的知識，贏過記憶容量遠勝過自己的人工智慧，恐怕已經相當困難。

而以往被視為是人工智慧界一大難題的圍棋，也因為阿爾法圍棋的出現，使得人工智慧大勝人類。阿爾法圍棋運用深度學習技術進行特訓，學習掌握「致勝棋步」和「有利局面」的特徵。人類的圍棋棋士也會使用棋譜來進行訓練，而阿爾法所做的，就是與人類同樣的努力。再加上它不斷地與人類或電腦對弈，並且運用增強式學習的技術，從中找出「未知的特徵」，也就是自行找出棋譜上所沒有，但其實曾帶來好結果的棋步，更因此而戰勝人類。此後，情勢將會轉變成是由人類來研究人工智慧所創造出的棋步。

龐大資料中 AI能找出有用的東西

當您想從藏書量多達數萬冊的圖書館裡，找出自己想要的一本書時，您會怎麼做？絕大多數的情況下，找書不會花我們太多的力氣，畢竟圖書館為了方便讀者找書，所有館藏都分門別類，依序陳列。電子數據資料也一樣，只要書名、類別、作者和出版社等資訊已經過整理，我們就可從中找出一些線索。

此外，有時我們還沒有清楚的定見，不確定自己究竟想讀哪一本書。這時就要告訴圖書館的館員，說「我想讀這樣的書」，請他們代為尋書。其實這就是一種搜尋引擎，至於能不能找到我們想要的資訊，就要看那位館員（搜尋引擎）的功力如何了。

若是未經整理的資訊，情況又會如何呢？當圖書館裡的書排列得亂七八糟，封面上連書名或作者名都沒寫時，我們要從中找出想要的資訊，就得逐一拿出每本書籍，確認書中內容才行。這就是所謂的「大海撈針」。要人類在這樣的狀態下找出需要的資訊，幾乎是不可能的任務。不過，人工智慧可就不同了。它除了能滴水不漏地搜尋龐雜的資訊，找出我們想要的內容，還可以替人類整理資訊。

有了人工智慧，就能讓人類原本認為無用武之地的數據資料，身價突然翻漲。人工智慧挖掘、整理出來的這些資料，既可透過機器學習，用來幫助人工智慧變得更聰明，又能運用在人類的研究或商業活動上。而這種取得資料的方法，就稱為「資料探勘」（data mining），也就是「挖掘資訊」的意思，目前在多種領域都已廣為使用。

深度學習讓AI勝任感受性任務

深度學習和既往幾種人工智慧技術的不同之處，在於它擅長辨認特徵。人工智慧本來其實較不擅長「辨認圖片」、「聽聲辨別」等偏重感受性的任務，而幫助它克服這個弱點的，就是深度學習。

舉例來說，人類在分辨其他人的長相時，是看對方的眼睛、鼻子和嘴巴等特徵來判斷，也就是透過準確記憶他人的個別長相特徵，進而記住對方的長相。這種行為，我們稱之為掌握特徵的能力（特徵萃取力）。

換言之，就是因為有了深度學習，才讓人工智慧獲得了遠比以往強大的特徵萃取力。

為了能正確辨認圖片，深度學習所做的「學習」，並不是鉅細靡遺地把人的長相或物體的形狀硬背下來，而是做了「懂得如何掌握容貌或物體特徵的學習」。所謂的特徵，說穿了就是與眾不同的部分。而想知道哪些部分與眾不同，首先得知道「普通」或「平均值」究竟是多少。人類會從平時的經驗當中，下意識地學會「普通」的概念，進而找出他人或物體的特徵所在。然而，這種行為其實是一種相當高超的技術。

要讓人工智慧學會辨識，需要的樣本數量遠超過人類。因為深度學習問世而帶給人工智慧的「特徵萃取力」，水準其實並不如人類這麼高超。但是，只要蒐集到足供學習的樣本數，人工智慧其實也能夠發揮出超越人類的實力。

本文摘自聯經出版《全圖解！AI知識一本通：用故事讓你三小時輕鬆搞懂人工智慧》