深度思考：從深藍到AlphaGo，了解人工智慧的未來

(圖片來源：pixabay)

一九五六年發明「人工智慧」一詞的美國電腦科學家麥卡錫，將西洋棋稱為「人工智慧的果蠅」，意指低下的果蠅是無數重大的生物學實驗最理想的實驗對象，在遺傳學中特別重要。到了一九八○年代末，電腦西洋棋圈幾乎已經放棄了這項重大的實驗。一九九○年，創造Belle超級電腦的湯普遜公開建議，若要在機器認知上取得真正的進展，圍棋可能是更好的目標。同一年，《電腦、西洋棋與認知》（Computers, Chess, and Cognition）論文集裡有一整篇談論圍棋，標題是「一個新的人工智慧果蠅？」。

圍棋的棋盤為十九路乘十九路，總共有三百六十一顆黑色和白色的棋子，整個矩陣大到無法用暴力法破解，又細緻到不可能像人類輸給西洋棋電腦那樣，因為戰術上的失誤決定出勝負。在那篇一九九○年的論文裡，一個電腦圍棋團隊認為，他們大約比西洋棋晚二十年。

這個預測最後證實非常精準：二○一六年，也就是我敗給深藍之後十九年，Google資助的DeepMind人工智慧計畫，以及從這個計畫脫胎出來的圍棋程式AlphaGo，打敗了圍棋世界冠軍李世乭。更重要的是（也與預期相符），從人工智慧的角度來說，AlphaGo比任何製造頂尖西洋棋機器的方法更值得重視：它會用機器學習能力和神經網路教自己下出更好的棋，而且使用的技術更複雜，超越了傳統的alpha-beta剪枝搜尋。深藍是一個結尾；AlphaGo只是個開端。

在這一切當中，根本的錯誤認知不只有西洋棋的限制而已，人工智慧身為電腦科學的新創領域，因而有所限制。圖靈夢想的人工智慧，背後的基本假設是大腦本身就是一種電腦，而目標是創造出一種可以成功模仿人類行為的機器。多年以來，電腦科學家一直以這種概念為主。這個類比很容易懂：神經細胞是開關、大腦皮質是記憶資料庫等等。然而，撇開譬喻的層次，我們其實沒有什麼生物學上的證據來佐證這樣的類比，而且在探索人類與機器思考的差異時，這個類比反而是一種干擾。

我提議用「理解」與「行為目標」兩個詞，來突顯這些差異。先談論「理解」：像華生那樣可以理解人類自然語言的機器，必須爬梳上百萬種線索，才能建立起充足的前後脈絡來弄懂語意，同樣的語意對人類一看就懂。一個簡單的例子：「雞太熱了，沒辦法吃」，可能指一隻禽鳥生病了，或是晚餐需要放涼。然而，即使這個句子本身的語意模糊，人類不可能誤判說話的人指的是哪個意思，因為說這句話的前後脈絡會讓語意清楚。

人類會自然地加上前後脈絡，這是我們的大腦採用的一種方法，讓它處理大量的資料時不必持續、有意識地弄清楚事情。我們的大腦在背景處理這些脈絡，不需要我們主動花費力氣，幾乎像是呼吸一樣不耗心力。實力強的西洋棋手只需要看一眼，就知道某一種盤面適合某一種棋步；同理，你也知道你會喜歡某一種樣子的麵包。當然，這些在背景中運作的直覺程序有時候會出錯，讓你陷入不好的盤面，或是讓你吃到不想吃的點心，因此當你下一次碰到同一種情況，有意識的大腦可能會多主動一些，對你的直覺再進行評估。

相較之下，機器的智慧能力必須替它碰到的每一塊新資料建立起前後脈絡。它必須處理大量資料，才能模擬理解能力。想像一下，電腦碰到我們那隻熱雞，需要回答哪些問題才能判斷問題是什麼。什麼是雞？雞是死的還是活的？你在農場裡嗎？雞是可以吃的東西嗎？「吃」又是什麼？我有一次在演講中舉了這個例子，聽眾大多數不是英語母語人士，後來有人指出另一個語意模糊之處：在英語裡，hot除了指食物的溫度，也可以指食物的辣度。

就算是簡單的句子，也一樣會這麼複雜；不過，華生仍然讓我們看到，如果相關的資料夠多，又能以夠迅速、夠聰明的方式存取，機器有辦法找出精準的答案。正如西洋棋引擎搜尋數十億種盤面來找出最佳的棋步，語言也能拆解變成各種數值和可能性，用來找出適當的回應。機器的運算速度越快、資料的質與量越好、程式碼越聰明，回應就更有可能越精準。

電腦是否能提出問題？這就有點諷刺了：華生在《危險邊緣！》節目中擊敗兩位人類冠軍參賽者，展現出它的實力，但參賽者在節目中的回應必須以問句來呈現。換句話說，假如主持人說：「這個蘇聯電腦程式在一九七四年的第一屆世界電腦西洋棋大賽中獲勝」，參賽者按鈴後要說：「什麼是Kaissa？」不過，這個奇特的習慣只是這個益智節目單純的慣例，不會影響機器在15PB的資料中尋找答案的能力。

無論如何，機器輸出的答案就足以應付了。機器的效能比人類更好。機器沒有任何「理解」的過程，但我們本來就沒有打算要讓機器「理解」。進行醫學診斷的人工智慧程式可以在累積多年的癌症或糖尿病資料裡，挖掘出各種習慣或症狀之間的關聯，來幫助人類預防或診斷疾病。只要機器是個有用的工具，這一切資料對機器而言「不重要」，又有什麼關係？

也許沒有關係，不過假如你想要建造的新一代機器，是自行學習能力比人類教導它的速度更快的智慧機器，「理解」就非常重要了。畢竟，人類學習母語時不是從文法書上學的。

至今為止的演進方式是這樣的：我們創造出來的機器，會遵循嚴格的規則，來模仿人類的表現。這種機器的表現不佳，而且相當人工、不真實。經過幾個世代的最佳化工作，加上硬體增速後，效能就會增強。下一個躍進，是程式設計師放鬆規則，讓機器自己弄清楚更多事情，也讓機器自己塑造規則，甚至忽略舊規則。若要擅長某件事情，你必須懂得應用基本原則；若要精通某件事情，你必須懂得何時打破這些原則。這不只是理論而已，更是我二十多年以來對戰西洋棋機器的故事。

以上內容由臉譜出版授權刊登，未經允許請勿轉載。
◎更多精彩內容，請見：《深度思考》