人工神經網絡怎么工作?
AlphaGo團隊的高級搜索科學家在造就Talk的演講上,以AlphaGo為例,詳細闡釋了神經網絡是如何工作的。
大家好,我叫默里·沙納漢,是倫敦帝國理工學院認知機器人學教授。大約在六個月前,我還在Google的DeepMind部門兼職。
今天我來到這里和大家交流人工智能,大致探討一下人工智能的現在和未來。
為什么AI最近變得如此令人矚目?
為什么AlphaGo是一個激動人心的里程碑項目?它的局限性在哪里?
我們如何才能在有朝一日,實現接近人類水平的人工智能?它的阻礙有哪些?
造就Talk第212位講者 默里·沙納漢(Murray Shanahan)倫敦帝國理工學院認知機器人學系教授
DeepMind高級搜索科學家
首先我想說說人工智能的定義。
可以說,人工智能是計算機和機器人的架構,可以執行通常被認為需要人類智能完成的任務。當然,這個定義又需要輔以其他的解釋,它引出了什么是智能的問題。
我所喜歡的對于智能的準確定義是,智能是指在多變的環境下實現目標,以及做出適當決策的能力。
多變性才是通用智能的關鍵。
然而當前多數的人工智能,面向的都是特定的應用方向,例如下棋、自駕車、醫療診斷,或者在相冊中對照片進行標記等。它涉及的是對這些應用有用處的那部分技術,例如,理解計算機視覺、語言或學習等。
最近有一些報告已經在嘗試量化人工智能技術對于未來十年的經濟影響。這是埃森哲公司的一份報告,他們認為,人工智能有著巨大的經濟影響潛力。許多西方國家的年度經濟增長幅度在很多方面,將因人工智能的幫助而比沒有人工智能時翻倍。
中國國務院最近發布了一項行動計劃,將致力于讓中國在2030年成為人工智能領域的領先創新國之一。
普華永道事務所今年發表的報告也認為,在未來幾十年里,人工智能技術對國內生產總值的貢獻將會非常顯著。
尤其是在中國,這種影響將是最大的。
為什么我們對于AI技術的經濟影響力會有如此大的期待呢?
兩個里程碑現在,我們來看看人類在AI領域所取得的進步,以及所有輿論渲染和期望的理由是什么。
讓我們回到歷史上的1997年,20年前,一臺名叫深藍(Deep Blue)的IBM計算機打敗了加里·卡斯帕羅夫(Garry Kasparov),當時的國際象棋世界冠軍。卡斯帕羅夫在這場比賽中被打敗,這被廣泛認為是人工智能領域的一個非常重要的里程碑,一個非常重要的成就。
有趣的是,即使我們能夠造出棋藝達到如此水平的計算機,但是大家依然認為我們沒有真正實現人類水準的人工智能。人類還有很多事情是計算機無法企及的,哪怕是非常普通的日常事務。
此后的二十年來,我們突飛猛進,在2016年,DeepMind的AlphaGo以4:1的戰績打敗了韓國頂尖圍棋大師李世石,第二年,AlphaGo又成功打敗了中國的柯潔。
這是出乎人們意料的。很多人原以為,要想讓計算機在類似圍棋這種智力博弈中達到專業級別,需要很長的時間。
國際象棋可能的走法數量非常龐大,但是還沒有大到計算機用純粹蠻力運算解決不了的程度。
“深藍”破解國際象棋的辦法就是窮舉所有可能的走法,以及對手可能采取的對策,然后再算出自己的下一步對策等,進而得出一個包含各種可能性的樹狀結構。這個樹狀結構展開后非常非常龐大。
人類無法用這種蠻力方式來破解棋局。例如心里想著:“我先這樣走,對方再那樣走,然后我又這樣走,對方會不會再那樣走?”人類棋手這樣算幾步沒問題,但大體上講,高手都是依靠自己的直覺判斷以及套用棋譜的能力。
而計算機對國際象棋的處理方式依靠的并不是直覺判斷,也不是套用棋譜,而是利用超強的計算能力,超快的計算速度,來窮舉這棵巨大的可能性之樹。
但是,由于圍棋的可能性之樹大到遠遠超過了國際象棋,用窮舉的辦法也行不通。
這就是為什么很多人認為我們永遠造不出具備職業水平的圍棋計算機。即使憑借當今的計算能力,依然遠遠不能用蠻力窮舉的辦法來破解圍棋。
DeepMind采用的辦法是設法模仿了這種對棋盤局面進行直覺判斷的能力。如果你有關注過當時的比賽,就會知道AlphaGo甚至首創了一些新的走法。它贏下比賽的某些走法是人類的圍棋高手們前所未見的。
AlphaGo有多強?那么AlphaGo具體的工作原理是怎樣的呢?
和IBM的“深藍”類似,AlphaGo也會搜索這種可能性之樹,它使用了蒙特卡羅樹搜索法,也就是說,它會在搜索樹中進行隨機搜索。這是AlphaGo非常關鍵的一種工作方式。
它與深藍的工作方式不同之處在于,它使用神經網絡算法來修剪這棵樹。對于這棵巨大的可能性之樹,AlphaGo通過削減分支,并使用神經網絡算法限制探索的范圍。
它對龐大的人類專業棋手對弈數據庫進行深度學習,憑借這個人類專業棋手對弈數據庫,兩個神經網絡得到了訓練。
其中一個神經網絡思考棋盤上的態勢,分析當前局勢的好壞;另一個神經網絡則會分析棋盤局勢并分析專業棋手下一步最有可能怎么走。
憑借這些信息,它可以削減巨大的可能性,從而只去搜索那些潛在的好的招式,因為它從人類專家數據庫中學到了怎么走才算是好棋。對于AlphaGo來說,只有當這一步棋對局勢起到積極作用的時候,它才會去繼續搜索。
它還使用一種稱為強化學習的技術。強化學習是通過試錯法來學習,它會與自己對弈。AlphaGo利用對人類技法的學習成果不斷地和自己對弈,這會讓它的訓練得到大幅提升。
AlphaGo本身只是個圍棋項目,然而,從諸多方面來講,AlphaGo真正重要的是它所使用的基礎技術具有更廣泛的應用,而不僅限于圍棋。
計算能力不是唯一
AlphaGo的能力給人留下了深刻印象,但是人類水平的人工智能呢?我們在科幻電影中看到的那些景象呢?
有些作家,例如雷蒙德·庫茨魏爾,曾經預言,人類水平的人工智能到本紀20年代就會出現。
他的依據是,先算出人腦的神經元數量然后算出需要多少計算能力來模擬它們。再推斷我們什么時候能實現那種計算能力,當你推斷出計算能力的增長曲線的時候,例如這里顯示的是世界前五百強超級計算機的運算速度,由此可知,有能力模擬人腦所有神經元的計算能力,會在本世紀20年代出現。
但我認為真正的結論比這更復雜,那么我來解釋一下理由。
計算能力不是實現人類水平人工智能的唯一條件,因為我們真的需要清楚如何利用這些計算能力。
問題在于,人工智能軟件的進步是否符合硬件的進步,我認為要想實現人類水平的人工智能還有很多問題丞待解決。我可以通過再次思考AlphaGo的案例來得出結論。
AlphaGo顯然非常聰明。我們知道它甚至表現出了某種創造力,甚至它的設計師和圍棋大師也不完全了解它在做什么。
然而,和所有專業的人工智能一樣,AlphaGo實際上在很多方面又不夠聰明,因為它能做的只是下圍棋,而如果我們來看一下李世石或者柯潔,他們不僅會下圍棋,也可以做所有我們都會做的日常事情,比如和他人交談,陪小孩子玩,或是下廚做飯。
這些事情柯潔可以做,李世石可以做,我也可以做,但AlphaGo只會下圍棋。AlphaGo甚至都不知道日常事務的復雜程度。
為了實現人工通用智能(即人類水平的人工智能),我們需要滿足其他一些條件。用英語表達,就是三個C:
創造力(Creativity)
常識(Common sense)
抽象概念(abstract Concepts)
我們需要創造力,不斷去嘗試新的可能性,但只有當計算機具備常識的時候才能做到。
常識是理解日常生活中的日常行為結果的能力。我們對我們周圍的各種日常事物以及它們的工作方式都有一個共同的認知。
比如說你的房子,或者是在街上,我們知道如果操縱它們,移動它們,擠壓它們,會發生什么。對社會領域,我們也有共同的理解。
但我們還不知道如何讓計算機具備這種能力,讓它們有能力形成人類所遵從的抽象概念,幫助我們在新的環境中進行泛化應用。
要想實現人類水平的人工智能,就要先實現這些才行。實際上,我不知道我們什么時候才能實現這個目標。我認為在這一天到來之前,還有未知數量的概念上的障礙。
在技術奇點降臨之前然而,假設這一天終會到來,那么屆時我們將會處于某些人所說的技術奇點。
在那之前,我認為我們不得不開始思考一些至關重要的事情。
我們必須思考由此帶來的技術性失業問題,我們必須思考自身對于技術的依賴。我們不能過分依賴技術。我們希望確保我們的技術是安全可靠的。
如果真能實現人類水平的人工智能,那么這些擔憂將會變得更加深遠。
盡管如此,假設我們真能掌控一切,那么就有可能為人們的生活帶來非常非常顯著且有益的改善。如果計算機和人工智能能夠實現某種烏托邦,那么我們必須向自己提出一些真正深刻且重要的問題,比如:
作為人類,我們真正想要的是什么?
幸福生活的標準是什么?
我認為這些爭論和問題會超越文化和政治分歧。這些是我們都要去探討的事情。
最后我要說,即使人類水平的人工智能可能需要很久才能實現,但是專門化的人工智能技術現在已經有了,必定會越來越強大,也會帶來巨大的影響。
非常感謝。
關于AlphaGo Zero如何打敗AlphaGo Master,關注“造就”,在主頁文章列表中查看:
新版阿法狗3天超越3000年,人類邁出了被機器奴役的第一步嗎?
造就:劇院式的線下演講平臺,發現最有創造力的思想