深度學習是不是發展前景特別好?
也許每個計算機科學家都夢想造出變形金剛一樣的人工智能,但這幾年引起重視的“人工智能”還是狹義的深度學習(或者說神經網絡)。在算力和數據的幫助下,深度學習在圖像/語音等領域取得了巨大成功;以神經網絡為核心的外沿應用,諸如自動駕駛,機器人學也蓬勃發展。此外,在各種開源軟件/公開課的幫助下,深度學習門檻很低。也正因此,很多人涌入了這一鄰域,AI會議投稿翻了幾倍,各種AI公司也吸引了無數的投資者。
2016-17年大概是AI概念最火熱的時候,當時學界和業界都有很大進展:AlphaGo戰勝了李世石;Berkeley學者將DeepRL(深度強化學習)應用于機器人,開辟了一個全新的方向;自動駕駛公司雨后春筍般冒了出來,很多從業者認為1-2年后就可以取代人類司機。那時,不少人認為AI將會改變甚至顛覆很多鄰域:也許幾年后,道路上都是自動車,服務機器人進入千家萬戶,簡單重復的勞動會被取代。
我動筆已差不多2020年,三年后回頭看,好像人們對AI太樂觀了。幾家AI獨角獸集中在容易落地的方向(如人臉識別,監控)。這些方向市場飽和,這幾家公司也找不到新的增長點。而自動駕駛面臨各種各樣的問題,安全員依舊不可或缺,初創公司也倒閉了一批。DeepRL的應用局限在棋牌游戲一類可以大量生成數據的場景。對于機器人學,DeepRL在學界飽受爭議,在業界更是沒人敢用。
吳恩達說,AI是新的電力。但我個人以為,這一說法是不準確的。在電力革命之前,人們就已經對電磁現象有了深刻的認知。許多著名的定律,如歐姆定律和麥克斯韋方程,已經被提出。換言之,電力革命是“理論指導實踐”,電動機變壓器等重要發明離不開理論的指導。與之相對,深度學習是“實踐指導理論”:人們通過實驗發現新的算法,如果實驗結果良好則給予經驗性的解釋。缺乏理論指導無疑限制了學界對于新方法的發現。過去幾年里,雖然小的改動層出不窮,但主要的模型還是那么幾種,深度學習還是只能處理有限類型的數據。
也許用蒸汽機來類比深度學習,從性質上更為合適。但是改變人類生產生活的,并不是蒸汽機本身,而是蒸汽動力的紡紗機,火車,輪船等。如果深度學習可以被用來制造火車,輪船一樣對人類產生巨大影響的新發明,那也完全稱得上一場革命。但目前來看,深度學習遠沒有達到這種水平,也很難說有這樣的前景。如前文述,能落地的方向有限,頭部企業缺乏增長點,在事關安全的重要鄰域人們對神經網絡充滿疑慮。
與此同時,一些消極的現象已經出現。就學界來說,深度學習的低門檻,短周期和高收入吸引了很多人;新從業人員的增加以及合格審稿人的缺失,導致了AI論文泥沙俱下,頂會含金量縮水;而人數帶來的激烈競爭和過時單一的評價標準,反而在鼓勵“灌水”。就業界而言,一個行業從業人員的待遇水平,除去泡沫以后,最終必然取決于這個行業整體所能創造的價值。那么,深度學習所創造的價值,能不能撐得起那么多算法工程師,算法科學家的高薪呢?我沒有統計過,但很難對此樂觀。
我不是說要把深度學習束之高閣。相反,我覺得深度學習應該像編程一樣被普及。因為深度學習入門門檻真的很低,python編程加上不超過大一水平的數學而已。換言之,每個人都應該知道,對于特定類型的數據,我們可以解決歸類,擬合,模式匹配等問題。反過來說,人們也應該明白,目前的“人工智能”有巨大的局限,數據并不萬能,我們離家政機器人都還差十萬八千里,更不用說天網和終結者了。
但如果想要深入研究深度學習,那相比“普及”可能就是另一回事了。以蒸汽機為類比的話,大概有兩個方向。要么原理性的解釋神經網絡,運用數學工具研究其性質,這類似熱力學定律之于蒸汽機;要么應用神經網絡發明像火車,輪船一樣改變人類生產生活的東西。而研究神經網絡理論是一個數學問題,需要深厚的理論功底和孜孜不倦的思考,這并不“低門檻,短周期和高收入”,不適合大部分人。
對于神經網絡的應用,也需要從兩個方面看待。對于一些簡單直接的應用,例如人臉識別,它們基本上已經落地(并且飽和),剩下的工作主要在工程師而非研究員;而對于把神經網絡應用于其他學科的研究,其核心與難點也不是神經網絡本身,而是問題的提出,數據的準備,以及輸出結果的處理和應用。例如,前一段有些把深度學習用于數據庫的研究。在這些研究中,主要的創新在于問題的轉化,主要的工作則在于數據庫系統的實現。從事這些研究的,并不是一般意義上的算法科學家(Machine Learning Scientist)。在他們的知識結構中,深度學習只是很小的一部分,所以對他們更準確的刻畫可能是“懂深度學習的數據庫系統科學家”。
也就是說,為了深度學習的發展,目前在學界可能更需要懂得深度學習的物理學家,計算機科學家,工程學家,而不是算法科學家;在業界則更需要懂得深度學習的軟件工程師,硬件工程師乃至機械工程師,而不是算法工程師。做一個類比的話,如果瓦特蒸汽機已經被發明,那學界和業界可能更需要科學家卡諾(熱力循環)和發明家富爾頓(蒸汽輪船),而不是第二個,第三個乃至第一千個瓦特。