目前最熱門的IT行業分支是人工智能行業。
“人工智能”實際上是統計學的一種,很多種智能算法都可以被稱為“不可解釋的統計推斷”,雖然被廣泛運用在各行各業之中,但是因為智能算法參數的知識對人類來講無法理解,所以限制了自身的進步。
雖然AI這個詞是上世紀50年代被人提出的,但是人類試圖創造類人智能的努力一直沒有停止。我對于具體的事件記不清楚,所以在這里大多使用的都是側面反映制造類人智能努力的事件。
文藝復興時代16世紀達芬奇就有設計機器人的手稿,設計了可以發聲和揮動肢體的機器武士。
18世紀時候出現了一個魔術,由機械機器人和人類棋手對弈的表演“土耳其行棋傀儡”。傀儡進行了無數次表演,擊敗了當時大多數國際象棋棋手,直到19世紀中期才被揭露其中的原理,反應了當時民眾相信科技水平足以制造類人機械以及對于制造類人機械的努力。
在20世紀到來之前,一直在用機械手段試圖去實現類人機器,20世紀開始轉為結合電氣手段。
20世紀初期,卓別林喜劇摩登時代里,有機器人喂他吃東西,包括理發等等。
這些努力在當時的歷史時期里都沒有被視為荒謬的嘗試,科學家與全社會民眾對于科技水平與工程工資滿懷信心。在不具備電子計算機的時代里,就消耗了大量的社會資源。類似的創新沒有實現他們原本的目的,但是帶動了機械工業的發展。
后面的歷史可以在wiki查到。
人工智能1956年被人提出70年代感知器模型強化學習算法出現,一大批人又一次相信類人智能可以由這些算法實現,最終這類算法能實現的任務領域狹窄,計算能力與內存等硬件也存在瓶頸,人工智能陷入低谷。
80年代專家系統出現,核心是一種基于決策樹的分類模型,由于專家系統具備使用價值,流行一時。東野圭吾的小說里也提到日本企業80年代最流行的就是建設專家系統以保留技術能手的知識,但很快被發現應用情景過于特定,90年代這類系統就不再成為熱點。
在專家系統興盛的同時,有人改進了感知器模型,將原有的感知器模型串聯或并聯,形成神經網絡模型。BP算法的出現使得對神經網絡的研究再次復活,BP意味著誤差反傳,網絡結構里“隱節點”的加入對訓練模型產生了大的改進。90年代的論文里,神經網絡紅極一時,可以解決很多問題。但是神經網絡的學到的網絡參數難以解釋,調節參數對結果有很大影響,使得調參被看做一門科學之外的學問。
與神經網絡同時興盛的是“群智能”,最初是模擬生物進化的遺傳算法,隨后各類型群體智能算法仿照遺傳算法誕生。群智能比起神經網絡算法更加玄學,各類參數初始值設置不同可以得出不同的結論,以至于發展出解釋初值影響結果的“種群早熟”、“步長”之類的術語。
智能算法由于需要樣本多,訓練時間長,學習效果難以保證,問題難以解釋等等原因,應用領域也極為狹窄。改造這時期的智能算法并應用于現實的努力逐漸陷入低谷。
21世紀初在計算能力出現深度學習之前,國內主是學生做數學建模比賽使用這類智能算法。深度學習是在硬件計算能力大幅度提高之后,通過增大神經網絡的規模,擴展出多層“隱含層”來提高神經網絡結果。嚴格來說多層神經網絡的構想在上世紀就有模型,受限于硬件計算能力而難以實現。
深度學習目前被廣泛用在過去神經網絡應用的范疇里,也被寄予厚望,希望突破獲得類人智能。高效完成傳統神經網絡的任務是可行的,但是突破類人智能很可能是徒勞無功。因為目前提高效果是通過增加計算量實現的,每增加一層隱含層需要優化的參數都會增長,計算量的增長是非線性的。
使用今天突破的硬件去跑上世紀的模型算法,優化眾多效果不明的參數,獲得不可解釋的統計推斷結論。這種模式可以取得有意義的結論,但是依賴硬件提高性能的模式不可持續,如果模型不能取得創新,陷入冬天只是時間問題。