現階段,AI(人工智能)肯定是依靠大數據而來的。
AI,是一個龐大而復雜的概念,但AI目前的成果不是一日之功,不是憑空而來的創新,而是吸取人類積累的科學成果和知識而來,說專業點,就是依靠大數據而來。
AI大都奠基于一項基礎的關鍵技術——機器學習MachineLearning,這是讓機械擁有自主學習的能力。
在1950年代技術萌芽期間,演算法和硬體條件都不夠成熟,是直到近年來日益優異的演算法,與強勁的硬體運算能力,才讓機器學習的能力有突破性進展,而其中帶進展最為快速的一項關鍵技術,就是阿法狗戰勝圍棋高手而成為關注焦點的“深度學習”。
“大數據”提高了深度學習精準度,不管是NVIDIA等芯片商,還是擅長演算法的Google、Facebook等,最常提到從事的機器學習的主流技術,就是深度學習。
舉個例子描述深度學習如何進行。比如,讓一臺搭載深度學習能力的車輛進行自動駕駛,面對陌生的路線、隨時有行人沖出馬路的危險路況,機器怎么判斷?透過深度學習,你可先一次提供機器海量的數據資訊,包含路標、號志、路樹、行人、等,讓它學會辨識環境中的物體為何,學會了,便有助于它在行進過程中快速而精準地避開障礙、找出最佳路徑,并順利抵達目的地。只要數據越豐富完整,機器就越能夠提高一切辨識的精準度,以加強判斷能力。
總之,讓AI靠“深度學習”發展思考能力,很大程度是依賴大數據所賜,大數據帶給深度學習強而有力的判斷能力,但其實機器若要做到“學習”這件事,深度學習并不是唯一方法,“小數據”的機器學習方案也蓄勢待發。
回到自動駕駛的例子,倘若我們先不將海量的數據提供給機器,而是只告訴他“目的地”、“禁止碰撞”兩項指令,然后任憑他不斷的Trial&Error,在失敗中汲取“經驗”以達到學習的效果,最終也能抵達目的地,前提是沒有遭遇嚴重車禍影響行進能力。這樣在初始階段不仰賴大數據的學習方式,可以歸類為“強化學習”。
強化學習的方法能補足機器在突發狀況下的應變能力,阿法狗的開發商DeepMind也深諳這項方法的優點,因此讓阿法狗也借著深度學習與強化學習的組合,在對手下出意料之外的棋步時,隨即建立新的經驗,以做為未來在相同局勢下能克敵制勝的判斷依據。
事實上,“獲取足夠大量的數據”是極耗成本的一件事,此外,有些數據如罕見疾病的病歷、癥狀等本身就具稀有性,因此像是強化學習等低數據依賴度機器學習方案逐漸開始受到青睞,許多公司與研究機構也以此作為研發的努力方向。