我們大家都知道,如今的科學技術水平的發展速度已經遠遠超出我們的想象。人工智能、機器人、5G、物聯網等技術噴薄而出,帶給我們個人以及整個社會的影響都是巨大的。
但是我們應該明白一個問題,任何科學技術的發展都不能擺脫事物發展的客觀規律。換句話說,科學技術的發展都不可能是完美的,而且其適用性也會隨著社會生產力的發展而不斷改變。
過去也許是金科玉言,今天可能就不管用。
一直蘊含在IT行業發展速度中的摩爾定律,如今已經面臨發展的瓶頸期。過去,摩爾定律促使更多IT企業需要在短時間內完成產品的更新迭代,而如今則需要考慮如何消除摩爾定律帶來的不利影響。
人工智能,這個名詞相信大家都在各種新聞媒體介質中都聽到過這個名詞,也知道目前人工智能在這幾年的人機大戰中發揮出驚人的表現,但是大家要知道人工智能這個名詞是在1956年美國達特茅斯學術會議上提出的。可是為什么時隔五十年左右,人工智能直到最近幾年才得到大家廣泛意義上的認可和支持?
有人說是因為計算機的計算性能不成熟,有人說人工智能算法還不成熟,更有人支持是人工智能訓練的數據量不夠。目前來看,人工智能算法、計算能力和數據的確都是制約人工智能發展的關鍵因素。人工智能專家李飛飛也曾表示,人工智能的落地必然預示著人工智能算法、計算能力和數據的成熟。
隨著5G技術的興起,高清視頻、高清圖片的數據量規模將會呈現指數級增長。過去數據被認為是人工智能的強有推動力。李飛飛的開源ImageNet數據集,使得人工智能算法在8年內對于圖像識別的準確度整整提高了10倍。
那么5G時代,數據的快速增長還會進一步推動人工智能的發展嗎?大量的數據,勢必會進一步考驗我們的計算機的硬件計算能力和存儲處理能力,我們又該如何去避免陷入數據時代的“馬爾薩斯陷阱”?
什么是馬爾薩斯陷阱?
“馬爾薩斯陷阱”是由英國政治經濟學家馬爾薩斯提出,又被成為“馬爾薩斯災難”。馬爾薩斯陷阱,簡單來說就是指幾何增長的人口數量和算數級增長的生存資料之間的矛盾。人口數量是以1,2,4,8,16,……的增長速度進行增長,而生存資料則是以1,2,3,4,……的增長速度進行增長。
可以這樣說,人口數據一直按照這種模式增長下去,生存資料必然不夠。馬爾薩斯則認為,多出來的人口會因各種原因而被消滅,這就是馬爾薩斯陷阱理論。
有人說4G帶給我們移動支付、位置、社交和短視頻等,但是我個人覺得4G帶給我們的應該是4G之前無法實現的場景。移動支付、位置、社交都是在3G時代能夠實現,但是在4G時代得到蓬勃發展。
之所以出現這些新應用場景,除了是因為網速的提升,更重要的是因為智能手機的極大普及帶來了更多的市場需求,從而促使一些場景應用得到快速發展和普及。真正因為4G出現而帶來的新場景應該就是直播、短視頻、視頻會議和聊天等,而這些必須需要高網速才能得以實現。
高清視頻和圖像在過去讓我們享受到更高質量、更高效的生活、工作和娛樂方式,但是現在也成為了數據“馬爾薩斯陷阱”的強大推手。根據數據分析中心IDC的《數據時代2025》白皮書預測,2025年全球每年產生的數據將從2018年的33ZB增長到175ZB,換算到每天大約產生491EB的數據。
1ZB=1024EB=1048576PB=1073741824TB=1099511627776GB。每天491EB的數據量相當于每天產生491000億部10G的電影,平均每個人就會產生59870G數據(世界銀行的預測到2025年,全球人口達到82億)。
天文數字的數據量,必然會對我們計算存儲能力和數據挖掘能力產生巨大挑戰。
數據增長還會持續推動人工智能算法?
數據在過去被稱作是人工智能的石油。我國目前在人工智能方面取得飛速發展,很大程度上取決于我國在數據方面的優勢。到2018年,我國網民數量已經突破八億,互聯網普及率高達57.7%,這正是孕育大數據的溫床,也是培育人工智能發展的基石。
那數據增長還會持續推動人工智能算法的發展,這個答案是肯定的。數據的增長必然會推動人工智能算法的發展,但是其影響力和推動力都會放緩。要想說明這個問題,其實也很簡單,可以以人的學習過程來作為類比。
小時候,我們學習新的知識會讓我們能夠更好的應對生活中面對的各種問題,無論是學習考試還是社會實踐。因為有了這些知識,我們才能明白如何去認知、理解甚至改變這個世界。但是隨著知識大爆炸,我們已經被知識給埋沒。
現在的我們不再趨向于掌握新的知識信息,而是希望能夠在知識信息中挖掘對自己有用的干貨。越來越多的書,越來越多的音樂,越來越多的電影,越來越多的資訊,讓我們應接不暇。即使是我們想了解所有的知識信息,我們的腦容量、記憶力和時間已經遠遠跟不上知識大爆炸的步伐。
因此,這時候,我們希望有人能夠幫助我們推薦我們自己感興趣的知識,能夠幫助我們做資源整合。慢慢地,知道自己喜歡看什么,淘寶知道自己想買什么,攜程知道自己想要去哪。所有的一切都悄悄發生,越來越多的人工智能算法開始分析我們的生活數據,越來越多的人工智能算法變得越來越“聰明”。
未來,隨著數據量的增多,人工智能算法必將變得更加精細、精準。比如說,未來的資訊可能能夠提煉出我們感興趣的某一個觀點;未來的健康運動手環可能能夠精準定位到詳細生命特征,進而給出針對性、個性化的健康意見。
但是這對人工智能算法的智能程度要求就更高,研發難度和研發周期必將更長。
因此,數據的增長還會持續推動人工智能的發展,但是因為人工智能應用和研發的難度越來越大,發展速度應該會放緩。即使是出現突破現行人工智能算法框架的新技術,發展的中后期必然也是緩慢和漫長。
如何避免數據時代的“馬爾薩斯陷阱”?
數據越來越多,對人工智能技術的發展產生新的挑戰。
可以肯定的是,我們將來的算法將會更加智能,數據將會更加有效,這是科技發展的必然規律。但是這個過程中,我們必然會遇到各種阻礙和問題。那會不會出現數據時代的“馬爾薩斯陷阱”?我們目前無法預測,但是可以在其到來之前,特別是5G時代到來之前,做好相關預防工作。
如何才能避免數據時代的“馬爾薩斯陷阱”?簡單來說,就是更快處理,有效存儲和深度挖掘。
更快處理,提升數據處理速度。5G時代的大寬帶和低時延使得計算過程中的信息傳輸更加及時,具體來說來說,5G的核心技術——邊緣計算和網絡切片使得這一切成為可能。
過去都是依靠集中服務器處理,但是隨著數據量的提升,集中服務器的處理壓力增大,很難滿足快速數據增長的需求。邊緣計算則是依托數據前端進行數據處理,讓“身邊設備”就能計算,緩解中心云的壓力,從而提升數據處理的時效性。
網絡切片技術,簡單來說就是專通道專使用,就像我們的高速公路一樣,必須按照規定的速度和路線行駛,數據流通行速度自然能夠得到保障。
有效存儲和深度挖掘其實就是強調如何在海量數據中發現有用信息,避免冗余信息的存儲,深度挖掘數據中的關聯性,減少數據存儲量。反之,提升數據質量,則會進一步需要人工智能具備更強大的數據挖掘能力。
結論
5G時代,越來越多的數據,讓我們迎接不暇。數據的增長,滋養者人工智能不斷發展,但也帶來更多存儲、計算的壓力。數據呈現出幾何指數增長態勢,而人們對數據的處理、存儲和應用的能力遠不能有效跟上數據增長的速度,可能導致出現數據時代的“馬爾薩斯陷阱”。
數據時代的“馬爾薩斯陷阱”,簡單來說就是人類處理數據的能力已經無法匹配上數據增長的速度。即使數據增多會持續提升人工智能數據分析能力,但是數據處理能力和數據量的不匹配,必然會造成更大的資源、人力、時間的浪費。
如何能夠有效避免5G數據時代的“馬爾薩斯陷阱”,可以從提升信息處理速度、提高數據挖掘能力和減少數據存儲量三個方面入手解決,避免數據增長帶來的計算和存儲壓力。
未來必然可期,但是道路還很漫長。你們怎么看?歡迎在下方留言。