謝邀!
在回復(fù)《人類與AI(人工智能)如何相處?( https://www.wukong.com/answer/6955462920969830692/)》中談了在面對擁有自我意識的機(jī)器人,人類該如何與之相處?又該遵從哪些倫理道德?接下來,借著回復(fù)此問題,向大家介紹一下AI的三大核心要素(也是AI的三大基石)——數(shù)據(jù)、算力和算法。
數(shù)據(jù)是AI算法的“飼料”
在如今這個時代,無時無刻不在產(chǎn)生數(shù)據(jù)(包括語音、文本、影像等等),AI產(chǎn)業(yè)的飛速發(fā)展,也萌生了大量垂直領(lǐng)域的數(shù)據(jù)需求。在AI技術(shù)當(dāng)中,數(shù)據(jù)相當(dāng)于AI算法的“飼料”。機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)(Supervised Learning)和半監(jiān)督學(xué)習(xí)(Semi-supervised Learning)都要用標(biāo)注好的數(shù)據(jù)進(jìn)行訓(xùn)練(由此催生大量數(shù)據(jù)標(biāo)注公司,對未經(jīng)處理的初級數(shù)據(jù)進(jìn)行加工處理, 并轉(zhuǎn)換為機(jī)器可識別信息),只有經(jīng)過大量的訓(xùn)練,覆蓋盡可能多的各種場景才能得到一個良好的模型。
目前,數(shù)據(jù)標(biāo)注是AI的上游基礎(chǔ)產(chǎn)業(yè),以人工標(biāo)注為主,機(jī)器標(biāo)注為輔。最常見的數(shù)據(jù)標(biāo)注類型有五種:屬性標(biāo)注(給目標(biāo)對象打標(biāo)簽)、框選標(biāo)注(框選出要識別的對象)、輪廓標(biāo)注(比框選標(biāo)注更加具體,邊緣更加精確)、描點(diǎn)標(biāo)注(標(biāo)注出目標(biāo)對象上細(xì)致的特征點(diǎn))、其他標(biāo)注(除以上標(biāo)注外的數(shù)據(jù)標(biāo)注類型)。AI算法需要通過數(shù)據(jù)訓(xùn)練不斷完善,而數(shù)據(jù)標(biāo)注是大部分AI算法得以有效運(yùn)行的關(guān)鍵環(huán)節(jié)。
算法是AI的背后“推手”
AI算法是數(shù)據(jù)驅(qū)動型算法,是AI背后的推動力量。
主流的算法主要分為傳統(tǒng)的機(jī)器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)算法,目前神經(jīng)網(wǎng)絡(luò)算法因?yàn)樯疃葘W(xué)習(xí)(源于人工神經(jīng)網(wǎng)絡(luò)的研究,特點(diǎn)是試圖模仿大腦的神經(jīng)元之間傳遞和處理信息的模式)的快速發(fā)展而達(dá)到了高潮。
南京大學(xué)計算機(jī)系主任、人工智能學(xué)院院長周志華教授認(rèn)為,今天“AI熱潮”的出現(xiàn)主要由于機(jī)器學(xué)習(xí),尤其是機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)技術(shù)取得了巨大進(jìn)展,并在大數(shù)據(jù)和大算力的支持下發(fā)揮巨大的威力。
當(dāng)前最具代表性深度學(xué)習(xí)算法模型有深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,簡稱DNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)。談到深度學(xué)習(xí),DNN和RNN就是深度學(xué)習(xí)的基礎(chǔ)。DNN內(nèi)部的神經(jīng)網(wǎng)絡(luò)層可以分為三類,輸入層,隱藏層和輸出層, 一般來說第一層是輸入層,最后一層是輸出層,而中間的層數(shù)都是隱藏層。DNN可以理解為有很多隱藏層的神經(jīng)網(wǎng)絡(luò),是非常龐大的系統(tǒng),訓(xùn)練出來需要很多數(shù)據(jù)、很強(qiáng)的算力進(jìn)行支撐。
算力是基礎(chǔ)設(shè)施
AI算法模型對于算力的巨大需求,推動了今天芯片業(yè)的發(fā)展。據(jù)OpenAI測算,2012年開始,全球AI訓(xùn)練所用的計算量呈現(xiàn)指數(shù)增長,平均每3.43個月便會翻一倍,目前計算量已擴(kuò)大30萬倍,遠(yuǎn)超算力增長速度。
在AI技術(shù)當(dāng)中,算力是算法和數(shù)據(jù)的基礎(chǔ)設(shè)施,支撐著算法和數(shù)據(jù),進(jìn)而影響著AI的發(fā)展,算力的大小代表著對數(shù)據(jù)處理能力的強(qiáng)弱。算力源于芯片,通過基礎(chǔ)軟件的有效組織,最終釋放到終端應(yīng)用上,作為算力的關(guān)鍵基礎(chǔ),AI芯片的性能決定著AI產(chǎn)業(yè)的發(fā)展。
加快補(bǔ)齊AI芯片短板
從技術(shù)架構(gòu)來看,AI芯片可以分為四大類:通用性芯片(GPU,特點(diǎn)是具備通用性、性能高、功耗高)、半定制化芯片(FPGA,特點(diǎn)是可編程、功耗和通用性一般)、全定制化芯片(ASIC,特點(diǎn)是不能擴(kuò)展、性能穩(wěn)定、功耗可控)和類腦芯片(特點(diǎn)是功耗低、響應(yīng)速度快)。
AI本質(zhì)上是使用人工神經(jīng)網(wǎng)絡(luò)對人腦進(jìn)行的模擬,旨在替代人們大腦中的生物神經(jīng)網(wǎng)絡(luò)。由于每個任務(wù)對芯片的要求不同,所以可以使用不同的AI芯片進(jìn)行訓(xùn)練和推理。
在過去二十年當(dāng)中,處理器性能以每年大約55%的速度提升,內(nèi)存性能的提升速度每年只有10%左右,存儲速度嚴(yán)重滯后于處理器的計算速度。隨著AI技術(shù)的發(fā)展,所需數(shù)據(jù)量變得越來越大,計算量越來越多,“內(nèi)存墻”(指內(nèi)存性能嚴(yán)重限制CPU性能發(fā)揮的現(xiàn)象)的問題越來越嚴(yán)重。因此,存算一體(將部分或全部的計算移到存儲中,計算單元和存儲單元集成在同一個芯片,在存儲單元內(nèi)完成運(yùn)算)有望成為解決芯片性能瓶頸及提升效能比的有效技術(shù)手段。
目前,數(shù)據(jù)中心中核心算力芯片各類通用的GPU占主導(dǎo)地位。IDC的研究指出,2020年,中國的GPU服務(wù)器占據(jù)95%左右的市場份額,是數(shù)據(jù)中心AI加速方案的首選。但I(xiàn)DC也做出預(yù)測,到2024年,其他類型加速芯片的市場份額將快速發(fā)展,AI芯片市場呈現(xiàn)多元化發(fā)展趨勢。
近些年來,我國AI雖然取得了不少的突破和進(jìn)展(例如小i機(jī)器人主導(dǎo)了全球第一個AI情感計算的國際標(biāo)準(zhǔn)),并在國際上具備一定的競爭力,但AI芯片對外依賴較大(根據(jù)賽迪智庫人工智能產(chǎn)業(yè)形勢分析課題組研究指出,國內(nèi)AI芯片廠商需要大量依靠高通、英偉達(dá)、AMD等國際巨頭供貨),并缺乏AI框架技術(shù)(深度學(xué)習(xí)主流框架TensorFlow、Caffe等均為美國企業(yè)或機(jī)構(gòu)掌握)的支撐。
未來人們對科技的依賴會與日俱增,AI也將會成為大國競爭的焦點(diǎn)。為擺脫我國AI的短板,有專家表示AI芯片方面我國可以借鑒開源軟件成功經(jīng)驗(yàn),降低創(chuàng)新門檻,提高企業(yè)自主能力,發(fā)展國產(chǎn)開源芯片;算法框架方面則可通過開源形成廣泛的應(yīng)用生態(tài),廣泛支持不同類型的AI芯片、硬件設(shè)備、應(yīng)用等。
算法、算力、數(shù)據(jù)作為AI核心三要素,相互影響,相互支撐,在不同行業(yè)中形成了不一樣的產(chǎn)業(yè)形態(tài),隨著算法的創(chuàng)新、算力的增強(qiáng)、數(shù)據(jù)資源的累積,傳統(tǒng)基礎(chǔ)設(shè)施將借此東風(fēng)實(shí)現(xiàn)智能化升級,并有望推動經(jīng)濟(jì)發(fā)展全要素的智能化革新,讓人類社會從信息化進(jìn)入智能化。
最后,再順便打個小廣告,“陳思進(jìn)財經(jīng)漫畫”系列第一部《漫畫生活中的財經(jīng)》新鮮出爐,謝謝關(guān)注!
你對這個問題有什么更好的意見嗎?歡迎在下方留言討論!