從數(shù)據(jù)本身而言,大數(shù)據(jù)是人工智能的核心競爭資源
有人說:數(shù)據(jù)、算法、算力是人工智能的核心三大模塊。說是數(shù)據(jù)驅(qū)動的人工智能,不為過。沒有數(shù)據(jù),
互聯(lián)網(wǎng)時代,每個公司積累的大數(shù)據(jù),是每個公司的戰(zhàn)略物資。比如電商的用戶行為數(shù)據(jù),比如社交領(lǐng)域的用戶通信數(shù)據(jù)。
后續(xù)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí),從預(yù)測算法到客服機(jī)器人、人臉識別等等,背后模型都是以大量的數(shù)據(jù)為基礎(chǔ)的。比如NLP領(lǐng)域:從GPT,BERT,GPT2,Transormer-XL,XLNET,RoBERTa,模型背后的數(shù)據(jù)越來越多,模型越來越重,精度越來越高。
未來人工智能的落地,依賴于大數(shù)據(jù)。比如金融、醫(yī)療行業(yè),
從技術(shù)角度來講,大數(shù)據(jù)日趨成熟,成為應(yīng)用的底層基礎(chǔ)技術(shù)
大數(shù)據(jù)技術(shù)越來越成熟,從離線數(shù)據(jù)到實(shí)時數(shù)據(jù),從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù),從hadoop到spark,storm。
很多公司都有自己的大數(shù)據(jù)團(tuán)隊構(gòu)建的大數(shù)據(jù)平臺,有點(diǎn)類似運(yùn)維工作的味道。前幾年,你說你會hadoop;
大數(shù)據(jù)與隱私
很多人意識到了數(shù)據(jù)的重要性,并想方設(shè)法從中盈利。如果你買過房子,不久后你可能會收到中介的電話,問你的房子要不要出租;或者問你的房子,要不要裝修。等你小孩上學(xué),會收到電話,問你小孩要不要舞蹈、鋼琴、英語培訓(xùn)。
大數(shù)據(jù)帶動了數(shù)據(jù)采集的需求。從人工收集到APP等索要各種權(quán)限,大數(shù)據(jù)采集的成本越來越低。最近因?yàn)榕老x,很多人甚至公司整個團(tuán)隊被抓,將來預(yù)計對這方面的立法會越來越關(guān)注。
很多大公司的app,都會要求你同意一個協(xié)議,里面說白了要用你的數(shù)據(jù),需要你同意。對于這些app,鑒于市場環(huán)境,沒法拒絕,除非你拒絕用它。從用戶角度而言,想拒絕,很難。