大數(shù)據(jù)(英語:Big data),又稱為巨量資料,指的是在傳統(tǒng)數(shù)據(jù)處理應(yīng)用軟件不足以處理的大或復(fù)雜的數(shù)據(jù)集的術(shù)語大數(shù)據(jù)的特點(diǎn)
體積大
數(shù)據(jù)量很重要。對(duì)于大數(shù)據(jù),將不得不處理大量的低密度,非結(jié)構(gòu)化數(shù)據(jù)。這可能是價(jià)值未知的數(shù)據(jù),例如Twitter數(shù)據(jù)供稿,網(wǎng)頁或移動(dòng)應(yīng)用程序上的點(diǎn)擊流或啟用傳感器的設(shè)備。對(duì)于某些組織,這可能是數(shù)十兆字節(jié)的數(shù)據(jù)。對(duì)于其他人,可能是數(shù)百PB。
PB是硬盤存儲(chǔ)容量單位,存儲(chǔ)容量:是該存儲(chǔ)設(shè)備上可以存儲(chǔ)數(shù)據(jù)的最大數(shù)量,通常使用千字節(jié)(kb kilobyte)、兆字節(jié)(MB megabyte)、吉字節(jié)(GB, gigabyte)、太字節(jié)(TB ,terabyte)和PB(Petabyte)、EB(Exabyte)等來衡量。1PB=1024TB=1024 * 1024 GB一部1080P高清電影 2G 左右,大概就是 50W部高清電影速度
速度是接收和(或可能)作用于數(shù)據(jù)的快速速率。通常,與直接寫入磁盤相比,數(shù)據(jù)流直接進(jìn)入內(nèi)存的速度最高。一些支持互聯(lián)網(wǎng)的智能產(chǎn)品會(huì)實(shí)時(shí)或近乎實(shí)時(shí)地運(yùn)行,因此需要實(shí)時(shí)評(píng)估和采取措施。
多樣性
多樣性是指可用的多種數(shù)據(jù)類型。傳統(tǒng)的數(shù)據(jù)類型經(jīng)過結(jié)構(gòu)化,可以整齊地放置在關(guān)系數(shù)據(jù)庫中。隨著大數(shù)據(jù)的興起,數(shù)據(jù)進(jìn)入了新的非結(jié)構(gòu)化數(shù)據(jù)類型。非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)類型(例如文本,音頻和視頻)需要進(jìn)行額外的預(yù)處理才能得出含義并支持元數(shù)據(jù)。
真實(shí)性
它是指數(shù)據(jù)中的不一致和不確定性,即可用數(shù)據(jù)有時(shí)會(huì)變得混亂,并且質(zhì)量和準(zhǔn)確性難以控制。
大數(shù)據(jù)也是可變的,因?yàn)槎喾N不同的數(shù)據(jù)類型和數(shù)據(jù)源會(huì)產(chǎn)生大量的數(shù)據(jù)維度。
價(jià)值
除非將其轉(zhuǎn)化為有用的東西,否則大量沒有價(jià)值的數(shù)據(jù)對(duì)公司沒有好處。
數(shù)據(jù)本身沒有用處或重要性,但需要將其轉(zhuǎn)換為有價(jià)值的信息以提取信息。
大數(shù)據(jù)作用指引產(chǎn)品開發(fā)
Netflix和寶潔等公司使用大數(shù)據(jù)來預(yù)測客戶需求。他們通過對(duì)過去和當(dāng)前產(chǎn)品或服務(wù)的關(guān)鍵屬性進(jìn)行分類并對(duì)這些屬性與產(chǎn)品的商業(yè)成功之間的關(guān)系進(jìn)行建模,從而為新產(chǎn)品和服務(wù)建立了預(yù)測模型。此外,寶潔還使用焦點(diǎn)小組,社交媒體,測試市場和早期商店推出的數(shù)據(jù)和分析來計(jì)劃,生產(chǎn)和推出新產(chǎn)品。
預(yù)測性維護(hù)
可以預(yù)測機(jī)械故障的因素可能深深地埋在結(jié)構(gòu)化數(shù)據(jù)中,例如設(shè)備的年份,制造商和型號(hào),以及覆蓋數(shù)百萬條日志條目,傳感器數(shù)據(jù),錯(cuò)誤消息和發(fā)動(dòng)機(jī)溫度的非結(jié)構(gòu)化數(shù)據(jù)。通過在問題發(fā)生之前分析這些潛在問題的征兆,組織可以更有效地部署維護(hù)并最大化零件和設(shè)備的正常運(yùn)行時(shí)間。
提升客戶體驗(yàn)
客戶競賽在進(jìn)行中。現(xiàn)在比以往任何時(shí)候都更可能更清晰地了解客戶體驗(yàn)。大數(shù)據(jù)使您能夠從社交媒體,Web訪問,呼叫日志和其他來源收集數(shù)據(jù),以改善交互體驗(yàn)并最大程度地實(shí)現(xiàn)交付的價(jià)值。開始提供個(gè)性化報(bào)價(jià),減少客戶流失并主動(dòng)處理問題。
機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)現(xiàn)在是一個(gè)熱門話題。數(shù)據(jù)(尤其是大數(shù)據(jù))是原因之一。現(xiàn)在,我們可以教授機(jī)器而不是對(duì)其進(jìn)行編程。大數(shù)據(jù)的可用性可訓(xùn)練機(jī)器學(xué)習(xí)模型,從而使之成為可能。
推動(dòng)創(chuàng)新
大數(shù)據(jù)可以通過研究人員,機(jī)構(gòu),實(shí)體和流程之間的相互依賴性,然后確定使用這些見解的新方法來幫助您進(jìn)行創(chuàng)新。使用數(shù)據(jù)洞察力來改進(jìn)有關(guān)財(cái)務(wù)和計(jì)劃考慮因素的決策。檢查趨勢(shì)以及客戶希望提供什么新產(chǎn)品和服務(wù)。實(shí)施動(dòng)態(tài)定價(jià)。有無窮的可能性。
引申現(xiàn)在社交媒體(微信,微博,短視頻),電商都有海量數(shù)據(jù)。頭條可以根據(jù)用戶行為進(jìn)行精準(zhǔn)推送內(nèi)容或是廣告。電商可以根據(jù)數(shù)據(jù)推送有購買意向的產(chǎn)品。
當(dāng)前大數(shù)據(jù)時(shí)代只要是有海量用戶,就可以根據(jù)用戶的行為進(jìn)行分析從而衍生出新的價(jià)值信息。
人工智能的前提就是通過海量數(shù)據(jù),進(jìn)行模型訓(xùn)練從而形成自己的計(jì)算方式。16年時(shí)谷歌人工智能機(jī)器人阿爾法狗大敗世界圍棋冠軍李世石。圍棋是人類引以為傲的高智商游戲,但最終敗給了機(jī)器人。機(jī)器人就是前期通過海量數(shù)據(jù)進(jìn)行計(jì)算不斷的完善。
大數(shù)據(jù)的快速發(fā)展,也帶來了很多問題。例如鼎鼎大名的臉書用戶隱私泄漏事件。大數(shù)據(jù)中含有很多用戶隱私數(shù)據(jù),不正當(dāng)?shù)氖褂脮?huì)造成災(zāi)難事故。
大數(shù)據(jù)未來還可以在更多的領(lǐng)域中使用,未來也將會(huì)出現(xiàn)更多的技術(shù)彌補(bǔ)大數(shù)據(jù)的漏洞。
請(qǐng)點(diǎn)贊支持下吆,留言關(guān)注交流。