云計算與大數據概述
云計算(cloudcomputing)是基于互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源。云是網絡、互聯網的一種比喻說法。過去在圖中往往用云來表示電信網,后來也用來表示互聯網和底層基礎設施的抽象。狹義云計算指IT基礎設施的交付和使用模式,指通過網絡以按需、易擴展的方式獲得所需資源;廣義云計算指服務的交付和使用模式,指通過網絡以按需、易擴展的方式獲得所需服務。這種服務可以是IT和軟件、互聯網相關,也可是其他服務。它意味著計算能力也可作為一種商品通過互聯網進行流通。
大數據(bigdata),或稱海量數據,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity。
從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式計算架構。它的特色在于對海量數據的挖掘,但它必須依托云計算的分布式處理、分布式數據庫、云存儲和虛擬化技術。
大數據管理,分布式進行文件系統,如Hadoop、Mapreduce數據分割與訪問執行;同時SQL支持,以Hive+HADOOP為代表的SQL界面支持,在大數據技術上用云計算構建下一代數據倉庫成為熱門話題。從系統需求來看,大數據的架構對系統提出了新的挑戰:
1、集成度更高。一個標準機箱最大限度完成特定任務。
2、配置更合理、速度更快。存儲、控制器、I/O通道、內存、CPU、網絡均衡設計,針對數據倉庫訪問最優設計,比傳統類似平臺高出一個數量級以上。
3、整體能耗更低。同等計算任務,能耗最低。
4、系統更加穩定可靠。能夠消除各種單點故障環節,統一一個部件、器件的品質和標準。
5、管理維護費用低。數據藏的常規管理全部集成。
6、可規劃和預見的系統擴容、升級路線圖。
云計算與大數據的關系
簡單來說:云計算是硬件資源的虛擬化,而大數據是海量數據的高效處理。雖然從這個解釋來看也不是完全貼切,但是卻可以幫助對這兩個名字不太明白的人很快理解其區別。當然,如果解釋更形象一點的話,云計算相當于我們的計算機和操作系統,將大量的硬件資源虛擬化后在進行分配使用。
可以說,大數據相當于海量數據的“數據庫”,通觀大數據領域的發展我們也可以看出,當前的大數據發展一直在向著近似于傳統數據庫體驗的方向發展,一句話就是,傳統數據庫給大數據的發展提供了足夠大的空間。
大數據的總體架構包括三層:數據存儲,數據處理和數據分析。數據先要通過存儲層存儲下來,然后根據數據需求和目標來建立相應的數據模型和數據分析指標體系對數據進行分析產生價值。
而中間的時效性又通過中間數據處理層提供的強大的并行計算和分布式計算能力來完成。三者相互配合,這讓大數據產生最終價值。
不看現在云計算發展情況,未來的趨勢是:云計算作為計算資源的底層,支撐著上層的大數據處理,而大數據的發展趨勢是,實時交互式的查詢效率和分析能力,借用Google一篇技術論文中的話:“動一下鼠標就可以在妙極操作PB級別的數據”,確實讓人興奮不能止。