數據科學與大數據?
目前只能從名字分析,更主要的還是要看專業課。
智能科學與技術應該是人工智能領域。
數據科學與大數據應該是大數據處理。
物聯網更多的是各曾經之前的通信協議。
因為這幾方面,我基本上算都有所涉獵。下面我來簡答聊聊這些具體都是做什么的。
1、人工智能
人工智能,聽起來很高大上吧,不過目前的人工智能就是線性推演和深度學習。
之前我有一期問答詳細說分析過。這里簡單誰一下吧,線性推演,就好比下棋,我們將規則預設,推演利用的就是計算機的速度優勢。如今的計算速度,不靠預先錄入棋譜,單考超算的硬實力也能碾壓人類頂尖棋手。
深度學習就是卷積的訓練,通過多次訓練不斷矯正和完善。為了進一步優化響應速度和并發,現在有些國內的前端領域從芯片著手,放棄了通用的精簡指令集,而采用了專業度邏輯運算電路進一步提升速度。
人工智能簡單點的現實應用,車牌識別、語音識別,人臉識別。這些基本上一點都不智能,推理這方面基本上還是剛起步。人工智能領域的從業者也很少說自己是做人工智能的,前幾年一般都說自己是做數學研究的。為啥這樣,就是現階段的確不怎么樣。
我就用小愛音響控制空調的語音識別交互邏輯為例你就明白了。空調組是要執行的類組的一個實體化的對象。每個空調的對象都有一個屬性叫所在房間。語音識別到“臥室空調關閉”,口音的也許會近似匹配。在空調組里找到屬性“臥室”,執行“關閉方法”。這樣的智能你還感覺高級嗎?
但是就是因為的確目前還在很基礎階段,后面才有更多的發展空間。人工智能設及的領域也超多,dsp,超算,邏輯新品,各種算法。高數和更高都數學不好的同學就別去嘗試了。一個傅立葉算法就可以應用在圖像,聲音等多個領域。
2、大數據
大數據也是在信息化和互聯網發展到今天不得不解決的。
大數據行業按照作業流程可以大體分為采集,存儲,分析三個階段。
采集
這個之前我也做過介紹,我這里就簡單介紹下。就是把整理好或者沒整理好分布在互聯網各處的潛在有價值信息拿回來。這個過程就叫做爬蟲,現在的高級爬蟲也是利用到了人工智能的深度學習學習,判斷下一步抓取的方向和感興趣的內容。
隨著國家關于信息隱私的立法,這方面的采集更多只能通過標準搜索引擎蜘蛛爬行的方式。
存儲
海量的數據如何完整存儲,高效調用。左右手各帶一塊表,鏈表,哈希倒排索引(分詞)等基礎方式,在超大規模的數據結構處理時就不太夠用。根據項目需求采用列式數據庫,鍵值數據,圖數據庫,甚至于集中聯合使用。后面可能還需要一個大并發的框架。
分析
根據手中數據和目標進行建模,優化。然就是仿真,實現,出報告了。
看看我一個朋友公司的招聘需求,就知道你大概的一個職業技能積累了。
任職要求:
1. 具有極強的數據敏感度和商業敏感度,有通過數據創造商業價值的具體案例;
2. 本科以上學歷;具有5年以上大數據相關的數據平臺、數據倉庫、數據分析應用等相關經驗;具有扎實的大數據功底,有以數據視角和分析業務的能力,有規劃和設計大數據解決方案的能力。
3. 總體負責過大數據部門或類似技術部門,具有目標和結果導向的管理思維和很強的團隊管理能力;具有豐富的項目管理經驗,具備技術團隊建設及管理經驗;
4. 掌握主流的大數據技術,包括離線數據處理、流式數據處理和NoSQL技術,熟悉Hadoop生態相關技術,如Hive、HBase、Spark、Storm、Flink、Kafka等,熟悉數據接入相關工具,如Flume、Sqoop、GoldenGate等;
5. 具有很強的溝通能力,有同時面向業務和技術部門的協同工作能力;
數據庫,架構,隊列,分析工具全方位要求。也有些小型公司,也許用python+pg就搞定了!
3、物聯網
這是個實現交互和通信的領域,期間也許會包含大量的協議。
這里說的協議可能是底層的,甚至IPv6,TCP,udp,也可能是xml,json。甚至會話層的教驗和加密,一類設備統一管理的協議規范,每個行業有自己的行業標準,即便很像的兩個設備在不同行業應用也要遵循所在行業的規范。。
WiF mesh,藍牙,zigbee,nfc5g等這些需要底層實現的也許都包括在內。
做物聯網的更多的是做一個服務,提供API,或者就是調試接口。當然前段也許還包括下面曉設備和下位機的嵌入式開發。
我估計應該沒對手人比我說得更詳細了。
未來的職業技能要求,發展方向和工作領域我基本上都告訴你了。前兩個領域想做好基本需要碩士或者博士。第三個入門門檻稍低點,本科生勉強可以做入門工作。
希望我的回答對你有幫助。