1、《Python for data analysis》
這本書涵蓋了ipython notebook、Numpy、Scipy和Pandas包的使用等,只要掌握了python語法就可以學習。
2、《Python Cookbook》
這本書介紹了Python應用在各個領域中的一些使用技巧和方法。
3、《Python數據處理》
教你如何利用語法簡單、容易上手的Python輕松處理數據。
加米谷大數據開發9月零基礎班,已開課可試聽;大數據分析10月零基礎班,預報名中...
相關:
大佬們推薦的Python書單匯總
https://www.toutiao.com/i6649565082718044680/
未來最大的能源不是石油而是大數據。對大數據的獲取、處理與分析,以及基于大數據的智能應用,已成為提高未來競爭力...
回答之前,先有情提醒一句,「蟲有風險」,刑法已明確非法獲取計算機信息系統數據罪。我們先來看看善意爬蟲和惡意爬蟲的區分:
善意爬蟲,比如百度搜索引擎的爬蟲,嚴格遵守Robots協議規范爬取網頁數據(如URL),它的存在能夠增加網站的曝光度,給網站帶來流量。惡意爬蟲,它無視Robots協議,對網站中某些深層次的、不愿意公開的數據肆意爬取,其中不乏個人隱私或者商業秘密等重要信息。Python爬蟲,不懂Python可以嗎?不懂HTTP基礎可以嗎?不會基本的抓包工具你能玩通爬蟲嗎?一圖勝前言,我們先來看看python爬蟲都涉及哪些方面的知識:
言歸正傳,有什么好的資料推薦呢?下面說說自己的看法。
1、Python 3網絡爬蟲開發實戰豆瓣評分8.9分,全書以python3為基礎,從基本的開發環境、常用的爬蟲庫開始,對爬蟲過程涉及的基礎知識HTTP、Web基礎、代理進行了介紹,接下來詳細講解python中urllib、requests、正則等基礎庫的用法,并以實例「抓取貓眼電影排行」為例講解。
文中的內容不僅涉及爬蟲過程中代理的處理,驗證碼的識別,模擬登陸過程,更介紹了移動時代下APP數據的爬取,最后介紹了Scrapy框架,分布式爬蟲的原理及部署。
具體內容可見上圖PDF,如果有需要這本書的童鞋,可關注+留言獲取。
2. 爬蟲實戰篇talk is cheap,show me the code!
這里直接推薦Github的開源項目「awesome-python-login-model」,這里就不再貼地址了,大家直接去git上搜索即可。使用python模擬登陸一些大型網站,還有一些簡單的爬蟲。
眼過千遍不如手過一遍,多動手實踐,多多debug,永遠是提升自己編程技能的鐵的定律 !
由于其豐富的第三方框架,python非常適用于進行數據挖掘,利用python進行數據挖掘包括數據處理及算法實現,其中數據處理需要用到numpy、pandas等框架,算法部分可借助scikit-learning或tensorflow實現相關的機器學習或深度學習算法,相關書籍可參考《利用python進行數據分析》、西瓜書、《tensorflow技術解析與實戰》
有不少。畢竟python是一種常用的語言,從業者眾多,面向初學者的書籍也就不少。事實上,現在想要在家自學python也不是件難以做到的事情,只要找到合適的學習順序就可以。
以閱讀來學習python,建議選擇這樣幾本書。
一,《笨辦法學python》。這本書提供了52個例子,涵蓋簡單的python語法和功能,能夠讓讀者初步掌握python。只要嚴格按照這本書中的要求,逐步輸入代碼、檢查、完成課后習題,就能對python產生一個基本了解。這本書在網上能找到免費PDF版本,最新版本是第三版。另有面向python 3的版本。
二,《簡明python教程》。這本書原名為《A Byte of Python》,2005年出版了第一版,被譽為最出色的python教程。在過去的十幾年中,這本書一直不斷改進,現在已經出到了第四版,使用python 3.5。這是一本自由圖書,任何人都可以免費訪問和分享。在gitbook上有譯本,也可以免費下載PDF版本。
三,《Python編程:從入門到實踐》。這是一本商業圖書,可以在各大電商網站上購買。目前最新版本也是面向python3的。
仔細閱讀這幾本書,按部就班地完成案例和課后習題,就可以基本掌握python的基礎知識。至于更多內容,則需要在解決問題的時候去查幫助、查python語言參考、去網上搜索解決方案,或者尋找其他書籍的幫助了。