如今確實(shí)挺多諸如數(shù)據(jù)分析、機(jī)器學(xué)習(xí)的崗位選擇使用python做開發(fā)的多,那么,如果是想從事機(jī)器學(xué)習(xí)開發(fā)的話,該如何起步呢?
一 扎實(shí)python基礎(chǔ)要想把機(jī)器學(xué)習(xí)用起來,就得先掌握python的基礎(chǔ),諸如import、對象等的一些概念和使用要了然于心,否則基礎(chǔ)不扎實(shí)的話,就會面臨很多瑣碎的問題。對于python基礎(chǔ)的掌握,推薦慕課網(wǎng)教程,個人聽過感覺還不錯。 當(dāng)然,書籍方法的話推薦《Python編程 從入門到實(shí)踐》,此書可以充當(dāng)字典,遇到不會的可以多翻翻。
二 熟悉掌握python常用的機(jī)器學(xué)習(xí)包python提供了很多可以很好支出程序進(jìn)行矩陣、線性和統(tǒng)計(jì)等的數(shù)學(xué)運(yùn)算,像大部分機(jī)器學(xué)習(xí)的開發(fā)者都熟悉的Scikit Learn包一樣,里面封裝了很多算法,可以讓我們事半功倍。但也相應(yīng)的需要我們花時間去了解里面包的使用,在這里推薦去官網(wǎng)看(https://scikit-learn.org/stable),里面也提供了很多例子供我們參考和研習(xí)。當(dāng)然,也可以購買相應(yīng)的書籍,這里推薦《機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn和TensorFlow》。此書涵蓋機(jī)器學(xué)習(xí)的基礎(chǔ)理論知識和基本算法——從線性回歸到隨機(jī)森林等,幫助讀者掌握Scikit-Learn的常用方法;探討深度學(xué)習(xí)和常用框架TensorFlow,一步一個腳印地帶領(lǐng)讀者使用TensorFlow搭建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),以及卷積神經(jīng)網(wǎng)絡(luò)。
三 掌握真正的內(nèi)功算法機(jī)器學(xué)習(xí)需要使用的算法是很多的,雖然前輩們已經(jīng)為我們留下了各種包方便我們使用,但真正解決機(jī)器學(xué)習(xí)開發(fā)者級別的,還在于內(nèi)功的深厚,也就是算法。 只有真正的弄懂了算法,在開發(fā)的過程中才能真正的知其然而又知其所以然。 懂得了算法,你才能知道為什么需要這樣做,為什么那樣做會產(chǎn)生那樣的結(jié)果,如何更好的調(diào)參等。 如果沒有算法做鋪墊,很快就會迷失在調(diào)包的迷霧中,很難更近一步的往上。 在這里,推薦你去看吳恩達(dá)機(jī)器學(xué)習(xí)課程,這門課程在網(wǎng)易公開課上也有。 同時,也建議你去看機(jī)器學(xué)習(xí)的入門教材,也就是周志華出的《機(jī)器學(xué)習(xí)》,此書對于新手來說也算是一件寶物。在內(nèi)容上盡可能涵蓋機(jī)器學(xué)習(xí)基礎(chǔ)知識的各方面. 全書共16 章,大致分為3 個部分:此書介紹機(jī)器學(xué)習(xí)的基礎(chǔ)知識;討論了—些經(jīng)典而常用的機(jī)器學(xué)習(xí)方法(決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、貝葉斯分類器、集成學(xué)習(xí)、聚類、降維與度量學(xué)習(xí))后期還涉及特征選擇與稀疏學(xué)習(xí)、計(jì)算學(xué)習(xí)理論、半監(jiān)督學(xué)習(xí)、概率圖模型、規(guī)則學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)等。
學(xué)習(xí)的路上切記浮躁,要一步步的基礎(chǔ)打撈了,才能以不變應(yīng)萬變。
最后祝你早日成為大佬。
簡評:Python 官方有一個推薦書單「
PythonBooks.org
」,這里面涵蓋了從初學(xué)到入門再到精通(并沒有到放棄)的各個階段,最好的學(xué)習(xí)書籍。一:初學(xué)編程,這些書籍適合你(前三名):二:中級 Python 程序員:
掌握語言:
實(shí)踐:
三:相關(guān)書籍四:專項(xiàng)書籍(這個分類太多我就貼機(jī)器學(xué)習(xí)和 AI 了,其他自己看吧)Python 的機(jī)器學(xué)習(xí)和 AI五:有經(jīng)驗(yàn)的程序員學(xué) Python 可以看
記得關(guān)注哦。另外除了書本想要是視頻用來學(xué)習(xí)的,關(guān)注私聊我,發(fā)送“python”就行咯。
推薦書籍:《python編程從入門到實(shí)踐》,需要電子版,可以直接在我主頁私信發(fā)送書名,系統(tǒng)會給你發(fā)云盤鏈接。
看到有位老哥說看書基本上沒什么用,個人覺得,一個作者能寫一本書,也就是說他對這一方面有了一定的系統(tǒng)概括,看完了整本書絕對有很大收獲,關(guān)鍵是怎么看,尤其是看這類技術(shù)書籍,建議先快速整體看一遍,不用每一個地方都要跟著敲代碼,而是明白其能做什么、怎么做,有了大概了解后,后面實(shí)戰(zhàn)了,再一點(diǎn)點(diǎn)內(nèi)化就可以了。
舉個例子:如果你看完上面推薦的書,你就可以對python可以用來做什么以及怎么做有了大概了解,后面你想用python來開發(fā)網(wǎng)站,那么就會想起這本書上面有介紹了可以用django來開發(fā),隨后你可能需要的是去官網(wǎng)看看文檔、看看其他博主寫的博客,就可以自己動手了。
1、Python自身的優(yōu)勢。
Python簡單易學(xué)可讀性強(qiáng),一段好的代碼,閱讀起來像是在讀一篇外語文章,可以使你只關(guān)心完成什么工作任務(wù),而不是糾結(jié)于Python語法。除此之外,它還擁有非常多優(yōu)秀的庫可用于數(shù)據(jù)分析,目前超過125,000的第三方Python庫,對于像pandas,NumPy和matplotlib這樣以數(shù)據(jù)為中心的庫,任何懂Python語法規(guī)則的人都可以操作部署。最重要的是它是免費(fèi)開源的!!
2、Python與其他數(shù)據(jù)分析工具的對比。
(1)Python處理Excel表格,是通過調(diào)用模塊,處理這些數(shù)據(jù)并生成報表。相比Excel,Python能夠處理更大的數(shù)據(jù)集;能夠更容易的實(shí)現(xiàn)自動化分析;能夠比較容易的建立復(fù)雜的機(jī)器學(xué)習(xí)模型。
(2)相比spss,spss是個統(tǒng)計(jì)軟件,只適合在科學(xué)研究領(lǐng)域做實(shí)驗(yàn)數(shù)據(jù)的分析,并不適合做偏向?qū)嶋H應(yīng)用場景的數(shù)據(jù)的分析;而Python能夠處理復(fù)雜的數(shù)據(jù)邏輯,因此在這些場景的使用更有優(yōu)勢。
(3)相比R語言,Python的機(jī)器學(xué)習(xí)庫只有一個sklearn ,所有的機(jī)器學(xué)習(xí)方法都集中在這一個庫中,而R語言,我不清楚它到底有多少個用來做機(jī)器學(xué)習(xí)的庫,R語言中的機(jī)器學(xué)習(xí)方法是如此的分散,以至于很難掌握。而且Python的使用人數(shù)在不斷上升,有一些曾經(jīng)只使用R的人在轉(zhuǎn)向Python,投入到一個呈現(xiàn)上升趨勢的技術(shù)中,未來才會更加寬廣。
(4)相比上述的幾個工具,,Python在做機(jī)器學(xué)習(xí)、網(wǎng)絡(luò)爬蟲、大數(shù)據(jù)分析時更加的得心應(yīng)手。目前很多數(shù)據(jù)科學(xué)方面的應(yīng)用都可以輕松使用Python實(shí)現(xiàn)。包括數(shù)據(jù)搜集,清洗,整理,可視化,機(jī)器學(xué)習(xí),人工智能,開發(fā),運(yùn)維等。所以光一個Python就可以做到全套服務(wù)。
綜合選擇Python做數(shù)據(jù)分析是很好的選擇,可以看一下相關(guān)課程了解一下
http://xue.ujiuye.com/class-95167/