如何使用Pandas進行可視化分析?
1.寫什么 自己手上掌握的,工作中經常用到的,從數據源 到 最后可視化 所有一套流程。 2.為什么寫 因為很長一段時間沒有進行總結和梳理了,總感覺很多東西很零散,另一方面,寫寫筆記也是對那些東西的一次鞏固。 3.怎么寫 這個問題其實想了很久,后來想通了,就是怎么把工具都放在手上,結合著用起來,按流程走。 接下來都會這么寫: 1.梳理思路 2.找數據 3.連數據 4.pandas xjb一頓操作 5.可視化 6.總結 找數據: 理由:本人之前從事過金融貸款行業的工作,而且現在國家互聯網金融行業盛行,找些投資借款數據用來練手還是可行的。 備注:僅是部分樣本數據,目的只有一個:練手。 可以這么理解:如果你想練刀工,重點不在于你是切雞肉還是鴨肉,在于你手上的刀玩得溜不溜,不管是雞肉,鴨肉還是鵝肉,切好他們的同時讓你刀工更加進步。 連數據: 我用的是 python + pymysql 方式,還有用pandas讀取excel,csv,txt文件都是ok的。 python連接數據庫有很多人用的是MySQL-python,mysqlclient,peewee或者SQLAlchemy庫,也是ok的。 順便說一下各個庫 MySQL-python:又叫 MySQLdb,是用的比較多的一種驅動,基于C開發的庫,可是它只支持python2.X,而且在windows平臺經常抽風。 mysqlclient:這個據說是django ORM的依賴工具,之后可視化部分我應該也會用到django。 pymysql:這個是純Python實現的,最大的優點就是安裝so easy ,我剛接觸python+mysql時,選擇了這個,所以就一直用這個庫來操作mysql了。 peewee:ORM框架,如果對Django的ORM操作很熟悉的話,這個就so_easy了,但是我覺得很麻煩,哈哈哈。 SQLachemy :這個不錯,既支持原生SQL,也支持ORM,pandas操作中會涉及這個。 pandas xjb一頓操作: 這也是為什么我要寫文章鞏固梳理的地方,數據操作重點就在這里。 可視化操作: 可視化(excel,python可視化庫,在線制圖,以及非常牛逼的highcharts,echarts web交互)。 表比文字好,圖比表好。 人要穿衣服,但是衣服也有漂亮和丑之分,如果目的僅僅是穿衣服,那么隨便穿,只要掩體就行,可視化也是一個道理,圖表有裝逼和不裝逼之分,關鍵看你只是達到目的,還是為了更美觀。