應該學習Python3
很多初學者糾結學 Python2 還是 Python3,Python3 不是趨勢而是現(xiàn)實,盡管不少公司還在用 Python2,但只要主流第三方框架宣布不再支持 Python2,那么 Python2 很快就會被淘汰。況且 Python2 和 Python3 的從使用角度來說區(qū)別只有不到 1%。花一個小時的時間就能區(qū)分兩者的差異。所以不要擔心學 Python3 找不到工作。
一、命令行下使用pydoc命令
在命令行下運行$ pydoc modules即可查看
二、在python交互解釋器中使用help()查看
在交互式解釋器中輸入>>> help("modules")即可,效果跟在命令行下輸入$ pydoc modules是一樣的
三、在python交互是解釋器下導入sys模塊查看
python的sys模塊也是可以用來查看模塊信息的
>>> import sys
>>> sys.modules.keys()
四、命令行下使用pip查看
如果你使用的是pip來作為你的python包管理器的話,可以在命令行下直接運行$ pip freeze或者$ pip list來查看安裝包的信息,當然其它的包管理器也有類似的功能,同時,你也可以在python交互式解釋器中導入pip模塊來查看包信息
pip list#或pip freeze
五、使用yolk來查看
如果你安裝過yolk的話可以使用yolk命令來查看包信息,你可以使用$ pip install yolk來安裝它
yolk使用簡單,只需在命令行下操作即可
若果你是程序員,可以自學,一些程序員常逛的網(wǎng)站就有關于python的詳細教程;
如果你是編程小白,建議找個師傅帶領你,自己再去找些視頻來看,因為python求職一般都是需要項目經驗的,找人帶你可以做做項目。視頻的話,其實,某寶上多的是,建議找一些大一點的教育機構的付費課程,比較系統(tǒng)。
授人以魚不如授人以漁,我介紹一下用Python自動化下載我想要的論文參考文獻格式的方法。其用到的方法和工具同從知網(wǎng)爬取論文數(shù)據(jù)類似,你可以做個參考。
工具:selenium瀏覽器: Chrome引用的庫:為了將每個下載到的文件都能對應正確的文件名,用了多線程來監(jiān)聽下載目錄文件夾,用watchdog一個開源庫來監(jiān)聽下載目錄文件夾,當該文件夾中出現(xiàn)新的文件時,程序自動將該文件進行重命名。
軟件從一個txt文件中讀取出需要下載的文件名稱,然后進行自動化下載。從txt中讀取文件名稱時,用到了正則表達式。
需要下載的文獻在txt中
打開瀏覽器
打開瀏覽器后,需要獲取到頁面的相應操作控件,需要獲取輸入框和搜索按鈕,selenium提供了find_element_by_id函數(shù),可以在界面中找到控件的id即可
同理找到搜索按鈕的id,然后在輸入框中填入需要搜索的文章,觸發(fā)按鈕的click事件。
按照上述思路進行界面自動化操作,進入到想要的下載鏈接按鈕處
現(xiàn)在需要獲取到該鏈接,即圖中的href鏈接既是需要下載的內容鏈接
事實上,下載按鈕有相應的屬性值,只需要通過get_attribute函數(shù)獲取即可。
以上既是自動化下載文獻引用格式的一個過程。爬取知網(wǎng)論文思路類似,完全可以通過Selenium來實現(xiàn)。