一、查看相應的js代碼,用python獲取原始數據之后,模仿js編寫相應的python代碼。
二、通過接口api獲得數據,直接使用python獲取接口數據并處理。
三。終極方法。使用Selenium和PhantomJS執行網頁js代碼,然后再獲取數據,這種方法100%可以獲取數據,確定就是速度太慢。
方式大體有那么幾種,比如phantomjs,webkit,selenium等。如果對抓取的性能沒有什么要求的話,嘗試一下selenium或者watir吧.web自動化測試腳本用好了可以做很多事情.利用你的瀏覽器執行好js,然后再從dom里面取數據.另外一個情況,如果你知道js是通過ajax或者api取數據的,直接去抓數據源,得到的不是json就是xml,然后處理數據吧
方式大體有那么幾種,比如phantomjs,webkit,selenium等。如果對抓取的性能沒有什么要求的話,嘗試一下selenium或者watir吧.web自動化測試腳本用好了可以做很多事情.利用你的瀏覽器執行好js,然后再從dom里面取數據.另外一個情況,如果你知道js是通過ajax或者api取數據的,直接去抓數據源,得到的不是json就是xml,然后處理數據吧