爬蟲用哪個好?
假如這里你同時有python與java的基礎,而且還挺不錯的(沒錯 是我)。
首推scrapy因為python用起來很舒服。
然后heritrix是比較適合整站直接爬取的框架。
WebCollector比較適合做有精準抽取抽取業務的爬蟲,適合做二次開發。
寫最后 ,就假如你是準備在爬蟲上有所建樹,建議先不用框架吧。這些框架太優秀了,你可能還沒弄懂爬蟲怎么運行的數據就抓下來了。你一定知道的 基礎是很重要
爬蟲用哪個好?
假如這里你同時有python與java的基礎,而且還挺不錯的(沒錯 是我)。
首推scrapy因為python用起來很舒服。
然后heritrix是比較適合整站直接爬取的框架。
WebCollector比較適合做有精準抽取抽取業務的爬蟲,適合做二次開發。
寫最后 ,就假如你是準備在爬蟲上有所建樹,建議先不用框架吧。這些框架太優秀了,你可能還沒弄懂爬蟲怎么運行的數據就抓下來了。你一定知道的 基礎是很重要