Python是一種功能強(qiáng)大的編程語(yǔ)言,它可以用來(lái)實(shí)現(xiàn)各種不同的任務(wù),包括爬取源代碼。在這篇文章中,我們將介紹如何使用Python爬取網(wǎng)站的源代碼。
import requests # 定義要爬取的網(wǎng)址 url = 'https://www.baidu.com' # 發(fā)送HTTP請(qǐng)求 response = requests.get(url) # 輸出網(wǎng)頁(yè)源代碼 print(response.text)
在上面的代碼示例中,我們先定義了要爬取的網(wǎng)址(這里我們選擇百度),然后使用Python的requests庫(kù)發(fā)送HTTP請(qǐng)求,并將返回的響應(yīng)存在response變量中。使用response.text可以獲取到網(wǎng)頁(yè)的源代碼,最后將源代碼輸出。
當(dāng)然,這只是一個(gè)簡(jiǎn)單的示例,如果要爬取更多的網(wǎng)頁(yè)源代碼,需要使用循環(huán)語(yǔ)句和其他方法。同時(shí),你也需要注意法律和倫理問(wèn)題,確保你的爬蟲(chóng)程序不會(huì)侵犯任何人的權(quán)利。