眾所周知,Python是一種強大的編程語言,它擁有眾多的第三方庫和工具,其中一個非常有用的庫就是爬蟲庫,可以從互聯網上抓取各種信息。下面就來介紹一下如何使用Python爬蟲在網頁上爬取圖片。
import urllib.request
from bs4 import BeautifulSoup
# 定義一個爬蟲函數,用于從網頁上抓取圖片
def crawl_img(url):
# 打開網頁
html = urllib.request.urlopen(url).read()
# 解析網頁
soup = BeautifulSoup(html, 'html.parser')
# 找到所有的img標簽
img_tags = soup.find_all('img')
# 遍歷所有的img標簽
for img in img_tags:
try:
img_url = img['src']
# 下載圖片
img_name = img_url.split('/')[-1]
urllib.request.urlretrieve(img_url, img_name)
print('下載成功:%s' % (img_name))
except:
print('下載失敗:%s' % (img_url))
# 調用爬蟲函數
crawl_img('https://www.google.com/')
以上代碼使用了Python標準庫中的urllib.request來打開網頁和下載圖片,同時也使用了第三方庫BeautifulSoup來解析網頁。使用這些工具可以輕松地爬取網頁上的圖片,代碼概述如下:
- 打開網頁
- 解析網頁
- 找到所有的img標簽
- 遍歷所有的img標簽
- 下載圖片
使用Python爬蟲在網頁上爬取圖片是一個非常有用的功能,無論是從網絡上抓取頭像,還是在網頁上搜索圖片資源,都可以使用這種方式輕松實現。
上一篇vue dist文件
下一篇vue單個頁面打包