欧美一区二区三区,国内熟女精品熟女A片视频小说,日本av网,小鲜肉男男GAY做受XXX网站

python 表情包爬取

李中冰1年前8瀏覽0評論

最近,關于表情包的爬取問題開始引起廣泛關注。

Python作為一種高效的編程語言,在表情包爬取方面也有著廣泛的應用。下面就帶大家一起看一下Python爬取表情包的實現方法。

import requests
from lxml import etree
url = 'https://www.doutula.com/photo/list/?page={}'
urls = [url.format(i) for i in range(1, 3)]  # 爬取前兩頁
headers = {
'Referer': 'https://www.doutula.com/',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
for url in urls:
response = requests.get(url, headers=headers)
html = etree.HTML(response.text)
imgs = html.xpath('//img[@class="img-responsive lazy image_dta"]')
for img in imgs:
img_url = img.get('data-original')
alt = img.get('alt')
alt = alt.encode('utf-8').decode('unicode_escape')  # 對中文解碼
with open('doutula/{}.jpg'.format(alt), 'wb') as f:
f.write(requests.get(img_url).content)

通過requests庫實現請求,然后使用lxml庫解析html,獲取到表情包的鏈接和名稱。最后使用requests庫將圖片下載到本地,實現表情包爬取。

這是一個簡單的表情包爬取實現,大家可以根據自己的需求進行適當調整,實現更完善的爬取功能。