Python是一門極其強大的編程語言,廣泛應用于互聯網領域。利用Python,我們可以輕松地爬取網頁上的數據,比如今天要講的蔡徐坤。
import requests from bs4 import BeautifulSoup url = 'https://baike.baidu.com/item/蔡徐坤/21601515' response = requests.get(url) html = response.text soup = BeautifulSoup(html, 'html.parser') # 找到基本信息表格 table = soup.find('div', attrs={'class': 'basic-info cmn-clearfix'}) # 找到出生日期 trs = table.find_all('tr') for tr in trs: th = tr.find('th') if th: if th.get_text() == '出生日期': print(tr.find('td').get_text()) break
以上代碼使用了requests和BeautifulSoup兩個庫,requests用于發送HTTP請求,獲取網頁源代碼,BeautifulSoup用于解析HTML源代碼,提取需要的信息。在代碼中,我們先從百度百科上獲取蔡徐坤的百科頁面源代碼,然后用BeautifulSoup把HTML代碼轉換成一個Python對象,之后找到基本信息表格,再從表格中找到出生日期信息,最后打印出來。
除了出生日期,我們還可以用類似的方法獲取更多蔡徐坤的信息,比如身高、體重、經紀公司等。不過需要注意的是,爬取信息時需要遵守法律法規,尊重公眾人物的隱私權,不能用于非法用途。