欧美一区二区三区,国内熟女精品熟女A片视频小说,日本av网,小鲜肉男男GAY做受XXX网站

python 抓網頁表格

劉姿婷1年前9瀏覽0評論

Python是一種高級編程語言,具有簡單易讀、可擴展性強等特點。在數據分析、大數據處理、機器學習等領域,Python已經成為了非常重要的一部分。本文將介紹使用Python抓取網頁表格的方法。

import requests
from bs4 import BeautifulSoup
url = "http://www.example.com/table.html"
res = requests.get(url)
soup = BeautifulSoup(res.text, 'html.parser')
table = soup.find('table')
# 獲取表頭
thead = table.find('thead')
headers = []
for th in thead.find_all('th'):
headers.append(th.text.strip())
# 獲取數據
tbody = table.find('tbody')
rows = []
for tr in tbody.find_all('tr'):
row = {}
tds = tr.find_all('td')
for i in range(len(headers)):
row[headers[i]] = tds[i].text.strip()
rows.append(row)
# 輸出結果
print(headers)
print(rows)

代碼中使用了requests庫和BeautifulSoup庫。首先使用requests庫請求網頁,然后使用BeautifulSoup庫對網頁進行解析。通過find方法找到表格元素,再分別獲取表頭和數據。最后分別輸出表頭和數據。

使用Python抓取表格數據是一項非常實用的技能。通過學習,可以掌握更多數據處理的方法,進一步提高數據分析和程序開發的能力。