Python 爬取學校信息
Python 是一種廣泛被使用的編程語言,它有著非常強大的網絡爬蟲能力,可以幫助我們獲取學校信息等相關數據。下面介紹如何使用 Python 爬取學校信息。
import requests from bs4 import BeautifulSoup # 定義爬取頁面的 URL url = "http://www.example.com/school" # 獲取頁面 HTML 內容 html = requests.get(url).content # 使用 BeautifulSoup 解析 HTML 內容 soup = BeautifulSoup(html, "html.parser") # 使用 CSS 選擇器獲取所需信息 title = soup.select("h1.title")[0].text desc = soup.select("div.description")[0].text # 打印獲取的信息 print("學校名稱:", title) print("學校簡介:", desc)
以上代碼使用 requests 庫獲取頁面 HTML 內容,使用 BeautifulSoup 庫解析 HTML 內容,然后使用 CSS 選擇器獲取所需信息,最后打印輸出結果。
該方法可以用于獲取學校名稱、簡介、學院列表等相關信息,方便我們在實際工作中進行數據分析和挖掘。