Python作為一門高級編程語言,應用廣泛且簡單易學,因此在網絡爬蟲方面也有著廣泛的應用。港交所是全球重要的交易所之一,在金融領域具有重要的地位。而Python對于港交所的數據抓取也十分方便,本文將介紹如何使用Python抓取港交所數據。
#導入需要的包 import requests from bs4 import BeautifulSoup #請求港交所數據 url = 'https://www.hkexnews.hk/sdw/search/searchsdw_c.aspx' data = {'ctl00$txt_today':'', 'ctl00$txt_stock_code':'00005', 'ctl00$txt_stock_name':'', 'ctl00$btn_search':'搜索'} res = requests.post(url, data=data) #解析數據 soup = BeautifulSoup(res.text,'html.parser') table = soup.find('table',{'class':'table table-responsive table-hover searchnoresult'}) rows = table.find_all('tr') #輸出數據 for row in rows: cols = row.find_all('td') cols = [col.text.strip() for col in cols] print(cols)
以上代碼中,我們先導入requests和BeautifulSoup兩個包,requests用來請求URL獲取數據,BeautifulSoup用于解析HTML。然后我們定義了需要請求的URL和提交的數據,再用requests.post()方法來獲取數據。接下來使用BeautifulSoup解析HTML得到表格,再遍歷表格中的每一行數據,輸出每個單元格的內容。這樣就可以實現對港交所數據的抓取了。
下一篇c json 頭文件