Python 是一個非常流行的編程語言,可以使用它來獲取、分析和可視化金融數據。當我們需要分析市場趨勢、企業業績、經濟數據等時,獲取準確的金融數據是非常關鍵的。本文將介紹如何使用 Python 爬取金融數據。
首先,我們需要安裝以下庫來支持網頁抓取和數據解析:
import requests from bs4 import BeautifulSoup import pandas as pd
我們使用requests庫來發送網絡請求,BeautifulSoup庫來解析網頁內容,并使用pandas庫來處理數據。
接下來,我們準備從雅虎財經網站上抓取蘋果公司的股票數據。我們可以使用以下代碼獲取該網頁的 HTML:
url = 'https://finance.yahoo.com/quote/AAPL/history?p=AAPL' response = requests.get(url) html = response.content
現在我們已經獲取了網頁的 HTML,接下來我們使用BeautifulSoup來解析該頁面的表格數據。使用以下代碼:
soup = BeautifulSoup(html, 'html.parser') table = soup.find_all('table')[0] df = pd.read_html(str(table))[0] print(df.head())
我們使用了find_all()方法來查找頁面中的表格元素,并將其傳遞給read_html()函數來進行解析。解析的結果將存儲在 DataFrame 對象中,您可以通過打印前幾行來檢查數據是否成功。
最后,我們可以使用以下代碼將數據保存到 CSV 文件中:
df.to_csv('stock_data.csv', index=False)
感謝您的閱讀,希望本文能夠幫助您更好地利用 Python 爬取金融數據。