Python 是一種功能強大的編程語言,可以用來爬取企查查的數據。企查查是一個全面的商業信息查詢平臺,包括所有公司的基本信息、財務信息、法律信息等等。
import requests from bs4 import BeautifulSoup url = 'https://www.qichacha.com/search?key=****' # 填入具體搜索關鍵詞 headers = {'referer': 'https://www.qichacha.com/index_verify?type=companyview', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299'} # 使用 headers 模擬瀏覽器訪問 res = requests.get(url, headers=headers) res.encoding = 'utf-8' soup = BeautifulSoup(res.text, 'html.parser') for company in soup.select('tbody tr'): name = company.select('a')[1].text.strip() # 公司名 legal_person = company.select('.legalPersonName')[0].text.strip() # 法人代表 reg_capital = company.select('.text-right')[1].text.strip() # 注冊資本 print(name, legal_person, reg_capital) # 輸出公司名、法人代表、注冊資本等信息
以上代碼會輸出所有搜索結果的基礎信息,可以根據實際需求調整代碼和數據類型。
需要注意的是,企查查的反爬蟲機制較為嚴格,需要模擬瀏覽器行為,并需要買相應的企查查 API 來獲取更詳細的商業信息。