Python是一種流行的編程語言,經常用于數據科學和Web開發。在這種語言中,獲得標簽是非常簡單的。
from bs4 import BeautifulSoup html = '<html><body><p>Hello World</p></body></html>' soup = BeautifulSoup(html, 'html.parser') p_tag = soup.find('p') print(p_tag) # 輸出:<p>Hello World</p>
上述代碼使用BeautifulSoup將HTML代碼解析為樹結構,然后使用“find”方法查找第一個“p”標簽。得到的結果是一個BeautifulSoup對象,它表示樹中的一個元素。
如果您要查找所有的標記,可以使用以下代碼:
from bs4 import BeautifulSoup html = '<html><body><p>Hello World</p><p>Goodbye World</p></body></html>' soup = BeautifulSoup(html, 'html.parser') p_tags = soup.find_all('p') for tag in p_tags: print(tag) # 輸出: # <p>Hello World</p> # <p>Goodbye World</p>
此代碼使用BeautifulSoup的“find_all”方法來查找所有的“p”標簽。返回的結果是一個BeautifulSoup對象列表,其中每個對象表示一個“p”標簽。