Python獲取上上層文章
在Python中,獲取上上層文章可以通過使用Requests庫和BeautifulSoup庫來實現。首先,我們需要使用Requests庫來獲取文章的HTML代碼,然后使用BeautifulSoup庫來解析HTML代碼。
以下是一個簡單的示例代碼,它可以獲取某個網站上的上上層文章:
```
import requests
from bs4 import BeautifulSoup
url = 'https://www.example.com/article-2/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
# 獲取文章的HTML代碼
response = requests.get(url, headers=headers)
html_doc = response.content
# 使用BeautifulSoup解析HTML代碼
soup = BeautifulSoup(html_doc, 'html.parser')
# 獲取上上層的文章
prev = soup.find_all('a', {'rel': 'prev'})[0]
prev_url = prev['href']
response = requests.get(prev_url, headers=headers)
html_doc = response.content
# 使用BeautifulSoup解析HTML代碼
soup = BeautifulSoup(html_doc, 'html.parser')
# 獲取文章的所有段落
paragraphs = soup.find_all('p')
# 輸出所有段落的內容
for p in paragraphs:
print('
' + str(p.text) + '
') ``` 這個示例代碼會獲取網站上的第二篇文章,然后跟蹤到第一篇文章。最后,它會輸出第一篇文章的所有段落內容(使用``標簽將每個段落圍起來)。 注意,在使用這個示例代碼時,需要將`url`變量設置為正確的文章鏈接,并在`headers`變量中設置適當的請求標頭。
上一篇vue國內的嗎
下一篇python 范圍求交