Python可以方便地從URL中提取根域名。根域名指最頂層的域名,例如對于"http://www.google.com"根域名就是"google.com"。
import tldextract url = "http://www.google.com" extracted = tldextract.extract(url) print(extracted.domain + "." + extracted.suffix)
使用tldextract庫可以非常方便地提取根域名。首先引入tldextract庫,然后將URL傳給tldextract.extract函數。這個函數返回一個命名元組,其中包含三個字段:domain,subdomain和suffix。使用domain和suffix字段拼接出根域名即可。
import tldextract url = "http://www.example.co.uk" extracted = tldextract.extract(url) print(extracted.domain + "." + extracted.suffix)
注意,對于一些特殊的域名,例如英國的二級域名,返回的根域名可能是.co.uk而不是.com。因此,在拼接根域名時需要考慮suffix字段。
上一篇html彩色框代碼
下一篇python 描述符類