在python爬蟲中,我們經(jīng)常需要清理一些文本,其中去除空格是比較常見的操作。下面介紹一些常見的方法。
# 方法一:使用strip()函數(shù)去除首尾的空格 text = ' hello world ' text = text.strip() print(text) # 'hello world' # 方法二:使用replace函數(shù)去除所有空格 text = ' hello world ' text = text.replace(' ', '') print(text) # 'helloworld' # 方法三:使用正則表達(dá)式去除所有空格 import re text = ' hello world ' text = re.sub('\s+', '', text) print(text) # 'helloworld'
除了去除空格,還有一些其他的清理文本的操作,比如去除換行符、HTML標(biāo)簽等等,這些操作也可以使用類似的函數(shù)和正則表達(dá)式來實(shí)現(xiàn)。
下一篇vue中的抽屜