正則表達(dá)式是一種強(qiáng)大的文本處理工具,它能夠用較為簡(jiǎn)潔的方式描述并匹配一個(gè)文本中的字符串,而Python中的re模塊則提供了使用正則表達(dá)式操作字符串的方法。
正則表達(dá)式的基本語法中,最基礎(chǔ)的表達(dá)式是“.”,它可以匹配任意一個(gè)字符(除了換行符):
import re s = "abcdefg" pattern = "." match = re.findall(pattern, s) print(match) # 輸出:['a', 'b', 'c', 'd', 'e', 'f', 'g']
另外一個(gè)比較常用的表達(dá)式是“\d”,它可以匹配一個(gè)數(shù)字字符:
s = "123abc456" pattern = "\d" match = re.findall(pattern, s) print(match) # 輸出:['1', '2', '3', '4', '5', '6']
對(duì)于“.”或“\d”這些元字符,我們可以使用“[]”將它們組合成一個(gè)字符集合:
s = "123abc456" pattern = "[\dabc]" match = re.findall(pattern, s) print(match) # 輸出:['1', '2', '3', 'a', 'b', 'c', '4', '5', '6']
另外,“^”可以用來表示取反,即匹配除了指定字符集合以外的字符:
s = "123abc456" pattern = "^[a-z]" match = re.findall(pattern, s) print(match) # 輸出:[]
以上是Python中正則表達(dá)式的基本用法介紹,還有許多高級(jí)的正則表達(dá)式語法及用法可以參考Python官方文檔。