Python 標準庫之一的 re 庫是處理正則表達式的重要工具。在 Python 中,re 庫使得處理字符串中的文本變得更加簡單和高效。正則表達式可以幫助我們在大量文本中搜索和匹配特定模式,如搜索電子郵件地址、電話號碼、等等。
以下是一個簡單的示例程序展示了 re 庫的基本使用方法:
import re # 定義一個要匹配的模式 pattern = r'Hello\s+(\w+)' # 搜索匹配的字符串 string = "Hello, World! Hello, Python!" # 使用 re.search() 方法得到匹配對象 match = re.search(pattern, string) # 判斷匹配是否成功 if match: print("Matched!") # 打印匹配到的字符串 print(match.group()) # 打印正則表達式中的組 print(match.group(1)) else: print("Not matched.")
在上面的代碼中,首先定義了一個要匹配的模式,然后搜索匹配的字符串,在使用 re.search() 方法得到一個匹配的對象 match。然后判斷匹配是否成功,如果匹配成功,輸出匹配到的字符串和正則表達式中的組。
除了上面的搜索匹配方法之外,re 庫還提供了很多其他有用的功能,例如替換字符串中的文本,拆分字符串,以及提取匹配的子字符串。掌握 re 庫的基本用法之后,你可以通過使用正則表達式來處理大量的文本數據,例如使用 re 庫來解析 CSV/TXT 文件、XML、HTML 等數據。