匹配度是指兩個文本中相同的部分的比例。在自然語言處理中,我們經(jīng)常需要求兩個文本之間的匹配度。Python自帶了字符串匹配的函數(shù),可以方便地實現(xiàn)這一功能。
text1 = "Hello, world!" text2 = "Hello, Python!" match = 0 for char1, char2 in zip(text1, text2): if char1 == char2: match += 1 match_percent = match / len(text1) print("匹配度為:", match_percent)
上面的代碼使用了zip函數(shù),將兩個文本按照字符一一對應(yīng),并通過for循環(huán)來判斷是否相等。最后,通過除以text1的長度來得出匹配度。運行代碼,輸出結(jié)果為:
匹配度為: 0.6923076923076923
這說明兩個文本中,有69%的部分是相同的。這個方法也可以用于比較兩個句子的相似度,只需要將文本改成句子即可。