JavaScript中的正則表達式是一種強大的文本匹配工具,可以用來匹配各種復雜的文本模式。中文在JavaScript正則表達式中也可以被匹配到,下面我們就來介紹一下如何在JavaScript正則表達式中匹配中文。
JavaScript中使用“\u”轉義字符來表示Unicode字符,中文的Unicode編碼范圍為[U+4E00, U+9FA5],因此 \u4E00表示漢字“一”,\u9FA5表示漢字“龥”,那么我們可以使用正則表達式/[\u4E00-\u9FA5]/來匹配所有的中文字符。例如:
var str = "JavaScript中的正則表達式也可以匹配中文"; var pat = /[\u4E00-\u9FA5]/g; console.log(str.match(pat)); // 返回["中","的","正","則","表","達","式","也","可","以","匹","配","中","文"]
另外,JavaScript中也提供了一個RegExp對象的屬性unicode,可以使正則表達式匹配到Unicode編碼大于\uFFFF的字符(包括Emoji表情等),我們只需要在正則表達式的末尾加上“u”即可,例如:
var str = "這是一個包含Emoji表情的字符串