Java語言中,一個漢字占據(jù)兩個字節(jié),占據(jù)的字節(jié)分為高位和低位。高位和低位的作用如下:
高位:用來存儲漢字的區(qū)碼,即漢字在漢字編碼表中的起始位置。
低位:用來存儲漢字的位碼,即漢字在其所在區(qū)的位置。
/** * 檢驗漢字的高位和低位 * * @param c 待檢驗字符 * @return true表示為漢字;false表示為非漢字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) { // 漢字 return true; } else { // 非漢字 return false; } }
以上是檢驗漢字高位和低位的Java代碼。調(diào)用isChinese(char c)方法,傳入待檢驗字符,即可判斷該字符是否為漢字。