字符編碼之文字是如何顯示的?
字符編碼就是按照某種格式某種規定將字符存儲在計算機中。
字符編碼非常多,每個國家都有自己規定的字符編碼。作為中國人,常用的字符編碼有ASCII、 Unicode、UTF-8、GBK(簡、繁體字融于一庫)、GB2312(簡體中文字符集)、BIG5(繁體中文字符集)。
通俗的說,由于計算機只能存儲“011101”這種二進制數字,所以當我們在電腦上使用文字編輯工具,如記事本輸入文字(或字母)后,計算機會把這些文字中的每個字轉換成對應的一個數字存入磁盤,這個過程稱為“編碼”。當再次使用記事本打開文件后,計算機會把磁盤中的數據轉換成文字顯示,這個過程稱為“解碼”。
舉個例子,假設輸入的文字為“你好”,對應的編碼為“0x5a13 0x89b7”,則再次打開記事本后,軟件讀取到磁盤上的數為“0x5a13”就會顯示成“你”,讀取到磁盤上的數為"0x89b7"就會顯示成"好"。
最常用的編碼方式就是ASCII(美國標準字符編碼),只能編寫英文的26個字母和一些其它字符,如空格編碼值為32。
英文用ASCII碼就夠了,那中文呢?中文數量可是比英文多得多,這時候Unicode碼這位救世主就出現了,中文主要使用其中的UTF-8進行編碼,每個文字的編碼都是獨一無二的。
希望以上的回答對您有用。
上一篇廣東人為什么離不開燒臘
下一篇有哪些奇奇怪怪的冷知識