计算机编码是指计算机在底层通过二进制字节实现各种字符表述的方式。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。在计算机内部,最小的单元是位(bit),而一个字节(byte)由8位二进制数字(0,1)组成,即1 Byte=8 bits 。在计算机存储中1 KB=1024 Byte; 1 MB=1024 KB; 1 GB=1024 MB ; 1TB=1024 GB。
常见的编码类型:
ascii码:不支持中文,一个字符由一个字节构成,即8bit。
gbk码:又称国标码,支持中文,一个字符由两个字节构成,即16bit。
unicode码:又称万国码,支持的语言种类特别多,一个字符由四个字节构成,即32位。
utf-8码:现在计算机中最常用的编码,长度可变。英文是一个字节构成,中文是24个字节构成(解决了gbk码中中文汉字支持数量较少这一弊端)
原文:https://www.cnblogs.com/ajym/p/10945610.html