学习了一些编码知识,想对其进行记录并加入一些我的体会
美国信息交换标准代码.
信息科学起源于美国,最初的编码也起源于美国,所以ASCII码里的文字编码只有英文字符
汉字内码扩展规范
在ASCII的基础上扩展了汉字编码,每个字符占2个字节
GB2312 -> GBK(支持繁体) -> GB18030(加入了日文,朝鲜语等)
Unicode 的建立旨在统一编码,在世界上大多数书写系统中表达的文本都被其包含
utf-8 是万维网上的主要编码,在编程时,也大多使用utf-8进行编码
采用变长编码,存储效率比较高,推荐使用
utf-16 为定长编码,固定2个字节,Java中程序内部的编码便为utf-16
utf-32 采用4字节 处理速度较快,但浪费了大量的空间,影响传输速度,较少被使用.
在一些编码中,高低位字节存储顺序不同.
例如, 0XABCD
Big Endian:
0000: AB
0001: CD
Little Endian:
0000: CD
0001: AB
原文:https://www.cnblogs.com/xxrlz/p/10423085.html