首页 > 其他 > 详细

计算机字符与编码集

时间:2020-06-14 22:32:45      阅读:35      评论:0      收藏:0      [点我收藏+]

ASCII码

    1. 使用7个bits就可以完全表示ASCII(American Standard Code for Information Interchange)码(包含95个可打印的字符,33个不可打印的字符,比如一些控制字符), 33+95=128=2的7次方。

    技术分享图片

   2. ASCII码很多国家的应用和符号是无法表示的,比如很多数学符号。

    Extended ASCII码 (扩展ASCII码)

    第一次对ASCII码扩充,7bits -> 9bits  128变成256 

    拓展的128多字符

 

字符编码集的国际化
  1.欧洲,中东,东亚,拉丁美洲等国家语言的多样性。
  2.语言体系不一样,并且不以有限字符组合的语言,比如英文每个单子都是由a-z组成的,但是中文除了偏旁,每个字都是独立的。而且以中国,日本,韩国风语言最为复杂。


中文编码集
  GB2312(国标2312): 1980年发明出来的,全称是《信息交换用汉字编码字符集-基本集》,简称国标2312。一共收录了7445个字符。包括了6763个汉字和682个其他符号。
不过GB2312也是有问题的,不符合国际标准,后来又推出了GBK《汉字内码扩展规范》,GBK向下兼容GB2312,向上支持国际ISO标准。收录了21003个汉字,支持全部中日韩字符。

 

Unicode

  GB2312在中国使用是没问题的,但是如果跨国就有问题,比如中国人开发一个中文网站,外国人去访问,如果他们电脑没安装GBK编码或者GB2312,在他们电脑上显示会变成乱码。
所以这里就有了兼容全球的字符集Unicode。

  Unicode:统一码,万国码,单一码。
    Unicode定义了世界通用的符号集,它规定了符号的二进制代码,用UTF-*实现了编码,比如UTF-8,常见的UTF-8以字节为单位对Unicode进行编码。中国Windows系统默认使用GBK,但是编程推荐使用UTF-8。

 

计算机字符与编码集

原文:https://www.cnblogs.com/songgj/p/13127168.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!