首页 > 编程语言 > 详细

java 编解码

时间:2018-09-22 13:31:55      阅读:160      评论:0      收藏:0      [点我收藏+]

decoder:解码--> 将文件内容转换为字符对象;

encoder:编码-->将字符对象转换为字节或者字节数组;

 

ASCII  (American Standard for Information Tnterchange )  使用7 bit 表示一个字符,共计表示128字符

ISO-8859-1 :八bit 表示一个字符 ,即用一个字节表示一个字符 ,表示256个字符

gb2312:  中华人民共和国制定, 两个字节表示一个汉字,没有考虑生僻字,表示汉字不全(中国制定)

gbk :  gb2312 扩展,表示汉字数量超过gb2312(中国制定)

gb18030  :对gbk 扩展;(中国制定)

big5 :繁体中文

unicode :表示全世界的所有字符,统一的采用两个字节表示一个字符; 问题出现:存储容量问题出现,原来一个字节表示的字符,现在用两个,容量堪忧

      UTF(unicode Transiation Format 即unicode 转换格式),是一种存储格式

 

    unicode 是一个编码方式,而UTF 是存储方式,UTF-8 是unicode的实现方式之一

UTF-8 :变长的字节表示形式,意思就是,一个英文我就占用1个字节,汉字就三个字节方式存储

    

java 编解码

原文:https://www.cnblogs.com/iscys/p/9689676.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!