您的位置:网站首页 > Java工具 > 正文

Java开发中常用的编码格式有几种?不知道怎么行

类别:Java工具 日期:2018-12-6 8:11:44 人气: 来源:

  圣艾斯特莱雅

  一般来说在开发过程中很多程序猿都会遇到编码问题,因为Java是跨平台语言,在不同平台之间的编码之间的切换比较多,因此编码问题尤为明显。

  是基于拉丁字母的一套电脑编码系统,总共128个,用1个字节的低7位表示,0~31是控制字符如换行、回车等,32-126是打印字符,可以通过键盘输入。

  这个编码出现的原因是ASCII的128字符不够用,涵盖了大多数西欧语言字符,应用最广泛,不过仍然是单字节编码,总共能表示256个字符。

  是中华人民国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,中国几乎所有的中文系统和国际化的软件都支持GB 2312。

  GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符。

  GB 2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国99.75%的使用频率。但对于人名、古汉语等方面出现的罕用字和繁体字,GB 2312不能处理,因此后来GBK及GB 18030汉字字符集相继出现以解决这些问题。

  汉字内码扩展规范,称GBK,向下完全兼容GB2312-80编码。支持GB2312-80编码不支持的部分中文姓,中文繁体,日文假名,还包括希腊字母以及俄语字母等字母。不过这种编码不支持韩国字,也是其在实际使用中与unicode编码相比欠缺的部分。

  全称:“国家标准GB 18030-2005《信息技术中文编码字符集》”,是中华人民国现时最新的变长度多字节字符集。对GB 2312-1980完全向后兼容,与GBK基本向后兼容;支持GB 13000(Unicode)的所有码位;共收录汉字70,244个。不过在实际应用系统中使用并不广泛。

  具体定义了Unicode(统一码)字符在计算机中的存取方法。UTF-16用两个字节来表示Unicode字符的格式。因为每两个字节表示一个字符,所以比较方便,简化了字符串操作,因此Java以UTF-16作为内存的字符存储格式。

  UTF-8采用了一种变长技术,每个编码区域有不同的字码长度,不同类型的字符可以由1~6个字节组成。

  是一种针对Unicode的可变长度字符编码,也是一种前缀码。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部分修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或发送文字的应用中,优先采用的编码。

  本文由来源于325棋牌 325游戏中心唯一官方网站

关键词:java编码规范
0
0
0
0
0
0
0
0
下一篇:没有资料

网友评论 ()条 查看

姓名: 验证码: 看不清楚,换一个

推荐文章更多

热门图文更多

最新文章更多

关于联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 人才招聘 - 帮助

郑重声明:本站资源来源网络 如果侵犯了你的利益请联系站长删除

CopyRight 2010-2012 技术支持 FXT All Rights Reserved