JSP/Servlet中的汉字编码问题
日期:2007年7月8日 作者: 查看:[大字体 中字体 小字体]-
网上就 JSP/Servlet 中 DBCS 字符编码问题有许多优秀的文章和讨论,本文对它们作一些整理,并结合 IBM WebSphere Application Server 3.5(WAS)的解决方法作一些说明,希望它不是多余的。
内容:问题的起源
GB2312-80,GBK,GB18030-2000 汉字字符集及 Encoding
中文转码时´?´、乱码的由来
JSP/Servlet 汉字编码问题及在 WAS 中的解决办法
结束语
参考文章
1. 问题的起源
每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII码, 中国的 GB2312-80,日本的 JIS 等,作为该国家/区域内信息处理的基础,有着统一编码的重要作用。字符编码集按长度分为 SBCS(单字节字符集),DBCS(双字节字符集)两大类。早期的软件(尤其是操作系统),为了解决本地字符信息的计算机处理,出现了各种本地化版本(L10N),为了区分,引进了 LANG, Codepage 等概念。但是由于各个本地字符集代码范围重叠,相互间信息交换困难;软件各个本地化版本独立维护成本较高。因此有必要将本地化工作中的共性抽取出来,作一致处理,将特别的本地化处理内容降低到最少。这也就是所谓的国际化(I18N)。各种语言信息被进一步规范为 Locale 信息。处理的底层字符集变成了几乎包含了所有字形的 Unicode。
现在大部分具有国际化特征的软件核心字符处理都是以 Unicode 为基础的,在软件运行时根据当时的 Locale/Lang/Codepage 设置确定相应的本地字符编码设置,并依此处理本地字符。在处理过程中需要实现 Unicode 和本地字符集的相互转换,甚或以 Unicode 为中间的两个不同本地字符集的相互转换。这种方式在网络环境下被进一步延伸,任何网络两端的字符信息也需要根据字符集的设置转换成可接受的内容。
Java 语言内部是用 Unicode 表示字符的,遵守 Unicode V2.0。Java 程序无论是从/往文件系统以字符流读/写文件,还是往 URL 连接写 HTML 信息,或从 URL 连接读取参数值,都会有字符编码的转换。这样做虽然增加了编程的复杂度,容易引起混淆,但却是符合国际化的思想的。
从理论上来说,这些根据字符集设置而进行的字符转换不应该产生太多问题。而事实是由于应用程序的实际运行环境不同,Unicode 和各个本地字符集的补充、完善,以及系统或应用程序实现的不规范,转码时出现的问题时时困扰着程序员和用户。
2. GB2312-80,GBK,GB18030-2000 汉字字符集及 Encoding
其实解决 JAVA 程序中的汉字编码问题的方法往往很简单,但理解其背后的原因,定位问题,还需要了解现有的汉字编码和编码转换。GB2312-80 是在国内计算机汉字信息技术发展初始阶段制定的,其中包含了大部分常用的一、二级汉字,和 9 区的符号。该字符集是几乎所有的中文系统和国际化的软件都支持的中文字符集,这也是最基本的中文字符集。其编码范围是高位0xa1-0xfe,低位也是 0xa1-0xfe;汉字从 0xb0a1 开始,结束于 0xf7fe;
GBK 是 GB2312-80 的扩展,是向上兼容的。它包含了 20902 个汉字,其编码范围是 0x8140-0xfefe,剔除高位 0x80 的字位。其所有字符都可以一对一映射到 Unicode 2.0,也就是说 JAVA 实际上提供了 GBK 字符集的支持。这是现阶段 Windows 和其它一些中文操作系统的缺省字符集,但并不是所有的国际化软件都支持该字符集,感觉是他们并不完全知道 GBK 是怎么回事。值得注意的是它不是国家标准,而只是规范。随着 GB18030-2000国标的发布,它将在不久的将来完成它的历史使命。
GB18030-2000(GBK2K) 在 GBK 的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。GBK2K 从根本上解决了字位不够,字形不足的问题。它有几个特点, - [1] [2] [3] [4] [5] 下一页
-
- JSP/Servlet中的汉字编码问题 相关文章:
- ·JSP/Servlet中的汉字编码问题
- JSP/Servlet中的汉字编码问题 相关软件
- 特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作
- 者.文章版权归文章原始作者所有.对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转
- 载的文章有版权问题请联系编辑人员,我们尽快予以更正. 转载请注明来源:http://www.hackhome.com
上一篇:J2EE面试题集锦(附答案)
下一篇:推荐:JSP实用技巧大全
精品推荐
热点TOP10
- ·目前最好的JSP分页技术
- ·JSP表达式语言
- ·Struts下JSP页面传递复选框值技巧
- ·JSP Struts之HTML标签库详解
- ·实例:JSP中把动态页面转换为静态页面
- ·JSP实现文件上传
- ·jsp 内嵌网页内容--iframe
- ·jsp 自定义分页标签
- ·jsp,html 清除页面缓存
- ·jsp搜索引擎
- ·在JSP中用bean封装常用的功能
- ·用 jsp:include 控制动态内容
- ·JSP和Servlet对中文的处理过程
- ·JSP自定义标签由浅到深详细讲解
- ·对于JSP中表单数据存储的一种通用方法
- ·加快JDBC中JSP数据库的访问速度
- ·JSP调用SQL server 2000存储过程
- ·用ASP将数据库中的数据直接导出到EXCEL表中
- ·使用技巧:JSP中如何发送一个动态图像
- ·解决JSP中使用request乱码问题
特别推荐
- ·新手入门:学习JSP的经典的入门学习资料
- ·由浅入深学习动态网页制作PHP的编程与应用
- ·输入汉字自动转为拼音(jsp实现方式)
- ·经验分享 JSP程序员完全蜕变手册
- ·JSP实战:JBuilder2005中创建数据库表
- ·新手入门:JSP基本语法与简单表单处理
- ·使用技巧:在JSP页面中的应用JavaBean
- ·实例:JSP中把动态页面转换为静态页面
- ·使JSP/Servlet应用程序优化的八种方法
- ·提升JSP页面响应速度的七大秘籍绝招
- ·jsp中文问题解决方案(完整版)
- ·jsp的八个隐含对象
- ·用jsp实现SQLServe数据库的备份和恢复
- ·深入浅析JSP安全编程实例
- ·jsp防盗链
- ·js技巧收集(200多个)
- ·JSP应用语法详解大全 (3)
- ·实例讲解:全程追踪入侵JSP网站服务器
- ·Apache服务器之JSP概述篇
- ·新手入门经典:Jsp环境配置
