游客:
注册
|
登录
|
帮助
网友俱乐部
»
网络编程
»
JAVA教程
» 从原理上解决Tomcat中文问题
网友生活网
|
网友学堂
如何获得金币?
诚招斑竹
IP归属地查询 PR查询 收录查询 whois查询
免费超短2级域名,your.jpy.cc
传世私服
|
传奇世界私服
注册亚洲交友中心,找个人来同居吧!
免费存储空间,免费网络硬盘
‹‹ 上一主题
|
下一主题 ››
投票
交易
悬赏
活动
打印
|
推荐
|
订阅
|
收藏
标题:
[基础]
从原理上解决Tomcat中文问题
ljjk5
元帅
UID 46706
精华
1
积分 99426
帖子 49690
威望 554
金币 48489
热心 505
阅读权限 100
注册 2007-2-25
状态 离线
#1
使用道具
发表于 2007-12-30 12:15
资料
个人空间
主页
短消息
加为好友
从原理上解决Tomcat中文问题
很多开源软件都有国际化和本地化的问题,其实国际化本没有那么复杂,只是总有些公司希望通过拒绝国际标准来提高市场占有率,所以也就渐渐导致了现在的情况。很多开源软件首要支持的便是UTF编码,然后才是其他编码。(by gashero)当然也有些不着调的软件首选的是ISO-8859-1编码,甚至是ASCII编码。好了,下面先讲讲编码,因为Tomcat也是一种不着调的软件。 常见的中文编码有GB2312、GBK、GB18030等等,当然没有包括繁体中文,这些编码都是表示编码,而并非是显示编码。现在越来越多的软件,在其核心使用的显示编码或者说处理编码,是Unicode编码。Unicode编码使用2字节表示了世界上几乎所有的文字符号,作软件的内部国际化处理再适合不过了。
只是有些龌龊公司,为了商业目的,对内核的Unicode编码API全部屏蔽,对外只提供本地化编码。(by gashero)比如M$公司在中文软件上就主推GBK编码。
还有一个问题就是用C/C++编写的很老的软件,字符串结束标志是'',而使用Unicode的话,会无故的截断一些字符串。所以UTF-8就应运而生了,这种变长编码既可以减小字符串的体积,也可以防止阶段而传输Unicode编码。
至于传统的英文编码,最常见的就是两种。一是ASCII,这种字符集高位为0,用7位表示数据。另一种是ISO-8859-1,每个字符1字节,用8位表示一个字符。
Tomcat的内置编码就是使用了ISO-8859-1。这也是本文最关键的一句,各种技巧的根本。
由此可知由网页所提交的数据就需要从ISO-8859-1解码,如下是获得提交参数number的例子。
String number=new String(request.getParameter("number").getBytes("ISO-8859-1"),"UTF-8");
这句就成功的实现了从ISO-8859-1向UTF-8编码的转换。
有经验的读者应该遇到过通过<jsp:param>标签传递网页间参数时出错的问题。(by gashero)接收到的字符串只要是无论如何都是一堆问号。其实这也是Tomcat内部编码所导致的。如果可以顺应Tomcat的内部编码就可以传递中文字符串了。
比如一个页面间的内部重定向:
<?xml:namespace prefix = jsp /><jsp:forward page="index.jsp">
<jsp:param name="name" value="<%=new String(" % 中文参数?.getBytes(?UTF-8?),?ISO-8859-1?)>" />
</jsp:forward>
而在目的页面接收参数的时候也需要再次从ISO-8859-1编码转换到UTF-8编码。这样就实现了在页面之间传递中文参数。
网友
ljjk5
签名 - 网友社区
===
[广告]
免费域名(Free Subdomain)
免费空间(Free hosting)
PR查询(Google Pagerank)
投票
交易
悬赏
活动
控制面板首页
编辑个人资料
积分交易
公众用户组
好友列表
个人空间管理
基本概况
流量统计
客户软件
发帖量记录
论坛排行
主题排行
发帖排行
积分排行
在线时间
管理团队
管理统计
当前时区 GMT+8, 现在时间是 2008-10-11 16:00
信产部ICP备案:
京ICP备05066424号
北京市公安局网监备案:1101050648号
Powered by
Discuz!
5.5.0
TOP
清除 Cookies
-
联系我们
-
网友俱乐部
-
Archiver
-
WAP