java

位置:IT落伍者 >> java >> 浏览文章

Java中文相关技术


发布日期:2020年12月09日
 
Java中文相关技术

在应用开发的过程中总会遇到一些难以理解的系统缺陷和不易解决的问题其实通过认真分析不必购买昂贵的产品依然可以解决多数问题

■JDBC ODBC Bridge的Bug及其解决方法

在编写一数据库管理程序时发现JDBCODBC Bridge存在不易发现的Bug在向数据表插入数据时如果为英文字符存储内容完全正确如果存入中文字符部分数据库只能存储前七八个中文字符其他内容被截去导致存储内容的不完整(有些数据库不存在这个问题如Sybase SQL Anywhere JDBCODBC Bridge还存在无法建表的Bug)

对于广大需要存储中文信息的Java程序员来说这可是一个不好的消息要么改用其他语言编程要么选择其他价格昂贵的数据库产品一次编写到处运行的目标也大打折扣能不能采用变通的方法将中文信息进行处理后再存储来解决这个问题呢?答案是肯定的

解决问题的具体思路方法

Java采用Unicode码编码方式中英文字符均采用bit存储既然存储英文信息是正确的根据一定规则将中文信息转换成英文信息后存储自然不会出现截尾现象读取信息时再进行逆向操作将英文信息还原成中文信息即可由GB编码规则可知汉字一般为二个高位为的ASCII码在转换时将一个汉字的二个高位去掉还原时再将二个高位加上为了处理含有英文字符的中文字串对英文字符则需要加上一个Byte 标记以下提供的两个公用静态方法可加入任何一个类中使用

将中英文字串转换成纯英文字串

public static String toTureAsciiStr(String str){

StringBuffer sb = new StringBuffer();

byte[] bt = strgetBytes();

for(int i = i〈btelse{//是英文字符 补作记录

sbappend((char));

sbappend((char)bt[i]);

}

}

return sbtoString();

}

将经转换的字串还原

public static String unToTrueAsciiStr(String str){

byte[] bt = strgetBytes();

int il=length = btlengthj=;

for(i = ;i〈length;i++){

if(bt[i] == ){

l++;

}

}

byte []bt = new byte[lengthl];

for(i = i〈length;i++){

if(bt[i] == ){

i++;

bt[j] = bt[i];

}else{

bt[j] = (byte)(bt[i]|x);

}

j++;

}

String tt = new String(bt);

return tt;

}

上例在实际编程中效果很好只是存储的中文信息需要经过同样处理才能被其他系统使用而且如果中文字串出现英文字符实际上增加了额外的存储空间

■Solaris下Servlet编程的中文问题及解决办法

在使用Java开发Internet上的一个应用系统时发现在Windows下调试完全正常的Servlet上传到Solaris 服务器上运行却出现故障——返回的网页不能显示中文应为中文的信息全为乱码用中文信息做关键字不能正确检索数据库后来采用加入检查代码等方法探知故障原因如下

显示乱码主要是因为通过类 HttpServletResponse提供的方法setContentType 无法改变返回给客户的数据的编码方式正确的编码方式应为GB或者GBK而事实上为缺省的ISO无法检索中文信息则是因为客户提交的中文信息经浏览器编码到达服务器后Servlet无法将其正确解码

举例说明显示乱码解决方法

Servlet 一般通常做法如下

public class ZldTestServlet extends HttpServlet {

public void doGet (HttpServletRequest requestHttpServletResponse response)throws ServletException IOException{

//在使用 Writer向浏览器返回数据前设置 contenttype header 在这里设置相应的字符集gb

responsesetContentType(text/html;charset=gb);

PrintWriter out = responsegetWriter(); //*

// 正式返回数据

outprintln(〈html〉〈head〉〈title〉Servlet test〈/title〉〈/head〉 );

outprintln(这是一个测试页!);

outprintln(〈/body〉〈/html〉);

outclose();

}

}

解决页面显示乱码问题需将*处代码换成如下内容

PrintWriter out = new PrintWriter(new OutputStreamWriter(responsegetOutputStream()gb));

Solaris中文信息检索问题的解决

浏览器利用表单向服务器提交信息时一般采用xwwwformurlencoded 的MIME格式对数据进行编码如果使用get方法参数名称和参数值经编码后附加在URL后在Java中称作查询串(query string)

在Servlet程序中如果采用ServletRequest的方法getParameter取得参数值在Solaris环境下对汉字却不能正确解码因而无法正确检索数据库

在Java 的包——中提供了URLEncode和URLDecode类类URLEncode提供了按xwwwformurlencoded格式对给定串进行转换的方法类URLEncode则提供了逆方法               

上一篇:用JavaMail写简易电子邮件发送系统

下一篇:用Javamail写的解析MimeMessage的程序