unicode 解码

简介:

1,如何把Unicode转化为正常字符呢?

Java代码   收藏代码
  1. /** 
  2.      * 把unicode转化为中文 
  3.      * @param str 
  4.      * @return 
  5.      */  
  6.     public static String unicodeToChinese(String str) {  
  7.         if (IsChineseUtil.isHasChinses2(str))//判断是否有中文字符  
  8.             return str;  
  9.         if (str.indexOf("\\u") == -1 || str == null || "".equals(str.trim())) {/*若不是unicode,则直接返回*/  
  10.             return str.replaceAll("\\\\ "" ");//删掉英文中的\,such as "default\ value1"  
  11.             /* 主要是针对 zk 中的国际化问题 */  
  12.         }  
  13.         StringBuffer sb = new StringBuffer();  
  14.         if(!str.startsWith("\\u")){/*若开头不是unicode,如“abc\u4e2d\u56fd” */  
  15.             int index=str.indexOf("\\u");  
  16.             sb.append(str.substring(0, index));  
  17.             str=str.substring(index);  
  18.         }  
  19.         if (str.endsWith(":")) /*如“\u4e2d\u56fd:” */{  
  20.             str = str.substring(0, str.length() - 1);  
  21.         }  
  22.         String[] chs = str.trim().split("\\\\u");  
  23.           
  24.         for (int i = 0; i < chs.length; i++) {  
  25.             String ch = chs[i].trim();  
  26.             if (ch != null && !"".equals(ch)) {  
  27.                 int length_ch=ch.length();  
  28.                 if(length_ch>4){  
  29.                     length_ch=4;  
  30.                 }//中文的长度是4,英文的长度是2  
  31.                 sb.append((char) Integer.parseInt(ch.substring(0, length_ch), 16));//按照十六进制解析  
  32.                 if (ch.length() > 4) {  
  33.                     sb.append(ch.substring(4));  
  34.                 }  
  35.             }  
  36.         }  
  37.         return sb.toString();  
  38.     }  

应用:

Java代码   收藏代码
  1. selectContent=Conversion.unicodeToChinese(selectContent);  

  

相关文章
|
1月前
|
存储 自然语言处理 C++
Unicode编码
Unicode编码
25 4
|
1月前
|
网络协议
ASCII编码
ASCII编码
22 1
|
6月前
|
JavaScript 数据安全/隐私保护
41 # 编码的问题
41 # 编码的问题
33 0
|
JavaScript 前端开发 Java
Unicode转义(\uXXXX)的编码和解码
  在涉及Web前端开发时, 有时会遇到\uXXXX格式表示的字符, 其中XXXX是16进制数字的字符串表示形式, 在js中这个叫Unicode转义字符, 和\n \r同属于转义字符. 在其他语言中也有类似的, 可能还有其它变形的格式.
2374 0
|
9月前
|
存储 Java 数据安全/隐私保护
什么是编码和解码
什么是编码和解码
195 0
|
JavaScript
编码
编码
68 0
|
iOS开发
Unicode 与 UTF-8 编码的转换
Unicode 与 UTF-8 编码的转换
Unicode 与 UTF-8 编码的转换
数制与编码
十进制整数转换为二进制数 可以将十进制数逐次用2除,取余数,一直到商为0.然后把全部余数按相反的次序排列起来。(除二取余)
255 0
数制与编码
|
机器学习/深度学习 算法 索引
关于Onehot编码的总结
关于Onehot编码的总结
530 0
关于Onehot编码的总结

热门文章

最新文章