Java字符集编码与转码

简介:
Java字符的class代码总是Unicode字符集的UTF-16编码,运行时内存中的字符串在没有指定编码的时候也总是Unicode编码。
 
Java编译时候,会将java文件的编码按照指定编码或者(系统默认的)编码转换为Unicode并加载到内存中进行编译。
 
下面给出一个Java转码工具,没有测试过,呵呵:
 
package lavasoft.common; 

import org.apache.commons.logging.Log; 
import org.apache.commons.logging.LogFactory; 

import java.io.*; 

/** 
* 转码工具,全面支持文件、字符串的转码 

* @author Administrator 2009-11-29 16:14:21 
*/
 
public  class EncodingToolkit { 
         private  static Log log = LogFactory.getLog(EncodingToolkit. class); 

         public  static  void main(String[] args) { 
                String han =  "汉"


                System.out.println( "---------"); 
        } 

         /** 
         * 对字符串重新编码 
         * 
         * @param text                字符串 
         * @param resEncoding 源编码 
         * @param newEncoding 新编码 
         * @return 重新编码后的字符串 
         */
 
         public  static String reEncoding(String text, String resEncoding, String newEncoding) { 
                String rs =  null
                 try { 
                        rs =  new String(text.getBytes(resEncoding), newEncoding); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码"); 
                         throw  new RuntimeException(e); 
                } 
                 return rs; 
        } 

         /** 
         * 重新编码Unicode字符串 
         * 
         * @param text                源字符串 
         * @param newEncoding 新的编码 
         * @return 指定编码的字符串 
         */
 
         public  static String reEncoding(String text, String newEncoding) { 
                String rs =  null
                 try { 
                        rs =  new String(text.getBytes(), newEncoding); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码" + newEncoding); 
                         throw  new RuntimeException(e); 
                } 
                 return rs; 
        } 

         /** 
         * 文本文件重新编码 
         * 
         * @param resFile         源文件 
         * @param resEncoding 源文件编码 
         * @param distFile        目标文件 
         * @param newEncoding 目标文件编码 
         * @return 转码成功时候返回ture,否则false 
         */
 
         public  static  boolean reEncoding(File resFile, String resEncoding, File distFile, String newEncoding) { 
                 boolean flag =  true
                InputStreamReader reader =  null
                OutputStreamWriter writer =  null
                 try { 
                        reader =  new InputStreamReader( new FileInputStream(resFile), resEncoding); 
                        writer =  new OutputStreamWriter( new FileOutputStream(distFile), newEncoding); 
                         char buf[] =  new  char[1024 * 64];          //字符缓冲区 
                         int len; 
                         while ((len = reader.read(buf)) != -1) { 
                                writer.write(buf, 0, len); 
                        } 
                        writer.flush(); 
                        writer.close(); 
                        reader.close(); 
                }  catch (FileNotFoundException e) { 
                        flag =  false
                        log.error( "没有找到文件,转码发生异常!"); 
                         throw  new RuntimeException(e); 
                }  catch (IOException e) { 
                        flag =  false
                        log.error( "读取文件为一个内存字符串失败,失败原因是读取文件异常!"); 
                         throw  new RuntimeException(e); 
                }  finally { 
                         if (reader !=  nulltry { 
                                reader.close(); 
                        }  catch (IOException e) { 
                                flag =  false
                                 throw  new RuntimeException(e); 
                        }  finally { 
                                 if (writer !=  nulltry { 
                                        writer.close(); 
                                }  catch (IOException e) { 
                                        flag =  false
                                         throw  new RuntimeException(e); 
                                } 
                        } 
                } 
                 return flag; 
        } 

         /** 
         * 读取文件为一个Unicode编码的内存字符串,保持文件原有的换行格式 
         * 
         * @param resFile    源文件对象 
         * @param encoding 文件字符集编码 
         * @return 文件内容的Unicode字符串 
         */
 
         public  static String file2String(File resFile, String encoding) { 
                StringBuffer sb =  new StringBuffer(); 
                 try { 
                        LineNumberReader reader =  new LineNumberReader( new BufferedReader( new InputStreamReader( new FileInputStream(resFile), encoding))); 
                        String line; 
                         while ((line = reader.readLine()) !=  null) { 
                                sb.append(line).append(System.getProperty( "line.separator")); 
                        } 
                        reader.close(); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码" + encoding); 
                         throw  new RuntimeException(e); 
                }  catch (FileNotFoundException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因所给的文件" + resFile +  "不存在!"); 
                         throw  new RuntimeException(e); 
                }  catch (IOException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是读取文件异常!"); 
                         throw  new RuntimeException(e); 
                } 
                 return sb.toString(); 
        } 

         /** 
         * 使用指定编码读取输入流为一个内存Unicode字符串,保持文件原有的换行格式 
         * 
         * @param in             输入流 
         * @param encoding 构建字符流时候使用的字符编码 
         * @return Unicode字符串 
         */
 
         public  static String stream2String(InputStream in, String encoding) { 
                StringBuffer sb =  new StringBuffer(); 
                LineNumberReader reader =  null
                 try { 
                        reader =  new LineNumberReader( new BufferedReader( new InputStreamReader(in, encoding))); 
                        String line; 
                         while ((line = reader.readLine()) !=  null) { 
                                sb.append(line).append(System.getProperty( "line.separator")); 
                        } 
                        reader.close(); 
                        in.close(); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码" + encoding); 
                         throw  new RuntimeException(e); 
                }  catch (IOException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是读取文件异常!"); 
                         throw  new RuntimeException(e); 
                }  finally { 
                         if (in !=  nulltry { 
                                in.close(); 
                        }  catch (IOException e) { 
                                log.error( "关闭输入流发生异常!", e); 
                                 throw  new RuntimeException(e); 
                        } 
                } 
                 return sb.toString(); 
        } 

         /** 
         * 字符串保存为制定编码的文本文件 
         * 
         * @param text         字符串 
         * @param distFile 目标文件 
         * @param encoding 目标文件的编码 
         * @return 转换成功时候返回ture,否则false 
         */
 
         public  static  boolean string2TextFile(String text, File distFile, String encoding) { 
                 boolean flag =  true
                 if (!distFile.getParentFile().exists()) distFile.getParentFile().mkdirs(); 
                OutputStreamWriter writer =  null
                 try { 
                        writer =  new OutputStreamWriter( new FileOutputStream(distFile), encoding); 
                        writer.write(text); 
                        writer.close(); 
                }  catch (IOException e) { 
                        flag =  false
                        log.error( "将字符串写入文件发生异常!"); 
                         throw  new RuntimeException(e); 
                }  finally { 
                         if (writer !=  nulltry { 
                                writer.close(); 
                        }  catch (IOException e) { 
                                log.error( "关闭输出流发生异常!", e); 
                                 throw  new RuntimeException(e); 
                        } 
                } 
                 return flag; 
        } 
}
 


本文转自 leizhimin 51CTO博客,原文链接:http://blog.51cto.com/lavasoft/236392,如需转载请自行联系原作者
相关文章
|
1月前
|
Oracle Java 关系型数据库
【问题】Cause: java.sql.SQLException: 不支持的字符集 (在类路径中添加 orai18n.jar): ZHS16GBK
【问题】Cause: java.sql.SQLException: 不支持的字符集 (在类路径中添加 orai18n.jar): ZHS16GBK
|
7月前
|
编解码 Java
Java原生图片Base64转码与Base64解码
Java原生图片Base64转码与Base64解码
|
10月前
|
编解码 Java 对象存储
【java】对URL中的中文和符号进行UrlEncode转码
【java】对URL中的中文和符号进行UrlEncode转码
318 0
|
10月前
java202303java学习笔记第三十五天IO流中unicode字符集1
java202303java学习笔记第三十五天IO流中unicode字符集1
44 0
|
10月前
java202303java学习笔记第三十五天IO流中unicode字符集1
java202303java学习笔记第三十五天IO流中unicode字符集1
37 0
|
11月前
|
Oracle Java 关系型数据库
Java操作oracle数据库提示:不支持的字符集 (在类路径中添加 orai18n.jar): ZHS16GBK,问题处理
Java操作oracle数据库提示:不支持的字符集 (在类路径中添加 orai18n.jar): ZHS16GBK,问题处理
616 0
|
存储 Java
Java字符集编码解码详细介绍
字符集的基本认识 字符集基础知识
Java字符集编码解码详细介绍
java Nio (五)字符集:CharSet
java Nio (五)字符集:CharSet
|
存储 Java Windows
java字符集(编码与解码)--计算机翻译官
计算机底层是不能直接存储字符的,只能通过一串的0和1去储存,这些0和1组合起来的就是字符集。
95 0
|
编解码 Java
JAVA调用FFMpeg进行转码等操作
JAVA调用FFMpeg进行转码等操作
269 0