PHP判断字符集并转码的函数-阿里云开发者社区

PHP判断字符集并转码的函数

2016-05-12 1975

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

原理很简单，因为gb2312/gbk是中文两字节，这两个字节是有取值范围的，而utf-8中汉字是三字节，同样每个字节也有取值范围。而英文不管在何种编码情况下，都是小于128，只占用一个字节（全角除外）。

如果是文件形式的编码检查，还可以直接check utf-8的BOM信息。话不多说，直接上函数，这个函数是用来对字符串进行检查和转码的。

   Java代码  
    
  
<?php  
function safeEncoding($string,$outEncoding ='UTF-8')      
{      
    $encoding = "UTF-8";      
    for($i=0;$i<strlen($string);$i++)      
    {      
        if(ord($string{$i})<128)      
            continue;      
          
        if((ord($string{$i})&224)==224)      
        {      
            //第一个字节判断通过      
            $char = $string{++$i};      
            if((ord($char)&128)==128)      
            {      
                //第二个字节判断通过      
                $char = $string{++$i};      
                if((ord($char)&128)==128)      
                {      
                    $encoding = "UTF-8";      
                    break;      
                }      
            }      
        }      
      
        if((ord($string{$i})&192)==192)      
        {      
            //第一个字节判断通过      
            $char = $string{++$i};      
            if((ord($char)&128)==128)      
            {      
                // 第二个字节判断通过      
                $encoding = "GB2312";      
                break;      
            }      
        }      
    }      
               
    if(strtoupper($encoding) == strtoupper($outEncoding))      
        return $string;      
    else     
        return iconv($encoding,$outEncoding,$string);      
}  
?>  

   Java代码  
    
  
/** 
 * 将未知编码的字符串转换为期望的编码（配置文件中设置的编码） 
 * @param unknown $str 
 * @param string $toEncoding 
 * @return string 
 */  
function convertStr($str, $toEncode = 'utf-8') {  
    $charsetlist = array('ascii', 'gbk', 'gb2312', 'utf-8', 'big5');  
    $strCode = mb_detect_encoding($str, $charsetlist);  
  
    if (strtolower($strCode) != strtolower($toEncode)) {  
        $str = iconv($strCode, $toEncode, $str);  
    }  
  
    return $str;  
}  

PHP判断字符集并转码的函数

热门文章

最新文章

相关课程

相关电子书

相关实验场景