PHP自动判断字符串是gb2312还是utf8编码

简介:

最近开发网站,需要判断用户是搜索什么关键词进来的。功能是实现了,但是遇到一个问题,就是不知道用户用的搜索引擎是什么编码的。因此经常一阵搜索,终于找到下面的解决方案:

//返回: true – 含GB编码 false – 为UTF-8编码

复制代码
function is_gb2312($str)
{
        for($i=0; $i<strlen($str); $i++) {
                $v = ord( $str[$i] );
                if( $v > 127) {
                        if( ($v >= 228) && ($v <= 233) )
                        {
                                if(($i+2) >= (strlen($str)- 1)) return true;  // not enough characters
                                $v1 = ord( $str[$i+1] );
                                $v2 = ord( $str[$i+2] );
                                if( ($v1 >= 128) && ($v1 <=191) && ($v2 >=128) && ($v2 <= 191) ) // utf编码
                                        return false;
                                else
                                        return true;
                        }
                }
        }
        return true;
}


本文转自黄聪博客园博客,原文链接:http://www.cnblogs.com/huangcong/archive/2012/12/15/2818962.html,如需转载请自行联系原作者
相关文章
|
2月前
|
JSON JavaScript PHP
PHP把unicode编码的json字符串转中文
PHP把unicode编码的json字符串转中文
13 0
|
PHP
PHP文件乱码(gb2312保存,但输入utf-8)
问题:文件已经用gb2312保存,但仍然显示乱码。随后,加入仍不行。解决:1、php文件本身的编码与网页的编码应匹配 2、如果欲使用gb2312编码,那么php要输出头:header(“Content-Type: text/html; charset=gb2312"),静态页面添加,所有文件的编码格式为ANSI,可用记事本打开,另存为选择编码为ANSI,覆盖源文件。
965 0