1. 云栖社区>
  2. 技术文集>
  3. 列表>
  4. 正文

php截取字符串之截取utf8或gbk编码的中英文字符串示例

作者:用户 来源:互联网 时间:2016-03-13 19:24:18

strlen需求编码中文字符php字符串截取php截取字符串全角半角英文字符串截取

php截取字符串之截取utf8或gbk编码的中英文字符串示例 - 摘要: 本文讲的是php截取字符串之截取utf8或gbk编码的中英文字符串示例,  php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求,下面给大家提供一个方法来完成这样的功能 微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角

 php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求,下面给大家提供一个方法来完成这样的功能

微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角字符算2个,半角字符算1个。 php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求。 mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以。 google了下,找到一个discuz中截取各种编码字符的类,改造了下,已经测试通过.其中参数$charset 只支持gbk与utf-8。    代码如下: $a = "s@@你好"; var_dump(strlen_weibo($a,'utf-8'));     结果输出为8,其中字母s计数为1,全角@计数为2,半角@计数为1,两个中文计数为4。源码如下:   代码如下: function strlen_weibo($string, $charset='utf-8') {     $n = $count = 0;     $length = strlen($string);     if (strtolower($charset) == 'utf-8')     {         while ($n < $length)         {             $currentByte = ord($string[$n]);             if ($currentByte == 9 ||                 $currentByte == 10 ||                 (32 <= $currentByte && $currentByte <= 126))             {                 $n++;                 $count++;             } elseif (194 <= $currentByte && $currentByte <= 223)             {                 $n += 2;                 $count += 2;             } elseif (224 <= $currentByte && $currentByte <= 239)             {                 $n += 3;                 $count += 2;             } elseif (240 <= $currentByte && $currentByte <= 247)             {                 $n += 4;                 $count += 2;             } elseif (248 <= $currentByte && $currentByte <= 251)             {                 $n += 5;                 $count += 2;             } elseif ($currentByte == 252 || $currentByte == 253)             {                 $n += 6;                 $count += 2;             } else             {                 $n++;                 $count++;             }             if ($count >= $length)             {                 break;             }         }         return $count;     } else     {         for ($i = 0; $i < $length; $i++)         {             if (ord($string[$i]) > 127)             {                 $i++;                 $count++;             }             $count++;         }         return $count;     } }

以上是云栖社区小编为您精心准备的的内容,在云栖社区的博客、问答、公众号、人物、课程等栏目也有 的相关内容,欢迎继续使用右上角搜索按钮进行搜索strlen , 需求 , 编码 , 中文 , 字符 , php字符串截取 , php截取字符串 , 全角 , 半角 英文字符串截取 php截取中英文字符串、php 中英文混合截取、中英文混合字符串截取、js截取中英文字符串、ios 中英文字符串截取,以便于您获取更多的相关知识。

utf-8-关于PHP截取中英文字符串的几个问题

问题描述 关于PHP截取中英文字符串的几个问题 function substr_len($str, $len, $charset=&#039;utf-8&#039;){ $len = intval($len); if(!is_numeric($len) || $len &lt; 0){ return false; } $str_len = strlen($str); ...

php截取字符串之截取utf8或gbk编码的中英文字符串示例_php实例

微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角字符算2个,半角字符算1个。php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求。mb_strlen 可以根据字符集计算长度,比如utf8的中文计...

php截取字符串之截取utf8或gbk编码的中英文字符串示例

 php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求,下面给大家提供一个方法来完成这样的功能微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角字符算2个,半角字符算1个。php中自带...

UTF-8总结

...---------------- 五.FLASH相关的UTF-8编码问题  FLASH内部对所有字符串,默认都是以UTF-8处理 1.FLASH读文普通本文件(txt,html) 要将文本文件的编码存为UTF-8 点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件...

关于node.js的buffer

...小是固定的,类似于不可变的整数数组。 look god Buffer与字符串之间的转换需要指定明确的编码。 googog fuck Buffer支持的编码: this googog 'ascii'编码,只为7位的ASCII的数据。这个编码方法非常快。 god this 'utf8' 编码,支持Unicode...

前三篇
后三篇