php 汉字转拼音 [包含20902个基本汉字+5059生僻字]

简介: 原文:php 汉字转拼音 [包含20902个基本汉字+5059生僻字]昨天在转换拼音的时候发现个bug,有好多字都无法转换,不过也不能怪他,毕竟人家的库才8k,应该只有常用的。无奈上网找了下,发现一篇《最全的PHP汉字转拼音函数(共25961字,包含20902个基本汉字+5059生僻字)》 看着都屌,测试后也不错,都能识别,但问题是功能不够,,无奈,自己动手压缩字库(无损压缩),扩展功能。
原文: php 汉字转拼音 [包含20902个基本汉字+5059生僻字]

昨天在转换拼音的时候发现个bug,有好多字都无法转换,不过也不能怪他,毕竟人家的库才8k,应该只有常用的。
无奈上网找了下,发现一篇《最全的PHP汉字转拼音函数(共25961字,包含20902个基本汉字+5059生僻字)

看着都屌,测试后也不错,都能识别,但问题是功能不够,,无奈,自己动手压缩字库(无损压缩),扩展功能。
我用的是他 pinyin.php ~ 206KB 那个UTF8字库,经过压缩扩展后就剩 106K 了。
当然性能也直逼他的,1万次压力测试,他的2.4s,扩展后2.8s,仅仅损耗0.4s,所以可以忽略不计。
无图无真相 (测试环境 CPU:I5-4210M, 内存8G, win8.1, php5.5.12)

好了,展示的差不多了,下面介绍下扩展的功能吧。
原生的只有转换+是否返回首字母功能。
扩展后支持
1. 返回格式 [all:全拼音|first:首字母|one:仅第一字符首字母]
2. 无法识别的字符替换用的占位符 (原版写死的是 _ )
3. 允许的非中文字符 正则控制 (原版写死0-9a-zA-Z, 空格都不支持)

其实看图就都明白了

好了,上链接。

下载: pinyin.zip

目录
相关文章
PHP:overtrue/pinyin 中文转拼音工具
PHP:overtrue/pinyin 中文转拼音工具
230 0
|
PHP Windows
PHP截取汉字乱码问题解决方法之mb_substr函数的应用
PHP截取汉字乱码问题解决方法之mb_substr函数的应用
1371 0
|
PHP Serverless
php中处理汉字字符串长度:strlen和mb_strlen
php中处理汉字字符串长度:strlen和mb_strlen
1867 0
|
PHP
***PHP各种编码的汉字字符串截取
虽然PHP有现成的截取字符串函数substr(),但是这个函数不能对汉字字符串进行截取,要实现这种效果还需要我们自己去编写相应的函数。汉字有多种编码,比如GB2312,UTF-8等,汉字字符串的截取需要区分这种汉字编码,下面是给出的几个解决方案。
789 0