深蓝词库转换1.2版本发布——支持紫光拼音和拼音加加

简介:

之前推出了深蓝词库转换工具,受到大家的欢迎,有朋友陆陆续续来信,希望增加一些实用的功能,于是乎今天深蓝词库转换1.2推出。该版本主要实现了3个新功能:

1.支持紫光拼音输入法的词库导入导出。

紫光拼音这个就不用我介绍了吧,当年搜狗拼音还没有推出之时,紫光拼音是我见过的最好用的拼音输入法了。现在紫光输入法还在不断推出新版本,同时也支持了词库的导入导出。如果想从搜狗输入法或者QQ输入法转换到紫光输入法,或者想回味一下紫光输入法,那么我想深蓝词库转换1.2的这个新功能应该能够让不少同学受益。

以搜狗细胞词库转紫光输入法为例,选择一个下载的细胞词库,然后在目标中选择紫光输入法即可,如图:

image

然后在紫光拼音中导入用户词库便可,如图:

image

【注意:紫光拼音在导入词库时对单词的检查比较严格,所以有可能会提示出现错误,单击“是”按钮继续导入即可。成功导入的数量可能比细胞词库的条数少一点点。】

2.支持拼音加加的词库导入导出。

拼音加加输入法也是一个很有历史的输入法了,当年和紫光拼音不分伯仲,现在应该还是有不少用户。如果拼音加加的用户想试一试其他输入法或者想扩大自己的词库,那么这个功能一定对您有帮助。(貌似加加输入法很久很久没有更新过了o(╯□╰)o,其用户是不是该考虑下其他输入法了?)

加加输入法的词库导出的格式与一般的输入法不同,他不标准拼音,只有是多音字的时候才只对多音字注音。我下载了加加输入法然后输入了一下词,接下来就是在拼音加加输入法的词库及自定义管理中选择“其他”选项卡中的“导出用户词库”,可以将词库导出为txt文件。如下是导出的拼音加加词库内容:

曾ceng经的de事情
大da尉wei
检查cha一下
深蓝
我的de音乐yue
我的de快乐le
西安
尉yu迟琳嘉
查zha京
曾zeng毅

然后用深蓝词库转换进行词库转换,假设转换成谷歌拼音,转换结果如图所示:

image

3.支持批量的词库转换。

在高级设置菜单中有一个“允许批量词库转换”选项,选中了该选项,那么就可以多选词库文件,当然多选的词库文件必须是同一种类型的词库,我相信有人肯定有很多细胞词库要转,那我就以细胞词库批量转换为例,转换成谷歌拼音输入法,如图所示:

image

另外,这次修复了一个Scel格式搜狗细胞词库解析的错误,分析了好久,终于把细胞词库的内部格式大部分都搞懂了,所以现在细胞词库的转换应该不会报错了。

目前还有微软拼音输入法、智能ABC等常用的老牌输入法我还没有搞定,尤其是智能ABC,相信这是很多人的第一个拼音输入法,不知道他的词库内部是什么结构,不知道该如何解析。另外还有各种输入法中的自定义词还没有实现导入。还有什么问题或者功能需求,希望大家多提意见。

文件下载地址:深蓝词库转换下载

我一直将该项目开源,项目源代码在http://code.google.com/p/imewlconverter/

目录
相关文章
|
11月前
|
机器学习/深度学习 存储 算法
万文长字总结「类别增量学习」的前世今生、开源工具包(1)
万文长字总结「类别增量学习」的前世今生、开源工具包
|
11月前
|
算法 PyTorch 算法框架/工具
万文长字总结「类别增量学习」的前世今生、开源工具包(3)
万文长字总结「类别增量学习」的前世今生、开源工具包
268 0
|
11月前
|
存储 算法 数据可视化
万文长字总结「类别增量学习」的前世今生、开源工具包(2)
万文长字总结「类别增量学习」的前世今生、开源工具包
136 0
|
开发者
Unity2019.1中文技术手册离线版
使用离线版优质、系统化的教程、经验文档、参考手册,为开发者节省时间,提高效率! 解压后打开UnityDocumentation_2019.1/Manual/index.html需要的自取,下载地址: https://pan.baidu.com/s/15rcBvr6JvM-wVYzGtSstdg
|
自然语言处理 程序员 Go
深蓝词库转换2.2发布,支持手心输入法和Win10微软拼音
距离上一次大版本的发布已经很久很久了,中间是不是会收到一些用户的来信,提出新的需求,于是只是做小版本的更新,终于积累了一些更新后,打算做个大版本的发布了。 深蓝词库转换是一个输入法的词库互转和生成软件,支持市面上主流的各种输入法软件的词库(加密的除外)和各种输入法(拼音、五笔、二笔,甚至台湾的注音、仓颉等),除了汉语还支持英文词库的导入导出以及根据词典生成英文输入法词库。
1323 0