深蓝词库转换1.7发布,支持QQ分类词库解析

简介:

昨晚收到了keke的邮件,得知了该大侠对QQ分类词库的解析有所研究,并Java实现了对QQ分类词库的解析,大喜,于是今天通过一天的努力,终于在C#中实现了对QQ分类词库(qpyd格式)的解析。

qpyd格式的解析一直是深蓝词库转换功能上的遗憾,我在一年多前的博客中提到了希望实现该功能,但是只可惜鄙人能力有限,不能悟透其中的格式,无法解析出来,现在有了keke大侠的帮助,同时还有Java源码作为参考,所以花1天就实现了该功能,并做了其他一些小调整,发布了深蓝词库转换1.7版。

深蓝词库转换1.7主要做了以下3方面的改动:

  1. 支持QQ分类词库(qpyd格式)的解析。
  2. 支持拖拽单个文件时感知文件格式,自动识别转换的源格式。
  3. 调整下拉列表中各个词库的顺序,将常用的搜狗拼音和QQ拼音放在最上面,方便大家使用。

还在犹豫是使用搜狗输入法还是QQ输入法,亦或是谷歌输入法吗?习惯了搜狗输入法,但是却有一个专业的词库只有QQ分类词库有,现在有了深蓝词库转换,不管选择用哪种输入法,其他方的词库都可以为我所用!附上QQ分类词库转换为搜狗拼音词库的截图:

image

深蓝词库转换是一个开源项目,项目地址:http://code.google.com/p/imewlconverter/

深蓝词库转换1.7的下载地址是:http://imewlconverter.googlecode.com/files/imewlconverter_1_7.zip

 

再次感谢keke大侠的帮助。附上keke大侠关于QQ分类词库解析的Java源码:

http://code.google.com/p/dict4cn/source/browse/trunk/importer/src/QQPinyinQpydReader.java

本文转自深蓝居博客园博客,原文链接:http://www.cnblogs.com/studyzy/archive/2012/02/16/2355036.html,如需转载请自行联系原作者

相关文章
|
3月前
|
Python
ChatGPT 调教指南:从 PDF 提取标题并保存
ChatGPT 调教指南:从 PDF 提取标题并保存
54 0
|
9月前
|
机器学习/深度学习 存储 自然语言处理
Jieba分词模式详解、词库的添加与删除、自定义词库失败的处理
Jieba(结巴)是一个中文分词第三方库,它可以帮助我们将一段中文文本分成一个个独立的词语。Jieba具有以下特点: 简单易用:Jieba提供了简洁的API接口,易于使用和扩展。可以快速地实现中文分词功能。 高效准确:Jieba采用了基于前缀词典和动态规划算法的分词方法,能够高效准确地处理各种中文文本。 支持多种分词模式:Jieba提供了三种分词模式:精确模式、全模式和搜索引擎模式,可以根据不同的应用场景选择合适的模式。
Jieba分词模式详解、词库的添加与删除、自定义词库失败的处理
|
机器学习/深度学习 编解码 自然语言处理
错字修改 | 布署1个中文文文本拼蟹纠错模型
错字修改 | 布署1个中文文文本拼蟹纠错模型
218 0
|
自然语言处理 开发工具 网络架构
自定义词库|学习笔记
快速学习自定义词库。
127 0
自定义词库|学习笔记
|
开发者
自定义词库 | 学习笔记
快速学习自定义词库
58 0
自定义词库 | 学习笔记
|
自然语言处理 程序员 Go
深蓝词库转换2.2发布,支持手心输入法和Win10微软拼音
距离上一次大版本的发布已经很久很久了,中间是不是会收到一些用户的来信,提出新的需求,于是只是做小版本的更新,终于积累了一些更新后,打算做个大版本的发布了。 深蓝词库转换是一个输入法的词库互转和生成软件,支持市面上主流的各种输入法软件的词库(加密的除外)和各种输入法(拼音、五笔、二笔,甚至台湾的注音、仓颉等),除了汉语还支持英文词库的导入导出以及根据词典生成英文输入法词库。
1323 0
|
Android开发
Wps 2013 拼音标注两种方式分析
Wps 2013 拼音标注两种方式分析 太阳火神的美丽人生 (http://blog.csdn.net/opengl_es) 本文遵循“署名-非商业用途-保持一致”创作公用协议 转载请保留此句:太阳火神的美丽人生 -  本博客专注于 敏捷开发及移动和物联设备研究:iOS、Android、Html5、Arduino、pcDuino,否则,出自本博客的文章拒绝转载或再转载,谢谢合作。
1543 0