讯飞语音

简介: <span style="font-family:宋体">、你需要</span><span>android</span><span style="font-family:宋体">手机应用开发基础</span> <p><span>2</span><span style="font-family:宋体">、科大讯飞语音识别</span><span>SDK android</span><spa
、你需要 android 手机应用开发基础

2、科大讯飞语音识别SDK android

3、科大讯飞语音识别开发API文档

4android手机

关于科大讯飞SDKAPI文档,请到科大语音官网下载:http://open.voicecloud.cn/

当然SDKAPI有多个版本可选,按照你的需要下载,其次,下载需要填写资料申请注册,申请通过或可获得Appid

二、语音识别流程

1、创建识别控件

函数原型

Public RecognizerDialog(Context context,String params)

其中Context表示当前上下文环境,传this即可

Params有参数详见API文档

2、用Appid登录到科大讯飞服务器(自动连接,需要联网)

主要用到SpeechUsercom.iflytek.speech包下)类下的getUser().login()函数

其中getUser()表示获取用户对象,可以实现用户登录,注销等操作

Login函数原型

Public boolean login(Context context,String usr,String pwd,String

参数详见API文档

3、读取语言识别语法

通过abnf文件并读取该文件,实现指定的语言识别语法,比如为了识别并计算国内两个城市之间的距离,abnf文件的内容可以是如下

Abnf文件的读取参考后面的具体开发实例

4、设置识别参数及识别监听器

通过RecognizerDialog下的setEngine()方法设置参数

函数原型

public void setEngine(String engine,String params,String grammar)

详细的参数请参考API文档

5、识别结果回调

需要实现RecognizerDialogListener接口,其中有两个方法需要重写,分别是

1)public void onResults(ArrayList<RecognizerResult> results,boolean isLast)

其中resultRecognizerResult对象的集合,RecognizerResult的属性有

String text 识别文本

Int confidence 识别可信度

2)public void onEnd(SpeechError error)

6、识别结果处理(自行处理)

自己将文本进行处理。

三、详细开发过程

1、新建Android项目

和普通的android项目一样,只是需要加入科大讯飞语言SDK包,主要包括

Msc.jarlibmsc.so动态库文件,项目lib截图

android_voice1.jpg

2、布局

这里只进行简单的布局,只设置一个按钮作为语言识别按钮及一个文本组件用作显示识别结果,布局文件如下

3、识别语法文件

这里只是简答的识别所说的城市名,其中指定了“北京”、“上海”、“广州”、“深圳”、“厦门”

4MainActivity程序

代码如下,请参考上面的语言识别流程

5、给程序相应的权限

由于本程序用到了网络、麦克风等,需要给定一下权限

6、结果截图

android_voice2android_voice3

四、项目文件及android程序下载

项目源文件及android程序安装包

下载地址:http://pan.baidu.com/share/link?shareid=494903&uk=3087605183

本站统一解压密码:www.52wulian.org

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
2月前
|
人工智能 信息无障碍 UED
网易AI Eyes获得iF设计奖,盲人也能“亲眼”玩游戏!
【2月更文挑战第17天】网易AI Eyes获得iF设计奖,盲人也能“亲眼”玩游戏!
38 2
网易AI Eyes获得iF设计奖,盲人也能“亲眼”玩游戏!
|
传感器 人工智能 芯片
“约架”AI拍照,手机厂商们的算盘不会太如意
2018年Q1结束,国内手机大厂的年度旗舰机型已经摆上货架。“华米OV”都给自家的手机贴上了AI拍照的标签。甚至还没有发布的荣耀10,也透露出了和AI拍照暧昧的消息。这让人想起2017年,不给自己的手机贴个全面屏的标签都不好意思搞发布会。不同的是,尽管去年各大厂商都在吹嘘自己的全面屏,在宣传上拍照技术仍然是首位,从小米的“拍人更美”到Vivo的“逆光也清晰,照亮你的美”莫不如是。
“约架”AI拍照,手机厂商们的算盘不会太如意
|
JSON 自然语言处理 测试技术
使用科大讯飞语音转文字的服务进行电话录音分析
使用科大讯飞语音转文字的服务进行电话录音分析
使用科大讯飞语音转文字的服务进行电话录音分析
|
机器学习/深度学习 人工智能 自然语言处理
现实版「柯南变声器」来了,搜狗变声让你声音随心变
声音秒变志玲姐姐,秒变「矮大紧」,秒变萝莉、正太,现在通通不是问题!
605 0
现实版「柯南变声器」来了,搜狗变声让你声音随心变
|
人工智能 达摩院 机器人
让每一个声音都被倾听-阿里语音AI抗疫纪实
积力之所举,则无不胜也;众智之所为,则无不成也。疫情面前,我们不是分散的个体,而是息息相关的每个人,是命运共同体。即使不在抗疫第一线,我们也会在后方持续支援,有一份热,发一份光,就令萤火一般,也可以发一点光。我们相信:春天总会到来,珞珈樱花仍会照常盛开。
822 0
让每一个声音都被倾听-阿里语音AI抗疫纪实
|
机器学习/深度学习 人工智能 算法
AI自动生成人脸照片?还能穿越时空变幻幼时和未来的模样?
AI一直是一个神秘且又令人心生敬畏和向往的概念。先且不论常人对AI的认知,就连游走在边缘的程序员们对AI也是知之甚少。
|
文字识别 API Python
共创“拍照翻译(生活服务)
本章采用了阿里云云市场通用文字识别API服务对图片进行文字转换,并采用阿里云云市场通用在线翻译API服务对文字进行翻译,支持的语言包括英文,中文等。
1489 0