科大讯飞发布会,我看到的人工智能

简介:

11 月 25 日,讯飞还是没能打破一个“魔咒”——逢发布会股价必跌。讯飞员工向雷锋网打趣道,直播的时候有人发弹幕说,快别直播啦,去看看你们的股价吧。另一名讯飞的员工则问,“这到底是什么原理呢?”实际上没人说得清楚,再加上每次股价都会反弹,所以也没人细究。

今年的发布会地点还是在国家会议中心的一层大厅,理论上这里能坐 1500 人,但今年的报名人数超过了 3500,所以现场站着听课的人不在少数,会议开始后半小时还听见门口的安保厉声道:“只让出不让进,工作人员也不行。”

总之,现场热闹非凡,人们都很想知道:在讯飞眼中,跟进人工智能的正确姿势到底应该是什么样子。

科大讯飞发布会,我看到的人工智能

为时 4 个小时的发布会,讯飞连发了七款产品:多语种实时翻译技术、万物互联输入法、智能家居、智能车载、智慧教育、智能服务机器人,以及个性化语音合成技术。用科大讯飞董事长刘庆峰的话说:“都是绝对的黑科技。”

众所周知,在偌大的会场演示语音技术算得上一种“自杀行为”,在此栽过跟头的厂商不计其数,但在发布会当天,讯飞的每个演示都堪称完美,现场惊叹连连。甚至有那么一瞬间让人产生一种错觉,电影《Her》中的场景已经离现实不远。

多语种实时翻译技术是演示重点之一,无论是哪位演讲者登台,左右两边的大屏幕上总是实时显示他所说的每一句话(中文),准确率极高。另外,英语,日语,韩语,维吾尔族语的翻译也在实时进行。

“这不科学,”我向讯飞的员工表示质疑,“我用过你们的录音宝,机器识别的准确率基本上属于不能用的水平。”他说:“现在录音宝的识别率已经提高了不少,只不过的确还比不上现场的演示效果。”问题的关键是拾音,他补充道:“现场的演示实际上一套完整的‘讯飞听见’系统,你看不到的是,我们在台下放了 8 个麦克风。”

声学博士钱晨曾告诉雷锋网,如果想把硬件产品的拾音做好,至少需要两个麦克风以上。言外之意,麦克风的数量与拾音效果呈正相关关系。既然现场有 8 个麦克风作陪,那“惊叹指数”显然是要打折扣的。

科大讯飞发布会,我看到的人工智能

另一款在现场掀起高潮的产品是被称为中英互译神器的“晓译翻译机”。演示的两人一人说中文,一人说英语,晓译翻译机几乎无延时地将对话内容互译,并用非常人性化的声音读了出来。

毫无疑问,这款产品的实用价值很高,如果复杂的对话也能达到演示的准确率——100%,晓译翻译机俨然就是一个贴身翻译。

看到这里,现场很多人心中基本上就剩下两个问题:这东西卖多少钱?什么时候上市?可惜这两个问题讯飞都没有给出答案,雷锋网能得到内部消息也只是:“还没量产,不知道什么时候上市。”

讯飞员工毫不讳言公司并不太擅长做电子消费品,并多次向雷锋网(公众号:雷锋网)强调:“硬件是个坑。”但基于晓译翻译机的产品形态,量产的难点显然不在硬件。元器件——麦克风、芯片等——都是现成的,又没有使用特殊的造型和材料,所以最让硬件厂商头疼的定制件对晓译翻译机似乎也不成问题。合理的推测是,其软件还需要进一步优化。

换句话说,讯飞想让真正的翻译官下岗,还为时尚早。同理适用于同声传译。

科大讯飞发布会,我看到的人工智能

真正让人想起电影《Her》的倒不是以上“黑科技”,而是这次发布会上“最不正经”的一款产品——个性化语音合成。

最开始演示时,摄像头对准了台下的锤子科技 CEO 罗永浩,老罗腼腆的笑着,和全场观众一起听着由讯飞合成的“老罗的声音”。从效果来看,合成的老罗已快逼近以假乱真的地步,所以在现场的哄笑声中,雷锋网记者的朋友圈也被“罗永浩为您朗读”刷屏了。

讯飞工作人员告诉雷锋网,合成只需录入一个人的数个音节,完成之后便可随意点播,欢乐程度与被录入者的可识别度,录入的音节数成正比。

在很多人(甚至包括讯飞自己的员工)看来,这只是个调节气氛的功能,但实际上,讯飞绝不会为了闹着玩研发一款新产品。

还记得在电影《Her》里,男主角西奥多第一次被人工智能震惊的场景么?斯嘉丽扮演的女主角萨曼莎一发声,西奥多便感觉很怪异,他说:“你看上去就像真人,但其实只是电脑发出的声音,太奇怪了。”萨曼莎安慰他:“我能理解你作为一个正常人,在洞察力方面的局限性,你会习惯的。”

编剧的这一设定非常讲究,参考的是恐怖谷效应。斯嘉丽的表演也很出彩,并凭此片成为了罗马电影节史上首位没有一个镜头的最佳女主角。英特尔数据中心事业部副总裁、计算机架构专家、神经系统科学家 Naveen Rao 曾告诉雷锋网记者,《Her》是他个人最欣赏的人工智能电影。但如果没有“看上去就像真人”这一点,欣赏程度显然要大打折扣。

后记

也许是发布会耗时太久,再加上演讲者的水平参差不齐,到了发布会后半段,原本拥挤不堪的会场空旷了很多。现场的工作人员显然习惯了这种状况,各司其职数小时之后,他们依然非常兴奋。

这不是讯飞的尴尬,他们以技术立足,在业内有口皆碑,作为合作伙伴,华为消费者业务 CEO 余承东甚至缺席华为集团财年预算会议来捧场。

但我依然好奇那些目光炙热的观众是否满载而归,就像在发布会前跟我说,“就想弄明白讯飞是怎么从一家语音输入公司变成一家人工智能公司”的同事,发布会结束后他仍一脸茫然。这是个值得深究的问题,但显然,这也并不适合在这种场合讲。


本文作者:六爷


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
人工智能 JSON 前端开发
吾剑未尝不利,国内Azure平替,科大讯飞人工智能免费AI语音合成(TTS)服务Python3.10接入
微软Azure平台的语音合成(TTS)技术确实神乎其技,这一点在之前的一篇:[含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入)](https://v3u.cn/a_id_260),已经做过详细介绍,然则Azure平台需要信用卡验证,有一定门槛,对国内用户不太友好,放眼神州,科大讯飞的讯飞开放平台也有语音合成服务接口,可以通过语音合成流式接口将文字信息转化为声音信息。
吾剑未尝不利,国内Azure平替,科大讯飞人工智能免费AI语音合成(TTS)服务Python3.10接入
|
人工智能 搜索推荐 大数据
对话科大讯飞胡郁:人工智能生态不会像互联网时代被几家垄断
6 月 28 日,讯飞开放平台「万物一听」智能硬件新品发布会在深圳举行,AI+ 生活的未来场景在发布会上带给人想象力上的无限冲击,科技感十足。科大讯飞执行总裁兼消费者事业群总裁胡郁、消费者事业群副总裁于继栋、讯飞研究院副院长王海坤等在会上分享了精彩观点。就在发布会的第二天,科大讯飞股票表现强势,早盘时一度触及涨停板,涨近 8%。
231 0
对话科大讯飞胡郁:人工智能生态不会像互联网时代被几家垄断
|
机器学习/深度学习 人工智能 机器人
聚焦科大讯飞刘庆峰两会建议:呼吁全社会关注人工智能,抢占全球人工智能产业制高点
在 2016 年两会中,刘庆峰建议将人工智能作为国家战略性科技发展方向列入科技部的重要工作内容。今年人工智能写进了两会,应了他去年的两会提议。
聚焦科大讯飞刘庆峰两会建议:呼吁全社会关注人工智能,抢占全球人工智能产业制高点
|
人工智能 自然语言处理 语音技术
AI公开课:19.04.24刘聪-科大讯飞AI副院长《人工智能的“顶天立地”之路》课堂笔记以及个人感悟
AI公开课:19.04.24刘聪-科大讯飞AI副院长《人工智能的“顶天立地”之路》课堂笔记以及个人感悟
|
1月前
|
人工智能 安全 数据挖掘
Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法
Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法

热门文章

最新文章