剑桥AI公司:7天精通一门新语言,未来将学会7000种语言

简介: 剑桥AI公司Speechmatics使用机器学习技术Automatic Linguist,可在一天内学会一门语言的基础,一周内掌握一门新语言。该公司希望有朝一日能够掌握世界上的所有语言。

11月11日,剑桥AI公司Speechmatics正式上线其机器学习平台Automatic Linguist,能在一周内掌握一门新语言。该平台沿用剑桥大学研发的技术,能够识别并应用语言中的不同模式。目前,该平台能够识别28种语言,实现从语音到文字的准确转录。

2a49d62f223cf47727f7d94aae47bcabd6ab34d7

图示: Speechmatics将28种语言逐渐加入其系统中。


一个大公司客户要求Speechmatics两周内学会印地语,该公司发布了一个系统,根据测试,该系统比市场领先者的错误率少23%。

Speechmatics首席执行官Benedikt von Thüngen在接受Cambridge Independent采访时表示,“印地语非常简单。我们发现它在发音方面与英语非常相似,所以我们可以使用一个叫做‘适应’的过程。它从我们拥有的不同数据集中学习。”

“每种语言都有各自有趣的地方。韩语、土耳其语、芬兰语、德语等语言都是粘着构词,词语结合起来构成新的词汇。这是一个有待解决的有趣问题。”

“越南语、汉语等变调语言,也是一个很有意思的挑战。要教会系统去处理这些语言。”

fd93a9d49c6fb63e12bc6dec01c55cac2d0cf5ab

Speechmatics首席执行官Benedikt von Thüngen。


语言识别的传统路径要经过繁琐、昂贵的人工过程,专家要手动收集、清理海量数据。这是一个一次性系统,因此只关注使用最广泛的几种语言才算经济实用。

但是经过剑桥大学博士、Speechmatics首席技术官Tony Robinson数十年对神经网络的研究,Speechmatics可以通过识别基本声音和语法结构,在一天之内掌握一门语言的基础。

7d9ca2d8dc0e5841af3277791ad16c6cf9aa6e66

剑桥大学博士、Speechmatics首席技术官Tony Robinson。

 

该软件的主要用途之一是为电视提供准确、实时的字幕,并增加了专业个性化词典,如足球员姓名。

Benedikt说金融机构能够使用这一技术进行通话录音,以证明合规性和对PPI不当销售进行审查。他预言:“语音将成为与设备互动的主要机制。”

该公司白皮书提到,“我们的终极目标是为所有语言提供一个语言包。鉴于世界上约有7000种语言,这将是一个雄心勃勃的目标,我们希望有朝一日能够全部掌握这些语言。”


原文发布时间为:2017-11-16

本文作者:Cecilia

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:剑桥AI公司:7天精通一门新语言,未来将学会7000种语言

相关文章
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
当语言遇见智慧火花:GPT家族历代模型大起底,带你见证从平凡到卓越的AI进化奇迹!
【10月更文挑战第6天】随着自然语言处理技术的进步,GPT系列模型(Generative Pre-trained Transformers)成为该领域的明星。从GPT-1的开创性工作,到GPT-2在规模与性能上的突破,再到拥有1750亿参数的GPT-3及其无需微调即可执行多种NLP任务的能力,以及社区驱动的GPT-NeoX,这些模型不断进化。虽然它们展现出强大的语言理解和生成能力,但也存在如生成错误信息或偏见等问题。本文将对比分析各代GPT模型的特点,并通过示例代码展示其部分功能。
248 2
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
YuE 是香港科技大学和 M-A-P 联合开发的开源 AI 音乐生成模型,能够将歌词转化为完整的歌曲,支持多种音乐风格和多语言。
311 23
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
|
15天前
|
XML 机器学习/深度学习 人工智能
CLaMP 3:音乐搜索AI革命!多模态AI能听懂乐谱/MIDI/音频,用27国语言搜索全球音乐
CLaMP 3是由清华大学团队开发的多模态、多语言音乐信息检索框架,支持27种语言,能够进行跨模态音乐检索、零样本分类和音乐推荐等任务。
45 1
CLaMP 3:音乐搜索AI革命!多模态AI能听懂乐谱/MIDI/音频,用27国语言搜索全球音乐
|
2天前
|
缓存 人工智能 自然语言处理
微软发明全新LLM语言,AI智能体交互效率翻倍!
微软发布DroidSpeak技术,优化大型语言模型(LLM)间的通信,显著提升AI智能体交互效率。该技术通过嵌入缓存和键值缓存重用,减少预填充延迟,降低高达50%的延迟,同时保持高质量生成。DroidSpeak适用于多种AI任务,提高协作效率,但在资源受限环境和处理模型差异性方面仍面临挑战。
16 3
|
2月前
|
人工智能 自然语言处理 开发工具
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
Languine 是一款面向开发者的 AI 翻译工具,支持 100+ 种语言,自动化翻译流程,提升多语言应用开发效率。
117 15
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
|
4月前
|
人工智能 Ubuntu 语音技术
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
ebook2audiobookXTTS 是一款开源的 AI 工具,能够将电子书转换为有声书,支持多种电子书格式和 16 种语言。该工具利用 Coqui XTTS 技术实现高质量的文本到语音转换,并提供命令行、Web 界面和 Docker 容器等多种使用方式。
327 3
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
|
3月前
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
153 10
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
自然语言处理(NLP)是AI的重要分支,旨在让计算机理解人类语言
自然语言处理(NLP)是AI的重要分支,旨在让计算机理解人类语言。本文探讨了深度学习在NLP中的应用,包括其基本任务、优势、常见模型及具体案例,如文本分类、情感分析等,并讨论了Python的相关工具和库,以及面临的挑战和未来趋势。
196 1
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法
DGLM(Diffusion Guided Language Modeling)是一种新型框架,结合了自回归模型的流畅性和扩散模型的灵活性,解决了现有引导生成方法的局限性。DGLM通过扩散网络生成语义提案,并使用轻量级提示生成器将嵌入转化为软提示,引导自回归解码器生成文本。该方法无需微调模型权重,易于控制新属性,并在多个基准数据集上表现出色。实验结果显示,DGLM在毒性缓解、情感控制和组合控制等方面优于现有方法,为可控文本生成提供了新的方向。
81 10
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法
|
7月前
|
机器学习/深度学习 人工智能
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!
【8月更文挑战第11天】牛津与剑桥大学研究揭示,AI模型若反复在自身生成的数据上训练,将遭遇“模型崩溃”,即性能严重退化,甚至遗忘真实世界的数据分布。此现象在《自然》杂志刊出,警示AI进化之路暗藏风险。实验显示,随着训练代际增加,模型倾向于生成更简单内容,丢失稀有信息,最终可能导致对现实世界的误解加深。此发现对AI领域的持续发展及模型可靠性提出了新的挑战。
232 60

新智元

+ 订阅

热门文章

最新文章