“天猫精灵”如何为你写诗?人机共创的秘密在这儿

简介:

今年七夕期间,由阿里巴巴人工智能实验室(A.I.Labs)AI创作团队研发的《天猫精灵为你写诗》(以下简称“为你写诗”),通过它,你可以用AI给心爱的人写一首藏头情诗,还可以进行人机共创的合作。

今天,我们对AI创作团队负责人进行了专访。该团队在A.I.Labs的认知实验室负责探索AI智能创作、深度学习、自然语言理解、智能对话等人工智能技术在智能音箱上的应用。

1054cc93d8cd84a385c567ffb1ee7a7e964f1180

识别上方二维码,可亲身体验~

如何实现古诗创作中的人机共创?

Q:为什么想到从AI写诗这个角度切入,去做人机共创?

A:在文艺创作这件事情上,我们认为最重要的不是智能,人机共创才能将“智能”与“情感”的结合推向一个更高的高度,让创作更具“心智”和“情感”才是更重要的。在人机共创的过程中,机器也可能会越来越多地了解“情感”的表达。为印证人机共创的价值,我们做了“天猫精灵为你写诗”的尝试。

4b1ace53422696e3b4a7d0b6b0539055c86615f9

Q:“为你写诗”人机共创的部分是如何实现的?

A:人机共创的模式是机器为人提供推荐,而不是让人独自去完成修改。例如,诗句生成模型在每一句诗的每一个字都可以提供候选集,还可以通过beam search固定一部分文字生成后序的文字等等。

但是,单句或者单字的修改其实是会影响整首诗的质量的,如果只修改一句,不能对后续诗句做相应的推荐则不能发挥人机共创的优势,针对这个问题我们给出了一个解决方案:

b7a1e70ebec8a884d8b72742c967b70c9c8c60aa

我们在绝句的生成过程中保一个位留了每置诗句的不同表达,然后再选择匹配句子,通过统一的评价模型来衡量不同的佳句组合的质量,从中选择最具品质的作为输出。

Q:如何构建人机共创的评价模型呢?

a6c48079282bb3e27debebc5e881177ca3cb3074

5bdfb1f97ffdae3d52302f8d89fcc3808c162fe3

前序诗句的bigram词袋经过嵌入层之后再经过全链接网络对后一句打分,这个分数可以看作是对每一边的评分,而整诗的评分就是所有边评分个乘积。评分模型可以通过在古诗训练集上学习,同时在使用过程中很容易通过对计算的缓存来加速。

cc0234e542c7b1b8c80dc1c01698a98b26e9d2ca

整个搜索的过程是一个求出最大K路径的问题,每一个路径的打分则通过评分模型完成。搜索过程中,通过剪枝来去除压韵和平仄不相符的路径,最终按照评分排序得到最佳绝句。

这个过程可以从任意一句诗开始,当其中一句诗被修改之后,就可以从它开始重新构建整棵树,然后根据评价模型的结果来推荐后续诗句。

让机器写诗变得更优秀

Q:在写诗这件事上,“为你写诗”如何做到人有我优?

A:从写一句诗到写两句诗的最大挑战在于如何让两句诗的语境相连,也就是说在写第二句诗的时候机器需要知道第一句诗在说些什么,并且承前启后。

语境的延续表现为选择合适的汉字组成合理的诗句,需要解决通顺和达意两个难点,前者可以通过RNN模型解决,后者则需要通过sequence-to-sequence模型来传递前句的意思。

d43f68138aacd73565f5cc9e381a7a1dc3315305

Sequence-to-sequence最早应用于机器翻译领域,而后应用场景拓展到了对话等语言生成任务中。Sequence-to-sequence的基本组成是两个RNN网络:LSTM Encoder网络和LSTM Decoder网络。

Encoder网络的目标是将第一句诗的不同元素都表征成一个实数向量,可以理解为将第一句诗所包含的语义encode到了这些向量中;Decoder网络则更像是一个RNN语言模型,只不过在选取汉字的时除考虑已经写出来的前半句还要考虑Encoder网络的输出。Encoder网络的输出时,通过注意力机制(Attention)来选取前句中的中心意思,以便在生成诗句的时候做到真正的达意。

8559745e1070009e488d96cc8625d37f02a80f0b

我们认为整诗的质量应该是能够通过人机协作共同创作的方式提高的,这和之前的写诗程序有很大的不同。机器的模型再丰富,历史的诗词再高雅,其实都及不上一颗参与其中的真挚的心,所以我们在设计上鼓励用户参与推敲,提供了自由修改诗句的能力。

Q:人机共创的技术应用前景如何?

A:对于语言的理解和生成可以被应用到更广泛的创作场景里。为机器装上“心”,与人协同创作,将为我们人工智能的高峰“文学艺术创作”打开全新的出路,就像AlphaGo的出现,给了职业棋手学习更开天辟地的棋路打开新的空间一样。

567836959049f27f4f1a5d6b156a295b4ce81320

或许不久将来,天猫精灵能成为一个超级输入法,不用你输入每一个想写的字,而是输入一个梗概或者主题,天猫精灵就可以生成一篇对应的文章,再交互式的修改一下就完成了。

AI的价值在于帮助人,不是替代人,人机共创、共赢或许才是未来打开AI的正确方式。


原文发布时间为:2018-08-29

本文作者:人工智能实验室

本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”。

相关文章
|
6月前
|
机器学习/深度学习 人工智能 文字识别
探索古彝文的秘密,AI实现古籍传承
随着社会的进步与文化传承的发展,新时代的年轻人展现出无比强烈的文化自信。中华文化源远流长、一脉相承,在这个强调文化自信的时代,我们不得不更加重视文化传承的历史任务,而今天,文化传承的接力棒已经交到的新一代年轻人的手中。但是古文字文化传承方面的工作目前还有待提升,其原因就在于在探索古文字释义的过程中有诸多困难,即使有大量的古文字书籍供人们阅览,但是大部分人对这部分文化少有研究,因此使得古文字文化的传承困难重重。
|
11月前
|
人工智能 自然语言处理 达摩院
达摩院智能对话技术升级-更人类,更温暖-卷首语
达摩院智能对话技术升级-更人类,更温暖-
|
11月前
|
运维 安全 架构师
【年终特辑】看见科技创新力量 洞见时代创业精神—文旅娱乐—海浪之声:端对端加密聊天,让信息传递更安全
【年终特辑】看见科技创新力量 洞见时代创业精神—文旅娱乐—海浪之声:端对端加密聊天,让信息传递更安全
|
11月前
|
机器学习/深度学习 人工智能 算法
【年终特辑】看见科技创新力量 洞见时代创业精神—文旅娱乐—智媒云图:5G时代的“AI交互+数字艺术”双效引擎
【年终特辑】看见科技创新力量 洞见时代创业精神—文旅娱乐—智媒云图:5G时代的“AI交互+数字艺术”双效引擎
106 0
|
11月前
|
人工智能 自然语言处理 搜索推荐
智能音箱借ChatGPT重获“新生”?
ChatGPT对智能音箱整个产业的影响必然是一个长期的过程
136 0
|
机器学习/深度学习 人工智能 算法
|
机器学习/深度学习 人工智能 自然语言处理
出门问问携手中科院自动化研究所,共建语音智能与人机交互联合实验室
2012 年 10 月,是一家在语音识别、语义分析、垂直探索等技术领域具备自主研发能力的人工智能公司。根据此前路透社报道,于 2015 年 11 月出门问问完成 C 轮融资后的累计融资金额达 7500 万美元,投资方包括 Google 、红杉资本、真格基金、SIG 海纳亚洲、圆美光电、及歌尔声学。
154 0
出门问问携手中科院自动化研究所,共建语音智能与人机交互联合实验室
|
机器学习/深度学习 人工智能 安全
如何去推开与AI共生的大门
AI 更像是一个在努力成长却不够成熟的孩子,它前进的步伐,取决于“原生家庭”指引的方向,也有无数的人在为AI的向阳而生而奋斗着。
715 0
如何去推开与AI共生的大门
|
人工智能 达摩院 机器人
让每一个声音都被倾听-阿里语音AI抗疫纪实
积力之所举,则无不胜也;众智之所为,则无不成也。疫情面前,我们不是分散的个体,而是息息相关的每个人,是命运共同体。即使不在抗疫第一线,我们也会在后方持续支援,有一份热,发一份光,就令萤火一般,也可以发一点光。我们相信:春天总会到来,珞珈樱花仍会照常盛开。
819 0
让每一个声音都被倾听-阿里语音AI抗疫纪实
「镁客·请讲」奇点机智邬霄云:打造AI语音对话平台,赋能传统行业
个好的对话平台,要能够使用有限的例句进行泛化拓展,利用算法、语料库、知识库训练有效的模型。
319 0