艾伦人工智能研究院推出PyTorch上的NLP库 | 附paper+demo

简介:
本文来自AI新媒体量子位(QbitAI)

f2e451b3be88cb061da219729d253d5161aad5cb

微软联合创始人保罗·艾伦建立的艾伦人工智能研究院(AI2)今天发布了一个PyTorch上的开源自然语言处理(NLP)研究库:AllenNLP。

这个库提供灵活的数据API,能实现智能的batching和padding,对文本处理中的常见操作进行高层抽象,还提供了一个模块化、可扩展的实验框架。

9428043df4511e32c35c2559aa7d242ca41e61fc

AllenNLP包含3个模型:机器理解、语义角色标注和文本蕴含。

其中,机器阅读理解(MC)模型能够从一段文本中选择一段,来回答自然语言问题。AllenNLP中的MC模型是Seo et al, 2017论文提出的BiDAF(双向注意流)的实现。AllenNLP的BiDAF模型在SQuAD数据集上测试的EM成绩是68.7,略好于原始BiDAF模型的67.7分,训练速度也是原来的10倍。

语义角色标注(SRL)模型能从一个句子中还原出它的潜在谓词参数结构,还能为回答“谁”对“谁”做了“什么”这类关于句子含义的基本问题而建立表示。AllenNLP的SRL模型是He et al, 2017论文提出的deep BiLSTM的实现,性能与原文的模型相当,在CoNLL 2012上的F1得分为78.9。

当处理一对句子的时候,文本蕴含(TE)模型能预测第一个句子中的事实是否隐含了第二个句子中的事实。AllenNLP的TE模型是Parikh et al, 2017论文中可分解注意模型的实现,在SNLI数据集上达到了84.7的准确率,接近原始模型86.3%的成绩。

c56ddabe3b639532129c4429c1b1cab1825caed8

AllenNLP由AI2与华盛顿大学等高校的研究者合作开发和维护。

关于这个库的更多信息,以及文中提到的3个模型,见以下链接:

AllenNLP主页:http://allennlp.org/

论文:http://allennlp.org/papers/AllenNLP_white_paper.pdf

GitHub地址:https://github.com/allenai/allennlp

Demo:http://demo.allennlp.org/

安装指南:http://allennlp.org/tutorials/installation

机器阅读理解模型 - BiDAF (Seo et al, 2017):
https://www.semanticscholar.org/paper/Bidirectional-Attention-Flow-for-Machine-Comprehen-Seo-Kembhavi/007ab5528b3bd310a80d553cccad4b78dc496b02

语义角色标注模型 - deep BiLSTM model (He et al, 2017):
https://homes.cs.washington.edu/~luheng/files/acl2017_hllz.pdf

文本蕴含模型 - 可分解注意模型(Parikh et al, 2017):
https://www.semanticscholar.org/paper/A-Decomposable-Attention-Model-for-Natural-Languag-Parikh-T%C3%A4ckstr%C3%B6m/07a9478e87a8304fc3267fa16e83e9f3bbd98b27

本文作者:李林
原文发布时间:2017-09-09 
相关文章
|
27天前
|
数据采集 自然语言处理 算法
如何使用Python的Gensim库进行自然语言处理和主题建模?
使用Gensim库进行自然语言处理和主题建模,首先通过`pip install gensim`安装库,然后导入`corpora`, `models`等模块。对数据进行预处理,包括分词和去除停用词。接着,创建字典和语料库,使用`Dictionary`和`doc2bow`。之后,应用LDA算法训练模型,设置主题数量并创建`LdaModel`。最后,打印每个主题的主要关键词。可以根据需求调整参数和选择不同算法。
22 0
|
2月前
|
自然语言处理 PyTorch 算法框架/工具
自然语言生成任务中的5种采样方法介绍和Pytorch代码实现
在自然语言生成任务(NLG)中,采样方法是指从生成模型中获取文本输出的一种技术。本文将介绍常用的5中方法并用Pytorch进行实现。
100 0
|
3月前
|
机器学习/深度学习 算法 PyTorch
PyTorch 人工智能基础知识:6~8
PyTorch 人工智能基础知识:6~8
119 0
|
3月前
|
机器学习/深度学习 自然语言处理 PyTorch
PyTorch 人工智能基础知识:1~5
PyTorch 人工智能基础知识:1~5
43 0
|
3月前
|
机器学习/深度学习 自然语言处理 PyTorch
PyTorch 人工智能研讨会:6~7
PyTorch 人工智能研讨会:6~7
21 0
|
3月前
|
人工智能 PyTorch 算法框架/工具
PyTorch 人工智能研讨会:1~5
PyTorch 人工智能研讨会:1~5
27 0
|
3月前
|
机器学习/深度学习 PyTorch TensorFlow
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南(NLP自然语言处理概念介绍)
【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南(NLP自然语言处理概念介绍)
39 0
|
2月前
|
机器学习/深度学习 人工智能 PyTorch
Python 与人工智能的完美结合——解析 PyTorch 框架
【2月更文挑战第4天】本文将探讨 Python 在人工智能领域中的应用,以及介绍 PyTorch 框架。PyTorch 是一个基于 Python 的开源机器学习库,其强大的自动微分功能和易于使用的接口使其成为深度学习领域的热门选择。本文将从 PyTorch 的发展历程、工作原理以及示例代码等方面进行详细分析和解释。
|
3月前
|
机器学习/深度学习 人工智能 算法
量化交易与人工智能:Python库的应用与效用
量化交易与人工智能:Python库的应用与效用
233 0