1. 云栖社区>
  2. 全部标签>
  3. #NLP#
NLP

#NLP#

已有1人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

让机器“读懂”放射学报告

利用基于规则的NLP系统让机器"读懂"放射学报告,准确率比基于机器学习的NLP系统要高。

云栖社区 深度学习 算法 机器学习 NLP

哪种词向量模型更胜一筹?Word2Vec,WordRank or FastText?

本文在不同语料库下分析了FastText,Word2Vec和WordRank三种词嵌入模型的性能,发现没有单独的一种模型能够用于不同类型NLP任务。

性能 word2vec NLP FastText WordRank 词向量模性

人生苦短,我用python!

​点击关注 异步图书,置顶公众号 每天与你分享 IT好书 技术干货 职场知识 ​ ​参与文末话题讨论,每日赠送异步图书 ——异步小编 Python这个无所不在的编程语言,薪资高到没朋友,《Python神经网络编程》的新书发布、Zed大神的《笨办法学Python3》即将出新版后,大家对Python热度持续高涨,有的读者问:“小编什么时候可以带来一波Python书单福利?",今天今天就是今天,小编带来了一份Python书单,分为入门、进阶高级、行业应用三部分内容,带来一大波好书福利给你。

python 深度学习 算法 人工智能 自然语言处理 神经网络 NLP

第一本Python神经网络编程译著图书终于来啦

是的,第一本Python神经网络编程译著图书终于来啦,它就是《Python神经网络编程》,基于Pyhthon3.5,书中使用的软件工具都是免费开源的,无需支付任何费用、也不需要一台昂贵的计算机便可以制作自己的神经网络。

python 深度学习 算法 人工智能 自然语言处理 神经网络 NLP al

AI小编问世!阿里智能写手核心技术首次公开!

内容化已经成为淘宝近几年发展的重点,我们可以在手机淘宝APP(以下简称手淘)上看到很多不同的内容形式和内容型导购产品,例如,“有好货”中的以单个商品为主体的富文本内容,“必买清单”中的清单,即围绕一个主题来组织文本和商品的长图文型内容,等等。

深度学习 算法 个性化推荐 淘宝 NLP 文本生成

NLTK基础基础教程学习笔记(十四)

对于文本分类,最简单的定义就是基于文本内容来对其进行分类。通常情况算法是根据数字/变量特征来写的。先从https://archive.ics.uci.edu/ml/datasets/SMS+SPam+Collection中下载数据集接下来先要进行数据清理,标识化处理,以及词干提取来对SMS数据进行清理,使其内容更加简单一点: import nltk from nltk.

自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(十三)

在信息摘要应用中还包含着另一种理论逻辑:重要的句子中通常包含着重要的词汇,而跨语料库的差异词(discriminatory word)绝大多数数是重要词汇。因此,句子中包含具有差异很大的词汇,它就很重要。

自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(十二)

构建第一个NLP应用:信息摘要:对所提供的文章短文故事生成需要针对其内容自动生成摘要。信息摘要需要理解的不只是句子的结构,而是整个文本结构,还要了解文本的体裁和主体主题内容。下面了一个介绍创建个人版的Google News通常用于较多实体和名词的句子的重要性往往会比较高,现在的任务是要用某种可能被标准化的统一逻辑来计算重要性成分(importance score),即如果想要获取前n个句子的信息情况,要去选择一个重要性评分阈值。

BY 自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(十一)

语块分解例子: from nltk.chunk.regexp import * import nltk test_sent="The prime minister announced he had asked the chief government whip, Philip Ruddock, t...

自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(十)

依赖性文本解析:依赖性文本解析(dependency parsing 简称DP)是一种现代化的文本解析机制。DP的主要概念是将各个语法单元(单词)用丁香链路串联起来。这种链路称为依赖关系(dependencies)。

自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(九)

不同的解析器类型:解析器通常需要对一个用于表达一组语法规则的输入字符串继续处理,然后构成一个或者多个可用于构成某种语法概念的规则。语法是我们衡量一个句子是否良好的一份规范说明,而解析器则是一个用于解读语法的程序。

正则表达式 NLP 自然语言 换装攻略 nltk

NLTK基础教程学习笔记(八)

浅解析与深解析:通常情况下,在深入解析或者全面解析的过程中,像CFG(Context-Free Grammer,上下文无关语法),PCFG(即probabilistic context-free grammar,概率性上下文无关语法)以及搜索策略这样的语法概念的作用都是要将一套完整的语法结构运用的某个句子上。

深度学习 自然语言处理 Apple NLP 换装攻略 NITK

NLTK基础教程学习笔记(七)

正则表达式标注器:定义了一个这则表达式的同时定义出给定表达式所对应的标签。下面会看到一些常见的正则表达式是如何获取不同词性的。其中有一些模式都有各自关联的POS类别。 from nltk.tag.sequential import RegexpTagger from nltk.

深度学习 正则表达式 表达式 自然语言处理 NLP 换装攻略 NITK

NLTK基础教程学习笔记(六)

用NLYK库实现标注任务的方式有两种:1:使用NLTK库或其他库中的预置标注器,并将其运用到测试数据上。这两种标注器应该足以应对英语文本环境,以及非特殊领域语料库中的所有词性标注任务。2:基于测试数据来创建或训练出适合的标注器。

深度学习 函数 pos 测试 自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(五)

词性标注:词性(POS)常用的POS标记库Penn Treebank,PennTreeBank原本是一个NLP项目的名称,该项目主要是对相关语料进行标注,标注内容包括词性标注以及语法分析,其语料来自1989年的华尔街日报,包含2499篇文章。

pos 自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(四)

标识化处理:机器所要理解的最小处理单位是单词(分词)。标识化处理,是将原生字符创分割成一系列有意义的分词。标识化就是将原生字符串分割成一系列有意义的分词。标识化处理的复杂性因具体NLP应用而异,目标语言本身的复杂性本身也会带来相关的变化。

面向对象 正则表达式 自然语言处理 NLP 换装攻略 nltk

NLTK基础教程学习笔记(三)

文本歧义:文本/数据歧义定义较为困难,教程定义为从原生数据中获取一段机器可读的已格式化文本之前所要做的所有预处理工作。该过程应该涉及数据再加工,文本清理,预定预处理,标识化处理,词干提取或词形还原以及停用词移除等操作。

Json csv NLP 换装攻略 nltk

NLTK基础教程学习笔记(二)

Python基础:字典(dictionary)也是最常用到的一种数据结构。在其他语言中被称为关联数组/存储。字典是一种键值索引型的数据结构,其索引键可以是一种不可变的类型,例如字符串和数字常被用来充当索引键。

python javascript js request jquery static class html type read 数据结构 NLP 换装攻略 nltk

NLTK基础教程学习笔记(一)

由于之后图像上可能要结合NLP的问题加快节奏 刷一波NLTK,用python3

python 函数 正则表达式 string last list NLP 换装攻略 nltk

2
GO