1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. W>
  5. 文本分析

当前主题:文本分析

「最有用」的特殊大数据:一文看懂文本信息系统的概念框架及功能

导读:作为一种特殊的大数据,文本数据泛指各种以自然语言形式存在的数据。 目前,我们正处在一个以大数据与人工智能技术为核心的新的工业革命时代,其主要特征是大量各种可利用的数据可以视为一种特殊的生产资料,经过高效的智能数据分析与挖掘以及机器学习等人工智能技术处理

阅读全文

敏捷AI | NLP技术在宜信业务中的实践【构建用户画像篇】

高级场景之构建客户画像 在许多企业中,每天业务人员和客户的沟通都会产生大量记录,这些记录可能包括了客服的沟通数据(通话记录、通话小结),也可能包括了各式各样的报告数据(陪访报告、征信报告等)(见图1)。 图1 业务人员与客户产生沟通记录 前者可能口语会多一些

阅读全文

6 个 K8s 日志系统建设中的典型问题,你遇到过几个?

作者 |  元乙  阿里云日志服务数据采集客户端负责人,目前采集客户端 logtail 在集团百万规模部署,每天采集上万应用数 PB 数据,经历多次双 11、双 12 考验。 导读:随着 K8s 不断更新迭代,使用 K8s 日志系统建设的开发者,逐渐遇到了各

阅读全文

钓鱼网站识别【机器学习】

本文介绍如何使用机器学习技术检测一个URL是否是钓鱼网站,内容包括数据抓取、特征选择和模型训练等。 我有一个客户的邮箱最近差点被钓鱼网站骗掉。他的供应商的邮件被攻击了,然后黑客使用这个供应商的邮箱给他发了一封催款邮件,要求他支付到另一个银行账号。幸运的是,我

阅读全文

日志服务在CDN流量指标中的异常检测实战(上)

本次专题主要包括四个方面内容,第一部分介绍AIOps平台,以及具备的能力和功能。第二部分讲解阿里云日志服务平台的作用,以及支撑AIOps的应用。第三部分为目前关注的异常检测算法的介绍。第四部分以一个实际的场景作为案例介绍流量场景中的实战,并加以分析。 本文为

阅读全文

【阿里云新品发布·周刊】第25期:硬核!阿里云新品动态一手掌握

点击订阅新品发布会! 新产品、新版本、新技术、新功能、价格调整,评论在下方,下期更新!关注更多内容,了解更多 产品动态 新版本/新规格:云数据库 MySQL 版 - MySQL 推出 90核 CPU 720GB 内存 独占物理机规格。 查看产品 查看文档 R

阅读全文

大数据学习路线分享AWK详解

  大数据学习路线分享AWK怎详解,awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。   aw

阅读全文

什么是网络爬虫?有什么用?怎么爬?终于有人讲明白了

一、什么是网络爬虫 随着大数据时代的来临,网络爬虫在互联网中的地位将越来越重要。互联网中的数据是海量的,如何自动高效地获取互联网中我们感兴趣的信息并为我们所用是一个重要的问题,而爬虫技术就是为了解决这些问题而生的。 我们感兴趣的信息分为不同的类型:如果只是做

阅读全文

文本分析相关问答

查看更多 提问题

人工智能——nlp自学习平台如何python调用api?

``` # 创建AcsClient实例 print 'done1_______________' client = AcsClient('xxx', 'xxxx', 'cn-hangzhou') print 'done2_______________'

阅读全文

文本分析 算法

智能客服,文本分析。拆词

阅读全文

文本分析中数据导入,分词后,停用词过滤组件为什么不能用?

文本数据在数据源中上传,设置了一个关键字段 在分词组件中进行了分词和词性标注 再连接停用词过滤组件,点击右边的选择字段却显示列表为空,因此无法执行停用词过滤 请问大家如何解决

阅读全文

2018spark技术问答集锦,希望能给喜欢spark的同学一些帮助

小编发现问答专区中有很多人在问关于spark的问题,小编把这些问题汇总一下,希望能给喜欢spark的大家一些启示和帮助 本帖不定期更新,喜欢的可以收藏哦 **如何在Apache Beam中实现类似Spark的zipWithIndex?** htt

阅读全文

用PAI能实现文本内容风格迁移吗(自动把我写的一句话,转化成比如韩寒的文风)?

用PAI能实现文本内容风格迁移吗(自动把我写的一句话,转化成比如韩寒的文风),大概用到PAI平台的哪些组件,请大神提示一下(为啥没有付费问答呢?)

阅读全文

阿里云可以解决文本挖掘问题吗?比如说从海量的裁判文书中提取有效信息加以分析?

从海量文书中提取关键信息

阅读全文

一个桌面标签云,文本云图制作软件需要的技术有哪些?

![screenshot](https://oss-cn-hangzhou.aliyuncs.com/yqfiles/799551d86857a5161ca969dc96470a67e4971b3c.png) ![screenshot](https://os

阅读全文

NOSQL 分析日志文件

现在系统的运行日志越来越多,目前都是txt文本文件.这样就很难对日志数据进行汇总分析. 我的想法是搭建一个NOSQL(最好是基于 JSON格式的),每天凌晨把昨天产生的日志文件写入到NOSQL数据库. 这样NOSQL的日志数据会有一天的延期

阅读全文