1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. S>
  5. 数据挖掘 数据清洗

当前主题:数据挖掘 数据清洗

数据挖掘 数据清洗相关的博客

查看更多 写博客

它是真实的“盗梦空间”?在这里,一切都可能是数据

阿里妹导读:位于杭州阿里巴巴西溪园区旁边的大型商场“亲橙里”2018年正式开业。和传统的线下综合型商场不同的是,亲橙里从规划之初就定位为数字化商场,通过植入自研的IBOS平台完成建筑内的所有子系统的接入,而让建筑和建筑内的设备、空间、人的“在线”是我们数字化

阅读全文

数据中台元年,破除数智化转型中的四大常见误区

2019年可谓是“数据中台元年”,过去几年企业市场对大数据的不断积累与沉淀,人们对数据中台、数智化转型的讨论也是非常火热。几乎每个企业都在关心如何构建自己的数据中台,如何利用数据中台构建企业自己的数据银行。 作为专注为企业数智化转型赋能的践行者,在2019云

阅读全文

火爆专场 干货来袭 | 淘宝端智能演进和思考

作者|吕承飞(吕行)出品|阿里巴巴新零售淘系技术部 关注「淘系技术」微信公众号,回复“大会”即可获得云栖大会「移动技术专场」全部 PPT 下载链接,赶快下载吧~ 今天分享内容包括三部分,第一是端智能整体趋势和淘宝应用现状,第二是淘宝在应用端智能过程中面临的问

阅读全文

数据可视化概览

科学可视化(Scientific Visualization)、 信息可视化(Information Visualization)和可视分析学(Visual Analytics)三个学科方向通常被看成可视化的三个主要分支。而将这三个分支整合在一起形成的新学科

阅读全文

敏捷AI | NLP技术在宜信业务中的实践【构建用户画像篇】

高级场景之构建客户画像 在许多企业中,每天业务人员和客户的沟通都会产生大量记录,这些记录可能包括了客服的沟通数据(通话记录、通话小结),也可能包括了各式各样的报告数据(陪访报告、征信报告等)(见图1)。 图1 业务人员与客户产生沟通记录 前者可能口语会多一些

阅读全文

Apache Flink 在同程艺龙实时计算平台的研发与应用实践

本文主要介绍 Apache Flink 在同程艺龙的应用实践,从当前同程艺龙实时计算平台现状、建设过程、易用性提升、稳定性优化四方面分享了同城艺龙实时计算平台的建设经验,供大家参考。 1.背景介绍 在 2015 年初,为了能够采集到用户在 PC,APP 等平

阅读全文

重磅|阿里云HBase Ganos全新升级,推空间、时空、遥感一体化基础云服务

1、HBase Ganos是什么 Ganos是阿里云时空PaaS服务的自研核心引擎。Ganos已作为云数据库时空引擎与数据库平台融合,建立了以自研云原生数据库POALRDB为基础,联合NoSQL大数据平台(Ali-HBASE和X-Pack Spark)的完整

阅读全文

重磅|阿里云HBase Ganos全新升级,推空间、时空、遥感一体化基础云服务

1、HBase Ganos是什么 Ganos是阿里云时空PaaS服务的自研核心引擎。Ganos已作为云数据库时空引擎与数据库平台融合,建立了以自研云原生数据库POALRDB为基础,联合NoSQL大数据平台(Ali-HBASE和X-Pack Spark)的完整

阅读全文

数据挖掘 数据清洗相关问答

提问题

greenplum的应用场景

前辈您好! 我先简单介绍一下背景:我搭建了一个PostgreSQL数据库用来存储单独一台机床在加工过程中产生的各种数据,我想借助神经网络等手段来分析这些数据,在此之前,需要对数据进行清洗、去噪和特征提取等操作,并将处理后的数据保存,以备将来训练和测试神经网络

阅读全文

阿里云ACA第二章考试有些问题不懂

疑惑一:如果要呈现产品类型、区域、销量,用哪种图? (4选1:气泡图、 柱状图、瀑布图、饼图) 疑惑二:数据分析平台包括哪些部分?5选3(事务处理、数据同步、数据清洗、数据处理、数据展现) 疑惑三:一个大型企业每天产生10T数据,直接放在业务系统进行数据分

阅读全文