1. 云栖社区>
  2. 全部标签>
  3. #数据挖掘#
数据挖掘

#数据挖掘#

已有9人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

时序数据的数据预处理

最近在读《数据挖掘》,其中关于数据预览和预处理(preprocessing)的内容没有介绍时序数据的处理,但这恰是很重要的应用场景。例如这道捕鱼题https://tianchi.aliyun.com/competition/entrance/231768/information我将根据书中和网络上找到的资料,尝试去清理其中的数据,并将思路记录下来,以备后查。

数据挖掘

小蜜团队万字长文 | 讲透对话管理模型最新研究进展

从人工智能研究的初期开始,人们就致力于开发高度智能化的人机对话系统。对话管理模型研究最新进展源于前沿的深度的研究……

云栖社区 深度学习 算法 机器学习 模块 数据处理 人工智能 Image 数据挖掘 API 自然语言处理 机器人 神经网络 人机交互 达摩院

为什么说阿里巴巴本身是云上数据中台的最佳实践

数据中台门在阿里巴巴集团干什么的,由哪个部门掌管?数据中台在阿里巴巴的主要作用是什么呢?外面吹嘘这么神秘的数据中台在阿里实践的如何呢?今天小编正好要采访数据技术及产品部门里面一个老大,带大家来一探究竟。

大数据 数据可视化 数据分析 数据挖掘 数据应用

Spark快速入门(72集视频+源码+笔记)

Spark快速入门(72集视频+源码+笔记)1、什么是Spark?Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

大数据 算法 hadoop 源码 配置 集群 Maven 数据分析 数据挖掘 spark 编程 Mapreduce IDEA

112
GO