1. 云栖社区>
  2. 全部标签>
  3. #数据挖掘#
数据挖掘

#数据挖掘#

已有9人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

大数据相关术语(1)

1.大数据:英文:big data,mega data大数据指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 2.大数据的4V:英文:4V [volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)] 3. HDFS(Hadoop Distributed FileSystem):Hadoop

深度学习 大数据 算法 服务器 高可用 数据库 人工智能 数据仓库 负载均衡 数据挖掘 分布式计算 并行计算 存储 神经网络

企业IT架构转型是大势所趋

经过多年实战和不断创新,阿里巴巴逐渐形成了今天自己的核心系统架构。这不是单一的产品,是很多包括中间件等在内的产品沉淀和体系化的结果。做架构不能考虑当前的一件事情,要从业务持续发展来思考。

大数据 架构 Oracle 互联网 阿里巴巴 阿里中间件 中间件 数据挖掘 解决方案 物联网 数据中心 异地 Aliware 企业转型 企业级互联网架构Aliware

数据的游戏:冰与火

数据就像一个王座一样,像征着一种权力和征服, 但登上去的路途一样令人胆颤!     我对数据挖掘和机器学习是新手,从去年7月份在Amazon才开始接触,而且还是因为工作需要被动接触的,以前都没有接触过,做的是需求预测机器学习相关的。后来,到了淘宝后,自己凭兴趣主动地做了几个月的和用户地址相关数据挖掘上的工作,有一些浅薄的心得。下面这篇文章主要是我做为一个新人仅从事数据方面技术不到1

算法 数据分析 数据挖掘

大学必备,让你求职、学习脱颖而出的神器,竟然是它!

9.9元学生专享云服务器:1核CPU配置、2G内存、1M带宽、40G硬件的配置。阿里云学生机:少买一个皮肤,成就你的不同凡想!

阿里云 云服务器 创业 配置 学生 数据挖掘 云市场 带宽 学生机

黑科技!一个工具玩转大数据挖掘

电商价格、网络舆情,互联网20亿网页中难以量计的网页数据如何被我们触及?教你一招黑科技,一个工具搞定大数据挖掘!

大数据 加密 互联网 电商 数据挖掘 移动互联网 网页抓取

借助数加,原来需要2-3天的单维度数据处理时间,目前仅需3-6小时,研发周期更短,产品需求符合度更高。

“在原来自建的环境里进行一个维度的数据处理大约需要 2-3天时间,而使用数加平台处理相同数据只需要 3-6 个小时。这些效率的提升可以缩短数据分析应用产品的研发周期,并能更好的提高这些产品的需求符合度。

大数据 架构 阿里云 数据处理 数据分析 数加 数据挖掘 索引 云服务 大数据分析

数据挖掘之数据准备——时间相关数据

实际的数据挖掘应用范围包括时间强相关,时间弱相关和时间无关问题。现实中的时间相关问题需要特殊的数据准备和数据转换。

云栖社区 数据存储与数据库 系统研发与运维 深度学习 函数 数据挖掘

数据挖掘之数据准备——丢失数据

对数据挖掘的实际应用而言,即使数据量很大,具有完整数据的案例子集可能相对较小。可用的样本和将来的事件都可能有丢失值。一些数据挖掘方法可以接受丢失值,并能进行圆满的处理,得到最终结论。一个明显的问题是,在应用数据挖掘方法之前的数据准备阶段,能否把这些丢失值补上。

云栖社区 数据存储与数据库 系统研发与运维 网络与数据通信 深度学习 数据挖掘 解决方案

数据挖掘之数据准备——原始数据的转换

接下来介绍的几个数据转换常见类型与问题无关,并可能改善数据挖掘的结果。在特定应用中选择和使用技术,取决于数据的类型,数据量和数据挖掘任务的一般特征。

云栖社区 数据存储与数据库 系统研发与运维 网络与数据通信 数据挖掘

数据挖掘之数据准备——原始数据的特性

最初为数据挖掘准备的所有原始数据集通常很大,它们中的许多都和人有关,且比较杂乱。

云栖社区 数据存储与数据库 系统研发与运维 深度学习 大数据 数据仓库 数据分析 数据挖掘

4月5日云栖精选夜读:Java如何进行垃圾对象回收?小秘书为你揭开谜底

由于JVM中垃圾收集器的存在,使得Java程序员在开发过程中可以不用关心对象创建时的内存分配以及释放过程,当内存不足时,JVM便会自动开启垃圾收集线程,进行垃圾对象的回收。 那么垃圾回收线程到底是什么时候触发,并如何实现垃圾回收的呢?在今天的夜读中,小秘书将用源码分析的方式为你揭开谜底。

深度学习 大数据 java jvm 阿里云 程序员 线程 源码 中间件 数据挖掘 e-mapreduce 数据恢复

菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结

在菜鸟—需求预测与分仓规划比赛上,“我们为R代言”团队获得了季军。在分享中,“我们为R代言”团队主要对赛题进行了分析,提出了选择机器学习的理由,介绍了团队线下解决方案实现过程。

机器学习 数据挖掘 需求预测 分仓规划

菜鸟—需求预测与分仓规划亚军——“天亮”团队赛后总结

在菜鸟—需求预测与分仓规划比赛上,“天亮”团队获得了亚军。“天亮”团队主要分享了团队的特征分析以及方案实现过程。

数据挖掘 需求预测 分仓规划 特征提取

数据挖掘之数据准备——原始数据的描述

数据样本是数据挖掘过程的基本组成部分,每个样本都用几个特征来描述,每个特征都有不同类型的值。

云栖社区 数据存储与数据库 系统研发与运维 网络与数据通信 大数据 数据挖掘

数据挖掘—数据挖掘的商业应用

各种形式的数据挖掘逐渐成为商业运作的一个主要组成部分。目前几乎所有的商业过程都涉及某种形式的数据挖掘。

云栖社区 数据存储与数据库 系统研发与运维 网络与数据通信 数据挖掘

数据挖掘——数据仓库

虽然存在数据仓库并不是数据挖掘的先决条件,但实际上,若能访问数据仓库,数据挖掘的任务就会变得容易的多。 数据仓库的主要目标是增加决策过程的“情报”和此过程的相关人员的知识。数据仓库对不同的人来说有不同的意义。

云栖社区 数据存储与数据库 系统研发与运维 深度学习 数据库 数据仓库 数据挖掘 OLAP 存储 数据存储

数据挖掘——大型数据集

我们分析和理解大规模数据集(成为大数据)的能力,远远落后于采集和存储数据的能力。

云栖社区 数据存储与数据库 系统研发与运维 网络与数据通信 大数据 数据处理 数据库 数据分析 数据挖掘 数据采集 存储 数据类型

数据挖掘——数据挖掘过程

数据挖掘:数据挖掘是从已知数据集合中发现各种模型,概要和导出值的过程 数据挖掘是一个迭代的过程:首先研究数据,利用某个分析工具来检查数据,然后从另一个角度来考虑这些数据,根据需要修改数据,接着从头开始,应用另外一个数据分析工具得到更好的或者不同的结果。

数据存储与数据库 网络与数据通信 深度学习 数据仓库 数据分析 数据挖掘

112
GO