1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. R>
  5. 如何分析大数据

当前主题:如何分析大数据

如何分析大数据相关的博客

查看更多 写博客

Apache Spark中国技术交流社区历次直播回顾(持续更新)

8月28日【Spark Streaming SQL流式处理简介】 主讲人:云魄,阿里云E-MapReduce 高级开发工程师,专注于流式计算,Spark Contributor,开源爱好者 简介:本次直播将简要介绍EMR Spark Streaming SQ

阅读全文

Apache Spark中国技术交流社区历次直播回顾(持续更新)

8月28日【Spark Streaming SQL流式处理简介】 主讲人:云魄,阿里云E-MapReduce 高级开发工程师,专注于流式计算,Spark Contributor,开源爱好者 简介:本次直播将简要介绍EMR Spark Streaming SQ

阅读全文

【译】Hadoop发生了什么?我们该如何做?

原文:https://insidebigdata.com/2019/08/10/what-happened-to-hadoop-and-where-do-we-go-from-here/ Apache Hadoop出现在IT领域是在2006年,它可以支持使用

阅读全文

在 Apache Spark 中利用 HyperLogLog 函数实现高级分析

在 Apache Spark 中利用 HyperLogLog 函数实现高级分析 预聚合是高性能分析中的常用技术,例如,每小时100亿条的网站访问数据可以通过对常用的查询纬度进行聚合,被降低到1000万条访问统计,这样就能降低1000倍的数据处理量,从而在查询

阅读全文

回顾 | Apache Flink Meetup ·上海站(附PPT下载链接)

9 月 7 日,Apache Flink Meetup 上海站,上海的同学再次演绎了站无虚席的爆满场面。现场来自阿里巴巴、intel、趣头条的技术专家们分享了 Zeppelin 中玩转 Flink 与 Hive、趣头条的应用实践、Flink 性能优化、Ten

阅读全文

读透《阿里巴巴数据中台实践》,其到底有什么高明之处?

最近阿里巴巴分享了《阿里巴巴数据中台实践》这个PPT(自行搜索原始文章),对于数据中台的始作俑者,还是要怀着巨大的敬意去学习的,因此仔细的研读了,希望能发现一些不一样的东西。 读这些专业的PPT,实际是非常耗时的,你需要把这些PPT外表的光鲜扒光,死抠上面的

阅读全文

结构化数据存储,如何设计才能满足需求?

![1](https://yqfile.alicdn.com/9bfc4cb69cad1607e7a072f658fc7d13782a7051.png) 阿里妹导读:任何应用系统都离不开对数据的处理,数据也是驱动业务创新以及向智能化发展最核心的东西。数据处理

阅读全文

从大数据到快数据 数据智创未来——2019 CCF大数据与计算智能大赛正式开赛!

8月17日,以**“数据驱动,智创未来”**为主题的**2019 CCF大数据与计算智能大赛**(CCF Computing Intelligence Contest,简称CCF BDCI)全球启动仪式,在北京大学正式启幕。 CCF BDCI大赛是由中国计算

阅读全文

如何分析大数据相关问答

查看更多 提问题

金融行业如何搭建实用有效的Hadoop大数据平台,来实现数据采集,数据分析,数据挖掘?

搭建Hadoop大数据平台

阅读全文

Hadoop大数据平台如何实现对批量数据的快速管理与分析?

Hadoop分布式大数据的操作原理

阅读全文

【精品问答合集】Hbase热门问答

hbase 大量写入很慢 https://yq.aliyun.com/ask/50074 发现hbase文件大规模的丢失了 https://yq.aliyun.com/ask/46584 hbase启动脚本start-hbase的疑问 htt

阅读全文

2018spark技术问答集锦,希望能给喜欢spark的同学一些帮助

小编发现问答专区中有很多人在问关于spark的问题,小编把这些问题汇总一下,希望能给喜欢spark的大家一些启示和帮助 本帖不定期更新,喜欢的可以收藏哦 **如何在Apache Beam中实现类似Spark的zipWithIndex?** htt

阅读全文

2018python技术问答集锦,希望能给喜欢python的同学一些帮助

小编发现问答专区中有很多人在问关于python的问题,小编把这些问题汇总一下,希望能给喜欢python的大家一些启示和帮助 本帖不定期更新,喜欢的可以收藏哦 **python可能替代Java吗?感觉现在很多Java程序员都跑去学python。*

阅读全文

[@徐雷frank][¥20]每天千万级有一定规则数据量的数据库如何选型

# 问题场景 * 假如需保存CPU、进程数量、内存值、测点值,2秒保存一次,信号数量约50W * 实际存储按信号变化存储,既测点值变化才存储 * 估算存储数据约50W条,每一秒需保存一次记录,以便做报表分析 # 部分数据格式如下 | 信

阅读全文

如何建立大数据存储分析和共享平台

抽毕业论文题目的时候抽到了这个,我学的专业是物理学,对这方面几乎没什么了解,想请教这里的大牛,该从哪里开始学,或者应该怎么做这个项目,如果可以的话,想请一个懂这方面的老师,辅导我完成一下论文,肯定不会是无偿的,真心真心球球大家帮忙。 具体的题目和要求是:

阅读全文

[@talishboy][¥20]请教关于系统架构如何合理设计问题

目前计划搭建一个能处理6000+TPS的数据采集和分析系统,平均秒入库数据量大概3000条据(单条数据4k),数据保留一周,主要业务是入库和集可数据报表查询,请问大牛我应该怎么搭建此业务系统。 1、需要采用什么技术、数据库、中间件。 2、保证业务可用,造价

阅读全文