1. 云栖社区>
  2. 全部标签>
  3. #大数据#
大数据

#大数据#

已有286人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

走进阿里云计算

2016阿里巴巴技术论坛,阿里云飞天总架构师唐洪、资深专家林伟、高级专家钱正平、安全研究员吴瀚清在云计算与大数据技术分论坛向我们呈现了精彩的演讲。本文是一个技术小白分享他参加分论坛的所见所闻。

大数据 阿里云 云计算 流计算 阿里巴巴技术论坛

Google, Facebook, Amazon, Apple的人工智能之争——收购AI开发团队

在过去的三年内,已经有超过六成的人工智能开发公司陆续获得了赞助。就仅仅在 2016年,已经出现了4次重要的大型公司竞购。

深度学习 大数据 人工智能 AI

代号“ GProfile ” ——独家解密阿里标签利器

你可能已经知道达摩盘,也可能接触过虾米音乐给你推荐的好歌,当然你肯定经常在购物时,收到系统给你推荐的产品……但你肯定不知道,在营销推荐、产品推荐的背后,是一个庞大的算法工程,其中的一款标签体系,从未对外公布。     今天阿里数据将会独家解密这一标签利器,它的内部代号是——GProfile

大数据 标签

靠谱么?人工智能为《我是歌手4》“占卜”

明天,《我是歌手4》总决赛,一起来看看阿里云小Ai的“占卜”能力如何?

大数据 阿里云 人工智能 预测 我是歌手

PyOdps 0.4版本发布,从一个故事说起

PyOdps 0.4版本,DataFrame API支持使用pandas进行本地计算,用户因此能join ODPS和本地数据,也能进行本地debug,另外还有MapReduce API等新特性

python 大数据 PyOdps DataFrame pandas MaxCompute

Spark如何使用Akka实现进程、节点通信的简明介绍

Akka是一款提供了用于构建高并发的、分布式的、可伸缩的、基于Java虚拟机的消息驱动应用的工具集和运行时环境。

大数据 分布式系统与计算 实时系统 spark Akka

基数估计

大数据

如何在E-MapReduce中玩转OSS

在E-MapReduce中,用户可以将OSS作为Hadoop/Spark的可选数据源之一。但是在实际使用时,我们发现Hadoop读写OSS的性能不令人满意。为了解决这个问题,E-MapReduce团队对Hadoop的底层实现进行了优化,使得OSS数据源能够更好地适配Hadoop/Spark。

大数据 分布式系统与计算 云存储技术 对象存储OSS

如何通过热修复,搞定开发中的那些 Bug?

作为程序员,Bug 修复终究是绕不开的话题,本期移动开发精英俱乐部讨论的主题便是 Bug 修复中的 Hotfix,即热修复。接下来让我们跟随大牛的脚步来了解 Hotfix,就算你不能一下豁然开朗,相信也一定会有所启发。非常感谢赖春辉的整理,本文系国内 ITOM 管理平台 OneAPM 审校。

大数据 性能管理 热修复

从“埋点技术已死?”开始说起

大数据时代的到来意味着数据量的爆炸,也意味着收集数据的难度将大幅增加。为了将海量的数据收集起来,埋点技术应运而生。然而随着大数据的发展和深入,用户的要求越来越高,埋点技术开始变得力不从心。 近期,一些公司开始以“无埋点技术”为卖点,开始到处宣传无埋点比埋点好,那么到底事实如何了? 埋点技术的时代

大数据 原创

一键扩容E-MapReduce集群,运维SO EASY

一键扩容E-MapReduce集群,运维SO EASY 谈到集群运维,我们不得不说说集群的扩容。随着业务量的增长,数据也会跟着增长,这样我们的集群规模也不得不跟着进行扩容。那么集群如何进行扩容呢,我们分下面的两个场景跟大家介绍一下 1. IDC机房集群扩容。当我们集群需要扩容的时候,一般会经过下

系统研发与运维 大数据 分布式系统与计算

“互联网+”的时代,易佳互联也随着时代步伐前进着

随着互联网的发展,我们在一步一步走向新的时代

互联网产品及应用 大数据

SparkContext的初始化(季篇)——测量系统、ContextCleaner等组件介绍

Spark按照Instance的不同,区分为Master、Worker、Application、Driver和Executor。Spark目前提供的Sink有ConsoleSink、CsvSink、JmxSink、MetricsServlet、GraphiteSink等。Spark中使用Metric

大数据 分布式系统与计算 spark scala 测量

SparkContext的初始化(叔篇)——TaskScheduler的启动

本文主要介绍TaskScheduler的启动过程。包括:创建LocalActor、 ExecutorSource的创建与注册、ExecutorActor的构建与注册、Spark自身ClassLoader的创建及启动Executor的心跳线程。 <img src="http://img.blog.c

大数据 分布式系统与计算 实时系统 spark scala

SparkContext的初始化(伯篇)——执行环境与元数据清理器

由于本书的第3章内容较多,所以打算分别开辟三篇随笔分别展现。本文展现第3章第一部分的内容: 第3章 SparkContext的初始化 “道生一,一生二,二生三,三生万物。”——《道德经》 本章导读:        SparkContext的初始化是Driver应用程序提交执行

大数据 分布式系统与计算 spark scala Akka

1897
GO