开源大数据周刊-第29期-阿里云开发者社区

开源大数据周刊-第29期

2016-11-10 1834

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

阿里云E-Mapreduce动态

E-Mapreduce产品即将发布的版本信息如下：

1.5.2版本

增加预定制配置，如试用型／入门型／计算型／内存型等
增加包年包月自动续费功能

1.6.0版本

交互式查询（支持Hive、Spark）

资讯

CIO时代学院院长姚乐：大数据的行业应用策略

关于大数据的发展，CIO时代学院院长姚乐认为有三个趋势值得我们关注：第一、数据资源鉴权问题；第二、与云计算的深度融合；第三、与人工智能的深度融合。

美国大选背后的个人隐私与大数据

美国总统竞选从来都是一项注重公众参与的活动，了解公众的需求，获得公众的喜好再加以满足，是入主白宫的根本;现在的候选人们早已意识到，数据技术是必要的途径。

数据变现独角兽-10种商业模式

数据，已经成为每一个行业和各种业务职能领域重要的生产因素和变革力量。数据的积累、合作、整理、挖掘、利用是现代企业所必需的基本素养，没有它，你的企业将无力面对大数据时代的竞争。文章就困扰企业决策者的诸多问题，总结和分享了10种商业模式。

企业部署云计算之后，下一步会考虑什么？

移动信息化研究中心认为：国内企业部署云计算实现预期收益之后，将继续进行预算追加。

（技术）一篇文读懂分布式系统本质：高吞吐、高可用、可扩展

分布式系统几乎是解决互联网业务承载量问题的最基本方法，所以作为一个服务器端程序员，掌握分布式系统技术就变得异常重要了。文章从吞吐，并发，延迟和负载四个角度来说明如何构建一个高可靠，高可用，高性能和可扩展的分布式系统。

（技术）HBase高可用原理与实践

 文章介绍了HBase上常见的几种高可用问题，并深入介绍了HBase如何解决这些问题以及HBase高可用特性的实现原理。

（技术）Scalable Stream Processing: A Survey of Storm, Samza, Spark and Flink

文章全面比较了Storm，Trident，Samza，Spark Streaming，Flink（Streaming）流式处理框架的特性，同时提供了Apex ，Heron，MillWheel，Beam， IBM Infosphere Streams等等流式处理器的特性。

（技术）Spark 在反作弊聚类场景的实践

针对批量的 spammer内容和行为，聚类是一种替代人工策略行之有效的方法，文章尝试使用聚类的方式去发现和挖掘spammer。anti-spam现阶段使用到聚类的场景主要有面向内容和行为的聚类。

欢迎加入阿里云开源大数据交流钉钉群

screenshot

国内大数据相关会议

| 会议 | 地点 | 时间 | 费用 |
| --- | --- | --- | --- |
|ArchSummit北京2016|北京 | 2016.12.2-3 | 6800元起 |

版权声明

信息都是来自互联网，都给出了原文的链接，如果侵权，请联系我们，我们负责删除。

阿里云E-Mapreduce团队出品

相关实践学习

简单用户画像分析

本场景主要介绍基于海量日志数据进行简单用户画像分析为背景，如何通过使用DataWorks完成数据采集、加工数据、配置数据质量监控和数据可视化展现等任务。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

开源大数据周刊-第29期

阿里云E-Mapreduce动态

资讯

欢迎加入阿里云开源大数据交流钉钉群

国内大数据相关会议

版权声明

开源大数据平台 E-MapReduce

热门文章

最新文章

相关课程

相关电子书

相关实验场景