开源大数据周刊-第29期

简介:

阿里云E-Mapreduce动态

E-Mapreduce产品即将发布的版本信息如下:

1.5.2版本

  • 增加预定制配置,如试用型/入门型/计算型/内存型等
  • 增加包年包月自动续费功能

1.6.0版本

  • 交互式查询(支持Hive、Spark)

资讯

  • CIO时代学院院长姚乐:大数据的行业应用策略

    关于大数据的发展,CIO时代学院院长姚乐认为有三个趋势值得我们关注:第一、数据资源鉴权问题;第二、与云计算的深度融合;第三、与人工智能的深度融合。
    
  • 美国大选背后的个人隐私与大数据

    美国总统竞选从来都是一项注重公众参与的活动,了解公众的需求,获得公众的喜好再加以满足,是入主白宫的根本;现在的候选人们早已意识到,数据技术是必要的途径。
    
  • 数据变现独角兽-10种商业模式

    数据,已经成为每一个行业和各种业务职能领域重要的生产因素和变革力量。数据的积累、合作、整理、挖掘、利用是现代企业所必需的基本素养,没有它,你的企业将无力面对大数据时代的竞争。文章就困扰企业决策者的诸多问题,总结和分享了10种商业模式。
    
  • 企业部署云计算之后,下一步会考虑什么?

    移动信息化研究中心认为:国内企业部署云计算实现预期收益之后,将继续进行预算追加。
    
  • (技术)一篇文读懂分布式系统本质:高吞吐、高可用、可扩展

    分布式系统几乎是解决互联网业务承载量问题的最基本方法,所以作为一个服务器端程序员,掌握分布式系统技术就变得异常重要了。文章从吞吐,并发,延迟和负载四个角度来说明如何构建一个高可靠,高可用,高性能和可扩展的分布式系统。
    
  • (技术)HBase高可用原理与实践

     文章介绍了HBase上常见的几种高可用问题,并深入介绍了HBase如何解决这些问题以及HBase高可用特性的实现原理。
    
  • (技术)Scalable Stream Processing: A Survey of Storm, Samza, Spark and Flink

    文章全面比较了Storm,Trident,Samza,Spark Streaming,Flink(Streaming)流式处理框架的特性,同时提供了Apex ,Heron,MillWheel,Beam, IBM Infosphere Streams等等流式处理器的特性。
    
  • (技术)Spark 在反作弊聚类场景的实践

    针对批量的 spammer内容和行为,聚类是一种替代人工策略行之有效的方法,文章尝试使用聚类的方式去发现和挖掘spammer。anti-spam现阶段使用到聚类的场景主要有面向内容和行为的聚类。
    

欢迎加入阿里云开源大数据交流钉钉群

screenshot

国内大数据相关会议

| 会议 | 地点 | 时间 | 费用 |
| --- | --- | --- | --- |
|ArchSummit北京2016|北京 | 2016.12.2-3 | 6800元起 |

版权声明

信息都是来自互联网,都给出了原文的链接,如果侵权,请联系我们,我们负责删除。

阿里云E-Mapreduce团队 出品

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
存储 SQL 分布式计算
开源大数据比对平台设计与实践—dataCompare
开源大数据比对平台设计与实践—dataCompare
59 0
|
4月前
|
SQL 大数据 关系型数据库
开源大数据比对平台(dataCompare)新版本发布
开源大数据比对平台(dataCompare)新版本发布
68 0
|
4月前
|
SQL 存储 分布式计算
从0到1介绍一下开源大数据比对平台dataCompare
从0到1介绍一下开源大数据比对平台dataCompare
102 0
|
5月前
|
机器学习/深度学习 分布式计算 大数据
开源大数据平台的发展
开源大数据平台的发展
63 0
|
5月前
|
人工智能 分布式计算 大数据
开源大数据平台 3.0 技术解读
阿里云研究员,阿里云计算平台事业部开源大数据平台负责人王峰围绕新一代的流式湖仓、全面 Serverless 化、更智能的开源大数据等多维度解读开源大数据平台 3.0~
1011 1
开源大数据平台 3.0 技术解读
|
1月前
|
SQL 存储 监控
构建端到端的开源现代数据平台
构建端到端的开源现代数据平台
49 4
|
4月前
|
SQL 存储 大数据
从0到1介绍一下开源大数据服务平台dataService
从0到1介绍一下开源大数据服务平台dataService
101 1
|
4月前
|
大数据 Linux KVM
【云计算与大数据技术】虚拟化技术、开源技术Xen、KVM、OpenVZ的讲解(图文解释 超详细)
【云计算与大数据技术】虚拟化技术、开源技术Xen、KVM、OpenVZ的讲解(图文解释 超详细)
93 0
|
4月前
|
存储 人工智能 大数据
2023云栖陈守元,阿里云开源大数据产品年度发布
阿里云计算平台事业部开源大数据产品总监陈守元围绕EMR、Flink Streaming Lakehouse、 Elasticsearch、Milvus等产品发布展开分享介绍。
256 2
|
6月前
|
存储 分布式计算 数据可视化
开源在大数据和分析中的角色
开源在大数据和分析中的角色
48 0