1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. Y>
  5. 云计算搭建hadoop集群

当前主题:云计算搭建hadoop集群

云计算搭建hadoop集群相关的博客

查看更多 写博客

阿里云智能--基础产品技术月刊 2019年8月

一、商用产品技术 TOP1 智能接入网关SAG发布集中控制台配置功能,提升企业客户网络管理维护效率 在规模较大的企业用户场景,企业线下IDC之间以及访问云上资源,会在多地域部署阿里云智能接入网关SAG,传统的本地web配置,因为IT管理人员经验和技能水平参差

阅读全文

如何在 Apache Flink 中使用 Python API?

作者:孙金城(金竹)整理:韩非 本文根据 Apache Flink 系列直播课程整理而成,由 Apache Flink PMC,阿里巴巴高级技术专家 孙金城 分享。重点为大家介绍 Flink Python API 的现状及未来规划,主要内容包括:Apache

阅读全文

Docker容器实战(三) - Docker的自我重新定位

Docker公司为什么在Docker项目已经取得巨大成功之后,执意走回已经让无数先驱折戟的PaaS路呢? 实际上,Docker项目一直伴随着公司管理层和股东们的阵阵担忧。他们心里明白,虽然Docker项目备受追捧,但**用户们最终要部署的,还是他们的网站、服

阅读全文

好程序员大数据学习路线分享hadoop常用四大模块文件

  好程序员大数据学习路线分享hadoop常用四大模块文件   1.1.1core-site.xml(工具模块)   包括Hadoop常用的工具类,由原来的Hadoopcore部分更名而来。主要包括系统配置工具Configuration、远程过程调用RPC、

阅读全文

独家 | 关于数据湖架构、战略和分析的8大错误认知(附链接)

翻译:张玲 校对:丁楠雅 文章来源:微信公众号 数据派THU 本文打破有关数据湖的8个错误认知,错误认知包括3方面,还提出了5个小技巧,以构建一个灵活的、可交付业务价值的数据湖。 本文的目的是构建数据湖,并提供适应企业数据策略的背景信息。咨询公司和提供商提出

阅读全文

DataWorks高级功能场景化案例分享

DataWorks高级功能场景化案例分享 自2009年DataWorks立项,伴随着阿里巴巴集团登月计划、公共云和专有云的发布,直到2018年V2.0的发布,DataWorks已经走过了十年的历程。本文主要分享了DataWorks商业化增值版本中高级功能,分

阅读全文

实录|互联网架构“高可用”在线技术交流

前段时间,受@谢工 邀请,在GitChat平台首发《究竟啥才是互联网架构“高可用”》。 问:在缓存层rehash过程中必然会有脏数据。一致性hash实际上只能减少rehash的成本,不能消灭脏数据,这种脏数据有没有办法避免? 答:如文章《究竟啥才是互联网架构

阅读全文

数据库产品事业部月刊(2019年7月)

一、重点事件 阿里云峰会·上海站 & 开发者大会(7月24日-25日): 7月24日,阿里云开发者大会数据库专场圆满落幕,专场内容包括云数据库架构和演进、POLARDB、AliSQL 8.0的特性和改进、AnalyticDB for MySQL:PB级云数仓

阅读全文

云计算搭建hadoop集群相关问答

提问题

我们的DB数据是在阿里云上,请问我应该如何选择hadoop弹性计算框架

我们的数据DB是在阿里云上,请问我应该如何选择弹性计算框架? 我们的日均数据大概在千万到 亿的级别,需要利用到spark 的内存计算。 是直接用ODPS 比较好,还是 在ECS上搭建HADOOP 集群比较好? 或者是否可以 从阿里云DB上下载数据到我们自

阅读全文

MongoDB

简介编辑 MongoDB[1] 是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 mongoDB mongoDB MongoDB[2] 是一个介于关系数据库和非关系数据库之间的产品,是非关系数

阅读全文