大数据真的在云计算上的快车上吗?

简介:

软件初创厂商AtScale公司去年年底发布了其年度大数据成熟度调查报告(以前称为“Hadoop成熟度调查”),显示商业智能大数据是首要任务,并正处于云计算的快速发展阶段,数据治理越来越受到关注。

该报告及其结果在最近ODPi用户顾问委员会(UAB)的会议上成为了一个主要的讨论话题,ODPi用户顾问委员会(UAB)是由来自汽车,技术和娱乐行业等使用Apache Hadoop和其他大数据技术的大型企业的代表组成。ODPi UAB十分认同报告中所提出的日益增长的数据治理问题。自助服务访问大数据和这种自助服务的治理确实触动了人们的心弦。行业专家讨论了让人们帮助推动自助服务访问政策的概念,这反映出越来越多的数据科学家是业务部门的一部分,而不是IT部门。该小组一致认为,仅持有治理和安全控制的IT目前的状态是不具成本效益的,而自治可能是一种帮助规模使用的策略。

关于云计算中大数据的主题,ODPi UAB在混合云模型中看到了他们的未来。虽然他们认为人们将在未来三年内看到云计算更多的应用,但他们将会在现有投资的基础上开展,而不是完全取代现有的投资。此外,ODPi UAB认为现有的中央处理与本地处理节点相辅相成,以帮助扩大需求,更好地遵守法规。目前,UAB成员看到全面扩展到云计算成本过高,但随着物联网数据本身运行的用例开始增长,云计算将变得更加有趣。

大数据真的在云计算上的快车上吗?

在ODPiUAB阐述之后,然后回到企业自己的使用模式。在本文中将介绍这些使用模式,ODPiUAB提供的见解以及云计算在Hadoop和大数据中的作用的体验。预生产和生产Hadoop之间有明显的区别。

表1概述了随着企业使用情况的变化,运营Hadoop的核心差异。

大数据真的在云计算上的快车上吗?

AtScale公司的报告指出,73%的受访者在使用生产,与2015年同期相比增长了8%。调研机构Gartner公司的业务调查报告为15%以上。由于在数量上有如此大的差异,很明显在行业中部署阶段的基线定义并不明确。UAB和ODPi成员在这里已经提出了这个详细的部署,认为它们与市场准确匹配。

大数据真的在云计算上的快车上吗?
企业Hadoop部署连续性

绘制出适合于连续性的位置,可以更客观地看待生产使用情况。

分析大数据的云计算

虽然72%的受访者表示计划在云端实施大数据,但更深入的分析可能会显示出一些重要的细微差别。UAB成员希捷技术公司企业分析总监Nicholas Berg表示:“要进行深入研究,人们还会问:企业的应用程序和IT在本地部署数据中心和云计算中的比例是多少?企业的大数据在本地部署数据中心和云计算中的比例是多少?最后,企业在云中的实际生产有多少?我敢打赌这个百分比要小得多。”

另一个ODPiUAB成员评论说:“我认为很多公司只是在云中进行概念验证(POC)测试,但仍然在内部数据中心进行生产部署。”UAB认为,这里的主要驱动力是人们认识到IT需要最大限度地降低风险和成本。

这引出了云计算中最大的没有解决的问题:成本。多年来,云计算供应商一直在推动“降低成本和复杂性-走向云”的叙述,“避免服务器采购的资本支出-只是利用云”等等。然而,ODPiUAB明确的一个因素是,当企业扩大规模时,云计算将变得更昂贵。

ODPi UAB一位成员谈到自己的经验,并表示,“最近,我们已经对数字不起作用做了一些成本分析,而不是当人们谈论入口或出口数据量时重新考虑。这就是云供应商的成本真正开始飞涨的地方,因此,当企业完全转向云端时数字不起作用。所以我们仍然在考虑实验的目的,但是没有看到人们如何完全移动到云端,甚至考虑把大量的系统移到那里。我发现云端工作适用于小规模的子集,如果企业愿意,这可能是一种聚合,但是一旦试图进行长期的存储,它将使成本增加的非常快速。”

这是否意味着ODPi UAB成员感觉到Hadoop和云中的大数据是注定失败的,除非成本下降?当然不是。对他们来说,问题在于云计算的叙述,而在场景上,不断被认为是““非此即彼”的讨论,而不是“两者兼用”的讨论。

云计算:物联网数据的用例

ODPi UAB的一位成员分享了一个物联网数据的使用情况,“当企业正在考虑解决某些问题时,将不同区域的数据转移到云计算中处理,云计算开始变得更有意义。当人们开始谈论物联网时尤其如此,企业难道真的想在自己的数据中心运行所有的物联网数据吗?人们查看一下描述的用例,就会发现所有的数据在自己的数据中心将面临一些问题,无论是在数量上还是在法律上。例如德国等一些国家,除非要在这些国家建立数据中心。”而其他专家也赞同这种看法。他说:”我们认为云平台的存在也是一个挑战,特别是作为一家在全球各地设有办事处的全球性公司,如果不想在每个国家和地我建立数据中心,那么采用云计算是一个很好的选择。”

从上述所有ODPi UAB反馈意见来看,很明显,云计算将继续成为Hadoop和大数据的一个组成部分,但与组织的成本和效率需求保持一致。换句话说,就像其他技术转向云端一样,最现实的答案往往在某种形式的混合中。Nicholas Berg说,“我想随着时间的推移,Hadoop将在云中的应用更加广泛,希望其成本结构变得更加合理,事情就会开始转变。我认为这是会发生的,只是时间问题。我们可能总是有某种混合部署,随着经济和用例更好地随着时间的推移,云计算的使用率可能会更高。”

下一件大事

人们生活在行业中,坦率地说是一个世界中-而寻求下一件大事情,将会激发行业人士成长和发展的愿望。行业先锋经常拒绝接受现状,认识到完美从未实现,并总是不断追求。正如Vince Lombardi曾经说过,“完美是无法实现的,但如果我们追求完美,那么我们可以实现卓越。”

话虽如此,有一件很少有成果的事情就是强化创新。顺应技术潮流,应对现代生活的挑战和机遇,如果你听过专业运动员的采访,他们总是会说下一步要达到什么目标,技术也是如此,但规模更大,人们对此并不总是很清楚。


原文发布时间为:2017-10-26 

本文作者:佚名

本文来自云栖社区合作伙伴“51CTO”,了解相关信息可以关注。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 大数据 数据挖掘
云计算与大数据:从基础设施到实际应用
云计算与大数据:从基础设施到实际应用
99 0
|
1月前
|
存储 大数据 数据挖掘
python数据分析——大数据和云计算
大数据和云计算作为当代信息技术的两大核心驱动力,正在以前所未有的速度改变着我们的生活、工作和思维方式。它们不仅为各行各业的创新提供了强大的技术支持,更是推动了整个社会的数字化转型。 从大数据的角度来看,它的核心价值在于通过对海量数据的收集、存储、分析和挖掘,发现其中的关联性和趋势,从而为决策提供更为科学、精准的依据。无论是商业领域的市场预测、消费者行为分析,还是公共服务领域的城市规划、交通管理,大数据都发挥着不可或缺的作用。同时,随着物联网、传感器等技术的普及,大数据的来源和种类也在不断扩展,这使得我们能够更全面地认识世界,把握规律。
47 0
|
2月前
|
监控 物联网 大数据
智慧工地管理平台系统源码基于物联网、云计算、大数据等技术
智慧工地平台APP通过对施工过程人机料法环的全面感知、互联互通、智能协同,提高施工现场的生产效率、管理水平和决策能力,实现施工管理的数字化、智能化、精益化。
51 0
|
4月前
|
资源调度 分布式计算 大数据
【云计算与大数据技术】资源管理、调度模型策略的讲解
【云计算与大数据技术】资源管理、调度模型策略的讲解
102 0
|
4月前
|
资源调度 大数据 调度
【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)
【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)
61 2
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
2月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 1
|
2月前
|
分布式计算 关系型数据库 数据库连接
MaxCompute数据问题之数据迁移如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
31 0