容器和微服务在Hadoop生态系统中找到一席之地

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 本文讲的是容器和微服务在Hadoop生态系统中找到一席之地【编者的话】容器和微服务凭借构架上的灵活优势,已经杀进了Hadoop生态系统。分别位于德国和美国两家公司的技术高管对此提出了自己的观点。
本文讲的是容器和微服务在Hadoop生态系统中找到一席之地【编者的话】容器和微服务凭借构架上的灵活优势,已经杀进了Hadoop生态系统。分别位于德国和美国两家公司的技术高管对此提出了自己的观点。

最近关于大数据的实践多是基于裸机的,这意味着Hadoop已经在非虚拟服务器上被广为实现。随着容器和微服务在应用服务界越来越受欢迎,这个现状也可能会发生改变。

容器和微服务都可将单层应用(monolithic application)的代码拆分为更为精细的部件,简化了开发和测试,也是部署复杂应用和代码重用的关键。

虽然刚开始将这种技术应用于大数据,但在数据流方面,微服务已经显示出良好的潜力。欧洲电商公司一位技术经理表示,微服务可以简化部署和代码重用。

Otto GmbH是德国汉堡一家多渠道零售商,它的商业智能系统的首席平台架构师Rupert Steffner表示,使用微服务,“可以精简当前的工作”,进一步说,对于某些类型的应用,如果不使用微服务,“是不明智的做法,因为你是在不停重复同样的功能。”

Steffner所说的应用类型即对在线零售网站进行实时分析工作的多功能人工智能(AI)机器人程序。Otto融合了微服务、Docker容器和流处理技术来支持这些AI机器人程序。

容器和微服务,厉害了

云计算是将Hadoop、Spark和其他大数据技术推向虚拟化、容器和微服务的动力之一。还有许多基础设施需要构建,但目前已经有公司开始用技术简化这个过程。

“以前Hadoop多运行在裸机上,后来在虚拟机上也可以了;比如亚马逊云、Azure云和OpenStack。而现在,又要转移到容器上去。”Tom Phelan,BlueData软件公司的联合创始人和首席架构师,该公司是Hadoop或Spark集群自动生成平台制造商。

“以前,Hadoop集群在裸机上的表现更好,但这种情况正在改变,”Tom Phelan说。他承认容器还需要进一步成熟,并提到Hadoop最初的设计并不是微服务类型的架构。位于加州圣克拉拉的BlueData最近更新了软件以增强容器支持,推出Hadoop集群Kerberos自动设置和Linux特权访问管理工具。

微服务的另两个驱动因素是敏捷性和流,Hadoop发行版厂商MapR Technologies公司的MapR数据和应用方面的高级副总裁,JackNorris表示,使用机器人程序的顾客需要快速适应数据和机器学习模型。

对“事件驱动”型构架的应用来说尤为如此,因为这样的构架包含越来越多的数据流组件。Norris说,随着Hadoop和Spark应用流变得越来越复杂,更新也变得越来越难了。但是,由于微服务专注于数据管道事件,这会给发展带来更多的灵活性。这也改变了之前 Hadoop的发展方式。

“我们认为有必要开启更多更广的应用,”Norris说。同时,他承诺MapR会继续支持当前的单层应用。

上个月,MapR试图进一步在大数据方面推动微服务的进展,即尝试用微服务对应用做版本管理,并将微服务用于机器学习模型的A/B测试。另外,据Norris说,有新的参考构架可以用来指导开发者通过微服务融合流数据和实时分析应用。

AI机器人程序盯着空空的购物车

随着大数据处理工作成为数据流组件更加复杂的集合,微服务拓宽了应用的广度。Otto公司的Steffner表示,微服务提供了典型的“分而治之”的思路来满足构架上的需要。

Steffner曾在上个月于纽约举办的Strata +Hadoop2016世界大会上发言,他说,Otto公司的数据构架中,每个AI机器人程序都处理一个特定的任务。例如,某个AI机器人程序专门寻找欺诈性交易,另一个则使用分析模型来投放实时广告,还有一个AI机器人程序专门检查空购物车,并在用户没有购买任何商品就要离开网站时放出优惠。

Steffner说,这些工作是通过基于Docker的微服务架构完成的,当时是2015年的十月份,而在两年之前,在常规的大数据平台上是做不到这一点的。

Steffner还说,Docker容器十分契合机器人程序的概念。Otto公司在后端安装了一系列的开源的流处理引擎,包括 Storm Spark Streaming Flink  和 Ignite 。在目前的环境下,Ignite(由GridGain 系统公司原创的内存数据结构技术)承担了大部分的实施处理工作。

原文链接:Containers and microservices find home in Hadoop ecosystem(翻译:马远征)

原文发布时间为:2016-11-09

本文作者:马远征

本文来自云栖社区合作伙伴Dockerone.io,了解相关信息可以关注Dockerone.io。

原文标题:容器和微服务在Hadoop生态系统中找到一席之地

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
Kubernetes 开发者 Docker
基于容器技术的微服务架构
基于容器技术的微服务架构
33 0
|
2月前
|
监控 数据可视化 关系型数据库
微服务架构+Java+Spring Cloud +UniApp +MySql智慧工地系统源码
项目管理:项目名称、施工单位名称、项目地址、项目地址、总造价、总面积、施工准可证、开工日期、计划竣工日期、项目状态等。
307 6
|
1月前
|
人工智能 运维 监控
构建高性能微服务架构:现代后端开发的挑战与策略构建高效自动化运维系统的关键策略
【2月更文挑战第30天】 随着企业应用的复杂性增加,传统的单体应用架构已经难以满足快速迭代和高可用性的需求。微服务架构作为解决方案,以其服务的细粒度、独立性和弹性而受到青睐。本文将深入探讨如何构建一个高性能的微服务系统,包括关键的设计原则、常用的技术栈选择以及性能优化的最佳实践。我们将分析微服务在处理分布式事务、数据一致性以及服务发现等方面的挑战,并提出相应的解决策略。通过实例分析和案例研究,我们的目标是为后端开发人员提供一套实用的指南,帮助他们构建出既能快速响应市场变化,又能保持高效率和稳定性的微服务系统。 【2月更文挑战第30天】随着信息技术的飞速发展,企业对于信息系统的稳定性和效率要求
|
12天前
|
分布式计算 资源调度 监控
Hadoop生态系统深度剖析:面试经验与必备知识点解析
本文深入探讨了Hadoop生态系统的面试重点,涵盖Hadoop架构、HDFS、YARN和MapReduce。了解Hadoop的主从架构、HDFS的读写流程及高级特性,YARN的资源管理与调度,以及MapReduce编程模型。通过代码示例,如HDFS文件操作和WordCount程序,帮助读者巩固理解。此外,文章强调在面试中应结合个人经验、行业动态和技术进展展示技术实力。
|
17天前
|
数据采集 运维 监控
微服务监控:守护系统稳定的终极防线
微服务监控在数字化时代日益重要,它帮助运维和开发人员实时监测服务性能、状态和安全,确保微服务架构的稳定性和可用性。构建微服务监控体系需关注合理监控策略、数据采集处理、可视化及告警。数据采集的三大支柱是指标、日志和链路追踪。监控涵盖基础设施、系统、应用和业务层面。通过优化监控体系、融合业务场景和建立跨团队协作,可提升监控效果。未来,AI和云计算将推动微服务监控向更精准、高效和安全的方向发展。
24 0
|
1月前
|
Kubernetes SDN 微服务
微服务与 Kubernetes 容器云的边界
【2月更文挑战第30天】该文探讨了微服务与Kubernetes集群的关系,主要关注是否应跨多集群部署。理想的状况是每个微服务对应一个Kubernetes集群,配置和注册中心在同一集群内,以减少网络延迟。
|
1月前
|
运维 应用服务中间件 调度
微服务容器化的运维
【2月更文挑战第27天】
|
1月前
|
运维 API Docker
深入浅出:微服务架构与容器化技术的完美融合
【2月更文挑战第13天】 在现代软件开发领域,微服务架构和容器化技术已成为推动企业快速发展的两大核心力量。本文将从微服务的基本概念出发,深入探讨其与容器化技术结合的必然性与优势,进而分析如何在实践中有效地实现二者的完美融合。通过对微服务架构的细致解析及容器化技术的应用展示,旨在为读者提供一种全新的视角,理解并掌握这一前沿技术趋势,以指导实际工作中的技术选择与架构设计。
|
2月前
|
运维 Java Docker
微服务容器化实践
【2月更文挑战第6天】
|
2月前
|
开发者 Docker 微服务
深入浅出:使用Docker容器化部署微服务架构
在当今快速迭代的软件开发环境中,微服务架构因其高度解耦和独立性而成为企业首选。然而,微服务的管理和部署可能会变得复杂和繁琐。本文将探讨如何利用Docker,一个轻量级的容器化技术,来简化和加速微服务的部署。我们将从Docker的基础概念入手,详细介绍如何创建、配置和运行微服务容器,最后讨论Docker在微服务架构中的优势和挑战。本文旨在为开发者提供一条清晰的路径,通过容器化技术实现微服务架构的高效部署和管理。
87 0