阿里云智能事业群 EMR团队招人啦!

简介: 加入我们,成为分布式存储,计算和调度等领域的专家,与众多业界和社区技术专家一起工作,加速大数据上云,投身数字时代新基建。

团队介绍

阿里云智能事业群 EMR 是阿里巴巴计算平台事业部的开源大数据生态体系核心技术团队。我们以 Apache Hadoop 和 Spark为核心打造一站式大数据分析平台,在阿里云上提供有竞争力的 E-MapReduce大数据上云服务产品套件,涵盖众多主流核心开源组件,如 Hadoop,Spark,Hive,Presto,Kafka,Hbase,Flink,Tensorflow 等。在过去一年,基于最新打造的 Jindo Spark 核心引擎,E-MapReduce 产品先后两次打破 TPC-DS 世界记录。我们的技术团队不仅包括阿里飞天大数据资深优化专家,同时围绕开源技术体系构建,包括来自Apache Hadoop/Spark/Flink/Hive 等顶级开源项目的多位PMC/Committer成员。我们热烈欢迎有志于开源技术体系核心引擎研发和优化的同学加入 EMR团队,与众多业界和社区技术专家一起工作,加速大数据上云,投身数字时代新基建。

职位描述

•基于Hadoop、Spark、Hive、HBase、Flink,Kafka,TensorFlow等开源大数据组件,构建云原生大数据平台,提供大规模计算能力

•以 Apache Spark 为核心,深度结合阿里云对象存储和弹性计算能力,打造云上开源大数据核心引擎

•使用最新的大数据和AI技术,打造智能化的数据分析和机器学习平台

•打造世界顶级的开源大数据平台,在公共云、裸机、私有云和混合云等环境, 为阿里云客户提供云原生大数据全家桶服务

•参与阿里云城市大脑、智慧交通等多项国家战略项目建设,利用实时/批技术处理真实世界中的海量数据

校招/实习职位要求

1.计算机、通信、数学等相关专业,具备良好的计算机技术基础

2.熟悉Java/C++/Python/GO等至少一种编程语言,具备扎实的数据结构和算法基础

3.具备良好的沟通和团队协作能力,做事主动积极,有技术热情和激情面对挑战

4.对大规模分布式存储,计算和调度有较好基础理论研究的同学优先

5.熟悉Hadoop/Spark/Hive/Flink/HBase/Kafka/TensorFlow/Kubernetes 技术者优先

欢迎投递简历到邮箱:zhengkai.zk@alibaba-inc.com,投递时请写明工作地(北京/杭州/上海)

社招职位要求

•在分布式存储,计算和调度等领域有多年工作经验和较深技术积累;

•源码层面熟悉一个或多个开源组件,包括Hadoop,Spark,Flink,Hbase,Hive,Kafka,TensorFlow,Kubernetes;

•具备良好的沟通和团队协作能力,做事主动积极,有技术热情和激情面对挑战;

欢迎投递简历到邮箱:zhengkai.zk@alibaba-inc.com,投递时请写明工作地(北京/杭州/上海)

校招海报-计算平台2020.png

相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
1月前
|
SQL 人工智能 数据挖掘
阿里云DMS,身边的智能化数据分析助手
生成式AI颠覆了人机交互的传统范式,赋予每个人利用AI进行低门槛数据分析的能力。Data Fabric与生成式AI的强强联合,不仅能够实现敏捷数据交付,还有效降低了数据分析门槛,让人人都能数据分析成为可能!阿里云DMS作为阿里云统一的用数平台,在2021年初就开始探索使用Data Fabric理念构建逻辑数仓来加速企业数据价值的交付,2023年推出基于大模型构建的Data Copilot,降低用数门槛,近期我们将Notebook(分析窗口)、逻辑数仓(Data Fabric)、Data Copilot(生成式AI)进行有机组合,端到端的解决用数难题,给用户带来全新的分析体验。
110091 118
阿里云DMS,身边的智能化数据分析助手
|
3月前
|
开发工具 开发者
阿里云 在智能媒体服务中,智能生产制作时长包,可以批量混剪视频吗?
【1月更文挑战第15天】【1月更文挑战第73篇】阿里云 在智能媒体服务中,智能生产制作时长包,可以批量混剪视频吗?
179 5
|
29天前
|
分布式计算 运维 大数据
阿里云 EMR Serverless Spark 版免费邀测中
阿里云 EMR Serverless Spark 版,以 Spark Native Engine 为基础,旨在提供一个全托管、一站式的数据开发平台。诚邀您参与 EMR Serverless Spark 版免费测试,体验 100% 兼容 Spark 的 Serverless 服务:https://survey.aliyun.com/apps/zhiliao/iscizrF54
390 0
阿里云 EMR Serverless Spark 版免费邀测中
|
1月前
|
人工智能 IDE API
灵动指尖 :阿里云智能编码插件 更好的为IDE内置社区服务
灵动指尖 :阿里云智能编码插件 更好的为IDE内置社区服务
|
1月前
|
存储 人工智能 自然语言处理
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据Gartner报告,到2025 年60%的B2B 销售组织将从基于经验和直觉的销售转变为数据驱动的销售,将销售流程、销售数据、销售分析合并形成一致的运营实践。
394 0
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
|
2月前
|
机器学习/深度学习 人工智能 供应链
阿里云 RPA:智能自动化的未来
随着科技的飞速发展,机器人流程自动化(RPA)正逐渐成为各行业提高效率和降低成本的重要手段。阿里云 RPA 作为领先的智能自动化解决方案,为企业和组织提供了强大的功能和无限的可能性。本文将探讨阿里云 RPA 在智能自动化领域的发展趋势、应用场景以及未来展望。
|
2月前
|
运维 安全 容灾
简单易用的智能云网,阿里云网络持续演进之路
2023年10月31日,杭州·云栖大会,在阿里云网络技术分论坛,阿里云网络产品线负责人祝顺民《Leadership:简单易用的智能云网络——阿里云网络持续演进之路》的主题演讲,全面阐释阿里云飞天洛神云网络的产品思考和能力升级。
392 0
|
2月前
|
人工智能 运维 云计算
阿里云周靖人:拓展智能边界,开启云计算在新时代
阿里云CTO周靖人在2023年10月31日云栖大会上的演讲:从六个维度进行阐述,如何拓展智能边界,开启云计算崭新时代。
198 1
|
3月前
|
存储 分布式计算 Apache
阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse
Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文在阿里云EMR上,针对数据实时入湖场景,对 Paimon 和 Hudi 的性能进行比对,并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。
64609 1
阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse
|
3月前
|
存储 人工智能 算法
【阿里云产品测评】揭秘阿里云向量检索服务:赋予智能时代搜索新“维度”
【1月更文挑战第3天】在数字化洪流席卷全球的今天,信息的表达与检索方式正在悄然变革。从字符到图像,再到复杂的多维度数据,我们正在步入一个深度理解、精准匹配的智能搜索新时代。此刻,阿里云推出的向量检索服务正以前沿技术之力,引领这一领域的创新潮流。 阿里云向量检索服务,内核采用自研的Proxima引擎,其强大之处在于能够实现水平拓展、全托管和云原生的高效向量检索。这就好比构建了一个可以无限延伸的“知识宇宙”,无论是大规模图像识别、语音识别模型生成的特征向量,还是复杂的大模型知识库结构化信息,都能通过向量化的形式被管理和高效检索。