英特尔马子雅:深度学习四大痛点与BigDL解决之道

简介:
 
  【51CTO.com原创稿件】在万物智能互联时代,数以亿计的智能互联设备及其产生的数据洪流带来了产业的数字化变革。越来越多的企业希望借助机器学习与深度学习,从海量数据中获取切实可行的洞察以指导企业决策、创造更多价值。借助计算、存储和网络等基础设施的优势,英特尔在数据分析与人工智能领域深耕已久,并通过与合作伙伴的合作,给用户提供了端到端的软硬件全平台解决方案。近期,由O'Reilly Media和Cloudera联合举办的Strata Data Conference大会在京召开。期间,笔者受邀采访了英特尔公司软件与服务事业部副总裁、系统技术和优化部门大数据技术总监马子雅,英特尔大数据首席架构师、资深首席工程师戴金权,Cloudera联合创始人兼首席技术官Amr Awadallah,以及Cloudera 大中华区总经理、公司副总裁凌琦,就英特尔与Cloudera在数据分析和人工智能方面的合作话题进行了探讨。

倍数提升的数据分析性能

7月12日,英特尔正式推出了至强可扩展处理器,由于采用全新的内核微架构、核内互联和内存控制器,因此基于至强可扩展处理器的平台提供了更加优化的数据中心和网络基础设施所需的性能、可靠性和可管理性,使得企业获得更高性能,将洞察付诸实施、实现业务连续性,并满足实时服务交付方面的需求。

英特尔提供的数据显示,与上一代产品相比,英特尔至强可扩展处理器的整体性能提升达1.65倍,OLTP仓库负载比当前系统提高达5倍。借助英特尔AVX-512以及集成英特尔OPA端口,英特尔至强可扩展处理器可将每秒浮点运算性能最高提升到2倍。相比上一代产品,英特尔至强可扩展处理器的大数据工作负载基本性能提升了2.7倍,针对深度学习训练和推理可提供高达2.2倍的性能。结合可加快交付人工智能服务的软件优化,相比3年前未经优化的服务器系统,全新的处理器可实现113倍深度学习性能的提升。

除了硬件升级之外,英特尔与Cloudera深度合作,在软件方面进行了全面优化。优化之后,Hbase非堆存储读操作性能提升了5.6倍,在没有增加任何硬件成本的情况下,阿里巴巴在“双11”时把HBase的Throughput提升了30%,吞吐量提升了30%。此外,把MKL应用到用户Spark机器学习的工作负载中,并实现了4.3倍的性能提升。

英特尔公司软件与服务事业部副总裁,系统技术和优化部门大数据技术总监马子雅表示,英特尔通过硬件升级和软件优化来帮助推进技术民主化,至强可扩展处理器已经正式推出,硬件升级已经完成。通过与合作伙伴的合作,对软件进行全面优化,性能和性价比都有了前所未有的提升。并且,英特尔已经将所有的软件优化代码全部贡献给了开源,并包含在最新的Cloudera发行版中。

深度学习存在着四大痛点

很多用户认为深度学习的主要痛点是性能,只要有足够强大的性能,即可以解决深度学习存在的各种问题。在马子雅看来,性能并非深度学习的主要痛点,用户的真正痛点主要有四个方面。

一是如何利用已有的海量数据分析平台,比如Hadoop、Spark,或者是跟已有的分析应用程序直接结合,而不是单独作为一个分开训练的功能存在。

二是如何将深度学习在一个集群上进行扩展,不是在一个或者两个分布式的节点上。这也是当前许多软件公司开始把Spark跟Caffe、TensorFlow进行结合,把已有的深度学习框架跟Spark可扩展性结合到一块儿,来解决高效可扩展性痛点。当然,由于 Caffe、TensorFlow并不是为扩展性设计的,也不是为Spark设计的,当把两个方案结合到一块儿时,根本无法实现数据并行跟模型训练并行,只是表面把这两个产品黏合到一块儿去,根本无法做到真正的分布式的深度学习的功能。

三是如何解决深度学习高昂代价的问题,用户不希望部署一个非常昂贵的新集群,而是利用已有集群添加深度学习功能。

四是如何用高性能来缩短模型训练的周期。

基于以上四大痛点,英特尔推出了BigDL。BigDL是在Spark的基础上构建了分布式深度学习的框架,将以往的深度学习框架同Spark结合之后,优势非常突出。

首先,BigDL深度学习功能与已有深度学习框架功能完全一致,例如Caffe、Torch、TensorFlow等,功能相当丰富。第二,BigDL能够无缝与Spark和Hadoop进行结合,直接在大数据平台中应用。第三,BigDl能够利用Spark的可扩展性做到数据并行,拥有强大的可扩展性,可以在一个集群上进行扩展,并且非常容易扩展到上百个节点。第四,低成本。由于可以利用BigDL在已有的集群上直接生成深度学习,所以成本非常低。最后,高性能。通过利用英特尔优化过的数学核心函数库和多线程优化方法来提升BigDL的性能,特别是在至强服务器上,性能优势非常明显。

马子雅表示,今年第一季度,BigDL已经发布了一个版本,第二版本将会在今年7月推出,与第一版本相比,它在Python API的支持,尤其是对支持载入Caffe、Torch、TensorFlow的预训练模型上有了很大的提升。另外,在用户体验,包括提供一些更丰富的RNN的支持上,第二版本将会更加全面。

深度合作推动人工智能落地

英特尔与Cloudera主要在三个方面达成了深度合作,一个是英特尔将会与Cloudera共同进行软件优化,并利用英特尔最新的硬件技术来做一些合作。二是在开源方面英特尔与Cloudera的所有合作都是最先到开源,贡献给开源。之后Cloudera会把功能从开源里再放到自己的解决方案和产品当中去。三是共同合作项目,一起帮助用户解决问题。

Cloudera联合创始人兼首席技术官Amr Awadallah表示,Cloudera数据科学平台是一个非常好的深度学习解决方案,完美满足了不同的甚至是相互冲突的诉求。数学科学家利用Cloudera平台编程,开发诸如Spark或者是Python等等不同的语言,并能够加入一些新的库,例如TensorFlow和BigDL。他表示,目前正处在人类历史上最伟大、最重要的一次转型,那就是决策的自动化,它的重要意义绝对不会弱于先前出现的工业革命,Cloudera和英特尔密切合作共同推动浪潮向前发展。

马子雅表示,英特尔在数据分析应用和人工智能方面的承诺从来没有改变,我们希望给用户最佳的用户体验。一是通过硬件的升级和软件优化来推进技术民主化;二是为新兴的需求提供新兴的解决方案;三是跟用户合作,推动创新,为用户解决最新、最复杂的问题,来帮助用户最大化其商业价值。

 
 
作者:ZC
来源:51CTO
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
机器学习/深度学习 人工智能 算法
周志华揭牌英特尔-南大联合研究中心:探索DNN与GPU之外的「广义深度学习」
英特尔与南京大学联合成立了一个「人工智能联合研究中心」。9 月 12 日,英特尔中国研究院院长宋继强与南京大学人工智能学院院长周志华在南京为这个名为「英特尔-南京大学人工智能 IPCC 中心」的机构揭了牌。
158 0
周志华揭牌英特尔-南大联合研究中心:探索DNN与GPU之外的「广义深度学习」
|
机器学习/深度学习 人工智能 缓存
深度学习芯片大战愈演愈烈,英特尔为何斥巨资收购创业公司Nervana?
深度学习创业公司 Nervana Systems 一直是机器之心重点关注的人工智能领域的创业公司之一。在文章《深度 | 深度学习创业公司需要了解的12件事》中,该公司的三位创始人讲解了深度学习创业需要了解的事项。作为最早的一批人工智能创业公司,如今它的价值已经被科技巨头所看重。今日消息,该公司已经被英特尔以 4 亿美元的价格收购。
195 0
深度学习芯片大战愈演愈烈,英特尔为何斥巨资收购创业公司Nervana?
|
机器学习/深度学习 存储 分布式计算
BigDL:Apache Spark 上的分布式深度学习库
BigDL是 Apache Spark 的分布式深度学习库;使用 BigDL,用户可以将他们的深度学习应用程序编写为标准 Spark 程序,这些程序可以直接运行在现有的 Spark 或 Hadoop 集群之上。为了轻松构建 Spark 和 BigDL 应用程序,为端到端分析 + AI 管道提供了高级Analytics Zoo。
BigDL:Apache Spark 上的分布式深度学习库
|
机器学习/深度学习 分布式计算 大数据