机器学习+运筹优化=?

简介: 本文主要从机器学习和运筹优化两个方面介绍了其在生产管理和商业运营中的应用。通过农业、养殖业和新零售的案例,深入讲解了应用场景和原理。


演讲嘉宾简介:谭剑,阿里巴巴达摩院MIT资深算法专家。


数十款阿里云产品限时折扣中,赶紧点击这里,领劵开始云上实践吧!


本次直播视频精彩回顾,戳这里! 

 

简介

本次分享主要围绕机器学习和运筹优化两个方面。它们在学术角度存在很大的重合,也有各自的侧重点。为了更好地帮助大家理解,这里借用心理学教授DANIEL KAHNEMAN的表达。


e4b4eed06f9cd340c83b21913d4194612806a8ed


人有两个系统,System1System2,分别负责快思考和慢思考。所谓快思考,即普通人在12秒之内能做出的决定,反之,如果需要一定的专注和专业,则为慢思考。在过去的六七年中,业界逐渐取得了在机器学习技术上的突破。而在很多传统行业中,关注的更多的是运筹学的内容。在复杂的生产管理和商业运营中,往往需要人在System1System2之间进行反复的迭代,以取得更优的解。下面将围绕机器学习和运筹优化分享三个具体的实例。

 

案例介绍

第一个案例是智能农业。主要涉及养殖和种植。背后涉及的知识点是深度学习模型压缩与加速。 第二个案例是计算资源优化。它是运筹学比较关注的问题。第三个案例是新零售。本文将从算法和架构的角度,提供一些新的视角。我们的最终目的是希望通过机器学习使感知模型自动化,同时通过运筹优化使决策过程智能化。

 3ac11328096fc1b2c32f03778df56c250d5f9838


智能农业

下图展示了深度学习模型压缩与加速在应用集团内外的一些落地项目。


88175c67793e29f3b2c8b6d63f0c1a2d2015dabe


下面主要介绍在种植和养殖方面的实际应用。下图展示了“天蓬计划”这个项目是真实的部署在养殖场中的。从右侧这张图展示的是实时监控猪的数量。左侧这张图是用以确定猪的身份的,比如来源、成长曲线等一系列关键的参数信息。


1ff7bd993e69779262079990270130bc62ce7866


智能农业

通过无人机技术,我们希望能准确地获取农作物的生长状态信息。为承保、理赔提供参考信息,为实时监管提供有利的帮助。

 

b9ce3f033548c42598698d1be90fe8ef5b43f441


下图展示的也是一个实时部署系统。在下图中,我们识别出了玉米大多正处在开花期。不仅如此,还识别出了数量信息。

 

6c4ae57043313fd3c8cddb4e554a63db539b0bdd


下图展示了在烟草种植行业中的应用。左边的图,准确的识别出了棵树,为政府补贴和保险提供关键的信息。右图,烟草种植面积评估,对生产规划有着很重要的参考价值。

 

38a756d88b6a87b1b60c8c8a80b27f2c89bd9bcf


相关算法

这些应用的背后都需要强大的算法支持。在云端,我们有自己的训练平台,在移动端有嵌入式系统。但应用时还是存在一些问题亟待解决。

 

9fced9bc575fc794551a0a062d132f04859bab4c


为此我们提出了Gauss作为解决方案。


fe1580325e81f47e87dc8d7152348015b01e6b5d


在服务器端,有Gauss训练平台,集合了目前业界比较先进的算法进行模型的加速。并且,在过程中,我们也在自行开发新的技术,比如模型离散技术。在部署时也进行了优化,比如智能盒子。在之前提到的养猪实例中,就有智能盒子支持的摄像头。

 

下图列出了高效前向推理中的主要技术要点。

 

ddd18c9e05c7f12d9f8e3687acb778dfe090edf8

 

下面介绍有关计算资源优化的内容。由于我们内部管理了大量的数据中心,和海量的服务器,其中有极端复杂的技术。我们的目标是通过数据和算法得到最优的策略。主要的应用有三个。第一,优化预测。即根据趋势,在物体被分配之前,有针对性的找到可能的关注点。第二,优化配置。比如容器资源分配,不能多也不能少。第三,异常检测。在智能运维中有比较重要的应用。

 

5c4c02eca2cea2f82a4bf786b99eddb4077d3e6b


下面给大家详细介绍一下资源调度的问题。它的基本模型非常简单,但在实际应用上是不可行的。主要的问题在于实际应用中异常复杂的约束关系。

 

fe3744f2b2c2759d5aec3e57639e447c0464f021


下图给出了三个真实的计算资源优化实例。每张图的左边和右边都展示了上线前和上线后的区别。

 

715f61d2d40497bb8e4812efd035e72acb6aa451


新零售

下面介绍新零售方面的应用。关键点在于。下面主要从算法架构的角度来讲述对新零售的理解。一个非常成功的案例就是盒马新零售。盒马是一个线上线下合一的自营体系。每一个店面分为两个部分。一部分是前台实体店面,另一个部分是仓储。前台主要服务的是线下的客户,仓储主要服务的是线上的客户。一个盒马店面实际上只有30%左右线下用户,有超过70%的用户是线上的。这种生态系统与传统的电商,比如淘宝,不一样。在线下的角度,它与菜鸟等,也不一样。在算法的角度,线上,不仅要关注用户的偏好,还要关注库存,也就是说线上对线下的库存起到导入的作用。在线下库存的角度,做库存和运营配送时也要考虑线上的作用。线上线下实际上是一个有机的整体,它跟菜鸟、淘宝这样的重量级系统是不太一样的。同时,这也造成了一系列的算法挑战。

 

 0b6ed4b3da218af99216b10dec1ba56cdcf5d820

 

第一,线上部分,用户行为偏好问题。我们可以从三个层次来理解这个问题。一,线下活跃但线上沉睡的客户。第二,新用户。第三,活跃用户个性化。

 

e79d726c7b20cc12879888ed1227f2681c5f8b74


第二个问题是,线上精准营销的匹配问题,如下图。

 

10d641164673d4e9b87eea91c5131fae4543236e


第三,是线下配送问题。线上会源源不断的产生订单。订单都会有各自的配送时间和地点。这个问题的解决方案就是合批集单。

 

394a4f525794968181004ca5461779b7909b4d49


关于线下集单优化问题,如下图。

 

0fc5ebaefb1391fcce9883e0a1f27994ab1d7d22


最后,从算法角度介绍一下新零售。除了之前提到的线上线下。还有一个问题就是运营。运营可以实时地获取新闻、交通、天气,并输入到线上和线下以起到调控的作用。

 

283ef21e6a1dfd954b97160dc8b272f5d4fb8800


最后回归到人,技术最终是为了服务于人。希望能通过机器学习和运筹优化在更多行业起到助力的作用。


0f23202aff6e6458f4e6bc4a0bff452b11b2e55f

本文由云栖志愿小组马JY整理

相关文章
|
23天前
|
机器学习/深度学习 自然语言处理 搜索推荐
【机器学习】揭秘!机器学习如何助力我们高效优化文本?
【机器学习】揭秘!机器学习如何助力我们高效优化文本?
29 3
|
1月前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型:从数据预处理到模型优化
在机器学习的实践中,构建一个高效的模型并非一蹴而就。本文将深入探讨如何通过精确的数据预处理、合理的特征选择、适当的模型构建以及细致的参数调优来提升模型的性能。我们将讨论数据清洗的重要性,探索特征工程的策略,分析不同算法的适用场景,并分享模型调参的实用技巧。目标是为读者提供一套系统的方法论,以指导他们在构建机器学习模型时能够更加高效和目标明确。
37 3
|
18天前
|
机器学习/深度学习 自然语言处理 搜索推荐
【机器学习】揭秘!机器学习如何助力我们高效优化文本?
【机器学习】揭秘!机器学习如何助力我们高效优化文本?
28 0
|
1天前
|
机器学习/深度学习 存储 监控
利用机器学习优化数据中心冷却效率
【4月更文挑战第25天】在数据中心的运营成本中,冷却系统占据了一大块。随着能源价格的不断攀升以及环保意识的增强,如何降低冷却系统的能耗成为了一个亟待解决的问题。本文提出了一种基于机器学习的方法来优化数据中心的冷却效率,通过实时监控和数据分析,动态调整冷却设备的工作状态,以达到节能的目的。实验结果表明,该方法可以显著降低数据中心的能耗,同时保证服务器的正常运行。
|
2天前
|
机器学习/深度学习 数据挖掘 数据中心
利用机器学习优化数据中心能效的策略研究
【4月更文挑战第24天】在数据中心管理和运营中,能效优化是一个长期存在的挑战,它直接关系到成本控制和环境影响的减轻。随着人工智能技术的不断进步,特别是机器学习(ML)方法的广泛应用,为解决数据中心能效问题提供了新的途径。本文旨在探讨如何通过机器学习技术对数据中心的能源消耗进行建模、预测和优化,以实现更高的能效。我们首先分析了数据中心能耗的主要组成部分,然后提出了一种基于机器学习的能效优化框架,并详细阐述了关键技术和方法。最后,通过实验验证了所提出策略的有效性,并讨论了未来的研究方向。
|
7天前
|
机器学习/深度学习 运维 监控
利用机器学习优化数据中心能效的研究
【4月更文挑战第19天】在数据中心的运营成本中,能源消耗占据了显著比例。随着能源价格的不断攀升与环境保护意识的加强,如何降低数据中心的能耗已成为研究的热点。本文提出了一种基于机器学习的方法来优化数据中心的能效。通过分析历史运行数据,构建预测模型,并结合实时监控,动态调整资源分配策略以达到节能目的。实验结果表明,该方法能有效减少能源开销,同时保证服务质量。
|
8天前
|
机器学习/深度学习 资源调度 调度
利用机器学习优化数据中心能效的策略研究
【4月更文挑战第18天】 在数据中心的运营成本中,能源消耗占据了显著比例。为了降低这一开销同时减少环境影响,本文提出一套基于机器学习技术的数据中心能效优化策略。通过分析数据中心的能耗模式和环境变量,构建了一个预测模型来动态调整资源分配,实现能源使用的最大效率。与传统方法相比,本研究提出的策略在保证服务质量的前提下,能有效降低能耗,并具备自我学习和适应的能力。
|
9天前
|
机器学习/深度学习 存储 算法
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
30 7
|
12天前
|
机器学习/深度学习 前端开发 算法
使用机器学习优化前端用户体验
在当今高度竞争的互联网市场中,用户体验是至关重要的。本文将探讨如何利用机器学习技术来优化前端用户体验,从而提高用户满意度和留存率。我们将介绍如何利用机器学习算法分析用户行为数据,优化网站性能和内容推荐,以及如何实时调整界面设计和交互方式,从而实现个性化、智能化的用户体验。
|
20天前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型:从数据预处理到模型优化
【4月更文挑战第6天】本文聚焦于机器学习模型的开发流程,旨在提供一套系统的方法论以构建出更高效的模型。我们将深入探讨数据预处理的重要性,特征工程的策略,以及如何通过交叉验证和超参数调优来提升模型性能。文章不仅涉及理论分析,还包括了实际案例的代码实现,为读者呈现一个从数据处理到模型部署的完整蓝图。
15 0