云上视觉智能的挑战与实践

简介: 人工智能技术已经迎来了第三次高峰,并且势不可挡,但与此同时,人工智能的商业化之路却面临着诸多挑战。在2019杭州云栖大会开发者峰会上,阿里巴巴副总裁、达摩院人工智能中心负责人华先胜就为大家分享了作为开发者应该如何跟随人工智能的浪潮,创造真正的价值。

摘要:人工智能技术已经迎来了第三次高峰,并且势不可挡,但与此同时,人工智能的商业化之路却面临着诸多挑战。在2019杭州云栖大会开发者峰会上,阿里巴巴副总裁、达摩院人工智能中心负责人华先胜就为大家分享了作为开发者应该如何跟随人工智能的浪潮,创造真正的价值。

如今,人工智能技术非常火爆,而视觉智能技术更是火爆中的火爆,以至于融资比盈利的速度还快,这表明了市场对AI的信心,也说明AI产生的价值和大众期望还存在一定距离。未来,开发者将会对人工智能技术在产业中的落地发挥巨大作用。一方面,人工智能的落地需要开发者一行行代码写出来。另一方面,开发者对于人工智能在产业中的优势和劣势都有很深入的了解,需要开发者为人工智能的落地实践出谋划策。

人工智能在前几十年经历了三次高峰,前两次都只是梦想,而如今的第三次高峰与前两次有什么不同呢?第一,基于深度学习解决了过去的很多问题。第二,具有强大的算力。第三,在各行各业中都积累了海量数据,为人工智能技术以及从数据中挖掘价值创造了条件。第四,已经出现了很多成功案例,如刷脸支付、搜索引擎以及城市大脑等。

人工智能产业的确在快速增长,2000年到2016年世界上出现了8千多家人工智能公司,2000年到2017年世界上活跃的AI创业公司增加了14倍,2017年167家中国公司获得总计50亿美元的融资,如今各大公司都有了自己的人工智能实验室,各大高校也有了人工智能学院。可以说,人工智能已经进入了各行各业,并且势不可当。

image.png

那么,AI领域是否就是一片繁荣呢?其实AI面临诸多困境,其中第一个困境就是营收。今天超过90%的AI公司都在亏损。一些公司做AI项目,投入的人力成本非常大。另外一些公司做公共API,但门槛又非常低,都快成“白菜”了。

image.png

AI面临的第二个困境就是实验室与真实世界存在很大差异。在实验室中,可以将模型和算法刷到非常高的准确率,以至于怀疑机器要超过人类了,而当到了真实世界中,AI从业者的信心遭受打击,人类的信心才又重新拾回来了。

image.png

AI面临的第三个困境是用户和客户对AI的期望非常高,曾经有某个客户向阿里提出了120条需求,可是由于技术问题、数据问题或者计算问题,最终只能实现二三十个需求。

image.png

这也促使阿里巴巴去思考AI技术和应用成功的关键因素是什么。公开测试排名很高,估值很高,融资很好,这些都是成功的因素,但是成功关键却是能否为用户创造价值。价值也分为三种,从低到高分别为锦上添花、雪中送炭和无中生有。如果AI技术和应用能够带来价值,那么为商业成功买单的就不再是风险投资,也不再是大公司,而是客户和用户。

阿里巴巴在数据上的布局有很多,不仅仅在电商行业,还包括电商周边和阿里云以及各行各业都进行了深入探究。而且很多AI算法需要在场景中不断地打磨和迭代,才能真正地解决问题。

image.png

这里列举四个视觉智能技术和应用案例。第一个案例是视觉搜索。最早在上世纪末和本世纪初就有人在做通用视觉搜索了,但是当时的数据样本量远不如今天。拿拍立淘举例,它会用到三种技术,第一种是特征学习,需要用特征来描述一个商品的图象。第二种是大规模搜索,需要把大量数据放到索引里面去,方便快速查找。第三种是高性能搜索,需要能够快速响应大量用户的搜索需求,提供毫秒级反馈。

image.png

拍立淘是阿里巴巴第一个视觉搜索技术的应用,并且每天有千万级用户在使用这个功能。为什么今天拍立淘能够成功,而上个世纪末的视觉搜索没有办法成功呢?其背后的原因就是刚需。对于电商而言,商品的图像搜索是刚需,很多场景下用户只能通过拍照的方式才能搜索到所需要的东西,而通用图像搜索目前来看并不是一个刚需。既然是刚需,那么即便做的不够好,也会有很多用户会尝试使用,随着用户尝试的不断增多,搜索系统就能够收集大量的反馈信息来改善自身的算法,否则根本不知道改善方向是什么。因此,最重要的一点就是关注刚需。

image.png

第二个案例是视觉制造,它不是识别也不是搜索,而是产生视觉产品或者视觉信号,如图像、视频等,夸张一点讲就是“所想即所得”。这里举一个例子,商品页面秒变视频,输入包含图、文字以及声音的商品页面,AlibabaWood系统即会自动地下载这些信息,分析图片并自动地合成视频,这样的视频对于商品的推介作用就会明显高于页面,点击率、转化率都会明显提升。

image.png

第二个例子视频广告植入,通过对于视频内容的分析,将广告无缝地嵌进去。这项技术会检测视频里面的水、竖直面以及整体空间,并将目标商品的广告嵌入进去,既不会影响用户体验,也能够对用户产生影响。

image.png

此外,阿里的鹿班系统可以自动生成平面设计。它可以将素材自动合成设计稿以及广告图片,去年的双11一共有7亿多个Banner,其中4.1亿个是由算法自动生成的。经过测试,基本上相当于一个UED本科生的水平,并且一秒钟可以完成8千个Banner设计。

image.png

之前没有这项技术的时候,Banner需要设计师逐个设计,而如今借助于鹿班的力量,Banner图已经成了大型促销活动的标配,这种需求是创造出来的。

image.png

第三个案例是视觉诊断,这里只谈机器视觉诊断。大家从生产线上拿到的很多产品都是需要经过人工多次检测才能拿到的,而这会耗费很多人力。而很多检测非常繁杂,并且只能做抽样检测,比如太阳能电池板瑕疵检测。如今,借助算法的力量可以准确地进行全量检测,不仅能够提升检测准确率和检测速度,还能够节省一半的人力。除此之外,视觉诊断还可以应用于智能养猪等领域。

image.png

其实,人工智能在很多方面都可以发挥很大的作用,各行各业都有它的用武之地。不要把目光局限在像人脸、安防这样的红海中,作为开发者要知道各个行业存在大量的机会,通过AI技术可以帮助其提高效率、降低成本。当然,做到这一点必须深入行业,因为没有一种人工智能技术是通用的。

image.png

第四个案例是城市大脑,城市大脑是要解决城市大量数据价值挖掘的问题,通过AI算法和算力挖掘城市数据大量的价值。首先要做感知,要了解城市正在发生着什么,对于车、人、事、物都要非常清楚的了解。之后做优化,然后就是搜索和挖掘。再进一步就是预测,预测个体行为比较难,但可以预测群体行为,比如预测车流量。有了预测之后,才可以进行精准管控和提前干预。

image.png

阿里城市大脑经过3年多的实战,沉淀出了一系列人工智能的产品,比如天鹰视频图像搜索、天曜异常事件识别、天机城市推演以及天谱城市建模等。以天谱为例,它是把城市三维的重建和城市二维视频的分析有机地融合在一起,这样不仅能对视频的局部进行分析,而且可以把分析结果还原到三维场景中,进而得到一个全局的信息。天谱使得对视频的分析从二维走向三维,对视频图象的推理从三维走向了四维。城市大脑慢慢地演变成了部署、研发和创新的平台。

image.png

所以,一定要为产业创造不可替代的价值,只有这样才能在商业上取得成功。

image.png

谈到人工智能的未来,技术走向往往很难预测,但是可以总结几点内容:

  • 今天的人工智能的方法论虽然有局限,但仍有很大的发展空间。
  • 对于传统产业和数字产业都适用:Embrace AI or Lose。
  • 对于人工智能从业者:Dive into Applications or Lose。
  • 对于人工智能商业化:Create Irreplaceable Value or Lose。
  • 对于每一个人来说:Intelligence Everywhere Embrace It or Lose。
相关实践学习
基于函数计算实现AI推理
本场景基于函数计算建立一个TensorFlow Serverless AI推理平台。
相关文章
|
29天前
|
机器学习/深度学习 人工智能 运维
《未来智能运维:AI技术的应用与展望》
在当今数字化时代,智能运维正日益成为企业提升效率、降低成本的关键。本文将探讨人工智能技术在运维领域的应用现状与未来发展趋势,展望未来智能运维的发展前景。
46 1
EMQ
|
存储 人工智能 边缘计算
云边协同架构助力智能工厂视觉 AI 缺陷检测应用构建
打破检测系统和产线自动化设备之间的信息孤岛,构建数据高速通道,为视觉AI缺陷检测算法模型提供数据支撑,实现工厂生产智慧优化。
EMQ
363 1
云边协同架构助力智能工厂视觉 AI 缺陷检测应用构建
|
9天前
|
机器学习/深度学习 人工智能 安全
AI战略丨阿里云百炼再升级:模型、工具、AI能力,快速接入、应有尽有
阿里云百炼持续加码模型服务,基于丰富的底层计算能力与通义系列模型的最佳实践,构建训练评测、标注、部署全生命周期模型工具,帮助企业、开发者在云上一站式调用、优化大模型,成为大模型时代的商业化基础设施。
|
2月前
|
机器学习/深度学习 API 计算机视觉
阿里云视觉智能平台的自学习服务
【2月更文挑战第2天】阿里云视觉智能平台的自学习服务
30 10
|
2月前
|
搜索推荐
AIGC在学生自主学习中的应用
AIGC在学生自主学习中的应用
63 2
AIGC在学生自主学习中的应用
|
3月前
|
运维 监控 算法
AIGC时代,智能运维真的来了吗?
【1月更文挑战第22天】AIGC时代,智能运维真的来了吗?
106 1
AIGC时代,智能运维真的来了吗?
|
3月前
|
人工智能 搜索推荐
AI能力更加原子化,业务流程迈向“无感智能”
【1月更文挑战第7天】AI能力更加原子化,业务流程迈向“无感智能”
48 1
AI能力更加原子化,业务流程迈向“无感智能”
|
3月前
|
存储 缓存 Kubernetes
云原生场景下,AIGC 模型服务的工程挑战和应对
本文介绍了在云原生场景下,AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。
135601 24
|
4月前
|
人工智能 运维 监控
SLS 智能运维 AI 基础模型创新
SLS 全新发布运维场景基础模型,覆盖 Log、Metric、Trace 等可观测数据场景,模型提供开箱即用的异常检测、自动标注、分类和根因分析等能力;根因分析算法千级异常请求秒级定位,生产中准确率达95%;同时支持人工辅助微调,提供人工标注、结果打标修正,模型根据人工反馈自动微调,提升场景准确率。
91029 1
|
7月前
|
网络安全 容器
虎虎生威,挑战云上魔方
以前我们玩魔方拼的是手速,这次咱们来拼拼弹速,通过 SAE 快速部署在线魔方,开箱即玩,一起来体验吧!
189 1