【2018中国计算机大会】阿里资深专家谈认知图谱的机遇与挑战

简介: 基于知识的人工智能服务日益成为流行趋势。大数据环境下,数据的分布、异构、动态、碎片化和低质化等特征给知识工程和服务提出了很多新困难和新挑战,有效构建新一代大规模知识图谱,已成为影响人工智能未来发展的关键问题之一。

基于知识的人工智能服务日益成为流行趋势。大数据环境下,数据的分布、异构、动态、碎片化和低质化等特征给知识工程和服务提出了很多新困难和新挑战,有效构建新一代大规模知识图谱,已成为影响人工智能未来发展的关键问题之一。

10月25日下午,2018中国计算机大会上举办了以“认知图谱与推理”为主题的技术论坛,领域专家与参会者们一起探讨了如何构建超大规模的认知图谱,及其在工业界实际场景中的应用,并深入探讨了数据智能、机器学习、图计算、认知推理等多方面的结合应用的理论方法与实践经验,现场参与观众爆满。
image001

论坛上,来自阿里巴巴达摩院智能计算实验室的数据科学家杨红霞博士和计算平台系统工程总监钱正平博士,分别从算法和系统角度,介绍了认知图谱在阿里电商推荐、视频分析、金融风控等领域的真实场景的生产实践。
16_29_16__11_02_2018

专家简介

杨红霞,阿里巴巴资深算法专家/总监。她带领团队开发基于计算平台和搜索推荐的智能算法,稳定的支持了阿里巴巴搜索、广告等30几个核心BU和其业务场景。加入阿里之前,杨博士曾任IBM全球研发中心Watson研究员,Yahoo!主任数据科学家。在顶级统计和机器学习国际学术期刊会议发表论文40余篇(包括JASA, ICML, ATSTATS, KDD, ICDM,CIKM和WWW等),美国专利9项,任职 Applied Stochastic Models in Business and Industry副主编,International Statistical Institute理事,2017浙江省千人。杨博士毕业于美国杜克大学。

钱正平,阿里巴巴资深技术专家/总监。他带领团队负责围绕阿里巴巴内外诸如图计算、机器学习等新兴应用的系统研发和商业解决方案构建。加入阿里之前,钱博士曾任微软亚洲研究院主管研究员。研究兴趣是分布式和数据并行计算,在OSDI、NSDI、EuroSys、VLDB等会议发表论文、并曾获EuroSys 2012最佳论文奖。钱博士毕业于华南理工大学。

杨红霞博士介绍,阿里巴巴生态体系有着极其丰富多样的数据,涵盖着从购物、出行,到娱乐、支付等各个方面。作为信息过滤的重要手段和电商应用的核心服务,个性化推荐系统需要依赖这一数据,识别我们的习惯和爱好来推荐合适的商品或者服务。但是传统的推荐系统容易出现稀疏性、冷启动和信息重复性的问题,而认知图谱作为大规模图表征的一类重要模型正在成为一种新兴类型的推荐辅助信息,可以将自然人的全域信息有效的结合起来,真正挖掘、理解每个人的需求,在每个业务域推出消费者真正感兴趣的潜在商品。
image007

杨博士还具体以淘宝推荐算法为例,介绍了如何利用图表征学习等技术,融合异构信息,对于超过几十亿节点、千亿边的超大规模知识图谱上进行有效的推理分析。从而利用多样化数据间的复杂关联和结构特征,为用户提供更精准和可靠的信息。这些结构特征也被用于更好的捕捉电商行为中的异常。
image009
image011

另一方面超大规模认知图谱的计算与推理也给系统设计带来巨大挑战。下一个报告中,钱正平博士首先介绍了阿里基于图模型的智能服务系统架构,包括图模型的维护、数据智能计算,以及与人工、算法知识的融合,并最终提供实时的在线服务。接着钱博士从底层图存储、并行计算与高层语言抽象和优化等角度,重点介绍了系统挑战和阿里的工作。
image013
image015

此外钱正平博士还透露,阿里正在结合过去几年在真实场景的大规模应用与实践经验,研发新一代图计算引擎MaxGraph,支撑超大规模认知图谱推理计算。相比现有图存储或图数据库,MaxGraph为图模型提供了高效的分布式存储、支持实时更新与保证数据一致性;自研的分布式数据流引擎能支持包括交互查询,批量全图计算,和低延迟、高并发在线服务在内的多模式混合执行;另外通过兼容TinkerPop Gremlin等流行的图查询语言,和提供自研的能够表达图表征学习等更丰富图计算语义的高层描述性语言及自动优化,提供良好的可编程性。MaxGraph旨在为大规模知识图谱应用提供统一的计算引擎和更高层的系统抽象,在应用与底层硬件、网络之间架起桥梁,充分发挥硬件性能、突破计算规模与性能瓶颈。
image017

在最后的讨论环节,各位专家进一步展望了认知图谱与推理领域的发展、分享了研究挑战与机遇。钱博士强调了算法与系统工程紧密结合的重要性,更为重要的,是要和领域专家紧密协作、真正深入和解决真实场景的重要问题。相信超大规模认知图谱及计算能力,会成为更多AI应用的基础设施、并带动更多的行业创新。
image019

点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html
阿里云总监系列课重磅上线!聚焦人工智能、弹性计算、数据库等热门领域,首次集齐12位阿里云技术高管,耗时半年精心打磨,从理论到实践倾囊相授,从零开始绘制技术大牛成长路径,限时直播课程免费报名中!欢迎戳“https://yq.aliyun.com/promotion/689”免费报名学习。
IMG_1996

相关文章
|
人工智能 Cloud Native 安全
「开源人说」|大咖齐聚首,大数据&AI开源话题对碰
「开源人说」第四期——大数据& AI专场在今年云栖大会举办,阿里巴巴开源委员会大数据AI领域副主席王峰和阿里云AI开源项目EasyRec负责人施兴现场分享热门开源项目背后的故事。开源中国创始人&CTO红薯,白鲸开源联合创始人代立冬,浙大博导赵俊博,InfoQ总编辑王一鹏、Apache软件基金会成员李钰等嘉宾圆桌共话,对开源热点及痛点问题展开激烈讨论。
138799 5
「开源人说」|大咖齐聚首,大数据&AI开源话题对碰
|
人工智能 达摩院 算法
2022世界人工智能大会大模型主题论坛星光云集,共话大模型的创新与生态发展!
本次“大规模预训练模型”主题论坛由阿里巴巴集团主办,世界人工智能大会组委会指导,整体围绕“大规模预训练模型的创新、落地和开源开放”展开,将探讨的边界延伸至算法模型、大数据及训练框架等方向,邀请到来自阿里巴巴,澜舟科技,清华大学,粤港澳大湾区数字经济研究院,深势科技,复旦大学等机构,在大规模预训练模型领域深耕多年的领军人物,通过keynote演讲和圆桌论坛两个环节,展示国产大模型多元生态下的技术成果和思考。
1637 0
2022世界人工智能大会大模型主题论坛星光云集,共话大模型的创新与生态发展!
|
人工智能 供应链 自动驾驶
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》
|
机器学习/深度学习 人工智能 自然语言处理
业界首批「首席AI架构师」出炉,百度黄埔学院推动飞桨在企业中的应用
今年初,百度联合「深度学习技术及应用国家工程实验室」成立「黄埔学院」,旨在为各行各业培养第一批「首席 AI 架构师」。 第一期学员共 35 人,分别来自不同企业和单位(包括国家卫星气象中心、中油瑞飞、中信银行、神思电子、OPPO、广东电网、广东长隆集团、中国联通软件研究院、华为、米文动力、爱奇艺等),当然杨鋆源是其中之一。 他们在北京进修半年,在半年时间里,他们结合自身行业和企业需求,使用飞桨(PaddlePaddle),将 AI 结合到业务实践中应用落地。
229 0
业界首批「首席AI架构师」出炉,百度黄埔学院推动飞桨在企业中的应用
|
人工智能 自动驾驶 安全
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》(一)
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》(一)
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》(一)
|
人工智能 供应链
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》(二)
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》(二)
AI:2020年6月16日晚20点陆奇博士演讲《正视挑战把握创业创新机会》(二)
|
人工智能 物联网 机器人
云栖科技评论79期:前沿科技公司要有平台思维
一家公司拥有强大的产品技术能力,致力于前沿科技的探索,但制造实用化的产品仍然是一个非常巨大的挑战,它需要的不仅仅是技术,还要面对产业链、市场需求、通用产品设计等一系列挑战,因此,对于许多类似波士顿动力一样具有强大的前沿科技能力,但实际上并不擅长产品实用化以及市场化的公司来说,实践平台思维,构建以自身为基础的开放生态,不失为一个好选择。
2995 0