ICPR 2018|阿里巴巴读光OCR及MTWI数据集亮相引关注

简介: 近日,第24届国际模式识别大会(ICPR 2018)在北京举办,阿里巴巴“图像和美”团队成为会场焦点,在本次ICPR大会中,阿里巴巴“图像和美”团队集中展示了在OCR方向的学术能力与读光OCR的产品能力。

近日,第24届国际模式识别大会(ICPR 2018)在北京举办,阿里巴巴“图像和美”团队成为会场焦点,在本次ICPR大会中,阿里巴巴“图像和美”团队集中展示了在OCR方向的学术能力与读光OCR的产品能力。

阿里巴巴“图像和美”团队是阿里巴巴延续时间最久的图像识别团队,从事OCR研究超过7年,全面覆盖公司内网络图片、文档等类型,日均处理图片超过6亿,累计超千亿,并于2017年底在阿里云上推出了读光云产品,提供企业级的公有云和专有云服务。目前读光OCR已广泛运用于各行业领域,在办公自动化、文档电子化、数据智能等场景实现企业的生产应用。在本次ICPR的展区也重点展示了卡证识别、表单识别、增值税发票识别等综合识别能力。

640

(读光OCR在ICPR的展台)

本次阿里巴巴“图像和美”团队还和华中科技大学、中科院自动化所共同举办了首届深度学习文档分析和识别研讨会,吸引了上百名研究人员参加。研讨会上IAPR主席Simone Marinai教授、华南理工大学金连文教授、阿里巴巴高级算法专家永攀等人发表了报告,各位专家同步了学术界最新研究及工业界的落地进展,现场反响热烈。

6401

(阿里巴巴高级算法专家永攀在研讨会上的报告)


6402

(Simone Marinai教授在研讨会上做报告)


研讨会的最后,华南理工大学金连文教授、北京大学王勇涛教授、阿里巴巴高级算法专家永攀等嘉宾就“深度学习OCR和DAR领域的未来趋势”进行了探讨,包括深度学习模型构架、数据集构建、算法应用方向等学术界及工业界都共同关注的热门话题。阿里巴巴高级算法专家永攀表示:“阿里读光是OCR应用领域的先行者,在实践中,读光将模型、数据、应用融合,实现通用应用场景的OCR算法架构,并按应用场景构建了完善的数据集系统。OCR是最基础最广泛的AI应用方向,能够与各行业结合形成广泛的社会效应, 我们期待和学术界一起追求算法极限,探索接近客观规律的AI问题。”

6403

(研讨会现场座无虚席)


此次,阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI 2018 挑战赛在大会进行了报告和颁奖,ICPR MTWI 2018挑战赛是目前参赛人数最多的OCR竞赛,由阿里巴巴天池平台承办,共有4282支队伍参与竞赛。 同时, 本次竞赛标注并公开了MTWI数据集,是现有难度最大、内容最丰富的网络图片OCR数据集,也是阿里巴巴首个公开的OCR数据集。

6404

(阿里巴巴算法专家永麒在大会进行竞赛报告)


阿里巴巴算法专家永麒在大会报告中表示:“希望通过这个数据集和竞赛,回馈学术界,并且推动业界技术的发展。从最终的效果来看,参加竞赛的队伍包括了众多知名高校和企业,在本次竞赛中,企业展现出了比较大的竞争优势。这也表明,众多企业看好OCR应用,OCR进入了应用爆发期。不过在三个赛道,最好队伍的准确率都没有超过90%。这也表明了网络图片的技术难点还没有完全解决。我们也希望这次的竞赛能够促进业界对这类问题的研究,一起来彻底解决这些问题。”

6405

(阿里巴巴资深算法专家雷音为获奖队伍颁奖)


在本次ICPR 2018中,阿里巴巴“图像和美”团队通过竞赛、研讨会、展区展示等形式多元化、全方位的展现了团队在OCR方面的深度积累及学术能力、产品能力,也得到了与会人员的高度评价和关注。
相关文章
|
机器学习/深度学习 人工智能 数据挖掘
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
|
9月前
|
机器学习/深度学习 自然语言处理 达摩院
阿里达摩院联合上海科大、浙大和新科大将知识引入命名实体识别,摘得10个榜首
阿里达摩院联合上海科大、浙大和新科大将知识引入命名实体识别,摘得10个榜首
阿里达摩院联合上海科大、浙大和新科大将知识引入命名实体识别,摘得10个榜首
|
11月前
|
数据采集 数据处理 vr&ar
CVPR 2022 | 将X光图片用于垃圾分割,港中大(深圳)探索大规模智能垃圾分类
CVPR 2022 | 将X光图片用于垃圾分割,港中大(深圳)探索大规模智能垃圾分类
106 0
|
11月前
|
存储 人工智能 编解码
CVPR‘2023 | 港科大 & 腾讯 AI Lab & 港大联合出品:有趣的动态 3D 场景重建
CVPR‘2023 | 港科大 & 腾讯 AI Lab & 港大联合出品:有趣的动态 3D 场景重建
174 0
|
机器学习/深度学习 编解码 人工智能
旷视科技2018 COCO负责人俞刚:如何构建检测与分割的冠军系统
ECCV 2018 如期而至,旷视科技在首席科学家、研究院长孙剑博士的带领下获得 2018 COCO+Mapillary 联合挑战赛四项第一。机器之心专访 2018 COCO+Mapillary 挑战赛&旷视科技 Detection 组负责人俞刚,从算法模型与团队创新等方面讲述构建多项冠军方案的秘诀。
184 0
旷视科技2018 COCO负责人俞刚:如何构建检测与分割的冠军系统
|
机器学习/深度学习 数据采集 人工智能
百度亮相NeurIPS 首届Expo:向世界科普了一次中国自动机器学习框架
在 NeurIPS 的第一届 Expo 上,百度向 NeurIPS 2018 年大会参与者展现了什么?
135 0
百度亮相NeurIPS 首届Expo:向世界科普了一次中国自动机器学习框架
|
机器学习/深度学习 人工智能 安全
蚂蚁保险科技获“国际认知识别类技术挑战赛”双冠军
第29届ACM国际多媒体会议(ACM International Conference on Multimedia)于24日在成都落幕,作为多媒体领域的国际顶级学术会议,本次会议吸引了全球来自中国、美国、德国、澳大利亚、瑞典、法国、日本等19个国家和地区1000余名学者参会,共收到来自近40个国家,共计2000余篇论文,创下了ACM的规模纪录。
263 0
蚂蚁保险科技获“国际认知识别类技术挑战赛”双冠军
|
机器学习/深度学习 算法 视频直播
阿里巴巴淘系开源首个多模态直播服饰检索数据集
阿里巴巴淘系技术部与北京大学前沿计算研究中心CVDA实验室、英国爱丁堡大学等合作,正式开源业界首个大规模的多模态直播服饰检索数据集(Watch and Buy),以推动视频多模态检索技术的研究。此前,依托该数据集举办的第一届淘宝直播商品识别大赛完美落幕,近2000支队伍参加了比赛,涌现了一批检索创新技术,有效提升淘宝直播场景中服饰检索的效果,形成了一定的学术和工业影响力。
1466 0
阿里巴巴淘系开源首个多模态直播服饰检索数据集
|
机器学习/深度学习 Web App开发 人工智能
阿里3D AI挑战赛落幕,2D照片10秒“升级”成3D模型
8月26日,首届阿里巴巴3D AI挑战赛落下帷幕。本届挑战赛共有1258支队伍报名参赛,三个赛道冠亚季军获奖名单出炉(文章底部查阅获奖名单),颁奖典礼将于Alibaba 3D Artificial Intelligence Challenge Workshop (IJCAI-PRICAI2020) 进行。
1515 0
阿里3D AI挑战赛落幕,2D照片10秒“升级”成3D模型
|
机器学习/深度学习 人工智能 自然语言处理
支付宝安全实验室获Kaggle视觉挑战赛冠军,领跑「细粒度图像分类」技术
作为一家创新型科技公司,蚂蚁集团(支付宝母公司)科技战略进程不断加速。
支付宝安全实验室获Kaggle视觉挑战赛冠军,领跑「细粒度图像分类」技术