ICPR 2018｜阿里巴巴读光OCR及MTWI数据集亮相引关注-阿里云开发者社区

ICPR 2018｜阿里巴巴读光OCR及MTWI数据集亮相引关注

2018-08-23 4974

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 近日，第24届国际模式识别大会（ICPR 2018）在北京举办，阿里巴巴“图像和美”团队成为会场焦点，在本次ICPR大会中，阿里巴巴“图像和美”团队集中展示了在OCR方向的学术能力与读光OCR的产品能力。

近日，第24届国际模式识别大会（ICPR 2018）在北京举办，阿里巴巴“图像和美”团队成为会场焦点，在本次ICPR大会中，阿里巴巴“图像和美”团队集中展示了在OCR方向的学术能力与读光OCR的产品能力。

阿里巴巴“图像和美”团队是阿里巴巴延续时间最久的图像识别团队，从事OCR研究超过7年，全面覆盖公司内网络图片、文档等类型，日均处理图片超过6亿，累计超千亿，并于2017年底在阿里云上推出了读光云产品，提供企业级的公有云和专有云服务。目前读光OCR已广泛运用于各行业领域，在办公自动化、文档电子化、数据智能等场景实现企业的生产应用。在本次ICPR的展区也重点展示了卡证识别、表单识别、增值税发票识别等综合识别能力。

640

（读光OCR在ICPR的展台）

本次阿里巴巴“图像和美”团队还和华中科技大学、中科院自动化所共同举办了首届深度学习文档分析和识别研讨会，吸引了上百名研究人员参加。研讨会上IAPR主席Simone Marinai教授、华南理工大学金连文教授、阿里巴巴高级算法专家永攀等人发表了报告，各位专家同步了学术界最新研究及工业界的落地进展，现场反响热烈。

6401

(阿里巴巴高级算法专家永攀在研讨会上的报告）

（Simone Marinai教授在研讨会上做报告）

研讨会的最后，华南理工大学金连文教授、北京大学王勇涛教授、阿里巴巴高级算法专家永攀等嘉宾就“深度学习OCR和DAR领域的未来趋势”进行了探讨，包括深度学习模型构架、数据集构建、算法应用方向等学术界及工业界都共同关注的热门话题。阿里巴巴高级算法专家永攀表示：“阿里读光是OCR应用领域的先行者，在实践中，读光将模型、数据、应用融合，实现通用应用场景的OCR算法架构，并按应用场景构建了完善的数据集系统。OCR是最基础最广泛的AI应用方向，能够与各行业结合形成广泛的社会效应，我们期待和学术界一起追求算法极限，探索接近客观规律的AI问题。”

6403

（研讨会现场座无虚席）

此次，阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI 2018 挑战赛在大会进行了报告和颁奖，ICPR MTWI 2018挑战赛是目前参赛人数最多的OCR竞赛，由阿里巴巴天池平台承办，共有4282支队伍参与竞赛。同时，本次竞赛标注并公开了MTWI数据集，是现有难度最大、内容最丰富的网络图片OCR数据集，也是阿里巴巴首个公开的OCR数据集。

6404

（阿里巴巴算法专家永麒在大会进行竞赛报告）

阿里巴巴算法专家永麒在大会报告中表示：“希望通过这个数据集和竞赛，回馈学术界，并且推动业界技术的发展。从最终的效果来看，参加竞赛的队伍包括了众多知名高校和企业，在本次竞赛中，企业展现出了比较大的竞争优势。这也表明，众多企业看好OCR应用，OCR进入了应用爆发期。不过在三个赛道，最好队伍的准确率都没有超过90%。这也表明了网络图片的技术难点还没有完全解决。我们也希望这次的竞赛能够促进业界对这类问题的研究，一起来彻底解决这些问题。”

6405