旷视Face++人工智能开放平台上线自定义模板文字识别功能 实用教程看这里

  1. 云栖社区>
  2. 博客>
  3. 正文

旷视Face++人工智能开放平台上线自定义模板文字识别功能 实用教程看这里

灵犀洞洞 2019-03-18 16:57:09 浏览222 评论0

摘要: 传统OCR对于没有制作对应模板的票据、卡证只能按行返回识别结果,因此容易产生误识与格式错误,增加了数据录入与处理的难度。为了破解传统OCR识别与卡证识别的困局,Face++人工智能开放平台上线自定义模板文字识别功能,通过自助的模板制作,生成识别规则,配合自动分类功能,实现自动化、便捷化的数据获取与录入。

传统OCR对于没有制作对应模板的票据、卡证只能按行返回识别结果,因此容易产生误识与格式错误,增加了数据录入与处理的难度;而单一的卡证识别只能获得某一类型的识别结果。为了破解传统OCR识别与卡证识别的困局,Face++人工智能开放平台上线自定义模板文字识别功能,通过自助的模板制作,生成识别规则,配合自动分类功能,实现自动化、便捷化的数据获取与录入。

自定义文字模版功能

Face++平台的自定义模板文字识别,提供高精度、普适的格式化文本识别服务,支持各类票据、文书、卡证等识别。用户通过简单的标注创建专属自己的模板后,便可通过API接口批量识别同类图片内容信息,获得定义好的输出结果,满足用户的个性化OCR需求。自定义模板文字识别功能在传统卡证审核、信息录入等行业应用广泛,大幅度降低了人力和时间成本,帮助带来更高效和优质的服务。

技术亮点

1、无需设置识别域参考点

现有的OCR技术必须通过设置参考点、辅助线找到字段位置。而Face++人工智能开放平台提供的业内独家技术无需手动设置参考点,简化了模板制作步骤,上手更容易更省时。

2、有效应对任意角度图片

通常我们在上传待识别图片时,必须手动调整图片角度,费时费力。而Face++人工智能开放平台的算法能针对各角度图片自适应,支持任意旋转的图片识别与同等优质的结果输出,节省上传时间,从细节处优化用户体验。

3、多种模板识别能力突出

Face++人工智能开放平台算法支持多类型票据、文书、卡证等识别,其中北京社保卡、顺丰快递单、电子发票识别效果尤为突出。

功能演示

1、在批量识别同一类型的卡证之前,首先您需要制作一个通用模板。在官网技术能力“自定义模板文字识别”页面中点击“立即体验”,即可进入制作页面。


2、进入模板制作页,点击“新建模板”。

图注:演示人员为虚假身份

3、选择您希望识别的类型(此处以识别北京社保卡为例),进入制作页面。

除了推荐模板,您还可以通过“空白模板”建立您需要识别的模板类型。只需上传一张图片作为示例,即可同样进入制作页面。

4、进入社保卡模板制作页面,选取识别域。

什么是识别域呢?通俗来讲,指需要识别的字段,例如图中被选中的字段“乐乐”、“女”、“汉”、“199934日”、“210204199903045789”、“122510100000”。

如果您还希望识别图片上的更多字段,比如文字信息“社会保障号码”,只需选中该部分即可创建一个新识别域(如下图)。如果不小心勾选错误,可以直接删除。

当您创建完成后,务必填写右侧的“字段名称”及“字段类型”。“字段名称”是为了区分每个字段代表的含义,“字段类型”是为了定义字段的属性范围,给予算法指示。显然,您既定的范围越精细,算法得到的指示就越清晰,识别准确率也就越高。

如果您未找到合适的字段类型,还可以自由创建:

请注意:新建字段类型相当于由您制定的一套新规则,因此返回的识别结果也间接由您限定。假设您需要识别员工卡号,那么您需要在“字段值”处提供所有员工卡号,保障返回的结果是其中一个数字,否则结果将为空值或返回错误。

如果您无法判断字段的属性,选择“常规”类型即可。填好信息后如图:

5、完成这一步,点击“发布模板”,您已经成功建立一个专属模板。

6、回到模板界面,点击“测试模板”开始进行测试。

7、上传图片测试效果,仅支持jpg, jpeg, png, bmp格式,不支持PDF等格式。同时建议您尽量上传清晰、背景干净、角度端正的图片。测试结果如图:

如果您在测试过程中遇到任何识别问题,欢迎通过Face++人工智能开放平台在线智能客服提交反馈!

8、现在,您可以根据API文档指示进行批量调用啦。

【云栖快讯】阿里巴巴小程序繁星计划,20亿补贴第一弹云应用免费申请,限量从速!  详情请点击

网友评论