征信报告OCR:结构化提取信息 加速信贷业务审批

简介: OCR技术在信贷业务中的应用,实现了征信报告识别录入自动化,优化业务流程的同时,也提升了业务处理效率,让信贷服务能够更加高效、便捷地触达用户。

征信报告是个人和企业征信历史的客观记录,也是信贷机构评估用户信用风险的核心依据,对信贷风控具有重要参考价值。在处理借贷业务时,信贷机构会通过用户既往信用记录分析、判断用户还款意愿,以便预见性地规避风险、减小坏账率。

然而,由于征信信息涉及个人隐私,央行征信中心不面向第三方机构开放征信数据,同时,在复杂的竞合关系下,各信贷平台也常常对打通信息孤岛共享数据持观望态度,导致信贷机构获取用户信用信息的门槛相对较高。

目前,办理贷款业务时,信贷机构只能在获得用户授权的情况下从央行征信中心调用征信报告,以便获得用户信用信息。拿到报告后,需要通过人工方式把核心信息一一录入风控模型,用于分析、评估潜在风险,进而作出相应决策。

WechatIMG14_jpeg

下图是从央行征信中心下载的《个人信用报告(个人版)样本》。如图所示,报告涵盖了公安部身份信息核查结果、个人基本信息、银行信贷交易信息、非银行信用信息等,信息量庞大。

WechatIMG15_jpeg
WechatIMG16_jpeg
WechatIMG17_jpeg
WechatIMG18_jpeg
(个人信用报告(个人版)样本)

问题在于,人工录入作业量大、相对耗时,难免影响贷款审批效率,造成意向客户的流失;抑或为实现快速放款,业务部门处理征信数据时删繁就简,因疏漏或主观判断造成风险评估不够精准。

基于这一现状,深源恒际推出征信报告信息结构化提取解决方案,帮助借贷平台提升服务效率、降低人力成本。

基于OCR识别技术,结合专项训练和自适应提取方法,深源恒际开发了征信报告专用识别模型,可自动识别、提取征信报告上的文字信息,并输出结构化文本,实现信息采录自动化。

在实际应用场景下,会出现诸多干扰识别效果的因素,如文本不清晰、旋转畸变等。为优化识别准确率、达到商用落地效果,深源恒际通过技术手段建立抗干扰机制,利用直线/表格线识别规则纠正文本畸变,通过分离印刷文本和打印文本提升字段提取准确率,结合启发式规则实现翻页文本合并,大幅提升模型的识别准确率。

测试数据显示,基于OCR完成整份征信报告的识别录入,用时约为20s-30s;而人工录入整份报告耗时约1-2小时,作业效率大幅提升。另外,在识别精度上,算法模型的字段准确率已达99%。

OCR技术在信贷业务中的应用,实现了征信报告识别录入自动化,优化业务流程的同时,也提升了业务处理效率,让信贷服务能够更加高效、便捷地触达用户。目前,深源恒际已在阿里云云市场平台上线了征信报告识别提取API,用户可点击访问link体验产品功能。

相关文章
|
2月前
|
人工智能 文字识别 Java
AI工具【OCR 01】Java可使用的OCR工具Tess4J使用举例(身份证信息识别核心代码及信息提取方法分享)
【2月更文挑战第1天】Lept4J和Tess4J都是基于Tesseract OCR引擎的Java接口,可以用来识别图像中的文本,本次介绍Tess4J
86 0
|
4月前
|
文字识别 算法 数据库
开源OCR模型DIY票证信息抽取
票证检测矫正模型在实际生活中有着广泛的需求,例如信息抽取、图像质量判断、证件扫描、票据审计等领等场景,可以大幅提高工作效率和准确性。
|
11月前
|
文字识别 UED
身份证OCR接口:提高录入效率+识别信息造假
现在的身份证登记多采用人工录入方式,这样做不仅费时而且效率很低。如何利用新兴的身份证OCR接口证件识别技术,快速、高效、完整地录入证件信息,并对其进行相应的管控与核验,已成为许多信息系统亟待解决的问题。
105 0
|
机器学习/深度学习 人工智能 文字识别
合合信息——用智能文字识别技术赋能古彝文原籍数字化
合合信息——用智能文字识别技术赋能古彝文原籍数字化
合合信息——用智能文字识别技术赋能古彝文原籍数字化
|
移动开发 文字识别 开发工具
iOS小技能: OCR 之银行卡/身份证信息识别(免费次数无限)
1. 功能:扫描银行卡识别信息( 银行名称、 银行卡号)并截取银行卡图像 2. 应用场景:快速填充银行卡号的场景,比如商户进件、实名认证
324 0
iOS小技能: OCR 之银行卡/身份证信息识别(免费次数无限)
|
机器学习/深度学习 存储 自然语言处理
【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
什么是基于深度学习的文本信息抽取? **信息抽取 (Information Extraction)** 是把原始数据中包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始数据,输出的是固定格式的信息点,即从原始数据当中抽取有用的信息。信息抽取的主要任务是将各种各样的信息点从原始数据中抽取出来。然后以统一的形式集成在一起,方便后序的检索和比较。由于能从自然语言中抽取出信息框架和用户感兴趣的事实信息,无论是在信息检索、问答系统还是在情感分析、文本挖掘中,信息抽取都有广泛应用。随着深度学习在自然语言处理领域的很多方向取得了巨大成功......
【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
|
文字识别
OCR:实现信息结构化提取 助力信息数字化管理 ——基于OCR的机动车销售统一发票识别提取自动化应用案例
为降低信息提取成本、优化业务处理效率,深源恒际依托自身在OCR技术上的积累,打造了机动车销售统一发票信息识别提取自动化解决方案,自动检测、识别、提取发票信息,并根据实际应用需求输出结构化文本,由计算机替代人工作业,高效、准确地完成信息提取。
|
文字识别 Oracle 关系型数据库
|
26天前
|
文字识别 容器
文字识别OCR常见问题之本地部署如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
31 3
|
26天前
|
文字识别 前端开发 API
文字识别OCR常见问题之处理产品图片识别如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
22 3

热门文章

最新文章