如何用无监督模型,防范信用卡欺诈?

简介: 小叽导读:国际支付是指在国际经济活动中的当事人以一定的支付工具和方式,清偿因各种经济活动而产生的国际债权债务的行为。在支付中,如果伪造、冒用他人的卡进行支付或者用自己的信用卡进行恶意透支,就构成了欺诈。

小叽导读:国际支付是指在国际经济活动中的当事人以一定的支付工具和方式,清偿因各种经济活动而产生的国际债权债务的行为。在支付中,如果伪造、冒用他人的卡进行支付或者用自己的信用卡进行恶意透支,就构成了欺诈。本文将无监督模型应用在信用卡欺诈检测中,在国际信用卡欺诈检测场景下,autoencoder模型对比规则,召回率提升约3倍,准确率提升约40%,模型效果优于规则,且维护成本比规则低。

国际支付中的信用卡欺诈

问题严峻性

从大的环境来说,信用卡欺诈已经形成了完整的偷盗、伪造、倒卖卡的产业链,给银行和用户造成很大的损失。国际站平台上发起信用卡支付时,如果发生盗卡,通常只要在一个月内报知银行,用户就只损失很低的金额,其他的部分由银行协调平台赔付,当平台短时间内发生大量盗卡事件时,平台不仅要赔付用户盗卡损失,还会被结算机构根据既定的协议处罚甚至终止合作。因此及时有效地识别平台上的欺诈案例并进行拦截,是风控系统需要解决的问题。

已解决和待解决的问题

在国际站购买商品采用信用卡支付时,需要在平台上发起支付,经过支付网关路由到各个收单行,由收单行进行授权,授权成功后再进行请款,才能完成一笔支付。目前风控系统在支付发起、银行授权和请款各个阶段都有相应的风控策略进行欺诈预警和拦截,能够解决一部分欺诈问题,特别是与历史发生类似的欺诈案例。

当前的风控策略主要是基于业务经验和对历史欺诈案例进行分析生成的经验规则,而欺诈团伙为了绕开风控系统,会不断地改变自己的欺诈手段,当前的这种风控策略对于新出现的欺诈方式难以及时有效地识别和预警。

平台的数据优势

与银行及其他外部信用卡风控机构相比,国际站支付除了可以拿到支付发起人、设备和卡等与当前支付密切相关的信息外,平台上还沉淀了丰富的交易数据,与外部风控机构相比,可以获取更全面的数据,如何利用这部分数据,及时有效地识别欺诈案例,既要能识别历史出现的类似欺诈case,又要能识别新的欺诈手段造成的欺诈case,还要不伤害平台的用户体验,对非欺诈case能快速通过,尽可能低的减少误拦截,是接下来我们要解决的问题。

无监督信用卡欺诈检测方案

无监督VS有监督

在信用卡异常检测场景下,理想的情况是输入一条信用卡支付的相关特征数据后,检测模型能够判定出该支付是否异常(或者给出异常值),直观上可以转换为分类或回归问题,沿着这个思路,我们只要从历史数据中获取标记的欺诈和非欺诈支付样本,即可通过有监督的方式训练得到分类模型,用于判定是否欺诈,并且我们也确实尝试过这样的方案。

上面的有监督模型看起来一切都顺理成章,十分完美,但是在实际应用的效果却差强人意。在信用卡支付中,欺诈尽管危害很大,但平台大部分的用户都是正常交易支付,短时间内难以获取大量的异常样本,需要一定时间的积累,才能获取到一定量的异常样本支持模型训练,得到的模型在训练集上进行预测,通常会有较好的表现。但是,当上线用于未来的支付欺诈检测时,效果会大打折扣,这是因为欺诈者往往会升级自己的作案手段以规避风控系统,从数据上来说,新的欺诈样本与训练集中的欺诈数据分布差异较大,训练集样本不能够很好的代表测试集,从而导致模型过拟合,在测试集上效果较差。

有监督模型存在异常样本过少以及数据分布引起的过拟合现象,无监督模型不需要标记正负样本,模型训练的数据集规模较大,采用实时训练,还可以及时得将新出现的case添加到训练样本中更新模型,有效的避免因为数据分布引起的过拟合问题,本文主要介绍用autoencoder算法进行信用卡欺诈检测。

无监督的解决方案

欺诈感知

信用卡欺诈发生在交易支付的流程中,理解这个流程,是我们感知识别欺诈的前提,简单概括如下:

_
欺诈行为虽然仅在支付流程中发生,但平台的支付源于交易,因此整个流程中涉及的主体包括买家、卖家、商品、卡和关系信息(支付关系,交易关系)都可以用于欺诈感知。因此欺诈感知的数据维度主要包括:
_
基于原始的业务数据和经验,通过简单的统计方法或者规则,及时发现可能的欺诈异常,同时快速放过正常的支付,提升正常支付的通过率和流畅度,初步的感知策略既可以在监控系统中发挥直接的作用,也可以作为特征作用于自动化模型,逐步迭代升级风控系统。

无监督模型——autoencoder

autoencoder是一种人工神经网络,用无监督的方式训练模型用于数据编码,从而压缩得到有效的数据信息。网络中包括一个编码器和一个解码器,结构对称,编码器用于将原始数据(输入)编码,解码器用于将编码后的数据解码得到原始输入数据(输出),损失函数是原始数据与解码得到的数据之间的误差,模型训练的目标是最小化损失函数。autoencoder的网络结构如下:
_
autoeocder用于信用卡异常检测

信用卡异常检测场景下,训练样本中大部分是正常支付,只有少量是异常支付,用未标记的样本训练autoencoder模型,为了使最终样本整体平均的恢复误差最小化,在训练时,网络结构中编码器和解码器会更倾向于适配正常支付样本的特征模式,因此,当用测试数据作用于模型时,可以通过恢复误差的大小来判定是否异常。具体算法如下[1]:

_
线上规则轻量化

由于历史原因,风控系统中积累了大量基于业务经验的规则,用于线上进行异常预警和拦截,随着规则积累的越来越多以及人员的变动,维护变得越来越困难甚至难以操作,因此规则的轻量化也是该场景下面临的重要问题之一。

借助于autoencoder模型的自动化编码能力,我们可以将规则抽取出来,进行编码,作为模型的输入特征进行使用,评测结果显示,模型可以达到优于线上规则的效果,因此可以逐步测试,用模型替换线上人工规则,降低维护成本。
_
取得的效果

经过多次的实验和调优,在国际信用卡欺诈检测场景下,autoencoder模型对比规则,召回率提升约3倍,准确率提升约40%,模型效果优于规则,且维护成本比规则低。此外,模型相比线上规则,能够更及时的检测发现新的欺诈类型,从而降低平台损失。

未来和后续

autoencoder模型在支付场景下的应用,是无监督模型在异常检测中的初步实践和应用,打通了相关流程,取得了一定的业务效果,证明无监督方法在这一场景下实践中的有效性。后续会在异常特征感知、特征去干扰、模型泛化能力以及异常判定方法等方面进行深入的优化的改进,并应用到领域其他业务场景上。

原文发布时间为:2019-02-18
本文作者:新起点
本文来自云栖社区合作伙伴“ 阿里技术”,了解相关信息可以关注“ 阿里技术”。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 安全
论文介绍:从黑盒生产语言模型中提取信息的模型窃取攻击
【2月更文挑战第22天】论文介绍:从黑盒生产语言模型中提取信息的模型窃取攻击
18 6
论文介绍:从黑盒生产语言模型中提取信息的模型窃取攻击
|
5月前
|
机器学习/深度学习 监控 TensorFlow
利用TensorFlow实现机器学习代码以用防止员工泄密软件检测员工泄密行为
随着信息安全的重要性日益增加,保护敏感数据免受员工泄密的风险成为组织的首要任务之一。在本文中,我们将讨论如何使用TensorFlow,一种强大的开源机器学习框架,来实现防止员工泄密软件。我们将演示如何编写代码来监控员工的行为,检测潜在的泄密行为,并在必要时采取自动化措施。这一切将有助于加强数据安全,防止敏感信息泄露。
183 2
|
机器学习/深度学习 数据采集 数据可视化
数据分析案例-基于随机森林模型对信用卡欺诈检测
数据分析案例-基于随机森林模型对信用卡欺诈检测
263 0
数据分析案例-基于随机森林模型对信用卡欺诈检测
|
监控 算法 安全
欺诈团伙遇上关联网络,邪不压正
你可能永远都想不到骗子有多狡猾、多专业
192 0
欺诈团伙遇上关联网络,邪不压正
|
人工智能 安全 算法
《白皮书》:身边的人脸安全事件及背后的三类攻击手段
近日,顶象发布《人脸识别安全白皮书》。《白皮书》对人脸安全事件、风险产生的原因进行了详细介绍及重点分析。
156 0
《白皮书》:身边的人脸安全事件及背后的三类攻击手段
|
机器学习/深度学习 人工智能 自然语言处理
为什么说机器学习是预防欺诈的最佳工具?
随着现代技术的发展和完善,生活变得越来越舒适。虽然以前人们认为同时进行复杂的操作是不可能的,而如今计算机使这一任务变得很容易了。
705 0
为什么说机器学习是预防欺诈的最佳工具?
|
SQL 算法 安全
基于关系的违规团伙发掘风控方案
目前很多平台方都有团伙作案的情况发生,比如团伙性薅羊毛,比如团伙性的制造一些虚假信息,团伙性发送违法广告。之所以是团伙性作案,因为作案人员之间有某种关系连接。当业务方获取了人员关系之后,能否成功挖掘出违规团伙,关系到平台的安全。
3254 0
|
Web App开发
二月垃圾邮件现状报:欺诈和钓鱼类信息倍增
2010年1月海地大地震后,欺诈和钓鱼消息数量急剧上升,攻击者利用这次灾难事件来为自己谋取利益。与2009年12月相比,2010年1月欺诈和钓鱼类消息在垃圾邮件中所占的比例是原来的2倍。419尼日利亚垃圾邮件(Nigerian Spam)手段江湖重现,欺诈和钓鱼消息数量占垃圾邮件总数的21%,达到该报告发布以来的历史最高记录。
774 0
|
算法
信用卡欺诈模型的一些总结
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_32502811/article/details/81008948 有些言简意赅······· 1.
1318 0
|
Web App开发 算法 安全
《网络空间欺骗:构筑欺骗防御的科学基石》一3.3.4 识别和量化恶意软件的指标
本文讲的是网络空间欺骗:构筑欺骗防御的科学基石一3.3.4 识别和量化恶意软件的指标,本节书摘来华章计算机《网络空间欺骗:构筑欺骗防御的科学基石》一书中的第3章,第3.3.4节, Cyber Deception: Building the Scientific Foundation 苏西尔·贾乔迪亚(Sushil Jajodia)V. S.苏夫拉曼尼(V. S. Subrahmanian)[美] 维平·斯沃尔(Vipin Swarup) 著 克利夫·王(Cliff Wang) 马多贺 雷程 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
908 0