联通案例|利用大数据分析,识别电话诈骗个人隐私信息泄露途径

  1. 云栖社区>
  2. 大数据文摘>
  3. 博客>
  4. 正文

联通案例|利用大数据分析,识别电话诈骗个人隐私信息泄露途径

小旋风柴进 2017-05-17 11:52:53 浏览3525
展开阅读全文

1.被呼号码临界熵的计算


0?wx_fmt=jpeg


电话诈骗具有明显的特点(见图1)。据统计,电话诈骗的平均成功率仅为0.28%,即平均要打上357次电话才有可能诈骗成功一次,所以电话诈骗也是个费时费力的“工作”。一般而言,电话诈骗中受其侵害的群体比较广泛,有些是非特定的,采取顺序拨号,有些却是有明确目标、针对性比较强的。这些有针对性的诈骗,通常都是受害者的个人信息被泄露所引发的,而且诈骗人可能针对已获取信息为此类群体准备了专门的沟通“脚本”。

0?wx_fmt=png

图1:电话诈骗呼叫时点与通话时长的分布


为了从被举报的电话诈骗中,发现有明确目标的“无序”(明显的吉祥号码除外)被呼号码,我们引入了“临界熵”(marginal entropy)指标,同时采用“滑动窗口法”来计算熵值,进一步挖掘被呼号码间的关联。相比以往的“隔断窗口法”,在处理数据方面“滑动窗口法”具有明显的优势(见图2
















网友评论

登录后评论
0/500
评论
小旋风柴进
+ 关注
所属云栖号: 大数据文摘