SACC 2016:专访宜信大数据研发经理侯松

简介: 本文讲的是SACC 2016:专访宜信大数据研发经理侯松,随着数据时代的到来,以云计算、物联网、大数据、智能设备为代表的新兴技术正在得到越来越广泛的应用,各行业以“互联网+”为契机正在掀起一场新的风潮,互联网金融也不例外。

本文讲的是SACC 2016:专访宜信大数据研发经理侯松,随着数据时代的到来,以云计算、物联网、大数据、智能设备为代表的新兴技术正在得到越来越广泛的应用,各行业以“互联网+”为契机正在掀起一场新的风潮,互联网金融也不例外。本次我们采访到了宜信大数据研发经理侯松,和我们聊聊大数据风控的那些事儿。

SACC 2016:专访宜信大数据研发经理侯松
宜信大数据研发经理  侯松

  侯松(个人博客:http://housong.github.io/),毕业于新加坡国立大学计算科学系,曾就职于新浪信息系统部,负责Hadoop集群及各种周边系统的开发维护和优化。目前担任宜信大数据研发经理,负责姨搜大数据风控的各种数据产品和基础设施,协助宜信各产品线和业务方提升风控水平。

  新时代的风控如何发展

  金融的本质是风险管理,风控是所有金融业务的核心。侯松认为数据的有效性直接决定了风控的质量,云物大智的发展为数据的获取和处理提供了新途径,为风控行业带来了更多的可能性。

  现在有很多商场开始尝试用顾客手机的wifi记录来分析客流量。如果这些数据能以某种合规的形式共享出来,那么做借款业务的公司就可以和他们客户的手机做关联,查看他们在不同类别的商城出现的频率和时间。当然,这个只是想法,真正想要实施还面临着很多困难,比如iOS设备就开始对MAC进行随机化处理,使得客户流量分析更难进行。

  信贷数据缺失是整个信贷行业都面临的问题,侯松表示没有数据就无法判断风险,数据没有电子化、格式化就无法进行自动化的风控,针对数据问题,宜信也做了很多努力。

  1. 加强自身的信息化建设,保证自有数据能尽量完善;

  2. 跟第三方数据服务商进行合作,依托专业技能来扩充数据;

  3. 主动寻找信息化比较完善的行业,比如电商或者ERP/CRM的提供商等。

  大数据风控的未来在哪里

  大数据的数据管理能力和风控业务简直就是天生一对,当前大数据风控主要有三个服务方向数据收集、数据加工与数据建模和提供分析与服务,侯松认为大数据风控的未来会是一个结合了大数据技术和风控自有系统(比如决策执行引擎等)的私有云,以较小的管理和运行成本提供完整的数据整合、风控模型实验分析和风控政策上线监控的全方位服务。

  征信系统是每一个互金人都感同身受的风控之痛。侯松认为中国和其他发达国家的征信相比,还有很长的路要走,征信系统遇到的最大困难就是数据体系的建设。

  央行的征信系统能覆盖的人群和数据种类比较有限,能接入的单位也很有限;游走在央行征信系统之外的这些组织,要么是大公司在长时间的运营中已经积累了很多自有数据,要么是新企业还在黑暗中摸索,而这些组织都把数据攥在手里,共享的意愿不强,形成了一个个孤岛,导致很多问题无法解决(比如多头负债)。要想改变当前现状,行业领先者必须站出来,尽快建立数据共享行业标准,成立独立于任何组织的第三方数据服务公司,同时还要取得国家相关部门的许可。

  一个好的架构和架构师应该是这样的

  一千个读者心中有一千个哈姆雷特,一千个人心中也有一千个完美的架构。侯松认为完美的架构可以有千万种,但是它们都有一个共同的特点。一个成功的架构,一定是技术、产品、已有资源和未来规划相结合的产物,脱离其中的任何一个都不是完美的架构方案。

  在侯松看来,一个好的架构师,除了是一个资深的程序员之外,还应该是一个好的产品经理和技术管理人才。作为一个程序员,他需要能设计好系统的结构,写出正确高效的核心代码,给团队成员提供指导,同时也能关注业界动态,把最新的技术引入团队;作为一个产品经理,他需要能理解产品最核心的逻辑,按照产品的需要设计架构并预留出适当的空间,而不是一味的拔高;作为一个技术管理者,他需要能得到团队成员的信任,能准确知道每个人的技能和做事风格,做好放权也能做好全局把控,最后还需要对人员和资源做正确的预估,在资源不够的情况下及时作出技术架构和产品需要之间的权衡。

  新技术新思想的不断涌现也促进了架构创新,2016年第八届中国系统架构师大会SACC也以“架构创新之路”作为主题,对此侯松认为架构的最佳实践的确是在不断更新,但是计算机科学中的一些基本理论是不变的,只有认识到最本质的思想,才能快速掌握新技术,应用到自己的系统中。

SACC 2016:专访宜信大数据研发经理侯松

  作为国内最受欢迎的架构师盛会,2016年第八届中国系统架构师大会SACC即将于10月27-29日在北京盛大召开。本届大会以"架构创新之路"为主题,安排两大主场和24个专场。届时,来自互联网、电子商务、金融、电信、政府、行业协会等20多个领域的150多位技术专家将汇聚一堂,共同探讨云计算和大数据时代下,如何通过架构创新来实现企业的快速转型。更多内容请访问大会官网:http://sacc.it168.com/

作者:田晓旭

来源:IT168

原文标题:SACC 2016:专访宜信大数据研发经理侯松

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
SQL 分布式计算 关系型数据库
超详细!搭建本地大数据研发环境(16G内存+CDH)(二)
超详细!搭建本地大数据研发环境(16G内存+CDH)(二)
791 0
超详细!搭建本地大数据研发环境(16G内存+CDH)(二)
|
大数据 Linux 数据安全/隐私保护
超详细!搭建本地大数据研发环境(16G内存+CDH)(一)
工欲善其事必先利其器,在经过大量的理论学习以后,需要有一个本地的研发环境来进行练手。已经工作的可以不依赖于公司的环境,在家也可以随意的练习。而自学大数据的同学,也可以进行本地练习,大数据是一门偏实践的学科,在找工作之前进行一些实践操作,也更利于对大数据知识的理解。 本文将从头开始详细的记录整个大数据环境的搭建过程,本文所使用的笔记本电脑内存为16G,将使用CDH6.3.2管理整个大数据集群。 本文共四个部分,一定要保证每一个部分都安装成功以后再向下进行。
743 0
超详细!搭建本地大数据研发环境(16G内存+CDH)(一)
|
机器学习/深度学习 人工智能 城市大脑
前端智能化在阿里云大数据研发平台中的实践
前端智能化有哪些实际应用场景?
前端智能化在阿里云大数据研发平台中的实践
|
数据采集 监控 大数据
后端技术杂谈12:捋一捋大数据研发的基本概念
你了解你的数据吗(开篇) 转自http://www.mdjs.info/2018/03/05/data-warehouse/concept-of-dw/0x00 前言你了解你的数据吗? 前几天突然来了点灵感,想梳理一下自己对数据的理解,因此便有了这篇博客或者说这系列博客来聊聊数据。
|
SQL DataWorks 监控
DataWorks V2.0 新一代智能大数据研发平台
在2018年7月12日,DataWorks将会发布一个新版本,DataWorks V2.0。DataWorks V2.0在V1.0的基础上,推出了很多强大的功能,以提升大数据研发、运维的效率。下面给大家讲解一下本次发布新增的功能点。
5021 0
|
机器学习/深度学习 安全 大数据
|
10天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
10天前
|
SQL 分布式计算 大数据
MaxCompute产品使用合集之怎样可以将大数据计算MaxCompute表的数据可以导出为本地文件
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

热门文章

最新文章