风控系统之数据服务,名单、标签、IP、设备、地理信息、征信等

个人博客:无奈何杨(wnhyang)

个人语雀:wnhyang

共享语雀:在线知识共享

Github:wnhyang - Overview


提要

早些年,“马云提出,人类已经从IT时代走向DT时代,IT时代是以自我控制、自我管理为主,而DT(Data technology)时代,它是以服务大众、激发生产力为主的技术。这两者之间看起来似乎是一种技术的差异,但实际上是思想观念层面的差异。”

在这样一个我们自己都不如大数据了解自己的时代,应该都深有体会吧。

那么,在风控系统中数据有哪些,他们在风控系统中如何应用?

参考:

智能风控筑基手册:全面了解风控决策引擎

以下两图都来源于此

image
image(1)

事件

首先,风控系统的所有进件数据就是最重要的数据,事件包含最基础的数据。

风控系统要做的就是通过这些基础数据来分析计算,最终得到决策结果。

解析数据

基础的事件数据,可以是已加工过的,如:IP归属国家/地区、GPS归属地、证件号归属地等等。也可以是基础的IP、经纬度、证件号等。但作为统一的系统处理还是基础数据好一些,一致性上有些保障。这样的话,就需要解析数据,如IP归属地数据库、GPS归属地数据库、手机号归属地数据库、身份证归属地数据库等等。

这些可以是系统本身提供,也可以是外部提供。

但是通常这些数据,都只能是一些数据服务商提供,自己来做确实比较难搞。

关于这个解析数据会另一篇文章介绍这近一周的折腾。

ygLg9

指标

指标是风控系统中最重要的数据之一,灵活多变、实时计算。

名单/标签类数据

之前在规则的介绍中有提到,名单可用于规则判断也可以用于规则命中后的操作。

标签作为事件完成后的附属品,与名单类还稍微有些不一样,因为标签只在事件生命周期结束后产生,而名单事前和事后都是有的。

外部数据

要讲起外部数据,那可太多了,接什么数据就有什么数据。

人行、三方征信、工商、法院、税务、银联、运营山、社交平台、公安......

作为三方数据最大的缺点就是不可控,不可控就是最可怕了,如果是离线数据给出,风控系统自己开发业务逻辑使用这些数据,倒还好(但这通常更不好搞,联系更紧密了,关联太深了)。换是通过api、rpc等接口调用方式的话又要考虑到安全、稳定、熔断等等。总之很难有两全其美的方法。

其他

设备数据不可以单独讲一下吗?

设备其实可以归结到客户端风险检测,常见有:ROOT越狱、HTTP代理、VPN代理、模拟器检测等等。

写在最后

拙作艰辛,字句心血,望诸君垂青,多予支持,不胜感激。


个人博客:无奈何杨(wnhyang)

个人语雀:wnhyang

共享语雀:在线知识共享

Github:wnhyang - Overview