风控系统之数据服务,名单、标签、IP、设备、地理信息、征信等
个人博客:无奈何杨(wnhyang)
个人语雀:wnhyang
共享语雀:在线知识共享
Github:wnhyang - Overview
提要
早些年,“马云提出,人类已经从IT
时代走向DT
时代,IT
时代是以自我控制、自我管理为主,而DT
(Data technology
)时代,它是以服务大众、激发生产力为主的技术。这两者之间看起来似乎是一种技术的差异,但实际上是思想观念层面的差异。”
在这样一个我们自己都不如大数据了解自己的时代,应该都深有体会吧。
那么,在风控系统中数据有哪些,他们在风控系统中如何应用?
参考:
以下两图都来源于此
事件
首先,风控系统的所有进件数据就是最重要的数据,事件包含最基础的数据。
风控系统要做的就是通过这些基础数据来分析计算,最终得到决策结果。
解析数据
基础的事件数据,可以是已加工过的,如:IP归属国家/地区、GPS归属地、证件号归属地等等。也可以是基础的IP、经纬度、证件号等。但作为统一的系统处理还是基础数据好一些,一致性上有些保障。这样的话,就需要解析数据,如IP归属地数据库、GPS归属地数据库、手机号归属地数据库、身份证归属地数据库等等。
这些可以是系统本身提供,也可以是外部提供。
但是通常这些数据,都只能是一些数据服务商提供,自己来做确实比较难搞。
关于这个解析数据会另一篇文章介绍这近一周的折腾。
指标
指标是风控系统中最重要的数据之一,灵活多变、实时计算。
名单/标签类数据
之前在规则的介绍中有提到,名单可用于规则判断也可以用于规则命中后的操作。
标签作为事件完成后的附属品,与名单类还稍微有些不一样,因为标签只在事件生命周期结束后产生,而名单事前和事后都是有的。
外部数据
要讲起外部数据,那可太多了,接什么数据就有什么数据。
人行、三方征信、工商、法院、税务、银联、运营山、社交平台、公安......
作为三方数据最大的缺点就是不可控,不可控就是最可怕了,如果是离线数据给出,风控系统自己开发业务逻辑使用这些数据,倒还好(但这通常更不好搞,联系更紧密了,关联太深了)。换是通过api、rpc等接口调用方式的话又要考虑到安全、稳定、熔断等等。总之很难有两全其美的方法。
其他
设备数据不可以单独讲一下吗?
设备其实可以归结到客户端风险检测,常见有:ROOT越狱、HTTP代理、VPN代理、模拟器检测等等。
写在最后
拙作艰辛,字句心血,望诸君垂青,多予支持,不胜感激。
个人博客:无奈何杨(wnhyang)
个人语雀:wnhyang
共享语雀:在线知识共享
Github:wnhyang - Overview