金融交易面对严峻的欺诈环境,目前仍有三大急需解决的问题。一是欺诈风险监控需要更丰富的基础数据,二是欺诈风险监控需要更精准的模型方法,三是欺诈风险监控需要更及时的干预措施。面对上述挑战,新兴的大数据技术提供了一条可行的解决路径。
下面以某行银行为例来说明大数据在金融交易欺诈中的应用。
金融交易反欺诈体系以分布式集群为基础,接人行内外全面、丰富的信息,并按照客户、高户等维度进行了有机地整合;在此基础上,利用数据挖掘手段,部署了数百个智能模型,并综合实时、准实时和批量的监控手段,有效堵截了各类欺诈风险事件,其整体架构如图
( 1 )综合利用行内外各类型基础数据
当前,金融交易欺诈手段往往呈现出变化多样且隐蔽性强,根据单一的交易数据信息难以断定是否欺诈,需要掌握更为丰富的基础数据。因此,金融交易反欺诈体系需要采集各种产品和渠道的基础数据,包括客户个人的业务数据信息、电子银 行账户信息、线下消费支付交易数据及各类相关的交易日志;为了准确评估客户 信用,还需要分析央行的个人信用数据信息以及第三方的征信数据和行为数据。海量、异构的基础数据接人金融交易反欺诈体系 之后,经过数据格式化、筛选、校验、整合等处理流程,为后续的欺诈行为分析和挖掘奠定了基础。
(2)基于智能模型挖掘手段实现精准欺诈识别
针对不同的欺诈场景,金融交易反欺诈体系采取不间的分析维度,从海量的基础数据中, 按照客户、商户、产品、渠道等多个维度, 综合提炼出数以千计的统计指标和特征变量。这些统计指标和特征变量能够全面刻面出金融交易行为的轮廓,从而为构建智能模型和精确打击欺诈分子奠定基础。针对这类 “未知 ” 的欺诈场景, 一般采用专家规
则及智能模型来识别欺诈风险。智能模型通常是建立在特征变量基础之上, 通过历史数据和不同的智能学习算法(例如神经网络、逻辑回归、决策树、支持向量机等), 构建出不同的欺诈识别模型。
( 3)基于大数据处理技术从海量交易中快、准、稳地抓出欺诈交易。
分布式集群架构主要分为三大模块:一是数据分发集群, 采用哈希算法和Share Nothing的设计思想, 将这些 交易数据动态地分配到各个独立的计算节点;二是数据计算集群, 采用高级的数据统计分析技术(例如规则判断、模型预测等),对交易数据进行实时计算, 并根据欺诈策略返回相应的计算结果;三是交易事件库, 主要用于保存交易明细以及欺诈识别结果数据。
备注:部分内容来源于网络,侵删