在风险管理中,数据分析算是一个最基本也是最重要的环节,往往决定着风险管理的好坏差异。数据分析师就像一位侦查兵,数据一有变动就能马上感知。不需像模型岗位,需要等待数据累积到某个量级才能建模。
一个优秀的数据分析师不仅要懂得怎么提数做分析,当然更要懂业务。高级的数据分析更是需要结合数据分析的结果提供到位的解决方案。
不少打算从事风控数据分析的同学都在询问同一个问题,即风控中的数据分析究竟需要做哪些具体的数据分析工作?本文跟大家讲解下风险管理工作中,重要的数据分析的内容都有哪些。
我们将风控的数据分析拆分成两块:
一个是日常监控数据分析
另一个是基于业务的数据分析
一.日常监控数据分析
日常的监控报表所涉及的内容较多,比如平常做了一次推广活动之后,我们想看一下活动推广的数据情况,于是整理分析对渠道监控的数据分析报表。推广渠道分析——
根据渠道的数据分析情况,相关的授信金额、获客情况,都是日常分析中最重要的部分。日常监控报表之一:
二.基于业务的数据分析
基于业务的数据是整个数据分析中分量最多的部分,这一part是整个数据分析工作中是信贷风控中的特色模块,做这个分析需要理解业务流程,懂业务逻辑。我将数据分析按照业务流程,拆分成三部分,分别从贷前模块、贷中模块和贷后模块,一一阐述。
1.贷前模块
贷前是关于在风控流程中较为前置的部分内容。在这一模块中,我们经常是基于以下业务背景开展数据分析工作,以下我们列举两个典型场景:
a.公司需要开展新的产品线,需要结合历史数据分析存量客户的画像,决定新产品的投放渠道、产品定价等内容。
b.开发贷前申请评分模型前,是有一个数据分析环节,对产品特点、数据质量、分期情况等都需要有一个全面周全的把控,但之前看很多模型开发报告都直接跳过了这些内容。
下面我们对具体需要分析的报表做详细剖析:
对贷款类型的统计分析:
对还款方式的统计分析:
具体到某一个产品还款方式占比分析:
在开发贷前评分卡前,更是有需要对相关的表跟字段的统计分析。统计数据的所有变量,将具体的变量情况划分为四个类别,分别是数值型变量、字符标志变量、日期型变量以及关联键变量。
并且将这几个维度的变量展开详细的数据分析。数值型变量是一些取值连续的变量,如贷款金额、担保金额、销售额等。字符标志变量是那些取值为离散型的变量,例如客户教育程度、婚姻状况、贷款类型等。
对于数值型变量还会将分析其缺失值、平均值、中值、最大最小值和各种常用分位数;字符标志变量和日期变量则进行频数分析。通过此类分析,可以直观地观察到各变量的分布情况,并分析其变量分布的合理性,以便于及时发现数据的异常情况。
分析完资产概况、字段信息后,会结合产品对客户的画像中几个重要字段展开时间上的统计。这几个重要字段有教育程度、性别和职业等信息。
比如对之前某产品的分析结果,我们分析相关的数据,得到以下图表:
在对某产品的教育程度的分析中,可以看到2018年的该数据的缺失程度较高,这一部分应该是在系统迭代产品的系统性的数据缺失,另一结论是现有产品大专以上学历较之前有所减少。
有这样的数据分析结论,能够帮助我们进行相应的产品调整、客群调整,并且还能帮我们分析模型客群稳定性的内容,PSI指标在其中就能实现该指标的量化分析。
2.贷中模块
贷中监控中需要做分析的内容分别有资产分析和滚动率分析:
a.Vintage表—账龄表
这个是根据客群的资产表现做的一张表:
将每个月的booking的金额做一个统一的规整,得到一张booking金额表·,并且将每个月charge_off,逐一统计,将坏账合计,最后每个月的booking的金额一一做商,汇总得到资产表现情况。
根据资产表现,我们需要获取的信息有下面几点:
账期是多长时间的产品(产品周期)资产是在多长时间内趋于稳定(产品的稳定周期)结合vingtage应用到建模的数据里(结合建模)
b.滚动率 Flow Rate:
处于某一逾期阶段的客户转到其他逾期阶段的变化情况。迁移率通常可以用来预测不同逾期阶段的未来坏账损失。比如,M2-M3,说的是从逾期阶段M2转到逾期阶段M3的比例。
上面说的vintage是从时间维度上判断客户群体的好坏,下面说的滚动率则是从行为程度上判断客户的好坏,它可以帮助我们判断某些逾期客户是否还可以再抢救一下,收回点成本。
3.贷后
本文中所提到的贷后的数据分析也将从催收部门中,平常需要做的工作进行梳理。
(PS.贷前/贷中与贷后的区分点是有以下:放款提现是贷中跟贷前的区分点,但贷中与贷后特别在互金中并没明确区分点。在互金产品中,贷中跟贷后的区别相对较模糊。一般会将人员逾期划分为贷后催收。
而在银行体系中的信用卡的产品,较为重视贷中行为,因为信用卡相对其他银行系产品的贷前监控仍相对较松。信用卡重视的是贷中监控模块。)
贷后部门需要做的数据分析内容较多更多些,以下我们从几大方面进行梳理,分别是:
a.人力效能模块
b.回款指标模块(预测分析模块)
以下将这两个模块进行阐述。
a.人员绩效模块
催收员日报:
管理人员的统计明细:
催收里的人力分析模块:
当然少不了关于催收外包人力的数据分析:
根据人力跟合同情况计算的人力效能:
b.回款指标模块
回收率报表——地区的回收率报表,回收率报表是贷后部门经常需要统计跟分析的报表,回收的城市、渠道等都是统计的口径:
回收率/回收金额对比情况:
有效回收率:
在有效回收率中,如果没有将回滚计算上,回收率可以等于1-滚动率(请注意这里的前提,这也是知识星球里提问较多的一个问题)
待扣成功率分析:
将回款目标拆解,进行合理的回收指标的设置:
了解更多关于风控数据分析的实操报表详情?也可来知识星球中查看学习这份风控数据分析资料的内容:
以上关于风控数据分析相关的内容,可关注:
1:《数据分析训练营》
2:《sas数据分析训练营》
~原创文章
…
end