Vintage、滚动率、迁移率的应用

互联网金融中,风控尤其重要。风控模型的实施需要定义Y,跟踪分析客户的风险情况,本文收藏了一份关于vintage、滚动率、迁移率的应用。

本文转:https://mp.weixin.qq.com/s/fcfL4PmS1w63pthL_M2daA

一、Vintage

Vintage源于葡萄酒酿造,葡萄酒的品质会因葡萄生长的年份不同、气候不同而不同。Vintage分析是指评估不同年份的葡萄酒的品质随着窖藏时间的推移而发生的变化,并且窖藏一定年份后,葡萄酒的品质会趋于稳定。如下图,2000年的葡萄酒品质最好,窖藏5年左右,葡萄酒品质会趋于稳定。

借鉴葡萄酒Vintage分析,信用分析领域不仅可以用它来评估客户好坏充分暴露所需的时间,即成熟期,还可以用它分析不同时期风控策略的差异等。

一个客户的好坏,需要经过若干个还款周期后才能充分暴露,如果表现期较短,有可能将一个不是很坏的客户定义为坏,也有可能将一个很坏的客户定义为好。比如一个客户在开始的几个周期内发生了逾期后将逾期还清,并且后面的周期不再发生逾期,若表现期较短会将此客户定义为坏;又比如一个客户刚开始一直正常还款,但到后面发生了比较严重的逾期,若表现期较短会将此客户定义为好。另外,可以通过比较不同时间的贷款在相同周期的逾期表现,来分析不同时间的风控策略的差异、宏观形势的变化等。

下图为2017年4月至2018年12月放款的M4+(即逾期91天以上)的Vintage图和Vintage数据表,此图统计的逾期用的是月末的逾期状态(有些时候也可以使用历史逾期状态,一个客户只要发生过M4+逾期,未来每个月都将该客户记为M4+逾期客户),计算逾期率使用金额(也可使用笔数)。从图中可以看出,不同月份放款的M4+在经过9个周期(9个月)后趋于稳定,也就是说成熟期是在9个周期。

从图中还可以看出,资产质量不断提升,2017年4月至6月的逾期率相对较高,从2017年7月开始逾期率发生较大程度的下降,有可能因为前几个月不断优化风控策略所致。

二、滚动率

前面说的Vintage可以用于分析客户表现的趋势、稳定的时间等,对于客户好坏程度的定义没有涉及,而通过滚动率分析可以对客户好坏程度进行定义。

滚动率分析就是从某个观察点之前的一段时间(称为观察期)的最坏的状态向观察点之后的一段时间(称为表现期)的最坏状态的发展变化情况,如下图。

在观察点2018年6月30日,取1万个客户,统计该1万个客户从观察期到表现期的最大逾期的变化情况,如下表。


从该表可以看出:

1.正常的客户,在未来6个月里,有96%会保持正常状态;

2.逾期1期的客户,未来有81%会回到正常状态,即从良率为81%,有7%会恶化;

3.逾期2期的客户,从良率为23%,有39%会恶化;

4.逾期3期的客户,从良率为14%,有61%会恶化;

5.逾期4期及以上的客户,从良率仅为4%,有82%会继续此状态。

在对坏客户进行定义时,应将坏客户定义得尽可能坏,以与好客户尽可能的区分开来,因此可以将逾期4期及以上的定义为坏,而逾期2期和3期定义为中度坏,逾期1期为轻度坏。当然,在开发模型或规则时,还要结合样本量,如果M1占比较高,可以将M1划为好客户,M4+为坏客户,M2和M3为灰度客户,从样本中剔除;如果M1占比很低,也可以将M1和M2、M3一起归为灰度客户,从样本中剔除。

三、Y变量的定义

Y变量即为客户好坏标签变量,前面的Vintage分析和滚动率分析中已经说过一些,这里做个总结。Y变量要结合滚动率分析和Vintage分析来定义,滚动率分析用于对客户好坏程度进行定义,Vintage分析用于设置合适的表现期。定义Y变量可以分为以下几步:

1.进行滚动率分析,定义坏客户,如上面所说的M4+为坏客户;

2.然后统计出M4+的Vintage数据表及Vintage图,找出成熟期;

3.表现期大于成熟期的样本可以用于建模,表现期小于成熟期的样本无法准确定义Y变量,暂时舍弃。

当然,在实际应用中,根据业务需要,Y变量的定义可以灵活变通。比如在业务刚开展不久,表现期较短,此时无法根据上述方法定义Y变量,可以暂将逾期大于10天、15天或30天的客户定义为坏等等,然后随着时间的推移不断修正Y变量及模型。

四、迁移率

迁移率分析和滚动率分析比较像,都是分析客户从某个状态变为其他状态的发展变化情况,所不同的是,滚动率侧重于分析客户逾期程度的变化,所以在做滚动率分析时需要设置相对较长的观察期和变现期;而迁移率侧重于分析客户状态的发展变化路径,如M0M1,M1M2,M2~M3等。

先统计2018年6月至2018年12月各逾期状态的资产分布情况,如下表。表中的回收率是指,假设每月末将M7的资产以10%的价格卖掉,即收回M7资产的10%。

下面计算月度迁移率,比如,2018年7月底,M0M1的迁移率为41110122/171325636=24%,以此类推,得到如下表的迁移率。这里迁移率的计算是以月为时间颗粒度,当前也可以精细到以天为颗粒度计算迁移率,然后计算平均值得出月度迁移率,但更细的颗粒度要求资产规模更大,如果资产规模较小会产生较大的误差。值得注意的是,表中M3M4的迁移率较高,应该是逾期超过90天,过了黄金催收期,所以逾期恶化程度较高,但M4~M5的迁移率突然降低了不少,有可能是委外催收起到了一定效果所致。

下面根据迁移路径计算各逾期状态的损失率,M0变为M7的比例定义为损失率等于16.06%*29.27%*42.28%*81.71%*52.75%*82.51%*86.05%=0.61%,因为M7将以10%的价格收回,所以净损失率等于0.61%*90%=0.55%,以此类推,得到各逾期状态资产的损失率,如下表。

前面讲到定义Y变量时,根据滚动率分析定义好坏的程度,其实这里也可以根据迁移率得出的损失率来分析好坏的程度,并且还可以结合损失率与收益率,这里不再赘述。

下面根据资产损失率计算2018年12月的资产预计损失,计算方法为2018年12月M0~M6各资产乘以对应的净损失率,然后求和,即等于3671628090.55%+472304303.41%+1484867811.64%+601149927.54%+461403833.70%+232645463.89%+1586471*77.44%=11273470。所以2018年12月拨备金额为11273470,占总资产的比例为11273470/443823814=2.54%,即拨备率为2.54%。

注:文中数据非真实数据,而是为了说明问题而生成的数据

Vintage、滚动率、迁移率的应用相关推荐

  1. 用sql统计vintage,滚动率,迁移率,逾期率

    获取代码请移步:用sql统计vintage,滚动率,迁移率,逾期率

  2. 信贷风控中Vintage、滚动率、迁移率

    风控业务背景 信贷风险管理是一门艺术,更是一门科学.资产质量分析中常会涉及到三个理论: 账龄分析(Vintage Analysis):用以分析账户成熟期.变化规律等. 滚动率分析(Roll Rate ...

  3. 【参考】vintage、迁移率、滚动率、入催率等概念——看完你就懂了

    随着互联网金融的发展,对数据分析的需求越来越大.数据分析的目的其实是为了找到风险和收益的平衡点.高收益伴随着高风险,而低风险的回报又如同鸡肋.所以,太高的风险,太低的收益都不行.平衡点通俗来讲就是风险 ...

  4. vintage、迁移率、滚动率、入催率等概念——看完你就懂了

    随着互联网金融的发展,对数据分析的需求越来越大.数据分析的目的其实是为了找到风险和收益的平衡点.高收益伴随着高风险,而低风险的回报又如同鸡肋.所以,太高的风险,太低的收益都不行.平衡点通俗来讲就是风险 ...

  5. mysql怎么分组计算逾期率_用sql统计vintage,滚动率,迁移率,逾期率

    风险统计分析,离不开vintage,滚动率,迁移率,逾期率等指标的统计,贴一段递延率的Mysql代码,仅做参考. #create view overdue_list2 #as #逾期(递延)表 SEL ...

  6. 信贷风控中Vintage、滚动率、迁移率的理解

    风控业务背景 信贷风险管理是一门艺术,更是一门科学.资产质量分析中常会涉及到三个理论: 账龄分析(Vintage Analysis):用以分析账户成熟期.变化规律等. 滚动率分析(Roll Rate ...

  7. Vintage、滚动率、迁移率的应用(转载)

    转载于:http://mp.weixin.qq.com/s?__biz=MzIyNDk2MzQ1NQ==&mid=2247484124&idx=1&sn=eec18c83680 ...

  8. vintage、迁移率、滚动率、入催率、FPD概念

      随着互联网金融的发展,对数据分析的需求越来越大.数据分析的目的其实是为了找到风险和收益的平衡点.高收益伴随着高风险,而低风险的回报又如同鸡肋.所以,太高的风险,太低的收益都不行.平衡点通俗来讲就是 ...

  9. vintage、迁移率、滚动率、入催率等概念

    vintage.迁移率.滚动率.入催率等概念 转载于:https://www.cnblogs.com/andylhc/p/11544516.html

最新文章

  1. mysql 二进制日志变化_mysql-二进制日志
  2. slackware启动脚本详解
  3. python循环括号_Python3中小括号()、中括号[]、花括号{}的区别详解
  4. Vray-3.0 开箱宝典
  5. matlab计算复活节概率,复活节日期的计算方法
  6. 逾845.5万枚XRP从币安交易所转入未知钱包,价值超过496万美元
  7. JavaScript-输入输出语法
  8. centos mysql无法启动 sock_CentOS通过yum安装MariaDB(MySQL)无法启动服务或者找不到mysql.sock...
  9. Arturia SQ80 V for Mac 音频波形合成器
  10. Nginx 读写分离详解
  11. Net设计模式实例之桥接模式( Bridge Pattern)(1)
  12. springboot集成log4j
  13. 支持Linux分区移动的,Linux怎样支持2T以上大硬盘分区
  14. PDMS Pipeline Tool 教程(三):材料表
  15. 今日头条的个性化推荐
  16. CVPR2021 | 记录SCRFD人脸检测C++工程化(含docker镜像)
  17. 汇智网node学习笔记
  18. java安装未指定的错误_安装redistributable(x64)出现0x80240017未指定的错误
  19. web前端技术社区分享
  20. Qt安装包官方下载地址

热门文章

  1. SVM算法进行二分类
  2. error C4496: 使用了非标准扩展“for each”: 替换为 ranged-for 语句
  3. 可用于局域网的IP地址有哪些
  4. 从3个红球,5个白球,6个黑球中任取8个球,其中必须有白球,输出所有可能的方案
  5. 会员向上,广告向下:爱奇艺权衡之道不轻松
  6. VSCode前端必备插件2022版(持续更新)
  7. 科技类 论文常用词 替换词汇 避免词汇过度使用 (overused words)
  8. Linux学习02---软件包管理
  9. Unified Transformer Tracker for Object Tracking
  10. 面向 AWS 专家的 Azure 云服务介绍