由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。公式如下:

欢迎各位同学学习python信用评分卡建模(附代码)视频系列教程
地址为:https://edu.csdn.net/course/detail/30611

PSI实际应用范例:
1)样本外测试
  针对不同的样本测试一下模型稳定度,比如训练集与测试集,也能看出模型的训练情况,我理解是看出模型的方差情况。
2)时间外测试
  测试基准日与建模基准日相隔越远,测试样本的风险特征和建模样本的差异可能就越大,因此PSI值通常较高。至此也可以看出模型建的时间太长了,是不是需要重新用新样本建模了。

PSI揭秘拿破仑和希特勒为何入侵俄罗斯失败
PSI揭秘2008年美国华尔街金融危机
独裁者与信用危机
拿破仑和希特勒试图入侵俄罗斯和2007 - 08年的金融危机有何相似之处?
拿破仑试图在1812年入侵俄罗斯,希特勒于1941年重复了拿破仑的不端行为 - 两次入侵都以独裁者军队的严重失败而告终。拿破仑和希特勒的军队远远优于俄罗斯人。正是这场战斗的条件导致了这些失败。俄罗斯的冬天经常对这些军队的命运负责。实际上,正是拿破仑和希特勒的男人们的准备不足和不良判断导致了他们羞辱性的失败。他们是训练有素的人,但他们受过法国和德国的良好条件训练。这一次,战斗处于完全不同的极端条件下,他们无法应对。
2007-08财政危机期间信用风险模型的失败可能与法国和德国军队的命运有关。这些模型是在一个仁慈的经济环境中建立和培训的,并且没有准备好应对当时的极端经济条件。此外,金融公司的高管们做出了一系列糟糕的判断,导致经济全面崩溃。
上述故事的寓意是,必须密切关注当前流行的环境和培训环境中的条件变化。 “巴塞尔协议III”已经非常重视监督投资组合,这是有充分理由的。人口稳定指数(PSI)就是这样一个指数,它可以帮助风险管理人员完成零售信用记分卡的这项任务。
人口稳定指数(PSI) - 我们的银行业案例继续
假设您是银行的首席风险官。 自从您的团队在您的监督下建立了汽车贷款信用记分卡以来已经过去了几年。 从那时起,银行的整体风险评估流程得到了显着改善。 虽然您是一名谨慎的风险经理,但您已经要求您的团队定期比较建立记分卡的人口和现有的门户(汽车贷款申请人)。 开始这种比较的一个好地方是检查两个种群如何在通过记分卡创建的风险区分布。 以下是您的团队针对基准样本进行的最新季度比较的表示。 这里实际%'是最新季度的人口分布,'预期%'是验证样本的人口分布(a.k.a.基准样本)。

目视比较两个人群是一个很好的起点。 目前的人口似乎已转向图表的右侧。 在很小程度上,这是预期的,因为市场开始对银行的审批策略作出反应,因为记分卡经常影响到门户。 但是,我们需要问的问题是,这是否是人口的重大转变? 基本上,您正在比较两种不同的分布,并且可以使用任何拟合度度量,例如卡方检验。 然而,人口稳定性指数是一个行业认可的指标,为此提供了一些方便的经验法则。 人口稳定性指数(PSI)公式如下所示(参见Naeem Siddiqui的“信用风险记分卡”)

再次像证据的重量和信息价值,PSI似乎已经成为信息理论的根源。 让我们计算人口的人口稳定性指数(PSI)(我们已经看到了上面的直方图)。

上表中的最后一列是我们关心的。 让我们考虑分数带251-290并计算该行的索引值。

PSI的最终值,即0.13,是最后一列的所有值的总和。 现在的问题是如何解释这个值? PSI的经验法则如下所示

值为0.13属于第二行区间,表示人口与验证或基准样本的微小变化。这些都是方便的规则。但是,必须要问的是,这个人口如何转变会对记分卡产生任何影响?实际上,它可能有也可能没有任何区别。记分卡的每个分数带都有相关的不良率或客户未偿还贷款的概率。例如,我们的记分卡中的分数带251-290具有10%的不良率,或者该分数带中的10个人口中的一个客户将不会为他/她的贷款提供服务。人口稳定指数仅表明贷款申请人口的变化。然而,这可能会或可能不会导致记分卡的性能恶化以预测风险。然而,PSI表明环境的变化需要通过分析银行宏观经济状况和整体贷款政策的变化进一步调查。
备注
PSI人口稳定性指数是检查不断变化的条件的指标之一 - 但是,很明显,人们必须捕捉到强大的指标,以便密切关注不断变化的经济风,以防止崩溃着陆。另一方面,俄罗斯的冬天确实改变了地球的历史 - 我想改变并不总是坏事。
补充解释ln()为自然对数函数

欢迎各位同学学习python金融风控评分卡模型和数据分析
地址为:https://edu.csdn.net/combo/detail/1927

PSi-Population Stability Index (PSI)模型分稳定性评估指标相关推荐

  1. 泊松回归、gamma回归、Tweedie回归等广义线性回归模型GLM的评估指标:校准曲线、 洛伦兹曲线、卡方检验、AIC、BIC、偏差(Deviance)指标

    泊松回归.gamma回归.Tweedie回归等广义线性回归模型GLM的评估指标:校准曲线(Calibration curve). 洛伦兹曲线(Lorenz Curve).卡方检验.AIC.BIC.偏差 ...

  2. 奥卡姆剃刀是什么?机器学习实践中那些学习模型或者那些评估指标践行了这一理论?

    奥卡姆剃刀是什么?机器学习实践中那些学习模型或者那些评估指标践行了这一理论? 奥卡姆剃刀:无无必要,勿增实体. 奥卡姆剃刀原理应用于模型选择时变为以下想法:在所有可能选择的模型中,能够很好地解释已知数 ...

  3. 信用评分卡模型开发及评估指标

    版权声明:本文为博主原创文章,未经博主允许不得转载. 一.信用风险评级模型的类型 信用风险计量体系包括主体评级模型和债项评级两部分.主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用&qu ...

  4. 小白如何写Python算法-计算模型稳定性评估指标PSI

    前言 最近在研究如何存储和查询十亿数据的事情突然插了一档子事公司让我临时救个

  5. Python ,SVM模型效果的评估指标

    混淆矩阵中: 模型整体效果:准确率: 1. 准确率Accuracy就是所有预测正确的所有样本除以总样本,通常来说越接近1越好 2.捕捉少数类的艺术:精确度,召回率和F1 score: 精确度Preci ...

  6. 模型效果评估指标(ROC、AUC/KS、Lift、PSI)

    以二分类问题为例 混淆矩阵(Confusion Matrix) 对测试集数据进行预测,得到下列混淆矩阵中的数据 注:TP.FN.FP.TN以预测的结果是否准确来命名. 预测模型评估指标的本质是从模型预 ...

  7. 分类器评估指标——混淆矩阵 ROC AUC KS AR PSI Lift Gain

    目录 1.混淆矩阵 混淆矩阵原理 混淆矩阵的python代码 2.准确率(Accuracy).精确率(Precision).灵敏度(Sensitivity).召回率(Recall).特异度(Speci ...

  8. kmeans及模型评估指标_模型评估常用指标

    一. ROC曲线和AUC值 在逻辑回归.随机森林.GBDT.XGBoost这些模型中,模型训练完成之后,每个样本都会获得对应的两个概率值,一个是样本为正样本的概率,一个是样本为负样本的概率.把每个样本 ...

  9. 风控模型—WOE与IV指标的深入理解应用

    风控业务背景 在评分卡建模流程中,WOE(Weight of Evidence)常用于特征变换,IV(Information Value)则用来衡量特征的预测能力.风控建模同学可能都很熟悉这两者的应用 ...

  10. 机器学习特征稳定性评估-分布式scala实现

    泰格: 士别三日当刮目相待,模型也一样,客流不断变化,特征的分布不断变化,模型的结果分布也会受到影响.所以在工业界中,对线上模型的监控是非常重要的. 概述 考察稳定性最好的办法就是抽取另一个时间窗口的 ...

最新文章

  1. Node.js链式回调
  2. GLSL. 语法基础
  3. 二叉树代码 java面试题_《剑指offer》面试题39 二叉树的深度(java)
  4. 数字电路技术基础一二章
  5. 【过程记录】springboot整合redis/分别用redisRepository和redistemplate操作redis
  6. 【Linux系统编程】进程的控制:结束进程、等待进程结束
  7. mysql按月分列统计_实现mysql按月统计的教程
  8. Selenium2+python自动化7-xpath定位
  9. Linux菜鸟教程(一 :JDK安装和java环境的配置)
  10. NAO机器人语音识别
  11. matlab找零钱,自动售货系统
  12. linux默认安装gdk目录,安装GDK
  13. [易飞]同一单据如何根据不同用户或组限定仓库(客户)
  14. 罗尔(Rolle)、拉格朗日(Lagrange)和柯西(Cauchy)三大微分中值定理的定义
  15. 视频去水印软件?在线去除视频水印工具网站?
  16. 中国移动为挽留用户!推出20元不限量套餐,你会为之买单吗
  17. 注册表功能大全(转)
  18. 卡车智能驾驶进入“后法规”时代
  19. PMP学习笔记 第13章 项目相关方管理
  20. Excel文件打开后不能编辑,可以这样处理

热门文章

  1. DataBase简答题
  2. arm linux 内存压力测试,嵌入式中如何给内存做压力测试?
  3. fetch git pull 切换_git中fetch和pull的区别
  4. vue 修改路由名字_Vue 路由设置title
  5. python字典统计排序1_python笔记17-字典如何按value排序
  6. idea 2019.2 svn 忽略文件/目录 .idea *.iml target log
  7. python3 3种方式分别用for循环、while循环计算1到100的和
  8. 多维动态数组c语言,C语言多维动态数组的实现
  9. 前端封装接口弹出错误_Java:SpringBoot写后端接口,看这一篇就够了
  10. CentOS 安装rz和sz命令