LR算法在申请评分卡的应用的理论
本文采取的是德国公开的数据做的实验:
一.逻辑模型的理论
由逻辑回归的基本原理,我们将客户违约的概率表示为p,则正常的概率为1-p。因此,可以得到比率:
此时,客户违约的概率p可表示为:
评分卡设定的分值刻度可以通过将分值表示为比率对数的线性表达式来定义,即可表示为下式:
其中,A和B是常数。式中的负号可以使得违约概率越低,得分越高。通常情况下,这是分值的理想变动方向,即高分值代表低风险,低分值代表高风险。
逻辑回归模型计算比率如下所示:
其中,用建模参数拟合模型可以得到模型参数 β 0 , β 1 , … , β n 。
式中的常数A、B的值可以通过将两个已知或假设的分值带入计算得到。通常情况下,需要设定两个假设:
(1)给某个特定的比率设定特定的预期分值;
(2)确定比率翻番的分数(PDO)
根据以上的分析,我们首先假设比率为x的特定点的分值为P。则比率为2x的点的分值应该为P+PDO。代入式中,可以得到如下两个等式:
即:公式推导:
假设 设定评分卡刻度使得比率为{1:20}(违约正常比)时的分值为50分,PDO为10分,代入式中求得:B=14.43,A=6.78
特别说明:在大多部分行行中基础分值为600,比率去1:20或者是1:19,PDO一般会选用20,50,60
评分卡刻度参数A和B确定以后,就可以计算比率和违约概率,以及对应的分值了。通常将常数A称为补偿,常数B称为刻度。
则评分卡的分值可表达为:
式中:变量 x 1 … x n 是出现在最终模型中的自变量,即为入模指标。由于此时所有变量都用WOE转换进行了转换,可以将这些自变量中的每一个都写 ( β i ω ij ) δ ij 的形式:
式中ωij 为第i行第j个变量的WOE,为已知变量;βi为逻辑回归方程中的系数,为已知变量;δij为二元变量,表示变量i是否取第j个值。上式可重新表示为:
此式即为最终评分卡公式。如果x1…xn变量取不同行并计算其WOE值,式中表示的标准评分卡格式,如表3.20所示:
表3.20表明,变量x1有k1行,变量x2有k2行,以此类推;基础分值等于(A−Bβ0);由于分值分配公式中的负号,模型参数β0,β1,…,βn也应该是负值;变量xi的第j行的分值取决于以下三个数值:
(1)刻度因子B;
(2)逻辑回归方程的参数βi;
(3)该行的WOE值,ωij
LR算法在申请评分卡的应用的理论相关推荐
- 风控模型A卡申请评分卡,toad包实例
目录 一.读取数据 二.EDA.预处理 三.特征筛选 四.分箱 五.WOE转化 六.逐步回归 七. 建模和模型评估 八.转换评分 数据集中各个特征的含义 一.读取数据 二.EDA.预处理 import ...
- 金融风控--申请评分卡模型--特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融风
金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融 ...
- 申请评分卡(A卡)的开发过程(1)
前言: 本篇文章上接<申请评分卡简介>,有需要的童鞋可以参考下:https://blog.csdn.net/qq_16633405/article/details/107744921 下面 ...
- 开发申请评分卡的第一步要做什么
在开发信用申请评分卡之前,最基本面的工作就是梳理理解数据.不要自认为知道这些字段的中文意思.来自哪张数据表就可以了,还要尽可能的去了解这些数据是从生产库怎么生成的,也就是说这些可能用到的变量数据还原到 ...
- 机器学习之金融信贷风控(一)互联网金融业申请评分卡的介绍
金融信贷风控中的机器学习 在信贷风控领域,随着大数据.计算机集群技术.网络技术和人工智能的发展,越来越多的金融机构将传统的策略风控手段转向依赖机器学习模型等量化手段.信贷环节中的审批.预警.催收以及营 ...
- 金融风控-- >申请评分卡模型-- >特征工程(特征分箱,WOE编码)
这篇博文主要讲在申请评分卡模型中常用的一些特征工程方法,申请评分卡模型最多的还是logsitic模型. 先看数据,我们现在有三张表: 已加工成型的信息: Master表 idx:每一笔贷款的uniqu ...
- 机器学习之金融信贷风控(二)申请评分卡中的数据预处理和特征衍生(未完待续)
申请评分卡中的数据预处理和特征衍生 模型处理的一般流程: 构建信用风险模型的特征 获取数据 链接:https://pan.baidu.com/s/1CsY11ArZ6YK3o1icghWj2w 提取码 ...
- (信贷风控七)申请评分卡模型Python实现(图文+代码实现)
(七)申请评分卡模型Python实现(图文+代码实现) 贷前准入环节流程图大致如下 为什么需要建立评分卡? 所有的模型一定是服务于业务的,那么业务上到底出现了什么问题,需要用到评分卡模型去解决呢?我们 ...
- 金融申请评分卡(2)
金融申请评分卡的数据预处理和特征衍生 1.模型处理的一般流程 以上为模型的一般处理办法:在本次数据字段有: 字段 名称 member_id ID loan_amnt 申请额度 term 产品期限 in ...
最新文章
- python openpyxl写入多行_Python openpyxl读写操作
- 02_Android写xml文件和读xml文件
- 利用OpenCV进行人脸识别
- C语言算小数加减,C语言带小数加减乘除.doc
- iBatis 事务控制 与 两表操作将SQL语句写入单表
- 别告诉我你懂Javascript
- python两台电脑文件传输_两台电脑怎么互相连接传送文件?
- 爬取豆瓣电影TOP100
- Notepad软件的下载安装和使用
- PHP获取以毫秒级为单位获取当前时间
- 【arXiv 2021】Cluster Contrast for Unsupervised Person Re-Identification(CCU)
- OpenCV训练分类器制作xml文档
- 中国游客是否可以持中国驾照在美国自驾游?_游侠_新浪博客
- 磁力开源项目和自己服务器,Github新项目:自己本地搭建磁力搜索系统
- RHEL 5下iSCSI Initiator软件安装配置指导
- 通过 iso 重装阿里云 ECS
- Mvtec数据集批量加各种噪声(高斯,椒盐,随机噪声)
- SpringBoot 拦截器 过滤器
- 《设计模式解析》读书笔记
- Zend PDT Eclipse + Zend Server Communication Edition(CE)
热门文章
- [LUOGU]P5149 会议座位
- IATF 16949 合规认证仅剩2个月!
- 一见钟情,“钟”的并不是脸,而是……
- 百度地图-自定义搜索、自定义marker、地图选址实用实例
- 651被远程计算机关闭,宽带故障651错误代码什么意思(显示651的6种原因及解决方法)...
- 莫等闲 - 什么是工作和学习之间的适当平衡?
- 卜若的代码笔记-一周搞定树莓派-第十七章:(QT基础七:定时器)
- 【读书笔记】数据仓库工具箱 维度建模指南
- 北京内推 | 好未来招聘NLP算法实习生/博士后研究员
- 阿里云 ACP 考试学习过程分享