《智能风控实践指南》读书笔记
前两天大概读了一下《智能风控实践指南—从模型、特征到决策》这本书,说实话,书的内容超出了我原有的预期,还是有不少对我有所启发的地方。我还去看了作者蒋宏老师的视频号,其中他提到自己最早是做咨询,所以一直有知识管理的习惯,这些从这本书的内容也可以看出来。理论结合了实践,把自己工作中的经验沉淀下来,这是非常有意义和成就感的一件事。这篇文章先记录一些书中有所启发的地方,后续还会展开写一两篇具体的思考。
一、模型开发中的样本粒度
有渠道粒度、客户粒度、借款粒度、还款粒度。在实际业务中需要根据业务模式和模型应用策略来选择合适的粒度进行建模。比如一次性借款产品,申请模型选择借款粒度;循环额度产品选择客户粒度;催收评分选择还款粒度。
这个问题可以看下知乎求是汪在路上:贷中行为评分卡(B卡)模型的评论区。
二、标签定义
表现期定为近 6期是否发生30天以上逾期的情况下,对于超过6个月表现期且逾期发生在6个月之后的样本,也可以纳入建模样本中,属于“软表现窗口”。对于坏样本量较少的情况,可以选择不同的逾期状态,尽可能多覆盖坏样本。
三、特征选择中的稳定性
除了PSI之外,还要看各分箱坏账的稳定性。书中定义为“倒箱”,体现了特征对预测变量区分能力的稳定性,而PSI反映的是特征分布的稳定性。这个简单地说,就是分箱在分月的坏账不要交叉,开口越大越好。
四、损失函数、代价函数和目标函数
损失函数:单个样本的误差
代价函数:所有样本误差的平均,所有损失函数的平均值
目标函数:在代价函数的基础上加了正则项,是最终需要优化的函数
五、模型融合方法
1、模型结果简单加权
2、模型结果再训练
3、集成学习:bagging和boosting,stacking和blending方法的原理图画得不错。
上面是有了不同的模型分之后怎么进行融合,此外还可以针对不同标签、不同样本、不同数据源来建立不同的子模型。
六、特征设计方法
基于业务逻辑生成特征、半自动化生成特征、基于智能算法生成特征,每一种都有代码和案例实践。
七、风控策略
规则评估里,有一部分对规则收益性进行评估,从利润最大化的角度,评估引入的规则是否能真正为业务带来利润。
规则上线,对于有强业务含义且评估后效果稳定的规则,直接全流量上线;对于有明确业务含义且评估中发现稳定性可能存在风险的规则,可通过分流测试进一步验证线上的实际效果;对于业务含义不明但评估效果较好的规则,可先线上陪跑,确认线上的实际效果后再全面应用。
八、交换集分析
对新模型通过旧模型拒绝的样本进行坏账预估,这里假设旧模型的样本在新模型打分时,同分数段坏账率一致,会存在低估换入客群坏账率的问题,需要做系数修正(有3种方法)。后面再详细写一篇笔记。
九、额度策略评估
金额坏账率与笔数坏账率的比值,叫作“金笔系数”。额度的A/B测试需要在平均额度不变的情况下,设计多种额度方案,从利润最大化的角度选择最优方案。
十、决策优化智能算法
风险策略在风险与收益之间做权衡,即寻找最优决策。最优化算法侧重单步收益最优化。用模型策略中决策点选择为例进行了介绍,后续再详细写一篇笔记实操下。额度策略中的最优额度选取可参考。
十一、因果关系
辛普森悖论的例子。机器学习模型从数据中学习的是相关关系。举例,模型训练发现借款人的申请额度越高,风险越高。申请额度高并不是客户风险高低的原因,而是结果。先识别出高风险的客户,给该类客户较低的额度,再给低风险的客户较高的授信额度,才能真正提高收益。
【作者】:Labryant
【原创公众号】:风控猎人
【简介】:做一个有规划的长期主义者。
【转载说明】:转载请说明出处,谢谢合作!~
《智能风控实践指南》读书笔记相关推荐
- 读书笔记 | 墨菲定律
1. 有些事,你现在不做,永远也不会去做. 2. 能轻易实现的梦想都不叫梦想. 3.所有的事都会比你预计的时间长.(做事要有耐心,要经得起前期的枯燥.) 4. 当我们的才华还撑不起梦想时,更要耐下心来 ...
- 读书笔记 | 墨菲定律(一)
1. 有些事,你现在不做,永远也不会去做. 2. 能轻易实现的梦想都不叫梦想. 3.所有的事都会比你预计的时间长.(做事要有耐心,要经得起前期的枯燥.) 4. 当我们的才华还撑不起梦想时,更要耐下心来 ...
- 洛克菲勒的38封信pdf下载_《洛克菲勒写给孩子的38封信》读书笔记
<洛克菲勒写给孩子的38封信>读书笔记 洛克菲勒写给孩子的38封信 第1封信:起点不决定终点 人人生而平等,但这种平等是权利与法律意义上的平等,与经济和文化优势无关 第2封信:运气靠策划 ...
- 股神大家了解多少?深度剖析股神巴菲特
股神巴菲特是金融界里的传奇,大家是否都对股神巴菲特感兴趣呢?大家对股神了解多少?小编最近在QR社区发现了<阿尔法狗与巴菲特>,里面记载了许多股神巴菲特的人生经历,今天小编简单说一说关于股神 ...
- 2014巴菲特股东大会及巴菲特创业分享
沃伦·巴菲特,这位传奇人物.在美国,巴菲特被称为"先知".在中国,他更多的被喻为"股神",巴菲特在11岁时第一次购买股票以来,白手起家缔造了一个千亿规模的 ...
- 《成为沃伦·巴菲特》笔记与感想
本文首发于微信公众帐号: 一界码农(The_hard_the_luckier) 无需授权即可转载: 甚至无需保留以上版权声明-- 沃伦·巴菲特传记的纪录片 http://www.bilibili.co ...
- 读书笔记002:托尼.巴赞之快速阅读
读书笔记002:托尼.巴赞之快速阅读 托尼.巴赞是放射性思维与思维导图的提倡者.读完他的<快速阅读>之后,我们就可以可以快速提高阅读速度,保持并改善理解嗯嗯管理,通过增进了解眼睛和大脑功能 ...
- 读书笔记001:托尼.巴赞之开动大脑
读书笔记001:托尼.巴赞之开动大脑 托尼.巴赞是放射性思维与思维导图的提倡者.读完他的<开动大脑>之后,我们就可以对我们的大脑有更多的了解:大脑可以进行比我们预期多得多的工作:我们可以最 ...
- 读书笔记003:托尼.巴赞之思维导图
读书笔记003:托尼.巴赞之思维导图 托尼.巴赞的<思维导图>一书,详细的介绍了思维发展的新概念--放射性思维:如何利用思维导图实施你的放射性思维,实现你的创造性思维,从而给出一种深刻的智 ...
- 产品读书《滚雪球:巴菲特和他的财富人生》
作者简介 艾丽斯.施罗德,曾经担任世界知名投行摩根士丹利的董事总经理,因为撰写研究报告与巴菲特相识.业务上的往来使得施罗德有更多的机会与巴菲特亲密接触,她不仅是巴菲特别的忘年交,她也是第一个向巴菲特建 ...
最新文章
- Jquery : 上下滚动--单行 批量多行 文字图片翻屏【转】
- 【AC自动机】【字符串】【字典树】AC自动机 学习笔记
- 目前可用的微博秀的嵌入方法大全(亲测2019年2月仍有效)
- 谈一个优秀的美工需要掌握哪些技能
- 转:SqlServer中的datetime类型的空值和c#中的DateTime的空值的研究
- 分页的limit_分页场景(limit,offset)为什么会慢
- Python之Matplotlib库常用函数大全(含注释)
- 学习笔记 第六周 第一篇
- 【Cocos2d-html5】运动中速度效果
- SpringBoot整合Sharding-JDBC实现水平分库分表之操作公共表
- java中如何查看代码运行时间?
- 易支付源码 28k支付第四方支付源码-Oreo支付系统
- leetcode:数组:1467自矩形查询
- Vue+element图片上传
- 操作系统-进程互斥的软件实现方法
- matlab多项式的求值,多项式求值的MATLAB实现
- 如何看懂Code128条形码
- 针对世纪互联Azure IoT Hub的一种设备下线通知方案
- 英语总结—— 翩若惊鸿, 婉若游龙
- 2021年中质协六西格玛通过率年度总结
热门文章
- php志愿者服务平台的设计与实现
- C\Keil\TOOLS.INI’ does not contain a valid tool path for ‘C51‘
- 福利|回馈粉丝,送一些现金红包给大家
- 美团无人车来了,外卖小哥能松口气吗
- 用在线电路软件生成全加器与逻辑门
- 我所知道坦克大战(单机版)之机器坦克全消亡后重新加入、键盘F2复活主坦克...
- 2022年,我的数字化转型工作计划 by 傅一平
- 深入安卓操作系统历史长河
- Premiere CC视频预览界面黑屏怎么办?
- 深扒“微信乞丐” 教你如何不乞讨就赚大钱!