参考:https://www.kuxiao.cn/course/pc-course-learning.html?cid=C59acca6fa17eb456c650e849

一、商业理解

信用,对个人和企业都是无比重要的品质。比如有了信用,个人可以向银行申请信用卡,可以透支国际长途电话费、汽车保险打折等。对于企业,则可以大量透支和贷款。所以,银行考查客户的信用状况是非常重要的事情。

信用评分

  • 信用评分的方法是什么?
    信用评分是使用统计模型的方法来对潜在客户和已有客户进行贷款风险评价的方法。
  • 怎样计算客户的信用评分?
    随着这种统计建模的方法的成熟应用,其思路已被广泛推广,诸如欺诈评分、市场响应评分等领域。
  • 怎样考查客户的信用?
    在美国,客户信用评分系统主要由FICO公司推出。FICO的评分系统得出,信用评分范围在300-850分之间,评分越高,违约率越低。在我国银行业,比较通用的方法也是类似的形式 。评分特别低和特别高的客户很少,大多数评分中等。
  • 信用评分卡优缺点:
    优点 :便于理解和使用,容易被各层次的人员了解和使用;
    缺点 :假定各项因素对信用的影响关系是线性组合的。该假定在现实中并不普遍成立。

二、数据理解

  • QUESTION 1:怎样将贷款风险问题转化为数据挖掘问题?
    ►小额贷款问题可以理解为有目标变量的预测问题,根据目标变量是否违约,来预测信贷帐号是否有风险。
    ►客户是否按期归还贷款?
    ►银行把按期归还贷款理解为”好“的信贷帐号,对应的客户为”好“客户
    ►把不能按期归还贷款的理解为”坏“的信贷帐号,对应的客户为”坏“客户。
  • QUESTION 2:如何获取数据?
    银行可以从系统中提取大量关于贷款人的资金使用、消费、以及还贷款的情况数据,这些数据包括(但不限于)以下变量:
    ►帐户存在时间
    ►过去12个月最严重的拖欠行为(没有拖欠、1个月拖欠、两个月拖欠等)
    ►过去12个月的平均贷款金额
    ►过去6个月的还款占欠款比例
    ►过去6个月现金提取占交易金额比例
    ►过去6个月平均刷卡额
    ►过去6个月消费(刷卡)类型。。。。。
实验采用数据 — 小额贷款.csv

三、数据准备

离散化

►离散化可以降低异常数值的影响
►离散化使贝叶斯评分模型更易理解

四、建立模型

4.1 建立模型与模型评估

  • 建立什么模型?
    朴素贝叶斯模型,预测违约评分(0~1)
  • 朴素贝叶斯模型有什么问题?
    对于违约的预测能力差:违约类的查全率很小,接近0
  • 为什么存在这个问题?
    在朴素贝叶斯模型中,判定违约的后验概率confidence(1)的阈值设定为0.5
  • 如何解决这个问题?
    ♦ 修改confidence(1)的阈值
    ♦ 修改后的阈值使分类代价(将1归类为0的代价是30,将0归类为1的代价是1)达到最小
  • 修改方法:
    ♦ 从0开始,每次将阈值加1%
    ♦ 计算阈值对应的分类代价,取最小的分类代价及其对应的阈值

4.2 建立朴素贝叶斯违约评分模型

  1. Declare Missing Value
    将“收入”字段中值为100000.0判定为缺失值
    将“在现住址时间”和在现工作时间“值为999判定为缺失值
  1. Discretize
    离散化,记得将离散化类型定为标量化属性interval,用于后期贝叶斯分类,同时remove useless

  2. Loop
    子过程- 循环计算分类代价
    生成变量iteration,从1开始每次循环加1,直到50

    1)Generate Macro
    function description: threadhold=%{iteration}*0.01
    2)Validation

    3)Generate Attributes
    function description: threshold=%{threshold}

  3. append
    将每次循环得到的结果整合在一起

要使修改后的阈值使分类代价(将1归类为0的代价是30,将0归类为1的代价是1)达到最小,选取分数最低值的threadhold,即最佳阈值

4.3 保存朴素贝叶斯模型

五、模型应用

1)Generate Attributes
记得将模型训练时的离散化结果应用到测试集,这样模型才能有效运行

2)Create Threadhold
应用模型训练时得到的最佳阈值

银行信用风险预测分析相关推荐

  1. 利用预测分析改进欠款催收策略,控制欺诈风险和信贷风险

    前提摘要 在数字经济新时代,金融服务主管正在寻求方法去细分他们的产品和市场,保持与客户的联系,寻找能够推动增长和收入的新市场,并利用可以增加优势和降低风险的新技术. 在拥有了众多可用数据之后,金融机构 ...

  2. 疯狂的机器学习实战-银行营销预测

    机器学习实战-银行营销预测 问题: 数据集: 链接:https://pan.baidu.com/s/1TUOLr8jFbT38p_iUh1iBsQ 提取码:1234 银行营销数据集 这些数据与葡萄牙银 ...

  3. 银行流失用户分析及预测模型

    自学的一个银行流失客户预警的小项目 0.引言-银行流失用户分析 银行客户流失是指银行的客户终止在该行的所有业务,并销号.但在实际运营中,对于具体业务部门,银行客户流失可以定位为特定的业务终止行为. 商 ...

  4. 8大预测分析工具比较

    什么是预测分析工具? 预测分析工具融合了人工智能和业务报告.这些工具包括用于从整个企业收集数据的复杂管道,添加统计分析和机器学习层以对未来进行预测,并将这些见解提炼成有用的摘要,以便业务用户可以对此采 ...

  5. 银行股价预测——基于pytorch框架RNN神经网络

    银行股价预测--基于pytorch框架RNN神经网络 任务目标 数据来源 完整代码 流程分析 1.导包 2.读入数据并做预处理 3.构建单隐藏层Rnn模型 4.设计超参数,训练模型 5.加载模型,绘图 ...

  6. 2022-2028年中国手机配件行业发展前景战略及投资风险预测分析报告

    [报告类型]产业研究 [出版时间]即时更新(交付时间约3个工作日) [发布机构]智研瞻产业研究院 [报告格式]PDF版 本报告介绍了手机配件行业相关概述.中国手机配件行业运行环境.分析了中国手机配件行 ...

  7. LL(1)预测分析表的构造

    LL(1)分析法(即预测分析法)是自上而下文法中的一种,使用这种方法需要用到LL(1)预测分析表. 前提:掌握了FIRST集和FOLLOW集的构造. 步骤:对于每一个产生式A→α (1) 对每个终结符 ...

  8. 营销自动化的4大预测分析错误

    预测分析是数字营销的新领域.许多专家已经讨论了将预测分析与营销自动化工具(如HubSpot和Marketo)合并的好处. 将预测分析整合到用户的营销自动化策略中可能非常有益,但也很难执行.以下是可能会 ...

  9. 计算机书籍-数据挖掘与预测分析

    书名:数据挖掘与预测分析(第2版) 作者:[美]Daniel T. Larose,Chantal D. Larose 出版社:清华大学出版社 出版时间:2017年02月 鼠标

最新文章

  1. hadoop启动页面_轻松搞定Windows下的Hadoop环境安装
  2. AliOS Things 硬件抽象层(HAL)对接系列2 — SPI driver porting
  3. Oracle 的原理: 索引
  4. dart系列之:HTML的专属领域,除了javascript之外,dart也可以
  5. 程序崩溃 分析工具_程序分析工具| 软件工程
  6. 《Java技术》第一次作业
  7. Apache部署多个WordPress网站
  8. linux通配符与正则表达式
  9. 最大功率点跟踪MPPT
  10. HenCoder Android 开发进阶: 自定义 View 1-1 绘制基础
  11. 梅宫主:聊聊创业路上关于韭菜的事儿。。
  12. [音乐天堂]爱尔兰的小童星Declan
  13. 公司网站无意使用了”方正字体”,被”索赔
  14. 免费 GIS 软件资源介绍,大家值得收藏
  15. 毛玻璃效果 php,CSS3教程之制作倾斜导航条和毛玻璃效果
  16. 我的世界android启动器,我的世界手机版启动器 安卓方块启动器教程
  17. 幂律分布图matlab代码,关于幂律分布,你还应该知道如何用代码实现!| 集智百科...
  18. python输入三角形三条边长_python问题:输入三角形的三条边a,b,c,判断此三边是否可以构成三角形。等边、等腰、直角三角形?...
  19. 如何下载生物数据(四):SRA数据下载
  20. C#从windows剪贴板粘贴内容的代码

热门文章

  1. android线程改变布局,震惊!Android子线程也能修改UI?(第二篇)
  2. SAAS产品有哪些优缺点?
  3. Log sum inequalit 对数和不等式的证明
  4. 1024 科学计数法 (20 分) 完全解析(C++详细思路)
  5. 想当程序员,如何判断自己是否适合当前端程序员?
  6. [Splay伸展树]splay树入门级教程
  7. 华为机试 - 最大矩阵和
  8. python 获取百度地图上北京地铁的数据,然后excel导出
  9. k8s 安装nfs_kubernetes挂载nfs报错 | 运维笔记
  10. 基于Java的Minecraft游戏后端自定义插件 04注册命令与处理