构建信用卡客户风险识别模型

需求说明:

为了推进信用卡业务良性发展减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作。某银行研究的风险识别模型随时间推移不再适应业务发展需求,需要重新进行风险识别模型构建。

实验目标

(1) 掌握异常值的识别与处理方法。

(2) 构建信用卡用户风险分析关键特征。

(3) 掌握 K-Means 聚类算法的应用。

(4) 掌握聚类算法结果分析的方法。

实验内容

为了推进信用卡业务良性发展,减少坏账风险,台湾各大银行都进行了信用卡客户风险

识别相关工作,建立了相应的客户风险识别模型。某银行因旧的风险识别模型随时间推移,不再适应业务发展需求,需要重新进行风险识别模型构建。

(一)处理信用卡数据异常值

实验步骤

(1) 读取信用卡数据。

(2) 丢弃逾期,呆账,强制停卡,退票记录,拒往记录为 1,瑕疵户为 2 的记录。

(3) 丢弃呆账,强制停卡,退票为 1,拒往记录为 2 的记录。

(4) 丢弃频率为 5,刷卡金额不等于 1 的数据。

(二)  特征选取

特征的轩主主要是以下三个方面。

1. 根据特征瑕疵户,逾期,呆账,强制停卡,退票,拒往记录构建历史行为特征。

2. 根据特征借款余额,个人月收入,个人月开销,家庭月收入和月刷卡金额,构建出经济风险情况特征。

3. 根据特征职业,年龄,住家,构建出收入风险情况特征

4. 将历史行为特征,经济风险情况特征以及风险情况特征分别进行降维

(三)构建模型

构建K-Means聚类模型,聚类数为5。

训练模型,求出聚类中心、每类的用户数目。

结果分析

通过观察SSE与k的取值尝试找出合适的k值

雷达图

(一类客户)

(二类客户)

(三类客户)

(四类客户)

(五类客户)

(雷达图)

根据H(历史行为)E(经济风险)I(收入风险)数据,我们可以对客户进行评价分析。

客户聚类HEI图

HEI图

客户价值排名图

客户特征图

客户价值分析

我们重点关注的是H,E,I,从HEI图中可以看到:

1、一类客户 [blue]   E I 很高,H也不低,可以看做是重要保持客户

2、二类客户[black]   可以看做是重要发展客户

3、三类客户[yellow]  重要挽留客户,原因:H很高,可以看做是重要的挽留客户,因为历史行为很高, 但是E和I较低

4、四类客户[red]    E特别高,其余都较低,可以看作是一般客户

5、五类客户[green]  低价值客户

以下再结合具体的特征定义五个等级的客户类别,针对不同等级的客户,采取相应的营销手段和策略,为信用卡客户风险的客户群管理提供参考(既业务分析)。

我是呵呵哒!

一个喜欢编程的程序猿!

数据网上可以找到,如果需要代码或者疑问请留言!

构建信用卡客户风险识别模型相关推荐

  1. 大数据之Python数据分析 实训 信用卡客户风险评价之二、构建信用卡客户风险评价关键特征

    构建信用卡客户风险评价关键特征 实训数据:https://pan.baidu.com/s/1RduW2P0UtdgvQowIu26u7A 1 实训目标 (1) 掌握评分卡模型的原理. (2) 构建信用 ...

  2. 大数据之Python数据分析 实训 信用卡客户风险评价之一、处理信用卡数据异常值

    一.处理信用卡数据异常值 实训数据:https://pan.baidu.com/s/1RduW2P0UtdgvQowIu26u7A 1 实训目标 (1) 掌握异常值的识别与处理方法. (2) 构建信用 ...

  3. 基于深度机器学习算法DBNs的风险识别模型

    前言:最初关注深度机器学习是听了NUS的汪晟博士关于深度机器学习平台SIGNA的介绍,当时就发现深度机器学习是人工智能的一个革新的进步.但是由于从事的云计算和大数据方向的工作,所以平时只是作为自己的兴 ...

  4. 数据分析课后作业--信用卡客户风险评价(代码)

    1.处理数据异常值: (1) 丢弃逾期,呆账,强制停卡,退票记录,拒往记录为 1 ,瑕疵户为 2 的记录 . (2) 丢弃呆账,强制停卡,退票为 1 ,拒往记录为 2 的记录. (3) 丢弃频率为 5 ...

  5. 用Pytorch构建一个喵咪识别模型

    本文参加新星计划人工智能(Pytorch)赛道:https://bbs.csdn.net/topics/613989052 目录 一.前言 二.问题阐述及理论流程 2.1问题阐述 2.2猫咪图片识别原 ...

  6. 信用卡交易欺诈识别模型

    项目介绍:原始数据中共有284807条数据,30个特征,其中正常交易数据为284315条,欺诈交易数据为492条,为典型的不平衡数据集.案例中采用xgboost算法,分别在原始样本和经过smote算法 ...

  7. 信用卡迎来史上最强风控?利用数据挖掘进行信用卡评分,提高银行的客户风险识别能力

    **下半年,信用卡圈却又发生了一次大的地震.**多家银行开始严格管控使用信用卡,论坛和网上各种哀嚎,很多卡友遇到刷卡限制.降额,甚至封卡. 这是为什么呢? 根< 2020年第一季度支付体系运行总 ...

  8. 信用卡客户风险分析与评价

    1.处理信用卡数据异常值 1.训练要点 (1)熟悉信用卡的基本业务知识. (2)掌握异常值的识别与处理方法. 2.需求说明 为了推进信用卡业务良性发展,减少坏账风险,各大银行都进行了信用卡客户风险识别 ...

  9. R语言实训项目——信用卡客户风险分析

    实训1 处理信用卡数据异常值(数据预处理) (1)读取信用卡数据. #读取数据 credit <- read.csv('F:/R-Project/data/credit_card.csv') ( ...

最新文章

  1. Datawhale组队学习周报(第003周)
  2. 不可错过!普渡大学最新《机器学习》课程
  3. Compellent试用手记之二:系统连接
  4. ROS知识: vanilla(香草) CMakeLists.txt 的语法
  5. 织女的红线_JAVA
  6. 视频监控系统防雷设计方案
  7. mysql 多主一从备份_(5.14)mysql高可用系列——级联复制与多主一从(多源复制)...
  8. 使用Android高性能音频--OpenSL ES和AAudio
  9. linux 禁ping设置
  10. python中import星_【已解决】Python中递归import导入:ImportError: cannot import name
  11. SpringCloud feign、hystrix、zuul超时配置
  12. python os模块
  13. Vue毫秒计时器(开始计时)
  14. txt文件的编码结构
  15. 首推机器人视觉解决方案 百度AI开发者实战营成都站揭秘
  16. Padding Oracle攻击(POODLE)技术分析
  17. Java程序员辛勤工作7年被裁,背后的思考与总结
  18. UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters
  19. matlab如何提取某一列的数据_MATLAB如何提取某一矩阵的某一列的部分数据?
  20. 道氏理论:如何买入开仓和止损点设置?

热门文章

  1. 我的世界基岩版服务端 更换地图教程 minecraft bedrock 更换地图教程
  2. mysql 索引的目的是什么_SQL 创建索引的目的是什么?
  3. getElementsByTagName()
  4. EasyPoi导出excel多Sheet遇到的坑
  5. java 文本框只能输入数字_java swing 怎么设置文本框只能输入数字
  6. newsletter
  7. C 结构体指针初始化
  8. 数据管理—1、指标体系
  9. 小白看完都学会了!mysqlmergeintousing
  10. VS2017 Web项目添加引用项目后,引用上有黄色的感叹号小图标