构建信用卡客户风险识别模型
构建信用卡客户风险识别模型
需求说明:
为了推进信用卡业务良性发展减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作。某银行研究的风险识别模型随时间推移不再适应业务发展需求,需要重新进行风险识别模型构建。
实验目标
(1) 掌握异常值的识别与处理方法。
(2) 构建信用卡用户风险分析关键特征。
(3) 掌握 K-Means 聚类算法的应用。
(4) 掌握聚类算法结果分析的方法。
实验内容
为了推进信用卡业务良性发展,减少坏账风险,台湾各大银行都进行了信用卡客户风险
识别相关工作,建立了相应的客户风险识别模型。某银行因旧的风险识别模型随时间推移,不再适应业务发展需求,需要重新进行风险识别模型构建。
(一)处理信用卡数据异常值
实验步骤
(1) 读取信用卡数据。
(2) 丢弃逾期,呆账,强制停卡,退票记录,拒往记录为 1,瑕疵户为 2 的记录。
(3) 丢弃呆账,强制停卡,退票为 1,拒往记录为 2 的记录。
(4) 丢弃频率为 5,刷卡金额不等于 1 的数据。
(二) 特征选取
特征的轩主主要是以下三个方面。
1. 根据特征瑕疵户,逾期,呆账,强制停卡,退票,拒往记录构建历史行为特征。
2. 根据特征借款余额,个人月收入,个人月开销,家庭月收入和月刷卡金额,构建出经济风险情况特征。
3. 根据特征职业,年龄,住家,构建出收入风险情况特征
4. 将历史行为特征,经济风险情况特征以及风险情况特征分别进行降维
(三)构建模型
构建K-Means聚类模型,聚类数为5。
训练模型,求出聚类中心、每类的用户数目。
结果分析
通过观察SSE与k的取值尝试找出合适的k值
雷达图
(一类客户)
(二类客户)
(三类客户)
(四类客户)
(五类客户)
(雷达图)
根据H(历史行为)E(经济风险)I(收入风险)数据,我们可以对客户进行评价分析。
客户聚类HEI图
HEI图
客户价值排名图
客户特征图
客户价值分析
我们重点关注的是H,E,I,从HEI图中可以看到:
1、一类客户 [blue] E I 很高,H也不低,可以看做是重要保持客户
2、二类客户[black] 可以看做是重要发展客户
3、三类客户[yellow] 重要挽留客户,原因:H很高,可以看做是重要的挽留客户,因为历史行为很高, 但是E和I较低
4、四类客户[red] E特别高,其余都较低,可以看作是一般客户
5、五类客户[green] 低价值客户
以下再结合具体的特征定义五个等级的客户类别,针对不同等级的客户,采取相应的营销手段和策略,为信用卡客户风险的客户群管理提供参考(既业务分析)。
我是呵呵哒!
一个喜欢编程的程序猿!
数据网上可以找到,如果需要代码或者疑问请留言!
构建信用卡客户风险识别模型相关推荐
- 大数据之Python数据分析 实训 信用卡客户风险评价之二、构建信用卡客户风险评价关键特征
构建信用卡客户风险评价关键特征 实训数据:https://pan.baidu.com/s/1RduW2P0UtdgvQowIu26u7A 1 实训目标 (1) 掌握评分卡模型的原理. (2) 构建信用 ...
- 大数据之Python数据分析 实训 信用卡客户风险评价之一、处理信用卡数据异常值
一.处理信用卡数据异常值 实训数据:https://pan.baidu.com/s/1RduW2P0UtdgvQowIu26u7A 1 实训目标 (1) 掌握异常值的识别与处理方法. (2) 构建信用 ...
- 基于深度机器学习算法DBNs的风险识别模型
前言:最初关注深度机器学习是听了NUS的汪晟博士关于深度机器学习平台SIGNA的介绍,当时就发现深度机器学习是人工智能的一个革新的进步.但是由于从事的云计算和大数据方向的工作,所以平时只是作为自己的兴 ...
- 数据分析课后作业--信用卡客户风险评价(代码)
1.处理数据异常值: (1) 丢弃逾期,呆账,强制停卡,退票记录,拒往记录为 1 ,瑕疵户为 2 的记录 . (2) 丢弃呆账,强制停卡,退票为 1 ,拒往记录为 2 的记录. (3) 丢弃频率为 5 ...
- 用Pytorch构建一个喵咪识别模型
本文参加新星计划人工智能(Pytorch)赛道:https://bbs.csdn.net/topics/613989052 目录 一.前言 二.问题阐述及理论流程 2.1问题阐述 2.2猫咪图片识别原 ...
- 信用卡交易欺诈识别模型
项目介绍:原始数据中共有284807条数据,30个特征,其中正常交易数据为284315条,欺诈交易数据为492条,为典型的不平衡数据集.案例中采用xgboost算法,分别在原始样本和经过smote算法 ...
- 信用卡迎来史上最强风控?利用数据挖掘进行信用卡评分,提高银行的客户风险识别能力
**下半年,信用卡圈却又发生了一次大的地震.**多家银行开始严格管控使用信用卡,论坛和网上各种哀嚎,很多卡友遇到刷卡限制.降额,甚至封卡. 这是为什么呢? 根< 2020年第一季度支付体系运行总 ...
- 信用卡客户风险分析与评价
1.处理信用卡数据异常值 1.训练要点 (1)熟悉信用卡的基本业务知识. (2)掌握异常值的识别与处理方法. 2.需求说明 为了推进信用卡业务良性发展,减少坏账风险,各大银行都进行了信用卡客户风险识别 ...
- R语言实训项目——信用卡客户风险分析
实训1 处理信用卡数据异常值(数据预处理) (1)读取信用卡数据. #读取数据 credit <- read.csv('F:/R-Project/data/credit_card.csv') ( ...
最新文章
- Datawhale组队学习周报(第003周)
- 不可错过!普渡大学最新《机器学习》课程
- Compellent试用手记之二:系统连接
- ROS知识: vanilla(香草) CMakeLists.txt 的语法
- 织女的红线_JAVA
- 视频监控系统防雷设计方案
- mysql 多主一从备份_(5.14)mysql高可用系列——级联复制与多主一从(多源复制)...
- 使用Android高性能音频--OpenSL ES和AAudio
- linux 禁ping设置
- python中import星_【已解决】Python中递归import导入:ImportError: cannot import name
- SpringCloud feign、hystrix、zuul超时配置
- python os模块
- Vue毫秒计时器(开始计时)
- txt文件的编码结构
- 首推机器人视觉解决方案 百度AI开发者实战营成都站揭秘
- Padding Oracle攻击(POODLE)技术分析
- Java程序员辛勤工作7年被裁,背后的思考与总结
- UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters
- matlab如何提取某一列的数据_MATLAB如何提取某一矩阵的某一列的部分数据?
- 道氏理论:如何买入开仓和止损点设置?