1、处理信用卡数据异常值
1.训练要点
(1)熟悉信用卡的基本业务知识。
(2)掌握异常值的识别与处理方法。
2.需求说明
为了推进信用卡业务良性发展,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,建立了相应的客户风险识别模型。某银行因旧的风险识别模型随时间推移不再适应业务发展需求,需要重新进行风险识别模型构建。目前,银行给出的信用卡信数据说明如表7-11所示。
3、实现思路
(1)读取信用卡数据。
(2)丢弃逾期、呆账、强制停卡、退票、拒往记录为1、瑕疵户为2的记录。
(3)丢弃呆账、强制停卡、退票为1、拒往记录为2的记录。
(4)丢弃频率为5、刷卡金额不等于1的数据。
2、构造信用卡客户风险评价关键特征

  1. 训练要点
    (1)掌握信用卡模型的原理。
    (2)构建信用卡用户风险分析关键特征。
    2.需求说明
    在信用卡相关的征信工作中,主要从3个方向判定客户的信用等级。信用等级分别为客户的历史信用风险,主要为客户的历史信用情况,包括了客户是否有逾期、呆账和强制停卡记录等;客户的现阶段经济状况,综合考虑了借款余额、个人月收入、个人月开销、家庭月收入,以及月刷卡额这类和个人经济水平息息相关的特征;客户的未来经济收入以及目前收入的稳定情况,客户的职业不同、年龄不同、房产信息不同,那么客户的经济稳定情况是不同的。
    3.实现思路及步骤
    (1)根据特征瑕疵户、逾期、 呆账,强制停卡记录 退票、拒往记录,构建历史行为特征。
    (2)根据特征借款余额、个人月收入、个人月开销、家庭月收入和月刷卡额,构建出经济风险情况特征。
    (3)根据特征职业、年龄、住家,构建出收入风险情况特征。
    (4)标准化历史行为、经济风险情况、收人风险情况特征。
    3、构建K-Means聚类模型
    1.训练要点
    (1)掌握K-Means聚类算法的应用。
    (2)掌握聚类算法结果分析的方法。
  2. 需求说明
    构建信用卡高风险客户识别模型可以分为两部分:第一部分, 根据构建的3个特征对客户进行分群,对客户做聚类分群;第二部分,结合业务对每个客户群进行特征分析,分析其风险,并对每个客户群进行排名。
    3.实现思路及步骤
    (1)构建K-Means聚类模型,聚类数为5。
    (2)训练K-Means聚类模型,并求出聚类中心、每类的用户数目。

import pandas as pd
import numpy as np
from sklearn.cluster import KMeans

std = np.load(“…/tmp/standard.npy”)
print(std[:5])
kmeans_model = KMeans(n_clusters=5,random_state=123)
fit_kmeans = kmeans_model.fit(std)
kmeans_model.cluster_centers_

查看样本类别标签

print(“聚类中心\n”,kmeans_model.cluster_centers_)
print(“样本的类别标签\n”,kmeans_model.labels_)

统计不同类别样本的数目

r1 = pd.Series(kmeans_model.labels_).value_counts()
print(‘最终每个类别的数目:\n’,r1)

#针对聚类结果绘制雷达图
import matplotlib.pyplot as plt
#设置中文显示
plt.rcParams[‘font.sans-serif’] = ‘SimHei’
plt.rcParams[‘axes.unicode_minus’] = False

#绘制雷达图
N = len(kmeans_model.cluster_centers_[0])
print(“N的值\n”,N)

#设置雷达图的角度,用于平分切开一个圆面
angles = np.linspace(0,2np.pi,N,endpoint=False)
print(“angles的值\n”,angles)
#为了使雷达图一圈封闭起来
angles = np.concatenate((angles,[angles[0]]))
print(“angles的值\n”,angles )
#绘图
fig = plt.figure(figsize=(7,7))
ax = fig.add_subplot(111,polar=True)
colors = [“r”,“g”,“b”,“y”,“k”]
lab = []
for i in range(len(kmeans_model.cluster_centers_)):
values = kmeans_model.cluster_centers_[i]
feture = [“历史行为特征”, “经济风险特征”, “收入风险特征”]
feture = np.concatenate((feture, [feture[0]]))
values = np.concatenate((values,[values[0]]))
print(“values的值\n”,values)
#绘制折线图
ax.plot(angles,values,colors[i],linestyle=“-”,linewidth=2,markersize=10)
#填充颜色
ax.fill(angles,values,alpha=0.5)
#添加每个特征的标签
ax.set_thetagrids(angles
180/np.pi,feture,fontsize=15)
#添加标题
plt.title(“客户群特征分布图”)
#添加网格
ax.grid(True)
#添加图例
lab.append(“客户群”+str(i+1)+“,”+str(r1[i])+“人”)
plt.legend(lab)
plt.savefig(“…/tmp/客户群特征分布图.png”)
plt.show()

信用卡客户风险分析与评价相关推荐

  1. R语言实训项目——信用卡客户风险分析

    实训1 处理信用卡数据异常值(数据预处理) (1)读取信用卡数据. #读取数据 credit <- read.csv('F:/R-Project/data/credit_card.csv') ( ...

  2. 大数据之Python数据分析 实训 信用卡客户风险评价之二、构建信用卡客户风险评价关键特征

    构建信用卡客户风险评价关键特征 实训数据:https://pan.baidu.com/s/1RduW2P0UtdgvQowIu26u7A 1 实训目标 (1) 掌握评分卡模型的原理. (2) 构建信用 ...

  3. 大数据之Python数据分析 实训 信用卡客户风险评价之一、处理信用卡数据异常值

    一.处理信用卡数据异常值 实训数据:https://pan.baidu.com/s/1RduW2P0UtdgvQowIu26u7A 1 实训目标 (1) 掌握异常值的识别与处理方法. (2) 构建信用 ...

  4. 构建信用卡客户风险识别模型

    构建信用卡客户风险识别模型 需求说明: 为了推进信用卡业务良性发展减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作.某银行研究的风 ...

  5. 银行信用卡客户价值分析(Python数据分析)

    import pandas as pd from sklearn.preprocessing import StandardScaler from sklearn.cluster import KMe ...

  6. python信用卡客户_信用卡客户画像 作业讲解1

    信用卡客户画像 作业讲解1 信用卡客户画像 作业讲解1 获取请求类型 在很多情况下面,我们需要判断当前操作的请求类型是GET.POST.PUT.DELETE或者HEAD,一方面可以针对请求类型作出不同 ...

  7. 基于python的银行信用卡客户等级预测系统

    目录 一.设计要求 二.技术综述 三.需求分析 四.系统实现 数据来源 一.设计要求 1.客户数据预处理.对数据集进行缺失值处理,包含删除缺失值.填充数据等,同时对数据进行归一化处理. 2.确定影响客 ...

  8. 数据分析课后作业--信用卡客户风险评价(代码)

    1.处理数据异常值: (1) 丢弃逾期,呆账,强制停卡,退票记录,拒往记录为 1 ,瑕疵户为 2 的记录 . (2) 丢弃呆账,强制停卡,退票为 1 ,拒往记录为 2 的记录. (3) 丢弃频率为 5 ...

  9. sim卡rfm_信用卡客户的RFM集群

    sim卡rfm Recency, Frequency, & Monetary (RFM) is one of the techniques that can be used for custo ...

最新文章

  1. 提交表单自动刷新_Web自动化测试:元素的基础操作和浏览器基础操作
  2. 架构师必备技能:教你画出一张合格的技术架构图
  3. 智源发布:悟道 · 文汇 | 面向认知,超大规模新型预训练模型
  4. 源码里查看Android版本
  5. Sysnoise5.6安装教程
  6. SQL Server配置支持中文
  7. Windows巡检IIS指标脚本(PowerShell实现)
  8. 【直播间】移动互联网产品中如何用好HTML5?
  9. byte 转 int 为什么要0xFF?
  10. Netty的并发编程实践2:volatile的正确使用
  11. DataMining with Sql 2005
  12. Python Selenium打开谷歌浏览器
  13. UAF—metasequoia_2020_summon
  14. android手机两年变卡,安卓手机用一两年就卡是通病,知道这几招,还可以用很久...
  15. H5页面分享到朋友圈,自定义标题描述封面图 前端+php代码
  16. mysql_assoc函数_PHP:MySQL函数mysql_fetch_assoc()的用法
  17. 射频中的 IM3、IIP3、OIP3、G、P1dB指标之间的关系
  18. 考研线性代数手写笔记1 行列式
  19. Spring Cloud微服务系统架构的一些简单介绍和使用
  20. oracle怎么备份bak文件,[转载]如何将sqlserver的bak文件中的数据还原到oracle数据库中...

热门文章

  1. Docker-镜像的优化
  2. pythonmysql数据处理_Python之MySQL数据操作
  3. Ubuntu一键部署Yunzai-Bot v3
  4. 5个准入控制系统的常见问题解答让您进一步了解准入控制系统
  5. 微信小程序分享盆友圈(onShareTimeline)
  6. 商城项目14_商品新增vo抽取、修改vo、新增逻辑、代码的具体落地、SPU检测、SKU检测、流程图
  7. 资本、资产和证券——区块链可以重新定义新兴市场
  8. SSM6==spring体系回顾,纯XML配置springMVC,纯注解配置springMVC
  9. swift导入oc第三方库
  10. 计算机房防凝露保温材料,机房地板保温有哪些要注意的