实训1处理信用卡数据异常值

1.训练要点
(1)熟悉信用卡的基本业务知识。
(2)掌握异常值的识别与处理方法。
2.需求说明
为了推进信用卡业务良性发展,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,建立了相应的客户风险识别模型。某银行因旧的风险识别模型随时间推移不再适应业务发展需求,雷要重新进行风险识别模型构建。目前,银行给出的信用卡信息
数据说明如表7-11所示。
3.实现思路及步骤
(1)读取信用卡数据。
(2)丢弃逾期、呆账、强制停卡、退票、拒往记录为1.瑕疵户为2的记录。
(3)丢弃呆账、强制停卡、退票为1.拒往记录为2的记录。
(4)丢弃频率为5、刷卡金额不等于1的数据。

实训2构造信用卡客户风险评价关键特征

1.训练要点
(1)掌握信用卡模型的原理。
(2)构建信用卡用户风险分析关键特征。
2.需求说明
在信用卡相关的征信工作中,主要从3个方向判定客户的信用等级。信用等级分别为客户的历史信用风险,主要为客户的历史信用情况,包括了客户是否有逾期、呆账和强制停卡记录等;客户的现阶段经济状况,综合考虑了借款余额、个人月收入、个人月开销,家庭月收入,以及月刷卡额这类和个人经济水平息息相关的特征;客户的未来经济收入以及目前收入的稳定情况,客户的职业不同、年龄不同、房产信息不同,那么客户的经济稳定情况是不同的。
3.实现思路及步骤
(1)根据特征瑕疵户、逾期、呆账、强制停卡记录、退票、拒往记录,构建历史行为特征。
(2)根据特征借款余额、个人月收入。个人月开销、家庭月收入和月刷卡额,构建出经济风险情况特征。
(3)根据特征职业、年龄、住家,构建出收入风险情况特征。
(4)标准化历史行为、经济风险情况、收入风险情况特征。

实训3构建K-Means聚类模型

1.训练要点
(1)掌握K-Means聚类算法的应用。
(2)掌握聚类算法结果分析的方法。
2.需求说明
构建信用卡高风险客户识别模型可以分为两部分:第一部分, 根据构建的3个特征对客户进行分群,对客户做聚类分群;第二部分,结合业务对每个客户群进行特征分析,分析其风险,并对每个客户群进行排名。
3.实现思路及步骤
(1)构建K-Means聚类模型,聚类数为5。
(2)训练K-Means聚类模型,并求出聚类中心、每类的用户数目。

三个实训代码和结果放在一块:
1、“码”上就来:

import pandas as pd
#实训1处理信用卡数据异常值
#(1)读取信用卡数据。
data = pd.read_csv(r'.\第七章 数据\实训数据\credit_card.csv',encoding='gbk')
#(2)丢弃逾期、呆账、强制停卡、退票、拒往记录为1.瑕疵户为2的记录。
data = data.drop(data[(data['逾期'] == 1) & (data['呆账'] == 1) &\(data['强制停卡记录'] == 1)& (data['退票'] == 1) &\(data['拒往记录'] == 1) & (data['瑕疵户'] == 2)].index)
print('丢弃逾期、呆账、强制停卡、退票、拒往记录为1.瑕疵户为2的记录后的数据形状:',data.shape)
data = data.drop(data[(data['呆账'] == 1) & (data['强制停卡记录'] == 1) &\(data['退票'] == 1) & (data['拒往记录'] == 2)].index)
#(3)丢弃呆账、强制停卡、退票为1.拒往记录为2的记录。
print('丢弃呆账、强制停卡、退票为1.拒往记录为2的记录数据集形状:',data.shape)
#(4)丢弃频率为5、刷卡金额不等于1的数据。
data = data.drop(data[(data['频率'] == 5) &(data['月刷卡额'] != 1)].index)
print("丢弃频率为5、刷卡金额不等于1的数据后数据集形状:",data.shape)#实训2构造信用卡客户风险评价关键特征
from sklearn.preprocessing import StandardScaler
history=data[['瑕疵户','逾期','呆账','强制停卡记录','退票','拒往记录']]
economy=data[['借款余额','个人月收入','个人月开销','家庭月收入','月刷卡额']]
income=data[['职业','年龄','住家']]
historyScaler=StandardScaler().fit_transform(history)
economyScaler=StandardScaler().fit_transform(economy)
incomeScaler=StandardScaler().fit_transform(income)
credict_features=pd.concat([history,economy,income],axis=1)
credict_features_Scaler=StandardScaler().fit_transform(credict_features)
#print(credict_features_Scaler)#实训3构建K-Means聚类模型
from sklearn.cluster import KMeans
kmeans=KMeans(n_clusters=5,random_state=13).fit(credict_features_Scaler)
print("根据三个特征聚类后的聚类中心:",kmeans.cluster_centers_)
num = pd.Series(kmeans.labels_).value_counts()
#credict_features['label']=kmeans.labels_
print('每类用户数目为:\n',num)

2、结果

【Python】实训7:航空公司客户价值分析(K-means聚类)相关推荐

  1. 【数据挖掘实战】——航空公司客户价值分析(K-Means聚类案例)

    目录 一.背景和挖掘目标 1.RFM模型缺点分析 2.原始数据情况 3.挖掘目标 二.分析方法与过程 1.初步分析:提出适用航空公司的LRFMC模型 2.总体流程 第一步:数据抽取 第二步:探索性分析 ...

  2. python客户价值分析_Python数据分析与应用航空公司客户价值分析.ppt

    Python数据分析与应用航空公司客户价值分析.ppt 大数据,成就未来 * 大数据挖掘专家 * 大数据挖掘专家 大数据,成就未来 航空公司客户价值分析 * 目录 分析航空公司现状 1. 行业内竞争 ...

  3. Python数据挖掘:利用聚类算法进行航空公司客户价值分析

    无小意丶 个人博客地址:无小意 知乎主页:无小意丶 公众号: 数据路(shuju_lu) 刚刚开始写博客,希望能保持关注,会继续努力. 以数据相关为主,互联网为辅进行文章发布. 本文是<Pyth ...

  4. 航空公司客户价值分析python实战

    航空公司客户价值分析(K_Means聚类分析) 最近在看黄红梅.张良均老师主编的<Python数据分析与应用>,拿书里的案例练练手. 本案例将使用航空公司客户数据,结合RFM模型,采用K_ ...

  5. python航空公司客户价值分析

    1.航空公司部分数据特征说明及LRFMC模型介绍及K-Means聚类算法介绍 2.开始数据分析 - 数据探索 Part Ⅰ:数据预处理 数据清洗 数据集成 数据归约 数据变换 Part Ⅱ:建模分析和 ...

  6. Python数据挖掘-RFM模型K-means聚类分析-航空公司客户价值分析

    使用教材:<Python数据分析与挖掘实战> 模型:RFM模型 算法:K-means聚类:其他方法还用到了层次聚类 数据:需要数据的可以评论里call. 内容: (1)案例: 航空公司客户 ...

  7. 《Python数据分析与挖掘实战》第7章——航空公司客户价值分析(kmeans)

    本文是基于<Python数据分析与挖掘实战>的实战部分的第七章的数据--<航空公司客户价值分析>做的分析. 旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码. 1)在 ...

  8. python客户价值分析_航空公司客户价值分析实例

    第8章 航空公司客户价值分析 传统的识别客户价值应用最广泛的模型主要通过3个指标(最近消费时间间隔(Recency).消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别 ...

  9. 【毕业设计】大数据分析的航空公司客户价值分析 - python

    文章目录 0 前言 1 数据分析背景 2 分析策略 2.1 航空公司客户价值分析的LRFMC模型 2.2 数据 2.3 分析模型 3 开始分析 3.1 数据预处理 3.1.1 数据预览 3.1.2 数 ...

最新文章

  1. [Step By Step]使用SLT工具从SAP导入数据到SAP HANA
  2. 准备把以前在百毒博客写的一些文章搬运过来
  3. python做电脑软件-程序员带你十天快速入门Python,玩转电脑软件开发(一)
  4. Python学习笔记(七)函数的使用
  5. php钩子函数示例,PHP中钩子函数的实现与认识
  6. 如何在Kali Linux中安装Google Chrome浏览器
  7. mybatis generator生成example_[Springboot系列] SpringBoot与Mybatis结合
  8. [密码学基础][每个信息安全博士生应该知道的52件事][Bristol Cryptography][第21篇]CRT算法如何提高RSA的性能?
  9. 自定义百度网盘分享密码提取码
  10. linux windows凤凰,凤凰系统率先升级内核到Linux4.9,支持更多新硬件
  11. [ActionScript 3] 【开源】D5Power RPG网页游戏开发套件
  12. Magento二次开发哪家好呢?
  13. Java爬虫Jsoup爬取必应壁纸
  14. 把 Win 8.1 升级成 Windows 2012 R2 (再续)
  15. 新技术表明通过观察灯泡振动可进行窃听,以后聊天得拉窗帘
  16. 娱乐,舰娘r建造公式【转】
  17. 动态规划(Dynamic Programming)
  18. 编译器工具链(二)——交叉编译
  19. Unity调用USB摄像头开启与关闭
  20. SkyWalking之安装Java agent

热门文章

  1. tightvnc使用教程,简述tightvnc使用教程
  2. [UOJ500]任意基DFT
  3. XP系统“Windows无法配置此无线连接”的解决办法
  4. CTOR打肿黑粉脸 | 石墨烯让BCH实现技术领先
  5. word插入希腊字符
  6. java-php-python-ssm奇妙店铺电子商务网站计算机毕业设计
  7. UVA508摩斯密码题目详解
  8. 移动磁盘由于IO设备错误,无法运行此项请求要怎么办啊
  9. 免费好看的图片哪里找?这里几个经典图片网站分享给大家
  10. gam估计模型的链接