import pandas as pd

from sklearn.preprocessing import StandardScaler

from sklearn.cluster import KMeans

data = pd.read_csv(r'credit_card.csv',sep=',',encoding='gbk')

print(data.columns)

#1.处理信用卡异常值

data1 = data[data['逾期'] != 1]

data2 = data[data['呆账'] != 1]

data3 = data[data['强制停卡记录'] != 1]

data4 = data[data['退票'] != 1]

data5 = data[data['拒往记录'] != 1]

data6 = data[data['瑕疵户'] != 1]

print(data6)

#2.构造信用卡客户风险关键特征

#(1)行为特征;(2)经济风险特征#;(3)收入风险特征;(4)标准化数据

data_action = data[['瑕疵户','逾期','呆账','强制停卡记录','退票','拒往记录']]

data_jingji = data[['借款余额', '个人月收入','个人月开销','家庭月收入','月刷卡额']]

data_income = data[['职业','年龄','住家']]

data_action_std = StandardScaler().fit_transform(data_action)

data_jingji_std = StandardScaler().fit_transform(data_jingji)

data_income_std = StandardScaler().fit_transform(data_income)

#3.构建Kmeans聚类模型(客户分群)

data_kmeans1 = KMeans(n_clusters=5,random_state=123).fit(data_action_std)

#print('聚类中心:',data_kmeans1.cluster_centers_)

r1 = pd.Series(data_kmeans1.labels_).value_counts()

print('行为特征每类数目:',r1)

data_kmeans2 = KMeans(n_clusters=5,random_state=123).fit(data_jingji_std)

#print('聚类中心:',data_kmeans2.cluster_centers_)

r2 = pd.Series(data_kmeans2.labels_).value_counts()

print('经济风险特征每类数目:',r2)

data_kmeans3 = KMeans(n_clusters=5,random_state=123).fit(data_income_std)

#print('聚类中心:',data_kmeans3.cluster_centers_)

r3 = pd.Series(data_kmeans3.labels_).value_counts()

print('收入风险特征每类数目:',r3)

python信用卡客户_银行信用卡客户价值分析(Python数据分析)相关推荐

  1. 用python画皇冠_手把手教你用 Python 绘制酷炫的桑基图!

    原标题:手把手教你用 Python 绘制酷炫的桑基图! 作者 | 周志鹏 责编 | 郭 芮 最近,不止一次收到小伙伴的截图追问: "这个图叫什么???" "这个图真好看! ...

  2. 微软大神的python语言入门_你是如何自学 Python 的?

    [个人介绍] 本人大学专业为"高分子材料与工程",属化学方向,毫无编程经验,但在18年中由于工作需要处理大量数据,"被迫"学习了数据库和Python,虽然不能算 ...

  3. python画图宽度_手把手教你用 Python 绘制酷炫的桑基图!

    作者 | 周志鹏 责编 | 郭   芮 最近,不止一次收到小伙伴的截图追问: "这个图叫什么???" "这个图真好看!!!怎么画啊?" ...... 笔者本没有 ...

  4. 易语言和python混合编程_[我叫以赏]Python制作交互式的服务器与客户端互相通讯(引用SOCKET模块)...

    前言 欢迎来到我的教程啊,我是以赏,这么说吧,Python我也在学习并未达到"精通"的地步,一部分呢是自学,一部分是老师"传授"的.但我认为学习Python应该 ...

  5. 怎么用python自制计算公式_手把手教你用python制作简易计算器,能够记录你使用的情况...

    话不多说,首先先看效果图,它能够记录你在使用过程中的历史,方便你查看是否有错: 接下来就仔细分析一下是如何制作的: 简易计算器 第一步:导入资源库 在过程中使用到了tkinter这个资源库,win+R ...

  6. python做运动控制_第一课:用Python操控小龟小车运动

    欢迎来到小龟的课堂,今天我们讲如何用小龟小车的车载Python控制小车运动. 如果小伙伴还不会使用小龟小车的Python编辑器的话,可以阅读这篇教程<如何使用小龟小车的Python编辑器> ...

  7. print python excel分隔_合并/拆分 Excel?Python、VBA轻松自动化

    作者 | Ryoko 来源 | 凹凸数据 当你收集了 n 个人的 EXCEL 记录表,需要将它们汇成一个总表时你会怎么做呢? 如果不通过技术手段,要一个个打开再复制粘贴也太麻烦了吧! 此时就需要一个通 ...

  8. python半圆代码_趣味项目:用Python代码做个月饼送给你!

    所用工具 1.Python中的turtle包 2.对Python似火的热情 先来介绍一番 Turtle作图又叫海龟作图,是Python中比较有趣的一个模块,功能强大,使用方便.简单来说,比如有一块空地 ...

  9. 易语言和python混合编程_关于易语言与Python的一点想法

    易语言与python的一点想法">关于易语言与Python的一点想法 小香蕉 2019年7月11日 说在前面 最近吃饭的时候总是会想很多关于易语言的事情.易语言是我学会的第一门语言,虽 ...

  10. python文件编译_我算是白学Python了,现在才知道原来Python是可以编译的

    斌哥说 大家好,我是斌哥. 一说起Python,可能开发者第一时间想到的就是:"Python是一门能快速开发的解释型语言". 没错,Python确实是一门解释型的语言,而对比Jav ...

最新文章

  1. 多传感器融合之滤波(二)EKF
  2. VMware三种网络模式根本区别
  3. Ubuntu 8.10今起正式退休
  4. 淘宝分布式调度框架TBSchedule
  5. Tensorflow解决MNIST手写体数字识别
  6. 理解 CSS 属性值语法
  7. python数据库连接代码_python 连接各类主流数据库的实例代码
  8. Python+Spark大数据音乐推荐系统
  9. Pycharm相对路径
  10. java中将Fri Feb 19 17:32:34 CST 2021时间格式转为yyyy-MM-dd HH:mm:ss时间格式
  11. 反步法设计步骤及仿真验证(非线性系统)
  12. Linux常用指令---系统负载
  13. 5.1 多元线性回归分析
  14. java 根据日期算星座_Hive自定义函数实现通过日期计算星座
  15. 提升研发效率的基本工作原则
  16. 硬盘引导服务器,Windows 7实战之为本机引导部署虚拟硬盘
  17. C# 导入(读取) WPS ET文件
  18. 一图看懂TensorFlow2.0系列(十一)如何用TensorFlow2.0实现seq2seq的机器翻译?
  19. 基于PyQt5实现界面控件自适应大小
  20. JAVA Mall 项目致力于打造一个完整的电商系统,采用微服务架构设计

热门文章

  1. dubbo SPI机制与@Adaptive自适应扩展机制
  2. NUC8冥王峡谷改装苹果网卡完美方案
  3. Ubuntu14.04安装LSD-SLAM
  4. LSD算法调节参数GUI
  5. Java项目使用jib打包docker镜像的简单记录
  6. SRVCC关键场景及Log分析
  7. 计算机查看配置的快捷键,剪映电脑版快捷键在哪里设置? 剪映查看快捷键的技巧...
  8. Jenkins HTML Publisher 插件
  9. Ubuntu Linux,及Python matplot,安装Times New Roman等字体,让图标签可以用Times New Roman等字体
  10. IMU惯导相关开源项目整理