import pandas as pd
import numpy as np
import matplotlib.pyplot as plt# 解决中文乱码问题
plt.rcParams['font.sans-serif'] = ['SimHei']# 解决负号无法正常显示的问题
plt.rcParams['axes.unicode_minus'] = False'''
某银行的数据分析师计算坏账率用户ID  好坏客户   年龄   负债率     月收入    家属数量
0     1        1      45   0.802982   9120.0     2.0
1     2        0      40   0.121876   2600.0     1.0
2     3        0      38   0.085113   3042.0     0.0
3     4        0      30   0.036050   3300.0     0.0
4     5        0      49   0.024926   63588.0    0.0
'''data = pd.read_csv('Myxlsxdata/loan.csv', encoding='gb2312')'''
是不是收入越高的人坏账率越低
'''
# 首先进行缺失值处理,用均值填充法
data = data.fillna({'月收入': data['月收入'].mean()})# 对月收入进行分析
# 因为月收入属于连续值,对连续值进行分析时,我们一般都会将连续值进行离散化
# 就是将连续值进行区间分割,分成若干类别
cut_bins = [0, 5000, 10000, 15000, 20000, 100000]
income_cut = pd.cut(data['月收入'], cut_bins)# 区间分好后就可以查看每个区间的坏账率
# 坏账率就是所有借款用户中逾期不还用户的占比
# 逾期不还的用户的好坏客户字段表记为1,按期还款的标记为0
# 坏账率 = 好坏客户字段之和(坏账客户数) / 好坏客户字段的计数(所有借款用户)
all_income_user = data['好坏客户'].groupby(income_cut).count()
bad_income_user = data['好坏客户'].groupby(income_cut).sum()
income_bad_rate = bad_income_user / all_income_user
income_bad_rate.plot.bar()
plt.show()'''
年龄和坏账率的关系
'''
# 先对年龄进行离散值处理
age_cut = pd.qcut(data['年龄'], 6)
all_age_user = data['好坏客户'].groupby(age_cut).count()
bad_age_user = data['好坏客户'].groupby(age_cut).sum()
age_bad_rate = bad_age_user / all_age_user
age_bad_rate.plot.bar()
plt.show()'''
家庭人口数量和坏账率的关系
'''
# 人口数量也是连续值,但因为数值不大,就当作离散值处理
all_age_fam_num = data.groupby('家属数量')['好坏客户'].count()
bad_age_fam_num = data.groupby('家属数量')['好坏客户'].sum()
fam_num_bad_rate = bad_age_fam_num / all_age_fam_num
fam_num_bad_rate.plot()
plt.show()

数据分析案例3----银行坏账率分析相关推荐

  1. Python数据分析案例-利用AB test分析转化率是否存在差异

    1. AB test简介 AB测试是为Web或App界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组 ...

  2. 数据分析案例-停车场数据可视化分析

    ​​​​​数据集介绍 数据为某停车场信息表,具体字段信息如下表: 字段 含义 字段 含义 cn 车牌号 price 停车所交费用 timein 车辆进场时间 state 是否已经离场 timeout ...

  3. 数据分析案例--学生用户消费分析

    1.导入相关python包 import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inl ...

  4. 数据分析案例——IP归属地分析

    根据用户上网数据,完成上网IP归属地分析统计,并进行相应排序. 简介 给定的access.log是电信运营商的用户上网数据,第一个字段是时间,第二个字段是ip地址,第三更字段是访问的网站,其他字段可以 ...

  5. 【数据分析案例】某瓣读书数据分析

    前言说明 本文借用原文作者路人甲的爬取数据进行数据分析思路分享,如有侵犯相关版权信息,请联系本文作者删除文章 数据来源 数据源来自路人甲的公众号,可关注「路人甲 TM」公众号获取数据源 部分数据特征为 ...

  6. Pandas数据分析案例(盛华化工锅炉排放数据可视化分析)

    Pandas数据分析案例(盛华化工锅炉排放数据可视化分析) 实验环境 数据集介绍 问题描述 实验步骤 一.数据导入与观察 二.数据转换 三.数据可视化分析 相关资源 实验环境 操作系统:Linux/W ...

  7. Python数据分析案例10——北向资金流入与沪深300涨跌幅分析

    博主本科是学投资的,最近看了b站邢不行up主的一些量化策略视频,和自己本科毕业论文很像,便想自己也来做一下这个实操的项目. 案例背景 北向资金是从中国最南方--中国香港流入内陆的资金,大部分都是外资, ...

  8. python实验数据预处理案例_Python数据分析小案例——红楼梦文本分析(一) 文本预处理...

    本文开始介绍一个简单的数据分析案例,分析红楼梦文本,本文主要内容是将红楼梦文本按照章节获取每一回的标题,字数,段落数并保存到csv中方便后续数据分析 红楼梦小说文本可以在这里下载 链接:https:/ ...

  9. python酒店数据分析_Python数据分析 I 全国旅游景点分析案例,哪里好玩一目了然...

    原标题:Python数据分析 I 全国旅游景点分析案例,哪里好玩一目了然 前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作 ...

最新文章

  1. Blender从头到尾创建低多边形角色学习教程 Low Poly Characters – Blender Bitesize Course
  2. Mysql binlog应用场景与原理深度剖析
  3. Android开发如何双击返回键退出程序
  4. Mac安装MySQL数据库
  5. gan怎么输入一维数据_时空序列预测模型GAN+LSTM
  6. 漫步数理统计十一——连续随机变量(下)
  7. c语言乘法口诀表的流程图_看了100篇化妆教程,还没有这60句化妆口诀管用
  8. CACTI实现飞信报警
  9. python保存不了_新手,我的python保存不了文件
  10. Centos 8 安装和配置 VNC 服务,让 MAC 可以远程桌面管理Centos(linux)
  11. Julia :PyPlot库安装中需注意的问题
  12. 预测股票涨跌看什么指标,如何预测明天股票走势
  13. VUE:element ui组件应用之个人中心页面
  14. 2018年sfdc工作总结_常见Salesforce 异常
  15. 关于php上传多张图片时,选择图片后就可以预览的问题
  16. 成功搭建Selenium运行环境,能够使用Chrome浏览器打开任意网页
  17. 名帖289 董其昌 行书《千字文》
  18. 如何使用在线客服转接功能
  19. 画色彩如何画出体积感
  20. Day2 QT常用基础类型(自用)

热门文章

  1. JAVA对象头的指针压缩
  2. Java基础面试题——IO流
  3. Core Animation - 爆炸效果
  4. 1037 在霍格沃茨找零钱(JAVA)
  5. 黑盒测试用例设计方法一(等价类划分、边界值分析)
  6. 是什么在背后支撑起“带货一哥”李佳琦?
  7. sphider+scws
  8. 忘记Word文档密码?这里有解!
  9. VS的release版本如何调试
  10. python的安装与环境配置