数据分析案例3----银行坏账率分析
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt# 解决中文乱码问题
plt.rcParams['font.sans-serif'] = ['SimHei']# 解决负号无法正常显示的问题
plt.rcParams['axes.unicode_minus'] = False'''
某银行的数据分析师计算坏账率用户ID 好坏客户 年龄 负债率 月收入 家属数量
0 1 1 45 0.802982 9120.0 2.0
1 2 0 40 0.121876 2600.0 1.0
2 3 0 38 0.085113 3042.0 0.0
3 4 0 30 0.036050 3300.0 0.0
4 5 0 49 0.024926 63588.0 0.0
'''data = pd.read_csv('Myxlsxdata/loan.csv', encoding='gb2312')'''
是不是收入越高的人坏账率越低
'''
# 首先进行缺失值处理,用均值填充法
data = data.fillna({'月收入': data['月收入'].mean()})# 对月收入进行分析
# 因为月收入属于连续值,对连续值进行分析时,我们一般都会将连续值进行离散化
# 就是将连续值进行区间分割,分成若干类别
cut_bins = [0, 5000, 10000, 15000, 20000, 100000]
income_cut = pd.cut(data['月收入'], cut_bins)# 区间分好后就可以查看每个区间的坏账率
# 坏账率就是所有借款用户中逾期不还用户的占比
# 逾期不还的用户的好坏客户字段表记为1,按期还款的标记为0
# 坏账率 = 好坏客户字段之和(坏账客户数) / 好坏客户字段的计数(所有借款用户)
all_income_user = data['好坏客户'].groupby(income_cut).count()
bad_income_user = data['好坏客户'].groupby(income_cut).sum()
income_bad_rate = bad_income_user / all_income_user
income_bad_rate.plot.bar()
plt.show()'''
年龄和坏账率的关系
'''
# 先对年龄进行离散值处理
age_cut = pd.qcut(data['年龄'], 6)
all_age_user = data['好坏客户'].groupby(age_cut).count()
bad_age_user = data['好坏客户'].groupby(age_cut).sum()
age_bad_rate = bad_age_user / all_age_user
age_bad_rate.plot.bar()
plt.show()'''
家庭人口数量和坏账率的关系
'''
# 人口数量也是连续值,但因为数值不大,就当作离散值处理
all_age_fam_num = data.groupby('家属数量')['好坏客户'].count()
bad_age_fam_num = data.groupby('家属数量')['好坏客户'].sum()
fam_num_bad_rate = bad_age_fam_num / all_age_fam_num
fam_num_bad_rate.plot()
plt.show()
数据分析案例3----银行坏账率分析相关推荐
- Python数据分析案例-利用AB test分析转化率是否存在差异
1. AB test简介 AB测试是为Web或App界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组 ...
- 数据分析案例-停车场数据可视化分析
数据集介绍 数据为某停车场信息表,具体字段信息如下表: 字段 含义 字段 含义 cn 车牌号 price 停车所交费用 timein 车辆进场时间 state 是否已经离场 timeout ...
- 数据分析案例--学生用户消费分析
1.导入相关python包 import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inl ...
- 数据分析案例——IP归属地分析
根据用户上网数据,完成上网IP归属地分析统计,并进行相应排序. 简介 给定的access.log是电信运营商的用户上网数据,第一个字段是时间,第二个字段是ip地址,第三更字段是访问的网站,其他字段可以 ...
- 【数据分析案例】某瓣读书数据分析
前言说明 本文借用原文作者路人甲的爬取数据进行数据分析思路分享,如有侵犯相关版权信息,请联系本文作者删除文章 数据来源 数据源来自路人甲的公众号,可关注「路人甲 TM」公众号获取数据源 部分数据特征为 ...
- Pandas数据分析案例(盛华化工锅炉排放数据可视化分析)
Pandas数据分析案例(盛华化工锅炉排放数据可视化分析) 实验环境 数据集介绍 问题描述 实验步骤 一.数据导入与观察 二.数据转换 三.数据可视化分析 相关资源 实验环境 操作系统:Linux/W ...
- Python数据分析案例10——北向资金流入与沪深300涨跌幅分析
博主本科是学投资的,最近看了b站邢不行up主的一些量化策略视频,和自己本科毕业论文很像,便想自己也来做一下这个实操的项目. 案例背景 北向资金是从中国最南方--中国香港流入内陆的资金,大部分都是外资, ...
- python实验数据预处理案例_Python数据分析小案例——红楼梦文本分析(一) 文本预处理...
本文开始介绍一个简单的数据分析案例,分析红楼梦文本,本文主要内容是将红楼梦文本按照章节获取每一回的标题,字数,段落数并保存到csv中方便后续数据分析 红楼梦小说文本可以在这里下载 链接:https:/ ...
- python酒店数据分析_Python数据分析 I 全国旅游景点分析案例,哪里好玩一目了然...
原标题:Python数据分析 I 全国旅游景点分析案例,哪里好玩一目了然 前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作 ...
最新文章
- Blender从头到尾创建低多边形角色学习教程 Low Poly Characters – Blender Bitesize Course
- Mysql binlog应用场景与原理深度剖析
- Android开发如何双击返回键退出程序
- Mac安装MySQL数据库
- gan怎么输入一维数据_时空序列预测模型GAN+LSTM
- 漫步数理统计十一——连续随机变量(下)
- c语言乘法口诀表的流程图_看了100篇化妆教程,还没有这60句化妆口诀管用
- CACTI实现飞信报警
- python保存不了_新手,我的python保存不了文件
- Centos 8 安装和配置 VNC 服务,让 MAC 可以远程桌面管理Centos(linux)
- Julia :PyPlot库安装中需注意的问题
- 预测股票涨跌看什么指标,如何预测明天股票走势
- VUE:element ui组件应用之个人中心页面
- 2018年sfdc工作总结_常见Salesforce 异常
- 关于php上传多张图片时,选择图片后就可以预览的问题
- 成功搭建Selenium运行环境,能够使用Chrome浏览器打开任意网页
- 名帖289 董其昌 行书《千字文》
- 如何使用在线客服转接功能
- 画色彩如何画出体积感
- Day2 QT常用基础类型(自用)