银行搜集了用户贷款、收入和信用卡是否逾期的数据。请使用这些数据建立一个能预测信用卡逾期情况的逻辑回归模型。
素材文件见“credit-overdue.csv”。
要求(1)绘制数据的散点图,查看数据分布情况;
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
data=pd.read_csv("credit-overdue.csv", header=0) # 加载数据集
print(data.head())#展示下前五行
plt.figure(figsize=(10,6))#设置画布大小
map_size={0:20,1:100}#能够改变不同形状
size=list(map(lambda x:map_size[x],data['overdue']))#map()函数是Python的内置函数,会根据提供的函数参数,对传入的序列数据进行映射。所以,map()函数也称映射函数。在Python中,map是一个类,有着迭代方法,能够返回对应值。平时也能充当着函数使用:
plt.scatter(data['debt'],data['income'],s=size,c=data['overdue'],marker='v')
(2)绘制损失函数(MSE)随着迭代次数增加而变化的曲线;
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import mean_squared_error, classification_report
#默认参数下的逻辑回归
X = data[['debt','income']].values#把data中debt,income列的值给到X
y = data['overdue'].values#把data中overdue的值给到y
lr = LogisticRegression()#初始化逻辑回归器
lr.fit(X, y)#用X,y训练模型
y_prediction=lr.predict(X)
print(mean_squared_error(y,y_prediction))
mse_list=[]
#绘制损失函数变化曲线
for i in range(0,100,2):model=LogisticRegression(max_iter=i)model.fit(X,y)mse=mean_squared_error(y,model.predict(X))mse_list.append(mse)
plt.figure(figsize=(10,6))
plt.plot([i for i in range(0,100,2)],mse_list)
plt.xlabel("Number of iterations")
plt.ylabel("MSE")
plt.show()
(3) 随机选取30%作为测试集,计算测试集上的预测指标(含查全率,查准率,F1-score)。
from sklearn.model_selection import train_test_split
#划分训练集和测试集
X_train,X_test,Y_train,Y_test = train_test_split(X, y, test_size=0.3, random_state=2023)
print("X_train:", X_train.shape, "Y_train:", Y_train.shape)
print("X_test:", X_test.shape, "Y_test:", Y_test.shape)
lr = LogisticRegression()
lr.fit(X_train, Y_train)
Y_prediction=lr.predict(X_test)
print(classification_report(Y_test,Y_prediction))
银行搜集了用户贷款、收入和信用卡是否逾期的数据。请使用这些数据建立一个能预测信用卡逾期情况的逻辑回归模型。相关推荐
- 大数据分析实战-信用卡欺诈检测(五)-逻辑回归模型
大数据分析实战-信用卡欺诈检测(一) 大数据分析实战-信用卡欺诈检测(二)-下采样方案和交叉验证 大数据分析实战-信用卡欺诈检测(三)- 模型评估 大数据分析实战-信用卡欺诈检测(四)-正则化惩罚 逻 ...
- 上可以替代mobaxterm_电能替代 | 基于逻辑回归模型的电能替代用户辨识研究
[抢先看]<浙江电力>2020年第1期目录及重点关注文章 [抢先看]<浙江电力>2020年第2期目录及重点关注文章 征文 |"储能技术规模化应用技术"专题征 ...
- NO.62——100天机器学习实践第五天:用逻辑回归模型分析信用卡欺诈案例
import pandas as pd import matplotlib.pyplot as plt import numpy as np%matplotlib inline #分类计数 count ...
- 机器学习-逻辑回归-信用卡检测任务
信用卡欺诈检测 基于信用卡交易记录数据建立分类模型来预测哪些交易记录是异常的哪些是正常的. 任务流程: 加载数据,观察问题 针对问题给出解决方案 数据集切分 评估方法对比 逻辑回归模型 建模结果分析 ...
- 唐宇迪机器学习课程笔记:逻辑回归之信用卡检测任务
信用卡欺诈检测 基于信用卡交易记录数据建立分类模型来预测哪些交易记录是异常的哪些是正常的. 任务流程: 加载数据,观察问题 针对问题给出解决方案 数据集切分 评估方法对比 逻辑回归模型 建模结果分析 ...
- python之逻辑回归项目实战——信用卡欺诈检测
信用卡欺诈检测 1.项目介绍 2.项目背景 3.分析项目 4.数据读取与分析 4.1 加载数据 4.2 查看数据的标签分布 5.数据预处理 5.1 特征标准化 5.2. 使用下采样解决样本数据不均衡 ...
- 银行定期存款产品目标客户的确定——基于逻辑回归
本篇文章将会介绍用Python分析银行定期存款产品目标客户的确定详细建模细节,业务框架分析以及模型的选择与评估分析参见上一篇文章: 银行定期存款产品目标客户的确定--基于逻辑回归(建模前分析) 1.导 ...
- kaggle信用卡欺诈看异常检测算法——无监督的方法包括: 基于统计的技术,如BACON *离群检测 多变量异常值检测 基于聚类的技术;监督方法: 神经网络 SVM 逻辑回归...
使用google翻译自:https://software.seek.intel.com/dealing-with-outliers 数据分析中的一项具有挑战性但非常重要的任务是处理异常值.我们通常将异 ...
- 逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的概率设置为因变量,将用户的
逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种.通过历史数据的表现对未来结果发生的概率进行预测.例如,我们可以将购买的概率设置为因变量,将用户的 ...
最新文章
- 看大神如何使用vue导出pdf
- pytorch maxout实现
- 案例丨神策数据赋能物流服务行业数字化转型
- 智能、弹性、易用:云时代的负载均衡之道
- ARM(IMX6U)裸机C语言蜂鸣器驱动实验(BSP+SDK)
- 交通仿真软件测试自学,[2018年最新整理]各类交通仿真软件综合介绍.docx
- 集成灶带给我的是无尽烦恼,大家的集成灶用得如何?
- php 判断昨天_PHP 判断时间在今天、昨天、前天、几天前几点
- jsoup教程_1 简介
- php7安装详解、,php7安装详解(windows环境)
- 497.非重叠矩形中的随机点
- matlab聚类分析_数据挖掘——聚类分析
- 基于D-S证据理论的数据融合算法的研究
- 2022高压电工考试试题及在线模拟考试
- 计算时代正在消灭中产阶级
- [ctf misc][2021祥云杯初赛]层层取证
- Vue组件实现数字滚动抽奖效果
- Auto Layout和UILabel
- 消息队列及常见消息中间件
- 软件架构设计与需求分析方法论