一周算法实践---金融贷款逾期模型
金融贷款逾期模型
1.读取数据
import pandas as pd
data_all = pd.read_csv('../data/data_all.csv')`
2.划分数据集
from sklearn.model_selection import train_test_split
x = data_all.drop(['status'], axis=1)
y = data_all['status']
#数据三七分,随机种子2018
x_train, x_test, y_train, y_test = train_test_split(x, y,
test_size=0.3,random_state=2018)
3.模型训练
#搭建模型
from sklearn.tree import DecisionTreeClassifier
from sklearn import svm
from sklearn.linear_model import LogisticRegression
#逻辑回归模型
lr = LogisticRegression(random_state =2018)
lr.fit(x_train, y_train)
#支持向量机
svc = svm.SVC(random_state =2018)
svc.fit(x_train,y_train)
#决策树
clf = DecisionTreeClassifier(random_state =2018)
clf.fit(x_train,y_train)
4.模型评估
#评分lr_score = lr.score(X_test,y_test)Svc_score = Svc.score(X_test,y_test)dt_score = dt.score(X_test,y_testprint(lr_score)print(Svc_score)print(dt_score)#得到结果(0.7484232655921513, 0.7484232655921513, 0.6846531184302733)
一周算法实践---金融贷款逾期模型相关推荐
- 【机器学习】数据挖掘实战:金融贷款分类模型和时间序列分析
今天给大家带来一个企业级数据挖掘实战项目,金融贷款分类模型和时间序列分析,文章较长,建议收藏! 如果本文对你有所帮助,记得文末点赞和在看,也可分享给你需要的朋友- 项目背景 银行和其他金融贷款机构经常 ...
- 金融贷款逾期的模型构建7——模型融合
文章目录 一.集成学习 1.Bagging 2.Boosting 3.Stacking (1)核心图解 a.构建新的训练集 b.构建新的测试集 c.最终的训练与预测 (2)示例 a.构建新的训练集 b ...
- 金融贷款逾期的模型构建6——特征选择
文章目录 一.IV值 1.概述 2.IV计算 (1)WOE (2)IV 计算 二.实现 0.相关模块 1.IV值 2.Random Forest 3.特征合并 4.模型构建 5.模型评估 数据传送门( ...
- 金融贷款逾期的模型构建5——数据预处理
文章目录 一.相关库 二.数据读取 三.数据清洗--删除无关.重复数据 四.数据清洗--类型转换 1.数据集划分 2.缺失值处理 3.异常值处理 4.离散特征编码 5.日期特征处理 6.特征组合 五. ...
- 金融贷款逾期的模型构建1
数据 data_all.csv文件是非原始数据,已经处理过了.数据是金融数据, 我们要做的是预测贷款用户是否会逾期.表格中, status是标签: 0表示未逾期, 1表示逾期. 任务--模型构建 给定 ...
- 金融贷款逾期的模型构建2——集成模型
任务--模型构建 构建随机森林.GBDT.XGBoost和LightGBM这4个模型,并对每一个模型进行评分,评分方式任意,例如准确度和auc值. 1.相关安装资源 随机森林.GBDT均在sklear ...
- 【一周算法实践集训】_【模型构建】_baseline
读取数据 import pandas as pd data_all = pd.read_csv('data_all.csv',encoding='gbk') # encoding='gbk' 解决编码 ...
- 金融贷款逾期的模型构建4——模型调优
文章目录 一.任务 二.概述 1.参数说明 2.常用方法 二.实现 1.模块引入 2.模型评估函数 3.数据读取 4.Logistic Regression (1)调参部分 (2)模型评估 5.SVM ...
- 金融贷款逾期的模型构建3——模型评估
文章目录 一.评价指标 1.基本概念 2.准确率(accuracy) 3.精确率(precision) 4.召回率(recall) 5.F1值 6.roc曲线 和 auc值 二.模型评估 1.Logi ...
最新文章
- Python的enumerater
- 2019年秋计算机管理工作总结,年段工作总结(2019秋高一上)
- 调光设备术语:调光曲线(转)
- mysql用户 11_MySQL-快速入门(11)用户管理
- mysql 编译安装与rpm安装的区别_编译安装与RPM安装的区别
- 【安全】phpldapadmin-1.2.3 界面使用
- 剑指Offer值字符串的排列
- 「leetcode」46.全排列【回溯算法】详细图解!
- springMVC_08文件上传
- EJB到底是什么,真的那么神秘吗??
- (转)用Scintilla让程序支持语法高亮
- PS冷知识:PS隐藏功能中的组合键
- java查找PDF关键字坐标 并且标记出来
- 无法访问 您可能没有权限使用网络资源
- Java基础系列:判断空指针的三种方式
- FFmpeg获取视频旋转角度rotate获取不到的问题解决
- ubuntu中使用宋体和雅黑字体
- 我女儿说要看雪,于是我默默的拿起了键盘,下雪咯,程序员就是可以为所欲为!
- 苹果ppt_毫无惊喜的苹果新品发布会,用到的这4个PPT技巧却值得学习
- python里感叹号是什么意思_感叹号!代表什么意思?(标点符号的用法之感叹号)...
热门文章
- 访问 localhost 的请求遭到拒绝_软件架构-Spring Cloud Zuul作为API网关实现请求路由转发...
- htm5新特性新增与弃用元素
- 类结构表示方式介绍:类图(Class Diagram)
- 取消谷歌点击链接下载文件后但却自动将其打开
- Chat AI和ChatGPT都是人工智能技术,在应用场景、技术原理和使用方法等方面存在一些差别
- 启明的MACD十大形态技战法6-10
- ASUS华硕天选3笔记本FX507ZC12700H原厂Win11系统包,恢复原装出厂状态OEM预装系统
- Motan-远程调用的rpc框架的负载均衡策略
- android调用网络打印机,Android下通过wifi调用打印机打印
- Ubuntu安装控制件floodlight