Machine Learning | 基于逻辑回归做二分类进行癌症预测
导入包
import pandas as pd
import numpy as np
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression, SGDRegressor, Ridge, LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, classification_report
from sklearn.externals import joblib
构造列标签名字
column = ['Sample code number','Clump Thickness', 'Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size','Bare Nuclei','Bland Chromatin','Normal Nucleoli','Mitoses','Class']
读取数据
data = pd.read_csv("breast-cancer-wisconsin.csv", names=column)
data.head()
缺失值进行处理
data = data.replace(to_replace='?', value=np.nan)data = data.dropna()
数据的分割
x_train, x_test, y_train, y_test = train_test_split(data[column[1:10]], data[column[10]], test_size=0.25)
标准化处理
std = StandardScaler()x_train = std.fit_transform(x_train)
x_test = std.transform(x_test)
逻辑回归预测
lg = LogisticRegression(C=1.0)lg.fit(x_train, y_train)print(lg.coef_)
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,intercept_scaling=1, max_iter=100, multi_class='warn',n_jobs=None, penalty='l2', random_state=None, solver='warn',tol=0.0001, verbose=0, warm_start=False)
[[ 1.60392495 -0.11066665 0.93702846 1.01160157 -0.31111269 1.208766031.20701977 1.04581779 0.81269039]]
y_predict = lg.predict(x_test)print("准确率:", lg.score(x_test, y_test))
print("召回率:", classification_report(y_test, y_predict, labels=[2, 4], target_names=["良性", "恶性"]))
Machine Learning | 基于逻辑回归做二分类进行癌症预测相关推荐
- 【机器学习基础】(三):理解逻辑回归及二分类、多分类代码实践
本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇.本文的概念相对简单,主要侧重于代码实践. 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题.我们可以从 ...
- 吴恩达《机器学习》学习笔记七——逻辑回归(二分类)代码
吴恩达<机器学习>学习笔记七--逻辑回归(二分类)代码 一.无正则项的逻辑回归 1.问题描述 2.导入模块 3.准备数据 4.假设函数 5.代价函数 6.梯度下降 7.拟合参数 8.用训练 ...
- 机器学习(三):理解逻辑回归及二分类、多分类代码实践
本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇.本文的概念相对简单,主要侧重于代码实践. 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题.我们可以从 ...
- 机器学习:理解逻辑回归及二分类、多分类代码实践
作者 | caiyongji 责编 | 张红月 来源 | 转载自 caiyongji(ID:cai-yong-ji) 本文的概念相对简单,主要侧重于代码实践.现实生活中不止有预测的问题还有分类的问 ...
- 机器学习算法应用30篇(十一)-理解逻辑回归及二分类、多分类代码实践
一.逻辑回归:二分类 1.1 理解逻辑回归 我们把连续的预测值进行人工定义,边界的一边定义为1,另一边定义为0.这样我们就把回归问题转换成了分类问题. 如上图,我们把连续的变量分布压制在0-1的范围内 ...
- 基于逻辑回归的天猫优惠券使用情况预测
文章目录 前言 一.数据预处理 二.变量选择 查看特征值与目标值之间的相关关系 选取特征值 进行one-hot编码后目标值与特征值的相关关系 查看类别型变量的所有类别及类别分布概率情况 对数值型变 ...
- 机器学习笔记(三)---- 逻辑回归(二分类)
逻辑回归基本概念 前面提到过线性模型也可以用来做分类任务,但线性模型的预测输出 y = wx + b 可能是(-∞,+∞)范围内的任意实数,而二分类任务的输出y={0,1},如何在这之间做转换呢?答案 ...
- 吴恩达机器学习(四)逻辑回归(二分类与多分类)
目录 0. 前言 1. 假设函数(Hypothesis) 2. 决策边界(Decision Boundary) 3. 代价函数(Cost Funciton) 4. 梯度下降(Gradient Desc ...
- 基于逻辑回归的鸢尾花分类预测
基于逻辑回归的分类预测 1 逻辑回归的介绍和应用 1.1 逻辑回归的介绍 1.2 逻辑回归的应用 2 学习目标 3 代码流程 4 算法实战 4.1 Demo实践 Step1:库函数导入 Step2:模 ...
最新文章
- BeautifulSoup_第二节
- 2018北京大学计算机考研分数线,2018年北京大学考研复试分数线已公布
- mysql 配置自动截断_MySql超长自动截断实例详解
- 蚊子喜欢咬什么人,蚊子喜欢什么血型,蚊子喜欢叮咬什么血型的人
- C语言求斐波那契数列前10项
- ucosii 知识点总结
- 如何对散列查找进行asl分析计算?_Python数据结构与算法——散列(Hash)
- 王道计算机考研数据结构—学习笔记Chapter Five 串String
- 史上最完整的Android开发工具集合(附带下载地址)
- 频繁gc是什么意思_CPU飙高,频繁GC,怎么排查?
- 经典括号匹配问题——你真的明白了吗?
- idea运行maven工程,并且tomcat运行成功,但是仍然是404错误
- 慎用鲁大师 360等软件
- 聚合支付收款码怎么申请
- Efforts should be valuable
- 2017清北学堂(提高组精英班)集训笔记——基础算法
- Windows中安装并配置Maven详细教程
- 别开发APP了,这不是在开玩笑
- 基于python+pyqt+halcon实现视觉定位(halcon12.0)【附部分源码】
- 华为mate10可以用鸿蒙吗,可升级到鸿蒙2.0的四款华为手机,在用的恭喜了