导入包

import pandas as pd
import numpy as np
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression, SGDRegressor,  Ridge, LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, classification_report
from sklearn.externals import joblib

构造列标签名字

column = ['Sample code number','Clump Thickness', 'Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size','Bare Nuclei','Bland Chromatin','Normal Nucleoli','Mitoses','Class']

读取数据

data = pd.read_csv("breast-cancer-wisconsin.csv", names=column)
data.head()


 缺失值进行处理

data = data.replace(to_replace='?', value=np.nan)data = data.dropna()

数据的分割

x_train, x_test, y_train, y_test = train_test_split(data[column[1:10]], data[column[10]], test_size=0.25)

标准化处理

std = StandardScaler()x_train = std.fit_transform(x_train)
x_test = std.transform(x_test)

逻辑回归预测

lg = LogisticRegression(C=1.0)lg.fit(x_train, y_train)print(lg.coef_)
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,intercept_scaling=1, max_iter=100, multi_class='warn',n_jobs=None, penalty='l2', random_state=None, solver='warn',tol=0.0001, verbose=0, warm_start=False)
[[ 1.60392495 -0.11066665  0.93702846  1.01160157 -0.31111269  1.208766031.20701977  1.04581779  0.81269039]]
y_predict = lg.predict(x_test)print("准确率:", lg.score(x_test, y_test))
print("召回率:", classification_report(y_test, y_predict, labels=[2, 4], target_names=["良性", "恶性"]))

Machine Learning | 基于逻辑回归做二分类进行癌症预测相关推荐

  1. 【机器学习基础】(三):理解逻辑回归及二分类、多分类代码实践

    本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇.本文的概念相对简单,主要侧重于代码实践. 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题.我们可以从 ...

  2. 吴恩达《机器学习》学习笔记七——逻辑回归(二分类)代码

    吴恩达<机器学习>学习笔记七--逻辑回归(二分类)代码 一.无正则项的逻辑回归 1.问题描述 2.导入模块 3.准备数据 4.假设函数 5.代价函数 6.梯度下降 7.拟合参数 8.用训练 ...

  3. 机器学习(三):理解逻辑回归及二分类、多分类代码实践

    本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇.本文的概念相对简单,主要侧重于代码实践. 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题.我们可以从 ...

  4. 机器学习:理解逻辑回归及二分类、多分类代码实践

    作者 | caiyongji   责编 | 张红月 来源 | 转载自 caiyongji(ID:cai-yong-ji) 本文的概念相对简单,主要侧重于代码实践.现实生活中不止有预测的问题还有分类的问 ...

  5. 机器学习算法应用30篇(十一)-理解逻辑回归及二分类、多分类代码实践

    一.逻辑回归:二分类 1.1 理解逻辑回归 我们把连续的预测值进行人工定义,边界的一边定义为1,另一边定义为0.这样我们就把回归问题转换成了分类问题. 如上图,我们把连续的变量分布压制在0-1的范围内 ...

  6. 基于逻辑回归的天猫优惠券使用情况预测

    文章目录 前言 一.数据预处理 二.变量选择 查看特征值与目标值之间的相关关系 ​选取特征值 进行one-hot编码后目标值与特征值的相关关系 ​查看类别型变量的所有类别及类别分布概率情况 对数值型变 ...

  7. 机器学习笔记(三)---- 逻辑回归(二分类)

    逻辑回归基本概念 前面提到过线性模型也可以用来做分类任务,但线性模型的预测输出 y = wx + b 可能是(-∞,+∞)范围内的任意实数,而二分类任务的输出y={0,1},如何在这之间做转换呢?答案 ...

  8. 吴恩达机器学习(四)逻辑回归(二分类与多分类)

    目录 0. 前言 1. 假设函数(Hypothesis) 2. 决策边界(Decision Boundary) 3. 代价函数(Cost Funciton) 4. 梯度下降(Gradient Desc ...

  9. 基于逻辑回归的鸢尾花分类预测

    基于逻辑回归的分类预测 1 逻辑回归的介绍和应用 1.1 逻辑回归的介绍 1.2 逻辑回归的应用 2 学习目标 3 代码流程 4 算法实战 4.1 Demo实践 Step1:库函数导入 Step2:模 ...

最新文章

  1. BeautifulSoup_第二节
  2. 2018北京大学计算机考研分数线,2018年北京大学考研复试分数线已公布
  3. mysql 配置自动截断_MySql超长自动截断实例详解
  4. 蚊子喜欢咬什么人,蚊子喜欢什么血型,蚊子喜欢叮咬什么血型的人
  5. C语言求斐波那契数列前10项
  6. ucosii 知识点总结
  7. 如何对散列查找进行asl分析计算?_Python数据结构与算法——散列(Hash)
  8. 王道计算机考研数据结构—学习笔记Chapter Five 串String
  9. 史上最完整的Android开发工具集合(附带下载地址)
  10. 频繁gc是什么意思_CPU飙高,频繁GC,怎么排查?
  11. 经典括号匹配问题——你真的明白了吗?
  12. idea运行maven工程,并且tomcat运行成功,但是仍然是404错误
  13. 慎用鲁大师 360等软件
  14. 聚合支付收款码怎么申请
  15. Efforts should be valuable
  16. 2017清北学堂(提高组精英班)集训笔记——基础算法
  17. Windows中安装并配置Maven详细教程
  18. 别开发APP了,这不是在开玩笑
  19. 基于python+pyqt+halcon实现视觉定位(halcon12.0)【附部分源码】
  20. 华为mate10可以用鸿蒙吗,可升级到鸿蒙2.0的四款华为手机,在用的恭喜了

热门文章

  1. Android 源码编译相关
  2. 某程序员遭遇奇葩事:辞退自己的leader竟然命令自己回前公司,给前同事讲代码!...
  3. 美团某程序员爆料:绩效背c的都要签pip!网友:pip就是变相劝退!
  4. Java并发必知必会第三弹:用积木讲解ABA原理
  5. 图解|通用搜索引擎背后的技术点
  6. 阿里文娱搜索算法实践与思考
  7. 浅谈分布式系统一致性之3PC协议
  8. 软件开发人员维护代码指南
  9. 推荐10款冷门但强大的windows软件,值得收藏!
  10. 管理者如何打造一个有执行力的团队?