1.接下来我们将使用朴素贝叶斯算法来进行一个小的项目实战——判断一个患者的肿瘤是良性还是恶性。这里我们将使用一个来自真实世界的数据集——威斯康星乳腺肿瘤数据集。
2.对数据集进行分析:
威斯康星乳腺肿瘤数据集是一个非常经典的用于医疗病情分析的数据集,它包括569个病例的数据样本,每个样本具有30个特征值,而样本共分为两类:分别是恶性和良性。

from sklearn.datasets import load_breast_cancer
cancer=load_breast_cancer()
from sklearn.model_selection import train_test_split
X,y=cancer.data,cancer.target
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=1)
from sklearn.naive_bayes import GaussianNB
nb=GaussianNB()
nb.fit(X_train,y_train)
print('训练集得分:{}'.format(nb.score(X_train,y_train)))
print('测试集得分:{}'.format(nb.score(X_test,y_test)))


3.总结:
相比线性模型算法,朴素贝叶斯算法的效率要高一些,这是因为朴素贝叶斯算法会把数据集中的各个特征看作完全独立的,而不考虑特征之间的关联关系。但同时模型的泛化能力会稍微弱一点,不过一般情况下并不太影响实际的使用。尤其是在现在这个大数据时代,很多数据集的样本特征可能成千上万,这种情况下,模型的效率要比模型的泛化性能多零点几个百分点的得分重要的多,因此在这种情况下,朴素贝叶斯算法往往是一个更好的选择。

朴素贝叶斯实战——判断肿瘤是良性还是恶性相关推荐

  1. 机器学习实验二:朴素贝叶斯和SVM——肿瘤分类与预测(朴素贝叶斯)

    实操项目 1--肿瘤分类与预测(朴素贝叶斯) 实验要求 采用朴素贝叶斯方法,对美国威斯康星州的乳腺癌诊断数据集进行分类,实现针对乳腺癌检测的分类器,以判断一个患者的肿瘤是良性还是恶性. [实验要求] ...

  2. 基于朴素贝叶斯算法对肿瘤类别分类

    目录 朴素贝叶斯算法​编辑 朴素贝叶斯的三种方式 实战--肿瘤类别的分类 朴素贝叶斯算法  贝叶斯定理 贝叶斯定理(Bayes Theorem)也称贝叶斯公式,是关于随机 事件的条件概率的定理 定理内 ...

  3. 朴素贝叶斯--实战分析

    概率论及贝叶斯决策理论的一些知识请参阅相关书籍和博客 https://blog.csdn.net/amds123/article/details/70173402 这里给出源码及解析. 1. 使用py ...

  4. 基于scikit-learn的朴素贝叶斯实战

    写在前面 学完了朴素贝叶斯的基本原理(机器学习算法总结之朴素贝叶斯法),现在利用sklearn平台的朴素贝叶斯类库来实战一下,加深印象. 1.sklearn中朴素贝叶斯(NB)简介 相比于前面的决策树 ...

  5. Python3《机器学习实战》学习笔记(五):朴素贝叶斯实战篇之新浪新闻分类

    转载请注明作者和出处:http://blog.csdn.net/c406495762 Github代码获取:https://github.com/Jack-Cherish/Machine-Learni ...

  6. 朴素贝叶斯实战(Python屏蔽留言板的侮辱性言论)

    项目概述 构建一个快速过滤器来屏蔽留言板上的侮辱性言论.如果某条留言使用了负面或者侮辱性的语言,那么就将该留言标识为内容不当.对此问题建立两个类别: 侮辱类和非侮辱类,使用 1 和 0 分别表示. 准 ...

  7. 朴素贝叶斯实战应用---单词拼写检查器(结合html直观展示)

    博文写于2020-05-10,于2020-07-07再次编辑 1.一个小小的引子: 写这篇博文的时候,日子有点特殊,啥日子大家应该都知道.用一篇某高二学生母亲节的英语作文,先祝天下所有母亲身体健康,母 ...

  8. NLP系列(4)_朴素贝叶斯实战与进阶

    作者: 寒小阳 && 龙心尘 时间:2016年2月. 出处:http://blog.csdn.net/han_xiaoyang/article/details/50629608 htt ...

  9. 机器学习实战4(1):朴素贝叶斯:垃圾邮件的识别

    一.朴素贝叶斯基础知识 预备数学知识: A. 无约束条件的优化 1.求极值问题 人工智能中最核心的数学环节是求出一个目标函数(object function)的最小值/最大值.求出一个函数最小是/最大 ...

最新文章

  1. Android 开发之Windows环境下Android Studio安装和使用教程(图文详细步骤)
  2. win10安装misql8_Win10下免安装版MySQL8.0.16的安装和配置教程图解
  3. Codeforces 1322D Reality Show (DP)
  4. extern用法详解
  5. android.os.binderproxy cannot be cast to,Android服务android.os.BinderProxy错误
  6. [系列][编译原理]正则表达式
  7. 20165318 结对编程项目-四则运算 阶段总结
  8. 解决微信小程序要求TLS版本不低于1.2问题
  9. Integer的自动装箱底层缓存原理
  10. 《程序员代码面试指南》总结
  11. 怎么删除映射网络里的计算机,如何映射网络驱动器 删除映射网络驱动器的方法...
  12. 这部纪录片带你重新认识中华神州大地,领略你不知道的中国
  13. [idea] idea导包的三种方式(导入jar包/添加库/全局库)
  14. UE4_相对于某一个Actor的夹角计算
  15. 【文字识别】OCR截图文字识别提取(无需安装)拖拽图片,打开图片,图片PDF转文字的好帮手
  16. 荧光定量PCR的优点和检测方法盘点
  17. linux如何启动网络配置文件,linux系统的网络配置教程 Ubuntu系统网络设置方法网络配置linux及Ubuntu通过修改配置文件进行网络配置...
  18. unity 使用超椭圆方程对图片进行裁切制作圆角矩形
  19. PAT乙级 C语言 1024 科学计数法
  20. 学校计算机室应该配备哪种灭火器,学校灭火器配备标准

热门文章

  1. VK Cup 2015 - Round 2 E. Correcting Mistakes —— 字符串
  2. Ubuntu 下安装类似记事本的工具Geany
  3. PaddleHub--飞桨预训练模型应用工具{风格迁移模型、词法分析情感分析、Fine-tune API微调}【一】
  4. Dissection C Chapter 4
  5. 获取微信小程序源码并进行反编译
  6. 车联网平台百万级消息吞吐架构设计
  7. 亚类划分数学建模(亚太数学建模思路持续分享)
  8. 中国的房地产,挤公交地铁的打工人,需要哆啦A梦的任意门
  9. 交通运输“十三五”成绩单出炉,公路通车里程约510万公里!
  10. 湖北经济学院大学计算机基础,大学计算机基础教学方法探讨