随着的机器学习日益重要,许多机器学习包也被人们开发出来,其中,scikit-learn是一种十分强大和广泛使用的python机器学习工具包。下面将叙述scikit-learn中常用的功能:

六大功能

Scikit-learn的基本功能主要被分为六大部分:分类(Classification),回归(Regression),聚类(Clustering),数据降维(Dimensionality reduction),模型选择(Model selection)和数据预处理(Preprocessing)。

Classification

分类是指识别给定对象的所属类别,属于监督学习的范畴,最常见的应用场景包括垃圾邮件检测和图像识别等。目前Scikit-learn已经实现的算法包括:支持向量机(SVM),最近邻,逻辑回归,随机森林,决策树以及多层感知器(MLP)神经网络等等。需要指出的是,由于Scikit-learn本身不支持深度学习,也不支持GPU加速,因此这里对于MLP的实现并不适合于处理大规模问题。

Regression

回归是指预测与给定对象相关联的连续值属性,最常见的应用场景包括预测药物反应和预测股票价格等。目前Scikit-learn已经实现的算法包括:支持向量回归(SVR),脊回归,Lasso回归,弹性网络(Elastic Net),最小角回归(LARS ),贝叶斯回归,以及各种不同的鲁棒回归算法等。可以看到,这里实现的回归算法几乎涵盖了所有开发者的需求范围,而且更重要的是,Scikit-learn还针对每种算法都提供了简单明了的用例参考。

Clustering

聚类是指自动识别具有相似属性的给定对象,并将其分组为集合,属于无监督学习的范畴,最常见的应用场景包括顾客细分和试验结果分组。目前Scikit-learn已经实现的算法包括:K-均值聚类,谱聚类,均值偏移,分层聚类,DBSCAN聚类等。

Dimensionality reduction

数据降维是指使用主成分分析(PCA)、非负矩阵分解(NMF)或特征选择等降维技术来减少要考虑的随机变量的个数,其主要应用场景包括可视化处理和效率提升。

Model selection

模型选择是指对于给定参数和模型的比较、验证和选择,其主要目的是通过参数调整来提升精度。目前Scikit-learn实现的模块包括:格点搜索,交叉验证和各种针对预测误差评估的度量函数。

Preprocessing

数据预处理是指数据的特征提取和归一化,是机器学习过程中的第一个也是最重要的一个环节。这里归一化是指将输入数据转换为具有零均值和单位权方差的新变量,但因为大多数时候都做不到精确等于零,因此会设置一个可接受的范围,一般都要求落在0-1之间。而特征提取是指将文本或图像数据转换为可用于机器学习的数字变量。需要特别注意的是,这里的特征提取与上文在数据降维中提到的特征选择非常不同。特征选择是指通过去除不变、协变或其他统计上不重要的特征量来改进机器学习的一种方法。

总结来说,Scikit-learn实现了一整套用于数据降维,模型选择,特征提取和归一化的完整算法/模块,Scikit-learn针对每个算法和模块都提供了丰富的参考样例和详细的说明文档。

scikit-learn功能大全相关推荐

  1. Scikit Learn: 在python中机器学习

    Warning 警告:有些没能理解的句子,我以自己的理解意译. 翻译自:Scikit Learn:Machine Learning in Python 作者: Fabian Pedregosa, Ga ...

  2. [转载]Scikit Learn: 在python中机器学习

    原址:http://my.oschina.net/u/175377/blog/84420 目录[-] Scikit Learn: 在python中机器学习 载入示例数据 一个改变数据集大小的示例:数码 ...

  3. 机器学习与Scikit Learn学习库

    摘要: 本文介绍机器学习相关的学习库Scikit Learn,包含其安装及具体识别手写体数字案例,适合机器学习初学者入门Scikit Learn. 在我科研的时候,机器学习(ML)是计算机科学领域中最 ...

  4. Spring Boot最新版集成邮件发送功能大全

    Spring Boot最新版集成邮件发送功能大全 前言 一.开启SMTP服务并获取授权码 二.创建Spring Boot项目 1.配置邮箱基本信息: 2.简单邮件发送: 3.发送带附件的邮件: 5.使 ...

  5. Windows 11快捷键功能大全 28个Windows 11快捷键功能介绍

    Windows 11快捷键功能大全 28个Windows 11快捷键功能介绍 1. Win+A 打开快速设置面板 2. Win+B 快速跳转系统托盘 3. Win+C 打开Microsoft Team ...

  6. python笔迹识别_python_基于Scikit learn库中KNN,SVM算法的笔迹识别

    之前我们用自己写KNN算法[网址]识别了MNIST手写识别数据 [数据下载地址] 这里介绍,如何运用Scikit learn库中的KNN,SVM算法进行笔迹识别. 数据说明: 数据共有785列,第一列 ...

  7. 华为手机日历的功能大全,赶快来试试

    华为手机上都会自带日历,方便人们查看日期和节假日,但是除了这个,你们还知道什么关于华为手机日历的隐藏功能吗?华为手机日历的功能大全,相信大多数人是不清楚的,不如看看这篇文章,get一些关于手机日历的隐 ...

  8. 用户登录查全表好还是用用户名好_白杨SEO:长尾关键词挖掘工具哪个好?5118站长工具功能大全看这...

    前言:这是白杨SEO公众号原创第175篇.经常有人问我关键词挖掘哪个工具好,怎么监控网站排名,怎么找出用户需求词等,所以今天就推荐一个SEO和新媒体从业者必备工具-5118站长工具. (上周在我的付费 ...

  9. 苹果计算机手机号隐藏功能,苹果手机隐藏功能大全

    苹果手机隐藏功能大全 其实 iPhone 本身有很多功能,不过却隐藏着在当中.下面是jy135小编收集整理的苹果手机隐藏功能大全,欢迎阅读. 首先来看看iPhone手机屏幕上操作的隐藏功能吧: 1. ...

  10. 我的世界服务器物品解绑,我的世界中国版里面各种东西的用法 物品用处功能大全...

    标签: 建筑 今天小编给大家带来我的世界中国版里面各种东西的用法,不少刚入坑的小伙伴对我的世界中国版里面的材料并不是很了解,一起去看看今天的物品用处功能大全吧~ 我的世界中国版里面各种东西的用法: N ...

最新文章

  1. android 课程——样式
  2. Java中有关Null的9件事
  3. 竹笋炒肉 I18N和L10N
  4. php两次访问时间,php – 检查当前时间是否介于两次之间,可能会有几天的时间
  5. ALV通过F4事件,实现自定义搜索帮助F4
  6. webpack入门进阶调优第一章
  7. Qt文档阅读笔记-ToolBar QML Type
  8. JAVA内存模型与线程安全
  9. 泛函编程(16)-泛函状态-Functional State
  10. 矩池云上安装yolov4 darknet
  11. Linux安装Java8
  12. Win10系统字体太小的调整设置教程
  13. 20篇聊天机器人领域必读论文速递!
  14. CSDN程序员个税服务平台“灵活家”连获8项计算机软件著作权!
  15. 计算机运行一段时间假死,电脑使用一段时间后变慢或死机(提高电脑运行速度技巧)...
  16. html解压zip文件怎么打开方式,zip文件是什么文件,如何打开zip格式的文件?
  17. 随手写的一些好用的功能(不定时更新)
  18. Datawhale集成学习笔记:熟悉机器学习的三大主要任务
  19. O2O模式发展迅速的原因 o2o模式成功的原因是什么?
  20. Smart Git Assume Unchanged

热门文章

  1. li指令 汇编_汇编语言和汇编软件
  2. PS cs6是哪一年发布的?
  3. 迅雷html什么意思,迅雷达到高速状态是什么意思?带图
  4. java中如何添加画板背景图,几何画板中如何添加背景图片
  5. oCPC实践录 | 成本优化策略之eCPC(2)
  6. mysql大于等于号
  7. 笔记本计算机在桌面显示,笔记本电脑显示桌面图标怎么样设置
  8. 光纤跳线选用指南及光模块连接方案
  9. PIC单片机提示 No valid installed HI-TECH compiler drivers
  10. SimpleFOC调参1-力矩控制