plt.scatter(X2[:,0],X2[:,1])

plt.show()

计算其均值/方差

np.mean(X2[:,0])

np.std(X2[:,1])

1.4 Sklearn中的归一化

首先我们来看一个在实际使用归一化时的一个小陷阱。

我们在建模时要将数据集划分为训练数据集&测试数据集。

训练数据集进行归一化处理,需要计算出训练数据集的均值mean_train和方差std_train。

问题是:我们在对测试数据集进行归一化时,要计算测试数据的均值和方差么?

答案是否定的。在对测试数据集进行归一化时,仍然要使用训练数据集的均值train_mean和方差std_train。这是因为测试数据是模拟的真实环境,真实环境中可能无法得到均值和方差,对数据进行归一化。只能够使用公式(x_test - mean_train) / std_train

因此我们要保存训练数据集中得到的均值和方差。

在sklearn中专门的用来数据归一化的方法:StandardScaler。

下面我们加载鸢尾花数据集

import numpy as npfrom sklearn import datasetsfrom sklearn.model_selection import train_test_split

iris = datasets.load_iris()

X = iris.data

y = iris.target

X_train,X_test,y_train,y_test = train_test_split(iris.data,iris.target,test_size=0.2,random_state=666)

使用数据归一化的方法:

from sklearn.preprocessing import StandardScaler

standardScaler = StandardScaler()# 归一化的过程跟训练模型一样standardScaler.fit(X_train)

standardScaler.mean_

standardScaler.scale_ # 表述数据分布范围的变量,替代std_# 使用transformX_train_standard = standardScaler.transform(X_train)

X_test_standard = standardScaler.transform(

机器学习的敲门砖:kNN算法(下相关推荐

  1. 算法代码[置顶] 机器学习实战之KNN算法详解

    改章节笔者在深圳喝咖啡的时候突然想到的...之前就有想写几篇关于算法代码的文章,所以回家到以后就奋笔疾书的写出来发表了     前一段时间介绍了Kmeans聚类,而KNN这个算法刚好是聚类以后经常使用 ...

  2. 【机器学习实战】KNN算法

    机器学习作为人工智能的重要分支,同时也是数据挖掘中不可或缺的算法支撑.本人接触时间不短,但研究尚浅.我计划用python来实现机器学习中较为常见的算法. 看透了自己,便无须小看别人. (老舍) 机器学 ...

  3. 机器学习:基于Knn算法的用户属性判断方案设计

    本文作者通过Knn算法进行了一次用户判断预测的流程,文章为作者根据自身经验所做出的总结,希望通过此文能够加深你对Knn算法的认识. knn算法简介 K最近邻(k-Nearest Neighbor,KN ...

  4. 《机器学习实战》kNN算法及约会网站代码详解

    使用kNN算法进行分类的原理是:从训练集中选出离待分类点最近的kkk个点,在这kkk个点中所占比重最大的分类即为该点所在的分类.通常kkk不超过202020 kNN算法步骤: 计算数据集中的点与待分类 ...

  5. 【机器学习实战】KNN算法的两个经典例子(电影类型判断,约会网站的改进)

    KNN算法的两个常用实际例子 一.使用K-邻近算法来对电影的类型进行判断 1.实验思路: 2.代码实现: 3.运行截图: 4.完整代码展示: 二.在约会网站上使用KNN算法 (一)准备数据:从文本文件 ...

  6. 机器学习 手写KNN算法预测城市空气质量

    文章目录 一.KNN算法简介 二.KNN算法实现思路 三.KNN算法预测城市空气质量 1. 获取数据 2. 生成测试集和训练集 3. 实现KNN算法 一.KNN算法简介 KNN(K-Nearest N ...

  7. 机器学习笔记(5) KNN算法

    这篇其实应该作为机器学习的第一篇笔记的,但是在刚开始学习的时候,我还没有用博客记录笔记的打算.所以也就想到哪写到哪了. 你在网上搜索机器学习系列文章的话,大部分都是以KNN(k nearest nei ...

  8. 机器学习Sklearn实战——KNN算法

    KNN鸢尾花分类 import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier from skl ...

  9. 《机器学习实战》KNN算法实现

    本系列都是参考<机器学习实战>这本书,只对学习过程一个记录,不做详细的描述! 注释:看了一段时间Ng的机器学习视频,感觉不能光看不练,现在一边练习再一边去学习理论! KNN很早就之前就看过 ...

  10. Scikit-Learn机器学习(knn算法)

    前言 博观而约取,厚积而薄发 本文中回忆了python的类概念,机器学习需要用到的环境,以及什么是Scikit-Learn 目的是方便博主进行回忆 记忆学习 和总结 如果能帮助到大家 那就更好了 Py ...

最新文章

  1. c语言程序设计A课程试,自学考试有关论文范文,与C语言程序设计A课程辅导相关硕士毕业论文范文...
  2. oracle每一行的hash值,Hash分区表分区数与数据分布的测试
  3. Fatal error: Call to undefined function gmp_strval() XAMPP 1.7.4 缺少php_gmp.dll
  4. C#与matlab混合编程
  5. ModelCoder中的超密时间模型
  6. oracle数据库cp命令,Oracle数据库备份与恢复(I)
  7. MAVEN项目的搭建
  8. struts2 tag if NumberFormatException
  9. linux 一键网克,MaxDOS 8.0
  10. 输出英文字母ch在英文字母表中的位置
  11. 产品读书《数据产品经理必修课:从零经验到令人惊艳》别读了!!!
  12. Android手机应用CTA认证自测
  13. 医疗his系统值不值得投入使用
  14. appium重启报错:Could not proxy command to the remote server. Original error: socket hang up
  15. linux oracle ins 30131,Oracle安装报错:[INS-30131]Oracle Database Configuration Assistant
  16. 注册表计算机性能设置怎么应用,教你几招怎么玩注册表
  17. 计算机控制实验室装置,新型自控原理/计算机控制多功能实验装置
  18. 中科院计算所培训中心二季度公开课安排
  19. 新生代垃圾回收器和老生代垃圾回收器
  20. ROS2源码快捷下载的办法

热门文章

  1. 让世界最速开发成为可能!承担《生化危机7》开发任务的卡普空新引擎RE ENGINE(1)...
  2. 阿里视觉AI训练营-day04-作业日-车辆保险应用
  3. XTW100编程器在Win10下的安装
  4. how to pase JSON in Swift
  5. 生活随记-老师的小确幸
  6. 计算机工程师属于什么职积,阿里巴巴JAVA工程师面试经验
  7. 虚拟现实VR与增强现实AR的未来
  8. iOS 获取当前APP名称版本手机型号
  9. 面试题 01.02. 判定是否互为字符重排
  10. 5G为智能工厂带来什么商机?让您一看就清楚!!