文章目录

  • 一、scikit-learn中的scaler
    • 对测试数据集如何归一化?
    • 测试数据是模拟真实环境:
    • 综上
  • 二、演示

一、scikit-learn中的scaler

对测试数据集如何归一化?

测试数据集不能跟训练数据集归一化一样,应该把测试数据集与训练数据集归一化后的数据集进行相应的归一化,也就是(x_test-mean_train)/std_train,来得到均值归一化的结果;

测试数据是模拟真实环境:

1.真实环境很有可能无法得到所有测试数据的均值和方差;
2.对数据的归一化也是算法的一部分;

综上

我们需要保存训练数据集得到的均值和方差;
为了方便进行这一步操作,在scikit-learn中使用Scaler类进行封装

二、演示




机器学习6scikit-learn中的scaler相关推荐

  1. [云炬python3玩转机器学习]sklearn中的Scaler

    08 Scikit-learn中的Scaler import numpy as np from sklearn import datasets import datetime print(dateti ...

  2. 机器学习-特征工程中的特征降维

    对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...

  3. pandas用众数填充缺失值_【机器学习】scikit-learn中的数据预处理小结(归一化、缺失值填充、离散特征编码、连续值分箱)...

    一.概述 1. 数据预处理 数据预处理是从数据中检测,修改或删除不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断. 也可 ...

  4. 【机器学习】解决中小微企业的信贷决策问题(一)

    [机器学习]解决中小微企业的信贷决策问题(一) 文章目录 概述 问题重述 问题分析 数据预处理说明 模型假设 模型评价与推广 未完待续! 参考 概述 中小微企业对我国国民经济发展做出巨大贡献,但由于其 ...

  5. DL之AF:机器学习/深度学习中常用的激活函数(sigmoid、softmax等)简介、应用、计算图实现、代码实现详细攻略

    DL之AF:机器学习/深度学习中常用的激活函数(sigmoid.softmax等)简介.应用.计算图实现.代码实现详细攻略 目录 激活函数(Activation functions)相关配图 各个激活 ...

  6. 机器学习-特征工程中的特征选择

    对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...

  7. 机器学习-特征工程中的数据预处理

    对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...

  8. 转载 干货 | 1400篇机器学习的文章中,这10篇是最棒的!

    [导读]在过去的一个月中, 作者从近 1400 篇有关机器学习的文章中挑选了最有可能帮助职业生涯发展的 10 篇推荐给大家(入选比率为0.7%). (此前发布过多篇收藏党喜欢的文章,也是来自Mybri ...

  9. fritz 使用手册_Fritz对象检测指南:使用机器学习在Android中构建宠物监控应用

    fritz 使用手册 by Eric Hsiao 萧敬轩 Fritz对象检测指南:使用机器学习在Android中构建宠物监控应用 (A guide to Object Detection with F ...

  10. 模型评价 - 机器学习与建模中怎么克服过拟合问题?

    上一篇博客链接: 机器学习与建模中 - 判断数据模型拟合效果的三种方法 在上一篇博客中,我们谈到了使用损失函数来判断模型的拟合效果.但是拟合效果比较好的模型不一定是最好的模型,建模的最终目的是为了预测 ...

最新文章

  1. 网站前端和后台性能优化18
  2. OpenStack neutron中AsyncProcess类
  3. Python matplotlib pyplot中title() xlabel() ylabel()无法显示在中文(方框乱码)的解决办法
  4. linux中权限分离,linux多项目资源分离权限问题
  5. tornado学习笔记day05-访问数据库
  6. 西南交大计算机辅助制造a卷,计算机辅助制造 西南交大作业.doc
  7. 函数的基本知识点总结(附实例)
  8. 教你用好手中的McAfee 杀毒软件和McAfee 企业集中管理工具EPO
  9. 群晖3617可以有几个网卡_【群晖系统】黑群晖洗白13问~经典QA
  10. Yalmip变量操作
  11. Vue中minxis的使用
  12. OpenSSH 修复预认证双重释放漏洞
  13. 怎么用matlab求特征向量,MATLAB用eig()函数求【特征值】【特征向量】【归一化
  14. SpringBoot 实现国际化 SpringBoot配置国际化 SpringBoot 国际化 springboot实现国际化 springboot配置国际化 springboot国际化代码实现
  15. idea启动报符号缺失,无法启动与构建
  16. Linux(CS-Notes)
  17. 简历被公司浏览分布图-来自前程无忧
  18. 最新WIN_GHO系统(及OFC_PS8_FASH8_PY练习题)
  19. 移动电源充电宝新国标GB/T 35590-2017检测报告测试项目
  20. Python的@装饰器是干什么用的?

热门文章

  1. linux下登录不上oracle,Oracle特定用户登录失败案例 ORA-20001
  2. 马太效应 (两极分化现象)
  3. 批量下载npm离线安装包
  4. 【模拟器】Android Studio模拟器运行自己的编译的Android源码镜像
  5. 若邻网络结盟职友集,共创人脉网络与职位搜索结合的求职新模式
  6. SSH攻击ip列表【不定时更新】
  7. 社会学概论试题库【1】
  8. openbsd mysql_使用OpenBSD一年的总结
  9. 无监督降维 效果评价 trustworthiness measure
  10. cocos 微信登陆失败(笔记)