机器学习6scikit-learn中的scaler
文章目录
- 一、scikit-learn中的scaler
- 对测试数据集如何归一化?
- 测试数据是模拟真实环境:
- 综上
- 二、演示
一、scikit-learn中的scaler
对测试数据集如何归一化?
测试数据集不能跟训练数据集归一化一样,应该把测试数据集与训练数据集归一化后的数据集进行相应的归一化,也就是(x_test-mean_train)/std_train,来得到均值归一化的结果;
测试数据是模拟真实环境:
1.真实环境很有可能无法得到所有测试数据的均值和方差;
2.对数据的归一化也是算法的一部分;
综上
我们需要保存训练数据集得到的均值和方差;
为了方便进行这一步操作,在scikit-learn中使用Scaler类进行封装
二、演示
机器学习6scikit-learn中的scaler相关推荐
- [云炬python3玩转机器学习]sklearn中的Scaler
08 Scikit-learn中的Scaler import numpy as np from sklearn import datasets import datetime print(dateti ...
- 机器学习-特征工程中的特征降维
对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...
- pandas用众数填充缺失值_【机器学习】scikit-learn中的数据预处理小结(归一化、缺失值填充、离散特征编码、连续值分箱)...
一.概述 1. 数据预处理 数据预处理是从数据中检测,修改或删除不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断. 也可 ...
- 【机器学习】解决中小微企业的信贷决策问题(一)
[机器学习]解决中小微企业的信贷决策问题(一) 文章目录 概述 问题重述 问题分析 数据预处理说明 模型假设 模型评价与推广 未完待续! 参考 概述 中小微企业对我国国民经济发展做出巨大贡献,但由于其 ...
- DL之AF:机器学习/深度学习中常用的激活函数(sigmoid、softmax等)简介、应用、计算图实现、代码实现详细攻略
DL之AF:机器学习/深度学习中常用的激活函数(sigmoid.softmax等)简介.应用.计算图实现.代码实现详细攻略 目录 激活函数(Activation functions)相关配图 各个激活 ...
- 机器学习-特征工程中的特征选择
对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...
- 机器学习-特征工程中的数据预处理
对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...
- 转载 干货 | 1400篇机器学习的文章中,这10篇是最棒的!
[导读]在过去的一个月中, 作者从近 1400 篇有关机器学习的文章中挑选了最有可能帮助职业生涯发展的 10 篇推荐给大家(入选比率为0.7%). (此前发布过多篇收藏党喜欢的文章,也是来自Mybri ...
- fritz 使用手册_Fritz对象检测指南:使用机器学习在Android中构建宠物监控应用
fritz 使用手册 by Eric Hsiao 萧敬轩 Fritz对象检测指南:使用机器学习在Android中构建宠物监控应用 (A guide to Object Detection with F ...
- 模型评价 - 机器学习与建模中怎么克服过拟合问题?
上一篇博客链接: 机器学习与建模中 - 判断数据模型拟合效果的三种方法 在上一篇博客中,我们谈到了使用损失函数来判断模型的拟合效果.但是拟合效果比较好的模型不一定是最好的模型,建模的最终目的是为了预测 ...
最新文章
- 网站前端和后台性能优化18
- OpenStack neutron中AsyncProcess类
- Python matplotlib pyplot中title() xlabel() ylabel()无法显示在中文(方框乱码)的解决办法
- linux中权限分离,linux多项目资源分离权限问题
- tornado学习笔记day05-访问数据库
- 西南交大计算机辅助制造a卷,计算机辅助制造 西南交大作业.doc
- 函数的基本知识点总结(附实例)
- 教你用好手中的McAfee 杀毒软件和McAfee 企业集中管理工具EPO
- 群晖3617可以有几个网卡_【群晖系统】黑群晖洗白13问~经典QA
- Yalmip变量操作
- Vue中minxis的使用
- OpenSSH 修复预认证双重释放漏洞
- 怎么用matlab求特征向量,MATLAB用eig()函数求【特征值】【特征向量】【归一化
- SpringBoot 实现国际化 SpringBoot配置国际化 SpringBoot 国际化 springboot实现国际化 springboot配置国际化 springboot国际化代码实现
- idea启动报符号缺失,无法启动与构建
- Linux(CS-Notes)
- 简历被公司浏览分布图-来自前程无忧
- 最新WIN_GHO系统(及OFC_PS8_FASH8_PY练习题)
- 移动电源充电宝新国标GB/T 35590-2017检测报告测试项目
- Python的@装饰器是干什么用的?