看了沐神的讲解,恍然大悟,b站可以不刷,但沐神一定要看。


在统计模型中,通过方差和偏差来衡量一个模型。

1 方差和偏差的概念

偏差(Bias):预测值和真实值之间的误差
方差(Variance):预测值之间的离散程度,也就是离其期望值的距离。方差越大,数据的分布越分散。

2 均方误差(Mean-Square error,MSE)

在统计模型评价中时,评价一个点估计的坏时,通常使用点估计y^\hat{y}y^​和参数真值yyy的距离,最常用的函数是距离的平方,由于估计量y^\hat{y}y^​具有随机性,每次采样的点都不一样,所以可以对该函数求期望,即表示在不同的采样点下具有的误差,这就是下式给出的均方误差:


以上就得到了均方差是由偏差、方差和数据本身的噪音的组合。

3 偏差—方差均衡(Tradeoff)

对于样本数据,如果选择的模型过于简单,学不到很多信息,此时模型的预测值和真实值误差很大,也就是偏差很大,随着模型的复杂度提升,学到的信息也越来越多,使得偏差逐渐降低。

同样的,随着模型复杂的提升,数据相对模型而言变得简单,使得模型学到了更多的数据噪音,方差也就越来越大。

泛化误差=数据本身噪声+偏差+方差\color{red}泛化误差=数据本身噪声+偏差+方差泛化误差=数据本身噪声+偏差+方差

如下图蓝线,所以需要在中间位置找到一个合适的模型复杂度,使得泛化误差尽可能地小。过于简单导致欠拟合,过于复杂导致过拟合。

这也就是我们常说的训练误差随着模型复杂度地提升而降低,而泛化误差会逐渐增大。训练误差更多和偏差相关,偏差越小,模型就越能拟合训练数据。


3 降低偏差和方差

对于偏差,偏差过高是由于模型地复杂度不够,所以通过增加模型复杂度来降低bias,比如在神经网络中,增加模型层数和隐藏神经元个数。也可以他通过集成学习地方法来,比如Boosting。关于集成学习的文章

对于方差,方差过高是由于模型过于复杂,通过降低模型地复杂度来实现。比如加入正则来限制参数的学习范围,使得方差降低。集中方法中的Bagging也可以降低方差。

对于σ2\sigma^2σ2,该项主要是由于数据本身的噪声产生,虽然在统计学里面,该项不可降低。但在实际中,可以通过改善数据来降低噪音。


从方差和偏差角度解读Boosting和Bagging

通俗易懂方差(Variance)和偏差(Bias)相关推荐

  1. 偏差(bias)、方差(variance)和噪音(noise)

    对于一个预测问题,若真实模型为f(x)f(\boldsymbol{x})f(x). 通常我们通过对特定的数据集D=(x1,y1),(x2,y2),-,(xn,yn)D = {(\boldsymbol{ ...

  2. 吴恩达神经网络和深度学习-学习笔记-6-训练集、验证集和测试集 + 偏差bias和方差variance

    寻找最优超参数是一个迭代过程 在今天,应用深度学习是一个典型的迭代过程. 创建高质量的训练数据集.验证集和测试集,有助于提高循环效率. 训练集.验证集和测试集 数据Data分为三部分: 训练集trai ...

  3. 偏差bias与方差variance

    目录 1 含义 1.1 偏差 1.2 偏差和方差 2 期望泛化误差公式推导 3 权衡偏差与方差: 4 解决高偏差与高方差 参考 学习算法的预测误差, 或者说泛化误差(generalization er ...

  4. 误差error,偏置bias,方差variance的见解

    更新日志:2020-3-10 谢谢@ProQianXiao的指正.偏差-方差的确是在测试集中进行的. 之前的误解是,偏差和方差的计算是同一个模型对不同样本的预测结果的偏差和方差:而实际上是不同模型对同 ...

  5. C语言实现方差variance计算(附完整源码)

    实现方差variance计算 实现方差variance计算的完整源码(实现,main函数测试) 实现方差variance计算的完整源码(实现,main函数测试) #include <math.h ...

  6. 协方差(covariance)与方差(variance)的对比

    协方差(covariance)与方差(variance)的对比 标准差( standard deviation): x=∑i=0n(X−X¯¯¯¯)2n−1−−−−−−−−−√x=∑i=0n(X−X¯ ...

  7. 偏差(Bias)与方差(Variance)详解

    偏差与方差详解 1 问题背景 2 一点点数学 3 偏差与期望 4 偏差方差窘境 5 Bagging与Boosting 1 问题背景  NFL(No Free Lunch Theorem)告诉我们选择算 ...

  8. Bias vs. Variance(1)--diagnosing bias vs. variance

    我们的函数是有high bias problem(underfitting problem)还是 high variance problem(overfitting problem),区分它们很得要, ...

  9. 最大似然估计的缺陷 —— 方差和均值的 bias

    0. 均匀分布期望的最大似然估计 首先我们来看,如何通过最大似然估计的形式估计均匀分布的期望.均匀分布的概率密度函数为:f(x|θ)=1θ,0≤x≤θf(x|\theta)=\frac1{\theta ...

最新文章

  1. 【爬虫】使用xpath与lxml移除特定标签
  2. openssl生成https证书
  3. 什么是Terraform?
  4. Surf特征提取分析
  5. java okhttp包的类特点
  6. 怎么在github上下载项目_Github上Top20 Python与机器学习开源项目汇总
  7. win7下DS、KS、ASIO、WASAPI输出比较
  8. 循序渐进学.Net Core Web Api开发系列【7】:项目发布到CentOS7
  9. 大型论坛系统环境搭建(20万日IP负载平衡实战)–Nginx+Apache2+PHP+MySQL
  10. python生成随机imei
  11. 平面变压器的设计(翻译)(4)
  12. Unity 大面积花草风吹动效果以及编辑
  13. Charles抓取https请求及常见问题解决
  14. 论文页码不连续?经常改不对?教你一招立马解决
  15. 美丽世界的另一面!(请保护好你身边的亲朋好友)
  16. Cloakroom BZOJ2794 POI2012(背包问题)
  17. [11] 微信公众帐号开发教程第11篇-符号表情的发送(上)
  18. 使用朋也社区搭建自己的社区网站就是这么简单~~
  19. java中protect是什么_Java中public、private、protecte、default、public void是什么意思 | 学步园...
  20. 跑批利器--SpringBatch框架

热门文章

  1. 关于AIR724UG接入TLINK云平台(未完成)
  2. start和run的区别
  3. 转载自https://blog.csdn.net/weixin_43793782/article/details/97308393
  4. GDC - 《幽灵行动:荒野》地形技术和工具(二)
  5. python培训班南京-南京python培训机构排名_南京python培训
  6. 回归分析(三)二项逻辑斯蒂回归模型
  7. Slowfast环境配置问题 | 安装PyAV报错An error occurred while installing package ‘conda-forge::olefile-0.46-pyh9f
  8. RocketMQ—Producer(二)路由动态更新
  9. MQTT发布订阅和取消订阅
  10. 黑盒测试的概念及测试方法