泛化

过拟合

将模型在训练数据上拟合得⽐在潜在分布中更接近的现象称为过拟合(overfitting),⽤于对抗过拟合的技术 称为正则化(regularization)。

训练误差和泛化误差

训练误差(training error)是指,我们的模 型在训练数据集上计算得到的误差。泛化误差(generalization error)是指,当我们将模型应⽤在同样从原 始样本的分布中抽取的⽆限多的数据样本时,我们模型误差的期望。

独立同分布假设

模型复杂性

当我们有更复杂的模型和更少的 样本时,我们预计训练误差会下降,但泛化误差会增⼤。

影响泛化的因素

  1. 可调整参数的数量。当可调整参数的数量(有时称为⾃由度)很⼤时,模型往往更容易过拟合。
  2. 参数采⽤的值。当权重的取值范围较⼤时,模型可能更容易过拟合。
  3. 训练样本的数量。即使你的模型很简单,也很容易过拟合只包含⼀两个样本的数据集。而过拟合⼀个有 数百万个样本的数据集则需要⼀个极其灵活的模型。

K折交叉验证

欠拟合和过拟合

训练误差和验证误差都很严重,如果模型不能降低训练误差,则欠拟合

当我们的训练误差明显低于验证误差,则过拟合

数据集大小

越多的数据,越能拟合一个更复杂的模型,复杂的模型可能是有益的,但如果没有足够的数据,简单的模型可能更有用

关于深度学习中泛化的几个概念相关推荐

  1. 深度学习中epoch,batch的概念--笔记

    深度学习中epoch,batch的概念 batch.epoch和iteration是深度学习中几个常见的超参数. (1) batch_ size: 每批数据量的大小.DL通常用SGD的优化算法进行训练 ...

  2. 深度学习中的一些术语和概念

    全连接的前馈神经网络 CNN(Convolutional Neural Network)--卷积神经网络,通常用于图像数据 RNN(Recurrent Neural Network)--循环神经网络递 ...

  3. 深度学习(2)--深度学习中的这25个概念

    神经网络基础 1)神经元(Neuron)--就像形成我们大脑基本元素的神经元一样,神经元形成神经网络的基本结构.想象一下,当我们得到新信息时我们该怎么做.当我们获取信息时,我们一般会处理它,然后生成一 ...

  4. 深度学习中的Lipschitz约束:泛化与生成模型

    作者丨苏剑林 单位丨广州火焰信息科技有限公司 研究方向丨NLP,神经网络 个人主页丨kexue.fm 去年写过一篇 WGAN-GP 的入门读物互怼的艺术:从零直达WGAN-GP,提到通过梯度惩罚来为 ...

  5. 深度学习中的一些英文解释

    A: (1)anchors:锚点.(anchors(锚点)定义在RPN网络中) B: (1)bounding box:预测边界框. (2)Botton-up 3D proposal generatio ...

  6. 深度学习中的优化算法之MBGD

    之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降,常见的梯度下降有三种形式:BGD.SGD.MBGD,它们的 ...

  7. 深度学习中的优化简介

    深度学习算法在许多情况下都涉及到优化. 1. 学习和纯优化有什么不同 在大多数机器学习问题中,我们关注某些性能度量P,其定义于测试集上并且可能是不可解的.因此,我们只是间接地优化P.我们系统通过降低代 ...

  8. 一文读懂深度学习中的各种卷积

    来源|机器之心 我们都知道卷积的重要性,但你知道深度学习领域的卷积究竟是什么,又有多少种类吗?研究学者 Kunlun Bai 发布了一篇介绍深度学习的卷积文章,用浅显易懂的方式介绍了深度学习领域的各种 ...

  9. 卷积有多少种?一文读懂深度学习中的各种卷积

    点击上方"视学算法",选择"星标"公众号 精选作品,第一时间送达 本文选自towardsdatascience 作者:Kunlun Bai 公众号机器之心整理 ...

最新文章

  1. PTA团体程序设计天梯赛-L2-024 部落
  2. html网络,HTML—构建网络
  3. 查看MySQL数据库表的命令介绍
  4. ubantu java编辑器_Linux Ubuntu中最好的代码编辑器 程序员都这么看吗?
  5. AspNet2.0页面生命周期
  6. 第七节:框架搭建之页面静态化的剖析
  7. flash动画制作常用代码
  8. spring电子书_不懂Spring就彻底放Java吧
  9. 关于golden gate director client的一点点使用总结
  10. 【MLNLP顶会论文发表总榜】谷歌最狂,清北入前十,周明、张岳、刘挺华人前三,中美差距何止一点点!...
  11. 斗鱼基于etcd和ZooKeeper的注册中心实践案例
  12. Win10兼容性怎么设置详细的步骤
  13. PHP随机生成英文大小写
  14. 软件测试入门全流程精华总结【必看 知识点很全】
  15. 获得Oracle ACE称号
  16. 简单并查集-加边的无向图
  17. es拼音分词 大帅哥_elasticsearch 拼音+ik分词,spring data elasticsearch 拼音分词
  18. 深入理解pytorch分布式并行处理工具DDP——从工程实战中的bug说起
  19. 前端开发必备之MDN(API查阅文档)
  20. Linux驱动学习之什么是驱动?

热门文章

  1. Android 使用Lottie的三个小技巧
  2. [论文阅读笔记]Evading Defenses to Transferable Adversarial Examples by Translation-Invariant Attacks(CVPR)
  3. Matplotlib指令之折线图散点图
  4. 麦肯锡:未来10年中国半导体企业有望实现全球领先
  5. 两个PDF比较标出差异_如何把两个pdf合成一个?在线就能免费合并!
  6. vue组件之间传值几种方法
  7. [vue]Extraneous non-emits event listeners (x) were passed to component but could not be automatica
  8. 竞品分析:抖音搜索VS快手搜索
  9. SQLSTATE 问题分析及解决·第四话
  10. 用 Python 爬取 500 条豆瓣影评,看看《蚁人2》是否有看点?