inductive 归纳,

deductive 演绎

inductive bias 经常翻译为 归纳偏好、归纳偏置

以下内容都是比较粗浅的理解和从各方收集来的加工内容,仅作增长见识。

理解一

在西瓜书中,有这样一段解释:机器学习算法在学习过程中对某种类型的偏好,称为归纳偏好(inductive bias),或简称为“偏好”。

任何一个机器学习算法必有其归纳偏好,否则它将被假设空间中看似在训练集上“等效”的假设所迷惑,而无法产生确定的学习结果。可以想象,如果没有偏好,西瓜学习算法产生的模型每次在进行预测时随机抽取的训练集上的等效假设,那么对这个新瓜而言,模型时而告诉我们它是好瓜,时而告诉我们它是坏瓜,这样显然没有意义。

例如现在一个样本集合 { x i , y i } \{x_{i},y_{i}\} {xi​,yi​},那么对样本点进行拟合的时候可能有很多条曲线,学习算法必须有某种bias,才能选出它认为正确的模型。例如模型偏好每个样本点的输出应该不一样,那么最后产生的曲线就可能比较–陡峭崎岖,认为相似的样本输出的结果应该相似,则最后曲线就比较–平缓。

归纳偏好 可以看作算法自身在一个可能很庞大的假设空间中对假设进行选择的启发式或“价值观”。有没有一般性的原则来引导算法确立正确的偏好呢?比较熟悉的**“奥卡姆剃刀”**原则是其中一个,还有许多其它原则。

没有免费的午餐定理NFL(No free launch theorem)

具体内容不在这里细说,就是说两个不同偏好的模型,经过公式推导,最后的总误差与学习算法无关,它们的期望性能相等。NFL的一个前提条件:所有“问题”出现的机会相等,或所有问题同等重要,但显然实际情况不可能这样,我们在现实中只关注自己想要解决的那个问题,找到一个解决方案,至于在其它场景下的问题我们并不关心。所以脱离具体问题,谈论算法的好坏毫无意义,学习算法自身的归纳偏置与问题是否匹配,往往就决定具体问题上模型的好坏。

理解二

参考内容:
https://analyticsindiamag.com/top-5-inductive-biases-in-deep-learning-models/
学习算法主要使用一些机制或假设,要么对假设的空间施加一些限制,要么可以说是底层的模型空间。这种机制被称为归纳偏差或学习偏差。

此机制鼓励学习算法优先处理具有特定属性的解决方案。简而言之,学习偏差或归纳偏差是机器学习算法为概括一组训练数据而做出的一组隐式或显式假设(类似于先验知识)。

在这里,列出了五个有趣的归纳偏差,没有特定的顺序,用于深度学习。

Structured Perception And Relational Reasoning

  • 结构化感知和关系推理
    https://openreview.net/pdf?id=HkxaFoC9KQ

结构化感知和关系推理是DeepMind的研究人员在2019年引入深度强化学习架构的归纳偏差。根据其研究人员的说法,该方法提高了深度RL模型的性能,学习效率,泛化和可解释性。

通过将结构化感知和关系推理引入深度强化学习架构,强化学习代理可以学习可解释的表示,并在样本复杂性、泛化能力和整体性能方面超越基线代理。这种方法还可以在满足现代人工智能中一些最具挑战性的测试环境方面提供优势。

Group Equivariance

https://arxiv.org/pdf/1602.07576.pdf

对于深度卷积网络来说,群等方差是一个好的归纳偏差。卷积神经网络中的群等方差是一种归纳偏差,有助于网络的泛化。它通过利用网络中的对称性来降低样本复杂性。阿姆斯特丹大学的研究表明,等变方程组神经网络(G-CNN)使用Group convolutions,这是一种比常规卷积层享有更高权重共享程度的层。

该层在不增加参数数量的情况下增加了卷积神经网络的表达能力。根据其研究人员的说法,组卷积层易于使用,并且可以使用–可忽略不计的计算开销–实现,用于平移,反射和旋转生成的discrete groups。

Spectral Inductive Bias

https://arxiv.org/pdf/1806.08734.pdf
频谱偏差是深度网络中的归纳偏差或学习偏差,它不仅表现在学习过程中,还表现在模型本身的参数化中。该研究由Yoshua Bengio及其团队于2019年发布。在这种偏差中,首先较低的频率被学习到。根据研究人员的说法,这种归纳偏差的属性与观察结果一致,即过度参数化网络—优先考虑学习—跨数据样本泛化的–简单模式。

Spatial Inductive Bias

具体论文https://jscholarship.library.jhu.edu/bitstream/handle/1774.2/40864/MITCHELL-DISSERTATION-2017.pdf?sequence=1&isAllowed=y
空间偏差是卷积神经网络 (CNN) 中的一种归纳偏差,它假定数据中存在某种类型的空间结构。根据其研究人员的说法,空间偏差即使在非连接主义和完全线性的模型中也很有用。这意味着,当涉及空间数据时,即使在非连接主义技术的背景下,将空间偏差应用于其他技术也应该是可能的和有益的。这种类型的偏差只需对算法进行微小的更改即可引入,并且不需要外部强加的分区。

Invariance and Equivariance Bias

https://openreview.net/pdf?id=Hkx6p6EFDr
不变性和等方差偏差可用于对关系数据的结构进行编码。这种归纳偏差会通知模型在各种变换下的行为。等变模型已成功用于对具有各种结构的数据进行各种深度学习 - 从平移等变图像到几何设置和离散对象(如集合和图形)。

解释三(未完。。)

参考论文:https://arxiv.org/pdf/1806.01261.pdf
许多博客中都讲到了这篇论文:Relational inductive biases, deep learning, and graph networks
由于内容复杂,仅仅关注第5页开始关于inductive bias的介绍部分。摘录如下:

如何理解inductive bias相关推荐

  1. 机器学习中的Inductive bias理解

    CNN的inductive bias应该是locality和spatial invariance,即空间相近的grid elements有联系而远的没有,和空间不变性(kernel权重共享) RNN的 ...

  2. inductive bias理解

    写在前面 写这个博文只是记录我现在想的,如果你好奇归纳偏置到底偏置的什么,你可以尝试去搜搜"卷积不变性"能解决你的疑惑.我接下来写的就不必看了-- 神经网络中有很多稀奇古怪的词,让 ...

  3. 归纳偏置 (Inductive Bias)

    一.概念 Inductive Bias一般翻译为归纳偏置/归纳偏差(归纳偏置应该更容易理解些),是一个关于机器学习算法的目标函数的假设.其实说的是模型的指导规则. 归纳是自然科学中常用的两大方法(归纳 ...

  4. 【机器学习】浅谈 归纳偏置 (Inductive Bias)

    目录 一.概念 二.例子 三.意义 一.概念 在机器学习中,很多学习算法经常会对学习的问题做一些关于目标函数的必要假设,称为 归纳偏置 (Inductive Bias). 归纳 (Induction) ...

  5. inductive bias:归纳偏置

    为什么卷积神经网络(CNN)相比于全连接网络(FC)往往有更好的泛化性能,尤其在图像分类任务上?通常用更好的归纳偏置(inductive bias)来解释,然而在数学上并不严格,因为足够宽的全连接网络 ...

  6. 归纳偏置/归纳偏差/inductive bias

    归纳偏置/归纳偏差/inductive bias "归纳偏差"中的"偏差"容易让人想到数据估计中估计值与真实值的差别error,会让人认为"归纳偏差& ...

  7. CNN中的Inductive bias(归纳偏置)

    归纳偏置其实就是一种先验知识,一种提前做好的假设. 在CNN中的归纳偏置一般包括两类:①locality(局部性)和②translation equivariance(平移等变性) ①  locali ...

  8. 归纳偏置是什么?从现实生活中观察到的现象中归纳出一定的规则,然后对模型做一定的约束,从而可以起到“模型选择”的作用

    归纳偏置在机器学习中是一种很微妙的概念:在机器学习中,很多学习算法经常会对学习的问题做一些假设,这些假设就称为归纳偏置(Inductive Bias). 归纳偏置这个译名可能不能很好地帮助理解,不妨拆 ...

  9. 【理论知识学习32】归纳偏差与选择性偏差(概念作用以及举例说明)

    呆呆象呆呆的所有博客目录 一.inductive bias 归纳偏置 1.1 背景与概念介绍 No-Free-Lunch (不存在免费午餐理论)提出没有先验知识进行学习是不可能的.如果我们不对特征空间 ...

最新文章

  1. UA MATH565C 随机微分方程V Markov Family的特征函数
  2. Fedora中允许mysql远程访问的几种方式
  3. 技巧/诀窍:在ASP.NET中重写URL
  4. Vue访问百度音乐API实现播放时no-referrer-when-downgrade
  5. aspectj xml
  6. ST-Link如何秒变J-link,手把手教你实现该功能
  7. 从底层重学 Java 之两大浮点类型 GitChat连接
  8. RCF - C ++的进程间通信
  9. python scrapy框架爬虫_Python Scrapy爬虫框架
  10. bigdecimal不保留小数_为什么 0.1 + 0.2 = 0.3,原来你不知道
  11. Linux 系统安装配置PHP服务(源码安装)
  12. Linux之scsi网络存储
  13. CFS 调度器数据结构篇
  14. 不要迷恋哥,哥只是个传说!
  15. 如何快速又优雅的一键保存网页
  16. 知识图谱 Freebase 的基本概念
  17. 【水哥RPA】配置水哥RPA环境变量报错的解决方法
  18. 关于zabbix中vm.memery.size监控项后的参数
  19. android网络编程案例,深入理解Android网络编程pdf 完整版
  20. 安卓android记单词软件

热门文章

  1. Lenovo/联想A628T root教程_方法
  2. Create Geometry From WKB(using NetTopologySuite)
  3. WKT、WKB和GeoJson
  4. jmockit 覆盖率配置
  5. 路由器的基本配置方法
  6. Google 大佬们为什么要开发 Go 这门新语言?
  7. 微服务架构下分布式事务解决方案——阿里云GTS
  8. idea之idea激活服务搭建
  9. ubuntu中mysql默认密码_ubuntu服务器16.04中mysql的默认密码
  10. java 校验护照_如何处理护照身份验证响应并将其显示给用户