(GEM)Gradient Episodic Memory for Continual Learning

Abstract

GEM:减轻了遗忘,同时允许有益的知识转移到先前的任务中。

Introduction

大多数监督学习方法假设每个例子(xi,yi)都是一个来自固定概率分布P的同分布的、独立分布的的样本。

给每个例子一个标签t,令每个例子变为(xi,ti,yi),且每个例子都时满足正态分布。

这样学习者不会经历一个例子两次,且是按照顺序进行。

GEM

GEM中主要特征为一个情景记忆Mt,储存了任务t中观察到得例子。

则第k个任务得损失为:

若最小化损失再加上上述公式会导致过拟合得出现,因此将上述公式作为不等式得约束:

可以通过计算之前任务的损失梯度向量之间的角度来诊断损失的增加和建议的更新,因此将约束条件改写为

gk表示当天任务t之前得任务k得损失梯度 ,以内积得形式判断两个梯度方向是否呈锐角方向更新

建议将梯度g投影到满足所有约束最近的梯度g上,通过求解L2范数找到一个满足所有约束的梯度g替代g进行更新,则上述问题可以转化为:

在这一步,发现只需要将变换g~,令其与先前每一个向量的夹角变为锐角即可,作者将其转化为了2次规划的对偶问题进行了求解:

计算出v后,我们的g~可得:

算法原理图

总结于这两篇博客,感谢两位作者的分享:

Gradient Episodic Memory for Continual Learning 论文阅读+代码解析_编程龙的博客-CSDN博客【论文笔记】Gradient Episodic Memory for Continual Learning_疯狂的小猴子h的博客-CSDN博客

(GEM)Gradient Episodic Memory for Continual Learning论文笔记相关推荐

  1. Gradient Episodic Memory for Continual Learning 论文阅读+代码解析

    一. 介绍 在开始进行监督学习的时候我们需要收集一个训练集 D t r = { ( x i , y i ) } i = 1 n D_{tr}=\{(x_i,y_i)\}^n_{i=1} Dtr​={( ...

  2. 【论文笔记】Gradient Episodic Memory for Continual Learning

    Gradient Episodic Memory for Continual Learning(用于持续学习的梯度情景记忆) 本篇论文的贡献 创新性 Gradient of Episodic Memo ...

  3. Deep Learning论文笔记之(五)CNN卷积神经网络代码理解

    Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但 ...

  4. Deep Learning论文笔记之(八)Deep Learning最新综述

    Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...

  5. Deep Learning论文笔记之(七)深度网络高层特征可视化

    Deep Learning论文笔记之(七)深度网络高层特征可视化 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但老感 ...

  6. Deep Learning论文笔记之(六)Multi-Stage多级架构分析

    Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些 ...

  7. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现

    Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文, ...

  8. Deep Learning论文笔记之(三)单层非监督学习网络分析

    Deep Learning论文笔记之(三)单层非监督学习网络分析 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但老感 ...

  9. Deep Learning论文笔记之(二)Sparse Filtering稀疏滤波

    Deep Learning论文笔记之(二)Sparse Filtering稀疏滤波 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看 ...

最新文章

  1. 技术战“疫”,贾扬清、李飞飞要给程序员直播讲AI技术!
  2. python装什么版本-新手python用什么版本好?
  3. 排序 np_干货 | XGBoost在携程搜索排序中的应用
  4. OpenCV简单的过滤器平滑的实例(附完整代码)
  5. 程序员自家种水果,新鲜包邮配送
  6. oracle如何写循环日期自增_Oracle动态创建时间分区,以及Oracle12c中快速创建自增列...
  7. STM32的CAN过滤器详解
  8. 字体怎么转换html代码,如何设置下列html代码的字体大小和 font-family 以进行水平转换?_html_开发99编程知识库...
  9. linux双系统启动项grub,grub双系统启动顺序更改
  10. Silverlight 简明教程(3) -- 资源、样式控制、视觉状态以及部署
  11. 【有利可图网】推荐!设计师必备配色宝典!
  12. JS 如何实现获取本地文件夹名称
  13. 免费在线二维DataMatrix码生成器
  14. 微信小程序-抖音/字节小程序
  15. MySQL Server 5.7.13
  16. office修复找不到msi_Microsoft Office安装程序找不到ProPlus.WW\ProPlusWW.msi
  17. 想晋升Android架构师——学习这些核心技术够用吗?
  18. python 将List中元素两两组合
  19. 综合布线系统工程中计算机插座的标识符号是,TD是综合布线系统工程中计算机插座的标识符号。...
  20. 大道至简----多示例学习与注意力机制的巧妙结合

热门文章

  1. 软考高级信息系统项目管理师系列之七:项目整体管理
  2. 微信小程序-开发经验总结---(基础重点)
  3. 申请国外免费空间必备的免费电话:短信、语音验证不再是难题
  4. python 进化树_【ROSALIND】【练Python,学生信】48 Newick格式与进化树
  5. 华为设备配置通过管理VLAN实现远程管理设备
  6. AWS Products Services
  7. 选择云原生是企业进行技术变革的必经之路
  8. 计算机固态硬盘作用,笔记本固态硬盘有哪些作用 笔记本固态硬盘有什么用?...
  9. Manjaro修改IP地址
  10. java jxl label_jxl.write.label 方法