一、综述
  最近由于交流的需要,读了几篇关于Domain adaptation的文章,其中一种名叫Domain generalization的技术引起了我的注意,这种技术可以在target domain未知的情况下训练出分类器而且性能还相当不错,下面就对这种技术进行一下简单的介绍。

二、迁移学习
  提到Domain adaptation,就不得不提到迁移学习(transfer learning),按照我的理解,Domain adaptation算是迁移学习中的一种特殊算法,在介绍Domain adaptation之前,先对迁移学习进行简单的介绍。 
  迁移学习出现的背景如下:在一些新兴领域很难得到我们需要的大量的训练数据,另外,传统的机器学习需要对每个领域都标定大量训练数据,这将会耗费大量的人力与物力。而迁移学习的目标是将从一个环境中学到的知识用来帮助新环境中的学习任务。因此,相对于传统的机器学习假设训练数据与测试数据服从相同的数据分布,迁移学习不会像传统机器学习那样作同分布假设。 
  迁移学习是指一个学习算法可以利用不同学习任务之间的共性来共享统计的优点和在任务间迁移知识。传统的机器学习假设训练数据与测试数据服从相同的数据分布。如果我们有了大量的、在不同分布下的训练数据,完全丢弃这些数据也是非常浪费的。如何合理的利用这些数据就是迁移学习主要解决的问题。迁移学习可以从现有的数据中迁移知识,用来帮助将来的学习。

三、Domain adaptation
  Domain adaptation中文名称是域自适应学习,可以有效处理训练数据与测试数据具有不同分布的问题。拿经典的垃圾邮件分类问题来说,分类器是在某个用户的邮箱数据上训练完成的,再将分类器用到另一个与训练用户邮箱中的邮件内容很大程度上不相关的另一个用户的邮件上面,就可以用域自适应学习来解决。再介绍Domain adaptation中的两个概念:source domain 和 target domain;中文名称是源域和目标域,分别对应于普通机器学习任务的训练集和测试集。下面引用自动化学报《域自适应学习研究进展》这篇文章对域自适应学习的描述:

  域自适应学习能够有效地解决训练样本和测试样本概率分布不一致的学习问题, 作为机器学习新出现的研究领域在近几年受到了广泛的关注。传统的机器学习算法中, 通常假设训练样本和测试样本来自同一概率分布, 然后设计相应的模型和判别准则对待测试的样例的输出进行预测.。但是实际上当前很多学习场景下训练样本的概率分布和测试样本的概率分布是不同的, 例如如何根据老用户的邮件信息设计一种面向新用户的垃圾邮件过滤系统、自然语言处理方面的情感分析、依存句法分析、跨语言处理等都属于域自适应学习问题.。如何在这种源域和目标域概率分布不一致的情况下进行学习即为域自适应学习问题。 因此, 域自适应学习的重点在于如何克服源域分布和目标域分布不同, 实现目标域上的学习任务。

四、Domain generalization
  终于进入到我们的正题 domain generalization了,domain generalization是domain adaptation中的一种特殊的技术,其目的是基于domain adaptation技术学习对于任何不可见的target domain的具有很强鲁棒性的分类器。所谓不可见的target domain是指在分类器的训练过程中,我们并不知道target domain的任何情况。与传统的机器学习方法不同,由于目标域和源域是具有不同的概率分布的,如果在训练过程中我们无法获得目标域的任何信息就代表着训练出的分类器可能无法在目标域上取得良好的表现,而在现实应用中,目标域往往是不可知的,在这种背景下domain generalization应运而生。 
  从其目的上看,这项技术有两个主要的难点:1.目标域不可见 2.要对任何目标域都起作用。按照我个人的理解,第二项难点中的“任何”二字应该还是有局限的,比如说源域为图像分类任务,目标域应该也和图像分类有关而不能是自然语言理解之类的任务,所以在这里的“任何”并不是广义上的任何。在这个层面上来讲,我们剩下的难点就可以融合成一个,即目标域不可知。 
  目前成熟的domain generalization方法基本可以分为三类,分别是: 
  1.feature-based method [1,2,3,4,5] 
  2.classifier-based method [6,7,8,9,10] 
  3.instance-reweighting method 
  在第一类方法中,主要通过设计跨域不变特征来实现domain generalization;第二类方法往往是针对每个数据集也就是源域中的每一个子域对子分类器进行设计,然后将子分类器结合成一个融合分类器来实现domain generalization;最后一类方法我不是很了解,有想深入了解的读者可以读一下《Correcting sample selection bias by unlabeled data》这篇文章。

原文:https://blog.csdn.net/qrlhl/article/details/51119973

Domain generalization相关推荐

  1. 一篇综述带你全面了解迁移学习的领域泛化(Domain Generalization)

    领域泛化 (Domain Generalization, DG) 是近几年非常热门的一个研究方向.它研究的问题是从若干个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在 未知 (Un ...

  2. 如何通过Meta Learning实现域泛化(Domain Generalization)?

    ©作者 | 丘明姗 单位 | 华南理工大学 研究方向 | 领域泛化 域泛化(Domain Generalization)中有很多工作是用 meta learning 做的.Meta learning ...

  3. Domain Generalization数据集整理

    目录 一.引言 二.Datasets 1.PACS 2. Office-Home 3. VLCS 4.TerraIncognita (subset) 5.DomainNet 一.引言 自从Domain ...

  4. 领域泛化(Domain Generalization)

    文章目录 前言 问题定义 理论 方法 应用与数据集 未来挑战 参考 前言 领域泛化 (Domain Generalization, DG) 是近几年非常热门的一个研究方向.它研究的问题是从若干个具有不 ...

  5. 从ICML 2022看域泛化(Domain Generalization)最新进展

    ©PaperWeekly 原创 · 作者 | 张一帆 单位 | 中科院自动化所博士生 研究方向 | 计算机视觉 Domain Generalization(DG:域泛化)一直以来都是各大顶会的热门研究 ...

  6. Domain generalization 简介

    一.综述 最近由于交流的需要,读了几篇关于Domain adaptation的文章,其中一种名叫Domain generalization的技术引起了我的注意,这种技术可以在target domain ...

  7. Generalizing to Unseen Domains: A Survey on Domain Generalization 论文分享

    这篇论文应该是领域泛化领域第一篇综述,楼主花了些时间较为仔细的读了一下,写了这篇笔记 1.理论分析(论文所有的分析都基于二分类问题,分析工具会用到VC维) Domain Adaptation中的err ...

  8. 【领域泛化论文阅读】Generalizing to Unseen Domains: A Survey on Domain Generalization

    传统的机器学习是假设训练数据和测试数据独立同分布进行训练的,当训练数据和测试数据的分布不同,也就是域分布不同时,模型的性能将大大下降.而迁移学习是在训练数据和测试数据服从不同的数据的概率分布时,提高模 ...

  9. Domain Generalization by Solving Jigsaw Puzzles----论文翻译

    目录 Abstract Introduction The JiGen Approach Extension to Unsupervised Domain Adaptation Implementati ...

  10. Domain adaptation 与 Domain generalization

    一.Domain adaptation (DA) 1. 基本介绍 1. 什么是domain?: 一堆数据服从相同的分布. 2. Domain adaptation 研究的问题 给了一个training ...

最新文章

  1. 数据备份基础之备份类型
  2. iOS实现基于VLC播放器的封装效果
  3. 插入排序法算长度为10的数组
  4. ubuntu系统如何切换到root用户登录
  5. Ubuntu + pip + Python3 + CPU版本 PaddlePaddle 安装
  6. 前端学习(553):node实现登录和注册第一部分代码
  7. Java 判断字符串的存储长度
  8. 打砖块游戏c语言设计,打砖块游戏的源代码(请多指教)
  9. 解析Pinterest:兴趣乐园背后的大文章
  10. ARP协议具体解释之Gratuitous ARP(免费ARP)
  11. activiti流程定义的部署
  12. 环回测试能够提供什么信息_以太网测试仪的主要功能有哪些?
  13. 达梦数据库存储过程调用
  14. 简述RedHat 7 Linux系统
  15. Linux内核配置之Kconfig
  16. C#: 数字经纬度和度分秒经纬度间的转换
  17. 南开大学2019年数学分析考研试题
  18. 如何在win10上显示隐藏文件
  19. 为什么SEM竞价推广效果越来越差?
  20. 傅里叶变换经滤波处理及傅里叶逆变换

热门文章

  1. uboot启动时间优化
  2. Keychron K3 Pro键盘测评
  3. R语言根据日历周期处理时间序列数据(周、月、年等):使用xts包的apply.monthly函数和mean函数计算时间序列的月平均值(monthly)
  4. android启动界面修改工具,安卓 软件界面修改 修改安卓启动界面
  5. 基于HTML CANVAS和EXCEL的XLSx文件的财务报表展示、打印
  6. turbolinux mysql 5.0 cluste_--mysql 5.0 集群负载均衡—经过测试
  7. Docker之漫漫人生路
  8. 进击 !!第二章 JAVA编程基础
  9. (复习)android 调用系统相机 图库 裁剪-图片上传-客服端-服务器
  10. 为什么我们需要monad?