点击上方,选择星标,每天给你送干货!


作者丨赵俊博 Jake、杨朔、ICOZ

来源丨知乎问答

编辑丨极市平台

导读

2020年小样本学习可谓如火如荼,可是顶会论文却越看越懵,2020年到2021年初,小样本学习有里程碑意义的成果吗?

# 回答一

作者:赵俊博 Jake

浙江大学 / NYU AI博士 / ex-Facebook

来源链接:

https://www.zhihu.com/question/439865186/answer/1734654426

现有的小样本学习的benchmark和数据集,基本围绕在实现AGI这个目标上面。

以Lake et al.开发的omniglot为例,通过小样本学习来实现复杂象形文字的识别。但是说真的,这东西我们人看上去都不知道是什么 — 它距离实际应用有点远。

其实在工业界中真正有意义的小样本学习场景有很多。

我举个例子。在化学反应这个场景下,专业人员的最终目标是提升某种产物的产率。这里面的搜索空间的关键变量包括各种反应物,反应物的质量,催化剂,反应条件(包括湿度、温度等等)。而可用的数据是多少呢?可能是零。

你不要以为我在开玩笑,正经的应用其实数据就是零。在工程实施的环节,一般的流程是专家通过实验的方式积累一些数据,可能也就几十个。有意义的人工智能这里要做的是用过这几十个数据,对剩余的搜索空间进行一个搜索(其他的反应物、催化条件、反应条件等)。如果说搜索空间最终的高产率是个很小的子空间,那么初期的数据往往是低产率的数据。之后通过模型推荐出来的组合之后再做一批实验,之后融入到训练集里,反复上个流程。

这里就有了个非常有意思的小样本学习的问题,如何用产率很小的数据来预测高产率的反应组合?或者是这里的训练集是有偏的,它们的产率往往很小,距离最终的最优子空间的距离很远。

我没有谈要用什么方法来做这个,不管是监督学习(分类啊 回归啊啥的),还是元学习(maml啊之类的),或者其他的什么方法。这些暂时还不是那么重要。

可能在我们这个bubble里面,我们已经习惯了那种反馈很快的环境(比如说alphago,模拟一遍就出来结果了)。在这个场景下,一批数据的获取可能要花上几天甚至几周的时间。类似于这种情况的还有各路生物、材料等等场景。我认为凡是数据获取周期很长,成本不低的场景下,都是一个又一个鲜活的有意义的小样本学习问题。

# 回答二

作者:杨朔

悉尼科技大学 计算机科学博士在读

来源链接:

https://www.zhihu.com/question/439865186/answer/1683322623

要想较好的解决少样本学习这个问题,甚至达到与多样本学习相近的性能表现,就需要思考造成少样本学习如此困难的本质是什么。

是因为少样本导致经验风险最小化不可靠?少样本导致深度模型极易过拟合?或者是极少的样本无法反映真实数据分布?

针对“少样本无法反映真实数据分布,所以导致模型过拟合”这个现象,我们最新的一篇工作试图利用有限的样本去估计潜在的真实数据分布,并且实现了还不错的效果。

杨朔:ICLR2021 Oral |利用一个样本估计类别数据分布 9行代码提高少样本学习泛化能力

https://zhuanlan.zhihu.com/p/344531704

我觉得这是一个有趣的方向,假如该分布估计足够准确,少样本和传统多样本学习还存在很大的差别吗?

# 回答一

作者:ICOZ

Chi Zhang, PhD in ML & CV, NTU

来源链接:

https://www.zhihu.com/question/439865186/answer/1747593000

当然。

如果你只是focus在小样本分类的那几个benchmark上,那的确看起来很局限。事实上小样本学习的应用可以是很广泛的, 其中的研究思路也可以对其他领域产生启发。这两个方面展开说可以写很多。

随便举几个例子,很多相关的问题都可以看做小样本学习,比如图像检索,人脸识别验证,行人重识别。都是直接依据少样本来做预测。对于这些更具体的task,往往区别在于数据的类型和评测指标,比如few shot learning benchmark上的数据类别更强调语义,而且上面的几个例子里的数据可能是一些更细粒度的特征。

小样本的研究思路同样会给相关领域带来启发。比如小样本学习里的metric based的方法 (Prototypical Network, Matching Network, DeepEMD等)带来的启发就是如何表示fully connected layer里prototype,这样便可以迅速获得一个classifier来用于训练。这样思路用在其他领域也相当有效。

比如在这篇Distilling Cross-Task Knowledge via Relationship Matching(https://openaccess.thecvf.com/content_CVPR_2020/html/Ye_Distilling_Cross-Task_Knowledge_via_Relationship_Matching_CVPR_2020_paper.html)里, 在跨数据集的任务里蒸馏知识,label space不一样,预测的logits不一样怎么办。 就可以利用其中一个数据集的backbone到另一个数据集里用prototype的思想迅速获得classifier来训练。这种data relation也可以作为knowledge,同feature/logits一样,可以被distill。  最近也有将类似思路用在蒸馏self-supervised 模型,这种情况下没有label只有data embedding,也可以看做一种特殊的小样本情形。同样,小样本学习里,固定住backbone只调整prototype的做法直接搬到long tail classification问题里就可以取得SOTA的结果。

类似地,如果把小样本学习看做是一种conditional prediction模型的话,那又可以和大量领域建立联系。比如小样本分割领域经常会把support数据当做conditional input来预测,这和style transfer,group segmentation等任务又十分相似。比如如何更好的融入conditional input的信息? 可以是在feature 上concantenate ,可以是pixel level attention,可以是style transfer里经常用的AdaIN,可以用上graph来propagate信息,等等等。这些任务的learning方法都可以互相借鉴。  又比如,小样本里的数据可以被拆分成很多更小的数据,就像style transfer的工作里强调了一些局部的style, DeepEMD里使用local region feature来做分类,PGnet里把小样本分割数据表示成graph来传递信息。

总的来说,参考目前的 few-shot classification leaderboard(https://few-shot.yyliu.net/miniimagenet.html),即使是最简单的few shot分类问题还是有很大的研究空间的。其他的setting下,比如transductive learning, large scale, cross domain,fine-grained, open set 下也有很多task specific的算法,也都很有研究价值。

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

【小样本学习】近两年小样本学习取得重大进展了吗?相关推荐

  1. 近两年小样本学习取得重大进展了吗?

    链接:https://www.zhihu.com/question/439865186 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 2020年小样本学习可谓如火如荼,我从2020年六月份入坑 ...

  2. 近两年学习Python的人越来越多,Python就业形势很好?

    为什么近两年来学习Python的人越来越多?除了因为Python行业的高薪,更因为人工智能被写入报告,得到了很多政策上的支持.而Python作为人工智能时代的首选语言,自然受到了越来越多的关注.小编就 ...

  3. 谈谈实现小样本学习的两条路径

    来源:混沌巡洋舰 小样本学习是当下机器学习界的一个核心课题.大数据是当下深度学习的咽喉,面临收集成本昂贵,甚至根本无法采集的弊端, 小样本学习的实践价值不言而喻.对于众多产业来说, 真正能够收集到大量 ...

  4. Multi-Scale Metric Learning for Few-Shot Learning(用于小样本学习的多尺度度量学习)

    Abstract 本文提出了一种新的小样本学习方法,名字叫多尺度度量学习(multi-scale metric learning, MSML),能提取多尺度特征,学习样本间的多尺度关系,进行少镜头学习 ...

  5. GitHub 近两万 Star!深度学习 500 问带你入门人工智能!| 技术头条

    作者 | 非主流.Jane 出品 | CSDN AI 科技大本营(ID:rgznai100) 程序员转行学什么语言? https://edu.csdn.net/topic/ai30?utm_sourc ...

  6. 分享下近两个月美帝MBA研究生课程学习总结以及心得体会(PS.又可以开始软件开源分享了!)...

    由于国内外疫情十分严重,故当下上课方式改为线上进行,为此我为了抽出更多的时间专心学习向公司领导提了辞职,希望以后有机会的话还可以再回去吧.在世界上的一个开源平台Canvas进行学习,时间过得很快,为期 ...

  7. 【AI初识境】近20年深度学习在图像领域的重要进展节点

    文章首发于微信公众号<有三AI> [AI初识境]近20年深度学习在图像领域的重要进展节点 这是专栏<AI初识境>的第3篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使 ...

  8. 竞赛获奖系统解读:远场说话人确认中基于两阶段迁移学习解决域不匹配问题

    作为Interspeech2022的赛事活动,远场说话人验证挑战赛 (FFSVC) 由昆山杜克大学.新加坡国立大学.南加州大学和希尔贝壳联合组织,主要关注极具挑战性的远场说话人确认任务.2020年举办 ...

  9. datawhale 10月学习——树模型与集成学习:两种并行集成的树模型

    前情回顾 决策树 CART树的实现 集成模式 结论速递 本次学习了两种并行集成的树模型,随机森林和孤立森林,并进行了相应的代码实践.其中对孤立森林的学习比较简略,有待后续补充. 这里写自定义目录标题 ...

最新文章

  1. windows文件服务器双机热备_遇到ZFS文件系统如此棘手的问题,这种办法简单又高效!...
  2. SESSION常见问题辑
  3. 时隔七个月,我终于弄懂了汉诺塔的思想
  4. if 判断成绩 ,整百制
  5. zabbix JMX监控 tomcat
  6. (3)zynq FPGA AXI4_Stream总线介绍
  7. vue 数组添加元素_Vue躬行记(3)——样式和表单
  8. 6.Linux性能诊断 --- 远程通信gRPC,kafka,docker
  9. SKNode的子类和常用的Action
  10. 简易论坛代码源码(php+css+js+mysql)完整的代码源码,系统使用B/S架构
  11. codeforces——962
  12. 去除迅雷右侧资源信息栏和迅雷广告,以及迅雷的速度限制修改
  13. Java并发相关知识(多线程、锁、容器、工具)
  14. padding不会撑开盒子的情况
  15. android简单记账源码,Android+个人记账程序源码.rar(入门级)
  16. python 比较两种包装的大米的价钱
  17. Java8新特性LocalDateTime获取年,月,周,当年第X周
  18. Google drive下载失败,网络错误
  19. 智能家居解决方案-HouseKeeperV1.0 [管家V1]
  20. python 关键词抽取工具

热门文章

  1. HTML-CSS(三十四)HTML5新语义化标签
  2. Win10系统恢复IE 11浏览器
  3. K-均值聚类(K-means)算法
  4. 驾驶证——科目一技巧(一)
  5. 24届春招百度暑假实习笔试第二题
  6. (原创)用通道位深度巧做唐三彩效果图
  7. vs2017 c语言 安装教程,Visual Studio 2017 IDE安装使用图文教程
  8. 论文阅读:Natural Language Processing Advancements By Deep Learning: A Survey 深度学习在自然语言处理中的进展
  9. Spring 源码分析衍生篇十三 :事务扩展机制 TransactionSynchronization
  10. 开源免费的视频录制软件