点击上方“AI遇见机器学习”,选择“星标”公众号

重磅干货,第一时间送

转载自 | 夕小瑶的卖萌屋

作者 | 鹰钩鼻涕虫

从我们刚刚接触统计学习方法开始,想必就一直在接受一个思想:相比符号算法,统计模型最重要的能力之一,即是它的泛化能力。或者,用这两年使用更加广泛的话术,则是统计模型具备想象力,或者思考的能力。炼丹时,我们绝大多数时候去对抗的,也是泛化的反面,即过拟合。

大模型、大数据加持之后,深度学习算法的确也帮助我们解决了很多无法枚举的问题,关于其泛化能力的研究也越来越多,比如翻译模型,强大的泛化能力似乎可以让模型在没有足够的对齐语料时,也能达到不错的效果。

不过,我想提出一个相对反直觉的观点:以我们自己为例,我们都知道,有的时候想象力飘得太远,过于“举一反三”反倒未必是好事儿,或许成长的过程中,相当一部分的时间,我们是在限制自己的想象力。

1

『败也泛化』

以文生图算法为例,例如,我们输入 prompt 为:苹果,西瓜,这个时候文生图算法会给出什么结果呢?

不怎么稳定,对吧?实际上,我分别尝试了中文和英文的模型,结果是类似的(这里给出的是 stableboost 生成的结果,输入是 an apple and a watermelon)。

那我们换一个 prompt 再试一下:熊猫,西瓜,看看是什么结果?

甭管图是不是有点儿诡异,但起码意思上非常稳定了,对吧。我们来试着分析一下,这是怎么回事儿呢?

首先,几乎不可能是样本缺失的问题,我们难以想象,类似于苹果、西瓜这样的常用词,在文生图的庞大语料中会不存在。但是,实际测试中我们会发现,意思相近的提示如果放在一起生成,则很容易试出来奇怪的结果,比如老虎和狮子,榴莲和西瓜等。但如果同时提到的提示在自然语义上不相近,则往往能生成出靠谱的结果,比如前段时间火爆的太空歌剧、猫猫骑士等。

▲a tiger and a lion

▲a durian and a watermelon

如果我来猜测,如苹果和西瓜、老虎和狮子这种包含意思相近的主体的输入,大体是语义理解模型将它们看成了一个东西,也就是说,在语言模型的视角下,在物理空间内,两个词是很相近的。我们试着从预训练语言特征上去分析,在文本数据下,两个相近主体的上下文是高度一致的。乂,这正是统计模型的泛化能力所带来的。

也就是说,让预训练语言模型在绝大多数理解任务上叱咤风云的能力,在这里却好像吃了瘪。说白了,还是任务目标对不齐。在文生图里面,通过语义理解,控制生成的主题范围,合理泛化一些修饰词,以及对长 prompt 的语义更好的建模,语言模型可以起到很大的作用,但涉及到精细化控制,则又与其训练目标相冲突。

2

『随机是最牛的泛化』

实际上,我们在训练模型的过程中,一直都是在限制模型的泛化空间。如果我们不去修改模型的参数,那么其得到的结果是完全随机的,即有了无限可能,可以往任何的方向走。我们需要的是,给出条件之后,模型的每一步,都朝着正确的方向行进,在合理的范围内,它可以自由发挥一下,走出一些没有见过的路。当然,不同的任务,所要限制的空间不一样,例如生成任务,则多数需要精细化的控制,而理解任务,则多数追求兼容没见过的东西。

通用层,泛化追求的更宏大的目标则是,将泛化空间刚好限制到一个通用知识体系上,实现小样本/零样本的迁移。比如多语言场景,其追求的就是模型能够学到通用的语言学知识,从而解决小语种语料不全的问题。

我认为,理想很丰满,现实很骨感。我充分认可这一宏愿,且希望能够有进展,但在我有限的知识体系里,只认为这一宏愿极难实现。以跨语种为例,全球最顶尖的语言学家,如无充分交互,也未必能达到此能力。或许相同语系,或同源语言之间,这一任务相对容易,但不同语系之下,则又会掉入泥坑。

特德·姜所写《你一生的故事》中,主角学会外星语言的过程,亦是从最基本的认知开始,一步一步地掌握其语言规律。又比如,有些古楔形文字,多少代的语言学家在研究,至今也未能破解。已部分破解的古文字,多也是有足够的对齐语料,或其本身象形文字的属性,史料记载,发掘地原本的作用(如祭祀、讲学等)相互印证而得。

虽认可这一宏愿,也充分认同,在这一维度上讨论的泛化能力,对知识迁移相当有意义。但恕我直言,在应用领域(非理论研究领域),绝大多数的数据集质量,或任务设计,还不配谈算法层面的泛化能力。例如在主题分类上常见的,类别与某些词语,在自然语义上相关性不强,却在数据中有很强的统计共现,如“鹈鹕”和体育类别,小米、苹果等词。

是的,最终,又会回到这个老生常谈的话题上,数据理解和任务设计。起码,在讨论泛化之前,其任务应当是可行的,其数据也应当是充分、丰富的。如基于句式建模的算法,就没办法去谈通过小样本,抽取特定类别的词或关系;基于主题词建模的算法,则需充分考虑一些特殊词的二义性。

归根到底,哪怕是深度学习模型,目前也仅仅是一个统计工具,所以我们需要在样本上,先把不必要的 bias 给消解掉。至于怎样抽象出所谓“知识”,我认为想清楚目标(想抽出什么样的知识)之后,首先要指导的,仍旧是如何做出来一份符合要求的数据。否则,数据中明明存在的很强的统计显著性了,却要求模型不要建模,那到底这个模型是好,还是坏呢?

3

『后记』

胡乱吐槽这么一篇,实际上还是有一些“正视听”的宏愿的。正如我文中所说,现实中我也经常和身边的人讲,深度学习模型就是一个统计工具,莫要把它看得太过强大。近几个月来,我比较反感对深度学习模型使用所谓“思考”、“想象”、“创作”等词汇,许是我对人的能力太过高估,总是认为统计工具上不应当谈这些似表灵性的词。平常带的一些新人,也会使用类似于“模型能学会”的话术,去逃避严谨的论证工作、繁琐的数据工作。而最终,也是浪费了大量的算力,最终也没有得到可用的东西,反倒又牺牲了很大的运行效率,把性价比压得无比低。

真不知道求个什么劲儿。

我们追求的泛化,竟是一条死路?相关推荐

  1. 手机游戏繁荣时代,团队的N条死路

    海豚(手机游戏从业者) 首先写这篇东西,真是抱着十分沉重的心情写的,几年前我针对WEBGAME(网页游戏)市场写了WEBGAME繁荣下的危机,之后之前写的所有东西都被市场一一验证了,同时各种类型的WE ...

  2. 致敬2202年,这些优秀的裁缝们

    文 | 鹰钩鼻涕虫 2202年过去了,不知道小伙伴们是否和我一样,绝大多数时间处于迷茫之中,除去其他因素不谈,在最后一个月到来之前,NLP 学界的表现似乎不如前几年那样"精彩",甚 ...

  3. 《菜菜的机器学习sklearn课堂》随机森林应用泛化误差调参实例

    随机森林 随机森林 - 概述 集成算法概述 sklearn中的集成算法 随机森林分类器 RandomForestClassifier 重要参数 控制基评估器的参数 n_estimators:基评估器的 ...

  4. 追求最优选择的后果,往往是事与愿违,往往是善良的愿望,把人类带入了人间地狱

    最近毕业,遇上很多事不顺利,看见罗翔老师所说的这句话,感悟颇深,结合网上对此句的分析,在此记录. 因为人总是喜欢追求最优选择,但是追求最优选择的后果,往往是事与愿违,往往是那些善良的愿望把人类带入了人 ...

  5. 医院营销要多条腿走路

    医院营销要多条腿走路,大家都知道,但目前很多医院都只用一条腿走路,全靠网络.一条腿走路肯定是不好的,但对于很多追求短期效果的一条腿走路风险小.我在这里要谈的是医院长期的品牌建设和营销,要多条腿走路. ...

  6. 《Offer一箩筐》2W字总结面试套路14问——不给例子的教程都是耍流氓!!

    01. 面试前的准备 1 准备好自我介绍 提前准备自我介绍非常有必要,这几乎是每场面试的"开场白问题".特别是受疫情影响的现在,在线面试更是绕不开这个问题. ⚠️ 自我介绍三大雷区 ...

  7. 惠普前总裁孙振耀指点职业规划

    HP大中华区总裁孙振耀退休感言: 如果这篇文章没有分享给你,那是我的错. 如果这篇文章分享给你了,你却没有读,继续走弯路的你不要怪我. 如果你看了这篇文章,只读了一半你就说没时间了,说明你已经是个&q ...

  8. 区别于传统低效标注,两种基于自然语言解释的数据增强方法

    本文内容整理自 PaperWeekly 和 biendata 在 B 站组织的直播回顾,点击文末阅读原文即可跳转至 B 站收看本次分享完整视频录像,如需嘉宾课件,请在 PaperWeekly 公众号回 ...

  9. 海上瓶子下有东西吗_《海上钢琴师》:宁愿一生孤独,不愿随波逐流。

    海上钢琴师 阻止了我的脚步的, 并不是我所看见的东西, 而是我所无法看见的那些东西. 你明白么? 我看不见的那些. 在那个无限蔓延的城市里, 什么东西都有, 可惟独没有尽头. <海上钢琴师> ...

最新文章

  1. 我为中国第一张火星照片做鱼眼矫正
  2. WINCE支持的波斯语的codepages
  3. DL之SSD:SSD算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
  4. Nmon 性能:分析 AIX 和 Linux 性能的免费工具
  5. php br2nl,收藏一些规范化输入输出的PHP函数
  6. --save 和--save-dev的区别
  7. 【codevs2455】繁忙的都市
  8. congatec AG acquires Real-Time Systems GmbH
  9. 操作系统课后答案第三章
  10. 显存(Video Memory)
  11. typecho图标_handsome+Typecho美化过程【持续更新】包括踩坑解决办法
  12. ### LinuxCBT VBOX Edition ###
  13. Transformer代码详解与项目实战之Masking
  14. iOS比较常用的第三方及实例(不断更新中)
  15. Unity实战之类爬塔功能
  16. NGS可变剪切之STAR+rmats软件使用
  17. 3D数学基础——Rotator类的C++实现
  18. 关于Oculus无法下载应用:(OVR40779122) 的解决方案
  19. Mac:Permission denied XXX
  20. 欧拉角和四元数相互转换

热门文章

  1. 简便的Excel导出功能
  2. RTC介绍——单片机中的时钟芯片
  3. Linux服务器ftp命令找不到
  4. minio分布式存储系列(一)__介绍及开箱使用
  5. 第二篇 : SpringBoot 2.x中使用JdbcTemplate
  6. 输入法pad版android,百度输入法PAD版(Pad版)
  7. php将手机号转换成QQ号,php生成像qq号码这种的唯一数字id?
  8. python实现获取字符串中连续字串
  9. 3.Mac安装Vue出现的问题解决方案:Error: EACCES: permission denied
  10. 【putty】html中调起客户端putty