智力测试:如何超越动物之智?
全文共4814字,预计学习时长13分钟
图源:unsplash
我们经常问世界上生物的一个基本问题:你有多聪明?这个问题带着些许竞争意味,或嘲笑,或恭敬。人们认为,几百年后,一群真正聪明的科学家会提出测试智力的方法,为一些我们认为并不那么聪明的动物进行测试。
但看起来,测试对象在智力上不断地在超越最聪明的人类。
人类智力测试
人类智力衡量测试被卷入政治、社会以及伦理这类棘手的问题中。标准化的智力测试最早于19世纪末由声名鹊起的弗朗西斯·高尔顿研发,他还提出了优生学,在美国带来了大屠杀以及侵犯人权的灾难。
高尔顿是查尔斯·达尔文的堂兄,一位才华横溢的博学者,但他距离成就辉煌似乎缺乏一枚道德指南针。第一次世界大战期间,智力测验首次涉足更广阔的世界舞台,人们用它来更可靠地将新兵与任务联系起来,尤其是选择军官培训的候选人。
高尔顿率先建立心理测验中心以测试人类智力。不出所料,这直接引起了关于智力测验的种族偏见的争议,1994年的《贝尔曲线》(Bell Curve)也错误地宣称种族与智力之间存在联系。
请注意,智商测试并非测试智力本身,而是受到收入、住址、健康和大量其他因素的强烈影响,我们以此事实直接类比入了解动物智力的测试中。
心理测量学的一项成就认为一种基本的智力因素,称为g,对人在完成各种各样任务时的成功率影响颇大(40%-50%)。如今虽然这一说法存在争议,但它引发了对动物中类似g因子的类似研究。
本文将谨慎地避开人类智力测试的雷区,只关注动物智力,即非人类动物的智力。
动物智力测试
我刚刚写了一篇综合智力测试的评论,该测试应用于最聪明的一种动物——乌鸦,作者们将其与目前的非人类大脑动物黑猩猩的黄金标准进行了比较:就这些智力测试的一些关键弱点,我做了一些总结并希望在这里深入研究它们。
首先,来看看使用最广泛、技术最先进的动物智力测试的原理。目前最全面的动物智力测试被称为灵长类认知测试系列(PCTB),由埃斯特·赫尔曼在马克斯普朗克进化人类学研究所开发。
第一个测试就空间记忆进行评定,在PLOS杂志中描述如下:
“将三个杯子排成一排,放在测试笼前的平台上。实验者向受试者展示了两个奖品作为诱饵,并将它们放在三个杯子中的两个杯子下面,以充分观察受试者。然后,平台被推向受试者,要求其连续做出两个选择。如果受试者首先选择空杯,则不允许做进一步的选择;受试者连续选出两个诱饵杯时,即被认为正确”
通过这些测试以及类似测试,赫尔曼表明,一个两岁半的人类孩子对物理世界的认知能力与十岁的黑猩猩相似。然而,涉及到社会世界时,人类儿童的表现远远胜过黑猩猩和猩猩。
PCTB中用于物理领域测试的任务包括以下内容:
· 空间记忆
· 物体横存性
· 旋转
· 变换
· 相对数
· 加数
· 噪音
· 形状
· 工具使用
· 工具属性
PCTB测试社会领域的任务包括:
· 社会学习
· 理解力
· 指向杯
· 注意力状态
· 目光跟随
· 意向
目前为止,这些灵长类动物的测试最为全面,并且没有发现g因子,即作用于人类的一般智力因子。相反,PCTB发现了不同的领域或模块,也许我们可以将其称之为智力的“积木”。PCTB将社会域和物理域作为灵长类智力的独立模块。
重要局限
基于PCTB的鸦科鸟类智力测试的作者阐明了其研究的局限性,以及对动物智力的总体测试:
· PCTB测试假设社会智力和物理智力天然划分,这可能有误。
· 受试者和测试者之间的干扰可能会影响测试的有效性。
· 行为可以由完全不同的智力布线和机制驱动,而目前的测试较为盲目。
测试的局限性和制约性听起来像是在受试者身上浪费了很多时间,那为什么不在测试本身花费较多时间呢?试把智力测试看作是一项技术,其目的是描述动物的智力。只有严格审查这些局限和制约因素,才能在这些局限方面进步,取得重大进展。
社会和物理智力
PCTB测试假设社会和物理智力存在自然划分,这个假设虽在逻辑上令人满意,但对黑猩猩和人类儿童数据的重新分析推翻了这一假设。这也是一个极好的例证,说明如何彻底地、冷静地挑战自己的数据和结论,并诚实地公布结果,即使它否定了自己以前的结论。
赫尔曼等人在2009年发表了对其2007年论文的重新分析,表明他们最初的假设是错误的。赫尔曼在设计PCTB时的关键假设是,灵长类的认知技能可以大致分为两个独立的组别或领域:社会和物理。
之后,他们使用了一种叫做验证性因素分析(CFA)的统计方法,它恰好确认了是否正确选择了分析的原始因素。赫尔曼用CFA表明,实际上还有另一个因素-空间认知的存在,并且社会认知与物理认知不可分离。这增加了一种可能性,那就是我们关乎物理世界的智力与我们的社会智力同步进化了。
这一发现引发了一系列关于如何改进动物智力测试的讨论。2016年,杰尔伯特等人在《生物学快报》上发表的一篇论文指出,尽管我们对智力进化的理解取得了革命性的进步,但认知测试本身才是限制我们进步的关键。他们说:“如果认知以外的因素能系统地影响动物在这些测试中的表现,那么我们关于智力如何进化所得出的结论就有可能是错的。”
杰尔伯特利用新喀里多尼亚乌鸦的例子表明,鸟接受的训练类型影响了他们通过被称为“A非B”任务的基本自控测试能力。这个测试中,反复向动物展示并训练动物美食被放在杯A之下,然后在测试进行过程中,将美食放置在杯B下来观察动物是错误地选择杯A,还是正确选择杯B呢?受过训练的乌鸦懂得跟踪人手的移动,与受不相关技能训练的乌鸦相比,以更快的速度通过了“A非B”任务。
杰尔伯特研究的重要性在于表明,动物中预先存在但被忽视的技能将决定其在给定测试中的表现,而非其智力在起作用。
2017年,瑞秋·肖和马丁·施梅尔兹在《动物认知》杂志上发表的一篇论文也认为,动物认知测试需从多个方面改进,包括任务的设计、测试所针对的认知领域,甚至是被测物种。肖和施梅尔兹指出,与基于语言的人类心理测量测试不同,我们需要进行的动物智力测试基于行为,而在测试中使用行为会给智力推测造成巨大困难。
测试员与受试者
Pika等人也指出,乌鸦一直过着自然竞争的社会生活,每个乌鸦都将同伴既看作社会伙伴,也当作资源竞争对手。因此,人工饲养的乌鸦可能会把实验者看作食物奖励的竞争对手,这一因素可能掩盖了智力在测试性能方面的影响。
其他人也指出,灵长类动物同样生活在竞争性极高的社会环境中,所以在实验设计中应包括竞争成分。2001年,布赖恩·黑尔在《动物认知》杂志上发表了一篇论文,建议将竞争因素纳入灵长类研究,并做出了评估。
黑尔说:“灵长类动物的社会生活具有很强的竞争性,这意味着灵长类动物包括其认知能力在内的所有方面的表现,都可能是由于需要超越竞争对手而逐渐塑造而成。”
实际上,这意味着饲养灵长类动物的实验室工作人员可能被其视为他们的社会成员、同族和竞争对手,人类测试员在测试期间的行为将高度影响动物的行为。所以,人类进行的测试并不是真正的测试智力,而是一种社会互动。
与此同时,乌鸦在PCTB测试期间的表现与鹦鹉差距悬殊,鹦鹉也以其智力超群而闻名。
2019年,克拉申尼科娃等人在《行为》杂志上发表的一篇的论文表明,将PCTB测试应用于四种鹦鹉物种表明,结果均不及随机因素表现好。这与乌鸦测试结果对比鲜明,其测试性能明显优于随机因素。
乌鸦和鹦鹉的研究在其执行的细节上有很大不同。乌鸦的研究是由亲手饲养乌鸦的同一拨人进行的。鹦鹉的研究是由鹦鹉对其熟悉和陌生的人共同操作的,并非它们的饲养人员。这些有关人类与测试对象互动的细节可能掩盖了鹦鹉测试的有效性。
乌鸦可以追踪其它动物的目光的能力是另一项关键且令人费解的技能。由于乌鸦彼此之间的竞争异常激烈,他们发展出这种跟随其他乌鸦目光的能力是符合规律的。乌鸦所看之处可能就是食物所在之处,所以乌鸦学会了注意其它乌鸦所看方位。
克里斯蒂安·施洛格尔等人的研究发现,乌鸦在八周大的时候就获得了跟随另一只乌鸦目光的能力,但需再花七周才能跟随人类的目光。因此,在许多具有目光跟随能力的社会动物中,这些智力测试很可能并非测试智力,而是目光跟随。
智力线
虽然乌鸦的实验得分与类人猿相似,但皮卡等人并没有声称不同物种的智力通常是相似的。同样的行为可以由完全不同的智力线和机制驱动。
2009年,阿曼达·西德等人发表在《民族学》上的一篇的论文确认,鸦科和灵长类动物都“以相似的速度和灵活性解决社会和物理问题”,但他们也指出,我们目前还不理解“两组计算的表征和算法”。
西德等人以有翼飞行的物种为例,将其类比到其它不同物种上做为趋同进化的例子,反复利用类似结构的发明来解决蝙蝠与鸟类的飞行问题。同样,他们说,智力可能进化了多次,在物种中独立进行,例如灵长类和鸦科的差异,但功能相似,尽管每个物种的生物结构以及线非常不同。
2016年,奥诺·根图昆和托马斯·布尼亚在《认知科学趋势》(Trends in CognitionScience)上发表的一篇论文指出,虽然鸟类缺乏灵长类动物的大脑皮层,但在“延迟满足、心理时间之旅、推理、元认知、镜像自我识别、心智理论和第三方干预”等测量方面仍然表现相似。
鸟类和哺乳动物已分开进化了3亿多年,两者都演变地非常成功,都通常是各自生态位上的顶级捕食者,部分原因是它们的认知能力使它们能够快速地适应新方法,在不断变化的环境中脱颖而出。大脑结构的巨大差异反映了长期的时间分离,但问题是智力是如何在每一类动物中分别进化的呢?
2012年,瓦内萨·施密特等人在PLOS One上发表的一篇论文展示了令人惊讶的结果,即旧世界的猴子(长尾猕猴和橄榄狒狒)在PCTB中的表现与黑猩猩相似,而黑猩猩仅在空间认知和工具使用方面超过了猴子。这与认知表现与大脑大小有关的预测相矛盾,预测黑猩猩应将远远领先于猴子。
然而,施密特指出,PCTB测试是根据人类特有的技能设计的,因此可能“低估了真正的非人灵长类能力以及物种差异”。
显而易见的是,行为认知测试无法区分可以指导认知的潜在生物学差异。例如,两辆汽车均可以通过最低阈值加速度、制动和转弯测试,其及格/失败分数相似,但一辆是由汽油发动机驱动的,另一辆是由电动机驱动的。这三种汽车测试并不能揭示电动汽车独特的性能特征或传统汽车的局限性,也不能揭示引擎盖下面是什么。
图源:Google
接下来的行动
到目前为止,最具有智慧的认知科学家们的智力已不及他们所研究的智力动物。我们知道这盏灯亮了,但不知道它是如何得以点亮,也不知道认知之光如何影响着动物行为。
如果对“智力”一词没有一个准确的定义,我们将怎样开展智力研究呢?我们不知道智力形成及运作的方式,就无法事先设计精准的实验来衡量其作用范围、局限性以及影响。
我们根据对智力组成部分的最佳猜测(例如,赫尔曼将其划分为社会和物理领域)来设计智力测试,但到后来才发现存在一完全不同的因素(空间),且社会和物理两个领域并非真正分开,而是紧密相连的。
我们正在摸黑前进,在黑暗中寻找道路。虽然缺乏智力来探索智力,缺乏灵光来研究所看所闻背后的东西,但我们从一开始就在进步。的确,我们可能最终会陷入死胡同,一个错误的转折就可以让所有努力回到原点,必须重新制定所有假设。
但科学也是如此。我们带着对世间万物的无知,带着对远方前程的迷惘,在未知的世界踩出一个个新脚印。这就是科学与我们赖以生存的世界的神秘和浪漫。
推荐阅读专题
留言点赞发个朋友圈
我们一起分享AI学习与发展的干货
编译组:冯沙沙、骆昱含
相关链接:
https://medium.com/science-and-philosophy/how-to-out-smart-a-smart-animal-355ee4ddc90a
如转载,请后台留言,遵守转载规范
推荐文章阅读
ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾
长按识别二维码可添加关注
读芯君爱你
智力测试:如何超越动物之智?相关推荐
- 美国西北大学新系统在智力测试中超越75%民众,人类的推理能力也不及AI了?...
你听过瑞文氏标准推理测试(Raven's Progressive Matrices)么?上面这张图就是一道标准的瑞文氏测试题目,是不是很眼熟?在公务员考试.一般的智力测试中我们经常看到它. 那么问题来 ...
- 中国人工智能学会通讯——智力测试与智能测评的对比思考
因为我的研究方向是心理学,不是特别懂计算机的东西,像陈老师说的,我们2013年很有可能开始一个合作,后来没有进行下来,我们希望来做一下机器人的智能测试.我想跟大家说为什么我对这个研发感兴趣,刚才陈老师 ...
- 秋招春招,网申在线测评中的智力测试
公司招聘中的智力测试(也有叫认知能力测验),并不是说检测不通过就代表一个人的智力不行,这个智力检测其实也超越了单纯的智力测试,主要是评估人的逻辑思维能力,以及在实际生活中解决问题的能力,题型大多是类似 ...
- ppvt智力测试系统软件,PPVT智力测试
<PPVT智力测试>由会员分享,可在线阅读,更多相关<PPVT智力测试(1页珍藏版)>请在人人文库网上搜索. 1.PPVT智力测试(适用于3岁3个月至8岁5个月的儿童 )PPV ...
- 微信小程序游戏开发│智力测试游戏——button版
本案例开发智力测试游戏,当用户进入游戏后自动出现题目和选项(如图1).用户选择答案后如果正确自动进入下一题,也可以单击"上一题""下一题"按钮进入到上一题目或下 ...
- 盖泽尔智力测试软件,宝宝聪明不聪明?只需测一测,不用去医院,家长在家轻松筛查...
美国哈佛大学心理学家加德纳博士提出了多元智力理论,认为智力不仅是语言和数理逻辑能力,还要包括对人类和个体生存发展中有主要作用的能力,如音乐.动作.交往能力等. 这几天接到了一些咨询,是关于孩子智力问题 ...
- 小程序源码:实用的智力测试智商提升
这是一个考验智力,心里上面的一个测试游戏 支持多种测试方法比如有: 智商测试丨情商测试 性格测试丨爱情测试 抑郁症测试丨焦虑症测试 心理压力测试丨生活满意度测试 通过不同的测试,来检查你的智力,情商等 ...
- 智力测试情商测试小程序源码/带流量主提升智力微信小程序源码
☑️ 编号:ym287 ☑️ 品牌:无 ☑️ 语言:PHP ☑️ 大小:1.27MB ☑️ 类型:小程序 ☑️ 支持:智力测试
- 客户回访|国产MCU测试解决方案 助力中国“芯”智造
半导体技术持续更新迭代,MCU也在与时俱进,为了更好地迎接市场未来趋势,国产MCU厂商积极布局各系列MCU产品线,开始逐渐在特定细分领域实现突破.随着应用场景的进化升级,MCU 中包含越来越多的功能模 ...
最新文章
- 扎心一问!为什么前后端分离后,你比从前更痛苦?
- 解析mysqlbinlog日志_每日学点---Mysql的binlog日志解析导出
- Frequency 频率统计
- ux设计师薪水_公司与 设计机构:UX设计师的津贴和陷阱
- rip协议中周期性广播路由信息的报文_技术实操||距离矢量路由协议-RIP
- sql loader 参数详解
- 2017计算机三级试卷,2017年计算机三级《网络技术》测试题及答案
- MyCms自媒体内容管理系统 v1.6.0.1
- 荣耀20 Pro 5000元最强拍照机翻车?官方怒放样张辟谣
- i++为什么不能作为左值,而++i可以作为左值
- Java 实现线性运动界面_java 实现顺序结构线性列表
- 调查问卷java源码_2020年Java技术趋势
- JSP/Servlet-----charset 、pageEncoding差别
- ◆谷歌热榜|百度中文搜索风云榜|Top 50
- 软件无线电波测试软件,SDR软件无线电的测量
- qtabwidget设置表头_QTableWidget添加表头菜单 并 可以通过表头菜单隐藏选中列
- flowable子流程实现
- Vulkan教程 - 01 环境搭建
- 邮政局计算寄往美国的国际物品快递资费
- Python 三人斗地主手牌生成
热门文章
- 某地刑侦大队对涉及6个嫌疑人的一桩疑案进行分析
- 【SystemVerilog基础】program块的automatic与static深入探究
- 阿里云Elasticsearch让搜索上云像使用“水电”一样简单
- 手机系统计算机怎么解决办法,手机与电脑怎么连接【解决教程】
- Java实例方法、实例变量、类方法、类变量
- 2022适合3D渲染的电脑配置清单来了,如何选电脑?
- C语言中的数据类型及相关数据操作
- 62——A hybrid deep segmentation network for fundus vessels viadeep-learning framework
- 争当表率 争做示范 | 华云数据荣获第十三届无锡市专利奖优秀奖!
- 听说,南方人和北方人又双叒叕吵起来了