自动化设计的人为因素模型中的自动化等级

为什么我们可以考虑将婴儿和洗澡水一起倒掉

本文回应了卡贝尔（Kaber）对自动化等级(LOA)框架的经验基础和设计效用的思考。我们讨论了在复杂工作环境中支持设计决策的现有人类性能数据的适用性。我们就为什么人为因素设计指南似乎与一个值得商榷的预测价值模型绑定在一起提出了疑问。我们对LOA框架为高度自动化系统的设计和操作提供有效输入的信念提出了质疑。最终，我们在熟悉的人为因素结构以外，试图寻求扩展人机交互的设计空间。综上所述，在我们的立场上，我们将LOA框架描绘成一种正在遭受信任危机的抽象形式，而Kaber的补救措施无法恢复这种危机。

关键词:自动化等级、设计方法、功能分配、自动化、人机交互

引言

David B.Kaber教授(2018年这一期)的意见书邀请大家就人因工程的中心结构:自动化等级(LOA)进行思想交流。我们很赞赏《认知工程与决策》杂志在同样问题上对他的观点发表的一系列回应。这种方法为慢速而激烈的交流和在人因科学方面持有不同观点的期刊提供了一个有说服力的对比。

不同的观点有共同的基础

两位作者都是在人机交互(HAI)方面进行合作研究的经验主义者。我们采用一种归纳的研究方法，通过在复杂的工作环境中进行原型设计和实验来建立知识。我们试图通过将这些知识与设计问题的丰富性相结合来支持设计师，而不是主要基于存疑的预测价值模型。这一观点是经过20年对复杂过程控制任务的HAI现实模拟器的研究演变而来的，其中人为因素模型在预测绩效结果方面收效甚微(Skraaningng & Jamieson, 2017)。正是从这个角度，我们回应了Kaber关于LOA模型的经验基础和设计相关性的评论。

我们同意Kaber许多关于LOA预测经验证据的批判性考虑。我们同意，人因研究应该摆脱受约束的人工情境，转向面对真实操作环境的设计者所面临的问题。正如他所提出的，现有的基于人类信息处理的自动化模型的类型和级别可能无法描述复杂系统中操作人员的行为，导致模型的预测和实际观察之间存在令人沮丧的差异。正如Kaber所指出的，HAI的结果可能不仅仅是人的信息处理的功能。我们衷心赞同他对包含团队合作、信任和其他隐喻的模型空间的开放。

关于支持基于LOA的预测的人类绩效数据的需求和效用

费茨（1951)认识到需要一个研究项目来创建人类绩效数据，以便有效地比较人类和机器对任务的执行。然而，在引入MABA-MABA和LOA将近35年之后，普莱斯（1985)提到了功能分配方法“适用性的普遍不足”(第35页)。这些方法假设人类绩效数据是存在的，通过这些数据可以预测人类的表现……“它们”将依赖于人类行为的大量量化数据的可靠性，这些数据可以根据新设计的特定条件进行校准。“这样的数据现在不存在，可能永远也不会存在。”(普莱斯，1985年，第35-36页强调)

在Fitts列表、LOA理论和对大量人类绩效数据需求的认识出现65年后的今天，Price的预测被证明是有先见之明的。LOA模型依赖于我们基本没有的数据。和他一样，尽管我们都渴望获得更多的数据，但我们无法想象人因界聚集所需的资源来提供这些数据。

我们将Kaber对细粒度LOA模型的呼吁理解为一种努力，即更精确地指定所需的数据，以便为日益复杂的系统验证新的演绎模型。像劳斯（1988)一样，对于使用经验数据来演绎预测任何相当复杂的系统的任务表现的实用性，我们持有保留态度。我们也同意Perrow(1984)的观点，即简单和复杂的技术系统在性质上不同，而不是程度上不同。这种系统本质上是不可预测的;他们的行为是自然发生的。在这种情况下，我们认为归纳研究方法更适合建立知识和提取设计原则。

支持复杂工作环境下基于LOA的预测的证据强度研究

卡贝尔对个别LOA实验中不一致的响应趋势表达了关注。Onnasch、Wickens、Li和Manzey(2014)将合理的选择标准应用于更广泛的研究，以确定将哪些研究纳入他们对研究结果的统计分析。这18项研究代表了关于LOA模型的实证支持强度的讨论。然而，我们认为这些研究的组成本身并不能将结果应用于复杂的工作系统。

综合统计研究中的大多数研究都是在实验室多任务环境下进行的。根据Onnasch等人的说法(2014,p.485)，18项研究中只有4项包括非学生参与者；其中一个雇佣的军事人员从事的也并非与他的专业知识相关(即，Calhoun, Draper，& Ruff 2009)。同样，Cummings和Mitchell(2007)招募了与预期的未来世界实验任务相关的具有交叉学科专长的现役军事人员(M. L. Cummings, personal communication, 2017年3月31日)。Metzger，Parasuraman(2005)，Sarter和Schroeder(2001)的参与者分别是航路管制员和商用飞机飞行员。

表1摘自Onnasch等人(2014,p.481)的研究，这些研究雇佣了非学生参与者，并介绍了我们目前准备传播的实验结果(skraing & Jamieson, 2017)。我们还增加了一个专栏，记录每个研究的实验特征，包括参与者、模拟环境、实验任务或场景。表值为肯德尔等级相关系数，称为肯德尔tau，一种非参数的相关度量。各研究的自动化水平均转化为连续的秩值，并将其与按统计显著性排序的因变量指标进行比较。skraing和Jamieson(2017)采用统计研究中的排名方法（尽管我们对Onnasch等人[2014]支持LOA对绩效、工作量或态势感知的影响的推断排名方法有效性仍有疑问）。与Onnasch等人(2014)的结论形成鲜明对比的是，表1显示，对于复杂工作环境下，LOA对任务绩效、态势感知或工作量的预测模型，几乎没有实证证据。具有讽刺意味的是，将这些研究从Onnasch等人的综合研究中移除，可能会提高LOA表征对学生在几个小时的训练后可以执行的实验室任务的预测能力(cf. Li, Wickens, Sarter，& Sebok, 2014)。

Onnasch等人(2014)的发现确实支持这一观点，即人因工程师可以使用LOA预测来对简单工作环境的自动化设计做出，有效、可靠和有用的预测。然而，鉴于目前数据的缺乏，他们的文章并没有对于将预测的应用限制在复杂的工作环境中提出警告。

尽管基于LOA的预测能力较差但仍然坚持

尽管Kaber承认个别LOA实验的结果相互矛盾，他还是给出了支持LOA预测建模作为支持自动化设计的一般研究策略的两个理由。首先，他认为它们“很方便”。但预测价值不高的模型能有多方便呢?我们是否对这些模型有足够的信心来鼓励它们用于关键安全应用的设计?

一旦承认开发和评估了70年的LOA模型是不精确和不可靠的(就像Kaber所做的那样)，就很难相信这个方法的实用价值了。如果没有LOA模型倡导者所承诺的值得信赖的技术基础，工程师们将继续做出艰难的HAI设计决策。对于提供对设计师真正有用的、一致和普遍的人类反应趋势的愿望，我们表示同感，但怀疑LOA方法在这方面高估了它的作用。

另一方面，Kaber呼吁建立一个研究项目来，假设更复杂的分类将导致描述性的性能预测，来建立细致的LOA模型，从而对设计人员更有用。即这些模型中更多的细节将产生比目前更准确的预测，我们还是对这一假设抱有怀疑。

Kaber仍然致力于LOA查找表的第二个原因是，它们是研究人员提供给设计师的最好的人为因素，我们不应该在没有合适的替代品的情况下丢弃它们。在我们看来这一论点是错误的，它妨碍了去寻找更好的替代方案。这是一个支持功能分配的论点，但长期以来被我们团体中的少数人所排斥(例如,Fuld,2000):

当一个科学学科发现自己在一个死胡同,尽管努力和勤奋工作也无济于事,那么这一死胡同可能不应归因于缺乏对事实的了解,而是由于使用了错误的概念,使这门学科无法正确地对事实进行排序。人因工程在功能配置领域的失败似乎就是这样一种情况。(Jordan, 1963, pp. 161-162)

Kaber(在新闻中)自己断言，“如果对LOA的实际性能观察不能与理论描述联系起来，那么这些描述在系统设计方面没有什么意义。”我们同意Kaber对产生关于HAI知识的经验努力的质量的评价。我们发现在创造证据体的研究方法中没有系统性缺陷。相反，就像Jordan(1963)，我们怀疑基于LOA的对自动化环境下人类行为的预测能力很差，正是基于错误的概念。我们不知道这些概念的进一步完善将怎样导致更多的预测模型。

从我们的角度来看，Kaber采用了一个非常高的门槛来拒绝LOA概念。他用比喻的方法说，我们不应该把这个婴儿和洗澡水一起倒掉。我们同意Kaber的观点，即LOA建模还处于初级阶段——65年的初级阶段。LOA概念是人为因素研究的Benjamin Button。在65年的不精确和不可靠的预测之后，我们还需要什么更多的理由，至少考虑一下抛弃这个无法茁壮成长的孩子?

论LOA分类法在系统设计和运行中的使用和摒弃

Kaber指出，SAE(2014年)最近采用的自动驾驶系统分类法和定义证明了LOA分类法的实用性。然而，其他实践者社区表达了在应用LOA概念方面的困难。例如，美国联邦航空管理局(FAA)在飞行路径管理系统的操作使用报告中指出，在对驾驶舱自动化的分层LOA描述中效用有限。

“‘工作小组’发现，一些操作人员从一个策略开始，该策略使用明确的自动化级别定义，以一种严格特定的方式描述为简单的层次结构。在通过培训和使用这些严格定义获得操作经验后，一些航空公司得出结论，这种描述假设了一个不存在的线性层次结构。自动飞行系统的各种特性(自动驾驶仪、飞行指挥仪、自动油门/自动推力、‘飞行管理系统’等)，可以，也正在以不同的组合独立选择，他们不适合简单的层次描述。根据这一经验，这些操作人员修改了他们的政策，允许飞行员根据情况使用适当的自动化功能组合，‘而不是严格地按照级别定义它们’。(Abbott,Mckenney, & Railsback,2013,p.55;重点强调)”

这个例子有两个原因值得注意。首先，该评论强调了在复杂的操作环境中自动化能力的混合是如何压倒简单的层次描述的。我们在工业过程中也发现了类似的困难，在这些工业中，单个自动设备的集成，如保护、控制器、脚本、例程和程序，使得自动化配置分配到层次结构的顺序级别是一种推测性的努力(skraing & Jamieson, 2017)。人为因素研究人员可能会采用由自动化阶段(Parasuraman, Sheridan， & Wickens, 2000)、系统功能(自动驾驶仪、飞行指挥仪等)或其他方式定义的多个LOA层次，而不是单一的层次。此外，它们还可以根据动态操作环境或操作者状态的联系，选择采用适应性LOA的概念(Byrne & Parasuraman, 1996)。在这样做的时候，我们可能会倾向于一种描述独特功能分配情况的理论，而不是提供对设计师有用的一般LOA预测。

其次，美国联邦航空局（FFA）的例子强调了使用严格LOA描述的操作经验的价值。相反，SAE标准描述了一个利益相关者赞同的简单抽象概念。用Kaber的话来说，标准是一种社会观念。超越自动化的六个级别，揭示了分类法的协商公式中的权衡。该分类法不包括主动安全系统和驾驶员辅助系统，如自动紧急制动和车道保持辅助(SAE, 2014, p. 2)。因此，尽管SAE的动态驾驶任务概念包括纵向和横向运动控制，但干预这些功能的自动化系统不包括在内。尽管这可能是一个有用的简化假设，但怀疑者可能想知道，这种抽象在为设计规范和监管实践提供框架方面有多少效用。

斯伦贝谢（Schlumberger）生产集团首席软件架构师克林顿·D·查普曼(Clinton D. Chapman)提供了第二个拒绝LOA概念的例子。2014年9月，他在石油工程师学会“钻井系统自动化的实施”研讨会上发表了自动化案例研究的演讲。Chapman博士回顾了Endsley和Kaber(1999)以及Sheridan和V erplank(1978)的LOA描述，并描述了钻井系统自动化技术部分是如何“在之前的5到6次会议中回顾这一观点”的。然后他问研讨会的与会者是否认为这个概念有用，没有得到任何一个积极的回应。第一作者“Jamieson”不知所措。他站起来问Champan博士他是否正确理解了博士的意思，即技术部门发现LOA概念在支持钻井自动化的发展和实施方面是没有用的。Chapman的回答是，LOA概念被认为是一个抽象概念，不适合钻井自动化设计的目的。

从业人员对LOA概念的效用存在分歧，这应该是意料之中的。与其他人为因素概念一样，基于LOA的分类法为处理棘手的设计问题提供了直观的描述和明显简洁的帮助。然而，实现分类法可能会让我们认识到，抽象不能在概念设计阶段之后继续存在。SAE分类法是否会在地面运输领域取得比航空和钻井领域更大的成功还有待观察。

对HAI设计新思维的展望

我们同意Kaber的观点，即HAI研究提出了一些正确的设计问题。但是LOA传统过早地关闭了其他问题。例如,它暗示了这个问题的答案，“自动化应该如何与人类交互？”应该是“通过限制LOA(即调整功能分配)和监视任务性能、态势感知和工作负载影响”，就好像这样做是唯一的选择。从我们的角度来看，团队隐喻(Christoffersen & Woods, 2002)和Dekker、Woods的“胡言乱语”指责是对这种不必要的缩小设计空间的回应。

LOA研究还没有解决更多的问题——通过自动化“惊喜”(Sarter & Woods, 1997)和设计经验(Guerlain, Jamieson, Bullemer，& Blair, 2002)在操作环境中发现的问题。从开发高度自动化核电站操作概念的努力中产生的问题(Jamieson等人，2014)包括:

·我们应该设计与许多独立的自动化代理在组件或子系统级别工作的人类交互，还是通过一个单一的元代理？

·设计师应该如何在人类代理之间分配与机器代理的对话?这些对话是应该由一名船员和代理人单独进行还是公开进行?与自动代理的对话应该是一个操作员的角色还是全体机组人员共同的角色?

我们在现有的LOA研究中没有发现关于这些问题的有用的指导。设计者不能等待经验主义者通过理论驱动的研究来发现相关的问题。更令人担忧的是，Kaber从确信我们有正确的问题直接跳到假设我们正在以正确的方式回答这些问题。在某种程度上，他愿意考虑人工智能建模的新方法，他认为重新开始意味着回到人类信息处理模型。为什么要做出这样的假设?在长期尝试单一策略且成功与否存疑后，研究人员还应继续使用相同的基本配方吗?或者我们应该表现出一些创造性，想出新的方法来帮助复杂工作环境中的HAI设计者?

同时，我们也不要屈服于局限于单一结构或机制的新兴民间HAI模型。虽然团队合作、信任等构像几乎肯定是预测HAI的因素;如果孤立地看待它们，它们还可能会封闭设计自由度。工程师在处理未明确规定的设计问题时必须采取务实的方法。就像Sheridan(2000)的《桥梁建造者》，他们必须从主观直觉开始，然后才能转向规范/客观工具。同样的，我们人因研究者也应该务实，不要局限于狭隘的模型。

总结

在我们看来，LOA范式已经失去了它的势头，并正在接近危机。随着科技的不断发展，新的HAI挑战也在不断涌现。没有明显的迹象表明自动化正在以这样一种方式发展，LOA框架能够准确地描述新的设计问题。我们怀疑，通过改进或寻找更有力的证据来挽救这个概念已经太晚了。LOA理论迄今为止未能解释人类在操作环境中的行为和经验，这可能是由于错误的概念和不足的事实(Jordan, 1963)。如果证据不支持对安全和生产关键工作的LOA模型的预测，我们必须愿意至少去考虑拒绝这个理论。我们不能仅仅因为缺乏应急计划，就坚持不愿接受随着时间推移而形成清晰模式的证据的指导。我们不能因为没有更好的(甚至根本没有)的“魔术袖子”而对批评者置之不理。

参考文献（略）

自动化设计的人为因素模型中的自动化等级相关推荐

云计算中的自动化运维技术及其实践
引言随着云计算技术的快速发展,云计算成为了企业数据中心的新生态,提供了更加灵活.高效.安全的 IT 基础设施和应用服务,让企业能够更加专注于业务创新和变革.但是,云计算的快速发展也带来了新的安全挑战 ...
解读BLM业务领先模型中的业务设计
第一本全方位阐述华为端到端战略管理体系的著作<华为战略管理法:DSTE实战体系>出版了!!当当网.京东均可下单购买. 解读BLM业务领先模型中的业务设计本文作者 | 谢宁,<华为战 ...
yang模型中rpc_领域驱动模型(DDD)设计讲解
一. 什么是领域驱动模型(DDD)? 领域驱动模型一种设计思想,我们又称为DDD设计思想.是一种为了解决传统设计思想带来的维护困难,沟通困难和交互困难而产生的一种新的思想.也解决了在部分公司中,一个项 ...
犀牛软件无边框编辑设计,提高模型中的工作速度
犀牛软件无边框编辑设计,提高模型中的工作速度犀牛是设计专业设计师的软件工程师之一,允许用户设计问题,因为他们做不同类型的模型.在犀牛中建立等级的原则是建立边缘.为了在犀牛环境中建模,在空间中创建一个 ...
CUDA上深度学习模型量化的自动化优化
CUDA上深度学习模型量化的自动化优化深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参数 ...
论文翻译：道德判断模型中的伦理和统计考虑
Ethical and Statistical Considerations in Models of Moral Judgments 摘要这项工作扩展了道德决策计算模型的最新进展,通过使用数学和哲 ...
Paper之ACMCHUISTICUCIJHC：2009年~2019年人机交互技术(计算系统人为因素会议用户界面软件计算国际会议国际人类计算机研究人机交互的交易)历年最佳论文简介及其解读
Paper之ACMCHI&UIST&ICUC&IJHC&TCHI:2009年~2019年人机交互技术(ACM CHI计算系统人为因素会议&ACM用户界面软件和技 ...
计算机配色标准白板,计算机配色模型中存在的限制点
计算机配色发展了许多年,但仍不能满足使用需求,归根结底是由于其理论存在一些问题,使得其应用受到一定限制.如果可以找到这些限制点并加以修正,则有可能优化理论模型.提升配色性能. 一.传统配色模型中存在的 ...
多因素方差分析中预测因素的筛多_用回归来理解方差分析（二）：两因素方差分析...
1 两因素方差分析的形式多因素方差分析针对的是多因素完全随机设计.包含两个及以上的自变量,为便于讲解,本文以两因素方差分析为例. 在一个两因素完全随机设计中,自变量包含 ,共个水平.自变量包含 ...

自动化设计的人为因素模型中的自动化等级

自动化设计的人为因素模型中的自动化等级相关推荐

最新文章

热门文章