好的。昨天介绍了乌克兰的态势感知信息系统。其中用到了美国空军前首席科学家 Mica Endsley 提出的著名的态势感知模型
今天继续结合这个态势感知模型,介绍下态势感知的作战试验鉴定(OT)。这项研究的研究人员,是人因工程和人因心理学的专家,来自美国国防部试验鉴定社区。
这项研究,本人认为还是很有价值的。其中介绍的方法和思路,如果与未来战争中的JADC2、多域作战、AI HMT人机编队、任务规划、未来指控/ISR等场景结合,还是有很多可以深入研究的地方的。
本文适合阅读对象:
  • 试验鉴定人员
  • 指控系统、C4ISR 系统设计人员
  • 态势感知、信息(情报)融合算法设计开发人员
  • 人因工程、工业心理学、人因心理学、实验心理学研究人员
  • JADC2、多域战研究人员
  • AI HMT 研究人员
  • 无人自主蜂群研究人员
  • 任务规划系统研究人员
  • 情境感知研究人员
  • ……

这份态势感知作战试验鉴定的研究材料,及 Endsley 态势感知模型、陆军任务指挥决策流程,浙大心理学和行为系 HMT 人机协同态势感知等相关资料,如果您需要的话,可以扫下面的二维码,加入圈子即可下载。圈子中的文档编号:SDW152333

注1:本文由于主要用于军事场景,对 Situation Awarenes(SA), 统一称之为态势感知,不用情境感知这个翻译。
注2:原文很多内容没有画图,我用生成式 AI 画了几张图,便于读者同志更直观地理解。

1. 试验鉴定社区的统一的态势感知模型

这项研究指出,在试验鉴定社区,对态势感知的理解不统一。这种不统一的理解,会影响试验鉴定社区对态势感知的试验鉴定。

所以这项研究的研究者就建议,采用美国空军前首席科学家 Mica Endsley 提出的态势感知模型,作为试验鉴定社区的统一模型(下图)。


其中,1级感知环境要素,2级整合信息并理解当前态势,3级基于现状预测未来。

这个态势感知模型,突出“任务关键信息而非全量数据”,强调感知-理解-预测的迭代循环受个人经验、系统自动化和工作负荷调节,可直接映射到军事领域的OODA环。

此外,值得指出的是,这个态势模型为复杂的多域作战、人机协同、AI算法战等预留了扩展接口,以此指导客观、分级的态势感知测量。

注3:对这个模型预留接口进行扩展的案例,可以参考昨天的介绍乌克兰态势感知信息系统的文章(下图)。
俄乌冲突中乌克兰陆军基于人工智能和星链的作战态势感知

这项研究建议试验鉴定社区采用 Endsley 态势感知模型。其主要理由,可归纳为如下五点:

  1. 共识基础
    Endsley 模型是学术界与工程界引用最广的个体态势感知模型,能为缺乏统一术语的试验鉴定社区提供共同语言,减少“何为态势感知”的争议。

  2. 军事决策兼容
    其“感知-理解-预测”三级结构,可直接映射到军事领域常用的OODA环(观察-调整-决策-行动)和美军军事条令中的任务指挥决策流程,确保测试指标与作战流程一致。

  3. 灵活可扩展
    模型预留了个人经验、自动化、工作负荷等调节变量接口,既能解释当前单兵/单一系统,也为未来多域协同、人机编队等更复杂场景预留扩展空间。

  4. 可测量性
    三个级别分别对应可操作的测量需求:1级“看到什么”、2级“意味着什么”、3级“下一步会怎样”,为设计问卷、实时提问或行为指标提供明确指导。

  5. 降低风险
    避免仅凭任务成败推断态势感知的误区。Endsley 模型将态势感知看做“刺激-反应”之间的概率性的中介因素。这种概率观点,可以让作战测试人员采用更客观的专用测量手段,防止因“测试表现好=态势感知好”而漏掉潜在的系统缺陷。



联合全域指控下,态势感知的作战试验鉴定
2. 如何测试态势感知?

对态势感知进行试验鉴定,实际上是让操作人员通过被测系统的界面,来完成任务。与此同时,测试人员选择不同的测量方法,对操作人员的态势感知进行测试和评估


注4:这里说的操作人员,可以是平台操作人员(飞行员、坦克驾驶员、)、传感器(雷达红外声呐光电卫星…)操作人员、指挥所里的指挥官/参谋、动能非动能效果操作人员、通信信号电磁频谱操作人员、后勤保障人员等等。

被测系统有两类,一类是专门用来提高态势感知能力的系统,比如指控系统、ISR系统等;还有一类不是专门用来提高态势感知能力的系统,但是也需要有一定的态势感知能力。

对这两类被测系统的态势感知的测量防腐厂,是不同的。

有了试验鉴定的 Endsley 态势感知统一模型,试验鉴定社区,就可以针对该模型中的三个等级(1级到3级),采取合适的方式进行测试。



    3. 四类态势感知的测量方法
    这项研究详细介绍了四类测量操作人员的态势感知的方式。
    其中前面三类方法,都是试验鉴定社区已经在采用的方法。第四类方法,即关键信息要素法,则是这项研究的研究人员提出来的。第四类方法,也是这个研究的研究人员认为未来很有潜力的方式。
      • 问卷调查法:通过问卷量表收集操作人员或观察者对态势感知(态势感知)的主观评价,如SART或MARS,无需暂停任务,任务后快速填写即可。但结果易受记忆偏差影响,且与真实的态势感知关联较弱,适用于初步筛查或资源受限场景,需警惕其低敏感性与弱预测效度。

      • 行为分析法:通过记录操作行为(反应时间、生理信号等)间接推断态势感知,无需中断任务,可连续采集。但需大量前期工作(如GDTA)确定行为与态势感知的映射关系,且无法区分态势感知的三个等级,验证难度大,适合补充其他方法。

      • 提问回答法:在模拟任务中直接提问操作人员(如SAGAT/SPAM),实时测试操作人员的感知、理解与预测能力,结果客观可靠。但需暂停任务(SAGAT停止模拟,SPAM等待低负荷),且依赖高保真模拟环境和定制化问题设计,工作量高。

      • 关键信息要素法:利用军事任务中“关键信息要素(EEI)”的收集报告(如准确性、时效性)评估态势感知,无需暂停任务,直接嵌入作战流程。优势是贴合实战,但需预定义关键信息要素的标准,动态任务中控制变量困难,目前尚未充分验证。


      下面是上面四类方法中,用到的具体测量方法的简要说明:
      • SART:三维度自评量表,测操作人员的理解、注意需求/供给。任务后由操作人员填,易疲劳,与操作人员的表现弱相关。

      • MARS:步兵专用自评,覆盖感知理解预测三个层级,未验证与操作人员的表现关联,任务完成后快速填写。

      • SAGAT:操作人员通过模拟器操作,测试人员暂停模拟器时提问,测三级态势感知,然后与真值对照。

      • SPAM:操作人员通过模拟器操作,操作人员低负荷时测试人员在线提问,记录反应时与正确率,模拟环境下持续测态势感知。

      • GDTA:推荐的情境感知测量前置步骤:通过结构化访谈领域专家,逐层梳理操作人员在特定任务中的目标、关键决策及所需信息,明确对应Endsley 模型的三级的1级感知要素、2级理解整合、3级预测需求,从而量身定制问卷、提问或行为指标,确保测量紧贴任务而非通用模板。

      • EEI:军事行动中任务规划和任务执行过程中所需的关键要素信息。


      下表为根据这项研究,整理的四类不同态势感知测量方式的对比。

      4. 为什么要采用关键要素信息法?
      用关键要素信息法的关键原因,在于可以重用部队里已有的信息 EEI(关键要素信息)。
      兄弟之前介绍的两项可解释性的研究,都利用了原有的信息或评估方式。
      一个研究直接重用了任务规划器输出的任务元素之间的依赖关系。
      无人自主集群的作战任务规划可解释性研究
      另一个研究则直接重用了 ICD 203 这个情报界原本就遵循的情报分析过程的标准。
      AI 多源信息(情报)融合的可解释性研究
      对于态势感知的试验鉴定来说,也是采用了类似的思路——即基于已有的EEI信息,就像多源情报融合的测量时,直接拿了情报界(IC)的 ICD 203 这个情报分析过程评估标准一样。

      EEI 直接取自作战情报流程,指标天然与任务关键信息对齐,无需额外设计问答。在基于EEI 进行态势感知的测量时,测量得到的测量结果,直接嵌入真实指挥链,零中断、高实战度。依托既有情报报告可实时量化“感知-理解-预测”成效,降低测量成本且保持战场真实性。

      具体什么是EEI(关键要素信息)就不介绍了,大家可以参考相应的作战条令,比如美国陆军的任务指挥的作战条令

      #artContent img{max-width:656px;} #artContent h1{font-size:16px;font-weight: 400;}#artContent p img{float:none !important;}#artContent table{width:100% !important;}