第二届雷达探测感知大会于9月21日在西安顺利召开,“后羿”雷达数据处理基础模型会上首次公开发布。
后羿模型被定位为雷达数据处理领域的“YOLO”,是一个面向开发者发布的雷达数据处理基础模型。其目标在于变革雷达数据处理的开发模式,构建从点迹到航迹的端到端全流程基础模型,从而在增强雷达数据处理能力的同时显著提升设计人员的开发效率。
后羿模型的雏形诞生于2024年,在输入设计上,模型遵循第一性原理,采用多雷达系统共有的通用属性作为输入特征。模型架构以多头注意力机制为核心,采用多层堆叠方式构建。模型输出以深度特征为核心,目前已基于该特征拓展了点迹分类与跟踪任务,并正在向识别与操控等方向延伸。
后羿基础模型已在十余部雷达系统中开展验证,均实现超过90%的准确率,具备泛化性强的特点。基于预训练-微调的范式,后羿基础模型能够快速赋能具体系统,如在空管雷达系统中利用精标注数据进行微调,可达到99%的准确率。
原文引用格式
叶宇,叶星炜,欧阳可赛,等.后羿基础模型:’预训练-微调’范式下的雷达数据智能处理方法[J].现代雷达,2025,47(8):1-9.
YE Yu,YE Xingwei,OUYANG Kesai,et al.Houyi foundation model:intelligent radar processing method based on pre-training-fine-tuning paradigm[J].Modern Radar,2025,
47(8):1-9.
DOI:10.16592/j.cnki.1004-7859.2025052701
总体思路
首先,指出传统雷达数据处理算法及当前基于人工智能技术的雷达数据处理算法存在的问题,如传统算法调参难、升级成本高,AI算法手工提取特征工作量大、泛化性不足等。
接着,借鉴大语言模型“预训练-微调”范式,提出雷达数据智能处理方法,构建“后羿”基础模型,阐述该模型的技术基础(Transformer架构)、核心任务(虚警抑制、关联、滤波)及数据构建方式(仿真与实测结合)。然后,详细介绍模型架构设计、数据工程、基础模型预训练和模型微调等关键环节,包括模型各模块组成、数据标注与数据集构建、预训练的训练模式与损失函数、不同微调方法的适用场景等。
之后,通过实验验证,设置实验参数与评估指标,对比“后羿”模型与传统多假设跟踪方法在各项指标上的性能,分析不同数据量下适用的微调方式。最后,总结研究成果,指出“后羿”模型的开源特性与优势,展望其在下游任务扩展和上游信息扩展方面的应用前景,以期推动智能化技术在雷达领域的应用落地。
总体大纲
0 引言
雷达数据处理的定义与主要环节,包括虚警抑制、目标起始、航迹维护等。
传统雷达数据处理算法的发展与局限,如依赖人工经验、逐场景调参成本高、难以应对复杂环境等。
人工智能技术在雷达数据处理领域的应用进展与瓶颈,如杂波抑制、多目标航迹关联方面的进展,以及泛化性能差、数据标注难、分立小模型信息丢失等瓶颈。
本文研究目的与主要创新点,即提出“预训练-微调”范式、构建多任务一体化网络架构、验证微调方法性能边界、发布基础模型。
1 处理范式与模型原理
1.1 预训练与微调技术
“预训练-微调”范式的核心思想与发展历程,包括其在深度学习各领域的应用及优势。
预训练技术的多元化路径,如NLP领域的自编码与自回归预训练架构,计算机视觉领域的有监督与无监督预训练方法。
不同微调方法的特点与适用场景,如全参数微调、部分参数微调、LoRA微调。
“预训练-微调”范式在雷达信息处理领域的应用意义,解决小模型重复开发、泛化性不足等问题。
1.2 Transformer模型
Transformer模型的提出与核心优势,如处理长距离依赖、并行处理能力、灵活性与可扩展性。
Transformer在雷达数据处理中的适配性,如注意力机制与点航迹关联任务的契合,提升跟踪稳健性与效率,减少人工超参数。

2 后羿基础模型架构设计与构建
2.1 模型架构设计
模型输入与输出,输入为多圈点迹特征张量,输出为滤波后航迹坐标及相关跟踪信息。
模型核心模块组成,包括嵌入层、Transformer编码器层、虚警抑制模块、目标关联模块、点迹滤波模块、输出层。
各模块功能与网络结构参数,如嵌入层的线性映射与位置编码,编码器层的多头自注意力与前馈网络,各模块的输入输出尺寸与细节说明。
2.2 数据工程
数据标注的重要性与模型训练各阶段对数据标签质量的要求,预训练用粗标注数据,微调用精标注数据,长尾演进用针对性标注数据。
雷达数据集的构建方式,结合实测与仿真数据,仿真数据包含目标回波、杂波、噪声数据,说明各类数据的建模方法与特征。
仿真目标类型及相关参数,如民航飞机、军用飞机等的速度与雷达散射截面积统计值。
2.3 基础模型预训练
训练数据集的构成,多型雷达探测数据与仿真数据结合,数据规模与覆盖场景。
训练数据的处理方式,以雷达扫描圈为时序单元,对特征标准化,构建序列样本。
预训练过程的关键策略,包括增量式训练、余弦退火动态学习率、梯度裁剪、抗遗忘数据回放机制。
多任务联合优化的损失函数,包括Dice损失、Focal损失、Attention损失、Huber损失的表达式与作用。
2.4 模型微调
雷达实际应用中模型泛化能力面临的挑战,场景依赖性强、数据分布变化大。
不同微调方法的原理与适用场景分析,全参数微调、部分参数微调、LoRA微调的特点与适用的数据规模、任务差异情况。
3 实验验证及对比分析
3.1 实验设置
实验训练参数,包括学习率、批尺寸、训练终止条件(F1分数指标稳定)。
模型训练过程的评估指标,如准确率、精确率、召回率、F1分数、Dice指标,说明各指标含义。
模型实装性能评估指标与基准,漏情率、虚警率、起批时延、连续性、滤波精度,以二次雷达航迹及ADS-B结合人工确认为基准。
3.2 实验结果
仿真数据场景设计,包括简单场景(4条航迹、高斯噪声)与复杂场景(37条航迹、高斯杂波)的点迹生成情况。
实验结果图表展示,简单与复杂场景下原始点迹图、智能算法与传统算法处理后的时间-距离图和方位距离图。
性能对比分析,“后羿”模型与传统多假设跟踪方法在虚警率、漏情率、起批时延、连续性、滤波精度上的对比数据,突出模型优势。
主要结论
传统雷达数据处理技术在复杂探测环境下存在性能不足、适应动态变化能力差、开发维护成本高的局限,基于神经网络的小型模型也未解决定制化开发效率低和泛化能力不足的问题。
“后羿”基础模型采用“预训练-微调”范式,以Transformer为基础模块,通过多系统、多场景的海量仿真与实测数据预训练,具备强泛化性与鲁棒性,有效解决了传统算法与小型模型的瓶颈问题。
实验验证表明,“后羿”模型在虚警率、漏情率、起批时延、连续性、滤波精度等核心指标上显著优于传统多假设跟踪方法,如虚警率和漏情率显著下降,起批时延缩短,连续性和滤波精度大幅提升。
不同数据量下需选择适配的微调方式:数据极少时LoRA微调高效且避免过拟合;数据适中时部分参数微调平衡效率与性能;数据充足时全参数微调可最大程度挖掘模型潜力,实现性能最优化。
“后羿”基础模型已全面开源,具有较强的雷达数据深度理解与表达能力,且扩展性良好,前端输入和后端输出可适应不同任务和场景,为雷达AI开发提供标准化流水线,有望变革雷达智能处理算法开发模式,加速智能化技术在雷达领域的应用落地,同时在下游军事任务扩展和上游多模态信息协同方面具有广阔应用前景。
主要图表
#artContent h1{font-size:16px;font-weight: 400;}#artContent p img{float:none !important;}#artContent table{width:100% !important;}