摘要
本文提出一种LSTM-AMSgrad方法建立立式辊磨机(立磨)压差数据驱动模型。首先,对影响立磨压差预测的相关参数数据进行Min-Max归一化处理,为模型预测提供数据支撑,然后基于LSTM搭建预测模型,并采用AMSgrad优化算法对其进行迭代训练,得到最优的LSTM-AMSgrad压差模型。研究结果表明,该模型拟合度为0.65,预测平均绝对误差为29.19 Pa,可有效指导立磨优化控制系统。
0 引言

立磨是水泥、冶金、电力等行业广泛使用的一种设备,其性能直接影响到企业的生产效率和能源消耗。立磨压差是立磨运行过程中的一个重要参数,其对于立磨的稳定运行至关重要,直接影响立磨的工作状态。因此,对立磨压差的准确预测具有重要意义,由于立磨系统具有时序性和非线性特征,传统的压差预测方法难以满足实际需求。近年来,深度学习技术在时序数据处理和非线性建模方面取得了显著进展,为立磨压差预测提供了新的思路。长短时记忆网络(LSTM)是一种特殊的循环神经网络(RNN),具有较强的时序数据处理能力,它可以学习长期依赖关系,避免了传统RNN的梯度消失和梯度爆炸问题。AMSgrad优化器是一种自适应学习率的优化器,可以有效避免梯度下降过程中的不稳定性问题。因此,本文提出了一种基于LSTM-AMSgrad的立磨压差预测方法,以期为立磨的稳定运行提供有力支持。

1 LSTM预测模型

LSTM是RNN的一种变体,在处理时序数据时具有较强的学习能力和泛化能力。LSTM模型由多个LSTM单元组成,每个LSTM单元都有自己的输入门、遗忘门和输出门。它不仅能够记住过去的信息,而且可以选择性地忘记或输出这些信息,这使得LSTM在处理长期依赖关系时比传统的RNN更为有效。LSTM模型结构如图1所示。

LSTM模型计算过程如下:

(1)遗忘门:控制上一时刻的隐藏状态对当前时刻的贡献程度,通过 sigmoid函数生成一个0到1之间的值,表示需要遗忘的比例,记为。

图1 LSTM模型结构

式中:

Wf——遗忘门的递归连接权重;

h(t−1)——t1时刻的输出;

x(t)——t时刻的输入;

bf——遗忘门的偏置矩阵。

(2)输入门:控制当前时刻网络的输入信息量,通过sigmoid函数生成一个 0到1之间的值,表示允许通过的信息比例,记为i(t)。

式中:

i——当前网络层;

Wi——sigmoid函数的权重;

bi——sigmoid函数的偏置;

C~(t)——t时刻的输入节点状态;

C(t)——t时刻的记忆单元;

C(t−1)——时刻t的记忆单元;

Wc——tanh函数的权重;

bc——tanh函数的偏置。

(3)输出门:控制当前时刻网络的输出信息量,通过sigmoid函数生成一个0到1之间的值,表示允许通过的信息比例,记为o(t)。

式中:

Wo——t输出门的权重;

bo——t输出门的偏置矩阵。

2 AMSgrad优化算法

AMSgrad优化算法由Reddi等于2018年提出,其在Adam算法的基础上进行了改进,引入了一个状态变量,通过维护一个历史梯度平方和的指数移动平均,来自适应地调整学习率,可以防止梯度下降过程中学习率过大导致的震荡或发散现象的发生,提高模型的收敛速度和稳定性。

AMSgrad优化算法公式如下:

技术 | 基于LSTM-AMSgrad的立磨压差预测研究

其中:

式中:

wt+1——第t+1次迭代的参数更新;

wt——第t次迭代的参数更新;

α——初始学习率;

St——t次迭代的梯度平方累计值;

St−1——t −1次迭代的梯度平方累计值;

Vt——次迭代的累计梯度更新;

Vt−1——t −1次迭代的累计梯度更新;

β 、β2——梯度衰减因子;

ε——用于数值稳定的小常数,默认为10-8;

Sˆt——St的偏差纠正。

3 建立LSTM-AMSgrad立磨压差预测模型

基于深度学习框架建立LSTM立磨压差预测模型,它能够有效地处理时间序列数据,在其训练过程中,设定模型的均方误差MSE为损失函数,结合AMSgrad算法在优化过程中保持二阶动量的单调递增性,能有效捕捉时间序列数据中长期依赖关系,计算更新出模型的最佳网络参数,构建LSTM-AMSgrad的立磨压差预测模型,如图2所示,实现更精准的建模预测。

图2 LSTM-AMSgrad预测模型建立流程

本文从某矿渣厂立磨控制系统数据库中选择稳定工况下运行的932组立磨压差历史数据,通过工艺机理及数据相关性分析,选取喂料量和出磨负压作为模型的输入量预测立磨压差。

首先,对原始样本数据进行Min-Max归一化处理,消除不同特征之间的量纲差异,然后选择80%的原始数据作为训练样本,用于模型训练,其余数据作为测试样本,用于模型预测。

搭建深度学习环境,基于TensorFlow底层库,以 Keras建立LSTM-AMSgrad模型,第一层LSTM层神经元数50,第二层LSTM层神经元数128,全连接层神经元为1,激活函数使用ReLU函数,增加Dropout层(参数设为0.1)防止过拟合,并基于AMSgrad算法进行优化,学习率设为0.001,梯度衰减因子β 、β2、分别设为0.9和0.999,迭代次数设为120,构建LSTM-AMSgrad立磨压差预测模型。立磨压差测试集预测数据曲线如图3所示,判断该模型的一个重要指标相对百分比误差

,其测试集预测误差曲线如图4所示。

图3 LSTM-AMSgrad立磨压差预测

图4 LSTM-AMSgrad预测误差

另外,RMSprop和Nadam两种优化方法在训练神经网络时都可有效加快收敛速度并提高训练稳定性。RMSprop是一种基于梯度下降的优化器算法,具有自适应学习率的特性,能够加速收敛过程,而Nadam是Adam算法的改进形式,在梯度下降过程中考虑Nesterov动量和自适应学习率调整,能有效处理不同参数的学习率。基于以上两种方法优化LSTM模型分别预测立磨压差,结果如图5~图8所示。

图5 LSTM-RMSprop模型立磨压差预测结果

图6 LSTM-RMSprop模型立磨压差预测误差

图7 LSTM-Nadam模型立磨压差预测结果

图8 LSTM-Nadam模型立磨压差预测误差

上述三种模型预测结果的相关分析指标见表1。

表1 三种方法预测立磨压差的相关分析指标对比

从表1可以看到,LSTM-AMSgrad模型拟合度为0.65,相较于其他两种模型较大,均方根误差和平均绝对误差分别为37.84 Pa和29.19 Pa,相较于另两种模型较小,说明基于LSTM-AMSgrad算法的立磨压差模型相比之下预测精度更高。

4 结束语

本文提出一种基于LSTM-AMSgrad的立磨压差预测方法,仿真结果表明,该方法能够有效地预测立磨压差,可指导立磨优化控制系统,为立磨的稳定运行提供有力支持。在未来的研究中,我们可以进一步考虑将更多先进的时序数据处理技术和优化算法应用于立磨压差预测任务,以提高预测精度和效率。

作者单位:合肥水泥研究设计院有限公司

文章来源:《水泥》杂志第11期