摘要
为更加精准地预测滚动轴承剩余寿命,提出一种基于多策略改进河马优化(TOBCHO)算法与双向门控循环单元(BiGRU)融合的轴承寿命预测方法。首先,对全寿命周期信号进行特征提取,通过构建基于相关性、单调性和鲁棒性综合评价指标,筛选出敏感特征向量作为敏感特征集,并采用主成分分析(PCA)技术构建健康指标曲线。其次,针对BiGRU在滚动轴承寿命预测研究超参数难以确定的问题,提出多策略改进河马算法优化BiGRU的寿命预测模型(TOBCHO-BiGRU),该模型在河马算法种群初始化阶段引入最优最差对立学习机制,生成对立解扩展搜索空间;采用混沌映射序列替代传统随机数的生成方式以解决算法收敛不稳定的问题;在HO迭代后期引入最优个体自适应分布扰动策略,通过动态调整扰动强度以实现局部开发与全局搜索能力的平衡。最后,通过在国际通用的IEEE PHM 2012轴承数据集上进行实验验证,并与其他多种预测模型进行对比分析,结果充分证明了所提TOBCHO-BiGRU方法在预测精度方面具有显著优势。消融实验结果表明,各改进策略之间存在正向协同效应,共同促进河马优化算法性能的提升,为复杂工况下的滚动轴承寿命预测提供了高精度解决方案。
Abstract
To predict the remaining life of rolling bearings more accurately, this paper proposed a bearing life prediction method based on the fusion of the multi-strategy hippopotamus algorithm (TOBCHO: adaptive t-distribution, optimal-worst opposite learning, and chaos mapping) and bi-directional gated recurrent unit (BiGRU). Firstly, feature extraction was performed for the whole life cycle signal, and comprehensive evaluation indexes were established based on correlation, monotonicity, and robustness. Sensitive feature vectors were screened as the sensitive feature set, and principal component analysis (PCA) technology was used to construct the health index curve. Then, for the problem that it was difficult for BiGRU to determine the hyperparameters in rolling bearing life prediction research, a life prediction model of TOBCHO-optimized BiGRU (TOBCHO-BiGRU) was proposed, which introduced the optimal worst opposition-based learning mechanism in the population initialization stage of the hippopotamus algorithm and generated the opposing solution to expand the search space. The chaos mapping sequence was adopted to replace the generation of random numbers to solve the problem of unstable convergence of the algorithm. The adaptive distribution perturbation strategy for optimal individual was introduced in the late iteration stage of the hippopotamus optimization (HO) algorithm, and the perturbation strength was dynamically adjusted to balance the local development and global search capability. Finally, the experimental validation was conducted on the internationally used IEEE PHM 2012 bearing dataset, and the proposed model was compared with a variety of other prediction models. The results adequately show that the proposed TOBCHO-BiGRU method has a significant advantage in terms of prediction accuracy. Ablation experiment results demonstrate that there are positive synergistic effects among improvement strategies, promoting the enhancement of the HO algorithm, which provides a high-precision solution for the rolling bearing life prediction under complex working conditions.
近年来,随着现代工业的快速发展,大型设备部件趋于复杂化、多功能化,滚动轴承已广泛应用于机械[1]、电力系统[2],以及航空航天[3]等领域。在高强度环境下运行的滚动轴承容易造成损坏和失效,主要原因是旋转机械本身所引起[4]。因此,开发有效的方法来评估轴承当前的健康状态并预测其剩余使用寿命(remaining useful life,RUL),对于预防事故的发生具有极其重要的意义。轴承寿命定义标准通常以疲劳寿命为核心,即90%的同类轴承在相同工况下因滚动接触疲劳导致材料剥落前的运行周期。然而,这一传统方法仅适用于理想化的载荷与润滑条件,未涵盖实际工况的多因素耦合失效(如润滑劣化、污染磨损或安装误差)。因此,工程实践中常根据轴承的功能退化特性重新界定寿命终点。例如,在精密机床或航空航天设备中,轴承寿命可能定义为振动幅值超过 GB/T6075《机械振动在非旋转部件上测量评价机器的振动》规定的标准阈值或旋转精度丧失的时间节点。随着状态监测技术的发展,轴承寿命的定义进一步向动态量化和剩余使用寿命(RUL)预测延伸。基于实时采集的振动、温度或声发射信号,通过特征提取(如包络谱分析、时域指标计算)建立退化轨迹模型,并以首达时间(first hitting time)或退化曲线拐点作为寿命终止标志。例如,当振动信号的均方根值(root mean square,RMS)持续增长至初始值的3倍,或故障频率谐波能量占比超过30%时,可判定轴承进入失效临界状态。这种数据驱动的定义方法显著提升了寿命预测的工程适用性,但其有效性依赖于明确的失效阈值设定与退化阶段划分。
当前主要的轴承剩余使用寿命预测方法大致可分为3类:基于物理模型的方法[5]、基于统计模型的方法[6]和数据驱动方法[7]。基于物理的方法描述滚动轴承的退化机制,并据此估计和推断当前及未来的退化过程[8];基于统计模型的方法通过构建随机退化模型来预测轴承的RUL值。由于上述方法需要满足特定的数据分布条件且依赖大量的专家知识,故存在一定的局限性。
不同于上述方法,基于数据驱动方法的本质是将设备性能的衰退过程视为健康状态映射到监测数据的关系模型。为了表征轴承的健康状态,大量研究工作通过引入机器学习算法和其他智能技术进行建模。为了滚动轴承寿命的准确预测,Ahmad等[9]构建一种量纲一的健康指标(health index,HI)来推断轴承的运行状态,利用动态回归模型预测RUL。Yu等[10]利用RNN自编码器对基于相似性的RUL预测方法进行了改进,以提高对轴承寿命的预测。孙志伟等[11]利用长短时记忆(long short-term memory,LSTM)网络模型预测岸桥起升减速箱轴承寿命,结合约束感知粒子滤波(constrained aware particle filter,CAPF)方法预测轴承退化状态和RUL。Chen等[12]使用新型递归神经网络——门控循环单元(gated recurrent unit,GRU)来预测数据非线性退化过程,通过对C-MAPSS-Data案例研究,证明该预测模型在提升预测精度的同时,减少了训练所需要的时间。各种浅层模型的机器学习算法,包括支持向量机(support vector machine,SVM)[13]、高斯过程回归(Gaussian process regression,GPR)[14]、隐马尔可夫模型[15]等均能应用于轴承剩余使用寿命的预测中。相较于基于物理模型和统计模型的方法,基于机器学习的方法能够进一步提升预测效果。
随着深度学习的快速发展,基于深度学习的方法可以有效地挖掘有关轴承退化过程的知识,被广泛用于从历史数据中学习退化的经验模式。例如,长短时记忆(LSTM)网络[16]是递归神经网络(recurrent neural network,RNN)的一种,因此LSTM在处理时间序列数据时,能够有效捕捉时间依赖性,特别在轴承剩余使用寿命领域上表现出色。作为LSTM的优秀变体,门控循环单元(GRU)具有更简洁的网络结构,仅包含两个门,且不牺牲预测精度[17]。双向门控循环单元(bi-directional gated recurrent unit,BiGRU)通过增加双向递归层来利用时间序列的前向和后向信息,进一步提高了模型的预测能力。BiGRU在有效性、稳定性和准确性方面的表现被广泛认可[18]。但是,BiGRU的预测精度受超参数影响较大,为解决此问题,王晓鹏等[19]采用粒子群优化(particle swarm optimization,PSO)算法结合BiGRU与卷积神经网络(convolutional neural network,CNN)构造PSO-CNN-BiGRU滚动轴承寿命预测模型,该方法可以有效消除多种工作条件的影响,为复杂系统的剩余寿命预测研究带来很好的参考价值。高新勤等[20]提出了一种基于多尺度卷积神经网络(multi-scale convolutional neural network,MCNN)和双向门控循环单元(BiGRU)的特征提取模型,对工况数据进行特征挖掘,并通过粒子群优化(PSO)算法优化模型超参数。魏熙朋等[21]利用4个评价指标对从滚动轴承振动信号中提取出来的时域、频域,以及时频域特征进行筛选,构建敏感退化特征集,提出了一种基于稀疏自编码器(sparse autoencoder,SAE)和双向门控循环单元(BiGRU)的剩余寿命预测方法。由此可见,利用元启发式算法结合寿命预测模型,可以有效解决预测模型受超参数影响的问题。
尽管现有智能优化算法在超参数调优中取得一定进展,BiGRU模型的性能高度依赖超参数的选择[22],因此在滚动轴承RUL预测任务中仍面临以下局限:轴承退化数据具有强非平稳性与时序依赖性,超参数搜索空间维度高且非线性,传统算法易陷入局部最优;RUL预测要求算法在训练初期广泛探索参数空间,后期精准收敛,而多数算法依赖固定搜索策略,难以动态适配;工业数据噪声干扰显著,需优化算法兼具鲁棒性与正则化约束能力。
河马优化算法(hippopotamus optimization algorithm,HO)[23]作为一种新型仿生优化器,模拟河马群体觅食与社交行为,由个体觅食到群体协作的分层搜索机制天然适配高维非线性优化问题。HO的初始版本能够在训练初期广泛搜索超参数空间,避免因初始化不足造成模型性能下降;在训练后期,HO通过群体协作,集中搜索高适应度区域,提升模型的抗噪能力。此外,HO的仿生特性能够平衡探索与开发,而BiGRU的门控机制则要求优化算法具备自适应能力,以便应对超参数的动态变化。因此,HO与BiGRU的结合能够有效提升模型的性能。
然而,原始HO仍存在收敛速度慢、迭代后期易振荡等缺陷,限制了其在复杂时序模型优化中的应用。为此,本文提出多策略改进的TOBCHO算法,旨在保留HO仿生优势的同时,克服其工程适配性瓶颈,以满足BiGRU超参数优化的特殊需求。
因此,为解决上述BiGRU预测模型受到超参数影响较大的问题,本文提出一种多策略方法改进河马算法(multi-strategy hippopotamus algorithm,TOBCHO)优化BiGRU的滚动轴承寿命预测方法。首先,为解决河马优化算法全局搜索能力不足,容易陷入局部最优的问题,利用最优最差对立学习方法、混沌映射序列方法和自适应分布技术分别改进河马搜索算法的不同阶段。其次,利用已构建的TOBCHO方法优化BiGRU超参数,以提高BiGRU对滚轴轴承剩余使用寿命的预测性能。最后,结合消融实验对本文模型分析验证,检验本文预测模型的可行性与优越性。
1 改进的河马优化算法
1.1 原始河马优化算法
2024年,Amiri等[23]从河马种群的行为特性受到启发,研究出河马优化算法(HO)。HO具有稳定性高、寻优能力强、收敛性高、快速识别最优解等特点。尤其是在工程实践应用当中,HO通过采用高效的本地搜索策略,找到最佳解决方案。该算法从河马生活中观察到的3种突出的行为模式中获得灵感,由河马群在水中的空间定位、面对威胁的防御策略,以及躲避捕食者的技术3个不同阶段组成。
阶段1 河马在水域中的位置更新。
群中雄性河马成员在水域中位置的数学表示为
(1)
式中:为雄性河马的位置,xi,j为生成的初始解,hippoD为优势河马的位置。
(2)
式中:r1,···,4为0~1之间的随机向量,r5为0~1之间的随机数,I1、I2为1~2之间的整数,Q1、Q2为1或0的整数随机数。
(3)
式(4)、(5)表示雌性或未成熟河马在兽群中的位置()。
(4)
(5)
式中:gMi为随机选择的部分河马平均值,y1为0~1之间的随机数。h1、h2为从h方程中5种场景中随机选取的数字或向量,r7为0~1之间的随机数,Fi为目标函数值。该阶段具有较好的全局搜索性能,提高算法的搜索速度。
阶段2 河马防御掠食者。
捕食者在搜索空间中的位置为
(6)
(7)
式中:r8为0~1的随机向量。若>Fi,河马做出防御。如果捕食者 较大,表明捕食者较远。
(8)
式中:是河马面对捕食者的位置,δ为2~4之间的均匀随机数,c为1.0~1.5之间的均匀随机数,D为2~3之间的均匀随机数,g为-1~1之间的均匀随机数,r9为维数为1×m的随机向量(m为算法中决策变量的个数),RL是一个具有Levy分布的随机向量。
(9)
式中,>F,该河马已被猎杀,否则捕食者逃跑,该河马将返回群中。在河马算法阶段2,河马算法在全局搜索过程中观察到显著增强。
阶段3 河马逃离捕食者。
模拟河马逃离捕食者并找到安全位置为
(10)
式中:t为当前迭代,T为最大迭代MaxIter。
(11)
(12)
式中:为寻找最近安全位置的河马的位置; s1为扰动因子,其值从3种场景中随机选取(见式(12)); s为随机的向量或选取的数字,考虑在3种场景中找到更适合的局部搜索; r11为0~1之间的随机向量; r10、r13为0~1范围内的随机数; r12为正态分布随机数。
(13)
该阶段增强河马在局部搜索中的开发能力。HO算法每次迭代完成后,根据阶段1~3,即根据式(1)~(13)更新种群的过程,更新所有种群成员。式(1)~(13)一直持续到最后的迭代。
1.2 改进的河马优化算法
因此,本文针对提升河马优化算法维持种群的独立性以防止过早收敛,并确保种群间交互性的性能和存在局部最优的问题,在种群初始化阶段、河马算法的阶段1,以及迭代过程结束阶段进行了优化。
1.2.1 最优最差对立学习
在种群进化过程中,最优个体与最差个体承担着关键角色。最优个体引导其他个体向有利的搜索方向移动;同时,最差个体对于保持种群多样性起到重要作用。在HO算法中的初始化阶段,涉及随机初始解的生成,通过最优最差对立学习方法[24]替代原始的种群初始化策略,以防止算法的过早收敛并增强其全局搜索能力。最优学习的定义如下:

(14)
式中:bl、bu分别对应于迭代t时最优个体的上、下界,Xbest(t)、X′best(t)分别为迭代t时原个体最优位置和对立学习后得到的新个体最优位置。最差对立学习定义如下:

(15)
式中:b′l、b′u分别对应于迭代t时最差个体的上、下界,Xworst(t)、 X′worst(t)分别为迭代t时原个体最差位置和对立学习后得到的新个体最差位置,rand是随机数。
1.2.2 混沌映射序列
混沌映射序列是实现局部防御捕食者之间平衡的策略。在河马算法阶段1,向量h经过该5种场景的计算得出,其中概率参数r5受随机生成的值rand的影响,导致算法的收敛速度受到随机性的调控。
为了提升收敛速度及寻求最优解的能力,采用混沌映射序列代替随机参数[25]。混沌映射以其遍历性和非重复性的优点,能够实现比基于概率的随机搜索更高效的全面搜索[26]。在本文HO中使用Chebyshev混沌映射序列[27]对式(2)中关键参数r5进行调优,其定义见式(16)。引入一个参数A代替rand,改进后其定义如下:
(16)
式中ω为Chebyshev参数。
1.2.3 最优个体自适应扰动策略
在原始河马优化算法中,最优位置搜索依赖于位置更新、防御捕食者,以及逃离捕食者3个阶段的协同。然而,HO算法受限于随机搜索,无法确保全局最优解的达成。为克服此局限,本文在HO算法3个阶段完成后,引入了随迭代次数t增加的变异因子,以调整个体适应度。自适应t分布技术[28]兼具高斯分布(Gaussian distribution,GD)和柯西分布(Cauchy distribution,CD)这两者的优点,旨在增强种群多样性、加速收敛,并提升算法探索能力[29]。改进后的河马位置更新定义如下:
(17)
式中:为改进后第i只河马的位置,t为改进前第i只河马的位置,所提更新公式在的基础上增加了随机干扰项t(iter),既充分利用了当前位置信息,又增加了随机干扰信息,有利于算法跳出局部最优。引入自适应扰动需要判断扰动后的个体是否优于原始个体,对二者适应度进行比较,选择最优个体,更新公式如下:

(18)
式中:Best′i为变异后的最优个体位置,Bestnew为比较后的最优个体位置,f(·)为适应度值。
1.2.4 复杂度分析
1)时间复杂度分析。设HO算法初始复杂度为O(Nm),初始相位计算复杂度为O(NmT)=O(T),其中T为最大迭代次数。HO中第2阶段的计算复杂度为O(T),最后第3阶段的计算复杂度为O(T),经计算得到HO算法的总计算复杂度为O(T)。在TOBCHO中,基于HO算法做了3处改进。首先,引入最优最差对立学习机制初始化种群,该阶段增加了河马算法的计算过程,计算复杂度为O(2Nm)。其次,河马算法阶段1随机场景中在[0,1]范围内的随机数替换为混沌序列参数,故复杂度增加了O(Nm)。最后利用自适应t分布进一步挖掘算法最优解,计算复杂度增加O(NmT)=O(T)。因此TOBCHO计算复杂度为O(T),说明增加3种改进策略并没有增加时间复杂度。
2)空间复杂度分析。原始河马优化算法(HO)的空间复杂度主要由3部分构成:首先,算法需要存储种群中所有个体的位置和状态信息。对于包含N个个体的种群,其空间复杂度为O(Nn);其次,在迭代过程中需缓存每轮更新的中间参数,这部分空间需求与最大迭代次数TO(1)O(Nn+T)O(2Nn)相关,复杂度为O(T);最后,固定参数(如学习率等的存储仅占用常数级空间,记为O(1))。因此,HO算法的总空间复杂度可归纳为O(Nn+T)。
在TOBCHO算法中,本文引入了3项关键改进策略,第1项改进为最优最差对立学习机制。该机制理论上需要生成对立种群,若直接实现会导致空间复杂度从原始HO算法的O(Nn)翻倍至O(2Nn),为优化存储效率,仅需额外存储当前最优和最差个体信息,将新增空间复杂度降低至O(Nn);第2项改进涉及混沌序列参数生成。采用Logistic混沌映射替代随机数生成时,仅需存储当前混沌值和映射参数。由于这些参数与种群规模N和迭代次数T无关,其新增空间复杂度为常数级O(1),对整体复杂度无显著影响;第3项为自适应t分布,为了动态调整分布参数,算法需记录每轮迭代的更新序列。该序列长度与迭代次数T成正比,因此新增空间复杂度为O(T)。尽管引入了额外的O(T)项,但其与原始HO算法的迭代缓存复杂度O(T)同阶,不会改变整体复杂度的量级。
综合上述分析,TOBCHO算法的总空间复杂度可表示为
(19)
尽管新增了优化模块,TOBCHO的空间复杂度仍与原始HO算法保持相同阶数,总体来说未增加空间复杂度。
2 基于多策略改进河马算法优化BiGRU的寿命预测模型
2.1 BiGRU
门控循环单元(GRU)是LSTM模型的简化版本,仅包含复位门和更新门,可以有效地抑制梯度问题。GRU计算公式如下:
(20)
(21)
(22)
(23)
式中:x为输入数据,Wz、Wr、W分别为对应的权重,bz、br、bh分别为相应的偏置项,zt为更新门,rt为复位门,为候选激活状态,ht为激活状态,σ为sigmoid激活函数,[·]为连接的两个向量,xt为时刻t时 GRU的输入,tanh(·)为双曲正切激活函数,为矩阵元素乘法。
单向GRU沿时间序列前向传播,从而在预测时无法考虑后续时间点的数据对当前预测的影响。BiGRU通过结合前向和后向两个GRU层,有效克服此局限。BiGRU的输出由这两层GRU的隐藏状态共同决定,从而能够捕获单向GRU可能遗漏的时序特征,提升预测准确性。图1展示了BiGRU的结构原理。在时刻t,输入数据同时被送入前向和后向GRU,通过加权融合这两层的隐藏状态,得到最终输出隐藏层状态。计算过程如下:
(24)
(25)
(26)
式中:、、ht分别为前向、后向传输,以及最终输出隐藏层状态,函数FGRU用于将输入向量映射至GRU隐藏层状态,bt为偏置向量,Wt、Vt分别为对应的权重矩阵。
由于BiGRU通过双向门控机制捕捉轴承退化序列的前后向依赖关系,但其性能高度依赖隐藏层单元数、学习率等超参数,TOBCHO的多阶段优化能力,即全局探索到动态平衡再到精细收敛系统地搜索超参数组合,最大化BiGRU对退化特征的时序表征能力。
图1BiGRU模型结构图
Fig.1Structure of BiGRU model
2.2 TOBCHO-BiGRU模型
TOBCHO-BiGRU模型构建步骤如下。
Step1 提取滚动轴承全寿命周期水平信号,经过小波阈值去噪后计算时域、频域、熵特征和能量特征。
Step2 根据相似性、单调性和鲁棒性构建综合特征指标并设定阈值,筛选敏感特征后归一化处理构建健康指标,划分训练集和测试集。
Step3 设定种群规模Npop,维度D,优势河马位置HippoD,迭代次数iter等相应参数,根据式(14)、(15)初始化河马种群。
Step4 根据式(1)~(5)和式(16)完成河马算法阶段1,并根据式(6)~(13)完成第2、3阶段,得到当前个体适应度。
Step5 根据式(17)、(18)对河马当前个体适应度进行扰动,输出全局最优个体适应度值。
Step6 建立BiGRU寿命预测模型,确定待优化超参数的搜索范围。
Step7 通过TOBCHO算法优化BiGRU超参数,经过BiGRU训练得到的预测值和训练值的均方根误差作为优化过程中的适应度函数,经过iter次迭代结束后,得到超参数最优值。适应度函数如下:
(27)
2.3 基于相似度特征融合方法的健康指标构建
构建有效的健康指数(health index,HI)对于轴承运行状态的监测与评估至关重要,健康指标能够直观反映滚动轴承的性能退化,也是轴承剩余寿命预测的核心。受人为监测及环境因素影响,轴承全寿命周期信号包含噪声。实验采用小波阈值去噪方法[30],降低噪声对健康曲线构建的负面影响。采用相关性、单调性和鲁棒性3个指标构建综合特征选取指标对原始特征参量进行观测评估[31],基于特征信号序列f=[f1,f2,···,fS]和时间序列l=[l1,l2,···,lS]进行分析,具体说明如下。
fs为在时间s上相对应的特征值,S为轴承全寿命周期时间的总长度,利用移动平均法将特征信号分成平稳趋势和随机余量两部分:
(28)
式中:Fs为平稳趋势,Rs为随机余量。
引入相关3个指标,计算公式如下:
(29)
(30)
(31)
式中:Corr(F,S)为相关性指标,Mon(F)为单调性指标,dF为特征平稳序列微分,Rob(F)为鲁棒性指标。
由于单一的特征指标无法全面评估特征参数在显示轴承性能退化趋势方面的作用,为此,赋予该3个特征评价指标不同的权重作为综合评价指标,公式如下:
(32)
式中:R为特征评价综合指标,wi为3个指标的权重,i=1,2,3。
对综合评价指标R进行排序,预设阈值以筛选出高于阈值的指标,构造敏感特征集,即从N个特征时间序列中提取S个时间单位内的时序数据,构建敏感特征矩阵XS×N。
3 基于TOBCHO-BiGRU的寿命预测实验分析
实验在PRONOSTIA平台上有轴承在不同工况下的运行到失效数据集。PRONOSTIA由3个主要部分组成:旋转部分、退化产生部分(在被测轴承上施加径向力)和测量部分。PRONOSTIA提供的数据描述了球轴承在其使用寿命期间的退化(直到完全失效),并且每个退化的轴承几乎包含所有类型的缺陷(内圈和外圈、球、保持架)。在实验中,对水平和竖直方向的振动信号采集,采样频率为25 600 Hz,每次采样0.1 s,记录2 560个数据点,记录间隔为10 s,详细描述见文献[32]。
本文选取工况1条件下的Bearing1-1和Bearing1-5两组数据进行实验,只考虑水平振动信号[33]。
3.1 敏感特征提取与筛选
对选定的轴承全寿命周期水平振动信号做预处理,使用Bearing1-1与Bearing1-5分别进行实验,经小波阈值去噪处理后,原始振动信号与小波去噪信号的对比见图2。
从全寿命周期水平信号中提取35维特征,包括11维时域特征、8维频域特征、8维熵特征,以及8维IMF能量特征。表1列出两种工况下的筛选敏感特征集,其中F1~F8为时频域熵特征,F9~F16为时频域能量特征。图3展示了水平方向Bearing1-1与Bearing1-5提取并排序的平均综合指标特征集合。
图2原始振动信号和滤波后振动信号
Fig.2Original vibration signal and filtered vibration signal
表1经过阈值筛选的敏感特征集
Tab.1Sensitive feature set after threshold filtering
采用综合评价指标筛选出的最优敏感特征集,通过主成分分析(principal component analysis,PCA)进行数据融合,本文设定阈值为0.75。以综合评价指标达到该阈值的标准,选取敏感特征,保证保留尽可能多的原始信息,可以有效揭示轴承性能随时间的退化趋势。
图3轴承1-1和轴承1-5水平方向所有特征
Fig.3All features in horizontal direction for Bearing1-1 and Bearing1-5
3.2 HI构建
基于相关性、单调性和鲁棒性筛选敏感特征的方法和PCA方法构建健康指数(HI),如图4所示,两组工况数据均表现出对轴承退化状态的敏感响应。(图中Bearing1-1与Bearing1-5的横坐标均表示为每两次记录时间间隔为10 s),从图4可以看出,轴承在正常状态下HI值较高,而在失效状态下HI值降低。以Bearing1-1为例,HI>1指示轴承处于正常状态,HI值介于1~0表明轴承开始退化,HI<0则指示轴承发生急剧退化直至失效。
图4基于PCA特征融合后构造的健康指数曲线
Fig.4Health index curves constructed after PCA-based feature fusion
两个轴承提取的敏感特征集存在差异,原因在于不同类型的轴承在损伤模式上有所区别,导致对敏感特征的提取敏感性各异。在工程实践中,对待预测寿命的轴承特征集的选择应基于其特定的运行条件和损伤模式。单纯依赖历史数据获得的敏感特征集可能无法全面反映未来趋势。因此在实际应用中,不宜采用固定的敏感特征向量进行健康曲线构建。本文实验采取的策略是选取敏感程度较高的特征进行寿命预测,这种特征向量的选择具有灵活性,不受单一轴承敏感特征选取的局限,以提高预测模型的普适性。
3.3 算法寻优对比
在BiGRU中,采用Adam优化器,最大训练次数MaxEpochs为100,初始学习率为0.01。待优化超参数为:隐含层神经元个数[70,100],学习率[0.01,0.10],正则化系数[0.001,0.100]。隐藏层单元数决定了模型对时序特征的捕获能力,隐藏单元数过少可能导致模型欠拟合,无法捕捉数据中的复杂模式;而过多则可能引发过拟合,降低模型的泛化能力。学习率影响梯度更新的稳定性,过高可能导致模型无法收敛,而过低则会使训练速度变慢。正则化系数则是抑制过拟合,正则化系数常用于控制模型复杂度,防止过拟合。过大的正则化系数可能导致模型欠拟合,无法充分学习数据中的特征;而过小的正则化系数则可能无法有效抑制过拟合,导致模型在训练集上表现良好但在测试集上性能下降。选择这3个超参数作为BiGRU模型优化对象,旨在通过调整模型的结构、训练过程,以及复杂度,提升寿命预测的精度与可靠性,确保模型能够有效捕捉时序数据中的潜在规律,并在真实应用中具有较好的泛化能力。
为验证所提方法的有效性,本文采用如下对比模型:河马算法优化的BiGRU(HO-BiGRU)、灰狼优化算法优化的BiGRU(GWO-BiGRU)、哈里斯鹰优化算法优化的BiGRU(HHO-BiGRU)、麻雀搜索算法优化的BiGRU模型(SSA-BiGRU)、蝴蝶优化算法优化的BiGRU(ABO-BiGRU)、天鹰优化算法优化的BiGRU(AO-BiGRU),以及粒子群算法优化的BiGRU(PSO-BiGRU)。经过算法优化之后的超参数取值见表2。
将健康曲线前70%的HI值作为训练数据输入TOBCHO-BiGRU预测模型进行训练。为评估TOBCHO-BiGRU模型的预测性能,与其他预测模型进行对照实验。通过计算实际RUL与预测RUL之间的误差指标,即决定系数(R2)、均方根误差(root mean square error,RMSE)、平均绝对误差(mean absolute error,MAE)和均方误差(mean square error,MSE),以量化模型性能,计算方法如下:
(33)
(34)
(35)
(36)
式中:SRME为均方根误差,AME为平均绝对误差,SME为均方误差。
表2各预测模型超参数结果
Tab.2Hyperparameter results of various prediction models
不同算法优化BiGRU预测模型如图5所示,为更直观表示,每隔30个点对各个HI数据进行取样,并局部放大(图5(b))。由图5可以看出,TOBCHO-BiGRU模型的预测值和真实值拟合最好,该模型的预测表现也优于其他预测模型。
由图5、表2分析得出,有理由认为3种改进策略协同优化河马算法性能。在最优最差对立学习策略中,机制的核心在于通过生成对立解,扩展搜索空间,增强算法的探索能力;对于混沌映射序列策略具有优异的遍历性和非线性特征,可以进一步提升搜索过程中的随机性和不可预测性,使得算法能够更好地避免陷入某些局部最优解;自适应扰动策略的作用机制在于通过动态调整扰动强度,特别是在优化过程的后期,较小的扰动强度有助于精细化局部搜索,避免大幅度的搜索变动,而在早期阶段则通过较强的扰动保持全局搜索的广度。
表3给出了对比预测模型与具体预测精度度量值。为阐明河马优化算法对预测模型的优化效果,除优化算法模型对比,本文还加入LSTM、BiLSTM、GRU、BiGRU等模型预测误差。
图5不同算法模型预测对比
Fig.5Comparison of prediction results for different algorithmic models
表3多个模型分别对轴承Bearing1-1与轴承Bearing1-5的预测误差结果
Tab.3Prediction error results of multiple models for Bearing 1-1 and Bearing 1-5
注:加粗字体是在相应误差度量下预测效果最好的模型数据;决定系数R2的值取小数点后3位。
为验证预测模型的泛化能力,本文不仅在PHM2012数据集上进行了实验,还在西安交通大学(XJTU)公开数据集上进行了测试。实验结果表明,本文提出的模型在西交大数据集[34]上同样表现出优异的预测性能,进一步证明了算法的鲁棒性和泛化能力。
通过分析这3种策略的作用机制,可以发现,它们在TOBCHO算法中的协同效应是非常重要的。最优最差对立学习增强了全局搜索的能力,混沌映射序列提高了搜索的随机性和遍历性,自适应扰动策略则确保了局部搜索的精细化。这3种策略通过互补的作用,共同优化了算法的全局搜索和局部开发能力,从而实现了更好的平衡,避免了过早收敛,并提高了整体的优化效果。
3.4 消融实验分析
为深入验证各项改进策略对河马优化算法中的有效性,以Bearing1-1轴承为例进行消融实验。表4列出了构建的消融模型及其构建的依据。其中,引入自适应t分布的河马算法模型命名为THO,对立学习的河马算法命名为OBHO,引入混沌映射的河马算法命名为CHO。
表4消融模型及其建立的原因
Tab.4Ablation models and reasons for their creation
表5为对比模型与本文模型的预测误差度量。结果显示,本文模型的预测精度在所有比较模型中均有显著提升,进而说明本研究所采用的多策略改进算法行之有效。图6为比较模型与本文模型预测误差指标的折线图。分析可见,单独实施某一改进策略仅能带来有限的性能提升;组合两种策略的改进算法预测性能提升亦有限。当本文提出的3种改进策略同时融入河马算法中,其非线性相互作用显著促进了算法性能的非比例增长,大幅提升了预测效果。证明该3种改进策略通过不同贡献实现了协同效应,增强了滚动轴承寿命预测的能力。
表5消融模型和建议模型的预测误差度量
Tab.5Prediction error metrics between ablation models and proposed model
消融实验结果表明,随着各项改进策略逐步加入模型,模型呈现出的非线性提升源于3策略在优化阶段与功能定位上的互补性。最优最差对立学习在种群初始化阶段生成对称解,提升了隐藏层单元数、学习率等超参数的搜索空间覆盖率,解决了原始HO算法因初始种群单一导致的早熟收敛问题;通过混沌映射替代随机数生成,使得TOBCHO在迭代过程中弥补探索效率低下的缺陷;而自适应扰动策略在迭代后期继承并强化了前两者的优势,形成探索到开发再到收敛的自适应平衡。三者协同形成了分阶段优化链,并通过消融实验逐步呈现每个策略的增益。
图6Bearing1-1消融实验各个模型误差指标折线图
Fig.6Error indices for various models in ablation experiment of Bearing 1-1
4 结论
1)针对滚动轴承寿命预测研究,本文在可行性的基础上提出了一种新的滚动轴承剩余寿命预测方法——多策略改进河马算法优化BiGRU神经网络的寿命预测方法。引入了最优最差对立学习增强河马算法全局优化问题,在河马算法阶段1利用混沌映射序列提升搜索速度并找到最优解,在河马算法迭代完成后加入自适应t分布策略避免陷入局部最优,显著提高河马算法优化性能,有效降低BiGRU预测模型受到超参数影响较大的问题。
2)通过IEEEPHM挑战赛2012数据集实验对比证明,相较于原始河马算法,多策略改进的河马算法构建的TOBCHO-BiGRU模型显著提高了滚动轴承剩余寿命预测精度。结合消融实验分析不同改进策略对HO的有效性,证明单一的改进策略对河马算法的性能提升有限,而3种策略联合作用时,产生了协同增强效应,实现算法整体性能的非比例增长。
3)本研究将继续探索更多改进策略的集成,以及算法在复杂工况下的适应性和泛化能力。并考虑将预测模型应用于跨工况轴承,以实现更为精准的轴承寿命管理。

