摘要
随着工业传感器的广泛部署和人工智能算法的快速发展,基于数据驱动的智能故障诊断技术已成为机械装备故障预测与健康管理(PHM)的关键部分和热点话题,然而,此类方法依赖于大量标记数据且对数据分布具有严格的一致性要求,导致相关方法在真实工业场景中的准确性和鲁棒性大幅下降。迁移学习作为应对数据分布不一致与小样本故障诊断问题的有效手段,得到了学术界与工业界的广泛关注,其通过将源域中学习到的知识迁移到目标域,显著提升了模型在目标域的泛化性能。为研究基于迁移学习的机械装备智能故障诊断方法的发展现状及其亟需解决的关键技术难题,对目前该领域的文献进行了分析与总结。首先,系统性梳理了机械装备智能故障诊断领域的国内、外研究进展与现状。其次,围绕迁移学习技术,分析对比各类迁移学习故障诊断方法的优势与局限性,从不同应用场景与行业关键技术问题出发,对迁移学习驱动的机械装备智能故障诊断技术进行了总结与评述。最后,探讨了相关热点问题并对技术瓶颈进行深入分析,指出了应对现有挑战的可能途径和未来发展趋势。研究表明:迁移学习在机械装备智能故障诊断领域已引发广泛关注,但仍存在诸多技术难题亟需解决,随着人工智能技术的快速发展及本领域专家学者对迁移学习理论与应用研究的持续推进,可为机械装备智能故障诊断方法的开发提供坚实的理论与技术基础。
关键词
Abstract
With the extensive deployment of industrial sensors and the rapid development of artificial intelligence algorithms, data-driven intelligent fault diagnosis technology has become a key part and a hot topic in Prognostics and Health Management of mechanical equipment. However, such methods rely on substantial labeled data and demand strict consistency in data distribution, thereby causing a significant drop in the accuracy and robustness of related methods in real industrial scenarios. Transfer learning, as an effective approach to tackling the problems of inconsistent data distribution and small-sample fault diagnosis, has drawn widespread attention from both academia and industry. It markedly enhances the generalization performance of the model in the target domain by transferring the knowledge acquired in the source domain to the target domain. To investigate the current state of transfer learning-driven intelligent fault diagnosis methods for mechanical equipment and the crucial technical challenges that urgently need to be resolved, an analysis and summary of the existing literature in this field have been carried out. Firstly, the research progress and current status of intelligent fault diagnosis for mechanical equipment in domestic and international studies have been systematically reviewed. Then, focusing on transfer learning technologies, the advantages and limitations of various transfer learning fault diagnosis methods have been analyzed and compared. From the perspectives of different application scenarios and key technical issues in the industry, the intelligent fault diagnosis technologies for mechanical equipment driven by transfer learning have been summarized and critically evaluated. Finally, current research hotspots have been explored and the technical bottlenecks have been thoroughly analyzed, and potential solutions to existing challenges along with future development trends are identified. Studies show that while transfer learning has garnered widespread attention in the field of intelligent fault diagnosis for mechanical equipment, many technical issues remain to be resolved. With the rapid development of artificial intelligence technologies and the continued efforts of experts and scholars in advancing transfer learning theories and applications, a solid theoretical and technical foundation can be established for the development of intelligent fault diagnosis methods for mechanical equipment.
机械装备作为推动经济社会发展的关键引擎,不断促进着制造业的质量提升与效率优化。机械零部件通常工作在高温、高压和复杂操作环境下,容易发生故障,为了确保工业环境的安全可靠,对机械装备的健康状况进行及时的监测与诊断至关重要,可有效减少设备停机时间,提高装备生产效率,避免由于生产系统非计划停机而造成的人员伤亡和重大经济损失[1-2]。
近年来,随着物联网、人工智能和大数据技术的发展,基于数据驱动的智能故障诊断技术已成为机械装备故障预测与健康管理(prognostics and health management,PHM)的关键部分和热点话题[3-5],正推动着工业技术的高速发展与创新。智能故障诊断方法通过监测信号与故障模式之间的映射关系来检测故障类别[6],在过去的几年中,智能故障诊断从需要依赖专家知识手动提取特征的机器学习方法开始[7-8],逐步发展到具备从工业大数据中挖掘隐含故障特征能力的深度学习方法[9-10],基于数据驱动的智能故障诊断技术已广泛应用于各类复杂工业场景,助力提升工业系统的安全性与可靠性。
然而,无论是传统机器学习方法还是深度学习方法,都严重依赖于数据分布的一致性要求,通常需要假设训练数据与测试数据满足独立同分布条件[11-13],以确保模型在训练中学到的特征和规律能够直接应用于测试场景。但在实际工业环境中,数据的分布往往会由于设备工况、传感器配置、操作条件等多种因素的变化而发生显著差异,导致故障诊断模型的准确性和鲁棒性大幅下降[14-16]。同时,深度学习模型的性能在很大程度上依赖于大量标记数据的支持,数据的稀缺通常会导致严重的过拟合问题,从而损害故障诊断模型的准确性。但是,收集和标注足够的故障数据既耗时又繁琐,尤其在工业应用中,设备在大部分使用周期内处于健康状态,为了获取足够的故障数据而故意让设备发生故障,不仅可能缩短其使用寿命,还可能增加设备损坏、人员伤亡以及财产损失的风险[17-18],因此小样本问题成为智能故障诊断领域的一大挑战。
近年来,迁移学习驱动的智能故障诊断技术作为解决上述问题的有效手段正在被广泛研究[19]。迁移学习是机器学习的另一个重要分支,侧重于从一个或多个相关但不同的场景中学习知识,利用数据、任务或模型之间的相似性,将在旧领域学习到的模型和知识应用于新领域,突破了训练数据和测试数据必须遵循相同分布的限制[20]。迁移学习与传统机器学习故障诊断方法之间的区别如图1所示,其已帮助智能故障诊断实现了跨故障类型、跨工况以及跨设备迁移等复杂任务,被证明是一种有效的机械装备智能故障诊断方法。
本文通过对中国知网数据库(限定关键词为“迁移学习”and“故障诊断”)和Web of Science数据库(限定关键词为‘transfer learning’and‘fault diagnosis’)的文献进行统计分析,汇总了2014―2023年在机械装备故障诊断领域应用迁移学习技术的论文数量,相关数据见图2。分析结果显示,自2018年起,越来越多的研究者开始探索将迁移学习技术应用于故障诊断领域,研究成果呈逐年上升趋势。
图1迁移学习与传统机器学习故障诊断方法的区别
Fig.1Differences between transfer learning and traditional machine learning fault diagnosis methods
图2机械装备故障诊断领域中迁移学习相关文章数量
Fig.2Number of articles on transfer learning in the field of mechanical equipment fault diagnosis
本文系统性梳理了机械装备智能故障诊断领域的国内、外研究进展与现状,围绕迁移学习技术,分析对比了各类迁移学习故障诊断方法的优势与局限性,从多维应用场景与行业关键技术问题出发,对迁移学习驱动的机械装备智能故障诊断技术进行了总结与评述,探讨了相关热点问题并对技术瓶颈进行深入分析,指出了应对现有挑战的可能途径和未来发展趋势。
1 智能故障诊断的概述
随着工业传感器的广泛部署和机器学习、深度学习等人工智能算法的快速发展,基于数据驱动的智能故障诊断方法已成为机械装备PHM领域的有效手段,得到了专家学者们的广泛关注,通过及时检测与诊断装备运行状态,制定合理的维护策略,可以有效保障装备的运行效率和生产安全[21]。
智能故障诊断旨在利用现代计算技术和数据分析方法,自动识别和预测机械装备中的潜在故障。随着机械装备复杂性和操作环境多样性的增加,传统故障诊断方法高昂的维护成本、较低的准确性以及难以适应新故障模式等弊端开始暴露,逐渐无法满足现代化机械装备PHM的需要。为了应对这些挑战,智能故障诊断方法得到了广泛的研究和应用,按照发展历程可将其分为3个阶段:1)基于传统机器学习的智能故障诊断;2)基于深度学习的智能故障诊断;3)基于迁移学习的智能故障诊断[17]。
早期的智能故障诊断方法主要依赖于传统机器学习技术,如支持向量机[22-24]、决策树[25-26]、随机森林[27]以及K-近邻算法[28-29]等。Dhiman等[30]基于自适应阈值和双支持向量机实现了风力发电机组齿轮箱的异常检测。Tuerxun等[31]采用麻雀搜索算法(sparrow search algorithm,SSA)优化支持向量机(support vector machine,SVM)的惩罚因子与核函数,构建了SSA-SVM风力涡轮机故障诊断模型,有效提高了风机故障诊断的准确性。方愉冬等[32]提出一种基于集成决策树的随机森林方法来检测电力系统故障,利用电流信号的幅度和相位信息训练随机森林,为电力系统故障诊断提供了有效决策。上述方法通过搭建诊断模型实现了故障分类,实现了诊断智能化,但传统机器学习方法通常需要人工提取特征,且在处理高维数据和复杂故障模式时表现不佳。
随着深度学习技术的发展,智能故障诊断进入了新的阶段。深度学习方法利用卷积神经网络(convolutional neural networks,CNN)[33-35]、循环神经网络(recurrent neural network,RNN)[36-37]和长短期记忆神经网络(long short-term memory,LSTM)[38-40]等技术,从原始数据中自动提取高层次特征,显著提高了故障诊断的准确性和鲁棒性。Guo等[41]提出一种并行深度神经网络模型,将卷积注意力模块与AlexNet结合,构建双重注意力机制,提高了钻井泵故障诊断的准确性和可靠性。Liu等[42]提出一种多通道多尺度卷积神经网络模型,采用特征级融合策略实现了船舶管道阀门泄漏的故障诊断。Dao等[43]提出一种结合了贝叶斯优化、CNN和LSTM的故障诊断模型,通过贝叶斯方法优化CNN-LSTM模型超参数,在水轮机故障诊断任务中表现出了优越性能。然而,基于深度学习的智能故障诊断方法在实际工程应用中仍然面临一些挑战[44]。例如,深度学习模型严重依赖于大量标注数据,但在许多工业场景中,故障数据的获取往往非常困难,同时,数据特征分布会随着环境或工况的变化而改变,由此产生的训练数据和测试数据特征分布不一致问题也严重限制了模型的泛化能力。
近年来,迁移学习作为应对数据分布不一致与小样本故障诊断问题的有效手段,得到了广泛的研究与应用[13,45-46]。通过将源域中学习到的知识迁移到目标域,迁移学习可显著提升模型在目标域的泛化性能,常见的迁移学习方法包括实例迁移、特征迁移、参数迁移与关系迁移,它们在跨故障类型、跨工况以及跨设备的智能故障诊断中表现优异,有效提高了模型在数据分布变化与数据样本不足情况下的准确性和鲁棒性。李响等[47]利用迁移学习技术在变工况下实现跨域故障诊断,提出了一种基于事件相机的非接触式机械装备智能迁移诊断方法,为难以部署接触式传感器的工程场景提供了创新的视觉解决方案。Ding等[48]结合深度学习和迁移学习技术,针对同时存在特征偏移和标签偏移的复杂场景,提出一种深度不平衡域自适应框架,显著提高了在不平衡域适应情景下的跨域泛化能力。
智能故障诊断技术经历了从传统机器学习到深度学习,再到迁移学习的演变过程,传统机器学习方法为智能故障诊断奠定了深厚的实践基础,深度学习方法则显著提升了模型的特征学习和模式识别能力,作为当前的研究热点,迁移学习有效解决了数据稀缺和领域适应性问题,每一阶段的技术进步都为现代机械装备的智能运维带来了新的突破。
2 迁移学习驱动的智能故障诊断方法
2.1 实例迁移故障诊断方法
在智能故障诊断方法的研究中,基于实例的迁移学习方法主要包括实例选择和实例重加权两种策略。如图3所示,源域中通常包含两类故障样本:1)高质量故障样本。其特征分布与目标域更为相似,可有效提高目标域诊断模型的泛化性能。2)低质量故障样本。其无法为目标域诊断模型做成正向贡献,反而有可能引发负迁移现象。实例选择策略旨在从源域中选择那些高质量故障样本,丢弃低质量故障样本,从而减少源域与目标域之间的分布差异。与实例选择策略不同,实例重加权策略可以更加灵活地利用源数据集中的信息,通过为源域中的样本赋予不同的权重,加权源设备中的故障样本以匹配目标设备的故障模式,使得与目标域特征相似的样本对模型训练贡献更大,从而提高诊断模型对目标设备的泛化能力。Lee等[49]通过对与目标领域分布相似的实例进行差异化知识迁移,提出一种基于多目标实例加权的迁移学习网络,提高了模型的领域泛化性能。Zhang等[50]提出一种基于实例的集成深度迁移学习网络,通过选择相关源实例来训练具有不同激活函数的堆叠自编码器,结合支持向量机进行机械设备的退化识别。张兴民[51]从实例迁移的角度出发,将迁移学习与集成学习相结合,利用权重重加权的思想对多个弱分类器加权平均,有效解决了样本不平衡问题。
基于实例迁移的智能故障诊断方法同时面临一些挑战,相似性度量的有效性是实例迁移中的关键问题,由于工业数据的复杂性,传统度量方法可能无法准确反映源域样本与目标域样本之间的特征相似性,从而影响实例选择或实例重加权效果。
图3实例迁移故障诊断示意
Fig.3Schematic diagram of instance-based transfer fault diagnosis
2.2 模型迁移故障诊断方法
由于知识是在模型及其参数的层面上进行传递的,因此基于模型的迁移学习智能故障诊断方法也被称为基于参数的迁移学习智能故障诊断方法。其通过在不同模型间进行参数的迁移以提高其在目标任务上的诊断性能,这种方法能够有效利用源任务知识,减少目标任务中对大量标注数据的依赖,加速训练过程,从而使诊断系统在面对不同工作条件时具有更强的适应性和鲁棒性[52-54]。
预训练-微调是模型参数迁移的代表性方法,在机械装备智能故障诊断领域得到了广泛应用[55-56]。基于预训练-微调策略的智能故障诊断方法如图4所示,其主要包含两个步骤:1)在具有丰富标注数据的源任务上进行模型的预训练,学习通用的特征表示和模型参数,有效捕捉源任务中复杂的数据模式与结构。2)在微调阶段,根据目标任务的数据对预训练模型的参数进行调整,以更好地适应目标任务的特定特征和需求。
预训练-微调方法的一个显著优势是它能够显著减少目标任务对大量标注数据的需求,依靠在预训练阶段学习到的知识,模型可以在目标任务中以更少的数据实现良好的性能。吕游等[57]针对海上风电场和高海拔地区的风机机组叶片覆冰故障诊断模型精度低、建模速度慢等问题,提出一种基于LeNet5like的预训练-微调迁移学习风电机组叶片覆冰故障诊断方法。邵思羽[58]针对深度学习故障诊断方法存在的模型深度有限、特征学习能力不足以及模型训练困难等问题,研究并设计了一种基于预训练网络的迁移学习故障诊断模型,实现了大型深度卷积神经网络模型在旋转机械故障诊断领域中的应用。Chen等[59]将预训练网络引入基于Wasserstein距离的生成对抗网络(generative adversarial network,GAN)判别器和分类器中,实现了特征的自适应提取。Ren等[60]通过预训练-微调策略解决了GAN在小样本训练下的过拟合问题,增强了生成样本的多样性,提高了故障诊断模型性能。预训练-微调策略已成为机械装备智能故障诊断中应对数据稀缺和模型泛化能力不足问题的关键手段。
图4基于预训练-微调策略的智能故障诊断
Fig.4Intelligent fault diagnosis based on the pretraining-finetuning strategy
2.3 特征迁移故障诊断方法
基于特征的迁移学习智能故障诊断方法通过特征变换实现领域迁移,从而完成跨域故障诊断。领域自适应技术是特征迁移故障诊断的典型代表,主要分为基于差异的领域自适应和基于对抗的领域自适应。如图5所示,基于差异的领域自适应方法通过减少源域和目标域之间的特征分布差异来对齐特征表示,提高模型对可迁移特征的学习能力,通过构建和优化度量标准以最小化源域与目标域之间的特征分布差异。
常见的特征分布度量标准(见表1)包括最大均值差异(maximum mean discrepancy,MMD)[61]、KL散度(Kullback-Leibler divergence,KL Divergence)[62]、多核最大均值差异(multiple kernel MMD,MK-MMD)[63]、CORAL(correlation alignment,CORAL)方法[64]及Wasserstein距离[65]等。Cheng等[66]结合物理先验知识和多种度量方法,提出一种物理信息领域自适应网络,提高了跨域故障诊断的特征学习能力。Shi等[67]提出一种可迁移的自适应通道注意力模块,用于解决传统领域自适应方法泛化性能不足的问题。Yu等[68]通过融合时频分析、残差网络(Residual network,ResNet)和自注意力机制(self-attention mechanism,SAM),提出一种基于领域自适应的轴承故障诊断模型,显著提升了特征提取的跨域不变性。吕松[69]针对滚动轴承目标域无标签的无监督域自适应问题,提出一种多源域自适应诊断框架,充分利用多个源域内的差异知识,完成了对无标签滚动轴承目标域的故障诊断。
图5领域自适应技术
Fig.5Domain adaptation techniques
表1特征分布度量标准
Tab.1Feature distribution measurement metrics
基于对抗的领域自适应方法受GAN启发,通过引入对抗学习过程,使模型在区分源域和目标域特征时变得更加困难,从而迫使特征提取器生成领域不可分的特征表示。例如,领域对抗神经网络(domain-adversarial neural network,DANN)[70]通过在特征提取器和领域分类器之间进行对抗训练,使得特征提取器能够生成在源域和目标域上都具有良好判别能力的特征。对抗自编码器(adversarial autoencoder,AAE)[71]则结合了自编码器和对抗训练,通过在潜在空间中对齐源域和目标域的特征分布来实现领域不变特征的学习。Wan等[72]通过改进的深度残差网络提取可迁移特征,利用MK-MMD和多个领域判别器进行领域自适应,提出一种深度卷积多对抗领域自适应模型,显著提升了跨域轴承故障诊断的泛化性能。陈祝云[73]提出一种基于域对抗迁移网络的故障诊断方法,通过构建两个独立的编码网络,分别对源域数据和目标域数据进行学习,通过引入权值迁移策略和对抗训练机制,有效减少了源域和目标域的数据分布差异,改进了网络诊断性能。Xia等[74]提出一种基于对抗的领域自适应方法,引入感知损失函数以增强对抗训练的稳定性,采用基于时间戳映射的振动信号筛选方法提高数据预处理效率,有效解决了变工况条件下的工业机器人轴承故障诊断挑战。
图嵌入特征迁移是近年来新兴的一种特征迁移方法,利用图结构来建模源域和目标域的特征关系,并通过图嵌入技术实现特征对齐。该方法能够有效捕捉复杂的特征关联,特别适用于存在非线性特征空间差异的跨域故障诊断任务。Ma等[75]将多阶图嵌入堆叠去噪自编码器与协作式中心域适应技术相结合,完成了小样本条件下的滚动轴承故障诊断。Yu等[76]提出一种基于图神经网络(graph neural network,GNN)和动态图嵌入机制(dynamic graph embedding mechanism,DGE)的新型滚动轴承故障诊断框架,利用CNN提取故障特征,通过DGE模块将其转换为图结构特征,应用GNN进一步挖掘故障特征对变工况条件的敏感性,提升了模型在变工况条件下的故障诊断能力。
3 迁移学习在多维场景中的应用
3.1 小样本环境下的智能诊断策略
大量且完备的机械装备监测数据是实现数据驱动故障诊断方法精准诊断的关键[77]。然而,在实际工业场景中,机械设备大部分时间处于正常运行状态,故障数据极其稀少,甚至无法获得,小样本问题凸显了“深度学习模型对大数据的需求”与“故障数据难以获取”之间的矛盾,严重限制了传统数据驱动方法的有效性。
小样本故障诊断问题的核心在于样本数量过小,无法训练出一个可靠且泛化能力强的诊断模型[78]。通过数据增强方法扩充原始数据是解决小样本问题的直观方法,许多学者通过变分自编码器(variational auto-encoders,VAE)和生成对抗网络生成故障样本。Zhao等[79]提出一种结合VAE和CNN的数据增强故障诊断方法,以解决深度学习方法在小样本和数据不平衡情况下诊断精度不足的问题。Gao等[80]研究了基于Wasserstein距离的生成对抗网络数据增强算法,通过生成数据样本来扩充诊断域数据集,从而提高故障诊断准确性。王进花等[81]提出一种基于自校正辅助分类器生成对抗网络的齿轮箱故障诊断方法,解决了小样本条件下生成样本多样性不足与质量较差的问题。付松[82]将迁移学习引入到深度卷积自编码器(convolutional auto encoder,CAE)的训练中,通过建立故障特征提取模型实现故障样本的有效特征表示,在特征空间中引入元学习策略,同时实现小样本故障和首现故障的准确分类。
通过建立动力学模型生成海量、多样的仿真数据是解决小样本故障诊断问题的另一有效手段。Dong等[83]提出一种基于动力学模型和迁移学习的新型滚动轴承故障诊断框架,利用轴承动力学模型生成大量仿真数据,通过参数迁移策略将仿真数据中学到的诊断知识应用于实际工业场景。Ruan等[84]利用Modelica构建轴承动力学模型,通过仿真数据与实验数据训练CNN,实现了小样本条件下的轴承故障诊断。
降低模型对数据的依赖也是解决小样本故障诊断问题的有效途径之一。基于模型的方法主要包括通过正则化防止模型过拟合,通过迁移学习、元学习等构建高性能模型等,与从数据源头解决小样本问题的方法相比,基于模型的方法侧重于从有限的小样本中提取更多有价值的信息。Han等[85]提出一种结合生成对抗网络和领域自适应的新方法,用于解决不平衡样本下的轴承故障诊断问题。Wu等[86]利用元学习构建了一种小样本迁移学习方法,用于应对变工况下的小样本故障诊断。Li等[87]首次探讨了小样本场景下细粒度故障诊断问题,提出一种基于注意力机制的深度元迁移学习方法,实现了在有限故障数据情况下以更细粒度进行故障诊断。魏文军等[88]提出一种结合模糊聚类和改进Densenet网络的小样本轴承故障诊断方法,解决了实际工业场景中轴承故障数据稀缺、难以满足深度学习训练需求的问题。
3.2 复杂工况下的鲁棒诊断技术
在实际工业场景中,装备运行环境复杂多变,监测对象的实时测试数据与前期采集的训练数据之间难以满足独立同分布的条件。训练数据和测试数据特征分布的不同将导致故障诊断模型的泛化性能无法满足工作要求[89]。
为解决变工况故障诊断难题,领域自适应技术得到了广泛研究,其旨在从源域和目标域中提取域间共享的高级特征,以增强模型在不同数据分布下的泛化能力,通过减小源域与目标域之间的分布差异,提升故障诊断模型在复杂工况下的适应性与鲁棒性。Zhang等[90]提出一种基于监督对比学习的领域自适应网络,通过结合一维卷积残差网络和最大均值差异损失,实现了跨域轴承故障诊断。Shao等[91]结合多尺度特征融合和多级注意力机制,应用跨域适配策略、相关对齐和语义对齐损失,提出一种自适应多尺度注意力卷积神经网络,实现了在数据标记稀缺情况下的跨域故障检测。高学金等[92]针对传统无监督领域自适应方法在变工况轴承故障诊断场景中适用性弱的问题,提出一种多源域自适应残差网络,通过对齐多个源域的相关子域,提高了模型在变工况下的故障诊断性能。
权重重分配策略也可实现变工况场景下的故障诊断。Shen等[93]提出一种基于样本和特征的混合迁移学习策略,采用基于符号秩检验和卡方检验的相似性估计框架选择源数据集,分别在样本和特征层面重新分配权重,解决齿轮故障诊断模型在变工况场景下的泛化性能问题。Pan等[94]提出一种结合深度置信网络和迁移学习策略的高压断路器故障诊断方法,利用深度置信网络提取故障特征,通过调整训练样本权重,使用大量精选的辅助数据来增强学习效果,显著提升了诊断模型的特征学习能力与泛化性能。
预训练-微调策略广泛应用于处理变工况问题,其通过在源工况下预训练深度模型,学习通用特征表示,在目标工况下使用标记样本对预训练模型进行微调,以适应特定工况条件,从而提高故障诊断的准确性和鲁棒性。Chen等[95]通过引入梯度归一化和合页损失函数,提出一种结合改进GAN和微调策略的半监督故障诊断框架,增强了模型对无标记数据的特征学习能力。马佳琪等[96]提出一种基于深度迁移学习的隔离开关机械故障诊断方法,通过二阶同步压缩变换提取振动信号的时频特征,构建并优化预训练模型,最终实现了高准确率和低复杂度的智能故障诊断。与从头开始训练模型的方法相比,预训练-微调策略具有更快的收敛速度和更小的过拟合风险,但该策略的效果在很大程度上依赖于目标域中充足的标记数据。
3.3 跨设备智能泛化诊断
在跨设备故障诊断场景中,故障数据来源于相似但不同的设备,这些设备在组成、材料和尺寸等方面可能存在显著差异,从而导致不同设备的故障特征分布存在较大变化,传统故障诊断模型在此类场景中的泛化能力被严重限制。为解决该问题,迁移学习方法在跨设备故障诊断中得到了广泛应用,通过提取不同设备之间的共享特征,迁移学习能够将从源设备中学到的诊断知识应用于目标设备中,显著提升跨设备诊断的准确性和鲁棒性。Guo等[97]通过结合格拉姆角场和深度CNN,提出一种基于跨设备目标迁移的风电齿轮箱智能故障诊断方法,将故障诊断转化为图像分类任务,有效提升了跨设备场景下的故障识别能力。Wu等[98]利用基于实例的迁移学习方法生成辅助数据集,利用基于特征的迁移学习方法减少数据分布差异,提出一种自适应深度迁移学习方法,用于解决轴承故障诊断中的标记数据稀缺问题,实现了从凯斯西储大学轴承数据集到真实机车轴承数据集的跨设备迁移诊断。Han等[99]提出一种预训练-微调深度迁移卷积神经网络模型,引入全局平均池化替代全连接层,解决了目标域数据不足时的跨设备故障诊断问题。雷亚国等[100]利用领域共享的深度卷积网络将数据映射到深层特征空间,再通过少量目标设备标签数据调整特征分布,提出一种针对跨设备机械故障的靶向迁移诊断方法,提高了标签数据稀缺、故障信息不全情况下的跨设备故障诊断精度,成功应对了实际工业环境挑战。沈飞[101]提出一种基于弱约束快速自组织映射的跨设备迁移模型,共包括实虚极坐标图谱、弱约束快速自组织映射算法、交叉闵可夫斯基距离的源设备通道选择和二阶选择性集成的目标设备通道融合4个环节,实现了跨设备的泛化诊断。
3.4 面向未知工况的智能诊断
传统迁移学习方法通常需要一定数量的目标域数据来调整和训练模型,但在实际工程应用中,目标域的故障数据往往难以获取,特别是在设备早期故障阶段,目标设备或工况下的故障数据在模型训练阶段通常是不可见的。此外,现有的领域自适应故障诊断方法主要关注最小化源域与目标域之间的分布差异,而忽视了可能存在的域外偏移问题[102]。针对上述挑战,基于领域泛化的迁移学习故障诊断技术成为学术界广泛关注的研究方向[103-105],如图6所示,与领域自适应方法相比,领域泛化方法旨在无需目标域数据的前提下,通过在多个源域上学习泛化特征,使模型能够应对未知工况,显著提升其在未见域中的故障诊断能力[106]。
图6领域自适应与领域泛化
Fig.6Domain adaptation and domain generalization
数据增强和域不变表示学习是两种主流的领域泛化策略。数据增强策略通过对输入数据进行增强、变换和随机化,以增加可用训练数据的多样性,从而提升模型在新域中的适应能力。常见的手段包括对源域数据进行扰动、数据合成、数据随机裁剪或旋转等方式。Shi等[107]基于狄利克雷分布生成跨领域增强数据,通过融合来自多个领域的信息,解决了未知工况下的实时诊断问题。Zhao等[102]使用带标签数据的知识辅助多个无标签源域生成伪标签,强化数据多样性,设计了基于熵的样本净化机制,使数据增强过程更加精准,通过有效的数据增强和领域泛化策略,取得了优于现有半监督方法的故障诊断精度。
域不变表示学习策略的核心在于通过学习多个源域中一致的特征表示,避免模型对某个特定源域的依赖,使模型能够直接泛化应用于未知目标域,具体方法包括对抗训练、隐空间变换和特征映射等。Zhang等[108]提出一种基于单判别器的条件对抗领域泛化方法,通过设计条件对抗策略与损失函数,成功提取到领域不变特征,并在未知工况下实现了出色的泛化性能。Zhao等[109]通过全局分布对齐和局部类别聚类来学习领域不变知识并获得判别表示,使深度模型既能利用领域不变特征的普遍适用性,又能保留对特定领域的预测能力,提高了面向故障工况不可见场景下的诊断准确率。Zhu等[110]提出一种基于因果关系和物理驱动的领域泛化网络,通过挖掘故障因果关系并结合物理先验知识,实现了领域不变特征的提取与领域特定知识的嵌入,解决了不同机器在未知工况下数据分布差异带来的领域泛化挑战。
4 迁移学习智能故障诊断的挑战与展望
尽管基于迁移学习的智能故障诊断方法已经在一些应用场景中取得了突破,但要实现其在实际工业系统中的广泛应用仍面临诸多挑战。
4.1 负迁移问题
当源域和目标域之间的工作环境、设备类型或故障模式存在显著差异时,源域知识可能不仅无助于目标域故障诊断,反而会削弱模型性能。如何有效评估源域和目标域之间的可迁移性,以减轻或避免负迁移影响,成为保证迁移学习方法有效性的关键前提。可迁移性评估机制对于解决负迁移问题至关重要,基于统计距离、分布差异度量或域间相关性度量等方法构建可迁移性指标,在迁移前期评估源域数据适用性。
4.2 数据不平衡问题
装备的健康数据远远多于故障数据导致了数据不平衡问题,源域与目标域之间的分布差异进一步放大了不平衡效应,导致模型难以有效捕捉少数类的故障模式。尽管一些重采样和加权方法在传统机器学习中表现良好,但面对高维、非线性工业数据时,现有方法在迁移学习中存在明显的性能瓶颈。未来研究可聚焦于生成对抗网络或变分自编码器等生成模型,增强小样本故障数据的多样性,缓解数据不平衡的负面影响。此外,自监督学习也可在无标签数据的帮助下提升模型的特征提取能力,为故障诊断模型提供更多信息。
4.3 多传感器异构数据迁移
来自不同传感器的数据在频率、维度、采样率等方面具有显著差异,异构数据融合不仅要求提取和对齐多模态特征,还需实现源域与目标域之间的协同迁移,如何在迁移学习故障诊断中有效融合异构数据并提升跨域诊断精度成为重要挑战。跨模态特征对齐技术有助于实现多源异构数据的融合与迁移,通过联合对抗训练或自适应特征嵌入等方法,可实现不同传感器模态数据的协同融合。同时,可研究跨模态迁移机制,使模型能够在不同源域和目标域间有效传递信息,从而提升跨域诊断性能。
4.4 多源域迁移学习
多源域迁移学习是提升故障诊断模型泛化性能的有效方法,然而,在实际工程应用中,来自不同源域的数据可能存在显著差异,如何有效整合多源域数据以提升目标域诊断性能成为多源域迁移学习亟待解决的问题。基于加权集成学习的方法可有效应对多源域迁移学习挑战,将不同源域的贡献进行自适应加权,可以优化目标域的诊断性能。子空间映射技术可以对多源域征进行统一嵌入,可有效提升多源域数据的整合效果。此外,可结合领域专家知识与规则推理,优化多源域的迁移策略。
4.5 迁移学习故障诊断模型的可解释性
模型可解释性是迁移学习在智能故障诊断领域成功应用的关键前提,现有深度迁移学习模型往往被视为“黑箱”,其诊断结果难以被工业专家理解和信任,特别是在高风险场景下,模型的可解释性直接影响其应用的可行性和可信度。通过引入注意力机制、可视化技术或基于规则的解释模型,揭示模型的决策依据与诊断过程,可有效帮助工业专家理解与信任模型。此外,还可开发面向特定应用场景的专家系统,将迁移学习模型的诊断结果与专家知识相结合,提高模型的可信度与可解释性。
5 结论
迁移学习驱动的机械装备智能故障诊断技术已经引起了学术界和产业界的广泛关注,对现有迁移学习在智能故障诊断领域的研究进行系统总结与归纳,对于加速工业系统的数字化与智能化发展具有重要意义。本文系统性梳理了迁移学习在机械装备智能故障诊断领域的研究进展,围绕实例迁移、模型迁移和特征迁移3个维度对现有方法进行了详细分类与分析。针对小样本故障诊断场景、变工况复杂场景、跨设备诊断场景以及故障工况不可见场景,详细评述了各类迁移学习技术的实际应用效果和典型案例。同时,探讨了当前迁移学习智能故障诊断亟须解决的技术难题和研究热点,并从负迁移、数据不平衡以及模型可解释性等方面进行了展望,指出了未来的研究方向与发展趋势。研究的主要结论包括:
1)迁移学习驱动的机械装备智能故障诊断技术在机械装备故障预测与健康管理领域占据关键地位,其发展历程呈现出从传统机器学习到深度学习,再到迁移学习的演进路径。传统机器学习方法为智能诊断奠定基础,深度学习方法显著提升模型性能,而迁移学习则有效应对了数据稀缺和领域泛化等问题。
2)小样本环境下,通过数据增强、动力学模型生成仿真数据和降低模型对数据依赖等方法,有效缓解了小样本问题对故障诊断的限制,提高了诊断准确性。复杂工况下,领域自适应技术、权重重分配策略和预训练-微调策略的应用提升了故障诊断模型的适应性和鲁棒性。跨设备诊断中,迁移学习方法通过提取共享特征显著提升了跨设备诊断的准确性和鲁棒性,成功解决了不同设备故障特征分布差异导致的诊断难题。面向未知工况时,基于领域泛化的迁移学习故障诊断技术通过数据增强和域不变表示学习策略,提高了模型在未见域中的故障诊断能力。
3)尽管迁移学习在机械装备智能故障诊断领域已取得诸多成果,但仍面临一些挑战。如何有效评估源域和目标域之间的可迁移性,以减轻或避免负迁移影响,成为保证迁移学习方法有效性的关键前提。

