融合时空特征与孪生网络的风机叶片结冰预测
doi: 10.11918/202504029
韩华彬 , 高丙朋 , 蔡鑫 , 孙凯
新疆大学智能科学与技术学院,乌鲁木齐 830017
基金项目: 新疆维吾尔自治区自然科学基金(2024D01C28)
Prediction of ice accretion on wind turbine blades using spatiotemporal features and siamese networks
HAN Huabin , GAO Bingpeng , CAI Xin , SUN Kai
School of Intelligence Science and Technology, Xinjiang University, Urumqi 830017 , China
摘要
为实现对风机叶片结冰状态的精准预测,保障风力发电系统的安全与稳定运行,针对风机叶片结冰预测中存在的特征提取不足、多维传感器分布信息不明确,以及小样本学习中类别不平衡的问题,本文提出一种基于残差图注意力与时空双向序列孪生网络(residual graph attention network bidirectional LSTM siamese network,ResGAT-BiLSTM-SN)的风机叶片结冰预测方法。首先,通过数据清洗、滑动窗口采样和特征工程,对监控与数据采集系统(supervisory control and data acquisition,SCADA)的数据进行处理,构建适用于不同小样本学习任务的风机叶片结冰数据集。其次,基于19个关键变量,通过互信息(mutual information,MI)和权重矩阵构建一个非完全连接的无向图,用以反映传感器数据的空间分布与相关性。最后,结合图注意力网络(graphical attention network,GAT)和双向长短时记忆网络(bidirectional long short-term memory networks,BiLSTM)对SCADA数据进行时空特征提取,构建ResGAT-BiLSTM-SN模型对所构造的风机叶片结冰数据集进行未来24 h的结冰预测。选用2017年工业大数据创新竞赛平台中15号和21号风力机数据进行仿真,验证实验结果表明,在3种小样本学习场景下,ResGAT-BiLSTM-SN模型的F1分数均达到0.9以上,显著优于其他对比模型。相较于GAT-BiLSTM-SN模型,ResGAT-BiLSTM-SN模型在预测性能上有明显提升,验证了本文所提预测模型的有效性与优越性。
Abstract
The accurate prediction of wind turbine blade icing is essential for the safe and stable operation of wind power systems. To address the challenges of insufficient feature extraction, unclear distribution of multi-dimensional sensors, and class imbalance in few-shot learning scenarios, this paper proposes a prediction method based on a residual graph attention network-bidirectional LSTM-siamese network (ResGAT-BiLSTM-SN). First, the supervisory control and data acquisition (SCADA) data is processed through data cleaning, sliding-window sampling, and feature engineering, resulting in a blade-icing dataset suitable for various few-shot learning tasks. Second, based on 19 key variables, a non-fully connected undirected graph is built using mutual information (MI) and a weight matrix to capture the spatial distribution and correlations among sensor data. By integrating the graph Attention network (GAT) and the bidirectional long short-term memory network (BiLSTM) to extract spatiotemporal features, the ResGAT-BiLSTM-SN model is developed to perform 24-hour-ahead icing prediction on the constructed dataset. Simulation experiments are conducted using the data from turbines No.15 and No.21 provided by the 2017 Industrial Big Data Innovation Competition platform. The experimental results show that the ResGAT-BiLSTM-SN model achieves F1 scores above 0.9 across three few-shot learning scenarios, significantly outperforming other baseline models. Compared to the GAT-BiLSTM-SN model, the proposed model demonstrates clear improvements in predictive performance, validating its effectiveness and superiority.
风电作为清洁能源的重要形式[1],在实现“双碳”目标中发挥关键作用。然而,在高寒地区,风机叶片表面结冰会导致其质量增加[2],并破坏原有的空气动力学特性[3],进而降低风机的运行效率。更为严重的是,叶片结冰可能导致结构损伤[4]甚至引发断裂,并可能造成风机停运,造成严重的安全风险[5]。因此,实现对风机叶片结冰的准确预测,对于保障风电场的安全稳定运行具有重要意义。
风机叶片结冰的预测方法通常划分为基于物理建模方法与基于数据驱动方法。其中,基于物理建模方法可进一步分为直接法和间接法。直接法[6-7]是通过摄像头、红外传感器和振动传感器等设备实时监测叶片表面的结冰情况,从而实现对结冰状态的直接识别与预报。相比之下,间接法[8]则通过利用历史监测数据构建预测模型,以实现对叶片结冰状态的提前预估。随着工业大数据的发展,基于数据驱动的深度学习方法已成为风机叶片结冰预测的主流手段之一。文献[9]提出一种基于选择性深度集成模型的风机叶片结冰故障预测方法,融合多模型学习进行预测。文献[10]提出一种新型深度学习网络模型(parallel CNN-TCN-GRU,PCTG),实现对风机叶片结冰状态的高精度与长期预测。文献[11]构建一种具有双输入和一维卷积滤波器的卷积神经网络模型,实现对未来24 h叶片结冰状态的预测。文献[12]和文献[13]将结合图注意力网络与时间注意力机制相结合,应用于风机叶片结冰预测任务。文献[14]和文献[15]提出了改进后的BiLSTM网络,对传感器和机器的寿命进行预测。上述方法主要侧重于对SCADA数据的建模,缺乏对风机叶片结冰物理机理特征的研究,未充分考虑到结冰相关特征之间的内在关联。
文献[16]利用专家经验构建与结冰相关的物理特征变量,以提升 SCADA 数据的有效性。 文献[17]提出一种结合特征选择与一维残差卷积神经网络(1D ResNet-CNN)的方法,实现对风机叶片结冰状态的自动检测。 文献[18] 提出一种基于时空特征对齐的迁移学习方法,构建时空注意力模块与 FCNN-LSTM 并行网络的特征提取结构。 但这些方法在实际应用中严重依赖大量带标签的训练样本,然而由于传感器故障、数据传输过程中的错误以及较高的标注成本,使得获取足够的高质量样本面临显著挑战。
近年来,小样本学习(few-shot learning,FSL)为深度学习模型[19]在数据有限的情况下提供了新的解决方案。FSL任务的研究通常使用数据扩充[20]、迁移学习[21](transfer learning,TL)、元学习[22](meta-learning,ML)方法和度量学习。文献[20]使用生成对抗网络(generative adversarial network,GANs)来扩充智能故障诊断任务的数据。文献[21]提出一种结合迁移策略的深度卷积神经网络(CNN),用于实现小样本条件下的机械故障诊断。孪生网络(siamese network,SN)通过度量学习在嵌入空间中对不同类别样本进行区分,已被广泛应用于FSL任务中[23-25]。文献[23]基于SN结构设计一种用于小样本故障诊断方法,通过样本对之间的相似度学习实现高效分类。文献[24]和文献[25]采用深度CNN作为特征提取器,并结合SN作为度量模块来确定样本之间的相似性。上述文献的数据基于人工合成的数据,在真实的多维数据中应用有限。
现有文献对风机叶片结冰的时空特征相关性分析研究较少,同时由于叶片结冰数据有限,会对叶片结冰预测的准确性产生影响。基于SN的度量策略可提升有限样本的利用效率,并通过将原始特征空间投影到度量空间来缓解类别不平衡,从而提升FSL任务的性能。因此,本文提出一种基于ResGAT-BiLSTM-SN模型的风机叶片结冰预测方法,以实现对未来24 h结冰状态的预测。
本文首先对风机叶片结冰机理特征进行分析,考虑结冰相关特征之间的内在关联,构建任务相关的数据集,并据此设计3种具有代表性的小样本学习场景。其次,利用互信息构建属性图,通过图注意力网络进行空间建模,采用双向长短期记忆网进行时间建模,并结合残差连接机制增强特征表达能力。最后,融合孪生网络对样本对进行相似性度量,并通过共享权重机制提升模型的泛化能力,构建的ResGAT-BiLSTM-SN模型实现了空间相关性与时间动态特征的联合建模,显著提升风机叶片结冰的预测性能。
1 数据预处理
1.1 数据来源
本文实验数据[26]由中华人民共和国工业和信息化部提供,并用于首届工业大数据创新竞赛。实验数据涵盖文献[26]中15号与21号风机在连续运行周期内的实时监测数据,数据采集频率约为7 s,每个数据集包含共26个变量,包括风机运行参数、环境参数及状态参数等,具体变量名称如表1[16]所示。每个变量可以视为一个传感器。因此“变量”和“传感器”在此后不再区分。此外,文献[26]还提供了结冰和非结冰期间的完整标签。
1风机叶片结冰数据集
Tab.1Wind turbine blade icing dataset
注:变量名称参考国标GB/T43904—2024《风力发电机组运行参数监测与评估规范》及文献[16]
1.2 特征工程
深度学习能够减少对特征工程的依赖,但忽视叶片结冰的物理机制可能影响模型预测性能。为此,结合专家经验筛选出26个特征,并通过特征交互分析与数据建模方法构建一系列衍生特征。
首先,基于风机叶片的变桨角度与变桨电机温度的相关性,构建交互特征:变桨角度均值θ-和变桨电机温度均值T-,作为整体变桨系统的代表特征;其次,构建风速与功率比值(风速-功率比α1)、风速与发动机转速比值(风速-转速比α2),以及风速、功率与发动机转速的组合比值(风速-功率-转速比α3);随后,引入机舱温度与环境温度的差值 Td作为特征;最后,通过最小二乘法拟合正常功率曲线,计算正常功率与实际功率的差值Pd。构建特征的相关数学表达式如下:
θ-=θ1+θ2+θ3/3
(1)
T-=T1+T2+T3/3
(2)
α1=[(V+5)/P]2-1
(3)
α2=(V+5)/Ng+52-1
(4)
α3=(V+5)2/(P+5)Ng+52-1
(5)
Td=Tin -Tout
(6)
Pd=P1-Ptrue /P1
(7)
式中:θ为叶片变桨角度,V为风速,Ng为发电机转速,T1T2T3为叶片变桨电机温度,Tin为机舱温度,Tout为环境温度,P1为拟合的正常功率,Ptrue为实际功率。
1.3 特征选择
本文通过采用递归特征消除(recursive feature elimination,RFE)结合极限梯度提升(extreme gradient boosting,XGBoost)特征重要性评估进行特征选择。研究共涉及33个特征,其中26个特征来自SCADA数据集,7个新特征来自特征工程。所有特征被输入XGBoost模型进行训练,采用5折交叉验证进行模型评估,通过迭代优化确定最优特征子集。特征选择结果如图1所示,当选用19个特征时,模型在预测任务中的准确率达到最高值。最终选定的特征在表1中以加粗形式标出。该特征选择策略具有通用性,可适用于其他SCADA数据集。
1特征选择结果
Fig.1Feature selection results
2 建立ResGAT-BiLSTM-SN结冰预测模型
2.1 空间建模
图结构适用于非欧几里得空间中的传感器数据建模。然而,由于风机传感器位置难以确定,基于物理位置信息构建图结构并不可行。本文通过数据相关性分析构建属性图,以更准确地表征传感器数据的空间关联。在数据预处理后,从n个传感器中获取有效数据,记为X={x1x2,···,xn}。其中,xi代表单个传感器收集的时序数据,包括风速、发电机转速、风电功率等参数,这些数据全面反映风机的运行工况。
本文定义一个加权无向属性图G=(VE),其中VE分别表示属性图的节点集合和边集合。每个传感器对应加权无向图中的一个节点。图中的所有节点可以表示为集合V={v1v2,···,vn}。任意两个传感器的时序数据可以建模为两个随机变量xiyj
本文采用互信息(MI)分析来量化变量xiyj之间的依赖关系。MI值可以用熵τMI表示,其计算公式为
τMIIxi,yj=Hxi+Hyj-Hxi,yj
(8)
式中:Hxi)和Hyj)分别为变量xiyj的熵,Hxiyj)为变量xiyj的联合。
引入变量dxiyj)来表示传感器xi和传感器yj之间的相关性距离,该值越大,表示传感器间的相关性越弱,其定义为
dxi,yj=1τMIxi,yj,ij0,i=j
(9)
采用基于高斯核的阈值距离函数构建加权无向图,传感器i与传感器j之间的边权重ωxiyj计算公式为
(10)
式中:σn个传感器之间的空间距离的标准差,ε为阈值,采用n个传感器之间的平均距离作为阈值。
采用GAT来提取属性图中的空间信息。假设邻近传感器ij的特征向量分别定义为xitRM×1xjtRM×1,其中t表示时间步长,M为时间窗口大小。以传感器i为中心节点,传感器j到传感器i的注意力权重系数eij可以表示为
eij=ReLUαWxit||Wxjt
(11)
式中:WF为学习参数,F为传感器i在融合操作后输出的新特征向量的维数,ReLU(·)为Leaky ReLU激活函数,(·‖·)为连接操作,αR1×2F为传感器j和传感器i的输出特征之间的相似度。
为了更好地分配权重,必须使用Softmax函数对所有邻居与传感器i之间计算的相似度进行归一化,得到的注意力得分可以表示为
αij=expeijkχ(i) expeik
(12)
式中,kχi)表示k为传感器j的邻接传感器。
多头注意力机制计算加权和后,传感器i生成的新特征向量表示为
hi'=k=1KZjχ(i) αij(k)W(k)xjt
(13)
式中:hi'为新特征向量,αijk为第 k 头的注意得分,Wk)是第 k 头的学习参数。
2.2 时间建模
风机叶片结冰为时间依赖的复杂动态过程,受气象条件和运行参数耦合影响。环境温度变化先于结冰状态变化,而结冰状态对风速和功率输出存在滞后效应,体现出历史依赖与前向时序依赖的复合特征。BiLSTM双向建模机制能够同时捕获前向与后向的时序关系,有效提取叶片结冰的完整动态特征,与其物理演化规律高度吻合。为了区分不同的时间步,给定时间步序列Z=[z1z2,···,zn],前向LSTM的隐藏层ht和后向 LSTM 隐藏层ht计算公式为:
ht=LSTM,fxt,ht-1
(14)
ht=LSTM,bxt,ht+1
(15)
式中:LSTM,f(·)为前向 LSTM 数据处理,LSTM,b(·)为后向 LSTM 数据处理,ht-1为前一刻隐藏状态,ht-1为下一刻隐藏状态。
若仅提取最后一个时间步的BiLSTM的隐藏状态,可能导致部分时序信息丢失。为此,本文将所有时间步的输出进行拼接,得到拼接后的特征矩阵C=(C1C2,···,Cn)。最后,通过平均池化操作将拼接后的特征矩阵转换为特征嵌入向量GW,其计算公式为
GW=MeanPool C1,C2,,Cn
(16)
式中:MeanPool(·)为平均池化操作,GW为一维特征嵌入向量。
2.3 残差连接
在深度神经网络的训练过程中,梯度消失可能导致模型难以学习深层特征,影响模型收敛效果。为解决这一问题,并在信息传递过程中保留特征完整性,GAT-BiLSTM模块引入残差连接机制,其数学公式为
Yi=BiLSTMGATzi+zi
(17)
式中:BiLSTM(GATzi))为GAT-BiLSTM模块的整体变换,zi为输入特征,Yi为嵌入特征。
2.4 孪生网络
在风机叶片结冰预测任务中,SN主要用于学习风机运行状态之间的相似性,并通过度量不同时间段的特征差异来识别和预测结冰状态。该网络采用共享权重的双分支结构,使不同输入样本经过相同的特征提取器后,生成具有可比性的特征表示,从而提升特征学习的稳定性和一致性。此外,SN网络利用余弦相似度计算风机运行状态的相似性,其计算公式为:
EWY1,Y2=GWY1GWY2GWY1GWY2
(18)
式中:Y1Y2为图嵌入特征对,GWY1)和GWY2)为嵌入向量, EWY1Y2)为相似度量,“·”为向量点积,‖·‖为欧几里得范数。
在风机叶片结冰预测任务中,通过全连接层与sigmoid函数依次对特征进行处理,得到ResGAT-BiLSTM-SN模型的最终结冰预测输出EW。其计算公式为
φY1,Y2=sigmoidFEWY1,Y2
(19)
式中:sigmoid(·)和F(·)分别为sigmoid函数和全连接层函数,φY1Y2)为Y1Y2的相似度。
具体而言,ResGAT-BiLSTM-SN模型对输入样本对的特征差异进行比较,输出一个表示结冰状态的连续概率值,为实现由概率空间到类别空间的映射。本文采用标准的二分类判别策略,设定判断阈值θ,当预测概率pθ时,将样本判定为“结冰状态”;反之,则判定为“非结冰状态”。
2.5 焦点损失(focal loss,FL)函数
FL函数通过降低易分类样本的损失,增强对难分类样本的学习,动态调整损失权重,提高模型对少数类样本的学习能力,有效缓解类别不平衡问题。FL函数计算公式为
LFpt=-αt1-ptγlogpt
(20)
式中:pt为真实类别的预测概率,αt为平衡因子,γ为焦点调节参数,(1-ptγ为焦点因子。
2.6 ResGAT-BiLSTM-SN模型
本文提出一种用于风机叶片结冰预测的ResGAT-BiLSTM-SN模型,其整体结构如图2所示。首先,基于多维传感器数据的相关性构建属性图。将属性图输入到两个结构共享的孪生子网络,在每个子网络中,通过时空特征提取模块提取空间特征和时间特征。其次,在每个子网络内部对提取的特征进行拼接,并执行残差连接,采用余弦相似度度量两组融合特征的相似性。最后,通过全连接层生成输出预测结果,预测风机叶片结冰状态。
2ResGAT-BiLSTM-SN 模型结构图
Fig.2Structure of the ResGAT-BiLSTM-SN model
3 风机叶片结冰预测流程和评价指标
3.1 风机叶片结冰预测流程
本文所提出的基于ResGAT-BiLSTM-SN模型的风机叶片结冰预测流程图如图3所示。
Step1 从SCADA系统获取风机叶片的高维时间序列数据和状态特征信息。
Step2 对原始数据进行标准化处理,包括数据清洗、噪声剔除、缺失值填补及归一化操作,为模型训练奠定基础。
Step3 分析叶片结冰特征并提取影响结冰的关键特征,进行特征工程,构造新的特征组合。
Step4 构建基于ResGAT-BiLSTM-SN的预测模型。其中,GAT建模空间关系,BiLSTM捕捉时序动态,SN进行相似性度量,并通过残差连接机制融合空间特征提取和时间特征提取的输出。
Step5 通过网格搜索和五折交叉验证优化模型超参数,使用测试集验证最终模型性能,确保预测精度。经过多次实验对比,确定基于ResGAT-BiLSTM-SN预测模型的最优结冰判断阈值为0.5。
3风机叶片结冰预测流程图
Fig.3Flowchart of wind turbine blade icing prediction
3.2 评价指标
在风机叶片结冰预测中,关键性能指标包括准确度、精确度、召回率和F1分数。
准确度(Accuracy)指模型正确检测的样本数占总样本数的比例,其计算公式为
A=xTP+xTNxTP+xTN+xFP+xFN
(21)
精确度(Precision)指模型检测为所有样本中实际为结冰样本的比例,其计算公式为
P=xTPxTP+xFP
(22)
召回率(Recall)是指在所有结冰样本中,模型正确检测为实际结冰样本的比例,其计算公式为
R=xTPxTP+xFN
(23)
F1 分数(F1 score)是精确度和召回率的调和平均值,F1 分数提供一个平衡的性能指标,其计算公式为
F1=2×P×RP+R
(24)
式中:xTP为真阳性样本数,xTN为真阴性样本数,xFP 为假阳性样本数,xFN为假阴性样本数。
4 实验验证
所有实验均在本地工作站上进行,硬件配置包括 Intel( R)Core( TM)i7-14700HX CPU、NVIDIA GeForce RTX 4060 GPU 和 16 GB RAM。软件环境基于 Python 3.11.9,深度学习模型使用 PyTorch 2.3.1 实现。
4.1 小样本学习
为构建小样本学习(FSL)场景,本文将SCADA数据的采样频率统一调整为5 min。经过数据清洗后,原始数据集中分别包含640个结冰样本和8 384个非结冰样本。为构建不同的FSL场景,从结冰与非结冰样本中分别按不同比例ρ%均匀采样。
采用滑动窗口采样方法生成新的实验数据集,取不同采样比例ρ%=100%、ρ%=75%和ρ%=50%构造3个小样本学习场景,分别为场景1、场景2和场景3。本文未采用重叠采样,目的是检验所提出的预测模型在无需数据增强的情况下对FSL场景的适应能力。
新的实验数据集被随机划分为10个子集,其中训练集、验证集和测试集的比例为6∶2∶2。由于ResGAT-BiLSTM-SN模型通过样本对自由组合显著扩展了训练数据量。在训练过程中,输入样本对由结冰和非结冰样本自由组合生成,有效缓解了数据稀缺和不平衡问题。同时,孪生网络的度量学习框架通过比较样本对的特征差异,聚焦于结冰与非结冰状态的区分,减少了对样本数量的依赖。
4.2 属性图构造
为构建属性图,本文基于表1中通过特征选择所选取的19个关键变量作为节点特征。为分析这些变量之间的相关性,利用公式(8)计算任意两个变量之间的MI值。通过计算得到的MI值构成一个19×19的互信息相关矩阵热图。如图4所示,图中的“*”符号的数量表示变量之间相关性的强度。“*”符号越多表明相应传感器可能更存在空间相关性,而“*”符号越少,则表明传感器之间的相关性较弱,甚至可能彼此不相关。
根据式(9)和式(10)计算属性图边的权重,并形成一个19×19的权重矩阵,如图5所示。权重值范围为[-1,1],较大的权重表示变量间的相关性较强,较小的权重表示变量间的相关性较弱。
图4中计算得到的互信息矩阵用于构建如图5所示的加权邻接矩阵,并进一步生成属性图,如图6所示。图6展示了19个传感器在非欧几里得空间中的分布关系,构成一个稀疏的加权无向图,其中图的边具有不同的权重。本文将边权重划分为3类:小于0.4的边用蓝色虚线表示,大于0.8的边用红色点线表示,0.4~0.8之间的边用黄色实线表示。尽管图6未提供传感器的物理位置信息,但其图结构能够有效反映多维传感器数据之间的空间相关性。在完成节点特征嵌入后,属性图被自由配对以构造样本对,并输入至ResGAT-BiLSTM-SN模型中用于进一步处理。
4首选变量MI相关矩阵
Fig.4MI correlation matrix of the preferred variables
5属性图中边的权重矩阵
Fig.5Edge weight matrix of a property graph
619个传感器生成的图结构
Fig.6Graph structure generated by nineteen sensors
4.3 基线模型和超参数设置
本文提出的ResGAT-BiLSTM-SN模型包含多个超参数。GAT模块中每个图注意力层,以及BiLSTM模块中每个孪生子网络的BiLSTM层,其结构参数均可独立设定。为简化模型设计,本文采用以下措施:各模块中隐藏层的神经元数量相同,GAT模块的注意力头数保持一致。本模型的部分超参数通过经验手动调优,具体设置如下:优化器为Adam,学习率为0.001,训练轮次为200,批量大小为64,每个输入样本构造最相似样本数量为10;FL函数的αγ分别设为0.25和2.0。上述超参数配置对本文其他模型具有通用性。
除上述通过经验设定的超参数外,其余5个关键结构性超参数通过网格搜索与五折交叉验证评估确定,具体包括:GAT层数 n1∈{1,2,3,4},GAT中每个隐藏层的神经元数h1∈{8,16,32,64,128},GAT的注意力头数k1∈{1,2,3},BiLSTM层数 n2∈{1,2,3,4},以及BiLSTM中每个隐藏层的神经元数h2∈{16,32,64}。
首先,使用训练集对不同超参数组合下的候选模型进行训练,并基于验证集评估其性能。选择具有最高F1分数的模型作为最优模型,其超参数视为最优组合。通过网格搜索和五折交叉验证确定以下参数:n1=2,h1=64,k1=1,n2=2,h2=64。
上述超参数是在假设SCADA数据时间窗口大小M为16的情况下设置的。然而,训练集、验证集和测试集的样本量随着M值的变化而变化。为研究M值对风机叶片结冰预测结果的影响,设定M的取值范围为φM={8,12,16,20,24}。图7展示了不同时间窗口大小M下验证集的模型性能对比结果。实验结果表明,当M设置为16时,所有性能指标均达到最优值。
7时间窗口大小M的敏感性分析
Fig.7Sensitivity analysis of the time window size M
本文对其他模型进行多次实验,最终选择的各个模型的超参数如表2所示。
2模型的结构超参数
Tab.2Structural hyperparameters of the model
4.4 基线模型比较
本文比较 9 种深度学习模型在 3 种小样本场景(ρ% = 100%、ρ% = 75% 和 ρ% = 50%)下的风机叶片结冰预测性能,结果见表3,可以看到,ResGATBiLSTM-SN 模型在所有小样本场景中均取得最佳性能表现。在场景 1 中,ResGAT-BiLSTM-SN 模型的各项性能指标均优于对比模型,这体现其在捕捉时序依赖关系和提取风机叶片结冰特征方面的显著优势。在场景 2中,与 Transformer 模型相比,ResGATBiLSTM-SN 模型在准确度、精确度和 F1 分数方面分别提高了 20.2%、34.1% 和 17.6%,这说明该模型能够更好地捕捉数据的时序依赖关系。在场景 3 中,与 GRU 模型相比,ResGAT-BiLSTM-SN 模型在准确度、精确度和 F1 分数方面分别提高了 34.4%、 26.5% 和 20. 0%,这表明随着样本的减少,该模型在精确度和整体性能方面具有更强的优势。
与传统模型相比,ResGAT-BiLSTM-SN 模型相较于 CNN 模型在 3 个小样本场景的 F1 分数分别提升了 26.1%、30.9% 和 37. 0%,其优异性能随样本量增加而增强。此外,在 3 种小样本场景中,ResGAT-BiLSTM-SN 模型的 F1 分数比 TL [27] 模型分别提升了14.8%、14.5% 和9.3%,比 LOSGAN [28]模型分别提高了 35.8%、31.9% 和 28.9%。这表明基于孪生网络的小样本学习方法比其他小样本学习方法更适合风机叶片结冰预测任务。
3基线模型比较
Tab.3Comparison of baseline models
与其他的时空图模型相比,本文提出的模型性能表现优异,在场景 2 中,ResGAT-BiLSTM-SN 模型的 F1 分数分别较 ST-GCN [29] 模型和 ASTGCN [30] 模型提升了18.4%和 13.2%; 在场景 3 中提升了 15.1% 和 14. 0%。这表明在低样本场景中,该模型表现出更强的时空关联建模能力。
与其他同类任务模型相比,本文提出的模型在 3 种小样本场景下的 F1 分数和召回率分别比 PSOConv-LSTM-Transformer [16] 模型平均提升了 46.9% 和 47.2%,这表明其在数据稀缺条件下具备更强的特征提取与目标识别能力。同时,相比 TS-FCNNLSTM 模型,本模型在 F1 分数和召回率上平均提升了 13.2% 和 6%,进一步验证了该模型在小样本条件下的优越特征建模与泛化能力。
4.5 消融实验
本文通过消融实验系统评估不同模型结构对风机叶片结冰预测性能的影响,结果如表4所示,可以看到,在 3 种小样本场景中,ResGAT-BiLSTM-SN 模型与 GAT-BiLSTM-SN 模型相比,其 F1 分数分别提高了 4%、2.8% 和 3.6%,这表明残差连接的引入有效缓解了深度网络训练中的梯度消失问题,进一步增强了模型在时空特征提取与信息融合方面的能力。
此外,在 3 种小样本场景中,GAT-BiLSTM-SN 模型在召回率方面较 GAT-BiGRU-SN 模型分别提升了 14.4%、6. 0% 和 5.5%,说明在风机叶片结冰预测任务中,BiLSTM 模块比 BiGRU 模块具有更强的时序特征捕捉能力,尤其在与 GAT 模块结合后,能够更有效地整合空间拓扑信息与时间依赖关系。
与 GCN-BiLSTM-SN 模型相比,GAT-BiLSTM-SN 模型在准确率、召回率和 F1 分数上均表现更优,这表明 GAT 模块能够通过注意力机制动态分配邻居节点的权重,从而自适应地聚焦于对结冰预测最重要的空间依赖关系。
与 LSTM 模型相比,BiLSTM 模型在 3 种小样本场景中的 F1 分数和精确度平均提升了 12.4% 和 12.5%,且召回率也有明显改善。这表明双向 LSTM 结构相比单向 LSTM 在风机叶片结冰预测任务中具有更强的性能优势。
进一步分析显示,在场景 1 中,GAT-BiLSTM-SN 模型比 BiLSTM 模型、GAT 模型和 GCN 模型的 F1 分数分别提高了 19.1%、36.6% 和 41.9%,表明结合空间特征提取与时间特征提取的混合模型较单一特征提取模型表现更优。
4不同模型结构的消融实验
Tab.4Ablation tests on different model structures
4.6 模型泛化实验
为进一步评估 ResGAT-BiLSTM-SN 模型的泛化性能,将 15 号风机数据和 21 号风机数据交替作为训练集和测试集。这是因为 15 号与 21 号风机在所选时间段内具备连续、稳定的运行记录,满足高质量建模需求。其次,15 号和 21 号风机分别位于风电场内不同地理区域,这有助于评估模型在不同运行条件下的泛化能力。
当以 15 号风机数据作为训练集时,分别取 21 号风机数据的 10%、30% 和 50% 作为新的数据集,并添加到 15 号风机数据中。相应地,当以 21 号风机数据作为训练集时,分别取 15 号风机数据的 10%、30% 和 50% 为新的数据集,并添加到 21 号风机数据中,具体划分案例如表5所示。
在 3 种小样本场景下进行实验并选取关键指标进行量化分析,结果如图8所示,可以看到,本文提出的模型在不同场景下均展现出良好的泛化能力,其准确度、精确度、召回率和 F1 分数均超过 0.84。具体而言,ResGAT-BiLSTM-SN 模型在样本量较大的场景 1 中取得了较高的准确度和 F1 分数,且各类别的精确度和召回率变化较为平稳,表明 ResGATBiLSTM-SN 模型在数据充足的情况下具有较强的学习能力和泛化能力。然而,随着样本数量的减少,精确度和召回率指标在场景 2 和场景 3 中表现出波动,这表明 ResGAT-BiLSTM-SN 模型的泛化能力随样本数量的减少而下降。
5不同数据集划分案例
Tab.5Examples of different dataset splits
8不同场景下模型泛化能力柱形图
Fig.8Model generalization capability bar chart for different scenarios
5 总结
1)对 SCADA 数据进行特征工程处理,通过特征交互方法构造了 7 个新的衍生特征。
2)通过递归特征消除与 XGBoost 重要性评估相结合进行特征选择,最终确定 19 个关键特征。此外,基于互信息分析和高斯核阈值距离函数构建了具有良好可解释性的图网络结构。
3)利用GAT模块通过构建属性图对传感器变量间的空间依赖性进行建模,BiLSTM模块则有效捕捉结冰过程中的长期时序依赖性。残差连接的引入缓解了深度网络中的梯度消失问题。此外,孪生网络通过构造样本对扩展训练数据,有效应对小样本学习场景中的挑战。在3种小样本场景下对不同的深度学习模型进行对比实验,结果表明,在F1分数方面,ResGAT-BiLSTM-SN模型比ST-GCN模型和ASTGCN模型平均提升了15.2%和10.0%。消融实验结果表明,孪生网络架构的引入使模型所有性能指标均得到显著改善,证实模型整体架构在风机叶片结冰预测任务中的有效性。
4)在3种FSL场景下的跨风机实验结果表明,ResGAT-BiLSTM-SN模型在数据充足条件下具有较强的学习能力,其准确度、精确度、召回率和F1分数均超过0.84,验证了本文所提模型具有良好的泛化性。
1特征选择结果
Fig.1Feature selection results
2ResGAT-BiLSTM-SN 模型结构图
Fig.2Structure of the ResGAT-BiLSTM-SN model
3风机叶片结冰预测流程图
Fig.3Flowchart of wind turbine blade icing prediction
4首选变量MI相关矩阵
Fig.4MI correlation matrix of the preferred variables
5属性图中边的权重矩阵
Fig.5Edge weight matrix of a property graph
619个传感器生成的图结构
Fig.6Graph structure generated by nineteen sensors
7时间窗口大小M的敏感性分析
Fig.7Sensitivity analysis of the time window size M
8不同场景下模型泛化能力柱形图
Fig.8Model generalization capability bar chart for different scenarios
1风机叶片结冰数据集
Tab.1Wind turbine blade icing dataset
2模型的结构超参数
Tab.2Structural hyperparameters of the model
3基线模型比较
Tab.3Comparison of baseline models
4不同模型结构的消融实验
Tab.4Ablation tests on different model structures
5不同数据集划分案例
Tab.5Examples of different dataset splits
VARGAS S A, ESTEVES G R T, MAAIRA P M,et al. Wind power generation: A review and a research agenda[J]. Journal of Cleaner Production,2019,218:850. DOI:10.1016/j.jclepro.2019.02.015
SUNDEN B, WU Z. On icing and icing mitigation of wind turbine blades in cold climate[J]. Journal of Energy Resources Technology,2015,137(5):051203. DOI:10.1115/1.4030352
GAO Linyue, HU Hui. Wind turbine icing characteristics and icing-induced power losses to utility-scale wind turbines[J]. Proceedings of the National Academy of Sciences,2021,118(42):e2111461118. DOI:10.1073/pnas.2111461118
SHU Lichuan, LI Hantao, HU Qin,et al. Study of ice accretion feature and power characteristics of wind turbines at natural icing environment[J]. Cold Regions Science and Technology,2018,147:45. DOI:10.1016/j.coldregions.2018.01.006
SUNDARESAN A, ARUNVINTHAN S, PASHA A A,et al. Effect of ice accretion on the aerodynamic characteristics of wind turbine blades[J]. Wind and Structures,2021,32(3):205. DOI:10.12989/was.2021.32.3.205
KIM D, SAMPATH U, KIM H,et al. A fiber-optic ice detection system for large-scale wind turbine blades[C]//Optical Modeling and Performance Predictions IX. Bellingham: SPIE,2017,10374:52
LI Pengfei, HU Weihao, HU Rui,et al. Imbalance fault detection based on the integrated analysis strategy for variable-speed wind turbines[J]. International Journal of Electrical Power & Energy Systems,2020,116:105570. DOI:10.1016/j.ijepes.2019.105570
MUÑOZ C Q G, MAÁRQUEZ F P G, TOMAÁS J M S. Ice detection using thermal infrared radiometry on wind turbine blades[J]. Measurement,2016,93:157. DOI:10.1016/j.measurement.2016.06.064
XIAO Jin, LI Chunyan, LIU Bo,et al. Prediction of wind turbine blade icing fault based on selective deep ensemble model[J]. Knowledge-based Systems,2022,242:108290. DOI:10.1016/j.knosys.2022.108290
DAI Jiazhi, ROTEA M, KEHTARNAVAZ N. An ensemble network for high-accuracy and long-term forecasting of Icing on wind turbines[J]. Sensors,2024,24(24):8167. DOI:10.3390/s24248167
KREUTZ M, ALLA A A, VARASTEH K,et al. Convolutional neural network with dual inputs for time series ice prediction on rotor blades of wind turbines[J]. Procedia CIRP,2021,104:446. DOI:10.1016/j.procir.2021.11.075
YING Linghao, XU Zhijie, ZHANG Haohan,et al. Graph temporal attention network for imbalanced wind turbine blade icing prediction[J]. IEEE Sensors Journal,2024,24(6):9187. DOI:10.1109/JSEN.2024.3358873
WANG Lei, HE Yigang, ZHOU Yazhou,et al. A novel approach to wind turbine blade icing detection with limited sensor data via spatiotemporal attention Siamese network[J]. IEEE Transactions on Industrial Informatics,2024. DOI:10.1109/TII.2024.3378775
JIN Ruibing, CHEN Zhenghua, WU Keyu,et al. Bi-LSTM-based two-stream network for machine remaining useful life prediction[J]. IEEE Transactions on Instrumentation and Measurement,2022,71:1. DOI:10.1109/TIM.2022.3167778
FAN Yongxin, TANG Qian, GUO Yangming,et al. BiLSTM-MLAM: A multi-scale time series prediction model for sensor data based on Bi-LSTM and local attention mechanisms[J]. Sensors,2024,24(12):3962. DOI:10.3390/s24123962
GUO Jicai, SONG Xiaowen, TANG Shufeng,et al. Fault diagnosis of wind turbine blade icing based on feature engineering and the PSO-ConvLSTM-transformer[J]. Ocean Engineering,2024,302:117726. DOI:10.1016/j.oceaneng.2024.117726
沈学利, 杨莹, 秦鑫宇, 等. 基于残差神经网络的风机叶片结冰故障诊断[J]. 噪声与振动控制,2022,42(1):79. SHEN Xueli, YANG Ying, QIN Xinyu,et al. Wind turbine blade icing fault diagnosis based on residual neural network[J]. Noise and Vibration Control,2022,42(1):79
YUE Ruxu, JIANG Guoqian, JIN Xiaohang,et al. Spatio-temporal feature alignment transfer learning for cross-turbine blade icing detection of wind turbines[J]. IEEE Transactions on Instrumentation and Measurement,2024,73:1. DOI:10.1109/TIM.2024.3350147
韩华彬, 高丙朋, 蔡鑫, 等. 基于HO-CNN-BiLSTM-Transformer模型的风机叶片结冰故障诊断[J]. 广西师范大学学报(自然科学版),2025,43(6):13. HAN Huabin, GAO Bingpeng, CAI Xin,et al. Wind turbine blade icing fault diagnosis based on HO-CNN-BiLSTM-Transformer model[J]. Journal of Guangxi Normal University(Natural Science Edition),2025,43(6):13. DOI:10.16088/j.issn.1001-6600.2024101701
杨磊, 何鹏举, 丑幸幸. 基于TimeGAN数据增强的复杂过程故障分类方法[J]. 浙江大学学报(工学版),2024,58(9):1768. YANG Lei, HE Pengju, CHOU Xingxing. TimeGAN data augmentation-based fault classification method for complex processes[J]. Journal of Zhejiang University(Engineering Science),2024,58(9):1768. DOI:10.3785/j.issn.1008-973X.2024.09.002
SHAO Siyu, MCALEER S, YAN Ruqiang,et al. Highly accurate machine fault diagnosis using deep transfer learning[J]. IEEE Transactions on Industrial Informatics,2018,15(4):2446. DOI:10.1109/TII.2018.2864759
FENG Yong, CHEN Jinglong, XIE Jingsong,et al. Meta-learning as a promising approach for few-shot cross-domain fault diagnosis: Algorithms,applications,and prospects[J]. Knowledge-Based Systems,2022,235:107646. DOI:10.1016/j.knosys.2021.107646
ZHENG Xiaoyang, FENG Zhixia, LEI Zijian,et al. Few-shot learning fault diagnosis of rolling bearings based on siamese network[J]. Measurement Science and Technology,2024,35(9):095018. DOI:10.1088/1361-6501/ad57d9
ZHOU Xiaokang, LIANG Wei, SHIMIZU S,et al. Siamese neural network based few-shot learning for anomaly detection in industrial cyber-physical systems[J]. IEEE Transactions on Industrial Informatics,2020,17(8):5790. DOI:10.1109/TII.2020.3047675
JAVAID N, JAN N, JAVED M U. An adaptive synthesis to handle imbalanced big data with deep siamese network for electricity theft detection in smart grids[J]. Journal of Parallel and Distributed Computing,2021,153:44. DOI:10.1016/j.jpdc.2021.03.002
工业大数据产业创新平台[EB/OL].(2017-07-15)[2025-07-05].http://www.industrial-bigdata.com
ZHANG Ansi, LI Shaobo, CUI Yunxin,et al. Limited data rolling bearing fault diagnosis with few-shot learning[J]. IEEE Access,2019,7:110895. DOI:10.1109/ACCESS.2019.2934233
LIU Shen, CHEN Jinglong, QU Cheng,et al. LOSGAN: Latent optimized stable GAN for intelligent fault diagnosis with limited data in rotating machinery[J]. Measurement Science and Technology,2021,32(4):045101. DOI:10.1088/1361-6501/abd0c1
YAN Sijie, XIONG Yuanjun, LIN Dahua. Spatial temporal graph convolutional networks for skeleton-based action recognition[C]//Proceedings of the AAAI Conference on Artificial Intelligence. Menlo Park: AAAI Press,2018:7444
GUO Shengnan, LIN Youfang, FENG Ning,et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]//Proceedings of the AAAI conference on artificial intelligence. Menlo Park: AAAI Press,2019:922