摘要
针对地铁隧道盾构姿态难以控制的问题,以长春某隧道工程为例,基于现场实测数据,构建了一个融合经验模态分解(empirical mode decomposition,EMD)和轻量级梯度提升机(light gradient boosting machine,LightGBM)的盾构姿态预测模型(EMD-LightGBM)。首先,通过特征重要性和相关性分析筛选原始数据集特征。然后,利用EMD技术将数据分解为多个平稳子序列,并组成新数据集。最后,通过该新数据集拟合训练EMD-LightGBM来实现盾构姿态的预测,并且比较了该模型与单纯的LightGBM及融合EMD的反向传播神经网络(backpropagation neural network,BPNN)的预测效果。通过预测精度和预测稳定性两种评价体系来验证EMD-LightGBM模型的优良性能。结果表明:与LightGBM和EMD-BPNN相比,EMD-LightGBM在盾构姿态偏差预测折线图中的表现最佳,其平均绝对误差(mean absolute error,EMA)和均方根误差(root mean square error,ERMS)最大分别为2.89 mm和4.13 mm,决定系数R2最小值为0.95;同时,EMD-LightGBM的预测平均绝对误差EMA和均方误差(mean square error,EMS)的95%置信区间最大值分别为3.5 mm与25.6 mm2,结合其预测值的绝对误差(absolute error,EA)和平方误差(square error,ES)的良好频数分布,都说明了EMD-LightGBM在预测盾构姿态时的高精度和稳定性。研究成果可为类似工程的盾构姿态控制提供一种理论方法。
Abstract
In response to the problem of difficult control of shield tunneling attitude in subway tunnels, taking a tunnel project in Changchun as an example, a shield tunneling attitude prediction model (EMD-LightGBM) was constructed based on on-site measured data, which integrates empirical mode decomposition (EMD) and lightweight gradient boosting machine (LightGBM). Firstly, filter the features of the original dataset through feature importance and correlation analysis. Then, the data is decomposed into multiple stationary subsequences and combined into a new dataset by EMD. Finally, EMD-LightGBM was fitted and trained by the new dataset to achieve the prediction of shield tunnel attitude, and the prediction performance of the model was compared with that of LightGBM alone and the EMD-BPNN. Verify the excellent performance of the EMD-LightGBM model through two evaluation systems: prediction accuracy and prediction stability. The results showed that compared with LightGBM and EMD-BPNN, EMD-LightGBM performed the best in predicting shield attitude deviation in the line graph, with a maximum mean absolute error (EMA) and root mean square error (ERMS) of 2.89 mm and 4.13 mm, respectively, and a minimum coefficient of determination R2 of 0.95. Meanwhile, the maximum 95% confidence intervals for the EMA and mean square error (EMS) of EMD-LightGBM predictions are 3.5 mm and 25.6 mm2, respectively. Combined with the good frequency distribution of its predicted absolute error (EA) and square error (ES), it demonstrates the high accuracy and stability of EMD-LightGBM in predicting shield tunnel attitudes. The research results can provide a theoretical method for the attitude control of shield tunneling in similar projects.
长春市空港区广泛分布有棕红色砾岩,砾岩层厚度大且风化后易坍塌、遇水易软化。如果在这样的地层中采用盾构法,砾岩夹层可能导致刀盘长时间原地转动,扰动周围软弱岩层并引起失稳,同时刀盘顶部地层易被掏空,形成以刀盘为中心的漏斗型塌陷区,强行掘进可能引起地面塌陷[1-2]。不稳定的工作面和复杂的操作机理大大增加了姿态控制难度[3]。目前依赖自动导向系统和驾驶员经验的姿态控制方式存在着滞后性和主观性,加大了盾构姿态的控制难度,有时甚至导致管片过大变形、错台、破裂或者漏水[4]。因此,针对强风化砾岩层,如何实时预测盾构姿态,提前调整操作参数,确保施工安全和质量,成为了亟待解决的问题。
近年来,随着现代技术与人工智能技术的普及,尝试将机器学习、深度学习等算法应用于现场施工,对盾构姿态进行预测已成为一种趋势[5-9]。国内外学者已经构建了多种盾构姿态的预测模型,文献[10]运用BP神经网络研究了掘进速度、刀盘转速等施工参数与盾构姿态偏差的影响关系。文献[11]运用了K近邻、随机森林等8个常规机器学习算法来预测盾构姿态,验证人工智能技术在盾构姿态动态预测领域的良好应用前景。然而,上述常规的机器学习算法模型的计算机理较为复杂且占用内存较大,当输入大量盾构数据后,往往很难实现更高的预测精度,因此有必要选择一种具有快速训练和低内存消耗特性的模型——LightGBM。
为了满足工程实践中对预测精度日益增长的要求,研究人员结合数据预处理技术,开发了多种组合算法,以实现精度更高的预测。文献[12]在应用XGBoost预测盾构姿态偏差之前,采用递归特征消除特征选择和随机森林对包含大量特征的数据集进行特征提取,实现特征选择与降维的作用。文献[13]在使用BiLSTM进行盾构姿态预测之前,引入了人工神经网络的注意力机制,最终组成的AM-BiLSTM可以在大量的数据信息中去除冗余数据、挑选关键信息。然而上述采用的数据预处理技术不能根据LightGBM的特性,最大化地开发出LightGBM的潜力。
国内外学者已经提出了多种盾构姿态的预测模型,但不同模型的适用条件不同。本文以长春某地铁区间盾构隧道为例,建立了EMD-LightGBM的盾构姿态预测算法。首先,选择EMD预处理技术对现场实测得到的非平稳的盾构数据集进行分解,得到一个相对平稳但维度较高的新数据集;然后,利用能处理高维数据的LightGBM对新数据集进行拟合训练与预测;最后,与单纯的LightGBM及EMD-BPNN的预测结果进行对比。本文的研究成果可为盾构施工提供一种新的、更为精确的姿态预测方法,有助于提高盾构施工的安全性和效率,具有重要的理论和实践价值。
1 工程实例
以长春市某地铁盾构段区间工程为例,该隧道长956.507 m,埋深为17.8~25.5 m,采用土压平衡盾构机,主要穿越地层为强风化砾岩层,天然抗压强度均值为0.6 MPa(为极软岩),重度平均值为21.5 kN/m3,黏聚力均值为50 kPa,内摩擦角均值为35°。隧道采用单层衬砌型式,外径为6.2 m,内径为5.5 m,管片宽度为1.5 m。该区间砾岩风化呈土状、易坍塌,具有遇水软化崩解的特性,另外在水流作用下易产生颗粒流失的风险。因此,盾构机在该区间掘进过程中需要定期监测盾构控制系统,确保盾构姿态、隧道结构与周围土层环境的安全。
参考既有文献中样本量的选取[13-14],本研究选取整个盾构段的639环数据作为样本,每环包含20项参数。其中,反映盾构机姿态的关键参数有4个,即盾首水平偏差、盾首垂直偏差、盾尾水平偏差和盾尾垂直偏差。图1展示了上述4种盾构姿态参数的示意图。这些参数表征了盾构掘进过程中的偏差情况,作为模型输出特征。在水平方向,盾构机掘进中心向右偏离设计轴线视为正偏差;在垂直方向,向上偏离设计轴线同样视作正偏差。
图1区间地质剖面及盾构机姿态偏差示意
Fig.1Schematic diagram of interval geological profile and shield machine attitude deviation
图2显示了隧道管片的拱顶与拱底的累计竖向位移。从图中可以看出,管片在稳定成型后的竖向位移都被控制在±5 mm之内。本研究工程位于东北寒区,施工期跨越冬季,通过现场实测表明:盾构掘进过程中,采用了一系列盾构姿态的控制措施以及盾构外循环自动加热保温措施之后,管片错台量处在规范允许范围内,管片没有明显裂缝;经过一个天然的冻融循环后,管片漏水情况符合设计要求。因此,通过良好的隧道成型质量,可以间接证明算法模型所学习的盾构姿态数据是具有实际意义且可靠的。
本区间内岩层随地势起伏,盾构穿越的隧道围岩性质变化不大,地层较稳定,主要以强风化砾岩为主,掘进过程中周围土体的内摩擦角、黏聚力等参数可认为基本不变,故输入变量中的地层参数仅考虑上覆土层埋深[13]。表1、表2分别展示了盾构参数输入与输出特征的统计性描述。
图2隧道管片的拱顶、拱底累积竖向位移
Fig.2The cumulative vertical displacement of the arch top and arch bottom of tunnel segments
表1输入特征的统计性描述
Tab.1Statistical description of input features
表2输出特征的统计性描述
Tab.2Statistical description of output features
2 数据预处理
2.1 特征重要性分析
本文的数据集中含有16个输入特征,但可能存在冗余特征,导致模型过拟合。通过LightGBM的特征重要性分析技术,可以识别关键特征,提升模型训练效率和可解释性,通过“gain”指标量化了特征对4种盾构姿态偏差的影响,图3展示了特征重要性的可视化结果。另外,特征重要性表征的是该输入特征在LightGBM训练中的表现。
综合分析表明:1)铰接水平偏差对盾构水平姿态的影响最大,铰接垂直偏差对盾构垂直偏差的影响最大;2)铰接水平、垂直偏差、千斤顶推力、埋深和泡沫注入量对所有盾构姿态偏差均有重要影响,应重点关注;3)管片类型(ST)影响很小,考虑从特征中移除以提升模型效率。
图3输入特征对4种盾构姿态偏差的重要程度
Fig.3The importance of input features for four types of shield tunneling attitude deviations
2.2 相关性分析
相关分析用于衡量变量间的关联程度,是评价特征质量的关键步骤,有助于快速优化模型拟合与预测,提升计算效率。通过式(1)应用皮尔逊相关系数[15],分析盾构参数与盾构姿态之间的关系,以明确各参数的影响。

(1)
式中:r为各个参数之间的相关系数,一般|r|≤1;xi、yi为两个参数第i个数据点的参数值;、为两个参数的均值;n为数据点的数量。
表3所示为各盾构参数与盾构姿态参数的相关系数。表3显示,铰接水平偏差与盾构水平偏差、铰接垂直偏差与盾构垂直偏差的皮尔逊相关系数均大于0.75,表明它们之间存在较强的线性关系。其他输入特征与盾构姿态参数的皮尔逊相关系数较低,表明需要采用非线性模型进行预测。
千斤顶推力、推进速度、刀盘扭矩和螺旋机转速是土压平衡盾构机可主动操控的盾构参数,与掘进状态紧密相关[16]。图4展示了这些盾构操作参数与盾构姿态参数的矩阵散点图,包括两两特征的散点图和皮尔逊相关系数。散点图通过回归直线体现线性关系,而皮尔逊相关系数则反映了特征间的线性相关程度。结果表明,盾构姿态偏差与上述盾构操作参数之间存在更为复杂的非线性关系。
表3盾构姿态与其他盾构参数的相关系数
Tab.3The correlation coefficient between shield tunneling attitude and other shield tunneling parameters
图4盾构操作参数与盾构姿态之间的相关性分析
Fig.4Correlation analysis between shield tunneling operation parameters and shield tunneling attitude
通过相关性和特征重要性综合分析表明:1)由于铰接油缸的开启使得铰接偏差与盾构姿态偏差之间包含了主观影响因素,不再是简单的固定几何关系,铰接水平、垂直偏差与盾构姿态线性相关较高并且对LightGBM的特征重要程度也较高,表明其对LightGBM的预测影响显著。2)掘进长度、注浆量、K块位置等特征虽与盾构姿态皮尔逊相关性不高,但特征重要性不容忽视,这支持了它们与盾构姿态存在非线性关系的假设。
2.3 缺失值与异常值处理
2.3.1 缺失值处理
在盾构掘进中,由于现场环境、数据采集的间断性、设备故障等特殊因素导致数据缺失,这些缺失数据可能包含重要信息,直接应用于人工智能算法会增加模型难度和误差[17-19]。因此,在建模前应进行缺失数据的分析与处理。本文采用K近邻算法对盾构数据的缺失值进行填补,该算法通过寻找与缺失值相近的k个样本来估计缺失值。针对本文盾构数据集缺失值填补,设置k值为“3”。
2.3.2 异常值处理
盾构掘进数据可能因监测设备、现场环境和施工人员等因素含噪声和异常值,从而影响数据的真实性[20]。根据四分位距(IQR,上四分位数Q1与下四分位数Q3之差),定义异常值的范围,通常将小于Q1-1.5IQR或大于Q3+1.5IQR的值标记为异常值[21]。箱线图可直观地展示数据的分布情况以及异常值。图5展示了在盾构参数量纲归一化后,利用箱线图进行的异常值检测情况。本文应用均值滤波法处理盾构姿态数据异常,工作原理是用异常值两侧数据均值替代异常值本身。
图5盾构参数特征的异常值检测
Fig.5Abnormal value detection of shield tunneling parameter characteristics
2.4 经验模态分解
经验模态分解法(EMD)是用于非平稳、非线性数据的自适应分解分析技术,通过数据自身的时间尺度分解得到本征模态函数(IMF),揭示原始数据不同时间尺度的波动特征[22]。
盾构参数具有的不确定性和间断性,通过EMD算法得到大量的IMF分量来解决,此过程丰富了输入特征,并在不同尺度清晰地反映了特征局部特性。具体步骤包括:1)找到原始数据序列x(t)的极大值点和极小值点,画出包络线,取均值m1(t)得到第1组IMF分量IMF1(t)=x(t)-m1(t);2)原始数据序列减去IMF1,重复步骤,直至剩余分量(Res)单调或低于阈值,得到多组IMF分量及Res分量 。
本文利用EMD算法分解盾构数据,提取得到86个IMF和14个Res分量,保持数据集信息完整的同时还突出了局部特性。
3 模型建立
3.1 模型框架
图6展示了从数据预处理到模型建立、预测结果评估的全过程。其中数据集的14个数值特征经过EMD分解为86个IMF分量、14个Res分量,即转化为100个新特征,增强了数据表达力,但也增加了数据集维度。“K块位置”作为类型特征不需要分解。
图6EMD-LightGBM建立流程示意
Fig.6Schematic diagram of the EMD-LightGBM establishment process
最终EMD分解后的数据集包含101列输入特征、4列输出特征,共639环样本。划分前80%(511环)为训练集,后20%(128环)为测试集。训练集用于训练EMD-LightGBM,结合5折交叉验证避免过拟合;测试集用于算法预测不参与训练(假设为实际工程中前方即将掘进的地层数据),将盾构姿态偏差预测值与实际值进行对比分析的同时,也测试了EMD-LightGBM在该工况下的性能。
LightGBM是基于梯度提升决策树的高效算法,具有快速训练和低内存消耗的优势,支持并行处理海量数据。它通过将连续数据离散化为直方图来加速训练和提高准确性,并采用增益法提取特征[23]。LightGBM目标函数可表示为
(2)
式中:O(t)为目标函数值,yi为观测值,为模型第t次预测值,n为样本数,Ω为模型正则项。
EMD-LightGBM特别适用于复杂数据特征处理、多目标优化以及大数据分析。其局限性包括模型解释性较差以及对输入数据质量要求较高。为应对这些局限性,本文在建立算法前作了特征重要性与相关性分析,以及进行了充分的数据清洗和预处理。
3.2 模型调参
在使用LightGBM对盾构姿态进行预测前,需设定好超参数。本文采用网格搜索结合交叉验证进行调参,通过在一定的参数范围内逐步调整以寻找验证集上精度最佳的参数组合。
模型超参数遍历设置如下:1)学习率lr影响模型迭代的步长,如果设置过大,模型可能会在最优解附近震荡,难以收敛;而如果设置过小,则训练过程可能会变得非常缓慢;2)迭代次数ne与lr成反比,根据lr的大小进行调整。为了提高效率,本文将lr手动设定为0.1,仅对ne进行调整,其遍历值设定为[0,500]。同时,为了防止过拟合,本文设定了早停条件est为50,即如果连续50次迭代结果没有变化,将提前终止迭代过程;3)叶节点数nl遍历值设为[0,20],nl在一定的范围内增加可以提高模型的精确度,但同时也可能增加过拟合的风险;4)最大深度md遍历值设为[3,12],限制树模型的最大深度,防止过拟合。对4个盾构姿态目标进行网格搜索,表4列出了LightGBM的最优超参数。
表4LightGBM最优超参数结果
Tab.4LightGBM optimal hyperparameter results
4 结果分析
在盾构姿态预测结果分析中,常用平均绝对误差EMA、均方根误差ERMS和决定系数R2值作为评估指标。假设yi为盾构姿态实际值,为盾构姿态预测值,表示实际值的均值,n为样本数量。以下分别为3种评估指标的计算公式:
(3)
(4)

(5)
4.1 预测精度评估
图7展示了EMD-LightGBM预测盾构姿态的散点图,预测值与实际值吻合良好,预测散点均集中在对角线上。虽然预测盾构垂直偏差的EMA、ERMS相比水平偏差更高,但盾构垂直偏差的R2值更加接近于“1”,且散点更集中。这是由于盾构垂直偏差实际值分布范围(±100 mm)较水平偏差(±50 mm)广,预测值的相对误差较小。
为证实EMD-LightGBM在盾构姿态预测的有效性以及EMD对数据预处理的重要性,对比了LightGBM和EMD-BPNN。图8中EMD-LightGBM折线并没有如LightGBM折线与EMD-BPNN折线一样大幅度偏离盾构姿态实际值折线以及频繁凸出尖点,验证了EMD去除噪声、提升预测精度的作用。同时因EMD大幅度增加了数据维度,LightGBM拟合预测效果好于BPNN,从而凸显了LightGBM处理高维数据的强大性能。图8(a)局部放大图显示EMD-LightGBM预测值最贴合实际值,特别是对突变值的预测表现最好。
表5为3种模型对盾构姿态预测的评估指标结果,其中EMD-LightGBM对4种盾构姿态参数的评估结果最好,预测精度得到了提升。对比LightGBM,EMD-LightGBM预测盾首垂直偏差的ERMS降低了73.66%,预测盾首水平偏差的EMA降低了66.91%,预测盾首水平偏差的R2提升了43.94%,这证明了选择EMD分解原始数据的必要性。对比EMD-BPNN,EMD-LightGBM预测盾尾水平偏差的ERMS降低了70.43%,预测盾首、盾尾水平偏差的EMA均降低了73.79%,预测盾首水平偏差的R2提升了86.27%,这证明了选择LightGBM模型的可行性。
图7EMD-LightGBM预测盾构姿态的散点分布
Fig.7Scatter distribution of EMD-LightGBM for predicting shield tunneling attitude
图83种模型对盾构姿态偏差的预测对比
Fig.8Comparison of three models for predicting shield tunnel attitude deviation
表53种模型对盾构姿态预测的评估结果
Tab.5Evaluation results of three models for predicting shield tunneling attitude
图9通过多因子柱状图直观展示了EMD-LightGBM在各盾构姿态偏差预测中的EMA和ERMS值明显低于其他模型,同时R2值显著高于其他模型。
图93种模型评估结果的多因子对比分析
Fig.9Multi factor comparative analysis of evaluation results of three models
4.2 预测稳定性评估
4.1节通过ERMS、EMA与R2评估了模型预测精度,这些评估指标结果也带有误差。对于预测值的准确程度是无法确定的,即无法确定具体的误差范围,为了解决这一问题,需要运用到区间估计。置信区间是统计学中一种区间估计的方法,用[a,b]表示样本估计总体平均误差范围。
EMS和EMA是盾构姿态偏差实际值与预测值的平方误差ES和绝对值误差EA的平均值。表6列出了EMD-LightGBM预测盾构姿态的EMS、EMA的95%置信区间。观察EMD-LightGBM预测盾首水平、盾尾水平、盾首垂直以及盾尾垂直偏差的EMA的95%置信区间,表征该EMA值的可信波动范围均控制在4 mm内。结合盾构水平和垂直姿态偏差的分布分别为±50 mm和±100 mm,该置信区间有效地验证了EMD-LightGBM的预测稳定性。
表6EMD-LightGBM预测盾构姿态的EMS、EMA的95%置信区间
Tab.695% confidence interval of EMS and EMA for predicting shield tunneling attitude using EMD-LightGBM
本文不仅使用ERMS、EMA、R2 3种评估指标以及EMS、EMA的置信区间来评估盾构姿态预测结果的均值,而且进一步对预测结果的整体分布进行分析。用偏度衡量数据分布的偏斜程度,用峰度衡量分布的尖锐程度。本文对盾构姿态的预测误差理想分布标准:1)峰值横坐标接近“0”;2)峰度大(分布细长);3)偏度小(分布对称)。该理想分布表征盾构姿态预测误差整体上接近“0”且异常值少,分布集中且对称。
图10和图11展示了EMD-LightGBM在预测盾构姿态时的EA、ES频数分布。从图中可以看出,EMD-LightGBM的预测误差整体分布在“0”的周围,这意味着模型预测的整体误差都很小且集中,显示出很高的预测精度。在盾构水平姿态预测中,盾首、盾尾水平姿态偏差的EA、ES分布都是细长且对称的,这进一步证明了EMD-LightGBM在预测盾构水平姿态方面的稳定性。
在盾构垂直姿态预测中,模型预测误差的分布范围是关键。EMD-LightGBM预测盾尾垂直偏差的EA分布在0~20 mm之间,采用每2 mm进行频数统计;而EMD-BPNN预测的EA范围是0~120 mm,以每20 mm进行频数统计,更宽的频数统计区间就意味着每个统计区间内可包含更多的样本数据。平方误差ES会放大接近“0”与远离“0”的误差值,即预测误差较小和较大值将会更加集中,从而增加两者的频数,从而缓解因分布范围不一致而不具有对比性的问题。从图11(c)、11(d)可见,EMD-LightGBM表现良好,较高的峰度与较低的偏度表明了EMD-LightGBM对盾构垂直偏差预测的ES分布主要集中在“0”的附近,并且仅存在极少的较大误差值。
图10预测盾构姿态的EA频数分布
Fig.10EA frequency distribution for predicting shield tunneling attitude
图11预测盾构姿态的ES频数分布
Fig.11ES frequency distribution for predicting shield tunneling attitude
5 结论
强风化砾岩层的盾构姿态数据波动性和随机性强,而且输入特征与输出特征存在复杂的非线性关系。为此提出了一种EMD-LightGBM组合算法对盾构姿态进行预测,得出如下结论:
1)通过实例对比了EMD-LightGBM与单纯的LightGBM在预测盾构姿态偏差方面的表现,EMD-LightGBM预测的ERMS和EMA分别降低了53%、56%以上,表明EMD能有效提高模型的预测能力。
2)将EMD-LightGBM与EMD-BPNN进行对比。分析结果表明,EMD-LightGBM展现出了更高的预测精度,其ERMS和EMA分别降低了58%、54%以上。这验证了EMD-LightGBM在处理复杂的高维数据时的可行性。
3)在预测盾构姿态稳定性方面,EMD-LightGBM预测的EMA、EMS的95%置信区间相对较小,最大分别为3.5 mm、25.6 mm2。结合良好的偏度和峰度值,进一步分析预测误差的频数分布,可以得出预测误差主要集中在“0”的附近。这表明EMD-LightGBM在预测盾构姿态时具有较高的稳定性。
4)EMD能够有效处理非线性和非平稳信号,将复杂的时间序列数据分解为一系列IMF分量,从而简化了数据结构并解析出了有用的信息。LightGBM是一种高效的梯度提升决策树算法,适用于处理大规模数据并能快速学习数据特征。将两者融合,可以充分利用各自的优势,提高对盾构姿态的预测精度。通过这种组合预测模型,大大提高了预测盾构姿态偏差的预测精度和稳定性,为工程实践提供有力的决策支持。

