摘要
为提升智能压实(intelligent compaction,IC)质量的实时检测与评价精度,提出一种基于GA-XGBoost模型的连续压实质量预测方法,以提高动态变形模量(Evd)的预测精度。模型以动态变形模量为目标,建立机器学习模型,主要采用决策树算法,构建XGBoost模型对压实质量进行预测分析。通过引入遗传算法(genetic algorithm,GA)对模型超参数寻优,以提高模型的预测精度和可靠性。首先,通过现场工程试验,测量压路机碾压时振动加速度,分析加速度信号,计算信号统计量并采用快速傅里叶变换(FFT)得出谐波频率,初步建立各项特征因子与Evd之间的系统联系;其次,筛选各个时频域特征,进行相关性分析,选用相关性较高的特征来建立预测模型;最后,验证了GA-XGBoost预测模型可以较好的预测Evd。研究结果表明:遗传算法(GA)可以高效地确定XGBoost算法的超参数,且较单一的XGBoost模型表现出更优的收敛速度;通过优化特征因子,改变输入参数,提高了GA-XGBoost模型的预测精度,优化后均方误差为3.9%,相关系数为0.748;同时对比了传统CMV拟合Evd的方法,该机器学习模型可以大幅度提高预测精度。
Abstract
In order to improve the real-time detection and evaluation accuracy of intelligent compaction (IC) quality, a continuous compaction quality prediction method based on GA-XGBoost model was proposed to improve the prediction accuracy of dynamic deformation modulus (Evd). The model takes the dynamic deformation modulus as the goal, establishes a machine learning model, mainly uses the decision tree algorithm, and constructs the XGBoost model to predict and analyze the compaction quality. In order to improve the prediction accuracy and reliability of the model, genetic algorithm (GA) is introduced to optimize the hyperparameters of the model. Firstly, through the field engineering test, the vibration acceleration of the roller is measured, the acceleration signal is analyzed, the signal statistics are calculated and the harmonic frequency is obtained by fast Fourier transform (FFT), and the system connection between the characteristic factors and Evd is preliminarily established. Secondly, the characteristics of each time-frequency domain are screened, the correlation analysis is carried out, and the characteristics with high correlation are selected to establish the prediction model. Finally, it is verified that the GA-XGBoost prediction model can better predict Evd.The results show that the genetic algorithm (GA) can efficiently determine the hyperparameters of the XGBoost algorithm, and it shows better convergence speed than the single XGBoost model. By optimizing the feature factors and changing the input parameters, the prediction accuracy of the GA-XGBoost model is improved. The optimized mean square error is 3.9% and the correlation coefficient is 0.748. At the same time, compared with the traditional CMV fitting Evd method, the machine learning model can greatly improve the prediction accuracy.
智能压实(IC)技术是人工智能技术应用于路基压实质量控制的成功典范,它提供了一种实时检测路基压实过程的方法。IC主要通过GPS定位技术,振动信息反馈以及信息化处理等手段对路基压实质量进行检测,已广泛应用于机场、铁路、公路、大坝等建设中。但现在智能压实测试精度问题依然是大家关注的热点,因此,探索提升压实质量预测精度方法对IC技术推广具有重要意义。
压实测试精度问题研究主要分为两个方面。一方面,在传统压实检测方法[1]的基础上提出新的检测思路。聂志红等[2]通过现场试验基于双曲面响应法,研究了压路机振动频率、振动幅度、行驶速度等因素对检测数据的影响显著性。张德等[3]通过工程现场试验分析不同压实情况及碾压参数对智能压实质量的影响。吴龙梁等[4]提出以压实合格率为指标建立多元线性回归模型和质量控制模型,采用简单克里金算法,分析了两种模型可以有效预测智能压实的压实情况。冯振刚等[5]基于多元回归模型可以有效预测沥青路面的压实情况。马源等[6]基于有限元仿真软件对影响CMV的一系列碾压参数进行了正交试验,对CMV变化规律定性分析,并从计算角度剖析其变化机理。蔡德钩等[7]基于现场试验从时域、频域、能量以及时频域的角度分析智能压实振动过程中谐波的变化情况。目前,大多数学者已经从多种渠道构建了路基压实度与智能压实测试值之间的关系,但是这些方法大都基于动力学模型基础上,由于现场作业时偶然性较大以及各种因素如填料含水率、压路机碾压参数等的共同影响,上述方法难以同时考虑各种因素的影响以及保证检测参数的稳定和量测结果的精度,具有一定的局限性。
另一方面,在人工智能技术的基础上探究新的检测方法。部分学者发现机器学习方法对于处理复杂多变的情况具有一定优势,因此,该方法在行业内迅速发展。其与工程实例已结合的越来越紧密。其中,李凌志等[8]采用自主采样的机器学习方法,引入K均值聚类算法对高速公路的裂缝进行预测。而在智能压实领域,通过建立机器学习模型,将碾压参数如振动速度、加速度、激振力、频率等引入其中,对现场作业时压实度进行预测。Wang等[9-12]基于人工神经网络模型,通过改变不同参数如土壤特性、激振力、振动频率等去预测压实度,并通过现场试验验证预测精度。Cao等[13]根据压路机的碾压参数基于人工神经网络模型对CMV进行预测,验证了神经网络模型预测CMV的可行性和潜力。安再展等[14]基于现场试验和建立径向基神经网络模型,预测分析了碾压参数实时变化时的CMV,经过与试验结果对比,验证了该神经网络模型的精度。陈晓斌等[15]提出一种基于振动能量最小原则的优化方法改进神经网络模型并采用遗传算法寻出最佳参数,对优化高铁路基碾压技术参数具有较好的改进。黄国卿等[16]基于BP神经网络模型,通过CMV、CCV、THD 3种指标作为输出参数预测土体压实度,相较于传统方法大幅度提升了连续压实均匀性表征能力和压实度的预测精度。宿辉等[17]基于GA-PSO混合优化BP神经网络模型预测堆石坝压实质量,经过对比分析该优化方式具有更好的性能,精度相对更高。但也可以看出尽管机器学习方法具有较好的效果,单一神经网络方法必然影响其普适性,且神经网络的隐藏层数量均由经验值取得,无法适应复杂的施工工况,需要耗费大量时间去提高精度。
近年来,部分研究者发现决策树算法对处理这类回归预测问题具有较好的能力,该算法具有可视化分析过程,相比于神经网络算法的“黑箱模型”具有更好的调控能力,另外其对于处理具有缺失值数据的样本也有更好的表现。根据文献[12]提出的XGBoost算法,主要将大量决策树组合,即使用一系列弱分类器形成强分类器,该算法保留上述决策树算法的优点,且弥补单一的决策树存在的不足。同时,为降低该算法过拟合的风险,决定采用遗传函数(GA),该方法是一种高效的全局搜索优化算法,可自适应搜索并寻找全局最优解,不会陷入局部最优,用该方法确定XGBoost算法的超参数并且对决策树进行有效剪枝以及加入正则化过程可以有效降低过拟合的风险,提高对Evd的预测精度。
本文采用大量智能压实试验数据,基于决策树算法建立的XGBoost预测模型,并引入GA确定XGBoost模型超参数。该模型将加速度信号特征与CMV及Evd统一结合,以Evd为目标,对智能压实质量进行预测分析,得到一种有效的压实质量预测模型,并与传统压实质量分析方法对比,验证了该模型具有高效、准确的优点,具有一定的可行性以及实用性。
1 试验
1.1 工程背景与设备
现场试验在秦唐高速工程秦皇岛段开展,碾压设备采用徐工-XS263H型振动压路机。其中,工作质量为30 t;振动钢轮质量为13 t;振动轮宽度为2 170 mm;振动轮直径为1 600 mm;振动频率为27 Hz或32 Hz;激振力为209 kN或405 kN。路基填料为含粗粒的粉质土,液限为24.6%,塑限为16.5%,最优含水率为14.2%,最大干密度为1.94 g/cm3,比重为2.63,筑填厚度为30 cm。Evd采用轻型落锤仪进行检测,并通过RTK测量仪记录其测点坐标。具体试验现场如图1所示。
图1试验现场
Fig.1Test field
本次试验共采用4个加速度传感器,采用AB胶黏结固定在振动轮轴心及车架上,双侧安装,安装示意图见图2。传感器型号为美国PCB高灵敏度365A16 triaxial ICP 三向加速度传感器,其参数为:灵敏度25 mV/g;最大量程为200 m/s2;设置加速度采样频率为1 024 Hz。
本次试验所采用的常规检测指标Evd,是由德国进口HMP型动态变形模量测试仪测得,如图3所示,落锤式弯沉测试仪主要由落锤、承载板、测振传感器及沉陷测定仪组成,承载板直径为300 mm,厚度为2 cm,有效测试深度为40~50 cm,Evd测试量程为0~225 MPa,沉降测试量程为0.1~2.0 mm,适用温度为0~40℃,该测试仪操作方法简单,检测时间较快,测试前进行3次预冲击,随后进行3次正式冲击测试,通过承载板内部压力和位移传感器的数值,读数仪自动显示Evd数值。
图2加速度传感器安装示意图(单侧)
Fig.2Acceleration sensor installation diagram (half)
图3动态变形模量测试仪
Fig.3Dynamic deformation modulus tester
试验测点布置见图4。设置尺寸为2 m×20 m的碾压带,间隔2 m布置一个Evd测点,振动轮左右两侧布置,共8组;间隔5 m布置一个灌砂法测点,共3组。
图4测点布置
Fig.4Measuring point arrangement
1.2 试验方案
试验场地为20 m×20 m的矩形场地,压实条带为2 m×20 m,共设置6条碾压条带。试验振动压实6遍,分别是3遍弱振,3遍强振。具体碾压方案如表1所示。每遍振动压实后,采用灌砂法对路基进行压实度检测;预先在碾压条带标定位置,采用轻型落锤仪进行检测,并记录加速度信号与压实度。
表1试验方案
Tab.1Test scheme
1.3 压实度检测分析
根据室外智能压实试验方案,在每次碾压之后,根据条带预先布置的灌砂点位进行挖坑灌砂测试路基压实度,每条条带共3个测试点位,依次按照1、2、3顺序采样,将3次采样结果取平均值得到本次碾压后该条带的压实度值。压实度计算公式为
(1)
式中:K为碾压材料的压实度;ρc为碾压材料的最大干密度;ρd为试坑材料的干密度,,其中,mb为填满试坑所需标准砂的质量,md为试坑中取出材料的烘干质量,ρs为标准砂的密度,ρs=1.529 g/cm3。压实度与碾压遍数关系曲线如图5所示。
图5压实度与振压遍数关系
Fig.5The relationship diagram between compaction degree and vibration pressure times
由图5分析可得,经过6遍振动压实后,试验场地土体压实度逐渐增长且压实效果较好,压实度在9%~95%之间,达到路基压实要求。
1.4 Evd与压实度相关性分析
为了验证Evd和压实度关系,本小节以压实度与Evd的相关性研究出发,分析灌砂法所测得土体压实度和Evd相关性,具体拟合曲线如图6所示。
图6压实度-Evd相关性
Fig.6Correlation of between compaction and Evd
由图6可以发现,Evd和压实度存在较好的相关性,1~5条带其R2值都在0.83~0.98之间,表明常规压实指标Evd可以替代压实度作为评判路基压实标准。第6条带压实度和Evd相关性相较于其他条带,略微较弱,但R2也接近0.80,根据现行规范,该情况属于合理范畴。
2 GA-XGBoost模型
2.1 XGBoost算法原理介绍
XGBoost算法是机器学习方法的一种,其本质为大量决策树组合而成,通过模型内嵌的函数计算方式,对数据进行特征提取,通过大量数据学习特征并建立损失函数,建立预测模型,直接进行输入、输出数据之间关联性的研究,对非线性的情况具有较高的预测精度。XGBoost可以说是GBDT(gradient boosting decision tree)梯度提升树的一个改进版本。在文献[12]中,其算法原理如图7所示。
XGBoost使用了一系列弱分类器(决策树)来构建一个强分类器。假设存在N个样本,每个样本包含M个特征,则XGBoost的目标函数可以表示为
(2)
式中:为损失函数,表示模型预测值和实测值yi之间的差异; Ω(fk)为正则化项,用于控制模型的复杂度。
模型的预测值计算公式为
(3)
式中fk(xi)表示第k个决策树对于样本xi的输出。
图7XGBoost原理图
Fig.7XGBoost schematic diagram
2.2 遗传算法(GA)
遗传算法是受自然进化理论启发的通过模仿自然选择和繁殖过程的搜索算法,主要分为选择、交叉、变异3个过程。在遗传算法中,每个个体都由代表基因集合的染色体构成,算法保留了大量的独立个体,组成种群,即形成了针对给定问题的候选解集,通过算法迭代,利用适应度函数对个体进行评估,计算出适应度值,并以适应度高低形成对应概率,类似于轮盘赌,通过不同概率进行选择并将其遗传物质遗传给下一代。为了创建新的个体,将父本和母本部分基因交叉,传给子一代;在遗传过程可能产生基因突变,这就形成变异,其形式是通过随机改变一个或多个基因型来实现。最后不断迭代,形成大量新个体,直到满足算法的终止条件。遗传算法(GA)具有智能式搜索、渐进式优化、全局最优解、通用性强、并行式运算等优点。基于此,选用遗传算法对XGBoost模型进行优化处理。基于遗传算法优化XGBoost模型主要流程如图8所示。
图8GA优化XGBoost模型流程
Fig.8The flow of XGBoost model optimized by GA
2.3 数据预处理
2.3.1 数据记录
在本研究中,基于高速公路压实工程的现场试验数据以及跟随压路机记录数据参数的统计,建立GA-XGBoost预测模型。影响路基压实的因素众多,压路机控制参数如碾压速度、碾压遍数、激振力等;土体的工程特性如颗粒级配、粒径、最大干密度、含水率等。以上因素对压实度的影响重要度不同,本文选用振动轮加速度信号预测压实度,加速度信号采集分为振动轮左右两侧和车架左右两侧,本次试验主要采用振动轮左右两侧Y轴方向上采集的加速度信号。研究人员记录每秒的加速度信号和该点对应的Evd,在大量加速度信号中,选取每秒1 024个加速度值以及对应的Evd(图9)。总共统计318组数据,且每组加速度信号都对应到该点位的Evd值。
2.3.2 信号处理
目前大多数研究人员对加速度信号特征分析多采用谐波法,因此,对于现场试验采集的加速度信号,利用MATLAB软件自编程序分析,编程主要代码功能为加速度信号部分统计量计算及快速傅里叶变换(FFT)下的时频域转换。其主要原理为
(4)
式中N表示时间序列。
图9某一秒截取的加速度信号
Fig.9Acceleration signal intercepted in a second
统计量作为加速度信号的时域特征,各个计算方法见表2,同时计算其谐波的总谐波失真(THD)、信噪比(SNR)、信号噪声和失真比(SINAD);FFT 其基本思想为将离散复杂的时域信号转化成频域信号,即加速度信号从随时间分布转化为随频率分布,纵轴对应为某一种频率下加速度幅值大小。压路机振动轮的加速度采集频率为1 024 Hz。MATLAB程序主要分为4个模块:加速度信号读取、统计量的计算、快速傅里叶变换与显示、导出数据。
表2各时域特征计算公式
Tab.2Calculation formula of each time domain feature
注:si为信号的采样数据点幅值,N为采样点样本个数,为数据点平均值,ρt为偏度,Smax为最大值,Smin为最小值。
2.4 GA-XGBoost预测模型的建立
XGBoost预测模型算法由Scikit-learn机器学习包实现,训练集和测试集比例为8∶2,并建立特征工程。建立搜索函数,引入GA,构建适应度函数,在经过选择、交叉、变异的不断循环后,得到最优参数值,让模型达到最优效果。其中,模型参数对预测结果有较大的影响,因此,在GA优化后,同时加入采用严谨的交叉验证,并利用网格调参,最优参数如表3所示。
表3XGBoost模型最优参数
Tab.3Optimal parameters of XGBoost model
对预测模型的泛化能力进行评估,不仅需要严谨可靠的试验方法,还需要具有衡量泛化能力标准的评估指标。为量化评价模型预测结果的准确性,采用相关系数(R2)、均方误差(MSE)、平均绝对误差(MAPE)以及可解释方差4种指标共同描述XGBoost模型的预测结果。其评估指标数学上的计算方法如下:
(5)
(6)
(7)
(8)
式中:MSE表示均方误差,MAPE表示平均绝对误差,R2表示相关系数,yi为样本实测值,为样本预测值,为样本实测值均值,n表示样本的数量,Var(·)表示方差计算。
3 数据分析与讨论
3.1 Evd统计分析
GA-XGBoost预测模型采用上述19个特征因子作为输入特征预测Evd值。根据结果分析,图10可以看出Evd大致呈正态分布,Evd在10~25 MPa之间的占比多,在30~45 MPa之间的占比少;同样,图11箱型图全面综合地反映一组数据的集中趋势、离散程度、分布形状。箱内数据占总体数据50%,其中,下限为7.37 MPa,上限为38.4 MPa;下四分位数Q1为13.77 MPa,上四分位数Q3为23.65 MPa,四分位数的差Q3-Q1为9.88 MPa,此时箱子比较短,可见数据比较集中;中位数Q2为18.91 MPa,平均水平比较低,同时,中位数在箱子的正中间,数据呈正态分布;整体均值高于中位数19.75 MPa;存在5个异常值。
图10Evd分布直方图
Fig.10Evd value distribution histogram
图11Evd数值分布情况箱形图
Fig.11Box plot of Evd numerical distribution
3.2 相关性及重要性分析
由图12分析可得,在19个特征因子中,THD、均方根、峭度、偏度与Evd的相关性最高,其他特征因子的相关性较差。图13是测试集中各个特征因子对Evd的重要性程度分析,波形因子和脉冲因子这两种时域特征对Evd的重要性最高,直接表明路基压实质量软硬情况可以直接反应到加速度的波形振幅。
3.3 初预测结果
图14是采用XGBoost预测模型对Evd的预测结果,明显看出预测结果是非常接近真值的,两条曲线部分波动极为接近,但是也存在部分结果完全偏离真值,这种情况可能是因为此处某点的Evd存在异常。其中,各评估指标可解释方差为0.434,MAPE为0.303,MSE为0.116,R2为0.467。总体来说,预测值具有部分的可靠性。同时,XGBoost预测模型学习特征需要进一步优化,使其达到更理想的效果。
图12特征因子与Evd相关性热力矩阵图
Fig.12Thermal matrix diagram of correlation between each factor and Evd
图13各特征因子重要性直方图
Fig.13Histogram of importance of each feature factor
图14Evd实测值和预测值对比
Fig.14Comparison of measured and predicted values of Evd
3.4 GA-XGBoost模型数据优化结果
在加速度信号中分析得出的19个特征因子对Evd的预测有一定的可行性,但此时特征因子较多且存在多重共线性,对Evd的预测效果不甚理想。因此,选择对上述模型数据进行筛选优化。
首先,从Evd数值分布箱形图中发现,原始数据中存在数个异常值,出现偏离上极值线的情况,但由于异常值较少,并不影响数据的整体性,故选择删去;其次,从图12中发现,部分特征因子存在多重共线性,该情况会导致模型的泛化能力减弱。因此,需进一步对特征因子进行降维。根据Pearson相关系数理论,相关系数大于0.8为高度线性相关,本文选择对两两相关系数大于0.8的特征进行过滤,同时保留的特征因子需具有代表性且与Evd的相关系数较高;结合图13重要性直方图,保留过滤后重要性程度不小于0.4的特征因子,综合考虑筛选结果是峭度、偏度、均方根、波形因子、脉冲因子、THD、峰峰值7种特征因子,该组合下,特征因子对Evd的相关性和重要性皆较高且两两之间影响较小。
同时,考虑压路机的振动频率会对压实质量产生较大的影响,所以本次优化加入频率作为训练模型的特征因子,引入0.5倍频至3倍频共6种频率特征;最后,行业内各学者[13-18]已验证压实度测量值CMV也对Evd有较强的相关性,因此,加入CMV作为训练预测模型的特征因子。优化结果见图15。此时,4种评估指标可解释方差为0.732,MAPE为0.162,MSE为0.039,R2为0.748。相较于之前,数据优化后有较明显的提高,相关性增强,说明这种特征因子组合下的Evd数据预测具有可行性,但仍需要继续考虑是否存在其他特征情况产生更好的预测效果。图16和图17是分别以传统方法CMV与Evd线性拟合曲线以及GA-XBGoost模型拟合出的曲线,由此可见,该预测模型相较于传统方法精确度具有一定的提高。
图15优化后实测值与预测值对比
Fig.15The comparison between the measured value and the predicted value after optimization
图16传统CMV拟合结果
Fig.16Traditional CMV fitting results
图17优化后GA-XGBoost模型拟合结果
Fig.17Fitting results of GA-XGBoost model after optimization
4 结论
本文通过现场压实试验研究,基于GA-XGBoost预测模型,分析了智能压实试验中不同的碾压参数对路基压实质量的影响,并优化了模型中各特征因子对Evd的预测精度。得到的主要结论如下:
1)由加速度信号分析得出的时域特征对智能压实指标Evd的预测具有一定的可靠性,但需要进一步分析选取相关性较高的特征因子。
2)采用遗传优化算法可以对XGBoost模型的超参数寻优,且寻优效果较好。GA-XGBoost在测试集上的准确率较高,具有较优异的泛化能力。相较于传统方法基于倍频等单一指标,仅用CMV拟合Evd,客观性较差,影响了精度,本研究中基于GA-XBGoost预测模型采用多种特征因子分析压实度具有一定的可行性,可以提高模型的预测精度和可靠性。
3)验证了CMV和频率的加入对Evd的预测精度的影响,一定程度上提高了GA-XGBoost预测模型的精度。同时,模型结果表明,Evd数据值越集中,GA-XGBoost预测模型的学习特征能力越明显,效果越好,预测的精度越高。
4)实际工程试验验证了GA-XGBoost预测模型具有一定的可行性,相较于传统方法对历史数据的学习和继承性较差,机器学习这方面有优势。在智能压实工程控制中,通过采集振动信号可以较快速反映路基压实质量,相较于传统压实后点式抽样检测路基压实质量,机器学习方法更加便捷,高效。

