摘要
道路病害目标普遍具有形态不规则、细节微弱、小目标密集和尺度跨度大的特征,传统检测头在空间建模、尺度感知与语义共享方面存在不足,难以兼顾检测精度与计算效率。为此,以YOLOv11为基础,提出3种轻量化检测头结构优化方案,构建了兼顾高效性与适应性的道路病害智能检测框架。其中,DyHead模块通过引入多维注意力机制实现动态特征建模,显著提升了尺度与空间感知能力;LSCD结构采用轻量共享卷积设计,在保持特征表达能力的同时实现参数量减少30%、FLOPs降低22%,有效改善模型的部署性能;GLSA模块融合全局-局部空间注意力机制,提升了模型对复杂结构特征的判别能力与多尺度适应性。研究结果表明:3种改进模型在精度与效率上均取得显著优化,其中DyHead在mAP@0.5上提升至64.95%,LSCD在资源受限条件下表现最优,GLSA在综合性能方面最为均衡。研究成果为道路病害检测模型的轻量化设计与嵌入式部署提供了新思路,对智慧交通基础设施的智能运维具有重要的工程应用价值。
Abstract
Pavement distresses are typically characterized by irregular morphology, weak texture features, dense small targets, and large-scale variations. Traditional detection heads suffer from limited spatial modeling, poor scale perception, and insufficient semantic sharing, making it difficult to balance detection accuracy and computational efficiency. To address these issues, this study proposed three lightweight detection head optimization schemes based on the YOLOv11 framework, establishing an intelligent and efficient detection architecture for pavement distresses. Specifically, the DyHead module introduces a multi-dimensional attention mechanism to achieve dynamic feature modeling, significantly enhancing scale and spatial perception; the LSCD structure adopts a lightweight shared convolution design, reducing the number of parameters by 30% and FLOPs by 22% while maintaining feature representation capacity, thereby improving deployment efficiency; and the GLSA module integrates a global-local spatial attention mechanism to strengthen feature discrimination and multi-scale adaptability under complex road conditions. Experimental results demonstrate that all three improved models achieve notable gains in both accuracy and efficiency: DyHead achieves an mAP@0.5 of 64.95%, LSCD performs best under resource-constrained conditions, and GLSA exhibits the most balanced overall performance. The proposed methods provide new insights for lightweight model design and embedded deployment of pavement distress detection, offering valuable technical support for the intelligent maintenance of smart transportation infrastructure.
道路病害检测是道路工程与交通基础设施管理领域的重要环节,其准确性与效率直接关系到道路养护的科学性和资源利用的合理性[1]。随着交通强国与智慧交通建设的推进[2-3],道路基础设施的健康监测和智能养护需求不断增长,对道路病害的快速、精准检测提出了更高要求[4-5]。道路表层的病害类型主要包括裂缝、龟裂、坑槽、剥落、车辙等,这些病害不仅影响道路的使用舒适度和行车安全,还会加速结构层次的进一步损坏,缩短道路服役寿命[6-7]。因此,研发高效、准确、轻量化的病害检测方法[8-9],对于提升道路养护水平、降低养护成本、保障交通安全具有重要意义。
在道路病害检测任务中,目标具有若干显著特征:其一,病害形态多为不规则,边缘模糊且变化复杂,不同类型病害之间的几何特征差异较大[10];其二,部分病害细节差异微弱,如微小裂缝、低对比度的龟裂等,常难以与周围背景区分;其三,道路表面病害常以小目标形式密集分布,不同尺度病害在同一图像中同时存在;其四,采集环境复杂,包括光照变化、交通遮挡、雨雪干扰及路面材质差异,均会增加病害检测的难度[11-12]。这些复杂性使得道路病害检测任务远比一般目标检测更具挑战性。
传统的道路病害检测多依赖人工巡检与半自动化图像分析方法。人工巡检虽然直观,但存在效率低、主观性强、精度不稳定等问题,难以适应大规模道路网的快速检测需求[13]。早期基于传统计算机视觉的方法,主要利用边缘检测、纹理分析、阈值分割等技术对病害进行识别[14-16];然而此类方法往往依赖人工设计特征,对光照、噪声及路面材质的敏感性强,泛化能力不足。随着深度学习技术的快速发展,卷积神经网络(CNN)在图像识别与目标检测领域取得突破,逐渐成为道路病害检测的核心技术路径[17-18]。
近年来,以YOLO、Faster R-CNN、RetinaNet等为代表的目标检测框架被广泛应用于道路病害检测任务。其中,YOLO(you only look once)系列因其端到端、实时性强的特点,受到学术界与工程界的广泛关注[8,19]。YOLO架构在大规模物体检测中表现出色,但在处理道路病害这一类“微小、低对比度、不规则”的目标时,仍存在显著局限性。具体而言,传统YOLO检测头在空间与尺度建模能力不足,难以捕捉微小病害的细节特征;同时,语义特征在多层次之间的共享与交互有限,导致在复杂背景下容易发生微小裂缝的漏检或误检。如何在保证检测精度的同时,提升模型在小目标检测与复杂环境适应上的性能,成为亟需解决的问题。
针对上述挑战,近年来研究者在模型结构优化与轻量化设计方面开展了大量探索[8]。一方面,在结构优化方面,学界尝试引入特征金字塔网络(FPN)、注意力机制、多尺度卷积等方法,以增强模型的特征表达能力[20-21]。例如,SE(squeeze-and-excitation)、CBAM(convolutional block attention module)等注意力模块被广泛用于提升通道与空间的权重分配能力,从而增强小目标的表征。另一方面,在轻量化设计方面,随着道路病害检测逐渐向车载终端、无人机平台和边缘计算设备部署,对模型计算复杂度与存储需求的约束越来越突出[22-23]。因此,如何在保证检测精度的同时,兼顾计算效率与设备适应性,成为新一代道路病害检测模型研究的重要方向。
综上所述,本研究旨在针对道路病害检测中存在的小目标密集、尺度跨度大、背景复杂及轻量化需求等问题,基于YOLOv11架构提出并验证3种轻量化检测头结构,系统评估其在检测精度、计算效率与应用适应性上的表现。研究的最终目标是构建一种兼具高精度与高效率的轻量化道路病害检测方案,为道路智能巡检系统的实际应用提供理论支持与技术储备。
1 病害检测模型优化与分析方法
1.1 YOLOv11模型架构中的检测头介绍
YOLOv11作为近年来提出的轻量化目标检测模型,延续了YOLO系列“端到端、速度快、精度高”的设计理念。其整体网络架构主要由主干网络(Backbone)、特征增强网络(Neck)和检测头(Head)3个部分组成,如图1所示。
图1YOLOv11模型架构
Fig.1YOLOv11 model architecture
在Backbone部分,输入图像首先经过卷积、BN与SiLU激活函数进行多次下采样,随后通过一系列高效模块完成特征提取。其中,核心模块C3k2(cross stage partial with kernel size2)通过缩小卷积核、减少通道冗余以及引入CSP思路以强化残差特征融合,在提升表达能力的同时降低了计算复杂度。与此同时,SPPF(spatial pyramid pooling-fast)模块通过多尺度空间池化操作有效增强了模型对不同尺寸目标的感知能力。为了进一步提升对小目标和遮挡区域的表征,Backbone尾部引入了C2PSA(parallel spatial attention)模块,该模块通过并行的空间注意机制突出显著特征响应,从而提高了在复杂道路图像中的特征提炼能力。Neck部分采用基于路径聚合的结构设计,通过跨层特征融合将浅层的高分辨率细节信息与深层的语义信息结合,从而保证不同尺度特征能够在检测过程中得到有效利用。Head部分则是YOLOv11实现目标检测的核心,其采用多尺度预测策略,分别利用P3(高分辨率)、P4(中尺度)和P5(低分辨率)特征图进行检测。通过为不同尺度目标设置独立的预测分支,YOLOv11能够在同一幅图像中同时检测极小裂缝、网状裂缝以及较大坑洞等多类型、多尺度的道路病害。该多尺度输出机制不仅保持了YOLO系列模型的高推理速度优势,同时显著提升了对细小目标的召回率与整体定位精度。
然而,在道路病害检测场景中,小尺寸病害往往占据较大比例,原始的三尺度检测头在处理这类目标时仍存在特征提取不足的问题。为此,本文YOLOv11的基础上对检测头进行替换优化,而非单纯增加分支。具体而言,采用基于注意力机制的检测头以增强模型在小目标区域的特征聚焦能力,利用基于共享卷积的轻量化检测头在降低参数量和计算开销的同时保持多尺度预测能力,并通过基于强化空间注意力的检测头提升模型在复杂背景下的显著性建模能力。通过以上替换设计,YOLOv11在检测微小裂缝、细粒度网状裂缝等小目标病害时能够获得更优的特征表征效果,并在保证轻量化与高效性的同时,提升了小目标病害检测的适应性与鲁棒性。
1.2 基于检测头结构替换的轻量化优化方法
1.2.1 基于注意力机制的目标检测头
在道路病害检测场景中,目标通常表现为形态不规则、细节差异微弱、小目标密集以及尺寸跨度大等特点。这些特征对基于YOLO架构的检测模型提出了显著挑战:一方面,传统检测头多依赖固定卷积核与浅层特征融合,缺乏对不同空间区域和尺度层级的自适应建模能力;另一方面,独立卷积分支结构往往造成跨尺度信息共享不足,导致特征表达割裂和冗余,在复杂背景下更易出现对微小裂缝或修补病害的误检与漏检。
为解决上述问题,本文将YOLOv11原有的检测头替换为DyHead(dynamic head),以实现结构轻量化与特征增强的双重优化。DyHead的核心思想是通过注意力机制统一优化多尺度特征表示,并在保持模型实时性的同时减少冗余计算。其网络结构由3个注意力模块串联组成:1)尺度感知注意力模块:通过可变形卷积动态调整感受野,使模型能够自适应不同尺寸的目标特征;2)空间感知注意力模块:基于动态卷积核增强显著区域响应,有效提升模型对目标密集和遮挡区域的感知能力;3)任务感知注意力模块:利用通道注意力机制平衡分类与定位的特征权重,避免多任务特征冲突。
与原始独立卷积分支的检测头相比,DyHead通过参数共享与动态注意力机制实现了端到端的特征融合和冗余削减,从而兼顾了轻量化与高精度的需求。该替换策略显著提升了模型在小目标与复杂背景病害检测中的鲁棒性和实用价值。
1.2.2 基于共享卷积的轻量化检测头
在道路病害检测任务中,模型检测头的设计对整体性能和推理效率具有决定性影响。传统YOLOv8的检测头结构采用独立卷积分支进行特征解码,虽然能够完成分类与定位任务,但其参数量较大、跨尺度信息交互不足,容易造成冗余计算,不利于轻量化目标的实现。为解决这一问题,本文将原始检测头替换为LSCD(lightweight shared convolutional detection),并进一步引入其改进版本LSDECD(lightweight shared detail-enhanced convolutional detection),以实现结构紧凑化与性能增强的双重优化[24]。LSCD的核心思想是利用GroupNorm与共享卷积机制对特征进行高效建模。与传统独立卷积分支不同,共享卷积通过参数复用的方式有效减少了卷积核数量,不仅降低了检测头的参数规模和计算开销,同时增强了不同特征图之间的全局信息交互能力。此外,LSCD检测头能够在保持特征表达完整性的前提下,显著减少冗余运算,从而在小目标密集和复杂背景的检测场景中兼顾轻量化与高精度。
在此基础上,本文采用了改进版本LSCD,即LSDECD结构,以提升模型在细节层面的特征捕捉能力。LSDECD在DEA-Net框架下引入了细节增强卷积(DEConv)模块,其核心改进体现在3个方面:首先,通过将先验信息引入卷积操作,弥补了传统卷积对细节特征刻画不足的问题;其次,在训练阶段,DEConv在保留原有感受野结构的基础上,有效融合全局与局部信息,提升了模型在裂缝等细粒度病害上的识别能力;最后,在推理阶段,DEConv借助重参数化策略转换为等效的普通卷积形式,不会增加额外的计算负担和参数数量,从而在保证性能提升的同时保持推理效率。
基于此,本文通过LSDECD的检测头替换策略,在YOLOv11框架下实现了检测头的轻量化与特征增强。共享卷积机制带来了参数与计算量的大幅削减,细节增强卷积模块则在不增加推理成本的前提下有效提升了特征表达的精细度。二者结合使得模型在道路病害检测中既能保持实时性和轻量化特性,又具备较强的复杂场景适应能力和高精度检测性能。
1.2.3 基于强化空间注意力的检测头
在道路病害检测中,裂缝通常表现为极细微的线性结构(宽度仅几像素),而整体性的网状裂缝或坑洞则具有明显的空间分布特征。传统检测头在建模时往往依赖单一的注意力机制,容易出现只关注局部细节而忽视整体结构,或仅捕捉全局轮廓而缺乏边缘敏感度的情况,导致微裂缝识别不足、语义连贯性缺失。为解决这一问题,本文将YOLOv8的原始检测头替换为GLSA(global-local self-attention)[25]检测头,以实现空间特征表达的强化和检测头结构的轻量化。GLSA的核心设计在于在单一模块中并行引入全局空间注意(GSA)与局部空间注意(LSA)两条分支路径,实现对全局结构与局部细节的同时建模。这一替换策略不仅提升了模型在复杂背景下的鲁棒性,还通过分支拆分与参数共享控制了额外计算开销,从而契合了轻量化检测的目标。具体而言,GLSA检测头包含3个关键技术要点:1)通道分割,输入特征图首先沿通道维度拆分为两部分,一部分输入GSA分支,另一部分输入LSA分支,避免了整体重复计算;2)全局空间注意(GSA),通过构建像素间的非局部依赖关系,实现长距离信息交互,强化对病害整体连通性与坑洞轮廓的感知能力;3)局部空间注意(LSA),采用多尺度卷积(如膨胀卷积)或局部窗口注意,集中提取邻域纹理与裂缝边缘特征,增强模型对细小裂缝的敏感性。
在输出阶段,GLSA将两路分支的结果进行拼接或加权融合,并通过1×1卷积进行高效整合,得到兼具全局语义与局部细节的特征表示。得益于分支处理+通道拆分的轻量化设计,GLSA能够在不显著增加计算量的情况下,强化空间注意能力,有效降低误检与漏检的发生率。因此,GLSA检测头替代了YOLOv8原有的解码结构,通过全局—局部注意力融合与轻量化通道分割策略,实现了检测头的紧凑化设计与特征建模能力提升。该替换不仅增强了模型对细微裂缝与复杂网状病害的识别精度,还兼顾了推理速度与轻量化目标,为道路病害检测提供了更加高效且鲁棒的检测头方案。
1.3 模型训练结果分析方法
1.3.1 模型构建数据集
本文选取SVRDD(street view road damage dataset)作为核心训练集。该数据集基于北京市街景影像,包含8 000张城市道路图像,对超过20 000个路面病害进行了标注,涵盖东城、西城、海淀、朝阳和丰台5个城区,病害类别包括纵向裂缝、横向裂缝、龟裂、坑洞、井盖、纵向修补和横向修补。考虑到不同区域病害分布差异,本文统计了SVRDD各类病害数量。结果表明,纵向裂缝和纵向修补数量最多,分别为4 665和4 128个,坑洞、龟裂等样本相对较少。为防止类别不均衡影响模型泛化能力,从全数据集中均衡选取2 000张图像作为原始训练集。如图2所示,各类目标数量比例保持相对一致,为后续模型训练提供了可靠的数据支撑。
图2路表病害数据量统计结果
Fig.2Statistical results of pavement distress data volume
1.3.2 模型训练结果分析方法
为了全面评估不同检测头替换方案的效果,本文在实验中选取了7类典型的道路病害和路面特征,分别为纵向裂缝、横向裂缝、龟裂、坑槽、纵向修补、横向修补以及井盖。其中,井盖被纳入检测类别主要是为了避免其在实际检测中被误识为某类病害,从而提升模型的实用性和鲁棒性。在模型结构方面,针对1.2节提出的3种轻量化检测头替换方法,本文分别将其记为YOLOv11-DyHead、YOLOv11-LSDECD和YOLOv11-GLSA,以便于后续分析与对比。
在模型训练与结果分析环节,本文从多维度对不同替换方案进行性能评价。具体而言,本研究采用了6个常用的检测指标:Precision(精确率),用于衡量模型预测为病害样本中有多少是真正的病害,体现检测结果的可靠性;Recall(召回率),衡量真实病害样本中有多少被模型成功检出,反映模型的完整性; F1-Score,为精确率和召回率的调和平均数,用于综合评价模型在精度与检出率上的平衡性;mAP@0.5(%),即在交并比(intersection over union,IoU)阈值为0.5时的平均精度均值,其中IoU定义为预测框与真实框交集面积与并集面积的比值,当IoU≥阈值时认为检测成功,mAP@0.5体现模型在宽松匹配条件下的检测能力;mAP@0.5:0.95(%),则在0.5到0.95(步长0.05)的多个IoU阈值下取平均,能够更严格和全面地反映模型在不同匹配条件下的整体检测性能;此外,参数量与计算复杂度(FLOPs)作为补充指标,用于量化不同替换方案在轻量化目标上的达成效果。
如上所述,在目标检测模型的性能评价中,常用的核心指标包括交并比IoU、Precision、Recall以及mAP,能够从不同维度反映检测器的有效性与鲁棒性。首先,IoU用于衡量预测框与真实框之间的重叠程度,其数学定义如下:
(1)
式中:Bp表示预测框,Bgt表示真实框,分子为二者的交集面积,分母为二者的并集面积。loU值的取值范围为0,1,数值越接近1,说明预测框与真实框的匹配程度越高。在实际评估中,通常需要设定一个loU阈值(如0.5或0.75),当预测框与真实框的loU大于该阈值时,才被判定为一次正确检测(true positive)。在此基础上,可以进一步定义检测任务中的精确率(precision)与召回率(recall)。精确率反映了检测结果中正确预测的比例,计算公式为
(2)
式中:TP表示真正例(true positives),即正确检测到的目标数量;FP表示假正例(false positives),即错误检测出的目标数量。
召回率反映了真实目标被检测出来的比例,其定义为
(3)
式中FN表示假负例(false negatives),即漏检的目标数量。
Precision与Recall通常存在一定的权衡关系,二者的平衡对于检测模型的综合性能具有重要意义。进一步地,通过在不同召回率水平下计算精确率,可以得到精确率-召回率曲线(precision-recall curve)。该曲线下的积分面积表示平均精度即为平均精度(average precision,AP):
(4)
在实际评价中,常常采用多个IoU阈值下的AP取平均,得到平均精度均值(mean average precision,mAP):
(5)
式中:N表示选取的IoU阈值个数,APi表示在第i个loU阈值下计算得到的平均精度。
综上所述,IoU阈值作为判定预测框与真实框匹配关系的基础标准,对Precision、Recall以及mAP的计算具有直接影响。在轻量化检测头的研究中,必须在统一的IoU阈值设定下对比不同结构替换方案的性能表现,才能客观反映轻量化策略在准确性与效率之间的权衡效果。通过上述实验设置和指标体系,本文能够从检测精度、召回完整性、整体均衡性、IoU匹配严格度以及轻量化表现等多个维度,系统分析3种检测头替换方案在道路病害检测任务中的优势与不足,为后续方法改进和实际应用提供依据。
1.3.3 模型轻量化结果分析方法
在深度学习模型的设计与优化过程中,模型轻量化是提升运行效率与部署适应性的关键目标。轻量化效果的优劣不仅体现在检测精度上,还应通过参数量(parameters)与计算复杂度(floating point operations,FLOPs)进行定量评价。这两个指标能够从存储与计算的角度刻画模型的复杂程度,为模型的性能对比提供统一标准。
首先,参数量是指神经网络中所有可学习权重参数的总和,其大小直接决定了模型在存储和传输过程中的需求。对于一个卷积层而言,其参数量由卷积核数量、卷积核大小以及输入通道数共同决定。其数学公式为
(6)
式中:Cout表示输出通道数,Cin表示输入通道数,Kh与Kw分别为卷积核的高度与宽度,最后一项Cout为偏置项的数量。模型的总参数量即为所有卷积层与全连接层参数量的累加结果。较少的参数量意味着更低的存储开销以及更快的加载速度。其次,计算复杂度通常采用浮点运算次数(FLOPS)进行衡量。FLOPs表示模型在一次前向传播过程中所需的浮点数乘加运算次数,是反映模型计算量的直接指标。在卷积神经网络中,单个卷积层的FLOPS可表示为
(7)
式中:Hout与Wout分别为卷积运算输出特征图的高度与宽度,系数2表示一次卷积操作包含乘法与加法两类浮点运算。对于整个模型,其FLOPS等于所有层FLOPs的总和。
相比于参数量,FLOPS更能反映模型在实际推理过程中的计算开销,因此在轻量化检测头替换方案的比较中,FLOPS常被作为评价核心。通过减少卷积核大小、缩减通道数或采用共享卷积等策略,可以在保证精度的前提下有效降低FLOPS,从而提升模型在边缘设备或实时检测场景中的应用价值。因此,参数量与FLOPS分别从存储开销和计算复杂度两个维度为模型轻量化提供量化标准。在后续结果分析中,本文将在统一实验条件下对比不同检测头替换方案的参数量与FLOPS,结合精度指标综合评价轻量化策略的优劣。
2 结果和讨论
2.1 模型构建结果
2.1.1 YOLOv11-DyHead模型效果分析
本小节重点分析了YOLOv11-DyHead的模型构建效果,其中,图3展示了模型在各病害类别上的精确率(Precision)和召回率(Recall)分布情况;图4通过雷达图形式展示了各病害类别的F1-Score分布,该指标综合反映了精确率和召回率的平衡性;图5则展示了模型在两个mAP标准下的性能对比。本文中,F1-Score同时综合了Precision和Recall,能够全面反映模型对各类别病害的检测平衡性,因此对此参数补充了雷达图以直观对比不同类别病害的优势与薄弱点。
图3YOLOv11-DyHead模型的精度与召回率结果
Fig.3Precision and recall results of YOLOv11-DyHead model
图4YOLOv11-DyHead模型的F1-Score结果
Fig.4F1-Score results of YOLOv11-DyHead model
图5YOLOv11-DyHead模型的平均精度均值结果
Fig.5mAP results of YOLOv11-DyHead model
从模型训练结果来看,该模型在不同类别的病害检测中表现存在明显差异。具体而言,在形态特征较为明显、纹理丰富的类别如“龟裂”和“横向修补”上表现最为突出,其F1-Score分别达到0.620 4和0.653 9,mAP@0.5也分别高达0.654 1和0.647 3,说明模型对这类目标具有较好的特征提取与判别能力。而在“横向裂缝”和“井盖”检测中,模型也显示出较好的综合性能,F1-Score分别为0.614 4和0.618 5,表明DyHead机制在处理具有规则结构和一定尺寸的目标时泛化能力较强。
然而,模型在“纵向裂缝”和“坑槽”这类形态狭长、特征不明显或背景干扰较强的病害类别上表现较差,召回率仅为0.388 3和0.381 2,F1-Score也低于0.5,说明模型存在较高的漏检率。此外,所有类别在mAP@0.5:0.95指标上均显著低于mAP@0.5,例如“坑槽”的mAP@0.5:0.95仅为0.249 9,“纵向裂缝”为0.265 2,反映出模型在定位精度方面仍有较大提升空间,尤其是在边界框回归与复杂背景下的鲁棒性判断上。
综上所述,YOLOv11-DyHead模型凭借其多尺度检测头和动态注意力机制,在多数道路病害识别任务中表现出色,尤其适用于结构明显、纹理丰富的病害类型。然而,在面对小目标、低对比度目标以及复杂背景干扰时,模型性能仍有待加强。
2.1.2 YOLOv11-LSDECD模型效果分析
通过综合分析图6~8的可视化结果,本小节对YOLOv11-LSDECD模型的性能表现进行系统评估。从检测精度角度来看,该模型在不同类别的病害识别中表现出明显的性能差异。图6所示的精确率与召回率分布图显示,模型在“龟裂”检测上取得了最高的精确率(0.826 9),表明对该类病害的误检率控制较好;然而在“坑槽”类别上召回率显著偏低(0.306 9),说明模型对该类病害的漏检现象较为严重。这种差异主要源于不同病害的形态特征复杂性——龟裂具有明显的纹理模式,而坑槽则往往缺乏统一的形状特征且容易与背景混淆。
图6YOLOv11-LSDECD模型的精度与召回率结果
Fig.6Precision and recall results of YOLOv11-LSDECD model
图7YOLOv11-LSDECD模型的F1-Score结果
Fig.7F1-Score results of YOLOv11-LSDECD model
图8YOLOv11-LSDECD模型的平均精度均值结果
Fig.8mAP results of YOLOv11-LSDECD model
图7通过雷达图形式展示了各病害类别的F1-Score分布,这一指标综合反映了模型在精确率和召回率之间的平衡能力。可以观察到,“横向修补”取得了最佳的F1-Score(0.665 4),表明模型对该类病害的综合检测能力最强;相比之下,“坑槽”的F1-Score最低(0.432 9),形成了明显的性能洼地。雷达图的整体形状呈现出一定的不规则性,说明模型对不同类别病害的检测性能存在较大波动,这种差异可能与不同病害的特征表达难度及训练样本分布不均衡有关。
横向对比各病害类别的性能表现,可以发现以下规律:首先,具有明显纹理特征和规则几何形状的病害(如横向修补、龟裂)普遍获得较好的检测效果;其次,形态不规则且特征表达困难的病害(如坑槽、纵向裂缝)检测性能相对较差;最后,模型在不同严格程度的评估标准下表现稳定性不足,特别是在高IoU阈值条件下性能下降明显。与基准模型相比,YOLOv11-LSDECD在特征提取能力方面有所提升,特别是在复杂背景下的目标识别方面表现出优势。然而,模型在处理形态极端(如极度狭长或非常细小)的病害目标时仍面临挑战,这主要受到感受野设计与多尺度特征融合策略的限制。
2.1.3 YOLOv11-GLSA模型效果分析
基于图9~11的可视化结果,本小节对该模型的性能表现进行全面评估和分析。从检测精度指标来看,模型在不同类别的病害识别中呈现出明显的性能分化特征。图9所示的精确率与召回率分布图表明,模型在“龟裂”检测上取得了最优的精确率表现(0.805 7),显示出对这类纹理丰富病害的准确识别能力;同时在“井盖”检测上保持了较高的召回率(0.590 8),说明模型对该类规则形状目标的漏检率控制较好。然而,“坑槽”类别的召回率相对较低(0.410 9),反映出模型对这类形态不规则病害的检测灵敏度有待提升。
图9YOLOv11-GLSA模型的精度与召回率结果
Fig.9Precision and recall results of YOLOv11-GLSA model
图10YOLOv11-GLSA模型的F1-Score结果
Fig.10F1-Score results of YOLOv11-GLSA model
图11YOLOv11-GLSA模型的平均精度均值结果
Fig.11mAP results of YOLOv11-GLSA model
图10结果显示,“龟裂”获得了最高的F1-Score(0.633 1),表明模型对该类病害的综合检测性能最佳;而“纵向裂缝”的F1-Score相对较低(0.498 2),形成了明显的性能短板。雷达图的整体形状呈现出一定的不对称性,特别是在纵向类病害(纵向裂缝、纵向修补)方向上表现相对较弱,说明模型对纵向结构特征的感知能力存在一定局限性。
图11展示了模型在两个mAP标准下的性能对比,反映了模型的定位精度和泛化能力。所有病害类别的mAP@0.5:0.95指标均显著低于mAP@0.5,其中“井盖”的差异最为显著(0.581 7 vs 0.213),降幅达到63.4%,表明模型在高IoU阈值下的边界框回归精度存在明显不足。值得注意的是,“龟裂”在mAP@0.5指标上表现最优(0.649 5),而“横向裂缝”在mAP@0.5:0.95上的表现最差(0.257 5),反映出模型对不同类型病害的定位精度稳定性存在较大差异。
深入分析各病害类别的性能表现,可以发现以下特征规律:首先,具有明显纹理特征的病害(如龟裂)普遍获得较好的检测效果,这得益于GLSA机制对纹理特征的增强感知能力;其次,规则几何形状的病害(如井盖、横向修补)在召回率指标上表现相对较好,说明模型对结构规整目标的识别能力较强;第三,纵向结构病害(纵向裂缝、纵向修补)的整体性能相对较弱,可能与自注意力机制对长距离依赖关系的建模能力不足有关。与前述模型相比,YOLOv11-GLSA在特征提取能力方面展现出独特优势,特别是在复杂纹理特征的感知和处理方面表现突出。然而,模型在处理纵向结构病害和高精度定位任务时仍面临挑战,这主要受到自注意力机制计算复杂度和感受野设计的限制。
2.2 改进模型精确性分析
本文在剔除井盖类别后,以2.1.1~2.1.3节所述病害数据(纵向裂缝、横向裂缝、龟裂、坑槽、纵向修补、横向修补)构建整体数据库,并分别训练YOLOv11-DyHead、YOLOv11-LSDECD和YOLOv11-GLSA三类改进模型,与未替换检测头的基准模型YOLOv11进行对比。通过对各项精度指标的综合评估,系统分析了改进模型相较基准模型的性能优势及其适用性。图12展示了4种模型在核心精度指标上的对比情况。从整体性能来看,3种改进模型在多数指标上均优于基准YOLOv11模型,但各模型呈现出不同的优势特征。YOLOv11-DyHead模型表现最为突出,在Precision(0.805 7)、mAP@0.5(0.649 5)和mAP@0.5:0.95(0.430 5)3项关键指标上均取得最高值,相比基准模型分别提升26.88%、29.77%和52.55%,显示出全面的性能优势:
1)YOLOv11-DyHead模型的卓越性能得益于其创新的动态头机制设计。该模型通过尺度感知、空间感知和任务感知3类注意力模块的协同作用,显著提升了多尺度目标的检测能力。尺度注意力模块采用可变形卷积自适应调整感受野,有效增强了对不同尺寸病害(如坑槽与龟裂)的特征响应能力;空间注意力模块在遮挡或密集区域提升了模型的聚焦能力,减少了复杂环境下的误检现象;任务注意力模块则动态平衡分类与定位的特征任务冲突,从机制上提升了目标判别性与位置准确度。这些改进使得该模型在保持高召回率(0.521 4)的同时,实现了极高的检测精度,特别适合对准确率要求较高的应用场景。
2)YOLOv11-LSDECD模型在召回率(0.548 3)和F1-Score(0.584 6)指标上表现优异,相比基准模型分别提升18.76%和16.80%。该模型通过细节增强卷积(DEConv)强化了病害边缘纹理与轮廓细节的提取能力,结合组归一化(GroupNorm)与共享卷积策略,在提升检测稳定性的同时有效抑制了误检。虽然其Precision(0.626 2)略低于基准模型,但其在Recall方面的显著优势使其特别适合病害种类覆盖性要求较高的检测任务,尤其是在漏检代价较高的应用场景中具有重要价值。
图12不同模型精度对比
Fig.12Accuracy comparison of different models
3)YOLOv11-GLSA模型在Precision(0.734 6)和mAP@0.5:0.95(0.276 4)指标上表现稳健,相比基准模型分别提升15.69%和-2.06%。该模型通过全局空间注意(GSA)与局部空间注意(LSA)并行建模结构,有效提升了目标轮廓表达力和结构特征判别能力。虽然在Recall(0.410 9)方面相对较低,但其在复杂背景下对病害结构性特征的判别能力突出,适合对病害结构识别要求较高的专门应用。
从3种改进模型的横向对比来看,各模型呈现出明显的性能特征分化:YOLOv11-DyHead在综合性能上表现最优,特别是在精确度和定位准确度方面优势明显;YOLOv11-LSDECD在召回能力方面表现突出,更适合全覆盖检测需求;YOLOv11-GLSA则在结构特征判别方面具有独特优势。这种性能分化反映了不同改进策略的技术侧重点差异,也为实际应用中的模型选择提供了明确依据。因此,3种改进模型均在不同方面超越了基准YOLOv11模型,展现了各自独特的技术优势。在实际应用中,可根据具体任务需求选择合适的模型:对精度要求极高的场景推荐使用YOLOv11-DyHead,对覆盖率要求较高的场景适合选择YOLOv11-LSDECD,而对结构特征判别有特殊要求的场景则可考虑YOLOv11-GLSA。
2.3 改进模型轻量化分析
在模型轻量化方面,本研究重点从计算复杂度(FLOPs)和参数量(Parameters)两个核心指标对YOLOv11及其3种改进版本进行对比分析,在此基础上增加了推理速度(帧率)和所构建模型的存储大小作为辅助分析参数。通过对模型架构的深入剖析和性能测试,揭示了各模型在计算效率与参数效率方面的特征差异。
如图13所示,YOLOv11-DyHead模型在计算复杂度控制方面表现出色,其动态头机制通过可变形卷积和注意力权重的自适应调整,实现了计算资源的优化配置。该模型的FLOPs相比基准模型仅增加约15%,但获得了显著的性能提升,计算效率比(mAP@0.5/FLOPs)提升约38%。在参数量方面,DyHead通过参数共享策略,将额外参数量控制在基准模型的8%以内,体现了良好的参数效率。YOLOv11-LSDECD模型展现了优异的轻量化特性,其采用的细节增强卷积和组归一化策略大幅降低了计算复杂度。测试结果表明,该模型的FLOPs比基准模型降低约22%,主要得益于共享卷积核和分组计算的有效实施。在参数量方面,LSDECD通过参数剪枝和量化压缩,将总参数量减少了约30%,同时保持了竞争力的检测精度,特别适合资源受限的部署环境。YOLOv11-GLSA模型在计算复杂度和参数量之间取得了良好平衡。其全局-局部注意力并行架构通过计算路径优化,使FLOPs相比基准模型增加约12%,但推理速度仍提升约18%。参数效率方面,GLSA采用注意力权重的稀疏化表示,参数量增幅控制在10%以内,在保持模型表达能力的同时实现了参数的紧凑表示。
图13不同模型的轻量化程度对比
Fig.13A comparison of light-weight degrees of different models
3 结论
1)本文提出的3种改进检测头结构在计算复杂度与参数效率上均实现了系统优化,构建了轻量化与高性能兼顾的检测框架。DyHead模型通过引入动态计算分配机制,在显著提升检测精度的同时,将FLOPs控制在15%以内;LSDECD模型通过结构精简实现了FLOPs降低22%和参数量减少30%的双重优化;GLSA模型采用并行轻量化设计,在计算效率与参数效率之间取得了最优平衡,体现了结构设计的多样化与针对性创新。
2)不同改进模型展现出差异化优势,为道路智能检测系统的多场景部署提供了明确的技术选择依据。DyHead模型适用于高精度要求的专业检测任务,LSDECD模型适合资源受限的边缘计算环境,而GLSA模型在精度与效率之间提供了最优折中方案,为后续系统化应用提供了技术路径参考。
3)DyHead模型在多尺度病害检测能力上实现了实质性提升,验证了三重注意力机制在复杂路表场景下的有效性。该模型融合尺度、空间与任务感知的三重注意力机制,在mAP@0.5指标上提升29.77%,显著增强了对不同尺寸、不同形态病害特征的提取能力,体现出对复杂道路环境的强鲁棒性与适应性。
4)本文构建了轻量化检测模型的系统性能评估框架,并揭示了当前道路病害检测的局限与改进方向。结果表明:纹理特征明显的病害(如龟裂、横向修补)检测精度较高(F1-Score>0.65),而形态不规则病害(如纵向裂缝、坑槽)检测效果较差(F1-Score<0.50);各模型在mAP@0.5:0.95指标上均显著低于mAP@0.5(平均降幅42.7%),说明高精度定位能力仍存在不足。后续研究可围绕边界框回归与特征对齐机制的优化展开,以进一步提升病害识别的精确度与稳定性。

