摘要
为研究空间机械臂多模态视觉感知与操作的发展现状及亟须解决的关键技术难题,对目前该领域的文献进行了分析与总结。多模态视觉感知是指融合可见光、红外、深度相机与激光雷达等异构传感器及多源数据形式实现的视觉感知方式,空间操作是指面向在轨任务,利用机械臂等执行机构实施接近、抓取、装配与维护等作业的过程。首先,回顾了目前国内、外已服役的典型空间机械臂系统,总结其发展脉络与应用特点。其次,文中以“感知-规划-控制”为主线,系统梳理了自主在轨服务所需的3项关键技术:一是多模态视觉感知技术,重点介绍多源异构数据融合以及多模态视觉位姿估计技术;二是复杂约束下的轨迹规划技术,涵盖基于模型、优化与学习的空间机械臂轨迹规划方法,并探讨其在自由漂浮基座和强耦合动力学条件下的适用性;三是面向漂浮运动目标的柔顺抓取技术,以保障操作过程中的安全性。最后,总结了当前空间机械臂在自主在轨服务中面临的计算资源受限、在轨数据匮乏、多模态协同困难,以及运行生命周期短等核心挑战,并展望了其在硬件、算法与系统层面的未来发展趋势。研究表明:空间机械臂的自主在轨服务技术尚未成熟,关键技术环节与应用落地存在多处瓶颈,多模态视觉传感器与智能图像处理算法、基于学习的轨迹规划与柔顺抓取控制,将成为提升空间机械臂自主性能的核心发展方向。
Abstract
To investigate the current development of multimodal visual perception and manipulation for space manipulators and the pressing technical challenges, this paper conducts an analysis and summary of the existing literatures. Multimodal visual perception refers to a vision approach that integrates heterogeneous sensors and multi-source data, including visible, infrared, depth cameras, and LiDAR. Space manipulation is on-orbit activities conducted with robotic manipulators and other actuators, encompassing approach, grasping, assembly, and maintenance. This paper first reviews representative space manipulator systems that have been deployed domestically and internationally, summarizing their developmental path and application characteristics. Building on this foundation, we adopt a perception-planning-control framework to systematically review three technologies essential for autonomous on-orbit servicing. We first address multimodal visual perception, focusing on heterogeneous data fusion and multimodal pose estimation. We then examine trajectory planning under complex constraints, covering model-based, optimization-based, and learning-based methods and their applicability to free-floating bases and strongly coupled dynamics. Last, we discuss compliant grasping for free-floating moving targets to ensure operational safety. Finally, the paper highlights major challenges faced by space manipulators in autonomous on-orbit servicing, including limited onboard computational resources, scarcity of on-orbit data, difficulties in multimodal coordination, and the need for long-term reliability. Future directions are then outlined from the perspectives of hardware, algorithms, and system-level integration. Research indicates that autonomous on-orbit servicing for space manipulators is still immature, with multiple bottlenecks persisting in key technical components and practical deployment. Advances in multimodal vision, learning-based trajectory planning, and compliant grasping control will be critical to enhancing autonomous performance.
1 空间机械臂概述
1.1 研究背景与意义
随着航天技术的不断发展,空间任务逐渐从一次性、任务驱动型的单次发射运行模式向长期在轨运行、可重复利用以及可持续服务的方向转变。在轨服务(on-orbit servicing,OOS)作为延长航天器生命周期、提升任务灵活性、推动循环空间经济发展的重要手段,近年来逐渐成为各国航天战略的核心关注方向[1-3]。在实际在轨服务中,空间机械臂因其自由度高、通用性强、操作灵活等优势,被广泛应用于故障维修、辅助展开、燃料加注、目标捕获等多种典型场景[4-6]。空间机械臂的操作涵盖多个任务导向的子环节,但无论任务形态如何改变,其最终实现都要依托具体的技术支撑[7]。因此,空间机械臂的操作过程可以细分为轨迹规划与抓取控制两个核心阶段:前者侧重于在复杂动力学约束环境下生成安全可行的运动方案,后者则聚焦于通过自适应、柔顺、力-位混合等多种控制策略完成对空间目标的具体操纵。
为应对日益复杂的在轨作业需求,空间机械臂的操控模式经历了从完全遥操作到局部自主操作,再到全局自主操作的演变。与此同时,伴随着多源高精度传感器的快速发展,人工智能与深度学习技术的兴起以及空间算力平台的持续提升[8-10],面向在轨服务的空间机械臂系统逐渐朝着融合多模态感知与实时智能决策的方向发展。这一趋势不仅被视为推动在轨服务由“半自主”迈向“全自主”的关键支撑技术,也受到越来越多国家与科研机构的高度重视。
1.2 国内、外研究现状概述
1981年11月,加拿大航天局(Canadian Space Agency,CSA)与MDA Space公司研制的航天飞机遥控机械臂系统(shuttle remote manipulator system,SRMS,即“加拿大臂1号”,Canadarm-1)随哥伦比亚号航天飞机首次入轨,成为全球首个成功应用的在轨操作机器人,承担了卫星捕获与释放、国际空间站建设以及舱外作业辅助等任务[11]。直至2011年退役,SRMS共完成90次空间任务。在此基础上,CSA又研制了应用于国际空间站的移动服务系统(mobile servicing system,MSS,即“加拿大臂2号”,Canadarm-2)。该系统由空间站遥控机械臂(space station remote manipulator system,SSRMS)、移动基座(mobile base system,MBS),以及灵巧机械臂(special purpose dexterous manipulator,SPDM)组成[12]。目前,CSA与MDA Space公司还在推进“加拿大臂3号”的研制,以支持美国月球轨道平台Gateway项目的开展[13]。除加拿大外,欧洲航天局(European Space Agency,ESA)研制的欧洲机械臂(European Robotic Arm,ERA)[14]和日本宇宙航空研究开发机构(Japan Aerospace Exploration Agency,JAXA)研制的日本实验舱机械臂(Japanese Experiment Module Remote Manipulator System,JEMRMS)[15],也分别部署在国际空间站的俄罗斯舱与日本舱外。
除了部署在空间站的机械臂系统外,还有若干部署在航天器的机械臂系统承担了不同种类的在轨任务。1997年,JAXA前身之一的日本宇宙开发事业团(National Space Development Agency of Japan,NASDA)制造的技术试验卫星7号(engineering test satellite VII,ETS-VII),搭载了一台6自由度(6-DoF)的空间机械臂(ETS-VII Arm)成功升空,成为首颗配备机械臂的人造卫星[16],完成了包括插销入孔、滑动把手在内的在轨操作试验[17]。2007年,美国国防高级研究计划局(Defense Advanced Research Projects Agency,DARPA)牵头研制的“轨道快车”系统(orbital express system,OES)携带1台6-DoF的自主空间运输机器人操作机械臂(autonomous space transport robotic operations arm,ASTRO-Arm)顺利入轨,成功完成燃料输送、电池更换等验证目标[18]。
中国对空间机械臂技术的研究始于20世纪80年代。中国空间技术研究院自2005年起系统性地开展了空间机械臂的相关研究,2008年完成了6-DoF机械臂原理样机,随后布局7-DoF机械臂的研制,使中国在该领域逐步跻身国际先进行列[19]。2021年,中国空间站核心舱机械臂(core module manipulator,CMM)随“天和”核心舱入轨[20];2022年,中国空间站实验舱机械臂(experiment module manipulator,EMM)随“问天”号发射顺利入轨[21],共同构成了中国空间站遥控机械臂系统(Chinese space station remote manipulator system,CSSRMS)。目前,该系统已完成航天员出舱托举、空间站辅助对接等多项技术验证,展现出优异性能与应用潜力[22]。典型的国内、外空间机械臂系统如图1所示,同时,本文将它们的具体性能对比汇总于表1。
图1国内、外空间机械臂系统
Fig.1Domestic and international space manipulator systems
表1典型空间机械臂系统的比较
Tab.1Comparison of typical space manipulator systems
1.3 本文的组织架构
本文从空间机械臂在轨服务应用出发,以自主在轨服务的空间机械臂关键技术为主线,按照“感知-规划-控制”的逻辑链,围绕在轨操作中的多模态视觉感知技术、复杂约束下的空间机械臂轨迹规划技术,以及面向漂浮运动目标的柔顺抓取技术展开,并于最后对自主在轨服务的现有关键挑战与未来发展趋势进行展望。本文的组织架构见图2。
图2本文的组织架构
Fig.2Organization structure of this paper
2 面向在轨操作的多模态视觉感知
空间视觉感知技术作为自主在轨服务的前提,面临着与地面应用显著不同的多重挑战[23-26]。首先,空间极端环境严重影响光学成像的稳定性。强烈光照会带来过曝与眩光效应,弱光和阴影区域又会导致图像细节缺失,而复杂行星背景则会进一步降低视觉系统的感知精度。其次,空间目标的非合作特性也为感知任务带来了阻碍。由于缺乏先验信息,难以提取稳定的特征点,加上空间目标广泛存在的高反射与低纹理特性,进一步限制了基于视觉的目标位姿估计准确度。
面对上述问题,单一传感器往往难以应对复杂场景需求,多模态空间视觉感知技术应运而生[27]。然而,多源异构视觉数据融合带来了全新的研究难题,不同模态之间在时空同步、坐标系转换、分辨率统一,以及数据格式匹配等方面存在差异,对在轨图像融合与处理能力提出了更高要求。综上所述,空间环境视觉感知不仅要应对极端空间环境与非合作目标特性的双重制约,还必须在多模态协同与异构数据融合之间取得平衡,才能为在轨操作提供可靠稳健的技术支撑。
2.1 多模态视觉传感器分析
近年来,受计算机视觉与深度学习迅猛发展的影响,空间多模态视觉感知方法获得了国内、外研究者的广泛关注。空间视觉感知方法根据其依赖的视觉传感器类型可分为单目相机、双目相机、RGB-Depth(RGB-D)相机、红外相机,以及激光雷达(LiDAR)5类。在实际应用部署时,各国航天局往往会根据任务需求以及各种视觉传感器的特性选择合适的视觉感知方案。典型视觉传感器在空间感知任务下的特性见表2。
表2典型视觉传感器在空间感知任务下的特性
Tab.2Characteristics of typical vision sensors for space perception tasks
传统的可见光相机在适宜的光照条件下能够实现毫米级的定位精度,但对于在轨服务中广泛存在的目标遮挡和光照变化,基于可见光的图像处理算法效率较差,甚至可能出现定位盲区。针对这些问题,西北工业大学的赵迪等[28]采用Hough变换特征提取算法,将图像处理效率提升了约30%。中国科学院大学的施琦[29]利用深度神经网络在目标检测方面的优越性能,实现了基于可见光相机的高效空间目标识别,增强了实时性的同时,显著提高了对暗弱目标的检测能力。马兰[30]选用可见光相机为空间机械臂提供实时视觉反馈,辅助实现如捕获失效卫星、更换在轨模块等遥操作任务。该方法通过构建目标的三维模型并叠加增强视觉信息,有效提升了空间机械臂操作的精度与可靠性。
可见光相机的成像质量极易受到空间极端光照变化的影响,相比之下,红外相机能够利用目标热辐射进行特征识别,具备全天候工作的优势。即使在强动态光照下红外相机仍能够保持较高的视觉感知稳定性,大幅提升了航天器在暗区的目标识别率[31]。因此,各国航天局已开始将红外相机应用于空间任务。例如,2012年欧洲航天局成功发射了水星探测器BepiColombo[32],验证了红外相机在极端光照环境下具备鲁棒的位姿测量能力。2019年中国吉林一号光谱卫星搭载了短波和长波红外相机,成功完成了对目标船舶光学特征的识别任务[33]。然而,由于红外相机空间分辨率较低、硬件成本较高,所以无法在各国航天器的在轨服务任务中大规模应用。
相较之下,激光雷达凭借更高的测量精度和抗干扰能力,逐渐成为航天机构青睐的空间视觉传感器。2022年,赵梓良等[34]基于激光雷达对柔性航天器开展了仿真研究,验证了激光雷达对自由翻滚目标姿态估计的精度,成功满足了实际工程应用需求。He等[35]提出了基于点云特征的非合作目标位姿跟踪方法,有效实现了非合作目标位置和姿态的实时跟踪。然而,激光雷达价格昂贵且功耗较高,在航天器小型化的发展趋势下,其应用受到了非常大的制约。
为了兼顾精度与成本,立体相机逐渐成为各国新的研究重点。2021年,朱凌超[36]提出了一种基于立体相机视觉的非合作目标特征提取方法,在弱光环境实现了空间目标三维重构,并将重构误差降低了40%,为空间碎片捕获提供毫米级定位精度。2025年,Zhang等[37]进一步研究了立体视觉相机在近距离场景下的应用,大幅降低了10 m以内非合作目标的定位误差,其弱光环境下的自适应特征提取成功率超过90%。
此外,随着事件相机的发展,近年来事件相机与深度学习方法的结合也成为各国航天局重点研究的方向。Ussa等[38]提出了一种基于事件相机的空间碎片跟踪方法,通过卷积神经网络(convolutional neural network,CNN)的时空聚合能力,实现了空间碎片的非线性运动预测,在高动态环境下将跟踪延迟控制在10 ms以内,显著提升了跟踪精度与响应速度。该方法能够提取多频特征并适应极端光照条件,为在轨空间碎片监测提供了智能化解决方案。
2.2 多模态视觉融合增强
当前,基于单一传感器的空间视觉感知系统面临着感知精度低、环境适应能力弱等问题。因此,为了提升航天器观测数据的可辨识性,近年来国内、外研究人员对多模态视觉融合增强技术进行了广泛深入的研究。典型的融合方案包括可见光与红外成像的互补融合、可见光与激光雷达的深度感知融合,以及可见光与事件相机的动态信息融合等。
2.2.1 可见光与红外融合
目前,可见光与红外图像融合方法主要分为传统方法和基于深度学习的方法。其中,传统方法包括多尺度变换与稀疏表示。多尺度变换通过将源图像映射至不同尺度空间进行特征提取与融合,再进行图像重建,常见方法有离散小波变换[39]、曲波变换[40]、非下采样轮廓波变换[41]和金字塔变换[42-43]。稀疏表示则假设源图像可在过完备字典下进行稀疏分解,通过融合稀疏系数并结合字典重建实现图像融合[44]。尽管两类方法各具特色,但普遍存在适应性不足的问题。
相比之下,深度学习方法凭借强大的特征表征与自适应能力,逐渐成为图像融合研究的主流方向。2017年, Prabhakar等[45]提出了DeepFuse网络,其核心思想是通过编码器提取特征并利用解码器生成融合图像。在DeepFuse的基础上,Li等[46]提出了DenseFuse网络,DenseFuse引入了密集连接块(dense block),通过增加卷积层之间的特征传输通道,大幅提升了网络的特征表达能力。随着视觉变换器(vision transformer,ViT)[47]的提出,Transformer在视觉领域得到了越来越广泛的应用。Vs等[48]提出了一种新的融合方法,称为图像融合Transformer(image fusion transformer,IFT),它利用局部信息和远程模型依赖来克服图像融合中缺乏全局上下文理解的问题。Qu等[49]设计了一个将CNN模块与Transformer模块相结合的编码器TransMEF。该编码器结合了CNN和Transformer的优势,融合效果较好,但特征融合策略需要人为设置,无法完全适应复杂场景。由Ma等[50]提出的SwinFusion融合方法能够充分利用SwinTransformer的特殊架构,实现了高效可见光与红外图像特征的融合。
2.2.2 可见光与激光雷达融合
尽管可见光与红外融合在提升成像质量和增强环境感知方面已取得了显著进展,但由于两者均属于二维成像手段,仍存在对三维结构和空间深度信息获取不足的问题。为弥补这一短板,研究者逐渐将融合的重点扩展到可见光与激光雷达的融合,以充分利用激光雷达在三维空间建模和高精度测距上的优势。Shaukat等[51]提出将相机与LiDAR融合应用于行星表面建模,强调这种多源互补方式能够在保持纹理细节的同时显著提升深度测量精度和鲁棒性。在此基础上,后续研究将相机-LiDAR融合进一步引入到非合作航天器的在轨姿态测量问题中。Guo等[52]提出了一种双目视觉与3D LiDAR融合的方法,先利用图像特征获取目标的粗略姿态,再结合点云数据进一步优化位姿估计结果,从而克服单一传感器在光照不足或点云稀疏情况下的局限性。在更复杂的在轨服务场景中,Liu等[53]进一步结合深度学习与因子图优化方法,将RGB相机与新型固态LiDAR融合,实现了对接环、太阳帆板、喷管等典型航天器部件的智能识别与定位,特别是在低光照条件下表现出较高的鲁棒性与实时性,为空间机械臂自主在轨组装与维护提供了重要技术支持。
2.2.3 可见光与事件相机融合
可见光与LiDAR的深度感知融合在静态环境和三维重建中表现突出,但在高速运动目标跟踪、低延迟感知和动态场景适应性方面仍存在一定不足。为进一步提升时空分辨率与动态响应性能,国内、外研究人员开始探索可见光与事件相机的动态融合,使系统能够在快速变化和强光照差异的条件下依然保持稳定感知能力。Jawaid等[54]首先提出利用事件数据进行卫星位姿估计,证明了仅基于合成事件数据训练的模型仍然能够应用于真实极端光照环境,从而在一定程度上缓解了虚实迁移(Sim2Real)问题。Le Gentil等[55]针对在轨服务任务的对接场景,比较了RGB相机与事件相机在不同光照与运动条件下的性能,验证了二者的优势互补性,进一步体现了事件相机在空间视觉感知中的应用潜力。此外,考虑到事件相机在低相对运动条件下信噪比低的问题,Jawaid等[56]提出了可见光与事件相机融合方法。该方法通过光学与时间对齐的双通道采集装置,结合RANSAC融合策略与不确定性评估机制,有效结合RGB的高分辨率与事件相机的高动态范围优势,实现了在复杂光照条件下更鲁棒的位姿估计。
表3总结了当前多模态视觉融合增强的典型算法。总体来看,多模态视觉融合技术的发展经历了从二维互补到三维增强,再到动态适应的演进。可见光与红外融合提升了光照与纹理适应性,可见光与激光雷达融合增强了三维建模与定位精度,而可见光与事件相机融合则在高速与强动态场景下展现优势。
表3典型多模态视觉融合增强方法汇总
Tab.3Summary of representative multimodal visual fusion enhancement methods
2.3 多模态视觉位姿估计
近年来,随着计算机视觉与深度学习的迅猛发展,基于视觉的空间位姿估计已成为国内、外研究人员广泛关注的热点。根据多模态视觉融合增强介绍的视觉传感器类型,现有的位姿估计方法也可以划分为5类:基于单目相机、双目相机、RGB-D相机、RGB-Thermal(RGB-T)相机和激光雷达的位姿估计方法。
得益于LiDAR在高精度感知与远距离观测方面的突出性能,基于LiDAR的空间位姿估计方法一直受到各国航天机构的重视,并引发了国内、外研究者的深入研究。Chen等[57]基于LiDAR获取的点云信息进行匹配操作,通过点到平面(point-to-plane)算法细化位姿估计结果,并且构建了一套仿真数据集,验证了所提算法在数据稀疏、部分遮挡等常见空间干扰下具有较优的鲁棒性。Chekakta等[58]设计了一套基于LiDAR的混合式深度递归卷积神经网络(hybrid deep recurrent convolutional neural network,DRCNN),利用CNN从点云获取特征表征,利用长短时记忆(long-short term memory,LSTM)网络进行导航运动估计,模拟了多种场景来验证算法的有效性。Renaut等[59]考虑目标卫星的潜在对称性,选用CNN实现了实时的位姿估计。
伴随着航天器的小型化趋势,单目相机凭借结构紧凑、质量轻、能耗小,以及成本低等优点,逐渐成为空间视觉导航任务的首选。基于单目视觉的空间目标位姿估计方法可细分为基于直接回归的方法以及基于关键点检测的方法,前者通过深度神经网络,实现从图像到位姿参数的端到端回归,但该方法严重依赖大规模训练数据,且在面对复杂背景与目标遮挡时鲁棒性较差。Sharma等[60]提出了航天器姿态网络(spacecraft pose network,SPN),以单目图像作为输入,首次实现了基于神经网络的非合作航天器位姿估计,并且构建了航天器姿态估计数据集(spacecraft pose estimation dataset,SPEED),极大地推进了相关领域的研究。Huang等[61]结合多分支结构的关键点回归子网络与姿态估计子网络,设计了端到端的空间目标位姿估计网络,在多个公开数据集上证明所提方法在尺度变化和地球背景干扰下具有极强鲁棒性,并具备良好的实时性与泛化性。
为克服单目相机位姿估计过程存在的深度丢失等问题,研究人员随后提出了基于双目相机和基于RGB-D相机的视觉位姿估计算法。基于双目相机的位姿估计方法首先借助立体匹配算法重建出目标的稠密点云,再结合点云配准算法完成目标航天器位姿估计。 Li等[62]提出一种基于平行双目相机的非合作航天器位姿估计方法,首先利用非合作目标线特征提取特征点,随后对特征点进行立体匹配与三维重构,最终获得目标相对自身航天器的姿态。然而,基于双目相机的航天器位姿估计方法在实时性方面表现不佳,因此基于RGB-D相机的位姿估计方法引起了国内、外研究人员的关注。该类方法利用RGB-D相机同时获取目标彩色与深度图像,在关键点检测和位姿估计过程中引入深度约束,有效提高了位姿估计的精度与稳定性。Zhang等[63]基于RGB-D相机提出了一种融合点云法向量信息、点云信息与二维灰度信息的姿态估计算法,实现了目标与航天器之间的相对姿态估计,并在地面实验平台上验证了算法的实时性与准确性。
此外,为应对空间环境中剧烈光照变化对位姿估计算法的影响,国内、外研究人员还设计了基于RGB-T相机的空间位姿估计方法。通过RGB-T相机同时获取空间目标的可见光与红外图像,利用多模态信息融合策略提升关键点检测与位姿估计算法的鲁棒性。Rondao等[64]利用LSTM模块处理CNN提取的图像特征,提升端到端回归的位姿估计精度,并且利用RGB-T数据减轻可见光波段成像时的伪影影响。
本文将典型空间目标位姿估计方法汇总于表4。总体来看,各类方法在传感器维度与算法范式上各具侧重:基于LiDAR的算法依托三维几何与时序建模提升鲁棒性,但对初值、算力与投影损失较敏感;单目深度学习算法具备端到端优势,却受数据依赖与可解释性不足的制约;基于双目和RGB-D的算法通过深度约束对抗尺度变化,但在远距离、强反射等工况下稳定性不足;基于RGB-T的算法依靠多模态融合增强极端光照适应性,但对算力需求更为依赖。总体而言,空间视觉位姿估计正朝着多模态、跨任务融合的智能化方向演进。
表4典型空间目标位姿估计方法汇总
Tab.4Summary of representative space object pose estimation methods
3 复杂约束下的空间机械臂轨迹规划
在自主在轨服务过程中,空间机械臂需在自由漂浮基座、强动力学耦合,以及多任务约束等条件下完成目标捕获等操作。这一过程对空间机械臂轨迹规划提出了更高要求,不仅要确保末端执行器的位姿精确性与轨迹可行性,还必须兼顾机械臂与基座的动态耦合、能量与时间限制,以及在轨算力受限条件下的实时性[65]。因此,如何在复杂约束条件下实现高效、稳定且安全的轨迹规划,已成为空间机械臂自主操作的核心研究问题之一。
从算法层面细分,现有轨迹规划方法大致可分为两类:传统方法与基于学习的方法[66]。传统方法包括基于解析模型的轨迹规划与基于优化的轨迹规划,前者依赖动力学与运动学模型推导可行解,后者则通过数值优化在约束条件下寻求近似最优解。基于学习的方法则主要包括模仿学习与深度强化学习(deep reinforcement learning,DRL)。模仿学习作为一种监督式学习策略,通过专家示范或离线数据,获得轨迹生成能力;而深度强化学习则依赖与环境的交互试错过程,逐步逼近复杂环境下的最优轨迹路径。基于此,本文将分别介绍传统方法与基于学习的空间机械臂轨迹规划方法,并探讨其在复杂约束下的适用性及发展趋势。
3.1 传统轨迹规划方法
3.1.1 基于模型的轨迹规划
基于模型的轨迹规划方法以精确的运动学与动力学模型为前提,在自由漂浮状态下显式利用动量守恒及机械臂与基座的耦合特性,建立解析可解的约束方程实现轨迹规划。Umetani等[67]基于动量守恒重新推导了空间机械臂的运动学方程,并提出广义雅可比矩阵(generalized Jacobian matrix,GJM),以实现末端执行器速度到关节速度的非干扰映射,从而在执行任务时尽可能降低对航天器姿态的扰动。随后,研究人员进一步提出了解析运动速度控制(resolved motion rate control,RMRC)与解析加速度控制(resolved acceleration control,RAC)两种控制策略,并通过计算机仿真验证了该方法在自由漂浮基座条件下具有更高的精度与稳定性[68]。然而,由于GJM的时变性,该方法在实时性方面存在不足,进而限制了其在空间任务中的应用。
在GJM的基础上,Yoshida等[69]又提出了零反作用机动(zero reaction maneuver,ZRM)方法。该方法通过带约束的速度求解过程,在末端执行器完成任务的同时,利用机械臂的冗余自由度控制基座反作用力为零,显著提升了在轨操作的安全性。尽管如此,ZRM方法依赖于较高的关节冗余度,当冗余自由度不足时只能部分抵消反作用力,甚至会限制机械臂的可达工作空间。此外,该方法引入了更多奇异性问题[70],导致其应用场景受限。
为进一步简化GJM建模与分析,Vafa等[71]提出了虚拟机械臂(virtual manipulator,VM)方法。该方法将航天器与机械臂系统等效为固定基座虚拟机械臂,将基座自由度与关节自由度合并为虚拟关节向量并构造虚拟雅可比矩阵,使虚拟机械臂末端速度与真实系统保持一致。由此,对空间机械臂的轨迹规划可转化为固定在质心的虚拟机械臂轨迹规划问题,从而显著简化了规划过程的数学形式。沿着上述思路,后续研究者从关节空间约束[72]、奇异点分离[73],以及最小参数表示[74]等方面提出了多种改进方法,有效缓解了空间机械臂在任务执行过程中面临的奇异性问题。这些研究不仅显著提升了基于模型方法在复杂环境下的鲁棒性,也为在轨操作任务中的轨迹规划与控制奠定了坚实的理论基础。
3.1.2 基于优化的轨迹规划方法
尽管基于模型的轨迹规划方法已得到了广泛研究,但其在复杂动力学耦合条件下仍存在建模困难与精度受限等问题。为此,部分学者开始探索对系统模型依赖性较弱甚至无模型依赖的轨迹规划方法,进而逐渐转向基于优化的研究路径。针对动态奇异性对轨迹规划的制约,Wang等[75]提出了一种引入自适应惯性权重约束的粒子群优化(particle swarm optimization,PSO)算法,作为满足特定目标与严格约束条件下的轨迹规划求解器,有效降低了空间机械臂轨迹对奇异点的敏感性。随后,又结合Bézier曲线与零空间列向量来表征关节轨迹,并利用约束差分进化(constrained differential evolution,CDE)算法求解最优轨迹,在7-DoF自由漂浮空间机械臂的仿真中验证了方法的有效性[76]。Chen等[77]进一步探究机械臂轨迹规划与航天器姿态的关系,提出了一种在保证末端执行器到达指定位置的同时,使自由漂浮基座达到预期姿态的轨迹规划算法。该方法将轨迹规划转化为目标优化问题,将关节函数作为优化变量,采用量子遗传算法(quantum genetic algorithm,QGA)进行关节轨迹的求解。在6-DoF仿真系统中,QGA相较于传统遗传算法表现出更快的收敛速度和更优的控制性能。Rybus等[78]构建了轨迹规划与非线性模型预测控制(nonlinear model predictive control,NMPC)相结合的控制体系,其中优化模块生成末端执行器的参考轨迹,NMPC则基于系统非线性动力学预测未来状态,并在有限时域内实时求解优化问题,实现对参考轨迹的高精度跟踪。Shao等[79]基于自适应Radau伪谱法(adaptive radau pseudospectral method,ARPM)将连续动力学方程离散化,将轨迹规划转化为非线性规划问题,有效避免了高阶插值多项式带来的数值不稳定性,提升了计算效率与求解精度。
综上所述,传统轨迹规划方法的研究内容见表5。传统的空间机械臂轨迹规划方法通常对系统动力学与运动学模型有所依赖,尽管在降低基座扰动、提升轨迹精度和稳定性方面取得了显著成果,但其在实时性、复杂环境适应性,以及对系统建模精度的依赖上仍存在不足。因此,研究人员逐渐将关注点转向基于学习的空间机械臂轨迹规划方法,以期在满足复杂约束条件的同时实现更高的自主性与鲁棒性。
表5传统轨迹规划方法研究内容
Tab.5Research content of traditional trajectory planning methods
3.2 基于学习的轨迹规划方法
3.2.1 基于深度强化学习的轨迹规划方法
随着人工智能的快速发展,深度强化学习逐渐成为机器人轨迹规划与控制领域的重要研究方向,并在空间机械臂任务中展现出显著优势。早期的研究多将DRL作为补偿模型不确定性的手段。Senda等[80]通过引入DRL补偿模型误差,提出了一种面向桁架结构组装任务的空间机器人轨迹规划方法,并在数值模拟与气浮台实验中验证了其在插销等典型任务中的有效性。近年来,随着算法研究的深入,无模型的DRL方法逐渐取代传统的轨迹规划方式,直接作为空间机械臂的轨迹规划与控制框架。Hu等[81]基于多约束奖励深度确定性策略梯度(multi-constrained reward deep deterministic policy gradient,MRDDPG)算法提出了自由漂浮基座2-DoF空间机械臂的轨迹规划方法,将障碍物位置编码到状态空间,实现了避障与末端位置精确到达。Du等[82]则利用深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法设计了3-DoF空间机械臂轨迹规划方法,通过“预训练(pre-training)”控制机械臂随机运动收集经验加速算法收敛,在力矩模式下实现了末端位置的准确到达。D’Ambrosio等[83]基于近端策略优化(proximal policy optimization,PPO)算法提出了适用于7-DoF空间机械臂的轨迹规划方法,有效实现了末端执行器与自旋目标间的位姿稳定。Hu等[84]提出了基于深度强化学习的连续位姿表示轨迹规划方法(DRL-based trajectory planning with continuous pose representation,RTPC),选用连续位姿表示代替传统的欧拉角或四元数表示方式,并基于后视经验回放与课程学习构建了混合高效学习架构(hybrid efficient learning framework,HybridEL framework),提升了六自由度机械臂末端位姿到达精度。
除单臂任务外,DRL在更复杂场景中同样具有优异性能。Wu等[85]设计了基于DDPG算法的双臂协同轨迹规划方法,能够在基座固定与自由漂浮模式中控制2条7-DoF机械臂,实现末端执行器的协同位置到达。Hovell等[86]针对航天器捕获任务,提出了一种基于DRL的3-DoF空间机械臂轨迹规划与控制方法,在气浮台完成了对自由漂浮目标的捕获验证。Srivastava等[87]则基于PPO算法设计了联合控制框架,将6-DoF空间机械臂与3-DoF航天器动量轮系统作为整体进行优化,在保持航天器姿态稳定的同时,实现了末端执行器的位姿到达。上述研究充分表明,DRL不仅能够在不依赖精确模型的条件下完成复杂的轨迹规划,还在高阶系统与多任务耦合场景中具有巨大的应用潜力。
3.2.2 基于模仿学习的轨迹规划方法
尽管DRL具有广泛的应用前景,但完全无模型的算法同样存在瓶颈,例如训练周期长、收敛性难以保障、算法可解释性不佳等。为此,基于模仿学习的轨迹规划方法近年来逐渐进入人们视野。这类方法通常通过专家示范或离线数据集直接学习轨迹生成策略,在保证快速收敛的同时,还具备较好的泛化能力。
Ashith Shyam等[88]利用物理模拟器与MPC生成冗余7-DoF空间机械臂的轨迹示范数据,随后将轨迹数据编码为概率运动基元(probabilistic motion primitives,ProMPs)以构建轨迹分布,再利用模仿学习实现轨迹规划任务,根据姿态扰动代价,从多个冗余轨迹中选取对航天器姿态影响最小的轨迹,从而显著减少航天器姿态控制系统负担。随后,Ashith Shyam等[89]进一步推进上述方法,将模仿学习应用于实时轨迹调整,进一步优化空间机械臂系统的能耗与姿态扰动。Ning等[90]针对空间环境的目标抓取任务,设计了一个轻量化、端到端的集成框架(grasp detection and imitation learning,GD-IL),利用目标点云信息生成多个抓取候选区域,同时引入机器人可操控性指标,选取最佳抓取姿态。随后利用二阶动态运动基元(dynamic motion primitives,DMPs)模型,配合高斯混合模型(Gaussian mixture model,GMM)学习示范抓取轨迹,实现实时的目标抓取任务。实验结果表明,GD-IL在实时性、可操作性和抓取成功率上均优于其他算法。
本文将基于学习的轨迹规划方法总结于表6。尽管目前大多数算法的验证仍主要停留在仿真层面,但这些方法通过数据驱动与环境交互不断提升轨迹规划性能,为应对复杂约束条件和高维任务提供了新的解决方案。
表6基于学习的轨迹规划方法研究内容
Tab.6Research content of learning-based trajectory planning methods
4 空间目标柔顺抓取控制
轨迹规划为末端执行器提供了安全可行的运动方案,但进入具体执行阶段,空间机械臂仍面临着复杂场景耦合、不确定扰动,以及非合作目标未知性等挑战,亟须制定相应的运动控制策略予以保障。空间机械臂的控制难点包括对规划轨迹的稳定跟踪与误差抑制,以及末端执行器在接触/交互阶段的精细化调控。鉴于抓取任务在空间操作中的核心地位,本文围绕柔顺抓取任务的控制过程展开,涵盖面向不确定性的抓取前轨迹跟踪控制,接触时的瞬态冲击抑制与力交互控制,以及抓取后的基座-臂-载荷一体化协调控制,以期为在轨任务的安全高效执行提供系统性的技术支撑。
4.1 面向不确定性的自适应抓取策略
在空间环境下执行在轨捕获与柔顺抓取任务时,系统中普遍存在多源不确定性[65]。首先,目标的质量、质心位置,以及惯性参数往往未知或难以准确获取,并且机械臂末端位姿与连杆惯性参数之间存在强耦合关系,这会直接影响到空间机械臂与基座平台之间的动力学耦合建模与控制精度[91]。其次,空间机械臂本体结构的不确定性不可忽视,包括柔性变形、关节间隙以及摩擦等问题,这些因素在操作过程中会导致动力学模型偏差[92]。最后,感知与估计过程同样存在不确定性,传感器误差、装配偏差以及初始动量扰动都会使状态估计产生偏差,进一步影响抓取过程的动态响应[93]。
在空间控制任务中,模型参数不确定性和复杂外部扰动往往难以精确建模。针对这一问题,已有研究提出了不同类型的解决方法。一类方法是基于观测器的扰动抑制技术,包括扰动观测器(disturbance observer,DOB)[94]、噪声观测器(noise observer,NOB)[95]和降噪扰动观测器(noise reduction disturbance observer,NRDOB)[96],这些方法被应用于抑制基座振动和传感器噪声等典型扰动,并通过滤波器优化,提升了惯性参考单元(inertial reference unit,IRU)的鲁棒性和跟踪精度[97]。此外,也有研究将引力场建模误差、参数摄动及外部干扰统一为总扰动,并利用扰动观测器进行在线估计与前馈补偿,从而在轨迹跟踪控制中增强了对不确定性的抑制能力[98]。另一类方法则基于模型预测控制,其优势在于能够在优化框架下处理复杂的状态和输入约束。例如,Dong等[99]提出了管道型鲁棒输出反馈MPC(tube-based robust MPC,TRMPC),在非合作目标自主交会与对接任务中保证了在动力学不确定性、测量误差和执行器偏差等扰动下,依然满足速度和碰撞回避等关键约束。而Sanchez等[100]则提出了基于机会约束的鲁棒MPC方法,将概率约束与扰动在线估计结合,提升了地月L2点近直线晕轨道上交会对接任务的约束满足率与成功率,并兼容脉冲与连续推力模型。随着计算能力的飞速提升以及人工智能技术的发展,深度强化学习在应对复杂与不确定环境时展现出显著优势,尤其在空间目标柔顺抓取控制方面展现出了巨大潜力。Du等[82]利用DDPG算法实现了自由漂浮空间机械臂的自主捕获控制,突破了对精确动力学模型的依赖,并通过预训练机制提升了学习效率和捕获成功率。Liang等[101]针对训练收敛性和稳定性挑战,基于Actor-Critic架构设计了DRL算法并优化了奖励函数,加快了策略收敛并提升了捕获成功率。这些研究共同展示了DRL算法在提升空间机械臂自适应抓取方面的广阔前景。
4.2 接触瞬态的冲击抑制与力交互控制
微重力环境中两体自由漂浮、结构阻尼很低,接触前缺乏法向预压,瞬时冲击经基座与执行机构耦合,易诱发姿态突变、柔性模态激励与反弹,导致捕获失败、接口损伤,以及执行器输出饱和[102-103]。对于末端与环境的交互力,除了直接控制方法,还有间接控制方式。与直接力控制不同,间接力控制并不把力本身作为受控量,而是通过调节位置、速度或表观阻抗来间接实现力的调节。该思路尤其适用于难以高质量测力或需要对外部载荷保持顺应特性的场景。通常可分为两类:阻抗控制与导纳控制。阻抗控制在空间机械臂与环境之间设定期望的质量、阻尼和刚度关系,以整形力与运动的相互作用,提升接触任务的适应性;导纳控制则以外力为输入,生成期望的位姿或速度轨迹,从而实现对交互力的间接调节。
空间机械臂接触瞬态的阻抗控制最早由Hogan等[104]提出,在操作空间为末端设置期望的质量、阻尼与刚度,使受力与位移关系满足被动性[105-106]。其做法是定义一个虚拟机械阻抗(质量、阻尼与刚度),用以整形机械臂对外部广义力的响应;法向宜选取较低至中等刚度并配以临界或过阻尼以实现冲击抑制,切向保持较高刚度以有利于末端对准,并随软捕、对准、硬锁3个阶段逐步调整[107-109]。期望的机械阻抗可表示为
(1)
式中:xd、、分别为期望位置、速度与加速度,Md、Dd、Kd分别为所设定的表观惯量、阻尼与刚度矩阵。阻抗控制通过整形末端等效动力学,在保持与环境顺应交互的前提下,使实际运动逼近期望轨迹。阻抗刻画系统的动态顺应性,其基本思想是通过调节顺应水平来管控交互力,因此合理设计的阻抗参数将显著提升控制性能。
导纳控制与阻抗控制互为对偶。其关键不在直接闭环位置或速度,而在于规定系统对外部广义力的运动响应,即建立外力与期望运动之间的映射关系,常用以通过“运动补偿”实现力调节,因此对位置伺服精度依赖较强[110]。其思想是将机械臂期望的交互行为等效为一个虚拟的导纳系统,通常采用二阶惯量-阻尼-刚度模型,即
(2)
式中:Md、Dd、Kd分别为期望的惯量、阻尼与刚度矩阵,Fext为测得的外力/力矩。求解上述方程得到的x(t)或(t)作为期望轨迹(或速度指令)下发至底层控制器,从而实现对交互力的间接调节。
在方向化接触控制方面,Hashtrudi-zaad等[111]提出了一种并行力/位混合控制策略,通过将接触任务在接触坐标系下解耦为切向与法向两个方向来进行控制。对于切向方向,采用位置跟踪控制,以提供较高的等效刚度;而对于法向方向,则使用力控制策略,以保证系统的柔顺性。此外,研究人员还推导了线性化的闭环模型和实现公式,并给出了在未知环境刚度条件下的稳定性判据以及相应的参数整定指导。面向航天工程应用,Hu等[112]将该类思想落地于空间站机械臂,提出了腕力矩反馈的位置式阻抗控制方案,并给出了离散化实现与参数选取原则。该方法在对接与插拔阶段,沿接口法向采用位置控制以获得高刚度与精度,其余方向采用阻抗控制以限制接触力矩,并通过地面试验证明该方法能够有效约束末端力矩。此外,针对多分支空间航天器的复杂接触作业,Lu等[113]提出了分层被动性框架的“力-位置-构型”协调控制:任务层同时跟踪期望接触力与末端位姿,执行层采用自适应变阻抗在线调节等效刚度与阻尼,并引入能量罐以保证闭环被动性与稳定性,形成适用于在轨复杂操作的一体化方案。
4.3 抓取后基座-臂-载荷一体化协调控制
在空间抓取任务中,基座姿态扰动是由于机械臂运动产生的反作用力引起的,这会影响任务的稳定性和精确性。为减少空间机械臂抓取任务中基座姿态扰动,Huang等[114]提出了动态平衡控制概念,通过平衡臂的协调运动来补偿任务臂引起的基座姿态扰动。Zhang等[115]提出了一种基于反应零空间控制(reaction null space,RNS)的轨迹优化方法,结合粒子群优化算法,实现了基座姿态扰动的最小化。Xu等[116]提出了基于反应零空间控制的协调控制方法,通过优化机械臂的运动配置,确保机械臂运动不会对基座产生反作用力,从而保持基座姿态的稳定。Jiao等[117]提出了一种基于反应力矩的控制方法,针对自由漂浮的空间机械臂系统,研究了如何通过控制反应力矩来最小化卫星基座姿态扰动,并使用RNS方法进行基座姿态调整。
Hu等[118]提出了一种结合输入成形技术和变结构控制(variable structure control,VSC)的方法,用于在航天器执行姿态机动时,实现机械臂末端精确定位和弹性振动抑制,并设计了饱和补偿机制以克服控制输入的饱和问题。该方法通过外部输入成形单元抑制振动,并利用VSC策略在存在外部干扰和参数不确定性的情况下确保系统性能。Kong等[119]提出了一种结合反馈控制和输入成形技术的控制策略,用于在航天器的姿态机动过程中抑制柔性附加物的振动。该方法通过设计多模态输入成形器并结合反馈控制,有效减少了灵活结构的残余振动。Nenchev等[120]提出了一种复合控制法,用于在灵活结构安装的操纵系统中进行末端执行器路径跟踪,利用RNS控制技术消除对基座的干扰,并结合振动抑制控制来提高系统的稳定性。
在太空航天任务中,机械臂完成目标抓取后的整体稳定控制是另一个关键问题。为了应对这一挑战,近年来研究人员提出了多种自适应控制策略,以减小抓取后目标引入的扰动,确保机械臂能够安全、稳定地完成操作任务。由于目标的旋转动量传递可能导致反作用轮饱和,进而影响航天器姿态控制,Wang等[121]设计了一种基于4次Bézier曲线和自适应差分进化(differential evolution,DE)算法的优化路径,用于找到最优的消旋时间和目标的末端状态。该策略考虑了消旋时间和控制力矩,旨在最小化基座的扰动和目标的旋转。此外,还有研究人员考虑了利用多目标粒子群优化(multiple objective particle swarm optimization,MOPSO)算法寻找最优轨迹,从而有效抑制目标的振动并确保机械臂系统的稳定性[122-123]。
本文将空间目标柔顺抓取控制的研究总结于表7。整体来看,相关研究逐渐从依赖精确建模的传统控制方法,向着融合智能算法与自适应机制的方向发展。针对不确定性与外部扰动的研究强调通过观测器、鲁棒优化与学习方法提升系统在复杂环境下的稳定性与适应性;接触瞬态的控制方法则注重在保证抓取精度的同时抑制冲击与力扰动,以提升在轨任务的安全性;同时,抓取后的协调控制则强调机械臂、基座与载荷的整体协同,以实现对姿态扰动与柔性振动的有效抑制。这些进展共同表明,柔顺抓取控制正由单一方法走向多策略融合,并逐步形成面向复杂空间任务的系统化解决方案。
表7空间目标柔顺抓取控制研究概述
Tab.7Research overview of compliant grasping control for space targets
5 挑战与未来展望
5.1 当前技术面临的主要挑战
5.1.1 有限的计算资源与高复杂度任务需求之间的矛盾
无论是多模态视觉融合感知与位姿估计,或者复杂约束下的空间机械臂轨迹规划,亦或是不确定环境中的漂浮目标柔顺抓取控制,这些在轨感知-规划-决策任务通常需要高计算复杂度的算法支持,从而保障空间机械臂系统的自主性与智能化水平。作为代价,此类算法的实时性往往难以得到保障。由于星载计算平台受质量、体积、能耗及散热条件限制,算力资源极为有限,难以满足深度神经网络实时推理、大规模优化求解或预测控制等高计算量任务的需求[124]。这种算力与算法复杂度之间的矛盾,导致在轨应用往往需要在精度与实时性之间进行权衡。如何在受限算力条件下实现轻量化网络设计、模型压缩与加速推理[125],成为推动智能算法在空间任务中实际落地的关键问题。
5.1.2 在轨真实数据缺乏与模型泛化能力之间的矛盾
智能感知-规划-决策算法通常依赖大量优质数据进行训练,以保证模型在复杂环境下的泛化能力[126]。然而,轨道环境下的真实数据获取成本极高,受限于星载传感器类型、实验条件,以及采集手段,现有在轨数据规模十分有限,且往往存在样本不均衡、标注困难和噪声干扰等问题[127]。这种数据匮乏直接制约了模型的训练效果,导致模型在真实任务中可能出现迁移性能下降甚至失效的情况。为了缓解这一矛盾,研究人员常常利用仿真环境生成虚拟数据,以填补部分真实数据缺口。然而,仿真与现实之间仍然存在显著差异,同样会严重干扰模型的泛化性能。如何通过Sim2Real等技术增强模型泛化能力,减少模型训练阶段对真实数据的依赖[128],依然是在轨服务智能化发展亟待解决的重要难题。
5.1.3 多模态感知-规划-控制的实时协同问题
自主在轨服务任务需要将多模态视觉感知、轨迹规划与柔顺控制等环节有机耦合,实现完整的“感知-规划-控制”链路。然而,多模态传感器在采集数据时存在时延与异步问题,融合处理又引入额外的计算开销,使得感知结果难以及时传递到规划层。同时,轨迹规划算法往往需要在动态约束与复杂任务目标下进行高维求解,其输出必须与控制层的执行频率保持一致,否则将导致轨迹跟随误差持续累积,进而导致任务失败。此外,感知噪声与估计不确定性会进一步传递并放大至轨迹规划与控制环节,影响整个系统的安全性[129]。因此,如何在保证精度的前提下,实现实时的跨层级协同,是当前多模态空间机械臂在轨操作面临的关键挑战之一。
5.1.4 空间环境长期运行的可靠性问题
空间机械臂在轨运行周期长、维护困难,必须在真空、强辐射干扰[130]、剧烈温度变化和微陨石冲击等极端条件下保持长期稳定工作。这不仅对传感器与执行机构的抗衰退性提出了更高要求,也对空间机械臂系统的感知-规划-控制算法鲁棒性和容错能力带来挑战[131]。感知-规划-控制系统一旦出现性能退化或异常,可能导致任务失败甚至引发连锁风险。因此,如何在保证精度与效率的同时,提升硬件设备耐久性与软件系统容错性,是实现自主在轨服务的关键保障[132]。
5.2 自主在轨服务系统的未来发展趋势
面向自主在轨服务的空间机械臂系统,其未来发展必将呈现出硬件、算法与系统全栈协同演进的局面。
1)在硬件层面,NPU、TPU等智能计算单元的出现,将显著提升星载平台的算力与能效比,实现复杂感知规划算法的实时在轨运行。同时,智能化传感器与多模态传感器一体化集成系统的发展将逐步取代传统的单功能传感器,实现多模态信息的原位采集与初步融合,降低信息传输与处理的延迟,并提升空间机械臂系统的鲁棒性与紧凑性。
2)在算法层面,模型轻量化与高效推理技术将成为未来的核心方向,更加精简高效的网络模型有望在受限算力条件下实现高速准确推理。跨模态自监督学习框架能够为多源感知数据构建统一表征,在缺乏大规模标注样本的空间任务环境中保障系统的泛化能力。此外,具身智能的引入将使轨迹规划与任务执行更加贴近实际物理环境,推动空间机械臂从“离线学习”向“在轨自主演化”转变。
3)在系统层面,“感知-规划-控制”一体化的端到端架构将成为重要发展方向,有望突破传统分层式设计在实时性、协调性和鲁棒性上的局限,推动系统从局部最优向全局最优演化。同时,数字孪生技术将在高保真仿真与任务决策中发挥关键作用。通过地面站与在轨卫星之间的高保真数字孪生模型,系统能够实现任务场景的精确预测、在轨异常的快速诊断与定位,以及任务策略的动态优化与迭代,从而显著提升空间机械臂在轨服务的自主性与可靠性。
6 结论
作为自主在轨服务的重要工具,空间机械臂凭借其高自由度与卓越的灵活操作性,搭配多样化的末端执行机构,近年来成为承载复杂空间任务的核心系统。与此同时,复杂环境的不确定性与空间动力学约束也对空间机械臂系统的自主化与智能化提出了更为严苛的要求,集中表现为更稳健的环境感知、更高效的在线规划以及更安全的抓取控制。本文以“感知-规划-控制”为逻辑主线,对空间机械臂自主在轨服务相关的核心技术进行了全面的综述。研究的主要结论如下:
1)多模态视觉感知是实现空间机械臂自主在轨服务的关键基础。结合现有研究进展,可以发现可见光、红外、激光雷达、立体相机与事件相机等多模态传感器各有优势与局限性,面向任务的传感器选型对于提升系统性能至关重要。在算法层面,基于深度学习的多模态融合增强可以有效整合多源信息,弥补单一传感器的不足,从而在复杂工况下提升感知能力。与此同时,视觉位姿估计作为空间机械臂轨迹规划与抓取的前置环节,正在由传统的几何范式向“几何-学习”融合的方向演进。这一演化趋势在显著提升算法鲁棒性与环境适应性的同时,也为研究人员带来新的难题:一方面,在轨高质量训练数据稀缺,如何获取优质的训练数据成为制约学习算法性能的一大难点;另一方面,由于星载平台的算力限制,构建轻量化的神经网络模型成为空间任务实际部署的关键前提。总体来看,任务化的传感器选型、智能化的融合算法以及鲁棒高精度的位姿估计方法,共同构成多模态视觉感知技术的主要发展方向。
2)复杂动力学约束下的轨迹规划是空间机械臂安全稳定运行的重要支撑。空间机械臂轨迹规划从简单任务迈向复杂任务,从低自由度转为高自由度,从单机械臂轨迹规划扩展为多机械臂与航天器基座的协同规划,已成为重要的发展趋势。在此过程中,基于学习的算法凭借数据驱动的无模型特性与自适应的泛化能力,正成为空间机械臂轨迹规划的重要途径。与此同时,基于学习的方法也带来了可解释性不足、安全性与可达性难以形式化验证等新问题。此外,随着任务复杂度的提升,现有的空间环境地面模拟装置在场景覆盖、物理逼真度与实验可靠性等方面的局限日益显现,在学习方法的训练与评估上尤为突出。因此,推进学习算法与现有不完备模型的深度融合,扩展虚拟仿真平台与地面模拟装置的验证能力,已成为当前空间轨迹规划技术亟待解决的关键难题。
3)空间目标柔顺抓取控制是保障空间机械臂在轨服务安全与稳定的关键环节,涵盖自适应抓取、冲击抑制与整体协调3个方面。在不确定性条件下,扰动观测器、鲁棒MPC和深度强化学习等方法提升了对参数未知与外部扰动的适应能力,为自适应抓取提供了可行方案。在接触瞬态控制中,阻抗控制、导纳控制及力/位混合控制能够根据任务阶段动态调节系统顺应性,有效降低冲击力与姿态扰动,增强了在轨操作的安全性与可靠性。在抓取后的系统整体协调中,反应零空间控制、输入整形与复合控制策略显著减小了基座姿态扰动并抑制柔性振动,同时,基于优化与智能算法的轨迹规划方法进一步提升了消旋与稳定控制能力。总体而言,空间柔顺抓取控制正由传统解析方法向智能化、自适应与多目标优化方向演进,是当前空间抓取控制的重要研究方向。

