空间机械臂多模态视觉感知与操作技术综述
doi: 10.11918/202509050
胡瑀晖1 , 吴立刚1 , 陈建国1,2 , 张栎文1 , 张钊1 , 孙赫远1 , 周栋1,3
1. 自主智能无人系统工信部重点实验室(哈尔滨工业大学),哈尔滨 150001
2. 航天时代飞鸿技术有限公司,北京 100094
3. 香港中文大学 机械与自动化工程系,香港 999077
基金项目: 国家自然科学基金青年科学基金(62403162)
Review of multimodal visual perception and manipulation technologies for space manipulator
HU Yuhui1 , WU Ligang1 , CHEN Jianguo1,2 , ZHANG Liwen1 , ZHANG Zhao1 , SUN Heyuan1 , ZHOU Dong1,3
1. Key Lab of Autonomous Intelligent Unmanned Systems (Harbin Institute of Technology), Ministry of Industry and Information Technology, Harbin 150001 , China
2. Aerospace Times FeiHong Technology Company Limited, Beijing 100094 , China
3. Department of Mechanical and Automation Engineering (The Chinese University of Hong Kong), Hong Kong 999077 , China
摘要
为研究空间机械臂多模态视觉感知与操作的发展现状及亟须解决的关键技术难题,对目前该领域的文献进行了分析与总结。多模态视觉感知是指融合可见光、红外、深度相机与激光雷达等异构传感器及多源数据形式实现的视觉感知方式,空间操作是指面向在轨任务,利用机械臂等执行机构实施接近、抓取、装配与维护等作业的过程。首先,回顾了目前国内、外已服役的典型空间机械臂系统,总结其发展脉络与应用特点。其次,文中以“感知-规划-控制”为主线,系统梳理了自主在轨服务所需的3项关键技术:一是多模态视觉感知技术,重点介绍多源异构数据融合以及多模态视觉位姿估计技术;二是复杂约束下的轨迹规划技术,涵盖基于模型、优化与学习的空间机械臂轨迹规划方法,并探讨其在自由漂浮基座和强耦合动力学条件下的适用性;三是面向漂浮运动目标的柔顺抓取技术,以保障操作过程中的安全性。最后,总结了当前空间机械臂在自主在轨服务中面临的计算资源受限、在轨数据匮乏、多模态协同困难,以及运行生命周期短等核心挑战,并展望了其在硬件、算法与系统层面的未来发展趋势。研究表明:空间机械臂的自主在轨服务技术尚未成熟,关键技术环节与应用落地存在多处瓶颈,多模态视觉传感器与智能图像处理算法、基于学习的轨迹规划与柔顺抓取控制,将成为提升空间机械臂自主性能的核心发展方向。
Abstract
To investigate the current development of multimodal visual perception and manipulation for space manipulators and the pressing technical challenges, this paper conducts an analysis and summary of the existing literatures. Multimodal visual perception refers to a vision approach that integrates heterogeneous sensors and multi-source data, including visible, infrared, depth cameras, and LiDAR. Space manipulation is on-orbit activities conducted with robotic manipulators and other actuators, encompassing approach, grasping, assembly, and maintenance. This paper first reviews representative space manipulator systems that have been deployed domestically and internationally, summarizing their developmental path and application characteristics. Building on this foundation, we adopt a perception-planning-control framework to systematically review three technologies essential for autonomous on-orbit servicing. We first address multimodal visual perception, focusing on heterogeneous data fusion and multimodal pose estimation. We then examine trajectory planning under complex constraints, covering model-based, optimization-based, and learning-based methods and their applicability to free-floating bases and strongly coupled dynamics. Last, we discuss compliant grasping for free-floating moving targets to ensure operational safety. Finally, the paper highlights major challenges faced by space manipulators in autonomous on-orbit servicing, including limited onboard computational resources, scarcity of on-orbit data, difficulties in multimodal coordination, and the need for long-term reliability. Future directions are then outlined from the perspectives of hardware, algorithms, and system-level integration. Research indicates that autonomous on-orbit servicing for space manipulators is still immature, with multiple bottlenecks persisting in key technical components and practical deployment. Advances in multimodal vision, learning-based trajectory planning, and compliant grasping control will be critical to enhancing autonomous performance.
1 空间机械臂概述
1.1 研究背景与意义
随着航天技术的不断发展,空间任务逐渐从一次性、任务驱动型的单次发射运行模式向长期在轨运行、可重复利用以及可持续服务的方向转变。在轨服务(on-orbit servicing,OOS)作为延长航天器生命周期、提升任务灵活性、推动循环空间经济发展的重要手段,近年来逐渐成为各国航天战略的核心关注方向[1-3]。在实际在轨服务中,空间机械臂因其自由度高、通用性强、操作灵活等优势,被广泛应用于故障维修、辅助展开、燃料加注、目标捕获等多种典型场景[4-6]。空间机械臂的操作涵盖多个任务导向的子环节,但无论任务形态如何改变,其最终实现都要依托具体的技术支撑[7]。因此,空间机械臂的操作过程可以细分为轨迹规划与抓取控制两个核心阶段:前者侧重于在复杂动力学约束环境下生成安全可行的运动方案,后者则聚焦于通过自适应、柔顺、力-位混合等多种控制策略完成对空间目标的具体操纵。
为应对日益复杂的在轨作业需求,空间机械臂的操控模式经历了从完全遥操作到局部自主操作,再到全局自主操作的演变。与此同时,伴随着多源高精度传感器的快速发展,人工智能与深度学习技术的兴起以及空间算力平台的持续提升[8-10],面向在轨服务的空间机械臂系统逐渐朝着融合多模态感知与实时智能决策的方向发展。这一趋势不仅被视为推动在轨服务由“半自主”迈向“全自主”的关键支撑技术,也受到越来越多国家与科研机构的高度重视。
1.2 国内、外研究现状概述
1981年11月,加拿大航天局(Canadian Space Agency,CSA)与MDA Space公司研制的航天飞机遥控机械臂系统(shuttle remote manipulator system,SRMS,即“加拿大臂1号”,Canadarm-1)随哥伦比亚号航天飞机首次入轨,成为全球首个成功应用的在轨操作机器人,承担了卫星捕获与释放、国际空间站建设以及舱外作业辅助等任务[11]。直至2011年退役,SRMS共完成90次空间任务。在此基础上,CSA又研制了应用于国际空间站的移动服务系统(mobile servicing system,MSS,即“加拿大臂2号”,Canadarm-2)。该系统由空间站遥控机械臂(space station remote manipulator system,SSRMS)、移动基座(mobile base system,MBS),以及灵巧机械臂(special purpose dexterous manipulator,SPDM)组成[12]。目前,CSA与MDA Space公司还在推进“加拿大臂3号”的研制,以支持美国月球轨道平台Gateway项目的开展[13]。除加拿大外,欧洲航天局(European Space Agency,ESA)研制的欧洲机械臂(European Robotic Arm,ERA)[14]和日本宇宙航空研究开发机构(Japan Aerospace Exploration Agency,JAXA)研制的日本实验舱机械臂(Japanese Experiment Module Remote Manipulator System,JEMRMS)[15],也分别部署在国际空间站的俄罗斯舱与日本舱外。
除了部署在空间站的机械臂系统外,还有若干部署在航天器的机械臂系统承担了不同种类的在轨任务。1997年,JAXA前身之一的日本宇宙开发事业团(National Space Development Agency of Japan,NASDA)制造的技术试验卫星7号(engineering test satellite VII,ETS-VII),搭载了一台6自由度(6-DoF)的空间机械臂(ETS-VII Arm)成功升空,成为首颗配备机械臂的人造卫星[16],完成了包括插销入孔、滑动把手在内的在轨操作试验[17]。2007年,美国国防高级研究计划局(Defense Advanced Research Projects Agency,DARPA)牵头研制的“轨道快车”系统(orbital express system,OES)携带1台6-DoF的自主空间运输机器人操作机械臂(autonomous space transport robotic operations arm,ASTRO-Arm)顺利入轨,成功完成燃料输送、电池更换等验证目标[18]
中国对空间机械臂技术的研究始于20世纪80年代。中国空间技术研究院自2005年起系统性地开展了空间机械臂的相关研究,2008年完成了6-DoF机械臂原理样机,随后布局7-DoF机械臂的研制,使中国在该领域逐步跻身国际先进行列[19]。2021年,中国空间站核心舱机械臂(core module manipulator,CMM)随“天和”核心舱入轨[20];2022年,中国空间站实验舱机械臂(experiment module manipulator,EMM)随“问天”号发射顺利入轨[21],共同构成了中国空间站遥控机械臂系统(Chinese space station remote manipulator system,CSSRMS)。目前,该系统已完成航天员出舱托举、空间站辅助对接等多项技术验证,展现出优异性能与应用潜力[22]。典型的国内、外空间机械臂系统如图1所示,同时,本文将它们的具体性能对比汇总于表1
1国内、外空间机械臂系统
Fig.1Domestic and international space manipulator systems
1典型空间机械臂系统的比较
Tab.1Comparison of typical space manipulator systems
1.3 本文的组织架构
本文从空间机械臂在轨服务应用出发,以自主在轨服务的空间机械臂关键技术为主线,按照“感知-规划-控制”的逻辑链,围绕在轨操作中的多模态视觉感知技术、复杂约束下的空间机械臂轨迹规划技术,以及面向漂浮运动目标的柔顺抓取技术展开,并于最后对自主在轨服务的现有关键挑战与未来发展趋势进行展望。本文的组织架构见图2
2本文的组织架构
Fig.2Organization structure of this paper
2 面向在轨操作的多模态视觉感知
空间视觉感知技术作为自主在轨服务的前提,面临着与地面应用显著不同的多重挑战[23-26]。首先,空间极端环境严重影响光学成像的稳定性。强烈光照会带来过曝与眩光效应,弱光和阴影区域又会导致图像细节缺失,而复杂行星背景则会进一步降低视觉系统的感知精度。其次,空间目标的非合作特性也为感知任务带来了阻碍。由于缺乏先验信息,难以提取稳定的特征点,加上空间目标广泛存在的高反射与低纹理特性,进一步限制了基于视觉的目标位姿估计准确度。
面对上述问题,单一传感器往往难以应对复杂场景需求,多模态空间视觉感知技术应运而生[27]。然而,多源异构视觉数据融合带来了全新的研究难题,不同模态之间在时空同步、坐标系转换、分辨率统一,以及数据格式匹配等方面存在差异,对在轨图像融合与处理能力提出了更高要求。综上所述,空间环境视觉感知不仅要应对极端空间环境与非合作目标特性的双重制约,还必须在多模态协同与异构数据融合之间取得平衡,才能为在轨操作提供可靠稳健的技术支撑。
2.1 多模态视觉传感器分析
近年来,受计算机视觉与深度学习迅猛发展的影响,空间多模态视觉感知方法获得了国内、外研究者的广泛关注。空间视觉感知方法根据其依赖的视觉传感器类型可分为单目相机、双目相机、RGB-Depth(RGB-D)相机、红外相机,以及激光雷达(LiDAR)5类。在实际应用部署时,各国航天局往往会根据任务需求以及各种视觉传感器的特性选择合适的视觉感知方案。典型视觉传感器在空间感知任务下的特性见表2
2典型视觉传感器在空间感知任务下的特性
Tab.2Characteristics of typical vision sensors for space perception tasks
传统的可见光相机在适宜的光照条件下能够实现毫米级的定位精度,但对于在轨服务中广泛存在的目标遮挡和光照变化,基于可见光的图像处理算法效率较差,甚至可能出现定位盲区。针对这些问题,西北工业大学的赵迪等[28]采用Hough变换特征提取算法,将图像处理效率提升了约30%。中国科学院大学的施琦[29]利用深度神经网络在目标检测方面的优越性能,实现了基于可见光相机的高效空间目标识别,增强了实时性的同时,显著提高了对暗弱目标的检测能力。马兰[30]选用可见光相机为空间机械臂提供实时视觉反馈,辅助实现如捕获失效卫星、更换在轨模块等遥操作任务。该方法通过构建目标的三维模型并叠加增强视觉信息,有效提升了空间机械臂操作的精度与可靠性。
可见光相机的成像质量极易受到空间极端光照变化的影响,相比之下,红外相机能够利用目标热辐射进行特征识别,具备全天候工作的优势。即使在强动态光照下红外相机仍能够保持较高的视觉感知稳定性,大幅提升了航天器在暗区的目标识别率[31]。因此,各国航天局已开始将红外相机应用于空间任务。例如,2012年欧洲航天局成功发射了水星探测器BepiColombo[32],验证了红外相机在极端光照环境下具备鲁棒的位姿测量能力。2019年中国吉林一号光谱卫星搭载了短波和长波红外相机,成功完成了对目标船舶光学特征的识别任务[33]。然而,由于红外相机空间分辨率较低、硬件成本较高,所以无法在各国航天器的在轨服务任务中大规模应用。
相较之下,激光雷达凭借更高的测量精度和抗干扰能力,逐渐成为航天机构青睐的空间视觉传感器。2022年,赵梓良等[34]基于激光雷达对柔性航天器开展了仿真研究,验证了激光雷达对自由翻滚目标姿态估计的精度,成功满足了实际工程应用需求。He等[35]提出了基于点云特征的非合作目标位姿跟踪方法,有效实现了非合作目标位置和姿态的实时跟踪。然而,激光雷达价格昂贵且功耗较高,在航天器小型化的发展趋势下,其应用受到了非常大的制约。
为了兼顾精度与成本,立体相机逐渐成为各国新的研究重点。2021年,朱凌超[36]提出了一种基于立体相机视觉的非合作目标特征提取方法,在弱光环境实现了空间目标三维重构,并将重构误差降低了40%,为空间碎片捕获提供毫米级定位精度。2025年,Zhang等[37]进一步研究了立体视觉相机在近距离场景下的应用,大幅降低了10 m以内非合作目标的定位误差,其弱光环境下的自适应特征提取成功率超过90%。
此外,随着事件相机的发展,近年来事件相机与深度学习方法的结合也成为各国航天局重点研究的方向。Ussa等[38]提出了一种基于事件相机的空间碎片跟踪方法,通过卷积神经网络(convolutional neural network,CNN)的时空聚合能力,实现了空间碎片的非线性运动预测,在高动态环境下将跟踪延迟控制在10 ms以内,显著提升了跟踪精度与响应速度。该方法能够提取多频特征并适应极端光照条件,为在轨空间碎片监测提供了智能化解决方案。
2.2 多模态视觉融合增强
当前,基于单一传感器的空间视觉感知系统面临着感知精度低、环境适应能力弱等问题。因此,为了提升航天器观测数据的可辨识性,近年来国内、外研究人员对多模态视觉融合增强技术进行了广泛深入的研究。典型的融合方案包括可见光与红外成像的互补融合、可见光与激光雷达的深度感知融合,以及可见光与事件相机的动态信息融合等。
2.2.1 可见光与红外融合
目前,可见光与红外图像融合方法主要分为传统方法和基于深度学习的方法。其中,传统方法包括多尺度变换与稀疏表示。多尺度变换通过将源图像映射至不同尺度空间进行特征提取与融合,再进行图像重建,常见方法有离散小波变换[39]、曲波变换[40]、非下采样轮廓波变换[41]和金字塔变换[42-43]。稀疏表示则假设源图像可在过完备字典下进行稀疏分解,通过融合稀疏系数并结合字典重建实现图像融合[44]。尽管两类方法各具特色,但普遍存在适应性不足的问题。
相比之下,深度学习方法凭借强大的特征表征与自适应能力,逐渐成为图像融合研究的主流方向。2017年, Prabhakar等[45]提出了DeepFuse网络,其核心思想是通过编码器提取特征并利用解码器生成融合图像。在DeepFuse的基础上,Li等[46]提出了DenseFuse网络,DenseFuse引入了密集连接块(dense block),通过增加卷积层之间的特征传输通道,大幅提升了网络的特征表达能力。随着视觉变换器(vision transformer,ViT)[47]的提出,Transformer在视觉领域得到了越来越广泛的应用。Vs等[48]提出了一种新的融合方法,称为图像融合Transformer(image fusion transformer,IFT),它利用局部信息和远程模型依赖来克服图像融合中缺乏全局上下文理解的问题。Qu等[49]设计了一个将CNN模块与Transformer模块相结合的编码器TransMEF。该编码器结合了CNN和Transformer的优势,融合效果较好,但特征融合策略需要人为设置,无法完全适应复杂场景。由Ma等[50]提出的SwinFusion融合方法能够充分利用SwinTransformer的特殊架构,实现了高效可见光与红外图像特征的融合。
2.2.2 可见光与激光雷达融合
尽管可见光与红外融合在提升成像质量和增强环境感知方面已取得了显著进展,但由于两者均属于二维成像手段,仍存在对三维结构和空间深度信息获取不足的问题。为弥补这一短板,研究者逐渐将融合的重点扩展到可见光与激光雷达的融合,以充分利用激光雷达在三维空间建模和高精度测距上的优势。Shaukat等[51]提出将相机与LiDAR融合应用于行星表面建模,强调这种多源互补方式能够在保持纹理细节的同时显著提升深度测量精度和鲁棒性。在此基础上,后续研究将相机-LiDAR融合进一步引入到非合作航天器的在轨姿态测量问题中。Guo等[52]提出了一种双目视觉与3D LiDAR融合的方法,先利用图像特征获取目标的粗略姿态,再结合点云数据进一步优化位姿估计结果,从而克服单一传感器在光照不足或点云稀疏情况下的局限性。在更复杂的在轨服务场景中,Liu等[53]进一步结合深度学习与因子图优化方法,将RGB相机与新型固态LiDAR融合,实现了对接环、太阳帆板、喷管等典型航天器部件的智能识别与定位,特别是在低光照条件下表现出较高的鲁棒性与实时性,为空间机械臂自主在轨组装与维护提供了重要技术支持。
2.2.3 可见光与事件相机融合
可见光与LiDAR的深度感知融合在静态环境和三维重建中表现突出,但在高速运动目标跟踪、低延迟感知和动态场景适应性方面仍存在一定不足。为进一步提升时空分辨率与动态响应性能,国内、外研究人员开始探索可见光与事件相机的动态融合,使系统能够在快速变化和强光照差异的条件下依然保持稳定感知能力。Jawaid等[54]首先提出利用事件数据进行卫星位姿估计,证明了仅基于合成事件数据训练的模型仍然能够应用于真实极端光照环境,从而在一定程度上缓解了虚实迁移(Sim2Real)问题。Le Gentil等[55]针对在轨服务任务的对接场景,比较了RGB相机与事件相机在不同光照与运动条件下的性能,验证了二者的优势互补性,进一步体现了事件相机在空间视觉感知中的应用潜力。此外,考虑到事件相机在低相对运动条件下信噪比低的问题,Jawaid等[56]提出了可见光与事件相机融合方法。该方法通过光学与时间对齐的双通道采集装置,结合RANSAC融合策略与不确定性评估机制,有效结合RGB的高分辨率与事件相机的高动态范围优势,实现了在复杂光照条件下更鲁棒的位姿估计。
表3总结了当前多模态视觉融合增强的典型算法。总体来看,多模态视觉融合技术的发展经历了从二维互补到三维增强,再到动态适应的演进。可见光与红外融合提升了光照与纹理适应性,可见光与激光雷达融合增强了三维建模与定位精度,而可见光与事件相机融合则在高速与强动态场景下展现优势。
3典型多模态视觉融合增强方法汇总
Tab.3Summary of representative multimodal visual fusion enhancement methods
2.3 多模态视觉位姿估计
近年来,随着计算机视觉与深度学习的迅猛发展,基于视觉的空间位姿估计已成为国内、外研究人员广泛关注的热点。根据多模态视觉融合增强介绍的视觉传感器类型,现有的位姿估计方法也可以划分为5类:基于单目相机、双目相机、RGB-D相机、RGB-Thermal(RGB-T)相机和激光雷达的位姿估计方法。
得益于LiDAR在高精度感知与远距离观测方面的突出性能,基于LiDAR的空间位姿估计方法一直受到各国航天机构的重视,并引发了国内、外研究者的深入研究。Chen等[57]基于LiDAR获取的点云信息进行匹配操作,通过点到平面(point-to-plane)算法细化位姿估计结果,并且构建了一套仿真数据集,验证了所提算法在数据稀疏、部分遮挡等常见空间干扰下具有较优的鲁棒性。Chekakta等[58]设计了一套基于LiDAR的混合式深度递归卷积神经网络(hybrid deep recurrent convolutional neural network,DRCNN),利用CNN从点云获取特征表征,利用长短时记忆(long-short term memory,LSTM)网络进行导航运动估计,模拟了多种场景来验证算法的有效性。Renaut等[59]考虑目标卫星的潜在对称性,选用CNN实现了实时的位姿估计。
伴随着航天器的小型化趋势,单目相机凭借结构紧凑、质量轻、能耗小,以及成本低等优点,逐渐成为空间视觉导航任务的首选。基于单目视觉的空间目标位姿估计方法可细分为基于直接回归的方法以及基于关键点检测的方法,前者通过深度神经网络,实现从图像到位姿参数的端到端回归,但该方法严重依赖大规模训练数据,且在面对复杂背景与目标遮挡时鲁棒性较差。Sharma等[60]提出了航天器姿态网络(spacecraft pose network,SPN),以单目图像作为输入,首次实现了基于神经网络的非合作航天器位姿估计,并且构建了航天器姿态估计数据集(spacecraft pose estimation dataset,SPEED),极大地推进了相关领域的研究。Huang等[61]结合多分支结构的关键点回归子网络与姿态估计子网络,设计了端到端的空间目标位姿估计网络,在多个公开数据集上证明所提方法在尺度变化和地球背景干扰下具有极强鲁棒性,并具备良好的实时性与泛化性。
为克服单目相机位姿估计过程存在的深度丢失等问题,研究人员随后提出了基于双目相机和基于RGB-D相机的视觉位姿估计算法。基于双目相机的位姿估计方法首先借助立体匹配算法重建出目标的稠密点云,再结合点云配准算法完成目标航天器位姿估计。 Li等[62]提出一种基于平行双目相机的非合作航天器位姿估计方法,首先利用非合作目标线特征提取特征点,随后对特征点进行立体匹配与三维重构,最终获得目标相对自身航天器的姿态。然而,基于双目相机的航天器位姿估计方法在实时性方面表现不佳,因此基于RGB-D相机的位姿估计方法引起了国内、外研究人员的关注。该类方法利用RGB-D相机同时获取目标彩色与深度图像,在关键点检测和位姿估计过程中引入深度约束,有效提高了位姿估计的精度与稳定性。Zhang等[63]基于RGB-D相机提出了一种融合点云法向量信息、点云信息与二维灰度信息的姿态估计算法,实现了目标与航天器之间的相对姿态估计,并在地面实验平台上验证了算法的实时性与准确性。
此外,为应对空间环境中剧烈光照变化对位姿估计算法的影响,国内、外研究人员还设计了基于RGB-T相机的空间位姿估计方法。通过RGB-T相机同时获取空间目标的可见光与红外图像,利用多模态信息融合策略提升关键点检测与位姿估计算法的鲁棒性。Rondao等[64]利用LSTM模块处理CNN提取的图像特征,提升端到端回归的位姿估计精度,并且利用RGB-T数据减轻可见光波段成像时的伪影影响。
本文将典型空间目标位姿估计方法汇总于表4。总体来看,各类方法在传感器维度与算法范式上各具侧重:基于LiDAR的算法依托三维几何与时序建模提升鲁棒性,但对初值、算力与投影损失较敏感;单目深度学习算法具备端到端优势,却受数据依赖与可解释性不足的制约;基于双目和RGB-D的算法通过深度约束对抗尺度变化,但在远距离、强反射等工况下稳定性不足;基于RGB-T的算法依靠多模态融合增强极端光照适应性,但对算力需求更为依赖。总体而言,空间视觉位姿估计正朝着多模态、跨任务融合的智能化方向演进。
4典型空间目标位姿估计方法汇总
Tab.4Summary of representative space object pose estimation methods
3 复杂约束下的空间机械臂轨迹规划
在自主在轨服务过程中,空间机械臂需在自由漂浮基座、强动力学耦合,以及多任务约束等条件下完成目标捕获等操作。这一过程对空间机械臂轨迹规划提出了更高要求,不仅要确保末端执行器的位姿精确性与轨迹可行性,还必须兼顾机械臂与基座的动态耦合、能量与时间限制,以及在轨算力受限条件下的实时性[65]。因此,如何在复杂约束条件下实现高效、稳定且安全的轨迹规划,已成为空间机械臂自主操作的核心研究问题之一。
从算法层面细分,现有轨迹规划方法大致可分为两类:传统方法与基于学习的方法[66]。传统方法包括基于解析模型的轨迹规划与基于优化的轨迹规划,前者依赖动力学与运动学模型推导可行解,后者则通过数值优化在约束条件下寻求近似最优解。基于学习的方法则主要包括模仿学习与深度强化学习(deep reinforcement learning,DRL)。模仿学习作为一种监督式学习策略,通过专家示范或离线数据,获得轨迹生成能力;而深度强化学习则依赖与环境的交互试错过程,逐步逼近复杂环境下的最优轨迹路径。基于此,本文将分别介绍传统方法与基于学习的空间机械臂轨迹规划方法,并探讨其在复杂约束下的适用性及发展趋势。
3.1 传统轨迹规划方法
3.1.1 基于模型的轨迹规划
基于模型的轨迹规划方法以精确的运动学与动力学模型为前提,在自由漂浮状态下显式利用动量守恒及机械臂与基座的耦合特性,建立解析可解的约束方程实现轨迹规划。Umetani等[67]基于动量守恒重新推导了空间机械臂的运动学方程,并提出广义雅可比矩阵(generalized Jacobian matrix,GJM),以实现末端执行器速度到关节速度的非干扰映射,从而在执行任务时尽可能降低对航天器姿态的扰动。随后,研究人员进一步提出了解析运动速度控制(resolved motion rate control,RMRC)与解析加速度控制(resolved acceleration control,RAC)两种控制策略,并通过计算机仿真验证了该方法在自由漂浮基座条件下具有更高的精度与稳定性[68]。然而,由于GJM的时变性,该方法在实时性方面存在不足,进而限制了其在空间任务中的应用。
在GJM的基础上,Yoshida等[69]又提出了零反作用机动(zero reaction maneuver,ZRM)方法。该方法通过带约束的速度求解过程,在末端执行器完成任务的同时,利用机械臂的冗余自由度控制基座反作用力为零,显著提升了在轨操作的安全性。尽管如此,ZRM方法依赖于较高的关节冗余度,当冗余自由度不足时只能部分抵消反作用力,甚至会限制机械臂的可达工作空间。此外,该方法引入了更多奇异性问题[70],导致其应用场景受限。
为进一步简化GJM建模与分析,Vafa等[71]提出了虚拟机械臂(virtual manipulator,VM)方法。该方法将航天器与机械臂系统等效为固定基座虚拟机械臂,将基座自由度与关节自由度合并为虚拟关节向量并构造虚拟雅可比矩阵,使虚拟机械臂末端速度与真实系统保持一致。由此,对空间机械臂的轨迹规划可转化为固定在质心的虚拟机械臂轨迹规划问题,从而显著简化了规划过程的数学形式。沿着上述思路,后续研究者从关节空间约束[72]、奇异点分离[73],以及最小参数表示[74]等方面提出了多种改进方法,有效缓解了空间机械臂在任务执行过程中面临的奇异性问题。这些研究不仅显著提升了基于模型方法在复杂环境下的鲁棒性,也为在轨操作任务中的轨迹规划与控制奠定了坚实的理论基础。
3.1.2 基于优化的轨迹规划方法
尽管基于模型的轨迹规划方法已得到了广泛研究,但其在复杂动力学耦合条件下仍存在建模困难与精度受限等问题。为此,部分学者开始探索对系统模型依赖性较弱甚至无模型依赖的轨迹规划方法,进而逐渐转向基于优化的研究路径。针对动态奇异性对轨迹规划的制约,Wang等[75]提出了一种引入自适应惯性权重约束的粒子群优化(particle swarm optimization,PSO)算法,作为满足特定目标与严格约束条件下的轨迹规划求解器,有效降低了空间机械臂轨迹对奇异点的敏感性。随后,又结合Bézier曲线与零空间列向量来表征关节轨迹,并利用约束差分进化(constrained differential evolution,CDE)算法求解最优轨迹,在7-DoF自由漂浮空间机械臂的仿真中验证了方法的有效性[76]。Chen等[77]进一步探究机械臂轨迹规划与航天器姿态的关系,提出了一种在保证末端执行器到达指定位置的同时,使自由漂浮基座达到预期姿态的轨迹规划算法。该方法将轨迹规划转化为目标优化问题,将关节函数作为优化变量,采用量子遗传算法(quantum genetic algorithm,QGA)进行关节轨迹的求解。在6-DoF仿真系统中,QGA相较于传统遗传算法表现出更快的收敛速度和更优的控制性能。Rybus等[78]构建了轨迹规划与非线性模型预测控制(nonlinear model predictive control,NMPC)相结合的控制体系,其中优化模块生成末端执行器的参考轨迹,NMPC则基于系统非线性动力学预测未来状态,并在有限时域内实时求解优化问题,实现对参考轨迹的高精度跟踪。Shao等[79]基于自适应Radau伪谱法(adaptive radau pseudospectral method,ARPM)将连续动力学方程离散化,将轨迹规划转化为非线性规划问题,有效避免了高阶插值多项式带来的数值不稳定性,提升了计算效率与求解精度。
综上所述,传统轨迹规划方法的研究内容见表5。传统的空间机械臂轨迹规划方法通常对系统动力学与运动学模型有所依赖,尽管在降低基座扰动、提升轨迹精度和稳定性方面取得了显著成果,但其在实时性、复杂环境适应性,以及对系统建模精度的依赖上仍存在不足。因此,研究人员逐渐将关注点转向基于学习的空间机械臂轨迹规划方法,以期在满足复杂约束条件的同时实现更高的自主性与鲁棒性。
5传统轨迹规划方法研究内容
Tab.5Research content of traditional trajectory planning methods
3.2 基于学习的轨迹规划方法
3.2.1 基于深度强化学习的轨迹规划方法
随着人工智能的快速发展,深度强化学习逐渐成为机器人轨迹规划与控制领域的重要研究方向,并在空间机械臂任务中展现出显著优势。早期的研究多将DRL作为补偿模型不确定性的手段。Senda等[80]通过引入DRL补偿模型误差,提出了一种面向桁架结构组装任务的空间机器人轨迹规划方法,并在数值模拟与气浮台实验中验证了其在插销等典型任务中的有效性。近年来,随着算法研究的深入,无模型的DRL方法逐渐取代传统的轨迹规划方式,直接作为空间机械臂的轨迹规划与控制框架。Hu等[81]基于多约束奖励深度确定性策略梯度(multi-constrained reward deep deterministic policy gradient,MRDDPG)算法提出了自由漂浮基座2-DoF空间机械臂的轨迹规划方法,将障碍物位置编码到状态空间,实现了避障与末端位置精确到达。Du等[82]则利用深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法设计了3-DoF空间机械臂轨迹规划方法,通过“预训练(pre-training)”控制机械臂随机运动收集经验加速算法收敛,在力矩模式下实现了末端位置的准确到达。D’Ambrosio等[83]基于近端策略优化(proximal policy optimization,PPO)算法提出了适用于7-DoF空间机械臂的轨迹规划方法,有效实现了末端执行器与自旋目标间的位姿稳定。Hu等[84]提出了基于深度强化学习的连续位姿表示轨迹规划方法(DRL-based trajectory planning with continuous pose representation,RTPC),选用连续位姿表示代替传统的欧拉角或四元数表示方式,并基于后视经验回放与课程学习构建了混合高效学习架构(hybrid efficient learning framework,HybridEL framework),提升了六自由度机械臂末端位姿到达精度。
除单臂任务外,DRL在更复杂场景中同样具有优异性能。Wu等[85]设计了基于DDPG算法的双臂协同轨迹规划方法,能够在基座固定与自由漂浮模式中控制2条7-DoF机械臂,实现末端执行器的协同位置到达。Hovell等[86]针对航天器捕获任务,提出了一种基于DRL的3-DoF空间机械臂轨迹规划与控制方法,在气浮台完成了对自由漂浮目标的捕获验证。Srivastava等[87]则基于PPO算法设计了联合控制框架,将6-DoF空间机械臂与3-DoF航天器动量轮系统作为整体进行优化,在保持航天器姿态稳定的同时,实现了末端执行器的位姿到达。上述研究充分表明,DRL不仅能够在不依赖精确模型的条件下完成复杂的轨迹规划,还在高阶系统与多任务耦合场景中具有巨大的应用潜力。
3.2.2 基于模仿学习的轨迹规划方法
尽管DRL具有广泛的应用前景,但完全无模型的算法同样存在瓶颈,例如训练周期长、收敛性难以保障、算法可解释性不佳等。为此,基于模仿学习的轨迹规划方法近年来逐渐进入人们视野。这类方法通常通过专家示范或离线数据集直接学习轨迹生成策略,在保证快速收敛的同时,还具备较好的泛化能力。
Ashith Shyam等[88]利用物理模拟器与MPC生成冗余7-DoF空间机械臂的轨迹示范数据,随后将轨迹数据编码为概率运动基元(probabilistic motion primitives,ProMPs)以构建轨迹分布,再利用模仿学习实现轨迹规划任务,根据姿态扰动代价,从多个冗余轨迹中选取对航天器姿态影响最小的轨迹,从而显著减少航天器姿态控制系统负担。随后,Ashith Shyam等[89]进一步推进上述方法,将模仿学习应用于实时轨迹调整,进一步优化空间机械臂系统的能耗与姿态扰动。Ning等[90]针对空间环境的目标抓取任务,设计了一个轻量化、端到端的集成框架(grasp detection and imitation learning,GD-IL),利用目标点云信息生成多个抓取候选区域,同时引入机器人可操控性指标,选取最佳抓取姿态。随后利用二阶动态运动基元(dynamic motion primitives,DMPs)模型,配合高斯混合模型(Gaussian mixture model,GMM)学习示范抓取轨迹,实现实时的目标抓取任务。实验结果表明,GD-IL在实时性、可操作性和抓取成功率上均优于其他算法。
本文将基于学习的轨迹规划方法总结于表6。尽管目前大多数算法的验证仍主要停留在仿真层面,但这些方法通过数据驱动与环境交互不断提升轨迹规划性能,为应对复杂约束条件和高维任务提供了新的解决方案。
6基于学习的轨迹规划方法研究内容
Tab.6Research content of learning-based trajectory planning methods
4 空间目标柔顺抓取控制
轨迹规划为末端执行器提供了安全可行的运动方案,但进入具体执行阶段,空间机械臂仍面临着复杂场景耦合、不确定扰动,以及非合作目标未知性等挑战,亟须制定相应的运动控制策略予以保障。空间机械臂的控制难点包括对规划轨迹的稳定跟踪与误差抑制,以及末端执行器在接触/交互阶段的精细化调控。鉴于抓取任务在空间操作中的核心地位,本文围绕柔顺抓取任务的控制过程展开,涵盖面向不确定性的抓取前轨迹跟踪控制,接触时的瞬态冲击抑制与力交互控制,以及抓取后的基座-臂-载荷一体化协调控制,以期为在轨任务的安全高效执行提供系统性的技术支撑。
4.1 面向不确定性的自适应抓取策略
在空间环境下执行在轨捕获与柔顺抓取任务时,系统中普遍存在多源不确定性[65]。首先,目标的质量、质心位置,以及惯性参数往往未知或难以准确获取,并且机械臂末端位姿与连杆惯性参数之间存在强耦合关系,这会直接影响到空间机械臂与基座平台之间的动力学耦合建模与控制精度[91]。其次,空间机械臂本体结构的不确定性不可忽视,包括柔性变形、关节间隙以及摩擦等问题,这些因素在操作过程中会导致动力学模型偏差[92]。最后,感知与估计过程同样存在不确定性,传感器误差、装配偏差以及初始动量扰动都会使状态估计产生偏差,进一步影响抓取过程的动态响应[93]
在空间控制任务中,模型参数不确定性和复杂外部扰动往往难以精确建模。针对这一问题,已有研究提出了不同类型的解决方法。一类方法是基于观测器的扰动抑制技术,包括扰动观测器(disturbance observer,DOB)[94]、噪声观测器(noise observer,NOB)[95]和降噪扰动观测器(noise reduction disturbance observer,NRDOB)[96],这些方法被应用于抑制基座振动和传感器噪声等典型扰动,并通过滤波器优化,提升了惯性参考单元(inertial reference unit,IRU)的鲁棒性和跟踪精度[97]。此外,也有研究将引力场建模误差、参数摄动及外部干扰统一为总扰动,并利用扰动观测器进行在线估计与前馈补偿,从而在轨迹跟踪控制中增强了对不确定性的抑制能力[98]。另一类方法则基于模型预测控制,其优势在于能够在优化框架下处理复杂的状态和输入约束。例如,Dong等[99]提出了管道型鲁棒输出反馈MPC(tube-based robust MPC,TRMPC),在非合作目标自主交会与对接任务中保证了在动力学不确定性、测量误差和执行器偏差等扰动下,依然满足速度和碰撞回避等关键约束。而Sanchez等[100]则提出了基于机会约束的鲁棒MPC方法,将概率约束与扰动在线估计结合,提升了地月L2点近直线晕轨道上交会对接任务的约束满足率与成功率,并兼容脉冲与连续推力模型。随着计算能力的飞速提升以及人工智能技术的发展,深度强化学习在应对复杂与不确定环境时展现出显著优势,尤其在空间目标柔顺抓取控制方面展现出了巨大潜力。Du等[82]利用DDPG算法实现了自由漂浮空间机械臂的自主捕获控制,突破了对精确动力学模型的依赖,并通过预训练机制提升了学习效率和捕获成功率。Liang等[101]针对训练收敛性和稳定性挑战,基于Actor-Critic架构设计了DRL算法并优化了奖励函数,加快了策略收敛并提升了捕获成功率。这些研究共同展示了DRL算法在提升空间机械臂自适应抓取方面的广阔前景。
4.2 接触瞬态的冲击抑制与力交互控制
微重力环境中两体自由漂浮、结构阻尼很低,接触前缺乏法向预压,瞬时冲击经基座与执行机构耦合,易诱发姿态突变、柔性模态激励与反弹,导致捕获失败、接口损伤,以及执行器输出饱和[102-103]。对于末端与环境的交互力,除了直接控制方法,还有间接控制方式。与直接力控制不同,间接力控制并不把力本身作为受控量,而是通过调节位置、速度或表观阻抗来间接实现力的调节。该思路尤其适用于难以高质量测力或需要对外部载荷保持顺应特性的场景。通常可分为两类:阻抗控制与导纳控制。阻抗控制在空间机械臂与环境之间设定期望的质量、阻尼和刚度关系,以整形力与运动的相互作用,提升接触任务的适应性;导纳控制则以外力为输入,生成期望的位姿或速度轨迹,从而实现对交互力的间接调节。
空间机械臂接触瞬态的阻抗控制最早由Hogan等[104]提出,在操作空间为末端设置期望的质量、阻尼与刚度,使受力与位移关系满足被动性[105-106]。其做法是定义一个虚拟机械阻抗(质量、阻尼与刚度),用以整形机械臂对外部广义力的响应;法向宜选取较低至中等刚度并配以临界或过阻尼以实现冲击抑制,切向保持较高刚度以有利于末端对准,并随软捕、对准、硬锁3个阶段逐步调整[107-109]。期望的机械阻抗可表示为
Fext=Mdx¨-x¨d+Ddx˙-x˙d+Kdx-xd
(1)
式中:xdx˙dx¨d分别为期望位置、速度与加速度,MdDdKd分别为所设定的表观惯量、阻尼与刚度矩阵。阻抗控制通过整形末端等效动力学,在保持与环境顺应交互的前提下,使实际运动逼近期望轨迹。阻抗刻画系统的动态顺应性,其基本思想是通过调节顺应水平来管控交互力,因此合理设计的阻抗参数将显著提升控制性能。
导纳控制与阻抗控制互为对偶。其关键不在直接闭环位置或速度,而在于规定系统对外部广义力的运动响应,即建立外力与期望运动之间的映射关系,常用以通过“运动补偿”实现力调节,因此对位置伺服精度依赖较强[110]。其思想是将机械臂期望的交互行为等效为一个虚拟的导纳系统,通常采用二阶惯量-阻尼-刚度模型,即
Mdx¨+Ddx˙+Kdx=Fext
(2)
式中:MdDdKd分别为期望的惯量、阻尼与刚度矩阵,Fext为测得的外力/力矩。求解上述方程得到的xt)或x˙t)作为期望轨迹(或速度指令)下发至底层控制器,从而实现对交互力的间接调节。
在方向化接触控制方面,Hashtrudi-zaad等[111]提出了一种并行力/位混合控制策略,通过将接触任务在接触坐标系下解耦为切向与法向两个方向来进行控制。对于切向方向,采用位置跟踪控制,以提供较高的等效刚度;而对于法向方向,则使用力控制策略,以保证系统的柔顺性。此外,研究人员还推导了线性化的闭环模型和实现公式,并给出了在未知环境刚度条件下的稳定性判据以及相应的参数整定指导。面向航天工程应用,Hu等[112]将该类思想落地于空间站机械臂,提出了腕力矩反馈的位置式阻抗控制方案,并给出了离散化实现与参数选取原则。该方法在对接与插拔阶段,沿接口法向采用位置控制以获得高刚度与精度,其余方向采用阻抗控制以限制接触力矩,并通过地面试验证明该方法能够有效约束末端力矩。此外,针对多分支空间航天器的复杂接触作业,Lu等[113]提出了分层被动性框架的“力-位置-构型”协调控制:任务层同时跟踪期望接触力与末端位姿,执行层采用自适应变阻抗在线调节等效刚度与阻尼,并引入能量罐以保证闭环被动性与稳定性,形成适用于在轨复杂操作的一体化方案。
4.3 抓取后基座-臂-载荷一体化协调控制
在空间抓取任务中,基座姿态扰动是由于机械臂运动产生的反作用力引起的,这会影响任务的稳定性和精确性。为减少空间机械臂抓取任务中基座姿态扰动,Huang等[114]提出了动态平衡控制概念,通过平衡臂的协调运动来补偿任务臂引起的基座姿态扰动。Zhang等[115]提出了一种基于反应零空间控制(reaction null space,RNS)的轨迹优化方法,结合粒子群优化算法,实现了基座姿态扰动的最小化。Xu等[116]提出了基于反应零空间控制的协调控制方法,通过优化机械臂的运动配置,确保机械臂运动不会对基座产生反作用力,从而保持基座姿态的稳定。Jiao等[117]提出了一种基于反应力矩的控制方法,针对自由漂浮的空间机械臂系统,研究了如何通过控制反应力矩来最小化卫星基座姿态扰动,并使用RNS方法进行基座姿态调整。
Hu等[118]提出了一种结合输入成形技术和变结构控制(variable structure control,VSC)的方法,用于在航天器执行姿态机动时,实现机械臂末端精确定位和弹性振动抑制,并设计了饱和补偿机制以克服控制输入的饱和问题。该方法通过外部输入成形单元抑制振动,并利用VSC策略在存在外部干扰和参数不确定性的情况下确保系统性能。Kong等[119]提出了一种结合反馈控制和输入成形技术的控制策略,用于在航天器的姿态机动过程中抑制柔性附加物的振动。该方法通过设计多模态输入成形器并结合反馈控制,有效减少了灵活结构的残余振动。Nenchev等[120]提出了一种复合控制法,用于在灵活结构安装的操纵系统中进行末端执行器路径跟踪,利用RNS控制技术消除对基座的干扰,并结合振动抑制控制来提高系统的稳定性。
在太空航天任务中,机械臂完成目标抓取后的整体稳定控制是另一个关键问题。为了应对这一挑战,近年来研究人员提出了多种自适应控制策略,以减小抓取后目标引入的扰动,确保机械臂能够安全、稳定地完成操作任务。由于目标的旋转动量传递可能导致反作用轮饱和,进而影响航天器姿态控制,Wang等[121]设计了一种基于4次Bézier曲线和自适应差分进化(differential evolution,DE)算法的优化路径,用于找到最优的消旋时间和目标的末端状态。该策略考虑了消旋时间和控制力矩,旨在最小化基座的扰动和目标的旋转。此外,还有研究人员考虑了利用多目标粒子群优化(multiple objective particle swarm optimization,MOPSO)算法寻找最优轨迹,从而有效抑制目标的振动并确保机械臂系统的稳定性[122-123]
本文将空间目标柔顺抓取控制的研究总结于表7。整体来看,相关研究逐渐从依赖精确建模的传统控制方法,向着融合智能算法与自适应机制的方向发展。针对不确定性与外部扰动的研究强调通过观测器、鲁棒优化与学习方法提升系统在复杂环境下的稳定性与适应性;接触瞬态的控制方法则注重在保证抓取精度的同时抑制冲击与力扰动,以提升在轨任务的安全性;同时,抓取后的协调控制则强调机械臂、基座与载荷的整体协同,以实现对姿态扰动与柔性振动的有效抑制。这些进展共同表明,柔顺抓取控制正由单一方法走向多策略融合,并逐步形成面向复杂空间任务的系统化解决方案。
7空间目标柔顺抓取控制研究概述
Tab.7Research overview of compliant grasping control for space targets
5 挑战与未来展望
5.1 当前技术面临的主要挑战
5.1.1 有限的计算资源与高复杂度任务需求之间的矛盾
无论是多模态视觉融合感知与位姿估计,或者复杂约束下的空间机械臂轨迹规划,亦或是不确定环境中的漂浮目标柔顺抓取控制,这些在轨感知-规划-决策任务通常需要高计算复杂度的算法支持,从而保障空间机械臂系统的自主性与智能化水平。作为代价,此类算法的实时性往往难以得到保障。由于星载计算平台受质量、体积、能耗及散热条件限制,算力资源极为有限,难以满足深度神经网络实时推理、大规模优化求解或预测控制等高计算量任务的需求[124]。这种算力与算法复杂度之间的矛盾,导致在轨应用往往需要在精度与实时性之间进行权衡。如何在受限算力条件下实现轻量化网络设计、模型压缩与加速推理[125],成为推动智能算法在空间任务中实际落地的关键问题。
5.1.2 在轨真实数据缺乏与模型泛化能力之间的矛盾
智能感知-规划-决策算法通常依赖大量优质数据进行训练,以保证模型在复杂环境下的泛化能力[126]。然而,轨道环境下的真实数据获取成本极高,受限于星载传感器类型、实验条件,以及采集手段,现有在轨数据规模十分有限,且往往存在样本不均衡、标注困难和噪声干扰等问题[127]。这种数据匮乏直接制约了模型的训练效果,导致模型在真实任务中可能出现迁移性能下降甚至失效的情况。为了缓解这一矛盾,研究人员常常利用仿真环境生成虚拟数据,以填补部分真实数据缺口。然而,仿真与现实之间仍然存在显著差异,同样会严重干扰模型的泛化性能。如何通过Sim2Real等技术增强模型泛化能力,减少模型训练阶段对真实数据的依赖[128],依然是在轨服务智能化发展亟待解决的重要难题。
5.1.3 多模态感知-规划-控制的实时协同问题
自主在轨服务任务需要将多模态视觉感知、轨迹规划与柔顺控制等环节有机耦合,实现完整的“感知-规划-控制”链路。然而,多模态传感器在采集数据时存在时延与异步问题,融合处理又引入额外的计算开销,使得感知结果难以及时传递到规划层。同时,轨迹规划算法往往需要在动态约束与复杂任务目标下进行高维求解,其输出必须与控制层的执行频率保持一致,否则将导致轨迹跟随误差持续累积,进而导致任务失败。此外,感知噪声与估计不确定性会进一步传递并放大至轨迹规划与控制环节,影响整个系统的安全性[129]。因此,如何在保证精度的前提下,实现实时的跨层级协同,是当前多模态空间机械臂在轨操作面临的关键挑战之一。
5.1.4 空间环境长期运行的可靠性问题
空间机械臂在轨运行周期长、维护困难,必须在真空、强辐射干扰[130]、剧烈温度变化和微陨石冲击等极端条件下保持长期稳定工作。这不仅对传感器与执行机构的抗衰退性提出了更高要求,也对空间机械臂系统的感知-规划-控制算法鲁棒性和容错能力带来挑战[131]。感知-规划-控制系统一旦出现性能退化或异常,可能导致任务失败甚至引发连锁风险。因此,如何在保证精度与效率的同时,提升硬件设备耐久性与软件系统容错性,是实现自主在轨服务的关键保障[132]
5.2 自主在轨服务系统的未来发展趋势
面向自主在轨服务的空间机械臂系统,其未来发展必将呈现出硬件、算法与系统全栈协同演进的局面。
1)在硬件层面,NPU、TPU等智能计算单元的出现,将显著提升星载平台的算力与能效比,实现复杂感知规划算法的实时在轨运行。同时,智能化传感器与多模态传感器一体化集成系统的发展将逐步取代传统的单功能传感器,实现多模态信息的原位采集与初步融合,降低信息传输与处理的延迟,并提升空间机械臂系统的鲁棒性与紧凑性。
2)在算法层面,模型轻量化与高效推理技术将成为未来的核心方向,更加精简高效的网络模型有望在受限算力条件下实现高速准确推理。跨模态自监督学习框架能够为多源感知数据构建统一表征,在缺乏大规模标注样本的空间任务环境中保障系统的泛化能力。此外,具身智能的引入将使轨迹规划与任务执行更加贴近实际物理环境,推动空间机械臂从“离线学习”向“在轨自主演化”转变。
3)在系统层面,“感知-规划-控制”一体化的端到端架构将成为重要发展方向,有望突破传统分层式设计在实时性、协调性和鲁棒性上的局限,推动系统从局部最优向全局最优演化。同时,数字孪生技术将在高保真仿真与任务决策中发挥关键作用。通过地面站与在轨卫星之间的高保真数字孪生模型,系统能够实现任务场景的精确预测、在轨异常的快速诊断与定位,以及任务策略的动态优化与迭代,从而显著提升空间机械臂在轨服务的自主性与可靠性。
6 结论
作为自主在轨服务的重要工具,空间机械臂凭借其高自由度与卓越的灵活操作性,搭配多样化的末端执行机构,近年来成为承载复杂空间任务的核心系统。与此同时,复杂环境的不确定性与空间动力学约束也对空间机械臂系统的自主化与智能化提出了更为严苛的要求,集中表现为更稳健的环境感知、更高效的在线规划以及更安全的抓取控制。本文以“感知-规划-控制”为逻辑主线,对空间机械臂自主在轨服务相关的核心技术进行了全面的综述。研究的主要结论如下:
1)多模态视觉感知是实现空间机械臂自主在轨服务的关键基础。结合现有研究进展,可以发现可见光、红外、激光雷达、立体相机与事件相机等多模态传感器各有优势与局限性,面向任务的传感器选型对于提升系统性能至关重要。在算法层面,基于深度学习的多模态融合增强可以有效整合多源信息,弥补单一传感器的不足,从而在复杂工况下提升感知能力。与此同时,视觉位姿估计作为空间机械臂轨迹规划与抓取的前置环节,正在由传统的几何范式向“几何-学习”融合的方向演进。这一演化趋势在显著提升算法鲁棒性与环境适应性的同时,也为研究人员带来新的难题:一方面,在轨高质量训练数据稀缺,如何获取优质的训练数据成为制约学习算法性能的一大难点;另一方面,由于星载平台的算力限制,构建轻量化的神经网络模型成为空间任务实际部署的关键前提。总体来看,任务化的传感器选型、智能化的融合算法以及鲁棒高精度的位姿估计方法,共同构成多模态视觉感知技术的主要发展方向。
2)复杂动力学约束下的轨迹规划是空间机械臂安全稳定运行的重要支撑。空间机械臂轨迹规划从简单任务迈向复杂任务,从低自由度转为高自由度,从单机械臂轨迹规划扩展为多机械臂与航天器基座的协同规划,已成为重要的发展趋势。在此过程中,基于学习的算法凭借数据驱动的无模型特性与自适应的泛化能力,正成为空间机械臂轨迹规划的重要途径。与此同时,基于学习的方法也带来了可解释性不足、安全性与可达性难以形式化验证等新问题。此外,随着任务复杂度的提升,现有的空间环境地面模拟装置在场景覆盖、物理逼真度与实验可靠性等方面的局限日益显现,在学习方法的训练与评估上尤为突出。因此,推进学习算法与现有不完备模型的深度融合,扩展虚拟仿真平台与地面模拟装置的验证能力,已成为当前空间轨迹规划技术亟待解决的关键难题。
3)空间目标柔顺抓取控制是保障空间机械臂在轨服务安全与稳定的关键环节,涵盖自适应抓取、冲击抑制与整体协调3个方面。在不确定性条件下,扰动观测器、鲁棒MPC和深度强化学习等方法提升了对参数未知与外部扰动的适应能力,为自适应抓取提供了可行方案。在接触瞬态控制中,阻抗控制、导纳控制及力/位混合控制能够根据任务阶段动态调节系统顺应性,有效降低冲击力与姿态扰动,增强了在轨操作的安全性与可靠性。在抓取后的系统整体协调中,反应零空间控制、输入整形与复合控制策略显著减小了基座姿态扰动并抑制柔性振动,同时,基于优化与智能算法的轨迹规划方法进一步提升了消旋与稳定控制能力。总体而言,空间柔顺抓取控制正由传统解析方法向智能化、自适应与多目标优化方向演进,是当前空间抓取控制的重要研究方向。
1国内、外空间机械臂系统
Fig.1Domestic and international space manipulator systems
2本文的组织架构
Fig.2Organization structure of this paper
1典型空间机械臂系统的比较
Tab.1Comparison of typical space manipulator systems
2典型视觉传感器在空间感知任务下的特性
Tab.2Characteristics of typical vision sensors for space perception tasks
3典型多模态视觉融合增强方法汇总
Tab.3Summary of representative multimodal visual fusion enhancement methods
4典型空间目标位姿估计方法汇总
Tab.4Summary of representative space object pose estimation methods
5传统轨迹规划方法研究内容
Tab.5Research content of traditional trajectory planning methods
6基于学习的轨迹规划方法研究内容
Tab.6Research content of learning-based trajectory planning methods
7空间目标柔顺抓取控制研究概述
Tab.7Research overview of compliant grasping control for space targets
中华人民共和国国务院新闻办公室.2021中国的航天[EB/OL].(2022-01-28).https://www.cnsa.gov.cn/n6758823/n6758844/n6760320/n6760321/c6813117/content.html.The State Council Information Office of the People’s Republic of China. China’s space program 2021[EB/OL].(2022-01-28).https://www.cnsa.gov.cn/n6758823/n6758844/n6760320/n6760321/c6813117/content.html
National Aeronautics and Space Administration. On-orbit servicing,assembly,and manufacturing 2(OSAM-2)[EB/OL].(2023-10-30).https://www.nasa.gov/mission/on-orbit-servicing-assembly-and-manufacturing-2-osam-2
The European Space Agency. ESA Strategy 2040[EB/OL].[2025-09-01].https://www.esa.int/About_Us/ESA_Strategy_2040
刘宏, 刘冬雨, 蒋再男. 空间机械臂技术综述及展望[J]. 航空学报,2021,42(1):524164.LIU Hong, LIU Dongyu, JIANG Zainan. Space manipulator technology:review and prospect[J]. Acta Aeronautica et Astronautica Sinica,2021,42(1):524164. DOI:10.7527/S1000-6893.2020.24164
薛智慧, 刘金国. 空间机械臂操控技术研究综述[J]. 机器人,2022,44(1):107.XUE Zhihui, LIU Jinguo. Review of space manipulator control technologies[J]. Robot,2022,44(1):107. DOI:10.13973/j.cnki.robot.210243
PAPADOPOULOS E, AGHILI F, MA Ou,et al. Robotic manipulation and capture in space:a survey[J]. Frontiers in Robotics and AI,2021,8:686723. DOI:10.3389/frobt.2021.686723
解永春, 王勇, 陈奥, 等. 基于学习的空间机器人在轨服务操作技术[J]. 空间控制技术与应用,2019,45(4):25.XIE Yongchun, WANG Yong, CHEN Ao,et al. Leaning based on-orbit servicing manipulation technology of space robot[J]. Aerospace Control and Application,2019,45(4):25. DOI:10.3969/j.issn.1674-1579.2019.04.004
王友渔, 胡成威, 唐自新, 等. 我国空间站机械臂系统关键技术发展[J]. 航天器工程,2022,31(6):147.WANG Youyu, HU Chengwei, TANG Zixin,et al. Key technologies development of the space station manipulator system[J]. Spacecraft Engineering,2022,31(6):147. DOI:10.3969/j.issn.1673-8748.2022.06.018
丁希仑, 陈一同, 王成才, 等. 空间机器人操作技术研究现状与展望[J]. 航空学报,2025,46(6):266.DING Xilun, CHEN Yitong, WANG Chengcai,et al. Research status and prospect of space robot operation technology[J]. Acta Aeronautica et Astronautica Sinica,2025,46(6):266. DOI:10.7527/S1000-6893.2024.31556
于登云, 张哲, 泮斌峰, 等. 深空探测人工智能技术研究与展望[J]. 深空探测学报,2020,7(1):11.YU Dengyun, ZHANG Zhe, PAN Binfeng,et al. Development and trend of artificial intelligent in deep space exploration[J]. Journal of Deep Space Exploration,2020,7(1):11. DOI:10.15982/j.issn.2095-7777.2020.20190916001
SASIADEK J Z. Space robotics:present and past challenges[C]//2014 19th International Conference on Methods and Models in Automation and Robotics(MMAR). Miedzyzdroje: IEEE,2014:926. DOI:10.1109/MMAR.2014.6957481
HILTZ M, RICE C, BOYLE K,et al. Canadarm:20 years of mission success through adaptation[C]//Proceeding of the 6th International Symposium on Artificial Intelligence and Robotics & Automation in Space. Quebec: Canadian Space Agency,2001
MDA Space. MDA Annual Meeting of Shareholders[EB/OL].(2024-05-09).https://mda-en.investorroom.com/events-presentations?item=42
CRUIJSSEN H J, ELLENBROEK M, HENDERSON M,et al. The European robotic arm:a high-performance mechanism finally on its way to space[C]//The 42nd Aerospace Mechanism Symposium. Baltimore: NASA Goddard Space Flight Center,2014
MATSUEDA T, KUWAO F, MOTOHASI S,et al. Development of Japanese experiment module remote manipulator system[C]//Third International Symposium on Artificial Intelligence, Robotics,and Automation for Space 1994.[S.l.]: NASA Jet Propulsion Laboratory(JPL),1994:183
ODA M. Summary of NASDA’s ETS-VII robot satellite mission[J]. Journal of Robotics and Mechatronics,2000,12(4):417. DOI:10.20965/jrm.2000.p0417
ODA M. Space robot experiments on NASDA’s ETS-VII satellite-preliminary overview of the experiment results[C]//Proceedings 1999 IEEE International Conference on Robotics and Automation(Cat. No.99CH36288C). Detroit: IEEE,1999:1390. DOI:10.1109/ROBOT.1999.772555
FRIEND R B. Orbital express program summary and mission overview[C]//Sensors and Systems for Space Applications II. Orlando: SPIE,2008:695803. DOI:10.1117/12.783792
张雪松. 中国空间站机械臂: 太空助你一臂之力[J]. 太空探索,2021(9):26.ZHANG Xuesong. China space station manipulator:space helps you[J]. Space Exploration,2021(9):26. DOI:10.3969/j.issn.1009-6205.2021.09.008
胡成威, 高升, 熊明华, 等. 空间站核心舱机械臂关键技术[J]. 中国科学: 技术科学,2022,52(9):1299.HU Chengwei, GAO Sheng, XIONG Minghua,et al. Key technologies of the China space station core module manipulator[J]. Scientia Sinica(Technologica),2022,52(9):1299. DOI:10.1360/SST-2021-0507
王翔, 张峤, 王为. 中国空间站建设系统方案特点与展望[J]. 航天器工程,2022,31(6):26.WANG Xiang, ZHANG Qiao, WANG Wei. System characteristics and prospect of China space station[J]. Spacecraft Engineering,2022,31(6):26. DOI:10.3969/j.issn.1673-8748.2022.06.005
WANG Zhengwei, WANG Pengfei, DUAN Jinjun,et al. Review of on-orbit assembly technology with space robots[J]. Aerospace,2025,12(5):375. DOI:10.3390/aerospace12050375
郝颖明, 付双飞, 范晓鹏, 等. 面向空间机械臂在轨服务操作的视觉感知技术[J]. 无人系统技术,2018,1(1):54.HAO Yingming, FU Shuangfei, FAN Xiaopeng,et al. Vision perception technology for space manipulator on-orbit service operations[J]. Unmanned Systems Technology,2018,1(1):54. DOI:10.19942/j.issn.2096-5915.2018.01.005
MA Boyu, JIANG Zainan, LIU Yang,et al. Advances in space robots for on-orbit servicing:a comprehensive review[J]. Advanced Intelligent Systems,2023,5(8):2200397. DOI:10.1002/aisy.202200397
MURALIDHARAN V, MAKHDOOMI M R,ŽINYS A,et al. On-ground validation of orbital GNC:visual navigation assessment in robotic testbed facility[J]. Astrodynamics,2025,9(3):343. DOI:10.1007/s42064-024-0198-4
张凡, 张泽旭, 宋卓, 等. 面向地球背景与空间目标纹理的数据集增强学习方法[J]. 宇航学报,2025,46(7):1456.ZHANG Fan, ZHANG Zexu, SONG Zhuo,et al. Dataset augmentation learning method for earth background and space target textures[J]. Journal of Astronautics,2025,46(7):1456. DOI:10.3873/j.issn.1000-1328.2025.07.017
YAN Xiutian, GANCET J, GOVINDARAJ S,et al. Space robotics technologies:perception for autonomy[M]//Space robotics. Cham: Springer Nature Switzerland,2024:49. DOI:10.1007/978-3-031-39214-6_3
赵迪, 孙冲, 袁建平, 等. 基于多航天器协同观测的空间非合作目标姿态参数在轨识别方法研究[J]. 西北工业大学学报,2021,39(2):267.ZHAO Di, SUN Chong, YUAN Jianping,et al. Multi-view-based cooperative observation method for space non-cooperative target’s attitude determination[J]. Journal of Northwestern Polytechnical University,2021,39(2):267. DOI:10.3969/j.issn.1000-2758.2021.02.005
施琦. 基于深度学习的可见光遥感图像在轨目标识别技术研究[D]. 上海: 中国科学院大学(中国科学院微小卫星创新研究院),2023.SHI Qi. On-orbit deep learning-based object detection for visible satellite images[D]. Shanghai: University of Chinese Academy of Sciences(Innovation Academy for Microsatellites of Chinese Academy of Sciences),2023. DOI:10.44194/d.cnki.gwxwx.2023.000011
马兰. 机械臂在轨服务的遥操作及交互视景处理[D]. 西安: 西安电子科技大学,2020.MA Lan. On-orbit servicing mission planning and modeling visualization for space intelligent robot[D]. Xi’an: Xidian University,2020. DOI:10.27389/d.cnki.gxadu.2019.001383
刘银年, 孙德新, 曹开钦, 等. 高分五号可见短波红外高光谱相机在轨辐射性能评估[J]. 遥感学报,2020,24(4):352.LIU Yinnian, SUN Dexin, CAO Kaiqin,et al. Evaluation of GF-5 AHSI on-orbit instrument radiometric performance[J]. Journal of Remote Sensing,2020,24(4):352
BENKHOFF J, MURAKAMI G, BAUMJOHANN W,et al. BepiColombo-mission overview and science goals[J]. Space Science Reviews,2021,217(8):90. DOI:10.1007/s11214-021-00861-4
贺小军, 李竺强, 秦小宝, 等. 吉林一号光谱卫星技术创新与应用成果[J]. 卫星应用,2020(3):18.HE Xiaojun, LI Zhuqiang, QIN Xiaobao,et al. Innovations and application achievements of Jilin-1 spectral satellite technology[J]. Satellite Application,2020(3):18. DOI:10.3969/j.issn.1674-9030.2020.03.006
赵梓良, 孙晟昕, 李文龙, 等. 基于无迹卡尔曼滤波的柔性自由翻滚目标姿态估计[J]. 南京航空航天大学学报,2022,54(1):51.ZHAO Ziliang, SUN Shengxin, LI Wenlong,et al. Traceless Kalman filter-based pose estimation of flexible free-tumbling targets[J]. Journal of Nanjing University of Aeronautics & Astronautics,2022,54(1):51. DOI:10.16356/j.1005-2615.2022.01.006
HE Ying, LIANG Bin, HE Jin,et al. Non-cooperative spacecraft pose tracking based on point cloud feature[J]. Acta Astronautica,2017,139:213. DOI:10.1016/j.actaastro.2017.06.021
朱凌超. 空间翻滚目标智能跟踪控制研究[D]. 北京: 中国科学院大学,2021.ZHU Lingchao. Research on intelligent tracking control of space tumbling target[D]. Beijing: University of Chinese Academy of Sciences,2021
ZHANG Haifeng, WU Jiaxin, AI Han,et al. Pose measurement of non-cooperative space targets based on point line feature fusion in low-light environments[J]. Electronics,2025,14(9):1795. DOI:10.3390/electronics14091795
USSA A, RAJEN C S, PULLURI T,et al. A hybrid neuromorphic object tracking and classification framework for real-time systems[J]. IEEE Transactions on Neural Networks and Learning Systems,2024,35(8):10726. DOI:10.1109/TNNLS.2023.3243679
LIU Yipeng, JIN Jing, WANG Qiang,et al. Region level based multi-focus image fusion using quaternion wavelet and normalized cut[J]. Signal Processing,2014,97:9. DOI:10.1016/j.sigpro.2013.10.010
CHOI M, KIM R Y, NAM M R,et al. Fusion of multispectral and panchromatic satellite images using the curvelet transform[J]. IEEE Geoscience and Remote Sensing Letters,2005,2(2):136. DOI:10.1109/LGRS.2005.845313
ZHANG Qiong, MALDAGUE X. An adaptive fusion approach for infrared and visible images based on NSCT and compressed sensing[J]. Infrared Physics & Technology,2016,74:11. DOI:10.1016/j.infrared.2015.11.003
BURT P J, KOLCZYNSKI R J. Enhanced image capture through fusion[C]//1993(4th)International Conference on Computer Vision. Berlin: IEEE,2002:173. DOI:10.1109/ICCV.1993.378222
BURT P J, ADELSON E H. The laplacian pyramid as a compact image code[J]. IEEE Transactions on Communications,1983,31(4):532. DOI:10.1109/TCOM.1983.1095851
WU Minghui, MA Yong, FAN Fan,et al. Infrared and visible image fusion via joint convolutional sparse representation[J]. Journal of the Optical Society of America A, Optics, Image Science,and Vision,2020,37(7):1105. DOI:10.1364/JOSAA.388447
PRABHAKAR K R, SRIKAR V S, BABU R V. DeepFuse:a deep unsupervised approach for exposure fusion with extreme exposure image pairs[C]//2017 IEEE International Conference on Computer Vision(ICCV). Venice: IEEE,2017:4724. DOI:10.1109/ICCV.2017.505
LI Hui, WU Xiaojun. DenseFuse:a fusion approach to infrared and visible images[J]. IEEE Transactions on Image Processing,2019,28(5):2614. DOI:10.1109/TIP.2018.2887342
DOSOVITSKIY A, BEYER L, KOLESNIKOV A,et al. An image is worth 16×16 words:transformers for image recognition at scale[EB/OL].2020:arXiv:2010.11929.https://arxiv.org/abs/2010.11929
VS V, JOSE VALANARASU J M, OZA P,et al. Image fusion transformer[C]//2022 IEEE International Conference on Image Processing(ICIP). Bordeaux: IEEE,2022:3566. DOI:10.1109/ICIP46576.2022.9897280
QU Linhao, LIU Shaolei, WANG Manning,et al. TransMEF:a transformer-based multi-exposure image fusion framework using self-supervised multi-task learning[J]. Proceedings of the AAAI Conference on Artificial Intelligence,2022,36(2):2126. DOI:10.1609/AAAI.v36i2.20109
MA Jiayi, TANG Linfeng, FAN Fan,et al. SwinFusion:cross-domain long-range learning for general image fusion via swin transformer[J]. IEEE/CAA Journal of Automatica Sinica,2022,9(7):1200. DOI:10.1109/JAS.2022.105686
SHAUKAT A, BLACKER P C, SPITERI C,et al. Towards camera-LIDAR fusion-based terrain modelling for planetary surfaces:review and analysis[J]. Sensors,2016,16(11):1952. DOI:10.3390/s16111952
GUO Pengyu, ZHANG Yonghe, HU Qinglei. Pose measurement of non-cooperative spacecraft by sensors fusion[C]//2022 41st Chinese Control Conference(CCC). Hefei: IEEE,2022:3426. DOI:10.23919/CCC55666.2022.9901787
LIU Yuzhe, XIONG Zhi, GAO Guanhong,et al. Intelligent recognition and integrated navigation technology for typical spacecraft components[C]//2024 6th International Conference on Robotics, Intelligent Control and Artificial Intelligence(RICAI). Nanjing: IEEE,2025:1103. DOI:10.1109/RICAI64321.2024.10911675
JAWAID M, ELMS E, LATIF Y,et al. Towards bridging the space domain gap for satellite pose estimation using event sensing[C]//2023 IEEE International Conference on Robotics and Automation(ICRA). London: IEEE,2023:11866. DOI:10.1109/ICRA48891.2023.10160531
LE GENTIL C, NAYLOR J, MUNASINGHE N,et al. Mixing data-driven and geometric models for satellite docking port state estimation using an rgb or event camera[C]//2025 IEEE International Conference on Robotics and Automation(ICRA). Atlanta: IEEE,2025:14603. DOI:10.1109/ICRA55743.2025.11128225
JAWAID M, MÄRTENS M, CHIN T J. Event-RGB fusion for spacecraft pose estimation under harsh lighting[EB/OL].2025:arXiv:2507.05698.https://arxiv.org/abs/2507.05698
CHEN Zhiming, LI Lei, WU Yunhua,et al. A new pose estimation method for non-cooperative spacecraft based on point cloud[J]. International Journal of Intelligent Computing and Cybernetics,2019,12(1):23. DOI:10.1108/ijicc-03-2018-0036
CHEKAKTA Z, ZENATI A, AOUF N,et al. Robust deep learning LiDAR-based pose estimation for autonomous space landers[J]. Acta Astronautica,2022,201:59. DOI:10.1016/j.actaastro.2022.08.049
RENAUT L, FREI H, NÜCHTER A. CNN-based pose estimation of a noncooperative spacecraft with symmetries from LiDAR point clouds[J]. IEEE Transactions on Aerospace and Electronic Systems,2025,61(2):5002. DOI:10.1109/TAES.2024.3517574
SHARMA S, D’AMICO S. Neural network-based pose estimation for noncooperative spacecraft rendezvous[J]. IEEE Transactions on Aerospace and Electronic Systems,2020,56(6):4638. DOI:10.1109/TAES.2020.2999148
HUANG Haoran, SONG Bin, ZHAO Gaopeng,et al. End-to-end monocular pose estimation for uncooperative spacecraft based on direct regression network[J]. IEEE Transactions on Aerospace and Electronic Systems,2023,59(5):5378. DOI:10.1109/TAES.2023.3256971
LI Ronghua, ZHOU Ying, CHEN Feng,et al. Parallel vision-based pose estimation for non-cooperative spacecraft[J]. Advances in Mechanical Engineering,2015,7(7):1687814015594312. DOI:10.1177/1687814015594312
ZHANG He, ZHENG Yin, WANG Yan. A pose estimation method based on RGB-D system in the process of attaching asteroids[C]//2024 36th Chinese Control and Decision Conference(CCDC). Xi’an: IEEE,2024:4674. DOI:10.1109/CCDC62350.2024.10587422
RONDAO D, AOUF N, RICHARDSON M A. ChiNet:deep recurrent convolutional learning for multimodal spacecraft pose estimation[J]. IEEE Transactions on Aerospace and Electronic Systems,2023,59(2):937. DOI:10.1109/TAES.2022.3193085
孙向阳. 面向在轨制造的空间机械臂的运动规划与动力学控制研究[D]. 长春: 中国科学院大学(中国科学院长春光学精密机械与物理研究所),2024.SUN Xiangyang. Research onmotion planning and dynamic control of space manipulator for on-orbit manufacturing[D]. Changchun: University of Chinese Academy of Sciences(Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences),2024. DOI:10.27522/d.cnki.gkcgs.2024.000024
龙沁. 空间机械臂捕获非合作目标喷管规划及控制方法研究[D]. 哈尔滨: 哈尔滨工业大学,2023.LONG Qin. Research on the planning and control method of manipulator to capture non-cooperative target nozzle[D]. Harbin: Harbin Institute of Technology,2023. DOI:10.27061/d.cnki.ghgdu.2023.001189
UMETANI Y, YOSHIDA K. Resolved motion rate control of space manipulators with generalized Jacobian matrix[J]. IEEE Transactions on Robotics and Automation,1989,5(3):303. DOI:10.1109/70.34766
YOSHIDA K, UMETANI Y. Control of space manipulators with generalized Jacobian matrix[M]//Space robotics:dynamics and control. Boston: Springer US,1993:165. DOI:10.1007/978-1-4615-3588-1_7
YOSHIDA K, HASHIZUME K, ABIKO S. Zero reaction maneuver:flight validation with ETS-VII space robot and extension to kinematically redundant arm[C]//Proceedings 2001 ICRA. IEEE International Conference on Robotics and Automation(Cat. No.01CH37164). Seoul: IEEE,2006:441. DOI:10.1109/ROBOT.2001.932590
徐拴锋, 杨保华, 张笃周, 等. 空间机械臂自适应扩展雅克比零反作用控制[J]. 宇航学报,2014,35(7):786.XU Shuanfeng, YANG Baohua, ZHANG Duzhou,et al. Adaptive extended Jacobian zero reaction control for free-floating space manipulators[J]. Journal of Astronautics,2014,35(7):786. DOI:10.3873/j.issn.1000-1328.2014.07.007
VAFA Z, DUBOWSKY S. On the dynamics of manipulators in space using the virtual manipulator approach[C]//Proceedings of 1987 IEEE International Conference on Robotics and Automation. Raleigh: IEEE,1987:579. DOI:10.1109/ROBOT.1987.1088032
ZHANG Fuhai, FU Yili, HUA Lei,et al. Point-to-point planning for free-floating space manipulator with zero-disturbance spacecraft attitude[C]//2012 IEEE International Conference on Information and Automation. Shenyang: IEEE,2012:142. DOI:10.1109/ICInfA.2012.6246798
XU Wenfu, LIANG Bin, XU Yangsheng. Practical approaches to handle the singularities of a wrist-partitioned space manipulator[J]. Acta Astronautica,2011,68(1/2):269. DOI:10.1016/j.actaastro.2010.07.004
FROM P J, YTTERSTAD PETTERSEN K, GRAVDAHL J T. Singularity-free dynamic equations of spacecraft-manipulator systems[J]. Acta Astronautica,2011,69(11/12):1057. DOI:10.1016/j.actaastro.2011.06.014
WANG Mingming, LUO Jianjun, WALTER U. Trajectory planning of free-floating space robot using particle swarm optimization(PSO)[J]. Acta Astronautica,2015,112:77. DOI:10.1016/j.actaastro.2015.03.008
WANG Mingming, LUO Jianjun, FANG Jing,et al. Optimal trajectory planning of free-floating space manipulator using differential evolution algorithm[J]. Advances in Space Research,2018,61(6):1525. DOI:10.1016/j.asr.2018.01.011
CHEN Zhengcang, ZHOU Weijia. Path planning for a space-based manipulator system based on quantum genetic algorithm[J]. Journal of Robotics,2017,2017(1):3207950. DOI:10.1155/2017/3207950
RYBUS T, SEWERYN K, SASIADEK J Z. Control system for free-floating space manipulator based on nonlinear model predictive control(NMPC)[J]. Journal of Intelligent & Robotic Systems,2017,85(3):491. DOI:10.1007/s10846-016-0396-2
SHAO Xiangyu, YAO Weiran, LI Xiaolei,et al. Direct trajectory optimization of free-floating space manipulator for reducing spacecraft variation[J]. IEEE Robotics and Automation Letters,2022,7(2):2795. DOI:10.1109/LRA.2022.3143586
SENDA K, TANI Y. Autonomous robust skill generation using reinforcement learning with plant variation[J]. Advances in Mechanical Engineering,2014,6:276264. DOI:10.1155/2014/276264
HU Xiaodong, HUANG Xuexiang, HU Tianjian,et al. MRDDPG algorithms for path planning of free-floating space robot[C]//2018 IEEE 9th International Conference on Software Engineering and Service Science(ICSESS). Beijing: IEEE,2019:1079. DOI:10.1109/ICSESS.2018.8663748
DU Desong, ZHOU Qihang, QI Naiming,et al. Learning to control a free-floating space robot using deep reinforcement learning[C]//2019 IEEE International Conference on Unmanned Systems(ICUS). Beijing: IEEE,2020:519. DOI:10.1109/ICUS48101.2019.8995991
D’AMBROSIO M, CAPRA L, BRANDONISIO A,et al. Redundant space manipulator autonomous guidance for in-orbit servicing via deep reinforcement learning[J]. Aerospace,2024,11(5):341. DOI:10.3390/aerospace11050341
HU Yuhui, ZHOU Dong, YAO Weiran,et al. Deep Reinforcement Learning-based trajectory planning with continuous pose representation for 6-DoF free-floating space robot[J]. Aerospace Science and Technology,2025,166:110540. DOI:10.1016/j.ast.2025.110540
WU Yunhua, YU Zhicheng, LI Chaoyong,et al. Reinforcement learning in dual-arm trajectory planning for a free-floating space robot[J]. Aerospace Science and Technology,2020,98:105657. DOI:10.1016/j.ast.2019.105657
HOVELL K, ULRICH S. Laboratory experimentation of spacecraft robotic capture using deep-reinforcement-learning-based guidance[J]. Journal of Guidance, Control,and Dynamics,2022,45(11):2138. DOI:10.2514/1. G006656
SRIVASTAVA R, LIMA R, SAH R,et al. Deep reinforcement learning based control of rotation floating space robots for proximity operations in PyBullet[C]//2023 IEEE International Conference on Systems, Man,and Cybernetics(SMC). Honolulu: IEEE,2024:1224. DOI:10.1109/SMC53992.2023.10394028
ASHITH SHYAM R B, HAO Zhou, MONTANARO U,et al. Imitation learning for autonomous trajectory learning of robot arms in space[EB/OL].2020:arXiv:2008.04007.https://arxiv.org/abs/2008.04007
ASHITH SHYAM R B, HAO Zhou, MONTANARO U,et al. Autonomous robots for space:trajectory learning and adaptation using imitation[J]. Frontiers in Robotics and AI,2021,8:638849. DOI:10.3389/frobt.2021.638849
NING Yuming, LI Tuanjie, ZHANG Yulin,et al. An integrated framework of grasp detection and imitation learning for space robotics applications[J]. Chinese Journal of Mechanical Engineering,2025,38(1):139. DOI:10.1186/s10033-025-01321-8
XIANG Wuweikai, YAN Shaoze. Dynamic analysis of space robot manipulator considering clearance joint and parameter uncertainty:modeling,analysis and quantification[J]. Acta Astronautica,2020,169:158. DOI: DOI:10.1016/j.actaastro.2020.01.011
ZHAO Yang, BAI Zhengfeng. Dynamics analysis of space robot manipulator with joint clearance[J]. Acta Astronautica,2011,68(7/8):1147. DOI:10.1016/j.actaastro.2010.10.004
WANG Mingming, LUO Jianjun, YUAN Jianping,et al. An integrated control scheme for space robot after capturing non-cooperative target[J]. Acta Astronautica,2018,147:350. DOI:10.1016/j.actaastro.2018.04.016
SADEGHIAN H, VILLANI L, KESHMIRI M,et al. Task-space control of robot manipulators with null-space compliance[J]. IEEE Transactions on Robotics,2014,30(2):493. DOI:10.1109/TRO.2013.2291630
李醒飞, 王凡, 拓卫晓, 等. 基于NOB的线性自抗扰控制在惯性参考单元中的应用[J]. 控制与决策,2024,39(2):483.LI Xingfei, WANG Fan, TUO Weixiao,et al. Application of linear active disturbance rejection control based on NOB in inertial reference unit[J]. Control and Decision,2024,39(2):483. DOI:10.13195/j.kzyjc.2022.0659
LICEAGA-CASTRO J U, SILLER-ALCALÁ I I, ALCÁNTARA-RAMÍREZ R A. Least square identification using noise reduction disturbance observer[J]. International Journal of Mathematics and Computers in Simulation,2019,13:165
拓卫晓, 何梦洁, 李醒飞, 等. 扰动观测器在惯性参考单元位置校准中的应用[J]. 光学精密工程,2025,33(4):542.TUO Weixiao, HE Mengjie, LI Xingfei,et al. Application of disturbance observer to position calibration of inertial reference unit[J]. Optics and Precision Engineering,2025,33(4):542. DOI:10.37188/OPE.20253304.0542
郑艺裕, 崔祜涛, 王晓芳. 附着小天体的动态面鲁棒制导与控制方法[J]. 深空探测学报,2015,2(2):155.ZHENG Yiyu, CUI Hutao, WANG Xiaofang. Dynamic surface robust guidance and control for landing on asteroids[J]. Journal of Deep Space Exploration,2015,2(2):155. DOI:10.15982/j.issn.2095-7777.2015.02.009
DONG Kaikai, LUO Jianjun, DANG Zhaohui,et al. Tube-based robust output feedback model predictive control for autonomous rendezvous and docking with a tumbling target[J]. Advances in Space Research,2020,65(4):1158. DOI:10.1016/j.asr.2019.11.014
SANCHEZ J C, GAVILAN F, VAZQUEZ R. Chance-constrained model predictive control for near rectilinear halo orbit spacecraft rendezvous[J]. Aerospace Science and Technology,2020,100:105827. DOI:10.1016/j.ast.2020.105827
LIANG Binyan, CHEN Zhihong, GUO Meishan,et al. Space robot target intelligent capture system based on deep reinforcement learning model[J]. Journal of Physics: Conference Series,2021,1848(1):012078. DOI:10.1088/1742-6596/1848/1/012078
KRENN R, HIRZINGER G. Contact dynamics simulation for space robotics applications[C]//IEEE/RSJ 2008 International Conference on Intelligent Robots and Systems. Nice: IROS,2008
NENCHEV D N, YOSHIDA K. Impact analysis and post-impact motion control issues of a free-floating space robot subject to a force impulse[J]. IEEE Transactions on Robotics and Automation,1999,15(3):548. DOI:10.1109/70.768186
HOGAN N. Impedance control:an approach to manipulation[C]//1984 American Control Conference. San Diego: IEEE,2009:304
GE Dongming, SUN Guanghui, ZOU Yuanjie,et al. Impedance control of multi-arm space robot for the capture of non-cooperative targets[J]. Journal of Systems Engineering and Electronics,2020,31(5):1051. DOI:10.23919/JSEE.2020.000079
TAO Dong, ZHANG Qiang, CHU Xiaoyu,et al. Impedance-sliding mode control with force constraints for space robots capturing non-cooperative objects[J]. IEEE Access,2021,9:160163. DOI:10.1109/ACCESS.2021.3129835
ABU-DAKKA F J, SAVERIANO M. Variable impedance control and learning—a review[J]. Frontiers in Robotics and AI,2020,7:590681. DOI:10.3389/frobt.2020.590681
BUCHLI J, STULP F, THEODOROU E,et al. Learning variable impedance control[J]. The International Journal of Robotics Research,2011,30(7):820. DOI:10.1177/0278364911402527
SONG Peng, YU Yueqing, ZHANG Xuping. A tutorial survey and comparison of impedance control on robotic manipulation[J]. Robotica,2019,37(5):801. DOI:10.1017/s0263574718001339
SERAJI H. Adaptive admittance control:an approach to explicit force control in compliant motion[C]//Proceedings of the 1994 IEEE International Conference on Robotics and Automation. San Diego: IEEE,2002:2705. DOI:10.1109/robot.1994.350927
HASHTRUDI-ZAAD K, SALCUDEAN S E. Bilateral parallel force/position teleoperation control[J]. Journal of Robotic Systems,2002,19(4):155. DOI:10.1002/rob.10030
HU Bingshan, CHEN Huanlong, HAN Liangliang,et al. Research and ground verification of the force compliance control method for space station manipulator[J]. International Journal of Aerospace Engineering,2020,2020(1):8896610. DOI:10.1155/2020/8896610
LU Lang, YUE Chengfei, SHEN Qiang,et al. Hierarchical passivity-based force-position-configuration coordinated control of multi-branch spacecraft[J]. IEEE Transactions on Aerospace and Electronic Systems,2025,61(2):4223. DOI:10.1109/TAES.2024.3499911
HUANG Panfeng, XU Yangsheng, LIANG Bin. Dynamic balance control of multi-arm free-floating space robots[J]. International Journal of Advanced Robotic Systems,2005,2(2):13. DOI:10.5772/5797
ZHANG Long, JIA Qingxuan, CHEN Gang,et al. Pre-impact trajectory planning for minimizing base attitude disturbance in space manipulator systems for a capture task[J]. Chinese Journal of Aeronautics,2015,28(4):1199. DOI:10.1016/j.cja.2015.06.004
XU Shuanfeng, WANG Hanlei, ZHANG Duzhou,et al. Adaptive zero reaction motion control for free-floating space manipulators[J]. IEEE Transactions on Aerospace and Electronic Systems,2016,52(3):1067. DOI:10.1109/TAES.2016.130715
JIAO Chunting, LIANG Bin, WANG Xueqian. Adaptive reaction null-space control of dual-arm space robot for post-capture of non-cooperative target[C]//2017 29th Chinese Control and Decision Conference(CCDC). Chongqing: IEEE,2017:531. DOI:10.1109/CCDC.2017.7978151
HU Qinglei. Input shaping and variable structure control for simultaneous precision positioning and vibration reduction of flexible spacecraft with saturation compensation[J]. Journal of Sound and Vibration,2008,318(1/2):18. DOI:10.1016/j.jsv.2008.03.068
KONG Xianren, YANG Zhengxian. Combined feedback control and input shaping for vibration suppression of flexible spacecraft[C]//2009 International Conference on Mechatronics and Automation. Changchun: IEEE,2009:3257. DOI:10.1109/ICMA.2009.5246238
NENCHEV D N, YOSHIDA K, VICHITKULSAWAT P,et al. Reaction null-space control of flexible structure mounted manipulator systems[J]. IEEE Transactions on Robotics and Automation,1999,15(6):1011. DOI:10.1109/70.817666
WANG Mingming, LUO Jianjun, YUAN Jianping,et al. Detumbling control for kinematically redundant space manipulator post-grasping a rotational satellite[J]. Acta Astronautica,2017,141:98. DOI:10.1016/j.actaastro.2017.09.025
LIU Yuanqing, LIU Xiaofeng, CAI Guoping,et al. Trajectory planning and coordination control of a space robot for detumbling a flexible tumbling target in post-capture phase[J]. Multibody System Dynamics,2021,52(3):281. DOI:10.1007/s11044-020-09774-6
LIU Yuanqing, LIU Xiaofeng, CAI Guoping. Detumbling a flexible tumbling target using a space robot in post-capture phase[J]. The Journal of the Astronautical Sciences,2022,69(4):1048. DOI:10.1007/s40295-022-00334-y
赵曰艺. 面向星上环境的遥感图像云检测模型优化方法研究[D]. 西安: 西安电子科技大学,2024.ZHAO Yueyi. Research on optimization methods for remote sensing images cloud detection model in on-orbit environment[D]. Xi’an: Xidian University,2024. DOI:10.27389/d.cnki.gxadu.2024.001959
张鹏程, 武文波, 李强, 等. 面向星载边缘计算的遥感目标检测算法轻量化优化研究[J]. 空间控制技术与应用,2022,48(5):86.ZHANG Pengcheng, WU Wenbo, LI Qiang,et al. Lightweight of remote sensing object detection algorithm for spaceborne edge computing[J]. Aerospace Control and Application,2022,48(5):86. DOI:10.3969/j.issn.1674-1579.2022.05.010
XIE Lingxi, WEI Longhui, ZHANG Xiaopeng,et al. Towards AGI in computer vision:lessons learned from GPT and large language models[EB/OL].2023:arXiv:2306.08641.https://arxiv.org/abs/2306.08641
孙倩, 郑琳铄, 贾英民. 面向在轨捕获的空间机器人路径规划与控制综述[J]. 工程科学学报,2025,47(4):753.SUN Qian, ZHENG Linshuo, JIA Yingmin. A review on planning and control of space robots for on-orbit capture[J]. Chinese Journal of Engineering,2025,47(4):753. DOI:10.13374/j.issn2095-9389.2024.05.31.007
ZHAO Wenshuai, QUERALTA J P, WESTERLUND T. Sim-to-real transfer in deep reinforcement learning for robotics:a survey[C]//2020 IEEE Symposium Series on Computational Intelligence(SSCI). Canberra: IEEE,2021:737. DOI:10.1109/SSCI47803.2020.9308468
吕茂隆, 丁晨博, 韩浩然, 等. 基于深度强化学习的无人机自主感知-规划-控制策略[J]. 自动化学报,2025,51(6):1305.LV Maolong, DING Chenbo, HAN Haoran,et al. Autonomous perception-planning-control strategy based on deep reinforcement learning for unmanned aerial vehicles[J]. Acta Automatica Sinica,2025,51(6):1305. DOI:10.16383/j.aas.c240639
沈自才, 闫德葵. 空间辐射环境工程的现状及发展趋势[J]. 航天器环境工程,2014,31(3):229.SHEN Zicai, YAN Dekui. Present status and prospects of space radiation environment engineering[J]. Spacecraft Environment Engineering,2014,31(3):229. DOI:10.3969/j.issn.1673-1379.2014.03.001
朱光武, 李保权. 空间环境对航天器的影响及其对策研究[J]. 上海航天,2002(4):1.ZHU Guangwu, LI Baoquan. Space environment effect and countermeasure research on spacecraft[J]. Aerospace Shanghai,2002,19(4):1. DOI:10.19328/j.cnki.1006-1630.2002.04.001
李东方. 考虑动力学特性的关节部分失效故障空间机械臂轨迹优化与容错控制研究[D]. 北京: 北京邮电大学,2024.LI Dongfang. Research on trajectory optimization and fault-tolerant control of joint effectiveness partial loss faulty space manipulator considering dynamic characteristics[D]. Beijing: Beijing University of Posts and Telecommunications,2024. DOI:10.26969/d.cnki.gbydu.2024.000859