![]() |
![]() |
学术巷子 | 来自全球的每日最新论文
自然语言处理 | 计算机视觉 | 机器人 |
cs.RO方向,2025年4月25日更新论文15篇
|
[1] Robo-Troj:攻击基于大型语言模型的任务规划器 标题: Robo-Troj: Attacking LLM-based Task Planners 作者: Mohaiminul Al Nahian / Zainab Altaweel / David Reitano / Sabbir Ahmed / Saumitra Lohokare / Shiqi Zhang / Adnan Siraj Rakin 原文: [英文] [中文] 备注: None 摘要: 机器人需要任务规划方法来实现需要多个动作才能完成的目标。最近,大型语言模型(LLMs)在任务规划中表现出了令人印象深刻的性能。LLMs可以使用动作描述和目标生成逐步解决方案。尽管在基于LLM的任务规划中取得了成功,但关于这些系统的安全性研究仍然有限。在本文中,我们开发了Robo-Troj,这是第一个针对基于LLM的任务规划器的多触发后门攻击,这是这项工作的主要贡献。作为一种多触发攻击,Robo-Troj经过训练以适应机器人应用领域的多样性。例如,可以使用独特的触发词,如“herical”,来激活特定的恶意行为,例如在厨房机器人上切手。此外,我们开发了一种优化方法来选择最有效的触发词。通过展示基于LLM的规划器的脆弱性,我们旨在促进安全机器人系统的发展。 |
[2] 机器人操作臂在SE(3)上的统一力-阻抗控制的几何表述 标题: Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators 作者: Joohwan Seo / Nikhil Potu Surya Prakash / Soomi Lee / Arvind Kruthiventy / Megan Teng / Jongeun Choi / Roberto Horowitz 原文: [英文] [中文] 备注: Submitted to Control Decision Conference (CDC) 2025 摘要: 在本文中,我们提出了一种在SE(3)流形上的阻抗控制框架,该框架能够实现力跟踪,同时保证系统的无源性。基于统一力-阻抗控制(UFIC)和我们之前关于几何阻抗控制(GIC)的工作,我们开发了几何统一力阻抗控制(GUFIC),以通过微分几何的视角在控制器的公式中考虑SE(3)流形结构。与UFIC的情况一样,GUFIC利用能量罐增强技术来进行力跟踪和阻抗控制,以保证机械臂相对于外力的无源性。这确保了末端执行器在与不确定环境接触时保持安全,并跟踪期望的交互力。此外,我们通过引入速度和力场解决了UFIC公式中的非因果实现问题。由于其在SE(3)上的公式,所提出的GUFIC继承了GIC的理想SE(3)不变性和等变性属性,这有助于在将学习算法纳入控制律的机器学习应用中提高样本效率。所提出的控制律在需要跟踪SE(3)轨迹的场景下进行了仿真环境验证,结合了位置和方向,同时在表面施加力。代码可在此https URL获取。 |
[3] 多机器人网络中基于子框架的轴承刚性维护控制 标题: Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks 作者: J. Francisco Presenza / Ignacio Mas / J. Ignacio Alvarez-Hamelin / Juan I. Giribet 原文: [英文] [中文] 备注: 6 pages 摘要: 本文提出了一种新颖的方法,用于分析和控制具有动态拓扑的多机器人网络中的方位刚性。通过将系统的框架分解为子框架,我们将方位刚性这一全局属性表达为一组局部属性,其中刚性特征值作为自然的局部刚性度量。我们提出了一种去中心化、可扩展的基于梯度的控制器,该控制器仅使用方位测量来执行特定任务的命令。该控制器通过保持刚性特征值高于某一阈值来保持方位刚性,并且还避免了机器人之间的碰撞。模拟验证了该方案的有效性,信息交换仅限于子框架,突显了其可扩展性和实用性。 |
[4] MAT-DiSMech:一种基于离散微分几何的计算工具,用于模拟杆、壳和软体机器人 标题: MAT-DiSMech: A Discrete Differential Geometry-based Computational Tool for Simulation of Rods, Shells, and Soft Robots 作者: Radha Lahoti / M. Khalid Jawed 原文: [英文] [中文] 备注: Total 25 pages, 8 figures, open-source code available at this https URL 摘要: 准确且高效的仿真工具在机器人领域至关重要,它们能够在投入资源进行实际实验之前实现系统动态的可视化和控制律的验证。开发物理上准确的仿真工具在软体机器人中尤为具有挑战性,这主要是由于几何非线性变形的普遍存在。各种机器人仿真器通过使用简化的建模技术(如集总质量模型)来应对这一挑战,但这在实际应用中会导致物理不准确。另一方面,针对软结构的高保真仿真方法,如有限元分析,虽然提供了更高的准确性,但也导致了更高的计算成本。鉴于此,我们提出了一种基于离散微分几何的仿真器,它在物理准确性和计算速度之间提供了平衡。基于对软体机器人杆和壳体表示的广泛研究,我们的工具提供了一种以计算上可行的方式准确建模软体机器人的途径。我们基于MATLAB的开源框架能够模拟杆、壳及其组合的变形,主要利用隐式积分技术。软件设计是模块化的,用户可以自定义代码,例如,添加新的外力和施加自定义边界条件。我们提供了机器人领域常见力的实现,包括重力、接触力、动摩擦和粘性摩擦以及空气动力阻力。我们提供了几个示例,展示了仿真器的能力并验证了其物理准确性。开源代码可在此https URL获取。我们预计,所提出的仿真器可以作为一种有效的数字孪生工具,增强软体机器人研究中的Sim2Real路径。 |
[5] 用于动态四足行走的同时碰撞检测和力估计 标题: Simultaneous Collision Detection and Force Estimation for Dynamic Quadrupedal Locomotion 作者: Ziyi Zhou / Stefano Di Cairano / Yebin Wang / Karl Berntorp 原文: [英文] [中文] 备注: None 摘要: 在本文中,我们解决了使用关节编码器信息和仅依赖机器人动力学的四足行走同时碰撞检测和力估计问题。我们设计了一种交互多模型卡尔曼滤波器(IMM-KF),用于估计施加在机器人上的外力和多种可能的接触模式。该方法对任何步态模式设计都是不变的。我们的方法利用基于机器人动力学和编码器信息的外力伪测量信息。基于估计的接触模式和外力,我们为摆动腿设计了一种反射运动和顺应控制器,通过调整腿的参考运动来避免碰撞。此外,我们实施了一种力自适应模型预测控制器以增强平衡。仿真消融研究和实验表明了该方法的有效性。 |
[6] 基于测地长度动态运动基元的机器人打磨技能学习 标题: Robotic Grinding Skills Learning Based on Geodesic Length Dynamic Motion Primitives 作者: Shuai Ke / Huan Zhao / Xiangfei Li / Zhiao Wei / Yecan Yin / Han Ding 原文: [英文] [中文] 备注: None 摘要: 从人类工匠那里通过模仿学习来学习磨削技能已经成为机器人加工领域的一个关键研究课题。由于其强大的泛化能力和对外部干扰的鲁棒性,动态运动基元(DMPs)为机器人磨削技能学习提供了一种有前景的方法。然而,直接将DMPs应用于磨削任务面临挑战,例如低的方向精度、位置-方向-力不同步以及对表面轨迹的有限泛化。为了解决这些问题,本文提出了一种基于测地长度DMPs(Geo-DMPs)的机器人磨削技能学习方法。首先,开发了一种归一化的二维加权高斯核和内在均值聚类算法,以从多个演示中提取几何特征。然后,使用方向流形距离度量去除传统方向DMPs中的时间依赖性,从而通过Geo-DMPs实现精确的方向学习。进一步提出了一种同步编码框架,使用基于测地长度的相位函数联合建模位置、方向和力。该框架使机器人磨削动作能够在任意两个表面点之间生成。在机器人倒角磨削和自由曲面磨削实验中验证了所提出的方法在技能编码和生成方面实现了高几何精度和泛化。据我们所知,这是首次尝试使用DMPs在无模型表面上联合学习和生成位置、方向和力的磨削技能,为机器人磨削提供了一条新的路径。 |
[7] 展示伯克利轻型人形机器人:一种开源、易于获取且可定制的3D打印人形机器人 标题: Demonstrating Berkeley Humanoid Lite: An Open-source, Accessible, and Customizable 3D-printed Humanoid Robot 作者: Yufeng Chi / Qiayuan Liao / Junfeng Long / Xiaoyu Huang / Sophia Shao / Borivoje Nikolic / Zhongyu Li / Koushil Sreenath 原文: [英文] [中文] 备注: Accepted in Robotics: Science and Systems (RSS) 2025 摘要: 尽管人形机器人领域引起了极大的兴趣并取得了显著进展,但目前市面上大多数现有的商用硬件仍然价格高昂、闭源且在机器人社区中缺乏透明性。这种缺乏可及性和定制性的现状阻碍了该领域的发展以及人形技术的更广泛发展。为了解决这些挑战并促进人形机器人领域的民主化,我们展示了伯克利轻型人形机器人,这是一款设计为可访问、可定制并对整个社区有益的开源人形机器人。该设计的核心是一种用于执行器和机器人主体的模块化3D打印齿轮箱。所有组件都可以从广泛可用的电子商务平台采购,并使用标准桌面3D打印机制造,总硬件成本保持在5000美元以下(基于美国市场价格)。该设计强调模块化和易于制造。为了解决3D打印齿轮箱固有的局限性,例如与金属替代品相比强度和耐久性降低的问题,我们采用了摆线齿轮设计,在这种情况下提供了最佳的形状因子。对3D打印执行器进行了广泛的测试,以验证其耐用性并缓解对塑料组件可靠性的担忧。为了展示伯克利轻型人形机器人的能力,我们进行了一系列实验,包括使用强化学习开发运动控制器。这些实验成功展示了从仿真到硬件的零样本策略转移,突出了该平台在研究验证中的适用性。通过完全开源硬件设计、嵌入代码以及训练和部署框架,我们希望伯克利轻型人形机器人能成为推动人形机器人开发民主化的重要一步。所有资源均可在此https URL获取。 |
[8] 消除偏差的PnP用于立体视觉里程计:可证明的一致性和大规模定位 标题: Bias-Eliminated PnP for Stereo Visual Odometry: Provably Consistent and Large-Scale Localization 作者: Guangyang Zeng / Yuan Shen / Ziyang Hong / Yuze Hong / Viorela Ila / Guodong Shi / Junfeng Wu 原文: [英文] [中文] 备注: 10 pages, 7 figures 摘要: 在本文中,我们首先提出了一种用于立体视觉里程计(VO)的偏差消除加权(Bias-Eli-W)透视-n-点(PnP)估计器,并证明其一致性。具体而言,利用统计理论,我们开发了一种渐近无偏且$\sqrt {n}$-一致的PnP估计器,该估计器考虑了不同的3D三角测量不确定性,确保随着特征数量的增加,相对位姿估计收敛到真实值。接下来,在立体VO管道方面,我们提出了一个框架,该框架持续对当前特征进行三角测量以跟踪新帧,有效地解耦了位姿和3D点误差之间的时间依赖性。我们将Bias-Eli-W PnP估计器集成到所提出的立体VO管道中,创造了一种协同效应,增强了对位姿估计误差的抑制。我们在KITTI和Oxford RobotCar数据集上验证了我们方法的性能。实验结果表明,我们的方法:1)在大规模环境中显著改善了相对位姿误差和绝对轨迹误差;2)在不稳定和不可预测的机器人运动下提供可靠的定位。Bias-Eli-W PnP在立体VO中的成功实现表明,在具有高不确定性测量的机器人估计任务中信息筛选的重要性,并为PnP作为关键成分的多种应用提供了启示。 |
[9] 基于下一个视点估计的相机臂控制进行物体姿态估计 标题: Object Pose Estimation by Camera Arm Control Based on the Next Viewpoint Estimation 作者: Tomoki Mizuno / Kazuya Yabashi / Tsuyoshi Tasaki 原文: [英文] [中文] 备注: None 摘要: 我们开发了一种新方法来估计下一视点(NV),这对于零售店中用于产品展示机器人的简单形状产品的姿态估计非常有效。基于RGBD相机的神经网络(NN)姿态估计方法具有很高的准确性,但当相机在当前视点获取的纹理和形状特征较少时,其准确性会显著下降。然而,以往基于数学模型的方法难以估计有效的NV,因为简单形状的物体具有很少的形状特征。因此,我们关注姿态估计与NV估计之间的关系。当姿态估计更准确时,NV估计也更准确。因此,我们开发了一种新的姿态估计神经网络,可以同时估计NV。实验结果表明,我们的NV估计实现了77.3%的姿态估计成功率,比基于数学模型的NV计算高出7.4个百分点。此外,我们验证了使用我们方法的机器人展示了84.2%的产品。 |
[10] 使用激光雷达在杂乱和动态环境中飞行 标题: Flying through cluttered and dynamic environments with LiDAR 作者: Huajie Wu / Wenyi Liu / Yunfan Ren / Zheng Liu / Hairuo Wei / Fangcheng Zhu / Haotian Li / Fu Zhang 原文: [英文] [中文] 备注: None 摘要: 在拥挤和动态环境中导航无人机(UAV)仍然是一个重大挑战,尤其是在处理快速移动或突然出现的障碍物时。本文介绍了一种完整的基于激光雷达的系统,旨在使无人机能够在复杂环境中避开各种移动障碍物。得益于感知和规划的高计算效率,该系统可以使用机载计算资源实时运行,且具有低延迟。为了感知动态环境,我们将之前的工作M-detector集成到系统中。M-detector确保不同大小、颜色和类型的移动物体能够被可靠地检测到。为了规划动态环境,我们将动态物体预测纳入集成规划和控制(IPC)框架,即DynIPC。这种集成使无人机能够利用对动态障碍物的预测来有效地避开它们。我们通过模拟和现实世界实验验证了我们提出的系统。在模拟测试中,我们的系统在多个指标上优于最先进的基线,包括成功率、时间消耗、平均飞行时间和最大速度。在现实世界试验中,我们的系统成功地穿越森林,避开路径上的移动障碍物。 |
[11] 统一互补性约束与控制障碍函数以实现安全的全身机器人控制 标题: Unifying Complementarity Constraints and Control Barrier Functions for Safe Whole-Body Robot Control 作者: Rafael I. Cabral Muchacho / Riddhiman Laha / Florian T. Pokorny / Luis F.C. Figueredo / Nilanjan Chakraborty 原文: [英文] [中文] 备注: None 摘要: 安全关键的全身机器人控制需要能够实时确保避碰的反应方法。互补约束和控制障碍函数(CBF)已成为确保此类安全约束的核心工具,并且每个领域都得到了充分的发展。尽管它们解决了类似的问题,但它们之间的联系仍然很少被探索。本文通过正式证明这两种方法在采样数据的一阶系统中在单一和多重约束情境下的等价性,填补了这一空白。通过证明这种等价性,我们为这些技术提供了一个统一的视角。这种统一具有理论和实践意义,促进了在互补性和CBF框架之间的鲁棒性保证和算法改进的交叉应用。我们讨论了这些协同效益,并激励在更一般的情况下对这些方法进行比较的未来工作。 |
[12] 在施工监测中用于精确定位和偏差校正的BIM约束优化 标题: BIM-Constrained Optimization for Accurate Localization and Deviation Correction in Construction Monitoring 作者: Asier Bikandi / Muhammad Shaheer / Hriday Bavle / Jayan Jevanesan / Holger Voos / Jose Luis Sanchez-Lopez 原文: [英文] [中文] 备注: None 摘要: 增强现实(AR)应用在施工监测中依赖于实时的环境跟踪来可视化建筑元素。然而,由于施工现场的无特征表面、动态变化和漂移积累,传统的跟踪方法面临重大挑战,导致数字模型与物理世界之间的错位。本文提出了一种基于BIM的漂移校正方法来应对这些挑战。我们不再仅依赖于基于SLAM的定位,而是将从现实环境中检测到的“实建”平面与BIM中的“计划”建筑平面对齐。我们的方法执行稳健的平面匹配,并使用优化技术计算SLAM(S)和BIM(B)原点框架之间的变换(TF),以最小化随时间的漂移。通过将BIM作为先验结构知识,我们可以在嘈杂的施工环境中实现改进的长期定位和增强的AR可视化精度。该方法通过真实世界的实验进行了评估,显示出漂移引起的误差显著减少和优化的对齐一致性。平均而言,与用户最初的手动对齐相比,我们的系统在角度偏差上减少了52.24%,在匹配墙体的距离误差上减少了60.8%。 |
[13] 通过自然语言交互解决机器人任务歧义 标题: Robotic Task Ambiguity Resolution via Natural Language Interaction 作者: Eugenio Chisari / Jan Ole von Hartz / Fabien Despinoy / Abhinav Valada 原文: [英文] [中文] 备注: None 摘要: 最近,语言条件策略在机器人领域得到了广泛应用,因为它们允许用户使用自然语言指定任务,从而具有高度的通用性。尽管许多研究集中在提高语言条件策略的动作预测上,但对任务描述的推理却被大大忽视。模糊的任务描述常常导致下游策略的失败,因为机器人代理可能会误解任务。为了解决这一挑战,我们引入了AmbResVLM,这是一种新颖的方法,它将语言目标与观察到的场景联系起来,并明确地对任务模糊性进行推理。我们在模拟和现实世界的领域中广泛评估了其有效性,结果表明,与最近的最先进基线相比,它在任务模糊性检测和解决方面表现出色。最后,真实的机器人实验表明,我们的模型提高了下游机器人策略的性能,将平均成功率从69.6%提高到97.1%。我们在此https URL上公开了数据、代码和训练好的模型。 |
[14] 将基于学习的操作与基于物理的运动结合用于全身羽毛球机器人控制 标题: Integrating Learning-Based Manipulation and Physics-Based Locomotion for Whole-Body Badminton Robot Control 作者: Haochen Wang / Zhiwei Shi / Chengxi Zhu / Yafei Qiao / Cheng Zhang / Fan Yang / Pengjie Ren / Lan Lu / Dong Xuan 原文: [英文] [中文] 备注: Accepted to ICRA 2025. Project page: this https URL 摘要: 基于学习的方法,如模仿学习(IL)和强化学习(RL),能够在具有挑战性的敏捷机器人任务(如运动机器人)中产生出色的控制策略。然而,目前尚无工作将基于学习的策略与基于模型的方法相结合,以降低训练复杂性并确保敏捷羽毛球机器人控制的安全性和稳定性。在本文中,我们介绍了一种新颖的敏捷羽毛球机器人混合控制系统\ourmethod。具体来说,我们提出了一种用于底盘运动的基于模型的策略,为手臂策略提供基础。我们引入了一种物理启发的“IL+RL”训练框架,用于基于学习的手臂策略。在这个训练框架中,使用具有特权信息的基于模型的策略在IL和RL阶段指导手臂策略的训练。此外,我们在IL阶段训练评论模型,以缓解从IL过渡到RL时的性能下降问题。我们在自研的羽毛球机器人上展示了结果,对发球机的成功率达到94.5%,对人类玩家的成功率达到90.7%。我们的系统可以轻松推广到其他敏捷移动操作任务,如敏捷接球和乒乓球。我们的项目网站:this https URL。 |
[15] 夹持器关键姿态和物体点流作为双手机器人操作的接口 标题: Gripper Keypose and Object Pointflow as Interfaces for Bimanual Robotic Manipulation 作者: Yuyin Yang / Zetao Cai / Yang Tian / Jia Zeng / Jiangmiao Pang 原文: [英文] [中文] 备注: Published at Robotics: Science and Systems (RSS) 2025 摘要: 双手操作是一个具有挑战性但至关重要的机器人能力,要求精确的空间定位和多样化的运动轨迹,这对现有方法提出了重大挑战。现有方法分为两类:关键帧策略,该策略预测关键帧中的夹持器姿态并通过运动规划器执行;以及连续控制方法,该方法在每个时间步顺序估计动作。关键帧方法缺乏帧间监督,难以一致地执行或执行曲线运动,而连续方法则在空间感知方面较弱。为了解决这些问题,本文介绍了一种端到端框架PPI(关键姿态和点流接口),该框架将目标夹持器姿态和物体点流的预测与连续动作估计相结合。这些接口使模型能够有效地关注目标操作区域,而整体框架则引导多样化且无碰撞的轨迹。通过将接口预测与连续动作估计相结合,PPI在多样化的双手操作任务中表现出卓越的性能,提供了增强的空间定位和满足运动限制的灵活性。在广泛的评估中,PPI在模拟和现实世界实验中显著优于之前的方法,在RLBench2模拟基准上实现了+16.1%的性能提升,并在四个具有挑战性的现实世界任务中平均获得+27.5%的增益。值得注意的是,PPI在现实世界场景中表现出强大的稳定性、高精度和显著的泛化能力。项目页面:this https URL |