scholar lane logo wechat

学术巷子 | 来自全球的每日最新论文

自然语言处理 计算机视觉 机器人
cs.RO方向,2025年8月15日更新论文23
[1] 基于WiFi的全球定位在大规模环境中利用osmAG的结构先验
标题: WiFi-based Global Localization in Large-Scale Environments Leveraging Structural Priors from osmAG
作者: Xu Ma / Jiajie Zhang / Fujing Xie / Sören Schwertfeger
原文:   [英文]  
备注: None
摘要:
全球定位对于自主机器人至关重要,尤其是在GPS信号无法覆盖的室内环境中。我们提出了一种新颖的基于WiFi的定位框架,该框架利用无处不在的无线基础设施和OpenStreetMap区域图(osmAG)来实现大规模室内环境的定位。我们的方法将信号传播建模与osmAG的几何和拓扑先验相结合。在离线阶段,通过建模墙体衰减,迭代优化算法定位WiFi接入点(AP),实现了平均定位误差3.79米(比三边测量法提高了35.3%)。在在线阶段,实时机器人定位使用增强的osmAG地图,在指纹区域内实现了3.12米的平均误差(比KNN指纹识别提高了8.77%),在非指纹区域实现了3.83米的平均误差(提高了81.05%)。与基于指纹的方法相比,我们的方法在空间效率上更高,并且在没有指纹数据的位置上实现了更优的定位精度。该框架在一个复杂的11,025平方米多层环境中得到了验证,提供了一种可扩展、成本效益高的室内机器人定位解决方案,解决了被绑架机器人问题。代码和数据集可在此https URL获取。

[2] 系统约束公式化与使用凸集时空图的无碰撞轨迹规划
标题: Systematic Constraint Formulation and Collision-Free Trajectory Planning Using Space-Time Graphs of Convex Sets
作者: Matthew D. Osburn / Cameron K. Peterson / John L. Salmon
原文:   [英文]   [中文]  
备注: 21 pages with references, 20 figures
摘要:
在本文中,我们在复杂的动态环境中创建最优的、无碰撞的、时间相关的轨迹。由于存在许多空间和时间的约束条件,找到数值求解器的初始猜测变得困难。凸集图(GCS)和最近开发的时空凸集图(ST-GCS)使我们能够在不提供初始猜测的情况下生成最优的最小距离无碰撞轨迹。我们还探讨了通用GCS兼容约束的推导,并记录了一种将通用约束适应该框架的直观策略。我们展示了当环境是静态时,ST-GCS生成的轨迹与标准GCS公式等效。然后,我们展示了ST-GCS在动态环境中运行以找到最小距离的无碰撞轨迹。

[3] 用于稳健和反应性外骨骼运动合成的混合数据驱动预测控制
标题: Hybrid Data-Driven Predictive Control for Robust and Reactive Exoskeleton Locomotion Synthesis
作者: Kejun Li / Jeeseop Kim / Maxime Brunet / Marine Pétriaux / Yisong Yue / Aaron D. Ames
原文:   [英文]   [中文]  
备注: 8 pages; 8 figures
摘要:
在外骨骼中实现稳健的双足行走需要具备实时动态应对环境变化的能力。本文介绍了一种混合数据驱动预测控制(HDDPC)框架,这是对数据支持预测控制的扩展,通过同时规划足部接触时间表和连续域轨迹来应对这些挑战。所提出的框架利用Hankel矩阵表示法来建模系统动态,结合步间(S2S)转换以增强在动态环境中的适应性。通过将接触调度与轨迹规划相结合,该框架为运动合成提供了一种高效的统一解决方案,使得通过在线重新规划实现稳健和反应灵敏的行走。我们在Atalante外骨骼上验证了该方法,展示了其在稳健性和适应性方面的改进。

[4] ReconVLA:作为有效机器人感知器的重建视觉-语言-动作模型
标题: ReconVLA: Reconstructive Vision-Language-Action Model as Effective Robot Perceiver
作者: Wenxuan Song / Ziyang Zhou / Han Zhao / Jiayi Chen / Pengxiang Ding / Haodong Yan / Yuxin Huang / Feilong Tang / Donglin Wang / Haoang Li
原文:   [英文]   [中文]  
备注: None
摘要:
最近在视觉-语言-动作(VLA)模型方面的进展使得机器人代理能够将多模态理解与动作执行相结合。然而,我们的实证分析表明,当前的VLA在将视觉注意力分配到目标区域时存在困难。相反,视觉注意力总是分散的。为了引导视觉注意力正确地定位到目标上,我们提出了ReconVLA,这是一种具有隐式定位范式的重建型VLA模型。在模型的视觉输出的条件下,一个扩散变换器旨在重建图像的注视区域,该区域对应于目标操控对象。这个过程促使VLA模型学习细粒度的表示,并准确分配视觉注意力,从而有效利用特定任务的视觉信息并进行精确操控。此外,我们策划了一个大规模的预训练数据集,包括来自开源机器人数据集的超过10万条轨迹和200万条数据样本,进一步提升了模型在视觉重建方面的泛化能力。在模拟和现实世界中的大量实验表明,我们的隐式定位方法具有优越性,展示了其精确操控和泛化的能力。我们的项目页面是这个https URL。

[5] BEASST:基于行为熵梯度的移动机器人自适应源寻求
标题: BEASST: Behavioral Entropic Gradient based Adaptive Source Seeking for Mobile Robots
作者: Donipolo Ghimire / Aamodh Suresh / Carlos Nieto-Granda / Solmaz S. Kia
原文:   [英文]  
备注: None
摘要:
本文介绍了 BEASST(基于行为熵梯度的自适应源寻求移动机器人),这是一种用于复杂、未知环境中机器人源寻求的新框架。我们的方法使移动机器人能够通过将归一化信号强度建模为源位置的替代概率来有效地平衡探索和利用。基于行为熵(BE)和 Prelec 的概率加权函数,我们定义了一个目标函数,该函数根据信号可靠性和任务紧迫性调整机器人行为,从风险规避到风险寻求。该框架在单峰信号假设下提供理论收敛保证,并在有界干扰下提供实际稳定性。在 DARPA SubT 和多房间场景中的实验验证表明,BEASST 始终优于最先进的方法,通过智能的不确定性驱动导航实现路径长度减少 15% 和源定位速度提高 20%,在积极追踪和谨慎探索之间动态过渡。

[6] 基于少样本视觉的人类活动识别与基于多模态大语言模型的视觉强化学习
标题: Few-shot Vision-based Human Activity Recognition with MLLM-based Visual Reinforcement Learning
作者: Wenqi Zheng / Yutaka Arakawa
原文:   [英文]   [中文]  
备注: None
摘要:
在大型推理模型中应用强化学习可以通过对输出结果的反馈进行学习,这在微调数据有限的情况下尤为有用。然而,其在多模态人体活动识别(HAR)领域的应用仍然很少被探索。我们的工作将强化学习扩展到具有多模态大型语言模型的人体活动识别领域。通过在训练过程中引入视觉强化学习,模型在小样本识别上的泛化能力可以得到极大提升。此外,视觉强化学习可以增强模型的推理能力,并在推理阶段实现可解释的分析。我们将这种结合视觉强化学习的小样本人体活动识别方法命名为FAVOR。具体来说,我们的方法首先利用多模态大型语言模型(MLLM)为人体活动图像生成多个候选响应,每个响应包含推理轨迹和最终答案。然后使用奖励函数对这些响应进行评估,并使用群体相对策略优化(GRPO)算法对MLLM模型进行优化。通过这种方式,MLLM模型可以仅通过少量样本适应人体活动识别。在四个人体活动识别数据集和五种不同设置上的大量实验表明了所提方法的优越性。

[7] 一种用于上肢外骨骼安全和意图整合辅助的语义感知框架
标题: A Semantic-Aware Framework for Safe and Intent-Integrative Assistance in Upper-Limb Exoskeletons
作者: Yu Chen / Shu Miao / Chunyu Wu / Jingsong Mu / Bo OuYang / Xiang Li
原文:   [英文]   [中文]  
备注: None
摘要:
上肢外骨骼主要设计用于通过准确解读和响应人类意图来提供辅助支持。在家庭护理场景中,外骨骼需要根据任务的语义信息调整其辅助配置,并根据所操作对象的性质进行适当调整。然而,现有的解决方案往往缺乏理解任务语义或与用户协同规划动作的能力,限制了其通用性。为了解决这一挑战,本文引入了一个语义感知框架,将大型语言模型集成到任务规划框架中,从而实现安全且意图整合的辅助。所提出的方法首先让外骨骼在透明模式下运行,以捕捉佩戴者在抓取物体时的意图。一旦从任务描述中提取出语义信息,系统会自动配置适当的辅助参数。此外,基于扩散的异常检测器用于持续监控人机交互状态,并在检测到异常时触发实时重新规划。在任务执行过程中,在线轨迹优化和阻抗控制用于确保安全并调节人机交互。实验结果表明,所提出的方法能够有效地与佩戴者的认知对齐,适应语义变化的任务,并可靠地响应异常情况。

[8] 用于机器人感知的超级激光雷达反射率
标题: Super LiDAR Reflectance for Robotic Perception
作者: Wei Gao / Jie Zhang / Mingle Zhao / Zhiyuan Zhang / Shu Kong / Maani Ghaffari / Dezhen Song / Cheng-Zhong Xu / Hui Kong
原文:   [英文]   [中文]  
备注: None
摘要:
传统上,人类直觉通常将视觉定义为一种被动光学感知的模式,而主动光学感知通常被视为测量而不是视觉的默认模式。然而,情况现在发生了变化:传感器技术和数据驱动的范式使主动光学感知能够重新定义视觉的边界,迎来了主动视觉的新时代。光探测和测距(LiDAR)传感器捕捉物体表面的反射率,这在不同的光照条件下保持不变,在机器人感知任务中展现出显著的潜力,如检测、识别、分割和同时定位与地图构建(SLAM)。这些应用通常依赖于密集的感知能力,通常通过高分辨率、昂贵的LiDAR传感器实现。低成本LiDAR的一个关键挑战在于扫描数据的稀疏性,这限制了它们的广泛应用。为了解决这一限制,本文介绍了一种创新框架,用于从稀疏数据生成密集的LiDAR反射率图像,利用非重复扫描LiDAR(NRS-LiDAR)的独特属性。我们解决了关键挑战,包括反射率校准和从静态到动态场景域的过渡,促进了真实环境中密集反射率图像的重建。本文的主要贡献包括一个用于LiDAR反射率图像密集化的综合数据集、一种为NRS-LiDAR量身定制的密集化网络,以及使用生成的密集反射率图像的多种应用,如回环闭合和交通车道检测。

[9] 大模型赋能的具身人工智能:决策与具身学习综述
标题: Large Model Empowered Embodied AI: A Survey on Decision-Making and Embodied Learning
作者: Wenlong Liang / Rui Zhou / Yang Ma / Bing Zhang / Songlin Li / Yijia Liao / Ping Kuang
原文:   [英文]   [中文]  
备注: None
摘要:
具身人工智能(Embodied AI)旨在开发具有物理形态的智能系统,这些系统能够在现实世界环境中进行感知、决策、行动和学习,为实现通用人工智能(AGI)提供了一种有前景的途径。尽管经过数十年的探索,具身智能体在开放动态环境中实现人类水平的通用任务智能仍然具有挑战性。最近在大模型方面的突破通过增强感知、交互、规划和学习,革新了具身人工智能。在本文中,我们对大模型赋能的具身人工智能进行了全面综述,重点关注自主决策和具身学习。我们研究了分层和端到端决策范式,详细说明了大模型如何增强分层决策中的高层规划、低层执行和反馈,以及如何增强视觉-语言-行动(VLA)模型以实现端到端决策。对于具身学习,我们介绍了主流学习方法,深入阐述了大模型如何增强模仿学习和强化学习。我们首次将世界模型整合到具身人工智能的综述中,介绍了它们的设计方法及其在增强决策和学习中的关键作用。尽管取得了实质性进展,仍然存在挑战,这些挑战在本文结尾进行了讨论,可能成为进一步研究的方向。

[10] CorrectNav:自我校正飞轮赋能视觉-语言-动作导航模型
标题: CorrectNav: Self-Correction Flywheel Empowers Vision-Language-Action Navigation Model
作者: Zhuoyuan Yu / Yuxing Long / Zihan Yang / Chengyan Zeng / Hongwei Fan / Jiyao Zhang / Hao Dong
原文:   [英文]   [中文]  
备注: None
摘要:
现有的视觉与语言导航模型在执行指令时常常偏离正确的轨迹。然而,这些模型缺乏有效的错误纠正能力,阻碍了它们从错误中恢复。为了解决这一挑战,我们提出了自我纠正飞轮,一种新颖的后训练范式。我们的范式不将模型在训练集上的错误轨迹视为缺陷,而是强调其作为宝贵数据源的重要性。我们开发了一种方法来识别这些错误轨迹中的偏差,并设计了创新技术来自动生成用于感知和行动的自我纠正数据。这些自我纠正数据作为燃料推动模型的持续训练。当我们重新评估模型在训练集上的表现时,揭示了新的错误轨迹,此时自我纠正飞轮开始旋转。通过多次飞轮迭代,我们逐步增强了基于单目RGB的VLA导航模型CorrectNav。在R2R-CE和RxR-CE基准测试中,CorrectNav实现了新的最先进成功率,分别为65.1%和69.3%,超过了之前最佳的VLA导航模型8.2%和16.4%。在各种室内和室外环境中的真实机器人测试中,\method展示了其卓越的错误纠正能力、动态障碍物规避能力和长指令跟随能力。

[11] MASH:用于单一类人机器人运动的协作异构多智能体强化学习
标题: MASH: Cooperative-Heterogeneous Multi-Agent Reinforcement Learning for Single Humanoid Robot Locomotion
作者: Qi Liu / Xiaopeng Zhang / Mingshan Tan / Shuaikang Ma / Jinliang Ding / Yanjie Li
原文:   [英文]   [中文]  
备注: None
摘要:
本文提出了一种新颖的方法,通过协作异质多智能体深度强化学习(MARL)来增强单个类人机器人的运动能力。尽管大多数现有方法通常采用单智能体强化学习算法用于单个类人机器人或采用MARL算法用于多机器人系统任务,我们提出了一种不同的范式:应用协作异质MARL来优化单个类人机器人的运动能力。所提出的方法,即用于单类人运动的多智能体强化学习(MASH),将每个肢体(腿和手臂)视为独立的智能体,在共享全局评论家进行协作学习的同时探索机器人的动作空间。实验表明,MASH加速了训练收敛并提高了全身协作能力,优于传统的单智能体强化学习方法。这项工作推进了MARL在单类人机器人控制中的整合,为高效运动策略提供了新的见解。

[12] 使用面向对象编程实现通用机器人技能
标题: Enabling Generic Robot Skill Implementation Using Object Oriented Programming
作者: Abdullah Farrukh / Achim Wagner / Martin Ruskowski
原文:   [英文]   [中文]  
备注: 34th International Conference on Robotics in Alpe-Adria-Danube Region (RAAD 2025)
摘要:
开发机器人算法并将机器人子系统集成到更大的系统中可能是一项艰巨的任务。特别是在缺乏机器人专业知识的小型和中型企业(SMEs)中,实施、维护和开发机器人系统可能是一个挑战。因此,许多公司依赖系统集成商的外部专业知识,这在某些情况下可能导致供应商锁定和外部依赖。在智能制造系统的学术研究中,机器人在设计稳健的自主系统中起着关键作用。研究人员在希望将机器人系统作为更大智能系统的组件使用时,也面临类似的挑战,而不必详细处理机器人接口的复杂性和广泛性。在本文中,我们提出了一个软件框架,以减少部署工作机器人系统所需的努力。重点仅在于提供一个简化现代机器人系统不同接口的概念,并使用抽象层来适应不同制造商和型号。我们使用Python编程语言来实现该概念的原型。目标系统是一个包含Yaskawa Motoman GP4的料箱拣选单元。

[13] KDPE:一种用于扩散策略轨迹选择的核密度估计策略
标题: KDPE: A Kernel Density Estimation Strategy for Diffusion Policy Trajectory Selection
作者: Andrea Rosasco / Federico Ceola / Giulia Pasquale / Lorenzo Natale
原文:   [英文]   [中文]  
备注: 9th Conference on Robot Learning (CoRL 2025), Seoul, Korea
摘要:
在行为克隆领域,学习能够捕捉训练数据中多模态的机器人策略一直是一个长期未解决的挑战。最近的方法通过生成模型来建模条件动作分布以解决这一问题。其中一种方法是Diffusion Policy,它依赖扩散模型将随机点去噪为机器人动作轨迹。尽管达到了最先进的性能,但它有两个主要缺点,可能导致机器人在策略执行过程中偏离数据分布。首先,去噪过程的随机性可能会极大地影响生成动作轨迹的质量。其次,作为一种监督学习方法,它可能会从用于训练的数据集中学习到异常值。最近的工作集中在通过将Diffusion Policy与大规模训练或经典行为克隆算法结合来缓解这些限制。相反,我们提出了KDPE,一种基于核密度估计的策略,它在保持低测试时计算开销的同时,过滤掉Diffusion Policy输出的潜在有害轨迹。对于核密度估计,我们提出了一种流形感知核来为由末端执行器笛卡尔位置、方向和夹持器状态组成的动作建模概率密度函数。总体而言,KDPE在模拟的单臂任务和真实机器人实验中比Diffusion Policy表现更好。更多材料和代码可在我们的项目页面上获取,网址为this URL。

[14] MLM:学习用于带有机械臂的四足机器人多任务行走-操作的全身控制
标题: MLM: Learning Multi-task Loco-Manipulation Whole-Body Control for Quadruped Robot with Arm
作者: Xin Liu / Bida Ma / Chenkun Qi / Yan Ding / Zhaxizhuoma / Guorong Zhang / Pengan Chen / Kehui Liu / Zhongjie Jia / Chuyue Guan / Yule Mo / Jiaqi Liu / Feng Gao / Jiangwei Zhong / Bin Zhao / Xuelong Li
原文:   [英文]   [中文]  
备注: None
摘要:
四足机器人配备机械臂的全身运动操控仍然是一个具有挑战性的问题,特别是在实现多任务控制方面。为了解决这个问题,我们提出了MLM,一种由真实世界和模拟数据驱动的强化学习框架。该框架使得配备六自由度机械臂的四足机器人能够自主或在人工遥控下执行多任务的全身运动操控。为了解决在学习运动操控过程中平衡多任务的问题,我们引入了一个具有自适应、基于课程的采样机制的轨迹库。该方法使策略能够有效利用真实世界收集的轨迹来学习多任务运动操控。为了应对仅有历史观测的部署场景,并提高策略在不同空间范围任务中的执行性能,我们提出了一个轨迹-速度预测策略网络。该网络预测不可观测的未来轨迹和速度。通过利用大量的模拟数据和基于课程的奖励,我们的控制器在模拟中实现了全身行为,并能够零样本迁移到真实世界的部署。在模拟中的消融研究验证了我们方法的必要性和有效性,而在配备Airbot机械臂的Go2机器人上的真实世界实验则展示了该策略在多任务执行中的良好性能。

[15] 为什么要报告与机器人的失败互动?!走向基于小插图的互动质量
标题: Why Report Failed Interactions With Robots?! Towards Vignette-based Interaction Quality
作者: Agnes Axelsson / Merle Reimann / Ronald Cumbal / Hannah Pelikan / Divesh Lala
原文:   [英文]   [中文]  
备注: Accepted at the workshop on Real-World HRI in Public and Private Spaces: Successes, Failures, and Lessons Learned (PubRob-Fails), held at the IEEE RO-MAN Conference, 2025. 6 pages
摘要:
尽管随着大型语言模型(LLM)的出现,人机交互的质量有所提高,但与人际交互相比,系统仍然存在各种因素导致其次优。失败的性质和严重性通常取决于交互的上下文,因此无法在人机交互研究中实施的广泛场景和实验中进行概括。在这项工作中,我们提出使用一种在HRI领域被忽视的技术——民族志小插图,来清晰地突出这些失败,特别是那些很少被记录的失败。我们描述了撰写小插图过程背后的方法论,并基于我们在HRI系统中失败的个人经验创建了我们自己的小插图。我们强调小插图的优势在于能够从多学科的角度传达失败,促进对机器人能力的透明性,并记录研究报告中可能被遗漏的意外行为。我们鼓励使用小插图来增强现有的交互评估方法。

[16] 深度神经网络的合成与安全鲁棒自适应控制用于轮式移动机器人可靠运行
标题: Synthesis of Deep Neural Networks with Safe Robust Adaptive Control for Reliable Operation of Wheeled Mobile Robots
作者: Mehdi Heydari Shahna / Jouni Mattila
原文:   [英文]   [中文]  
备注: None
摘要:
深度神经网络(DNNs)可以通过避免动态建模来实现精确控制,同时保持较低的计算成本。然而,对于重型轮式移动机器人(WMRs)来说,部署这种黑箱方法仍然具有挑战性,因为它们需要遵循严格的国际标准,并容易出现故障和干扰。我们设计了一种用于重型WMRs的分层控制策略,由两个具有不同权限级别的安全层进行监控。为此,训练并部署了一种DNN策略作为主要控制策略,在正常操作条件下提供高精度性能。当外部干扰出现并达到一定强度,使系统性能低于预定阈值时,低级安全层会介入,通过停用主要控制策略并激活无模型鲁棒自适应控制(RAC)策略来进行干预。这种转换使系统能够继续运行,同时通过有效管理系统鲁棒性和响应性之间的固有权衡来确保稳定性。无论使用何种控制策略,高级安全层在操作期间持续监控系统性能。只有当干扰变得足够严重,以至于补偿不再可行并且继续操作会危及系统或其环境时,它才会启动关闭。所提出的DNN和RAC策略的综合保证了整个WMR系统的一致指数稳定性,同时在一定程度上遵循安全标准。通过使用一个6,000公斤的WMR进行实时实验,进一步验证了所提出方法的有效性。

[17] 用于模拟磁性软体机器人的开源用户友好界面:基于仿真开放框架架构 (SOFA)
标题: An Open-Source User-Friendly Interface for Simulating Magnetic Soft Robots using Simulation Open Framework Architecture (SOFA)
作者: Carla Wehner / Finn Schubert / Heiko Hellkamp / Julius Hahnewald / Kilian Scheafer / Muhammad Bilal Khan / Oliver Gutfleisch
原文:   [英文]  
备注: None
摘要:
软体机器人,特别是磁性软体机器人,需要专门的仿真工具来准确模拟其在外部磁场下的变形。然而,现有的平台通常缺乏对磁性材料的专门支持,使得不同专业水平的研究人员难以使用。本文介绍了一种使用仿真开放框架架构(SOFA)开发的开源、用户友好的仿真界面,专门用于模拟磁性软体机器人。该工具使用户能够定义材料属性、施加磁场,并实时观察由此产生的变形。通过集成直观的控制和应力分析功能,它旨在弥合理论建模与实际设计之间的差距。四个基准模型——一个梁、三指和四指抓手以及一个蝴蝶——展示了其功能。该软件的易用性使其对初学者和高级研究人员都很容易上手。未来的改进将通过实验验证和与行业标准有限元求解器的比较来提高精度,确保磁性软体机器人的仿真具有现实性和预测性。

[18] 用显著性区域偏置基于前沿的探索
标题: Biasing Frontier-Based Exploration with Saliency Areas
作者: Matteo Luperto / Valerii Stakanov / Giacomo Boracchi / Nicola Basilico / Francesco Amigoni
原文:   [英文]   [中文]  
备注: Accepted at the European Confrence on Mobile Robots (ECMR) 2025
摘要:
自主探索是一个被广泛研究的问题,其中机器人逐步构建一个先前未知环境的地图。机器人使用探索策略选择下一个要到达的位置。为此,机器人必须在相互竞争的目标之间取得平衡,比如尽可能快速地探索整个环境。大多数探索策略试图最大化已探索区域以加快探索速度;然而,它们没有考虑到环境的某些部分比其他部分更重要,因为这些部分会导致发现更大的未知区域。我们提出了一种方法,通过使用从神经网络获得的显著性图来识别\emph{显著区域},这些区域对探索具有高度兴趣。给定当前地图,该神经网络实现了一个终止标准,以估计环境是否可以被认为是完全探索的。我们利用显著区域来影响一些广泛使用的探索策略,并通过广泛的实验活动展示了这种知识可以显著影响机器人在探索过程中的行为。

[19] 为冗余机器人学习任务执行层次结构
标题: Learning Task Execution Hierarchies for Redundant Robots
作者: Alessandro Adami / Aris Synodinos / Matteo Iovino / Ruggero Carli / Pietro Falco
原文:   [英文]   [中文]  
备注: None
摘要:
现代机器人系统,如移动操作臂、人形机器人和带有机械臂的空中机器人,通常具有高度的冗余性,使它们能够同时执行多项任务。管理这种冗余性是实现可靠和灵活行为的关键。广泛使用的一种方法是任务堆栈(SoT),它在一个统一的框架内按优先级组织控制目标。然而,传统的SoT是由专家手动设计的,限制了其适应性和可访问性。本文介绍了一种新颖的框架,该框架能够从用户定义的目标中自动学习SoT的层次结构和参数。通过结合强化学习和遗传编程,系统在无需人工干预的情况下发现任务优先级和控制策略。基于直观指标(如精度、安全性和执行时间)的成本函数指导学习过程。我们通过在高冗余的双臂移动操作臂平台移动-YuMi上的模拟和实验验证了我们的方法。结果表明,学习到的SoT使机器人能够动态适应不断变化的环境和输入,在保持任务执行稳健的同时平衡竞争目标。这种方法为复杂机器人的冗余管理提供了一种通用且用户友好的解决方案,推进了以人为中心的机器人编程,并减少了对专家设计的需求。

[20] SET感知因素框架:迈向自主系统的可靠感知
标题: The SET Perceptual Factors Framework: Towards Assured Perception for Autonomous Systems
作者: Troi Williams
原文:   [英文]   [中文]  
备注: 4 pages, 4 figures, accepted to the Workshop on Public Trust in Autonomous Systems at the 2025 IEEE International Conference on Robotics & Automation
摘要:
未来的自主系统承诺带来显著的社会效益,但它们的部署也引发了关于安全性和可信度的担忧。一个关键问题是如何确保机器人感知的可靠性,因为感知是安全决策的基础。感知失败通常是由于复杂但常见的环境因素导致的,这可能引发事故,从而削弱公众的信任。为了解决这一问题,我们引入了SET(自我、环境和目标)感知因素框架。我们设计了该框架,以系统地分析天气、遮挡或传感器限制等因素如何对感知产生负面影响。为此,该框架使用SET状态树来分类这些因素的来源,并使用SET因素树来建模这些来源和因素如何影响物体检测或姿态估计等感知任务。接下来,我们利用这两种树开发感知因素模型,以量化特定任务的不确定性。我们的框架旨在通过提供一种透明且标准化的方法来识别、建模和传达感知风险,从而促进严格的安全保证,并培养公众对自主系统的更大理解和信任。

[21] 一种用于识别主观自我表露的多模态神经网络面向社交机器人
标题: A Multimodal Neural Network for Recognizing Subjective Self-Disclosure Towards Social Robots
作者: Henry Powell / Guy Laban / Emily S. Cross
原文:   [英文]   [中文]  
备注: Accepted at 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)
摘要:
主观自我披露是人类社交互动的重要特征。尽管社会和行为学文献中已经对主观自我披露的特征和后果进行了大量研究,但在开发能够准确模拟这一特征的计算系统方面,迄今为止的工作却很少。尤其是关于如何模拟人类与机器人伙伴进行自我披露的研究更是少之又少。随着我们需要社交机器人在各种社交环境中与人类协作并建立关系,这一问题变得愈发紧迫。在本文中,我们的目标是开发一个基于情感识别文献中的模型的定制多模态注意力网络,使用一个大型自我收集的自我披露视频语料库来训练该模型,并构建一个新的损失函数——尺度保持交叉熵损失,以改进该问题的分类和回归版本。我们的结果表明,使用我们新颖损失函数训练的表现最佳模型实现了0.83的F1分数,比最佳基线模型提高了0.48。这个结果在使社交机器人能够识别互动伙伴的自我披露方面取得了显著进展,这一能力对于具有社会认知的社交机器人将是至关重要的。

[22] CVIRO:基于李群的一致且紧耦合的视觉-惯性-测距里程计
标题: CVIRO: A Consistent and Tightly-Coupled Visual-Inertial-Ranging Odometry on Lie Groups
作者: Yizhi Zhou / Ziwei Kang / Jiawei Xia / Xuan Wang
原文:   [英文]  
备注: None
摘要:
超宽带(UWB)被广泛用于减轻视觉惯性里程计(VIO)系统中的漂移。保持一致性对于确保UWB辅助VIO系统的估计准确性至关重要。不一致的估计器会降低定位性能,而这种不一致主要源于两个主要因素:(1)估计器未能保持正确的系统可观测性,以及(2)假设UWB锚点位置已知,导致不适当地忽略了校准不确定性。在本文中,我们提出了一种基于李群的、一致且紧密耦合的视觉惯性测距里程计(CVIRO)系统。我们的方法将UWB锚点状态纳入系统状态,明确考虑UWB校准不确定性,并实现机器人和锚点状态的联合和一致估计。此外,通过利用李群的不变误差特性,确保了可观测性的一致性。我们通过分析证明,CVIRO算法自然保持系统的正确不可观测子空间,从而保持估计的一致性。大量的模拟和实验表明,与现有方法相比,CVIRO在定位准确性和一致性方面实现了更优的表现。

[23] 基于TLE的A2C代理用于地面覆盖轨道路径规划
标题: TLE-Based A2C Agent for Terrestrial Coverage Orbital Path Planning
作者: Anantha Narayanan / Battu Bhanu Teja / Pruthwik Mishra
原文:   [英文]   [中文]  
备注: 8 pages, 6 figures, 5 tables
摘要:
低地球轨道(LEO)的日益拥堵对地球观测卫星的高效部署和安全运行构成了持续的挑战。任务规划者现在不仅要考虑任务特定的要求,还要考虑与活跃卫星和太空碎片碰撞风险的增加。本文提出了一种使用优势演员-评论家(A2C)算法的强化学习框架,以优化卫星轨道参数,实现预定义地表半径内的精确地面覆盖。通过在自定义的OpenAI Gymnasium环境中将问题表述为马尔可夫决策过程(MDP),我们的方法使用经典的开普勒元素模拟轨道动力学。智能体逐步学习调整五个轨道参数——半长轴、偏心率、倾角、升交点赤经和近地点幅角——以实现目标地面覆盖。与近端策略优化(PPO)的比较评估表明,A2C的性能更优,累计奖励高出5.8倍(10.0对9.263025),同时在31.5倍更少的时间步内收敛(2,000对63,000)。A2C智能体在不同目标坐标下始终如一地实现任务目标,同时保持适合实时任务规划应用的计算效率。主要贡献包括:(1)一个基于TLE的轨道模拟环境,结合物理约束,(2)验证了演员-评论家方法在连续轨道控制中优于信任域方法,(3)展示了快速收敛能力,支持自适应卫星部署。这种方法确立了强化学习作为可扩展和智能LEO任务规划的计算高效替代方案。