scholar lane logo wechat

学术巷子 | 来自全球的每日最新论文

自然语言处理 计算机视觉 机器人
cs.RO方向,2025年1月15日更新论文9
[1] 基于学习的四旋翼无人机GPS欺骗攻击检测
标题: Learning-based Detection of GPS Spoofing Attack for Quadrotors
作者: Pengyu Wang / Zhaohua Yang / Jialu Li / Ling Shi
原文:   [英文]   [中文]  
备注: Accepted in IEEE Industrial Electronics Society Annual Online Conference
摘要:
安全关键的网络物理系统(CPS),如四旋翼无人机,特别容易受到网络攻击,如果不能及时准确地检测到这些攻击,可能会导致严重后果。在户外操作中,无人机系统的非线性动态特性与非高斯噪声相结合,对传统统计和机器学习方法的有效性构成了挑战。为克服这些限制,我们提出了QUADFormer,这是一种利用基于Transformer架构的四旋翼无人机高级攻击检测框架。该框架具有一个残差生成器,能够生成对异常敏感的序列,这些序列随后由Transformer分析以捕捉统计模式进行检测和分类。此外,警报机制确保无人机即使在受到攻击时也能安全运行。大量的模拟和实验评估表明,QUADFormer在检测准确性方面优于现有的最先进技术。

[2] 使用涡流夹持器对复杂几何形状的软组织进行低接触抓取
标题: Low-Contact Grasping of Soft Tissue with Complex Geometry using a Vortex Gripper
作者: Roman Mykhailyshyn / Ann Majewicz Fey
原文:   [英文]   [中文]  
备注: Submitted to T-MRB
摘要:
软组织操作是大多数外科手术的重要组成部分;然而,今天使用的绝大多数外科钳夹都是由硬材料制成的,如金属或硬塑料。此外,这些钳夹主要通过将组织夹在两个硬物体之间来实现组织操作。因此,在接触过程中施加过大力的可能性很高,从而可能损伤组织。作为一种替代方法,使用气动涡流开发的钳夹可以潜在地悬浮软组织,从而实现低接触力甚至无接触力的操作。在本文中,我们展示了涡流钳夹的设计,并对其在抓取四种常见形状的软表面时的力特性进行了全因子研究,这些表面具有凸面和凹面曲率,曲率半径范围涵盖10种不同的半径,总计40种独特的表面。通过改变钳夹设计中喷嘴元件的参数,可以研究涡流钳夹的质量流量参数对所有这些不同软表面的提升力的影响。我们进行了一个体外实验,测试了抓取生物组织和各种形状的软球,以展示所提议技术的优缺点。获得的结果使我们找到了涡流技术在使用中的局限性以及其在医疗应用中改进的后续阶段。

[3] AI导盲犬:智能手机上的自我中心路径预测
标题: AI Guide Dog: Egocentric Path Prediction on Smartphone
作者: Aishwarya Jadhav / Jeffery Cao / Abhishree Shetty / Urvashi Priyam Kumar / Aditi Sharma / Ben Sukboontip / Jayant Sravan Tamarapalli / Jingyi Zhang / Anirudh Koul
原文:   [英文]   [中文]  
备注: None
摘要:
本文介绍了AI导盲犬(AIGD),这是一种为视障人士设计的轻量级自我中心导航辅助系统,可在智能手机上实时部署。AIGD通过采用仅依赖视觉的多标签分类方法来预测方向指令,解决了盲人导航中的关键挑战,确保在各种环境中的安全通行。我们提出了一种新颖的技术,通过整合GPS信号和高级方向指令,实现基于目标的户外导航,同时解决了无目的地室内导航中的不确定多路径预测问题。我们的通用模型是第一个能够处理室内和室外环境中目标导向和探索性导航场景的导航辅助系统,建立了盲人导航领域的新标杆。我们展示了方法、数据集、评估和部署见解,以鼓励在辅助导航系统方面的进一步创新。

[4] 检查清单:用于机器人抛光的安全可变阻抗学习
标题: CHEQ-ing the Box: Safe Variable Impedance Learning for Robotic Polishing
作者: Emma Cramer / Lukas Jäschke / Sebastian Trimpe
原文:   [英文]   [中文]  
备注: None
摘要:
机器人系统越来越多地用于工业自动化,其中像抛光这样的接触密集型任务需要灵巧性和顺应性行为。这些任务难以建模,使得经典控制具有挑战性。深度强化学习(RL)通过直接从数据中学习模型和控制策略,提供了一种有前途的解决方案。然而,其在现实世界问题中的应用受到数据效率低和不安全探索的限制。自适应混合RL方法自适应地结合了经典控制和RL,结合了两者的优势:来自控制的结构和来自RL的学习。这导致了数据效率和探索安全性的改进。然而,它们在硬件应用中的潜力仍未得到充分探索,目前尚无在物理系统上的评估。这样的评估对于全面评估这些方法在现实环境中的实用性和有效性至关重要。本文展示了混合RL算法CHEQ在具有可变阻抗的机器人抛光中的实验演示,这是一项需要精确力和速度跟踪的任务。在模拟中,我们表明可变阻抗提高了抛光性能。我们比较了独立的RL和自适应混合RL,证明了CHEQ在遵循安全约束的同时实现了有效学习。在硬件上,CHEQ实现了有效的抛光行为,仅需八小时的训练并仅发生五次失败。这些结果突显了自适应混合RL在直接在硬件上训练的现实世界接触密集型任务中的潜力。

[5] HydroelasticTouch:具有水弹性接触表面的触觉传感器模拟
标题: HydroelasticTouch: Simulation of Tactile Sensors with Hydroelastic Contact Surfaces
作者: David P. Leins / Florian Patzelt / Robert Haschke
原文:   [英文]   [中文]  
备注: None
摘要:
由于最近在开发廉价且高分辨率的触觉传感器方面的进展,触觉传感在接触丰富的机器人操作任务中变得流行。随着数据驱动方法的兴起及其对大量数据集的需求,触觉研究社区出现了几种模拟触觉传感器的方法,以克服现实世界数据收集的限制。这些模拟方法可以分为两大类:快速但不准确的(软)点接触模型和慢速但准确的有限元建模。在这项工作中,我们提出了一种使用水弹性接触模型模拟基于压力的触觉传感器的新方法,该方法在合理的计算成本下提供了高度的物理现实感。该模型为软对软和软对刚的接触以及非凸接触表面生成平滑的接触力。压力值在接触表面的每个点进行近似,并可以集成以计算传感器输出。我们通过进行零样本模拟到真实的模型转移来验证我们模型合成真实世界触觉数据的能力,以进行物体状态估计。我们的模拟作为一个插件提供给我们基于MuJoCo的开源模拟器。

[6] 基于混合动作的多目标兼容自动驾驶强化学习
标题: Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving
作者: Guizhe Jin / Zhuoren Li / Bo Leng / Wei Han / Lu Xiong / Chen Sun
原文:   [英文]   [中文]  
备注: 12 pages, 9 figures, 5 tables
摘要:
强化学习(Reinforcement Learning, RL)在解决自动驾驶的决策和控制问题上表现出色,并且在各种驾驶场景中应用越来越广泛。然而,驾驶是一个多属性问题,这导致当前RL方法在实现多目标兼容性方面面临挑战,特别是在策略执行和策略迭代中。一方面,常见的单一动作类型的动作空间结构限制了驾驶的灵活性,或者在策略执行过程中导致行为波动较大。另一方面,多属性加权的单一奖励函数导致智能体在策略迭代过程中对某些目标的关注不成比例。为此,我们提出了一种具有混合参数化动作的多目标集成评论家强化学习方法,以实现多目标兼容的自动驾驶。具体而言,构建了一个参数化动作空间,以生成混合驾驶动作,结合抽象指导和具体控制命令。构建了一个多目标评论家架构,考虑了多属性奖励,以确保同时关注不同的驾驶目标。此外,引入了基于不确定性的探索策略,以帮助智能体更快地接近可行的驾驶策略。在模拟交通环境和HighD数据集上的实验结果表明,我们的方法在驾驶效率、动作一致性和安全性方面实现了多目标兼容的自动驾驶。它在显著提高训练效率的同时增强了驾驶的整体性能。

[7] 使用多臂强盗进行数据驱动的空间分类以监测能量受限的移动机器人
标题: Data-driven Spatial Classification using Multi-Arm Bandits for Monitoring with Energy-Constrained Mobile Robots
作者: Xiaoshan Lin / Siddharth Nayak / Stefano Di Cairano / Abraham P. Vinod
原文:   [英文]   [中文]  
备注: 8 pages, 6 figures. See this https URL for an overview of the approach along with videos of the hardware experiments
摘要:
我们研究了使用由移动机器人协调团队收集的数据进行监测的空间分类问题。这类分类问题在多个应用中出现,包括搜救和精准农业。具体来说,我们希望使用一组移动传感器和移动充电站尽快将搜索环境的区域分类为有趣和无趣。我们开发了一种数据驱动的策略,该策略能够处理传感数据中的噪声和传感器的有限能量容量,并为团队生成无碰撞的运动计划。我们提出了一种双层方法,其中高层规划器利用多臂赌博机框架,根据在线收集的数据确定无人机下一步访问的潜在感兴趣区域。然后,基于整数规划的低层路径规划器协调团队的路径,以在物理约束下访问目标区域。我们描述了所提出方法的几个理论特性,包括随时保证和任务完成时间。我们在模拟中展示了我们方法的有效性,并进一步通过使用移动机器人进行的物理实验验证了这些观察结果。

[8] FDPP:通过人类偏好微调扩散策略
标题: FDPP: Fine-tune Diffusion Policy with Human Preference
作者: Yuxin Chen / Devesh K. Jha / Masayoshi Tomizuka / Diego Romeres
原文:   [英文]  
备注: None
摘要:
从人类示范中进行模仿学习使机器人能够执行复杂的操作任务,并且最近取得了巨大的成功。然而,这些技术通常难以适应新的偏好或环境的变化。为了解决这些限制,我们提出了基于人类偏好的微调扩散策略(FDPP)。FDPP通过基于偏好的学习来学习奖励函数。然后,这个奖励用于通过强化学习(RL)微调预训练的策略,从而使预训练的策略与新的人工偏好对齐,同时仍然解决原始任务。我们在各种机器人任务和偏好上的实验表明,FDPP能够有效地定制策略行为而不影响性能。此外,我们展示了在微调过程中加入Kullback-Leibler(KL)正则化可以防止过拟合,并有助于保持初始策略的能力。

[9] VINGS-Mono:大场景中的视觉惯性高斯点云单目SLAM
标题: VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes
作者: Ke Wu / Zicheng Zhang / Muer Tie / Ziqing Ai / Zhongxue Gan / Wenchao Ding
原文:   [英文]   [中文]  
备注: None
摘要:
VINGS-Mono 是一个用于大场景的单目(惯性)高斯喷射(GS)SLAM 框架。该框架由四个主要组件组成:VIO 前端、2D 高斯地图、NVS 回环检测和动态擦除器。在 VIO 前端,RGB 帧通过密集束调整和不确定性估计来处理,以提取场景几何和位姿。基于此输出,映射模块逐步构建和维护 2D 高斯地图。2D 高斯地图的关键组件包括基于样本的光栅化器、评分管理器和位姿优化,它们共同提高了映射速度和定位精度。这使得 SLAM 系统能够处理多达 5000 万个高斯椭球体的大规模城市环境。为了确保大规模场景的全局一致性,我们设计了一个回环检测模块,该模块创新性地利用高斯喷射的新视图合成功能进行回环检测和高斯地图的校正。此外,我们提出了一个动态擦除器,以解决现实世界户外场景中不可避免的动态物体问题。在室内和室外环境中的广泛评估表明,我们的方法在定位性能上与视觉惯性里程计相当,同时超越了最近的 GS/NeRF SLAM 方法。在映射和渲染质量方面,它也显著优于所有现有方法。此外,我们开发了一款移动应用程序,并验证了我们的框架可以仅使用智能手机摄像头和低频 IMU 传感器实时生成高质量的高斯地图。据我们所知,VINGS-Mono 是第一个能够在户外环境中运行并支持公里级大场景的单目高斯 SLAM 方法。