2025-07-17 15:32:01 | 来源: AICG工具箱
宇树G1人形机器人在跳舞流畅得被人质疑像AI生成的一样后,又练起少林功夫了。
机器人前瞻2月19日报道,今天,上海AI实验室、上海交通大学、浙江大学、香港大学、香港中文大学联合发布了一项新成果——BeamDojo强化学习框架,这是第一个可以让人形机器人在落脚点稀疏的危险地形上实现精细落脚点控制的基于学习的方法。
在像踏脚石、平衡木这类落脚点稀疏的危险地形上行走,对机器人腿部运动来说是一项巨大挑战。机器人需要精确处理感知信息,在安全区域内精准放置脚步,并在整个过程中保持基座稳定 ,才可以灵活安全地进行移动。
具体来说,主要有两大方面的技术难点:
四足机器人已经解决了在这种落脚点稀疏的危险地形上行走的问题,但是却很难把同样的方法套用到人形机器人上。因为大多数四足机器人的脚是点状,但人形机器人的脚通常被是多边形,为点状脚设计的落脚点奖励并不适用于多边形脚。基于学习的人形机器人运动研究,在复杂地形和精细落脚点上的灵活运动方面还是存在不少问题,用于评估脚步放置的奖励信号很稀疏,学习过程效率极低,难以获取可靠的感知信息。所以,研究团队开发了BeamDojo强化学习框架,可以让人形机器人在稀疏落脚点上能灵活移动。
在演示中,G1可以稳定地穿越多个面积狭小约20厘米宽、间距不一的像梅花桩一样的踏脚石。甚至,它还可以做到倒退着穿越踏脚石。
20厘米宽度的平衡木挑战也不在话下。
在平衡性方面。G1就算是在背负6千克重物、遭受外力干扰的情况下,也可以很好地穿越这些复杂地形。
网友评论:越看越像人形机器人去少林寺训练进修了,疑是中国功夫片场景流出。
据Huayi Wang介绍,这个框架主要有以下创新点:
设计了两阶段的强化学习训练策略,让机器人学习效率更高。第一阶段让机器人在平地进行训练,通过输入地形参数让算法在安全环境中预学习;第二阶段切换至实际任务地形中进行策略优化。研究团队为多边形脚掌量身定制了基于采样的落脚点奖励机制,并采用“双评价器”(double-critic)架构,来平衡密集移动奖励和稀疏落脚点奖励之间的学习过程。搭载基于激光雷达的高程地图系统,使机器人能实时感知地形细节,为精准落脚提供数据支持。可以实现零样本泛化,尽管G1在训练过程中并未接触过稀疏地形与平衡木,但它却能对各类稀疏落脚点地形做到零样本泛化。实验表明,BeamDojo在模拟环境中实现了高效学习,在现实世界中,该框架也能让人形机器人在稀疏落脚点上精准落脚并灵活移动,并在受到较大外部干扰的情况下也能在保持较高的成功率,还可以进一步应用到像沟壑等更多具有挑战性的复杂地形中。
热门榜单
GPTs:GPT Builder创建器
常用AIHi Echo — 网易有道
常用AI讯飞绘文
常用AIsharegpt
常用AILooria,ai好物推荐
常用AIInteriorAI,ai室内设计
常用AITextomap
常用AIFind Your Next Book--AI荐书
常用AICivitai
常用AI热门资讯
1335 万考生都在用的AI高考志愿应用,哪款最靠谱?
06-30刚刚,马斯克切脑全场震撼!插脑只要1.5秒,26年治愈失明,28年全人类变AI
06-30谷歌发布本地VLA模型,机器人界的“安卓系统”要来了?
06-30不融资、不烧钱,9人干半年,卖出5.7亿,这可能是AI时代最狠的创业故事
07-01对话清华大学张亚勤:智能体是大模型时代的APP
07-0180后华人零融资创业:1/10人力营收规模超Scale AI,谷歌OpenAI大模型的“秘密武器”
07-01AI大神Karpathy演讲刷屏:软件3.0时代已来,提示词就是新代码
07-01AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
01-09stable diffusion怎么进行文生图_stable diffusion参数怎么设置_SD模型
01-17Remini“黏土”滤镜玩法刷屏,幕后公司揭晓丨苹果将采用自研大模型改进iOS 18丨奥特曼MIT讲话:AI创业机会巨大
04-12