2025-08-26 09:22:05 | 来源: AICG工具箱
8月15日消息,智元机器人昨天通过公众号宣布,推出行业首个面向真实世界机器人操控的统一世界模型平台---GenieEnvisioner(GE)。
根据官方介绍,不同于传统“数据—训练—评估”割裂的流水线模式,GE将未来帧预测、策略学习与仿真评估首次整合进以视频生成为核心的闭环架构,使机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。基于3000小时真机数据,GE-Act不仅在跨平台泛化和长时序任务执行上显著超越现有SOTA,更为具身智能打开了从视觉理解到动作执行的全新技术路径。
附开源有关链接:
Projectpage:https://genie-envisioner.github.io/
Arxiv:https://arxiv.org/abs/2508.05635
Github:https://github.com/AgibotTech/Genie-Envisioner
GE平台通过构建统一的视频生成世界模型,将这些分散的环节集成到一个闭环系统中。基于约3000小时的真实机器人操控视频数据,GE建立了从语言指令到视觉空间的直接映射,保留了机器人与环境交互的完整时空信息。
基于强大的视觉空间预训练,GE-Act仅需极少量数据即可实现跨平台迁移。在AgilexCobotMagic和DualFranka等全新机器人平台上,GE-Act仅使用1小时(约250个演示)的遥操作数据就实现了高质量的任务执行。
智元方面表示,团队将开源全部代码、预训练模型和评测工具。GE通过视觉中心的世界建模,为机器人学习开辟了新的技术路径。GE的发布,标志着机器人从被动执行向主动‘想象—验证—行动’的转变。未来,将扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人的落地应用。
相关阅读:
《智元发布首个世界模型开源平台“GenieEnvisioner”,让机器人先彩排再上岗》
热门榜单
剪映
常用AIEmo-阿里巴巴的AI视频生成框架
常用AI讯飞绘文
常用AITutorAI
常用AILiblibAI·哩布哩布AI
常用AIProdia
常用AI星火绘镜
常用AIWink Studio
常用AIGPTs:GPT Builder创建器
常用AI热门资讯
有哪些好用的AI工具_AI工具测评使用_
12-31谷歌Gemini Pro 1.5「百万Tokens长文本」免费全量开放!一小时电影“投喂”进去,大模型直出神级影评
04-17盘点50个目前最火的AIGC应用工具:ChatGPT占据60%+份额,90%公司已开始盈利
05-15GPT-4o回来了,评论区炸了
08-19商汤「日日新」5.0大模型上新:现场“暴打”GPT-4,端侧小模型SenseChat Lite效率突出,多项测评击败Llama 2
04-13波士顿动力最新电驱版Atlas机器人,完美复刻《午夜凶铃》贞子女鬼经典动作
04-15Sora发布了首支音乐MV《Worldweight》丨天工大模型3.0细节披露:4000亿参数丨抖音禁止发布“AI复活”视频
04-17苹果公布AI大模型研发进展,执行性能优于GPT-4丨阿里云启用首个「AI001号」AI员工丨昆仑万维AI音乐生成模型开启邀测
04-17美女主播广告刷爆外网!「Arcads」打造今年最逼真的AI数字人视频:情绪饱满动作丝滑,好事者发现搞钱新思路
04-17国行iPhone搭载文心一言!百度将为苹果国行iPhone/iPad/Mac提供AI功能
04-18