职位要求
工作内容
1负责具身智能大模型在标准评估基准(如 RLBenchRobotWinRoboVerse 等)上的性能测试与评估;
2熟练使用 OXERDT-1BDROID 等具身智能数据集,开展模型推理能力泛化能力数据覆盖等多维度分析;
3设计并搭建机器人任务与评估场景,包括环境设定任务分解执行接口设计等,支持模型定量评估与对比分析;
4精通至少两种主流仿真平台(如 Isaac SimMuJoCoGenie),能够进行高保真度模拟实验;
5推动模型部署仿真测试与在真实机器人上的闭环验证,构建完整模型评估pipeline;
6协助研究团队完善具身智能评估体系,提升评估稳定性可复现性与覆盖面。
岗位要求
1熟悉并实际使用过多个具身智能评估基准(RLBenchRobotWinRoboVerse等);
2熟练掌握主流具身数据集(OXERDT-1BDROID等),了解其结构与使用方式;
3有机器人任务设计经验,理解任务结构成功定义与反馈机制;
4至少熟练掌握两种主流仿真环境(Isaac SimMuJoCoGenie等),有场景构建仿真部署经验;
5有模型部署到仿真/真实机器人的测试经验,了解评估中的指标设定与性能对比方法;
6有机器人平台项目经验开发过benchmark开源贡献或顶会论文者优先(如 ICRACoRLRSSNeurIPS 等)。