达摩院

  • 在机器人操控领域,“精准响应指令、预判环境变化、稳定执行动作” 始终是核心挑战——现有视觉 - 语言 - 动作(VLA)模型缺乏对物理规律的理解与未来场景的想象,而世界模型虽能预测环境动态,却无法直接生成执行动作。 阿里巴巴达摩院、湖畔实验室等团队联合提出的RynnVLA-002,以 “VLA 模型与世界模型双向增强” 为核心思路,...
    具身智能之心 2025-11-25 08:00:00
  • 本文给大家带来 ICCV 2025 中「阿里巴巴达摩院」相关论文,论文选择 P 站(PaperScope.ai)ICCV 2025 数据库,解读由闻星使用 Intern-S1 等 AI 生成!(1) 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining论文简介:由浙江大学、阿里巴巴达摩院等机构提出了Multimodal Textbook,该工作构建了一...
    机智流 2025-10-18 16:21:32
  • 将人类演示转化为通用操作技能——机器人学习的“金矿”在具身智能领域,机器人操控始终受限于大规模高质量数据稀缺的难题 —— 传统方法依赖物理机器人遥操作采集数据,不仅成本高、效率低,还难以覆盖复杂场景。阿里达摩院最新发布的 RynnVLA-001 模型,从1200万第一视角操控视频中训练图像 - 视频生成能力,再结合人类关键点轨...
    深蓝具身智能 2025-09-27 10:56:00