作者头像

深蓝具身智能

深蓝学院旗下专注于具身智能与大模型的资讯与干货分享

资讯151
资讯

视觉导航大一统!三大顶尖机构联合发布:UniWM 陌生场景成功率飙升 30%

封面图

当前视觉导航作为具身智能与自主系统的核心能力,需实现智能体对第一视角视觉输入的解读及目标导向的连续动作选择,但其发展受两大关键问题制约:直接策略方法(如 GNM、NoMaD)虽在熟悉环境有效,但过度依赖训练数据,陌生场景适应性差;模块化方法(如 NavCoT、NWM)将规划器与世界模型分离训练,且缺乏轨迹记忆,导致状...

2025-10-29 10:56:00

全国高校具身智能师资培训(第二期)将于11月7日-11月9日开班

封面图

各相关单位:当前,具身智能技术正以前所未有的速度蓬勃发展,深刻重塑多领域发展格局,成为推动科技创新与产业升级的核心驱动力。为深化具身智能领域产学研深度融合,赋能高等学校、科研院所培育契合行业需求的专业人才,中国图象图形学学会、深蓝学院、松灵机器人、上海交通大学溥渊未来技术学院拟联合举办 “全国高校具身...

2025-10-29 10:56:00

端到端 VLA 跨场景领先!双 buff 加持,让机器人拥有"深度感知"能力,成功率大幅提升?

封面图

在机器人操作领域,如何让AI既能理解语言指令,又能精准感知3D空间,一直是个难题。近日,清华大学&星海图研究团队提出的DepthVLA,通过融合深度预测专家模块,让视觉-语言-动作模型具备了更强的空间推理能力。我们开设此账号,想要向各位对【具身智能】感兴趣的人传递最前沿最权威的知识讯息外,也想和大家一起见证它到底...

2025-10-28 10:56:00

是“爆冷”还是“实力”?它在拥有60%市占率的「行业霸主」家门口,撕开了行业垄断格局!

封面图

15公斤的“钢镚”,在行业霸主主场,完成了一场“以弱胜强”的逆袭……上图,是来自曼彻斯特大学的ZsiMan高校战队,使用智身科技钢镚L1机器狗,在IROS四足机器人挑战赛中,首次参赛即夺冠的画面!它面前,是体重50公斤级的“重型选手”;它身后,是霸占赛场的宇树科技机器狗——2024年冠军平台,本届比赛参赛队伍使用的“标配”。然而,...

2025-10-27 10:56:00

一周学术爆点|机器人 “小脑” 再升级,清北立评估标准,多家明星模型表现堪忧?

封面图

今天是10月26日大家周末好7 篇本周关注到的学术进展(要点版)【密歇根大学联合佐治亚理工学院】提出一种将模型预测控制(MPC)与基于随机傅里叶特征(RFF)的在线学习残差动力学相结合的框架。【美国犹他大学】提出Round-Robin Behavior Cloning (R2BC) 方法,允许人类操作员轮流遥控每个机器人,生成单智能体示范。【华盛...

2025-10-26 18:30:06

搞模仿学习,还是强化学习?Meta用新范式构建了一个二者的“中间地带”!

封面图

在传统方案中,模仿学习依赖人工标注的专家示范数据,让智能体无法从自身行为后果中学习;强化学习虽能通过试错优化,但需环境提供可验证的奖励信号,要么缺失要么延迟,训练效率极低。Meta等团队提出的 “Early Experience(早期经验学习)”,正为语言智能体训练破局——让智能体在无外部奖励的情况下,主动提出替代动作并收...

2025-10-25 10:56:00

从 VLA 到 Thinking VLA!谷歌 DeepMind 新模型刷屏,具身推理性能直接翻倍?

封面图

给VLA加上「Thinking」上图展示了:在机器人收拾伦敦之行的行李时,会先查看天气预告,然后思考 “伦敦可能下雨”,最后主动把雨伞放进箱子。这是 Google DeepMind 最新发布的 Gemini Robotics 1.5——具备自主推理与决策能力的“智能体”。长期以来,具身智能的发展深陷于三大核心瓶颈:技能难以泛化、任务缺乏连贯逻辑、推理与...

2025-10-24 10:56:00

重磅 | 构建机器人「形态宇宙」!断腿、加配重、锁轮子都能跑!(2025CoRL)

封面图

构建 “机器人形态宇宙”!当前主流机器人运动(locomotion)方法,深陷“白板假设”陷阱——假定智能体能在任务单一、环境纯净的“空白状态”下,通过强化学习从头解决特定问题。这导致了大量高度专业化却极其脆弱的控制器,本质上是在狭窄的物理动态分布上“过拟合”。而自然界的生物智能给出了截然相反的答案:智能并非来自单一任...

2025-10-23 10:56:00

横跨三年的技术复盘!重磅综述解读:2023至2025,具身智能开源路线图

封面图

当具身智能正从技术探索迈向产业落地的关键节点 —— 开源生态的成熟度已成为决定行业发展速度的核心变量!《AI Robotics Open Source R&D Survey: Foundation Models, Datasets, Simulation, and Benchmark Platforms (2023-2025)》正是此时应运而生的 “行业全景图”——这份横跨三年技术演进的权威综述,以四大核心支柱为框架...

2025-10-22 17:38:00

具身智能赛道「新黑马」?港科广 Super-Mimic 让机器人靠 “想” 复刻全流程

封面图

实习生看几遍演示就会的复杂操作,机器人读百页说明书却仍不知从何下手。这道鸿沟的核心,藏在人类 “想象未来” 的能力里 —— 我们观察时,会同步预判下一步动作、物体动态和目标状态,而非机械模仿。近期,香港科技大学(广州)与香港大学团队提出Super-Mimic 框架,让机器人从 “看人类做事” 升级为 “想自己该怎么做”:无需...

2025-10-21 17:38:00

国内高校霸榜具身智能周!上交大双人协同框架、北大跨域迁移,英伟达用文字直接驱动机器人动作

封面图

今天是10月20日大家周一好7 篇本周关注到的学术进展(要点版)【上海交通大学】提出 Harmanoid 框架,双人协同运动模仿方法。【北京大学】提出LOMORO框架,将多机器人任务分配建模为受资源和监控间隔约束的优化问题。【清华大学】等基于软提示(Soft Prompt)的学习方法,为每个数据源引入独立的可学习嵌入作为具身特定提示...

2025-10-20 17:38:05

300k数据集让VLM实现3D坐标精准计算!Code+Tool实验细节全公开,可复现!

封面图

视觉 - 语言模型(VLMs)在空间推理方面已展现出卓越能力,但本质上仍局限于定性分析,缺乏现实世界机器人技术所需的计算精度。为此,北航联手北京智源团队推出了TIGeR(Tool-Integrated Geometric Reasoning),通过让视觉 - 语言模型借助外部工具生成并执行精确的几何计算,将其从感知估计器转变为几何计算器。我们开设此...

2025-10-19 11:03:17

碾压前代!指尖感知3克压力、成本骤降60%,十万台机器人四年内“闯入”家庭?

封面图

上图来自Figure AI最近发布的第三代人形机器人Figure 03——从设计之初就瞄准三个目标:承载Helix AI的完整能力、适应家庭复杂环境、支持万台级量产。我们开设此账号,想要向各位对【具身智能】感兴趣的人传递最前沿最权威的知识讯息外,也想和大家一起见证它到底是泡沫还是又一场热浪?欢迎关注【深蓝具身智能】为AI重构硬件...

2025-10-17 10:56:00

智能体太“确定”反而是缺陷?清华团队用一个激活函数,提升三种智能!

封面图

无论是机器人控制还是语言模型推理,一个隐藏但普遍的难题是——智能体太确定了。当策略或输出过度收敛,探索空间被压缩,智能体就容易陷入“机械反应”:机器人动作呆板,语言模型推理死板,分类模型则对新样本反应迟钝……近日,清华大学、上海人工智能实验室与上海期智研究院的研究团队提出了一种全新的解决思路——ERA(Entropy...

2025-10-16 10:56:00

深蓝学院招聘|机器人算法实习生

封面图

一、公司介绍深蓝学院作为深耕人工智能教育8年的先锋平台,目前已经在人工智能、机器人与自动驾驶领域搭建了完善的课程体系,深蓝学院这8年来:与100+企业展开深度合作,例如头部大厂华为、小米、百度、小鹏,知名机器人公司宇树科技、云深处等;与百位知名讲师建立联系,其中不乏有华为天才少年、豆瓣9.0分算法书作者、30...

2025-10-16 10:56:00

VLA 演进为 MLA!北大提出统一点云、触觉与视觉的全新具身大模型架构

封面图

在机器人操控领域,如何充分利用多种传感器输入,以全面提升模型对物理世界的感知与动作生成,是一个亟待解决的问题。近日,北京大学仉尚航团队、北京人形机器人创新中心和香港中文大学的研究团队提出了一种名为 MLA(multisensory language-action)的新型多感官-语言-动作模型,利用无编码器的多模态对比学习对齐机制,以...

2025-10-15 10:56:00

颠覆机器人训练模式!Google DeepMind自进化模型实现“自主迭代”(NeurIPS 2025)

封面图

Google DeepMind 为机器人 “自主进化” 按下的加速键长期以来,尽管基于网页级数据预训练的具身基础模型(EFM)革新了机器人领域,但这些模型的低阶控制能力始终被困在 “行为克隆” 的框架里 —— 想要提升性能,只能靠人类不断演示新行为、扩大数据集再重新训练,不仅人工成本极高,还让机器人陷入 “只会模仿、不会创新” 的困...

2025-10-14 10:56:00

斯坦福大学抛出全新idea:让机器人学会「打篮球」!运球、急停、转身跳投,一步到位!

封面图

当人形机器人已能稳健行走、灵活跳跃,它们的下一站,或许是NBA赛场?图中,斯坦福大学实验室的研究者正在教机器人如何“打篮球”。不过,看似流畅的动作背后,藏着不少具身智能领域的挑战:如何让智能体在长时间、连续、物理约束的任务中实现多技能的无缝衔接。篮球不是单一动作的堆叠,运球需控节奏方向、合球要保平衡找衔...

2025-10-13 10:56:00

独家参访宇树科技、微分智飞:ARTS 2025最新日程揭秘

封面图

2025年10月18日-19日,第三届自主机器人技术研讨会(ARTS 2025)将在中国·浙江大学(玉泉校区)盛大举办。在常规学术议程基础之上,ARTS 2025 进一步推出ARTS奖学金、学术辩论赛、学术吐槽大会(脱口秀)及企业参观。旨在打破传统会议单向输出的模式,让思想的碰撞不止于论文宣讲,构建产学融合与坦诚对话的立体化交流场景...

2025-10-12 10:56:00

VLN新标杆!阿里高德 & 西安交大联合发布JanusVLN:双重隐式记忆范式

封面图

语义归语义,空间归空间:如何实现VLN的完美解耦?视觉-语言导航(VLN)技术旨在赋予机器“读懂指令、看懂世界、自主行动”的能力。然而,正如人类远行需要可靠的记忆,智能体在复杂的长时序导航中也面临着严峻的“记忆”挑战。当前主流方法所依赖的显式语义记忆(如文本地图或历史图像序列)已逐渐演变为性能的阿喀琉斯之踵,...

2025-10-11 10:56:00

端到端智能:颠覆传统,引领自主飞行的范式转移

封面图

自主飞行的未来,正经历一场从“精心编排”到“自主智能”的范式革命。当端到端学习开始直接为飞行器注入决策灵魂,传统的复杂模块堆叠,是否已走到尽头?为了助力空中机器人研究者更深入理解前沿技术,10月11号(周六) 10:30-12:00,深蓝学院联合微分智飞旗下的教育品牌非凸空间——特别邀请浙江大学控制学院长聘副教授高飞老...

2025-10-10 19:42:49

具身智能下一个十年看什么?语言推理是绕不开的关键!

封面图

之前我们聊过“AI的下半场”,说的是AI的焦点将从“训练模型”转向“定义任务”和“衡量效用”。这不仅是一场范式转变,也对各个AI应用领域提出了全新挑战。今天,我们把焦点收得更窄:落到具身智能。因为泛化性的问题,在机器人身上会被放大十倍。如ChatGPT,Deepseek等大语言模型在知识储备层面已经达到了人类的博士水准,但由它...

2025-10-10 10:58:00

10亿条数据也「救不了」的灵巧操作真正缺失的是什么?

封面图

高自由度灵巧手演示时玩魔方、翻书、弹钢琴,实际应用却连抓鸡蛋都难以胜任……这一现象背后,是整个行业面临的“最后一厘米霸权”之争:谁能让机器人真正学会“用手”,谁就能在即将爆发的灵巧手市场中掌握话语权。据统计,2024-2025年,我国灵巧手行业市场规模由125.33亿元增长至501.33亿元,期间年复合增长率300%;而 2030 年...

2025-10-09 10:56:00

顶流综述 | 220篇paper构建“数据-模型-评测” 体系,具身智能研究直接套用!

封面图

随着 World Model(世界模型)热度的不断攀升,让它不仅成为了学术界的研究焦点,更是产业落地的关键支撑。“特斯拉在自动驾驶 FSD 中采用基于世界模型的训练方式,华为和蔚来也在推进相关方案;宇树在最新的人形机器人系统中同样以 World Model 作为核心支撑。World Model 的价值,在于为具身智能提供了一种“理解空间”的能...

2025-10-08 17:32:00

近20所国内外知名机构联合发布,具身智能终于有了 “统一成绩单”!

封面图

随着具身智能研究的爆发式增长,从自主导航的机器人,到灵活操作物体的智能体,学术界与产业界不断交出令人瞩目的成绩单。但热闹背后,一个关键瓶颈却愈发凸显:我们该如何公平、全面地评估这些具身智能体的真实能力?假设两个机器人都需要去完成「拿起桌上的杯子」这个任务:一个机器人选择先移动到桌边再伸手抓取,另一个...

2025-10-07 17:32:00

CoRL 2025 Oral:机器人模仿学习“教科书”,成功率最高提 44%,其他基线方法全失败?

封面图

低成本、大规模的跨域模仿学习当前,机器人模仿学习正面临一个核心瓶颈:成本高昂、环境覆盖有限,更在规模化面前显得步履维艰。如何有效弥合这一“人-机”跨域差距,充分释放人类行为数据的潜力,已成为模仿学习领域亟待攻克的核心挑战。有没有一条更低成本、更高效率的路径?在CoRL 2025入选口头报告的研究成果提出了一种全...

2025-10-05 17:32:00

2025具身智能“封神榜”!Science Robotics九大封面一览(收藏)

封面图

2025具身智能「封神榜」作为机器人领域的顶级期刊之一,Science Robotics 不仅汇聚了全球最前沿的研究成果,也常常通过其封面论文展示出未来发展的趋势——从人机融合到仿生设计,从精准医疗到智慧农业,从多机器人协同到外星探测……这些研究早已跳出 “机械执行” 的传统框架。封面文章里所展现的研究,正好为我们提供了一个窗...

2025-10-04 17:32:00

具身智能主流技术方案是什么?搞模仿学习,还是强化学习?

封面图

最近,我们先后探讨了「大模型幻觉」与「被忽略的触觉模态」等问题。无论是大模型的认知,还是触觉等感知能力,当我们将视野投向更前沿的探索时,便不可避免地回归到一个激烈的新旧路线之争上:面对物理世界的复杂性,我们究竟该教AI“抄作业”?通过模仿学习(Imitation Learning)快速上手;还是该让它“自主闯关”,凭借强化...

2025-10-03 17:32:00

深度盘点|具身智能处处是“病”,而“触觉大模型”是最残缺的药方

封面图

当我们解剖当下具身智能的困境,犹如审视一个残缺的智能体。——资本高歌猛进|核心问题悬置大模型的“幻觉”问题尚未解决,具身智能的安全漏洞又接踵而至。前几天,宇树机器人被曝存在严重的无线安全漏洞。——黑客仅凭BLE接口就能绕过验证直取root权限,而被攻陷的机器人还会自动扩散感染,形成具备物理攻击能力的机器人僵尸网...

2025-10-02 10:56:00

首个会反思、能协作的 VLA 模型:清华大学新成果 CollabVLA 告别低效与 “黑箱”!

封面图

当前,视觉-语言-动作模型虽能执行指令,却困于三大难题:数据稀缺导致泛化差、决策过程如同“黑箱”、缺乏深度反思能力。这导致机器人在复杂开放环境中表现僵硬,一旦出错,人类也难以介入指导。为此,清华大学研究团队提出了 CollabVLA,这是首个支持自我反思推理与人机实时协作的VLA模型。它突破了传统模型“孤立执行任务”...

2025-09-30 10:57:00

热门作者
作者头像
华经产业研究院
华经情报网-专注于大中华区产业经济信息情报-隶属于华经产业研究院
作者头像
人工智能产业链union
人工智能产业链联盟,旨在汇聚全球人工智能领域的创新力量,共同推动人工智能技术的研发、应用与产业化。联盟以基础技术、人工智能技术及人工智能应用为核心,打造了一个完整、高效、协同的人工智能生态链。
作者头像
虎嗅app
从思考,到创造
作者头像
汽车行业早知道
每天更新汽车行业最新新闻哦
作者头像
36氪
36氪是服务中国新经济参与者的卓越品牌和开创性平台,提供新锐深度的商业报道,强调趋势和价值,我们的slogan是:让一部分人先看到未来。