资讯配图
资讯配图
文丨谭梓馨
7月27日,在WAIC 2025大模型论坛上,商汤科技一口气发布了多款重磅新产品,包括日日新V6.5大模型、悟能”具身智能平台以及智能助手“商汤小浣熊”等。
资讯配图
据商汤科技董事长兼CEO徐立介绍,日日新V6.5在多模态推理和交互性能上实现重大升级,官方给出的参数显示,日日新V6.5 pro的多模态推理能力在多个数据集上超越了Gemini 2.5 ProClaude Sonnet 4 thinking,在音视频交互能力方面,比Gemini 2.5 Flash和GPT-4o更强,时,得益于模型架构改进,应用成本大大优化,推理成本只有原始的30%。
此外,由日日新V6.5赋能,商汤研发了“开悟”世界模型,“开悟”世界模型也是视频生成模型,但它考虑了时间、空间等维度的一致性,进而打造出的“悟能”具身智能平台,以世界模型为核心引擎,依托商汤大装置提供端侧和云侧算力支持,能够为机器人、智能设备提供强大的感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化演进。
资讯配图
而智能助手商汤“小浣熊”则像是一个多面手AI智能体,具备复杂数据分析能力。

“代码小浣熊”能够帮助完成开发、测试、运维等工作,“办公小浣熊”则能辅助完成数据、文档、演示文稿等工作内容,此外,小浣熊还有教育版、金融版等垂直行业版本,能够更有针对性地提供服务,据悉用户总量已超过1000万。
资讯配图

关于接下来要重点发力的具身智能领域,徐立在现场表示,大家都知道商汤是做视觉感知起步的,积累的AI感知能力以及多模态能力在具身领域会有非常大的使用空间,比如说机器人的视觉、导航、交互、世界模型等,可以助力机器人构造更好的VLA以及与世界交互的可能性。

资讯配图

据了解,商汤的视觉感知技术可以嵌入到机器人核心芯片中,也就是在端侧就能处理好这样的感知能力。

此外,是视觉导航能力,商汤“绝影”本身就在做全自主视觉无人驾驶,近些年赋能了不少车企来做端到端的智能驾驶,同样的模块可以去适配到机器狗、机器人身上。

资讯配图

还有一大能力在于提升机器人交互深度,徐立现场演示了基于“悟能”具身智能平台的机器人如何自己翻PPT讲解《长安的荔枝》,它能实时响应用户提问,敏锐捕捉用户意图,期间用户打断进行提问,它完成提问后还能回归原来的逻辑主线继续讲解,还能结合长记忆能力进行阶段性回顾总结。

徐立表示,世界模型和具身AI的结合将开启AI发展的下一个阶段,加速社会迈向AGI时代,希望悟能具身智能平台能够帮助各类具身智能企业,完成AI和现实世界交互的梦想。

-END-

资讯配图
如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。
【2025免费新年礼】:了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会,领取100份AI科技商业研报合集,加群共同探讨与成长——
扫描下方二维码,添加头部科技晶总微信!
资讯配图