商汤科技多款新品亮相WAIC 2025，剑指具身AI和智能体市场

头部科技
2025-07-28 23:46:44

文丨谭梓馨

7月27日，在WAIC 2025大模型论坛上，商汤科技一口气发布了多款重磅新产品，包括日日新V6.5大模型、“悟能”具身智能平台以及智能助手“商汤小浣熊”等。

据商汤科技董事长兼CEO徐立介绍，日日新V6.5在多模态推理和交互性能上实现重大升级，官方给出的参数显示，日日新V6.5 pro的多模态推理能力在多个数据集上超越了Gemini 2.5 Pro和Claude Sonnet 4 thinking，在音视频交互能力方面，比Gemini 2.5 Flash和GPT-4o更强，同时，得益于模型架构改进，应用成本大大优化，推理成本只有原始的30%。

此外，由日日新V6.5赋能，商汤研发了“开悟”世界模型，“开悟”世界模型也是视频生成模型，但它考虑了时间、空间等维度的一致性，进而打造出的“悟能”具身智能平台，以世界模型为核心引擎，依托商汤大装置提供端侧和云侧算力支持，能够为机器人、智能设备提供强大的感知、视觉导航及多模态交互能力，推动智能终端向更高层次的自主化与智能化演进。

而智能助手商汤“小浣熊”则像是一个多面手AI智能体，具备复杂数据分析能力。

“代码小浣熊”能够帮助完成开发、测试、运维等工作，“办公小浣熊”则能辅助完成数据、文档、演示文稿等工作内容，此外，小浣熊还有教育版、金融版等垂直行业版本，能够更有针对性地提供服务，据悉用户总量已超过1000万。

关于接下来要重点发力的具身智能领域，徐立在现场表示，大家都知道商汤是做视觉感知起步的，积累的AI感知能力以及多模态能力在具身领域会有非常大的使用空间，比如说机器人的视觉、导航、交互、世界模型等，可以助力机器人构造更好的VLA以及与世界交互的可能性。

据了解，商汤的视觉感知技术可以嵌入到机器人核心芯片中，也就是在端侧就能处理好这样的感知能力。

此外，是视觉导航能力，商汤“绝影”本身就在做全自主视觉无人驾驶，近些年赋能了不少车企来做端到端的智能驾驶，同样的模块可以去适配到机器狗、机器人身上。

还有一大能力在于提升机器人交互深度，徐立现场演示了基于“悟能”具身智能平台的机器人如何自己翻PPT讲解《长安的荔枝》，它能实时响应用户提问，敏锐捕捉用户意图，期间用户打断进行提问，它完成提问后还能回归原来的逻辑主线继续讲解，还能结合长记忆能力进行阶段性回顾总结。

徐立表示，世界模型和具身AI的结合将开启AI发展的下一个阶段，加速社会迈向AGI时代，希望悟能具身智能平台能够帮助各类具身智能企业，完成AI和现实世界交互的梦想。

-END-
如果您有什么想说的，欢迎在评论区留言讨论！
投稿或寻求报道，欢迎私信“投稿”，添加编辑微信。
【2025免费新年礼】：了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会，领取100份AI科技商业研报合集，加群共同探讨与成长——
扫描下方二维码，添加头部科技晶总微信！

声明：本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人，不代表科技区角网立场。仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。点击这里

点赞 (0)
分享
微信扫一扫
加入群聊
扫码加入群聊