单张消费级显卡也能参与大模型训练!无问芯穹用「三个盒子」打通十万卡到一张卡AI效能跃升路径
- 2025-07-29 13:01:47
衡宇 发自 WAIC
量子位 | 公众号 QbitAI
智能时代的尺度,在计算资源与智能效率的双重牵引下正在极速压缩、迅速蔓延。
两年前,我们惊艳于几千卡集群训练而成的GPT3.5;但今天,一部手机也可以装下与它同等性能的小型AI了。
2025年WAIC上,无问芯穹联合创始人、CEO夏立雪如此说道。
他还代表无问芯穹,带来了AI落地这道难题的最新回答——
三个盒子,打通从十万卡到一张卡的AI效能跃升路径。

是的,仅仅是三个盒子。
在无问芯穹看来,这三个盒子背后,是一整套面向未来的智能基础设施设计。
什么是三个盒子?
“三个盒子”其实是无问芯穹全规模AI效能跃升方案的三大核心产品:
大盒子:无穹AI云
中盒子:无界智算平台
小盒子:无垠终端智能
这是一整套软硬件协同系统,专为未来智能基础设施设计,能覆盖从云到端的各种规模场景,支持多种异构算力,同时打通模型调度、性能优化到应用部署的全流程。

我们一个一个来看——
大盒子:无穹AI云
大盒子,即无问芯穹推出的无穹AI云,是面向万卡至十万卡级别的智算网络,为超大规模算力集群的利用提供了一个系统性的解决方案。
无穹AI云的底层是一张深度覆盖全国的广域算力网,基于无问芯穹“一网三异”调度架构,目前已成功覆盖“东数西算”国家战略布局的关键节点,汇聚了来自 26个省市、53个核心数据中心的庞大算力资源,整合超15种主流芯片架构的异构算力池,总算力规模超25000P。

夏立雪表示:
无穹AI云不仅可以让宝贵的算力资源实现最高效的流转与利用,还能有效激活处于非理想状态的算力资源,将其转化为具备高稳定性、高吞吐量与超低延迟的优质AI服务能力。
目前,无穹AI云提供高度标准化和开放化的接口,支持独特的“平台+自营”运营模式——不仅向独立智算中心敞开大门,实现无缝集成;也支持企业构建自有运营平台站点,并融入底层算力供给网络。
过去半年里,无穹AI已经在上海市、杭州市、北京市等地接连落地。
此外,无问芯穹服务的全球最大人工智能孵化器上海模速空间,日均Token调用量已突破100亿大关。

中盒子:无界智算平台
中盒子,即无问芯穹推出的无界智算平台,专门面向百卡至千卡级的大型集群,解决高校、科研机构、中小AIDC中心的模型训练与推理难题。
无界智算平台的能力建立在无穹AI云的基础之上。
夏立雪在现场透露,无界智算平台已在超过100个大型研发场景中多次成功保障了大规模模型训练与推理任务的关键需求,并帮助国产计算集群实现了实实在在的正向收益。
从3000卡的沐曦GPU集群稳定支撑百亿模型600小时训练,到云南移动依托2000张昇腾卡实现千亿模型商用推理,无界平台不仅能算优算稳,还能真正带来正向收益。
更重要的是,面向未来,夏立雪还宣布了无问芯穹在大盒子和中盒子协同的重要产品化进展:
全球首个跨地域全分布式联合强化学习服务。
这个服务支持将各地AIDC中零散的算力资源,与一个中等体量的算力集群结合起来,完成跨地域的联合强化学习。
最小支持单张消费级显卡接入,哪怕只有一张消费级GPU,也能参与大模型的联合训练。

小盒子:无垠终端智能
小盒子,即无问芯穹推出的无垠终端智能,专门面向智能终端。
在小盒子里,无垠终端智能致力于以软硬协同核心技术优势,打造“端模型+端引擎+端硬件”智能终端一体化解决方案。
基于此,无问芯穹与上海创智院共同打造了全球首款端侧本征模型无穹天权Infini-Megrez2.0,在实现云级21B参数智能水平的同时,将内存占用控制在7B规模、实际计算量控制在3B规模。

此外,Infini-Megrez2.0通过巧妙的工程设计,赋予了终端设备更强的能动性,即使在用户无感知的“休眠时段”里,也能持续运行大模型。
换句话说,哪怕AI PC在休眠状态、完全离线的情况下,大模型依然能自主运行,稳定完成任务。
算下来,一台设备在一年中,能多释放出1000多个小时的有效工作时间。
为什么要做三个盒子?
为什么无问芯穹要发布这三个盒子?
其实答案只有一个:智能时代的资源拐点已经到了。
从传统算法,到AI1.0、AI2.0阶段,在Scaling Law的推动下,计算资源持续驱动着智能边界的拓展,逼近AGI的临界点。

然而,资源的有限性,成为了“人类文明的终极边界始终横亘在AGI之路”上的天堑。
它横卧在面前,成为人们真正触碰到AGI之前可能会先触碰到的红线。

为了解决这个有限资源与无限需求之间的矛盾,无问芯穹提出加速抵达AGI临界点的两条进路:
一条是提高智能效率,另一条是扩充计算资源。
一方面突破从计算资源到智能性的转化效率,用更少的计算资源获取更强的智能;另一方面,不段挖掘和唤醒更多的可用计算资源。
夏立雪表示,这两条路径的交汇之处,即是新的AGI临界点所在。
他绘制了一个AI应用落地的价值空间:
人工智能应用落地价值空间=场景尺度×计算资源×智能效率。

这套逻辑底层其实指向的是效能跃升这四个字。
不是更大的模型,而是更高的效率;不是无限扩张的卡数,而是有限资源下的最优解法。
而三个盒子,正是这个效能跃升公式的具体化身。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
🌟 点亮星标 🌟

- 点赞 (0)
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊