电子发烧友网报道(文/章鹰)GPU超节点对国产算力具有提升算力性能、突破物理限制、优化算力利用率、推动生态建设等重要作用。中国工程院院士刘韵洁接受媒体采访时曾表示,短时间内国内端点GPU仍无法与国外竞争,弥补短板的有效办法是建设算力网络“把整个算力练起来”,发挥GPU集群效果。
7月27日, 2025年世界人工智能大会在上海世博中心开幕,来自深圳两家ICT公司华为、中兴通讯分别展示了自身独创的,或者联合其他厂商打造的算力底座的旗舰产品。
作为中国自主的算力核弹,华为昇腾384超节点真机首次亮相。中兴通讯、上海仪电、曦智科技、壁仞科技联合打造的光互联芯片及超节点应用创新方案荣获2025年世界人工智能大会最高奖。本文将对这两款重点产品进行分析。

超越英伟达GB200 NVL72系统,华为昇腾384超节点整机首次亮相

在WAIC大会现场,这款号称镇馆之宝的华为昇腾384超节点整机前,聚集了来自全国各地,海外的参观者和工程师,这款整机算力高达300 PFLOPs,内存带宽1229TB/秒,网络带宽269TB/秒,算力是英伟达GB200 NVL72系统的2倍,内存带宽暴涨113%,组网速度快107%,引领算力新基建。
英伟达CEO黄仁勋曾表示,从技术参数看,华为的CloudMatrix 384超节点,性能上甚至超越了英伟达,比英伟达的尖端技术更具优势,因此我们必须高度重视这家实力雄厚的公司,全力以赴应对挑战。半导体研究公司 Semi Analysis 称,CloudMatrix 384 在几个关键领域的表现优于 Nvidia 的 GB200 NVL72,特别是在训练海量人工智能模型或运行要求苛刻的推理工作负载方面。
资讯配图
图片来自华为中国官方微信
早在HDC2025大会上,华为云CEO张平安就宣布了,基于华为云CloudMatrix384超节点的新一代昇腾云服务已经在芜湖、贵安、乌兰察布和林格尔全面上线。张平安说,华为云致力于为大家提供澎湃的AI算力,让大家不再有AI算力短缺的焦虑。
华为云CloudMatrix384超节点整机的原理,按照张平安的说法是,数学补物理,空间换算力,能源助性能,打破传统AI服务器的边界,通过系统级的创新,将384颗昇腾NPU和192颗鲲鹏CPU通过全新的高速网络MatrixLink对等互联,形成一台超级AI服务器。
华为首次线下展出昇腾384超节点,即Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现384个NPU之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。通过系统工程的优化,实现资源的高效调度,让超节点像一台超级计算机一样工作。算力规模300 PFlops,单卡的推理量,从每秒600Token跃升到现在每秒2300Token,提升4倍,成功打破跨机通信带宽性能瓶颈,实现从服务器级到矩阵级的资源供给模式转变。
这款整机具备四大技术特点:一、吞吐突破性能强,可以实现软硬件协同优化,单卡Decoding吞吐达到2300Tokens;其次,主流模型覆盖多,沉淀了行业主流160+模型,可以高效支撑模型迁移;三、专家并行效率高,国内首创的大规模专家并行方案,可以实现系统级优化支撑更大吞吐、更低decode时延;四、规模灵活,初始投资小,每年迭代发布新版本,可以实现弹性灵活按需使用。
借助 CloudMatrix 384,华为现在提供了一种可靠、可扩展且本地制造的替代方案。作为中国最大的科技公司,华为尽管受到美国出口限制,但仍在迅速取得进展。专家表示,这可能会重塑人工智能基础设施和硬件的未来。

SAIL项目在上海落地!中兴+曦智科技+壁仞发布国内首个光互联GPU超节点

在本次大会上,曦智科技联合壁仞科技、中兴通讯共同推出的光跃LightSphere X——全球首个分布式光互连光交换GPU超节点解决方案获得2025 SAIL奖(卓越人工智能引领者奖)。
资讯配图
7月27日,曦智科技创始、首席执行官沈亦晨表示,算力发展类比电力革命,正如电力提升生活舒适度,算力飞跃将释放思维与精力潜能,而光子芯片正以创新技术开辟新赛道,成为算力突破的核心引擎。
该超节点基于曦智科技全球首创的分布式光交换技术,采用硅光技术的光互连光交换芯片和壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板互连,并搭载中兴通讯高性能AI国产服务器及仪电智算云平台软件,构建起高带宽、低延迟、灵活可扩展的自主可控智算集群新范式,即将于上海仪电智算中心落地。
资讯配图
图:光跃LightSphere X展示,来自中兴通讯官方微信
据悉,当前业界一种常见方案是通过提升单机柜功耗来部署更多GPU,但受限于数据中心单机柜的功耗天花板,单机柜GPU密度提升存在瓶颈。对此,光跃LightSphere X采用光互连技术,通过增加机柜数量构建超节点,突破传统互连方式下超节点的物理限制。
光跃LightSphere X全球首创的分布式光交换(dOCS)技术则进一步提升了超节点的灵活度和系统可扩展性,从而达到提升系统性价比的目的,还能按模型算力需求动态调整超节点规模,光跃LightSphere X将实现2千卡规模部署。
据悉,光跃LightSphere X依托上海仪电算力底座,集合国内智算领域头部企业,共建了“光芯片-GPU-服务器-算力集群-智算云平台”闭环,打造了开放共享的光电融合算力生态体系。上海仪电(集团)有限公司是上海市国资委所属的产业发展类集团、上海市公共算力服务平台核心建设单位和智算自主可控国产软硬件生态“链主”企业。
值得关注的是,曦智科技创新分布式光交换模组,可以支持集群内GPU互联拓扑的灵活切换,并在特殊情况下,可以利用冗余迅速重组超节点网络,显著提升大模型训推能力,极大的拓展了集群的应用场景。此外,曦智科技与沐曦合作的光互连电交换超节点方案也首次公开亮相。该方案采用线性直驱光互连技术,具有低延时、高带宽、低功耗的特点,并支持长距离传输,突破跨机柜连接的限制,支持8台标准服务器共64张xPU卡的高速互连,为大模型训练及推理提供更灵活、更高效的并行策略支持,从而提升集群性能。
中兴通讯表示,公司将坚持智算战略主航道持续深化AI领域投入,基于自主创新实力和全栈智算解决方案,助力全球运营商和合作伙伴构建开放、互利的AI新生态。

资讯配图

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。


更多热点文章阅读


点击关注 星标我们



将我们设为星标,不错过每一次更新!
资讯配图

资讯配图喜欢就奖励一个“在看”吧!