中国芯突破封锁！华为“算力核弹”诞生，性能暴打英伟达旗舰

极果网
2025-07-27 14:49:49

近日，上海世界人工智能大会现场，华为最新昇腾384超节点真机霸气亮相，成了整个展会中极具分量的 “镇馆之宝”。

这个由12个计算柜和4个总线柜组成的大型设备，集合了384颗昇腾NPU与192颗鲲鹏CPU，其总算力达到300Pflops，是英伟达旗舰产品NVL72系统的1.7倍；网络带宽达到269TB/s，较其提升107%；内存带宽为1229TB/s，提升幅度达113%。

在以往的普遍认知里，单颗昇腾芯片的性能仅为英伟达Blackwell架构GPU三分之一。然而，华为凭借 “系统工程” 的思路实现了突破性进展，昇腾384超节点运用全互连拓扑架构，借助华为自主研发的MatrixLink高速网络，达成了全对等互联。

资讯配图

这一创新举措，彻底改变了传统以CPU为核心的冯诺依曼架构。华为将高速互联总线从服务器内部拓展至整机柜乃至跨机柜范围，实现CPU、NPU、DPU、存储和内存等资源的全面互联与池化。这样就能去除掉繁多的中转环节，从而实现真正的点对点互联，进而实现更大的算力密度和互联带宽。

其性能测试结果表明，在昇腾超节点集群上运行LLaMA3等千亿参数的稠密模型时，其性能比传统集群提高了2.5倍以上。在处理多模态以及MoE专家混合模型时，性能提升甚至能达到3倍。昇腾384超节点所取得的突破，意味着长期以来全球AI算力市场被英伟达垄断（占比超过90%）的格局被打破，国产产品的市场份额正从不足10%向30%迈进。

资讯配图

更为关键的是，在当前西方技术封锁的严峻形势下，华为昇腾384凭借自主创新的MatrixLink总线协议，彻底摆脱了对西方“拼凑式”技术标准的依赖，打造出全球领先的互联架构。这不仅仅是一次技术突破，更是中国算力从“跟跑”到“领跑”的历史性跨越！

声明：本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人，不代表科技区角网立场。仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。点击这里

华为

点赞 (0)
分享
微信扫一扫
加入群聊
扫码加入群聊