资讯配图

在放开出口限制之后,H20这一AI芯片在中国市场出现了供不应求的现象。

7月29日,据路透社援引两位消息人士报道,英伟达已向台积电下达了30万片H20芯片组的订单。其中一位消息人士指出,强劲的中国需求促使英伟达改变主意,不再仅仅依赖现有库存。

据行业分析机构Jefferies估算,中国市场对H20级别AI芯片的总需求量约为180万颗 。然而,在2025年早些时候,英伟达的H20芯片库存据估计仅在60万至90万颗之间 。这一巨大的供需失衡是缺口存在的根本原因。

值得一提的是,中国科技巨头早在2024年就已下达了价值超过120亿美元的H20芯片预订单,以锁定未来供应。然而,今年4月美国政府一张出口限制令,让这一芯片在华销售一度停滞。但在7月,这一出口限制令的突然反转,进一步加剧了H20芯片的供应偏紧的现状。

美国出口管制政策的反复与不确定性

实际上,H20并非一款常规迭代的产品,而是地缘政治影响下的特定产物。

 H20基于成熟的NVIDIA Hopper架构,采用台积电N4工艺及CoWoS先进封装技术,内部集成超过800亿个晶体管 。部分信息显示其芯片本体是GH100的削减版本 。

该芯片配备了高达96GB的HBM3高带宽内存,显存带宽达到4.0 TB/s 。这一内存在容量上与旗舰级的H100/H200保持一致,成为其在处理大型语言模型(LLM)时的关键优势之一。但H20的算力被精确地限制在美方规定的性能密度门槛之下,综合算力大约只有H100的20%,在关键的FP16性能上,仅为H100的1/6到1/15 。

H20的市场定位非常明确:在美国先进AI芯片被禁运的背景下,为中国大陆的科技企业提供一个性能尚可、能够合法获得且兼容现有CUDA生态系统的高性能计算解决方案 。其主要应用场景覆盖了AI推理、大模型训练、高性能计算(HPC)、云计算及数据中心等领域 。

2025年4月,美国政府更新了出口管制清单,对H20芯片实施了新的出口许可要求,一度导致其对华销售陷入停滞 。

由于4月份的出口禁令,英伟达在2026财年第一季度(截至2025年5月)财报中计提了高达45亿至55亿美元的库存减值和采购承诺相关费用 这凸显了政策不确定性给企业带来的巨大经营风险,也使得英伟达在重启生产决策上更为谨慎。而英伟达为规避风险,已主动取消了在台积电预订的部分H20生产产能 。

2025年7月中旬,英伟达CEO黄仁勋宣布已获美国政府批准,可以恢复向中国市场发货H20芯片 。这一消息瞬间引爆了积压已久的市场需求,但由于生产线早已调整,供应链无法立即响应。

紧急追加30万颗订单也难解“近渴”

美国政府的出口管制政策具有高度不确定性,而半导体供应链的调整却需要漫长而稳定的周期。这种错配导致了市场的剧烈波动和供应的持续紧张。

目前,H20的主要客户群体非常集中,即中国大陆的头部互联网和云计算公司,包括但不限于阿里巴巴、腾讯、字节跳动和百度等 。这些公司在2024年已大量下单,是此次供应缺口中最主要的“需求方”。

 Jefferies的分析认为,英伟达在2025年第一季度向中国出货了约30万颗H20 GPU。随着7月恢复销售许可,市场预计英伟达将首先清理其60-90万颗的现有库存。有分析指出,恢复出货后,库存去化速度可提升30% 。

7月下旬援引知情人士消息称,英伟达为补充其60-70万颗的现有库存,已向台积电下达了30万片H20芯片的新订单,标志着其决定重启为中国市场的定制芯片生产线 。

不过,即便英伟达下单意愿强烈,台积电的接单能力也面临巨大挑战。台积电方面表示,如果从零开始重启H20的供应链,整个过程可能需要长达九个月的时间 。

据悉,台积电的N4产线持续满载,几乎没有空间处理紧急订单 。重新调整生产计划会影响对其他重要客户(如苹果、AMD等)的承诺,机会成本极高。

 基于N4工艺的芯片从投片到最终封装测试完成,生产周期约为3个月 。结合前述9个月的供应链重启时间,即便订单此刻确认,终端用户最快也要等到2026年年中才能拿到这批新芯片。显然,这“远水”解不了中国大陆客户的“近渴”。

为何国产AI芯片难以替代H20芯片

在未来数月内,中国大陆市场将主要依赖消化英伟达现有的H20库存。价格可能因供不应求而保持高位。那么,为何国产AI芯片难以替代英伟达H20芯片?

首先,全球超90%的AI模型基于英伟达CUDA平台开发,迁移至国产框架需重写30%以上代码,耗时6个月以上,并承担技术风险。而且,TensorFlow、PyTorch等主流框架对CUDA深度优化,而国产芯片需额外适配层,增加延迟和开发成本。

其次,H20虽FP16性能仅达H100的28%,但其96GB HBM3显存和4TB/s带宽可满足中等规模模型推理需求,如DeepSeek-R1的私有化推理显存利用率达90%以上。对于地方政府、金融机构及车企的垂类模型部署,H20的“及格线”性能已足够。

此外,H20还有集群扩展性优势。该芯片支持8卡NVLink互联,显存池化达768GB,可全量训练70B参数模型;而国产芯片虽FP16算力接近H20,但在多卡互联和混合精度训练等场景仍存差距。

特别值得一提的是,H20通过调整算力密度、禁用关键张量核心等技术手段,勉强符合美国出口管制要求,同时保留Hopper架构和CoWoS封装技术,形成独特市场定位。比如,该芯片显存带宽被刻意维持在900GB/s,正好卡在国产芯片与自身旗舰产品(H100的2TB/s)之间。这简直是英伟达对美国出口管制的“精准阉割”。

还有最重要的采购成本问题。H20的定价(6500-8000美元)堪称教科书级博弈,直接锚定华为昇腾910B政府采购价(6000美元)上浮20%,加上迁移成本和生态适应风险,制造“性价比幻觉”。

尽管此前国家发改委要求新建/扩建数据中心必须采用符合严格能效标准的AI芯片,直指H20的能效短板,但短期内H20仍能通过“性能妥协+生态霸权”维持市场韧性。当前,国产AI芯片处于从“能用”到“敢不用”的临界点,还需持续技术创新,以及政策支持和生态构建,以在更多应用场景中实现替代。