英伟达“丢掉”的1000亿,国产平替还能继续赚吗?...
“我们可能无法全部恢复先前的库存减计损失,但大多数库存是可以恢复的。新的客户需求和我们现有的库存产品是可以匹配的,所以不能说100%恢复,但也不是完全没有可能。”
这是英伟达创始人黄仁勋对H20芯片解禁后的最新表态。他在链博会上的上述讲话,无疑给了英伟达国产平替们一记闷棍。
此前,在2025年一季度财报电话会上,黄仁勋对外提到,因中国芯片出口限制带来的计提损失一季度55亿美元,二季度有望升至80亿美元,总损失达到近1000亿元人民币。
作为对比,2024年,英伟达在中国交付了超过100万张H20芯片。按照彼时单芯片1.2万美元到1.3万美元的售价计算,仅H20就为英伟达贡献了超过120亿美元的营收,超过上一财年英伟达中国区的整体营收。
近千亿的潜在亏损,直接影响着英伟达在中国芯片江湖的市场地位。5月份参加Computex 2025期间,黄仁勋对外表示英伟达在中国AI芯片的份额已经从2022年出口管制期间的95%,下降至50%。伴随而来的,则是英伟达在中国的市场的营收占比从2022年的约40%,下降到不到20%。
国产芯片厂商们,成了英伟达中国市场份额下滑中的最大赢家。以DeepSeek R1为代表的推理模型的到来,更是为国产芯片瓜分英伟达平添了一份助力。
2025年前,大模型行业更多处在预训练阶段,一众国产芯片厂商都难以在训练效率和结果上匹敌英伟达芯片。但进入后训练阶段的推理模式后,调用大模型过程中,随着客户对芯片性能的要求直线下降,落后英伟达好几代的国产芯片厂商们,终于等来一次难得的平替机会。
据字母榜(ID:wujicaijing)了解,华为在昇腾芯片加持下,一度在今年一季度的DeepSeek一体机市场,占据了超70%的份额。
寒武纪更是凭借飙涨的订单量,罕见地完成了扭亏为盈。沐曦股份和摩尔线程等初创芯片公司,更是在蜂拥订单助力下,纷纷开启了上市冲刺。
但H20芯片解禁消息一出,处在加速度中的国产芯片厂商,不可避免将迎来新一轮业务震荡期。
A
除了抢占以DeepSeek一体机为代表的推理市场,华为还瞄准了英伟达占据核心的训练市场,发起进攻。
在单卡性能不如英伟达的显示前提下,华为采取了以量取胜的笨办法,借助比英伟达更多的多卡集群来补上差距。
4月份,华为对外推出CloudMatrix 384超节点,官方称其已在芜湖数据中心规模上线。据“科创板日报”报道,华为内部人士称其为核弹级的产品,或将彻底终结算力焦虑。
传统AI服务器通常包括8张算力卡,一台服务器称为一个节点。在ChatGPT掀起大模型浪潮,并验证了缩放法则(Scaling Law)的正确性后,更大的算力集群,便成了训练出更优模型的必备条件。
为此,AI厂商不得不构建起包括成千上万张GPU算力卡的算力集群,这便带来了卡与卡之间互联和通信的新麻烦。
针对上述难题,2024年3月,英伟达率先发布了NVL72超节点,支持把72张算力卡组成一个超节点,为万亿参数的大模型训练和推理提供服务。
作为对比,华为CloudMatrix 384顾名思义便是以384张昇腾算力卡组成一个超节点,从而在规模、性能和可靠性上对标英伟达的NVL72。
华为的野心时刻被黄仁勋看在眼中。在谈及国产芯片竞争时,黄仁勋再度提及华为,“任何低估华为、低估中国制造能力的人,都是极其天真无知的。华为是一家非常强大的公司,我以前见过他们开发出的技术……他们能够做到和我们接近,这说明了一切。”
华为之外,作为当前GPU芯片上市第一股的寒武纪,则用更直观的财报数据,向外界展示了是如何瓜分英伟达蛋糕的。
2025年一季度,寒武纪实现营业收入11.11亿元,同比暴涨4230.22%,接近去年全年营收。归属于上市公司股东的净利润3.55亿元,上年同期为亏损2.27亿元,实现历史性的扭亏为盈。这也是寒武纪连续第二季度实现盈利,去年第四季度寒武纪归母净利约为2.81亿元。
更多创业公司也在暴涨订单助力之下,开始抢夺上市窗口期,包括沐曦股份和摩尔线程在内,都于年内提交了IPO申请。
B
但在国产芯片厂商纷纷争当英伟达平替的另一面,则是他们受限于产能等因素,还无法把到手的订单全部消化。
以寒武纪为例,尽管其一季度营收暴涨超40倍,但绝对值上也只有约11亿元人民币,相比英伟达一季度55亿美元的计提损失,占比不到3%。
就在国产芯片还在等待产能提升的当下,英伟达H20芯片值此解除禁售,等于反过来又抢了一波国产芯片的空窗期。这一变动,将直接影响三季度后的国产芯片厂商整体营收规模,也将抢占国产芯片原本就不大的市场空间。
年初DeepSeek爆火带动一众科技大厂加码To C应用时,尤其是腾讯元宝因接入DeepSeek流量暴涨,有报道称腾讯、字节等向英伟达紧急下单了一批H20芯片,以满足AI应用的算力消耗。
但随着4月份H20被禁,上述订单也不了了之。近期H20解禁后,外界很快传出字节、腾讯等厂商已经向英伟达下单。对此,黄仁勋否认称,自己还没来得及与任何客户会面。“需要一些时间来提升H20供应链的产能,未来几个月,英伟达将努力加速这一过程。”
之所以仍有一众厂商愿意等待英伟达H20芯片,关键原因之一在于,英伟达芯片在多卡串联的并行计算环节,仍然存在较大优势。
微软大中华区Azure事业部总经理陶然便曾对外解释道,很多厂商没有能力去实现多卡连接,但多卡并行运算却直接决定着大模型训练所需花费的时间成本,“同样的一套模型,如果训练一次需要花费一周成本为100万美元,但如果带宽太小最终耗时两周,那成本就将乘以2。”
在崇尚效率的大模型赛道,时间有时比金钱更重要。更糟糕的是,即便是在更换国产GPU的过程中,国内AI厂商眼下也面临无法使用更先进制程工艺芯片的挑战。美国相关部门已经将壁仞、摩尔线程等国产GPU公司列入实体清单,这意味着在没有获得许可的情况下,它们既不能进口含有美国公司的任何技术或产品,也不能通过台积电等代工厂生产14nm以下的先进芯片。
对国产芯片厂商来说,算得上好消息的一点是,从2022年开始的英伟达芯片禁令,把控方向正变得越来越严格,且政策还往往易变。即便H20芯片解禁,从供应链稳定和安全的角度考量,部分AI厂商也需要这些国产芯片厂商继续供货。
C
英伟达的麻烦并未随着H20的解禁而告一段落。相比上半年近千亿的损失,更令英伟达担忧的,则是大客户纷纷自研芯片的现状。这一景象已经在美国陆续发生。
为了降低用云成本,微软、谷歌等美国头部云厂商开始加速自研服务器芯片和云端AI芯片。
“如果你能制造出针对AI进行优化的硅,那前方等待你的将是巨大的胜利。”研究公司Forrester分析师格伦·奥唐纳形容道。
谷歌曾是最早大规模采购GPU来进行AI计算的公司,但后来研发自己的AI专用芯片,在2016年就已经发布了第一代TPU(张量处理单元)。如今,从AI绘图公司Midjourney,到AI独角兽公司Anthropic,都开始使用起了谷歌的算力。
亚马逊也借助2015年收购的以色列芯片初创公司Annapurna Labs,在2018年前后推出了基于Arm的服务器芯片和AI芯片,并开始将自研算力服务器兜售给包括OpenAI、Anthropic等在内的AI大客户,从而挤占英伟达的市场份额。
就连一贯英伟达强绑定的OpenAI,也在内部筹划着自研芯片的事情。至少从2022年开始,OpenAI就已经讨论了各种方案,希望能解决芯片又贵又短缺的问题,自研芯片便是方案之一。
对需求量大的国内科技大厂而言,成本压力也是华为、阿里、百度、字节、腾讯等自研芯片的原因之一。国信证券在一份研报中称,处理器芯片占服务器BOM(物料清单)成本约40%。
在阿里、百度相继推出各自的平头哥和昆仑芯计划之后,2021年3月,媒体曝出字节跳动正在自主研发云端AI芯片和Arm服务器芯片。字节跳动随后证实,正在组建芯片团队。
几乎在同一时间,腾讯也被曝出多个芯片研发岗位的招聘信息。官方随后回应,腾讯正在研发的并非通用芯片,而是基于一些业务需要,在特定领域展开的协处理器研发尝试,比如AI加速和视频编解码等。
类比当前智能手机领域的芯片竞争格局,展望未来的AI芯片领域,未必不会达成部分复杂场景用英伟达芯片,部分简单场景用自研和国产芯片的混合计算架构局面。
但想要维持上述局面的一大前提是,黄仁勋得避免让英伟达芯片再度迎来出口禁令。
文档于: 2025-07-18 12:53 修改
标签:
评论列表
英伟达“丢掉”的1000亿,国产平替还能继续赚吗?...
“我们可能无法全部恢复先前的库存减计损失,但大多数库存是可以恢复的。新的客户需求和我们现有的库存产品是可以匹配的,所以不能说100%恢复,但也不是完全没有可能。”这是英伟达创始人...