标题图片|

本文是《AI巨头来袭》系列文章的第001篇,《AI巨头来袭》关注AI领军企业的最新动向,我们会持续追踪这些影响AI未来走向的核心玩家,本文将重点关注发布的H20 GPU芯片。

一块性能大幅下降的AI芯片,可能让英伟达在中国暴赚900亿。

7月5日,一家咨询公司发布报告称,预计今年将交付100万块H20 GPU。

考虑到这是一款性价比不高的阉割版“中国专供版”芯片,基本可以确定这100万颗芯片今年将全部流入中国大陆市场。按照目前该类芯片1.2-1.3万美元的渠道定价计算,H20芯片至少能为英伟达带来120亿美元的收入,这已经超过了该公司去年在中国的总收入。

不过,H20在中国市场的实际情况,或许并没有咨询机构预期的那么乐观。

一位服务器经销商告诉虎嗅,目前H20八卡服务器售价在120万元左右,而性能明显更胜一筹的满配H100版本八卡服务器售价在270万元左右,且有现货。

虽然后者很早就被列入了对华禁售产品名单,但这款芯片通过非官方渠道供货基本没有中断过,甚至在今年第二季度H200上市后,这款芯片的价格还下跌了10%左右。

“无论怎么看阐发(2023澳门资料大全免费十开奖记录)“阉割版”AI芯片也能让英伟达疯狂赚钱?,H20的性价比还是太低了。”上述服务器经销商提到,即便与国产解决方案相比,也很难说H20有多大的竞争优势。

“阉割版”,不过还挺良心?

与同一系列的其他芯片不同,H20是一款明显仓促推出的产品。

去年10月美国升级芯片禁令之后,原本被视为阉割芯片的A800/H800,甚至是消费级产品都被纳入了禁令范围。

但仅一个月后,就有台湾媒体报道称,向一家代工厂下了H20芯片的订单。

不可能在这么短的时间内重新设计一款芯片,最有可能的是在现有型号的基础上进行有针对性的调整。

比如新规取消了“互联带宽”作为限制芯片的标识参数,因此将H20的HBM3显存容量提升至96Gb,显存带宽提升至4.0Tb/s;再比如新规增加了“性能密度”的限制,因此大幅下调了计算能力规格,使其理论性能只有H100芯片的15%。

至于新规中没有提到的PCIe Gen5扩展卡、八路HGX等,都全部保留了下来。值得一提的是,H20还拥有极高的卡间互联速度,其NV Link带宽达到900Gb/s,非常适合组建大规模集群。

但这些特点结合在一起就形成了一个非常尴尬的事实:在算力大幅降低的情况下,H20的BOM(综合硬件成本)很可能与后者持平,甚至更高。

原因在于存储颗粒一直以来都是高性能计算卡成本的大头,例如在H100芯片中,HBM3颗粒的采购量就占到了60%左右,而在H20芯片上,还要为其配备更高规格的显存容量,以弥补计算能力的不足。

基本可以得出,H20是高性能计算卡中利润率最低的,相比1.2万至1.3万美元的售价,同等成本的H100目前售价在2.5万至3万美元。

从这个角度来说,H20是的一款良心产品。

英伟达自然不愿意让单一产品拉低公司整体毛利表现新澳门正版资料,但自去年芯片禁令升级以来,英伟达第四季度在中国大陆的营收已从上一季度的40.3亿下滑至19.46亿,中国区数据中心营收占比也从22%下滑至8%。英伟达急需一款产品来稳住中国区市场份额。

H20是的诚意之作,但问题依旧存在:H20的算力实在太弱,这个缺陷不容忽视。

华为会反击吗?

事实上,在今年2月份就正式进行了价格调整,此次调价前H20芯片的售价为2.3万美元,虽然表示降价原因是“供货充足”,但如此大幅度调价的主要原因很有可能是销量未达预期。

“国内的大厂商基本都不考虑H20的服务器,都是盲目购买H100,规模比较小的那些厂商也认为不划算。”

有服务器经销商帮我算了一笔账,目前单台H100服务器的租赁费用大概在8-9万元/月,而算力只有前者六分之一的H20服务器售价则在120万元左右,即使不考虑算力损耗的问题,厂商也需要采购6台H20服务器才能与H100服务器平起平坐。

在这次比较中,虽然H20是利润率最低的产品,但对于客户来说,其实性价比并不高。

对于来说,另一个不可忽视的因素是国内同类型的竞争对手,例如华为 910B。

910B相比H20,计算能力(FP16)几乎是前者的一倍。相应的,910B的售价也比H20高。服务器经销商告诉我,目前910B服务器的售价已经超过170万元。

抛开价格不谈,从实际性能上看,两者的竞争不相上下。910B在算力和能效上强势,而H20在软件生态和互联互通上更胜一筹。最直接的例子就是H20兼容所有H系列卡,拥有极高的访存能力,在组建算力集群时可以更好的避免算力损耗。

当然,这个集群的规模是有上限的,比如各地规划的“万P计算集群”,如果用H20来搭建,那么单卡0.15P的算力就意味着10万块GPU,联网难度极大。

另外一个值得关注的问题是,和华为谁能更稳定地供应产品?

此前有业内人士向笔者提及,对于急于购置和搭建计算中心的制造商来说,H20或许是更为现实的选择。

一方面,的软件生态更加成熟,厂商的适配工作量要小很多;另一方面,目前无论是政策方还是资本方,都对计算中心芯片的国产化率有一定要求,910B的需求量非常大,相应的交付周期也比较长。

这一说法也得到了服务器经销商的验证,其告诉我,“在调整价格之前,业内客户对910B的询盘要多于H20,但现在由于库存充足,也有部分客户对H20表现出兴趣。”

有趣的是,二者或许并不属于完全的竞争关系,因为一位业内人士告诉笔者,在他的公司,910B与H20是分为不同等级的,采购上并不存在冲突。

正在改变世界或想要改变世界的人,都在虎嗅APP