打印页面

首页 > 快讯 禁令后大模型厂商急寻PlanB 英伟达改良版芯片已调试

禁令后大模型厂商急寻PlanB 英伟达改良版芯片已调试

国内算力“涨价风暴”期待产能上升

作者/ IT时报记者毛宇

编辑/郝俊慧孙妍

自10月24日美国针对人工智能(AI)芯片的出口管制禁令正式生效,已经月余。

《IT时报》记者多方采访获悉,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8卡服务器仍高达百万级。英特尔则对Gaudi 2改良版本表示暂无相关回应。仍可以在国内销售的AMD MI 210则被认为在大模型微调阶段具有相当竞争力。

“最近算力涨价太多,我们确实感到很吃力。”一家大模型创业公司人士告诉《IT时报》记者,他们迫切希望有Plan B方案。

最好的Plan B当然是国产算力。目前能够与英伟达一战的华为昇腾910B已经在科大讯飞、多地智算中心落地商用,且从测试结果来看,某些性能已经与英伟达芯片相当。但突如其来的禁令,使得国内大模型厂商对华为芯片的需求直线上升。

春天来得太快,华为的供应链还需时间做好准备。

01 改良版:训练能力下降综合能耗上升

针对禁令,英伟达、英特尔、AMD等公司迅速做出反应,均放出消息正加紧研制改良版AI芯片。

英伟达计划推出最新改良版系列芯片——HGX H20、L20 PCle和L2 PCle,其中HGX H20被认为是此次被禁售的H800替代品。一位英伟达经销商告诉《IT时报》记者,“HGX H20正在适配测试中,说是改良版,但其实是‘缩水版’。据我了解,H20符合美国出口芯片的相关规定,性能上比H800会有不小差异,但拿货最快也得下个月。”

据钛媒体App此前报道,H20在带宽、计算速度等方面均有所限制。理论上,整体算力要比英伟达H100(第一代被禁芯片)降低80%左右,即H20等于H100的20%综合算力性能,但增加了HBM显存和NVLink互联模块。

一份网传的调研报告认为,H20设计工艺较为一般,甚至不如华为昇腾910B的算力设计工艺,但增加的显存和网络带宽可能更适合训练参数不多的模型,适合多卡堆叠与多个AI服务器的使用,“如果有足够的买卡资源,并不考虑能耗,H20算力可以达到H100算力集群算力。”

但一位云计算业内人士认为,这种情况实现的可能性并不高,“H20是风冷,热设计功耗为400W,和A100大体相当,虽然低于H100的700W,但靠堆叠达到H100的算力,可能实际功耗是H100的2倍甚至更高。到最后比拼的都是能源,根本没有足够的电力供应机房。”

02 国产算力性能对标但供应不足

受限于禁令,这一个月来,算力市场风起云涌。

11月初,包括中贝通信、优刻得等提供AI算力技术服务的国内上市公司均公开表示,受服务器供应紧张影响,租赁价格将会结合市场行情等因素进行相应调整。

英伟达A100芯片算力服务收费价格甚至最高上调100%。

《IT时报》记者从某云商了解到,H800的算力资源非常紧俏,基本有价无货,A100(A800)的算力租赁价格上涨幅度暂时只有20%左右,但库存水位已经很低。

众多目光聚焦于国产本土AI芯片,而热度最高的自然是华为昇腾。此前《IT时报》曾独家报道,昇腾910B已在国内不少智算中心落地,进入规模化商用前期,且从多个信源反馈,在某些指标上,910B已经可以对标英伟达去年被禁的A100。

“我们之前已经和华为团队有深度合作,双方研发人员联手攻克了不少困难。”最近刚刚发布千亿参数大模型星辰的中电信人工智能科技公司副总经理刘翼告诉《IT时报》记者,测试中华为昇腾带来不少惊喜。

通信高级工程师、战略规划专家袁博此前在接受《华夏时报》采访时表示,华为昇腾芯片和英伟达GPU的适用场景不一样,在AI机器学习训练领域,其能力已经接近甚至部分超越英伟达的水平,但图像图形处理是弱势,因此只能弥补英伟达的部分场景。

“基于华为昇腾910B的算力价格大概和英伟达A100差不多,”一名接近华为的业内人士告诉《IT时报》记者,尽管H20仍有生态优势,但长远来看,国内各大厂商仍将华为昇腾看作Plan B的最优解,“只是910B产能正在慢慢爬坡,目前暂时无法满足这么多需求。”

长期来看,美国禁令的进一步收紧,给了国产算力更充足的发展时间。

IDC最新报告指出,随着政府支持,中国本土云端AI加速芯片制造商也正在快速增长。2023年上半年,中国AI服务器使用了50万块本地采购/开发的AI加速器芯片。这一数量占据了中国整个服务器市场的10%。显然,这个数字在2024年将飞速跃升。

03 算力服务器价格翻倍

至少在目前,国内各大厂商仍离不开英伟达。百度CEO李彦宏此前回应,百度得益于之前开发文心一言,已保存不少AI芯片,能够保证未来1~2年内不断更新AI大模型。腾讯高层也回应,H800等芯片库存水平较高,未来可支持几代混元大模型的更新。

《IT时报》记者分别致电腾讯、阿里、百度公司,询问AI芯片订单问题,但均未得到正面回应。

在大模型带来巨大算力消耗的红利之下,英伟达迎来了收入、利润暴增的三季度。11月22日,英伟达发布2024财年三季度财报,财报显示:英伟达三季度营收181.2亿美元,同比增长205.5%。营业利润104.2亿美元,同比增长1633.7%。营业利润率高达57.5%。

如此看来,算力芯片冲击仍有一段缓冲期,能够给到国内各大AI厂商一丝喘气和补救的时间。但另一方面,各类AI芯片正处于涨价通道,“僧多粥少”的局面仍在持续,尤其对于资金力度不够的中小AI企业来说,如今算力服务器和算力的价格并不友好。

“现在H800和A800服务器(不等同于算力租赁价格)的价格很高,一台已经飙升至350万和200万左右,比之前翻了一倍。”一名经销商表示。记者发现,不少经销商在各大社交平台发帖称手中有少量现货可以出售,并长期以市场行情价回收二手AI芯片。

“A800和H800价格比较乱,且不便宜。”一名江苏的芯片经销商告诉《IT时报》记者,随着美国禁令突然加强,国内二手算力芯片市场又开始活络,不少经销商开始面向全国收售英伟达二手A800和H800芯片。

另一位上海经销商告诉记者,他手上有少量现货的H800,报价超310万元,国产华为昇腾910B服务器的报价则为H800的一半,并称保证最快可于12月初交付现货,“越早订货可以越早交付。”

混战仍将持续一段时间。

文章来源:http://www.xinwulian.net/news/2023/1129/1787.shtml