打印页面

首页 > 企业 谷歌TPU商业化推进,算力芯片市场有望重构!AI ASIC已在崛起

谷歌TPU商业化推进,算力芯片市场有望重构!AI ASIC已在崛起

算力芯片酝酿重要变局,TPU有望抢占更多市场!

随着推理算力需求快速增长,ASIC芯片逐渐抢占GPU市场份额,谷歌TPU(张量处理器)就是佼佼者。根据媒体报道,谷歌已经向客户推销TPU,推进TPU运用于AI数据中心。

其中,科技巨头Meta已经对谷歌TPU产生了浓厚的兴趣,在内部讨论斥资数十亿美元购买TPU,拟从2027年开始将谷歌TPU部署在数据中心。

受此影响,英伟达11月25日盘中显著下跌,谷歌近期则领涨美国科技股。

展望未来,以TPU为代表的ASIC将展现出更强的竞争力,进而重构全球算力芯片市场。

1、“谷升达落”成科技界焦点,谷歌TPU芯片或对外出售

自从AI技术大爆发以来,全球科技巨头持续加码AI大模型,众多行业日益拥抱人工智能,AI芯片的需求将与日俱增,AI芯片供应紧张状况一直延续。

在大模型训练阶段,以英伟达为代表的GPU公司站上了AI风口,公司总市值峰值已经突破5万亿美元。然而,10月底以来,英伟达股价持续走弱,就算超预期的财报也没有带来更多的买盘。

特别是当地时间11月25日,英伟达跌幅一度接近7%,最低价较10月底峰值下跌超20%。与英伟达形成鲜明对比的是,谷歌股价持续上涨、刷新历史纪录。特别是巴菲特买入谷歌,这给市场传递了更强的信心。

究其原因,除了谷歌Gemini 3 Pro展现出较强的实力,公司自研的TPU也有望带来增量业务。

2025年4月9日-11日,Google Cloud Next 2025 大会在美国拉斯维加斯召开。谷歌正式发布了第七代TPU加速器Ironwood,这款芯片专为AI推理而设计,将单芯片算力峰值提升至4,614 TFLOPs(每秒浮点运算一万亿次)。TPU指的是张量处理器(Tensor Processing Unit),是谷歌专门为机器学习设计的、适配谷歌TensorFlow深度学习框架的ASIC(专用集成电路)。

TPU采用8位低精度计算,这不仅较少影响深度学习精度,还能降低所需的晶体管数量、提升运算效率。早在2016年,谷歌便首次发布TPU,第一代TPU采用28nm制程,并运用在围棋软件AlphaGo、谷歌街景服务等。

经过七代TPU产品的迭代升级,Ironwood算力已经得到了较大的提升,而且还可以支持FP8数据计算,FP8是一种新兴的低精度浮点数格式,存储空间小、运算速度快。

Ironwood还提升了高带宽内存容量,每颗HBM容量达到192GB,较第六代TPU产品Trillium提升了6倍。

谷歌为Ironwood设计了两种配置,包括256芯片集群和9216芯片集群,分别面向推理和训练两种场景。当规模达到最高级别时,Ironwood能够提供42.5EFLOPs(每秒百亿亿次浮点运算)。

Ironwood将促进AI基础设施建设向推理领域转变,而具备推理能力的AI大模型不断繁荣下游应用领域,在这个过程中,AI Agent(AI智能体)将成为关键环节。

以往TPU主要供谷歌内部使用,而谷歌第七代TPU Ironwood将在商业化道路上迈出重要一步,或将成为整个算力行业的有力竞争者。

2、算力芯片市场有望重构,ASIC有望获得更大市场

所谓的AI芯片,就是可以运行人工智能算法的芯片,此类芯片为了适应人工智能算法而专门进行了加速设计。

人工智能技术主要包括深度学习、机器学习、知识图谱、自然语言处理等技术,融合了计算机、心理学等学科,能够帮助程序、机器如人类一样去思考、处理问题。

与传统芯片不同,AI芯片要处理更加复杂的运算,设计上就要提升处理速度,这就需要注重加速器、高速存储、高集成度等。

AI芯片技术路线不仅局限于GPU,FPGA、ASIC等芯片也逐渐引来了行业的关注。此前科技巨头训练大模型,需要使用GPU芯片,而近期AI技术热点逐渐由预训练向推理倾斜,这就需要由多种定制芯片来完成,ASIC将扮演更加重要的角色。

GPU此前主要用来处理图像,拥有强大的浮点运算能力。随着深度学习的发展,GPU一举成为AI领域的利器,英伟达的高端GPU就成为全球科技巨头梦寐以求的硬件。

FPGA则是现场可编程门阵列,是一种半定制集成电路,可以满足不同的设计,具有较高的灵活性。FPGA特殊性能,非常适用于AI推理阶段。

ASIC则是专用集成电路,就是为了满足特定需求而开发的芯片。与GPU人工智能芯片相比,ASIC具有功耗较低、体积更小、成本更低等优势。尤其是在执行特定的任务时,ASIC就可以兼顾效率和成本,实现更优的解决方案。

需要注意的是,ASIC是针对特定场景而设计的,一旦设计完毕则只能适配特定用途。如果用途发生变化,极有可能要设计新的ASIC。

在AI ASIC芯片领域,英特尔也成为重要的参与者。2019年,英特尔收购AI公司Habana Labs,三年之后便发布了AI芯片Gaudi 2。2024年,英特尔发布Gaudi 3,较英伟达H100训练性能提升了1.7倍。英特尔此前透露,公司也在开发用于以太网网络的AI NIC ASIC。

在AI ASIC需求快速增长的背景下,未来更多的科技公司将在算力芯片领域有所突破。

文章来源:http://www.xinwulian.net/enterprise/2025/1127/3151.shtml