告别训练“军备竞赛”,AI决胜关键已转向推理芯片
一块小小的芯片,正在成为推动人工智能从“训练”走向“应用”的关键支点,撬动着未来三年超过3100亿元的市场规模。
当推理需求超越训练,谁能掌握这场算力竞赛的主动权?
近期,OpenAI与晶圆级AI芯片企业Cerebras签署了一份协议,OpenAI将在2026~2028年把750MW规模的Cerebras芯片集成到其AI推理计算资源库中。
这一大规模部署并非用于模型训练,而是专门为AI推理服务。
推理,这一让训练好的模型真正“工作”的环节,正在成为AI芯片市场的新焦点。
市场研究机构IDC中国副总裁周震刚指出,2024年,中国数据中心加速卡有57.6%是推理卡,33%是训练卡。而在DeepSeek出现后,一些小型公司的算力从训练转到推理。腾讯、百度这类平台接入DeepSeek也大大推动了推理芯片的增长,因此预计2025年推理芯片占比还会进一步大幅增加。
推理需求超越训练,产业迎来爆发点
过去两年,大模型训练是AI芯片市场的绝对焦点。
如今,这一格局正在悄然改变。
《2025-2030年人工智能芯片行业市场调研及投资前景预测报告》显示,中国AI推理芯片相关产品及服务行业市场规模正以惊人的94.9%复合年增长率扩张,从2020年的113亿元增至2024年的1626亿元。预计到2025年,这一市场规模将达到3106亿元。
这一爆发性增长的主要推动力来自AI大模型的快速落地应用。
生成式AI的普及 彻底改变了需求结构。开源且性能出众的大模型如DeepSeek-R1面世后,更多人开始真正将大模型用起来,促使推理需求大幅增长。
腾讯管理层在近期业绩交流会上明确指出,公司看到对GPU更大的需求是在推理侧,用户推理需求逐渐增长,AI需求已超过现有GPU资源所能提供的算力。
这种转变同样体现在智算中心的建设规划上。
2024年12月,香港规模最大的数码港人工智能超算中心投入服务,香港为申请使用者提供资助。数码港行政总裁郑松岩表示,该超算中心第二阶段规划算力是1700PFLOPS,2025年10月该超算中心算力将提升到3000PFLOPS。
中国AI推理芯片市场的快速扩张也与政策环境密切相关。国家政策正在加快智慧城市发展与数字政府芯片相关的产品及服务。
这些大型项目需要大量运算基础设施,使得运营成本控制成为关键考量,而具备卓越能效比的AI推理芯片相关产品及服务正能满足这一需求。
国产芯片站上竞技台,性价比成制胜关键
随着推理需求成为市场主流,AI芯片的竞争格局正在发生深刻变化。
一个最明显的趋势是:国产芯片正迎来前所未有的发展机遇。
周震刚提供的数据显示,2024年中国数据中心加速卡市场中,国产算力占比已达到34.6%。相比2022年和2023年英伟达占据85%-90%市场份额的格局,这一变化意义重大。
推理任务的特点为国产芯片提供了切入市场的机会。与训练任务不同,推理环节对AI芯片的兼容性要求更为灵活,可以将不同应用的推理负载分配到不同的芯片上。
图片来源:英伟达官网截图
这意味着国产芯片能够在不与英伟达直接竞争的情况下,找到自己的应用场景。
市场对国产芯片的接受度正在快速提升。
一些观察人士指出,过去客户会询问国产芯片与英伟达H100相比的优势、性价比和生态兼容性,“现在这些问题已经没有太大影响了”。
云厂商或AI厂商现在需要英伟达之外的更多国产芯片方案作为补充和备份。
在这个市场中,极致性价比成为国产芯片的制胜法宝。
有业界人士直言:“国产芯片通过极致的性能优化,可以在特定领域实现超越英伟达4090的极致性价比。”
这些特定领域包括信创、交通、能源、通信等。
随着边缘设备上运行的大模型越来越智能,从智能手表到工业机器人,推理芯片的市场边界正不断扩展。
这块曾经被训练芯片光芒掩盖的市场,正在迎来属于它的黄金时代。
这块小小的推理芯片,不再只是技术的附属品,而是决定AI能否真正融入千行百业的关键变量。
来源:第一电动网
作者:盖世汽车
本文地址:
以上内容转载自盖世汽车,目的在于传播更多信息,转载内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网,如有侵权请联系admin@d1ev.com删除。

