AI推理基础设施市场正经历一场成本与供给的双重冲击。在知名风投机构Altimeter近期举办的活动上,AI推理基础设施服务商Baseten首席执行官Tuhin Srivastava披露了一组关键数据:其云服务商早在今年5月就提前通知,英伟达B200 GPU的每小时租赁单价将在10月合同续约时,从现行的2.63美元大幅上调至5.10美元,涨幅接近94%。

这一调价幅度并非孤立事件,而是算力市场供需失衡的缩影。Tuhin Srivastava强调,云服务商提前数月主动报价,本身就说明在算力持续紧缺的背景下,需求方几乎丧失了议价能力。对于依赖GPU进行模型训练和推理的AI企业而言,这意味着运营成本将显著攀升,尤其是那些以租赁模式为主的中小型公司,可能面临预算压力。

供给端的紧张态势同样不容乐观。据Tuhin Srivastava介绍,当前若采购1000块GPU,交付排期已普遍延至明年第二季度,等待周期长达12至15个月。交付瓶颈与租赁价格上涨形成叠加效应,企业即便愿意加大资本支出,短期内也难以通过直接采购来补足算力缺口。这迫使更多公司转向租赁市场,进一步推高需求,形成恶性循环。

Baseten作为一家总部位于旧金山的AI推理基础设施服务商,其业务涵盖模型部署、管理与监控,客户多为对算力有刚性需求的生产级应用开发者。此次披露的数据,从一线服务商视角验证了行业普遍面临的挑战:价格上行与供给瓶颈双重挤压下,AI推理的成本正面临实质性抬升。市场观察人士认为,若供给端未能及时缓解,这种趋势可能持续至明年,影响AI应用的规模化落地节奏。