SpaceX旗下位于孟菲斯的Colossus 1数据中心,其全部算力被出租给外部客户,背后的真实原因终于浮出水面。这并非外界此前猜测的战略转型主动选择,而是一场由技术局限倒逼的务实变现。据彭博最新报道,知情人士透露,SpaceX在尝试将Colossus 1与另外两处数据中心园区联网、协同训练前沿AI模型时,遭遇了难以逾越的技术障碍。
核心问题在于网络延迟与硬件异构。Colossus 1与另外两处站点之间的距离超过10英里,老化的网络基础设施导致节点间连接存在严重延迟。对于训练更大、更强的AI模型而言,极高速的节点间通信是基本要求;一旦链路带宽不足或存在延迟,整个集群的训练效率就会被拖累至最慢节点的水平。此外,Colossus 1内部混合部署了英伟达多代芯片,包括Hopper和Blackwell系统,以及部分更老旧的加速器。相比之下,Colossus 2和Colossus 3则围绕Blackwell芯片进行了更统一的部署。在分布式训练集群中,较旧的芯片会形成性能瓶颈,迫使更快的加速器等待,导致整体算力向最慢的硬件看齐。
面对这些技术局限,SpaceX最终判断,与其持续投入大量资源去解决网络和硬件兼容性问题,不如将Colossus 1的容量整体出租,转化为稳定的收入来源,同时将更新、更统一的设施保留用于自身AI开发。
这一决策在财务层面已产生显著影响。根据此前报道,SpaceX已相继与Anthropic和谷歌签署巨额算力租赁协议。Anthropic每月支付12.5亿美元,谷歌从今年10月起每月支付9.2亿美元,两笔合同的年化收入规模合计约达260亿美元,合同总价值超过700亿美元。这些交易为SpaceX目标融资规模高达750亿美元的IPO提供了强劲的收入叙事支撑。在路演中,SpaceX将数据中心建设作为核心亮点,强调其首座Colossus设施仅用122天便完成建设,超越自身预期及行业平均水平。
然而,Colossus 1出租事件所揭示的技术困境,对SpaceX的叙事构成了微妙压力。今年早些时候,SpaceX完成了对马斯克旗下xAI的收购,并将数据中心业务定位为向AI基础设施提供商转型的战略支点。但Colossus 1因硬件混用和网络延迟而无法用于前沿模型训练,令外界对这一转型的可信度产生审视。市场观察人士指出,将算力出租给竞争对手而非用于自家模型训练,本身即暗示内部AI开发可能遭遇挫折。与此同时,部分分析人士对相关交易定价是否超出市价、以及交易结构是否存在“循环金融”特征提出质疑,认为这或许是xAI因GPU架构混乱、模型训练受挫后的资产变现。
SpaceX首席财务官Bret Johnsen近期表示,公司并未放弃自身内部AI服务,包括Grok。马斯克本人也表态称,SpaceX保留提前终止与Anthropic算力协议的权利,并提到“如果算力变得极度紧张,我们可能需要在某个时候收回它”。这些表态试图为未来战略调整保留弹性,但当前Colossus 1的技术局限已是不争的事实。
这一事件折射出SpaceX在快速扩张AI基础设施过程中面临的深层挑战。一方面,大规模数据中心建设速度惊人,展现了强大的工程执行力;另一方面,网络基础设施老化、硬件代际混用等问题,暴露出在追求速度的同时,技术整合与长远规划可能存在短板。对于密切关注马斯克生态的投资者而言,Colossus 1的出租既是短期收入变现的务实之举,也是衡量SpaceX能否真正转型为AI基础设施领导者的一个关键观察窗口。