据The Information近日披露,马斯克旗下人工智能公司xAI发生一起严重乌龙事件:一名员工在数据迁移过程中,误删了其编程产品约2到3周的核心训练数据。一位参与项目的人士证实,这批数据瞬间蒸发,对正在紧锣密鼓推进的模型训练造成直接打击。
The Information记者Amir Efrati在X平台上转发了报道,并配上一句引发广泛共鸣的调侃:“你最糟糕的工作日,可能也比这位xAI员工最糟糕的一天,好上十倍。”
这次事故并非孤立的技术失误,而是xAI近期剧烈组织震荡的缩影。据TechCrunch今年3月报道,xAI原有的11位联合创始人已全部离开。最密集的离职潮发生在2月,即SpaceX完成对xAI的收购后不久,负责推理、研究、安全等关键领域的联创在一周内接连告别。5月,据Fast Company报道,首席财务官辞职,负责算力与基础设施的Heinrich Kuttler也在X上宣布离开。同期,The Information指出,约10名Grok团队成员受到新一轮裁员影响。
在团队不断换血的背景下,一次迁移误删几乎是系统性风险。组织震荡的另一面,是产品线始终未能追上对手。今年5月,xAI上线了编程智能体Grok Build的早期测试版,并推出grok-build-0.1的API公测,主打智能编程任务。但入局时间明显偏晚,直到去年8月才发布首款编程模型,而Claude Code、Codex CLI等竞品早已在开发者中建立口碑。
马斯克本人也承认xAI在编程能力上落后。为扭转局面,他押注于新一代基础模型V9。5月中旬,马斯克透露V9(1.5T)训练完成,跑分优异;到5月25日,他正式宣布V9-Medium训练完成,参数量约为支撑Grok线上流量的V8-Small(0.5T)的三倍,并针对英伟达Blackwell架构做了优化。大量来自Cursor的真实开发数据已注入补充训练,预计2到3周上线。
被删数据的重要性正在于此。马斯克将V8的短板归结为数据质量、全面性和比例问题,V9想翻身,关键就在于喂入更高质量、更贴近真实开发过程的数据。那2到3周的训练成果蒸发,无疑给追赶计划蒙上阴影。
追赶手段不止明面一套。据The Information援引两名知情者称,xAI曾进行一个持续数月的蒸馏项目,直接使用Anthropic旗下Claude的输出作为训练材料,喂给自家编程模型。若属实,这直接踩中了Anthropic的服务条款红线——明确禁止用其输出训练竞争模型。今年1月,xAI联合创始人Tony Wu告知员工,Anthropic已切断公司访问通道;部分工程师改用个人账号继续使用Claude,随后也被陆续封禁。xAI继而转向一家名为Blackbox AI的加密中介,借道访问竞品模型,直至5月中旬仍在通过该服务运行基准测试。马斯克本人在今年5月与OpenAI的诉讼中作证时承认,xAI“部分”用过OpenAI模型训练Grok,并称这在业内很常见。
围墙、翻墙、再砌墙,互相测、互相学、互相封,已成为AI公司间新的竞争常态。而追到最后,xAI却与对手做起了算力生意。今年5月20日,SpaceX向SEC递交S-1文件,披露了一笔离奇交易:曾被马斯克公开骂作“邪恶”的Anthropic,如今每月支付约12.5亿美元,租下xAI在田纳西州孟菲斯的Colossus 1数据中心,几乎包下300兆瓦算力,合约签到2029年5月。粗算一年约150亿美元,整个周期可能带来超过400亿美元收入。
Colossus 1本是xAI为训练Grok打造的超算中心。如今Grok用户流失,算力却建得太满,于是xAI将其租给了最想追上的对手。SpaceX在文件中称,这笔交易“让我们能把基础设施里闲置的算力变现”。更耐人寻味的是,合约包含一条90天退出条款,任何一方提前通知即可终止。马斯克近日在X上反复说这是短期生意,希望交易短一点,因为“某个时候,我们可能需要把算力要回来”。
就在几天前,Google也签下类似订单,每月向SpaceX支付约9.2亿美元租用算力。把算力卖给对手,正成为xAI的一门现实生意。至于下一代Grok,SpaceX在招股书中仅表示仍在数据中心训练新旗舰模型,但发布时间表只字未提。追赶仍在继续,只是这一次,连追赶者自己也说不准终点到底在哪。