xAI员工误删数周训练数据，Grok重组后遗症浮现

xAI员工在数据迁移中误删编程产品核心训练数据，相当于2到3周工作量。

据The Information近日披露，马斯克旗下人工智能公司xAI发生一起严重乌龙事件：一名员工在数据迁移过程中，误删了其编程产品约2到3周的核心训练数据。一位参与项目的人士证实，这批数据瞬间蒸发，对正在紧锣密鼓推进的模型训练造成直接打击。

The Information记者Amir Efrati在X平台上转发了报道，并配上一句引发广泛共鸣的调侃：“你最糟糕的工作日，可能也比这位xAI员工最糟糕的一天，好上十倍。”

这次事故并非孤立的技术失误，而是xAI近期剧烈组织震荡的缩影。据TechCrunch今年3月报道，xAI原有的11位联合创始人已全部离开。最密集的离职潮发生在2月，即SpaceX完成对xAI的收购后不久，负责推理、研究、安全等关键领域的联创在一周内接连告别。5月，据Fast Company报道，首席财务官辞职，负责算力与基础设施的Heinrich Kuttler也在X上宣布离开。同期，The Information指出，约10名Grok团队成员受到新一轮裁员影响。

在团队不断换血的背景下，一次迁移误删几乎是系统性风险。组织震荡的另一面，是产品线始终未能追上对手。今年5月，xAI上线了编程智能体Grok Build的早期测试版，并推出grok-build-0.1的API公测，主打智能编程任务。但入局时间明显偏晚，直到去年8月才发布首款编程模型，而Claude Code、Codex CLI等竞品早已在开发者中建立口碑。

马斯克本人也承认xAI在编程能力上落后。为扭转局面，他押注于新一代基础模型V9。5月中旬，马斯克透露V9（1.5T）训练完成，跑分优异；到5月25日，他正式宣布V9-Medium训练完成，参数量约为支撑Grok线上流量的V8-Small（0.5T）的三倍，并针对英伟达Blackwell架构做了优化。大量来自Cursor的真实开发数据已注入补充训练，预计2到3周上线。

被删数据的重要性正在于此。马斯克将V8的短板归结为数据质量、全面性和比例问题，V9想翻身，关键就在于喂入更高质量、更贴近真实开发过程的数据。那2到3周的训练成果蒸发，无疑给追赶计划蒙上阴影。

追赶手段不止明面一套。据The Information援引两名知情者称，xAI曾进行一个持续数月的蒸馏项目，直接使用Anthropic旗下Claude的输出作为训练材料，喂给自家编程模型。若属实，这直接踩中了Anthropic的服务条款红线——明确禁止用其输出训练竞争模型。今年1月，xAI联合创始人Tony Wu告知员工，Anthropic已切断公司访问通道；部分工程师改用个人账号继续使用Claude，随后也被陆续封禁。xAI继而转向一家名为Blackbox AI的加密中介，借道访问竞品模型，直至5月中旬仍在通过该服务运行基准测试。马斯克本人在今年5月与OpenAI的诉讼中作证时承认，xAI“部分”用过OpenAI模型训练Grok，并称这在业内很常见。

围墙、翻墙、再砌墙，互相测、互相学、互相封，已成为AI公司间新的竞争常态。而追到最后，xAI却与对手做起了算力生意。今年5月20日，SpaceX向SEC递交S-1文件，披露了一笔离奇交易：曾被马斯克公开骂作“邪恶”的Anthropic，如今每月支付约12.5亿美元，租下xAI在田纳西州孟菲斯的Colossus 1数据中心，几乎包下300兆瓦算力，合约签到2029年5月。粗算一年约150亿美元，整个周期可能带来超过400亿美元收入。

Colossus 1本是xAI为训练Grok打造的超算中心。如今Grok用户流失，算力却建得太满，于是xAI将其租给了最想追上的对手。SpaceX在文件中称，这笔交易“让我们能把基础设施里闲置的算力变现”。更耐人寻味的是，合约包含一条90天退出条款，任何一方提前通知即可终止。马斯克近日在X上反复说这是短期生意，希望交易短一点，因为“某个时候，我们可能需要把算力要回来”。

就在几天前，Google也签下类似订单，每月向SpaceX支付约9.2亿美元租用算力。把算力卖给对手，正成为xAI的一门现实生意。至于下一代Grok，SpaceX在招股书中仅表示仍在数据中心训练新旗舰模型，但发布时间表只字未提。追赶仍在继续，只是这一次，连追赶者自己也说不准终点到底在哪。

xAI员工误删数周训练数据，Grok重组后遗症浮现

延伸阅读

所属专题

相关深度报道

相关每日新闻