2025 年初,馬斯克給這一年定的 Optimus 目標是數千臺;年底,他交出來的是幾百臺,外加一句「目前還沒在做有用功」。同一年,深圳一家成立剛一年半的公司,在發佈會上讓兩條機械臂當眾打了一條領帶。兩件事看起來不在一個量級,卻恰好量在同一把尺子上。
衡量一臺人形機器人量產到了哪一步,最順手的尺子是年產能:100 萬、1000 萬,數字越大越像未來。這把尺子在汽車上管用,因為一輛車下線就是一輛能賣的車。挪到人形機器人上,它會騙人。
真正該用的尺子是另一把:單位時間能做多少有用功,每做一份功花多少錢。 一臺只會跳舞、煎蛋、在發佈會上跟觀眾擊掌的機器人,年產能標到多少都是零——因為它每小時產出的有用功是零,而每小時的折舊、電費、維護是實打實的成本。換上這把尺子重看 Optimus,它卡住的位置就從「廠房蓋沒蓋好」挪到了別處:靈巧的手、撐起這雙手的執行器供應鏈、以及「把一件真活幹完」這道檻。 工廠那條線在哪裡破土、年產能標到幾位數,是另一回事。
一條逐年順延的承諾線
把馬斯克關於 Optimus 的幾次公開表態按時間碼排開,會得到一條很整齊的曲線——不是產量曲線,是承諾曲線。
2021 年 8 月 19 日的 AI Day,Optimus 第一次亮相,當時臺上是一個穿著緊身衣的真人;2022 年拿出半功能原型,能慢慢走、緩緩揮手[1]。2023 年 12 月的 Gen2,進步肉眼可見:能跳舞,能用指尖捏起一枚雞蛋放進鍋裡煎,動作流暢到像在炫技[1]。2024 年 10 月的 We, Robot 發佈會,幾十臺 Optimus 在場內端飲料、跟觀眾玩石頭剪刀布——事後被證實,其中大量動作是後臺真人遙控操作的,不是機器自主完成;同一場發佈會上,馬斯克給出了那個流傳最廣的數字:單臺售價約 3 萬美元[1]。2025 年 12 月,Optimus 出現在倫敦和柏林的活動現場,跟觀眾互動、分發禮物[1]。2026 年,特斯拉確認第三代 Optimus 將搭載自研的 AI5 芯片[1]。
能力在漲,這一點不假。可一旦把「能力演示」換成「產量承諾 vs 實際交付」,曲線立刻變形。
2025 年 1 月底的 Q4 2024 財報電話會上,馬斯克給 2025 年定的目標是約 5000 臺,主要用於特斯拉自家工廠,並稱零部件備庫足以支撐 1 萬到 1.2 萬臺[2]。這是一個具體到可以對賬的承諾。一年後對賬,實際下線僅幾百臺,漏掉了承諾的九成以上[2]。更要命的是定性而非定量的那句話:2026 年 1 月的 Q4 2025 財報電話會上,馬斯克親口承認,這批 Optimus 目前主要用於「學習和數據採集」,還沒在做有用功[2]。
這句「no useful work」是整條承諾線上最誠實的一幀。它等於官方蓋章確認:截至 2026 年初,特斯拉造出來的幾百臺 Optimus,按「有用功 × 成本」這把尺子量,分子仍然是零。一臺機器人站在產線旁學習,跟一臺機器人替人擰完一顆螺絲,是兩種東西;前者是成本中心,後者才是產能。承諾線說的一直是後者,交付出來的一直是前者。
到 2026 年中,口徑再次順延。馬斯克稱第三代 Optimus 進入「最後階段」,將於 2026 年夏開始生產,2027 年進入數萬臺級別的高產[5];而那條規劃中長期年產能標到 1000 萬臺的得州二代線,量產口徑也排到了2027 年夏[14]。每一代的量產時點,都穩定地停在「再過一年」。
讓這條承諾線一次次順延的,不是某一道工序沒調好,而是同一道坎反覆出現。這道坎,藏在那雙手裡。
卡點一:一隻手 22 個自由度,難在最後那點「分寸」
跳舞和煎蛋之所以適合上發佈會,是因為它們對「手」的要求其實不高——跳舞是全身關節的協調,煎蛋是預先編排好的一套固定動作。真正難的是另一類活:把一根線穿進針眼,把一枚硬幣立起來,捏住一支注射器而不捏碎它,在傳送帶上抓取一個位置和姿態都在變的零件。這類活的共同點是,它們要求手既靈巧、又懂得用多大的力。
第三代 Optimus 的手,把特斯拉押在這道坎上的賭注暴露得很清楚。單手 22 個自由度,靠單側約 25 個執行器驅動——執行器不塞在手掌裡,而是放進前臂,用肌腱穿過手腕拉動手指,幾乎是在仿照人類肌肉收縮牽動指頭的方式[4]。指尖裝了力反饋傳感器,讓機器能實時感知抓握的壓力,理論上可以捏起雞蛋、玻璃瓶、電子元件而不把它們捏壞[4]。作個對照:人手大約有 27 個自由度[4]。Gen3 這隻手的執行器數量,比 Gen2 翻了約 4.5 倍[4]。
把數字翻譯成工程語言:特斯拉為了讓 Optimus 能幹「有用功」,在一隻手上堆進了接近人手複雜度的機械結構。這正是問題所在。 自由度越高、執行器越多、還要在每根手指尖塞進觸覺,這隻手就越精密、越貴、越難批量造得一致。一隻手 25 個微型執行器,兩隻手 50 個,每一個都要在巴掌大的空間裡輸出足夠扭矩又足夠輕——這不是把汽車零件縮小,是一類特斯拉此前從未量產過的全新精密件。
而「分寸感」是其中最難自動化的一環。跳舞跳錯半拍沒人受傷,抓雞蛋用力多一成就是一手蛋液。要讓機器在成千上萬種它沒見過的物體、姿態、光照下都拿捏好這點力道,靠的不是更強的電機,是海量真實操作數據喂出來的判斷力——而數據,恰恰是「還沒在做有用功」的機器人最缺的東西。這裡藏著一個迴路:沒有有用功就沒有真實數據,沒有真實數據手就學不會有用功。 Optimus 當下正卡在這個迴路裡。
卡點二:手腕往上,是一條攥在別人手裡的供應鏈
就算手的設計圖完美,把它造出來還得過供應鏈這一關——而這一關,2025 年被攥在了別人手裡。
驅動這些執行器的高性能電機,靠的是釹鐵硼(NdFeB)永磁體,而釹鐵硼離不開稀土。2025 年 4 月 4 日,中國對七種稀土元素——釤、釓、鋱、鏑、鑥、鈧、釔——及其衍生磁體實施出口管制,出口商須向中國商務部申請許可,流程從數週到數月不等,且被業界形容為不透明[6]。中國掌握著全球約九成的稀土磁體產能[8],這意味著管制幾乎卡在所有西方機器人廠商的咽喉上。
特斯拉首當其衝。在 2025 年 Q1 財報電話會上,馬斯克直接承認 Optimus 的生產受到了影響,正在為出口許可與中方周旋。他的原話帶著一絲無奈:「中國想要某種保證,保證這些東西不會被用於軍事用途——它們顯然不會,只是裝進一個人形機器人而已。」[6][7] 這些磁體的用途單一而要害:只用在 Optimus 的執行器上,也就是讓機器人能動起來的那部分[8]。每臺 Optimus 的執行器需要用到數公斤量級的釹鐵硼磁體[8]——量看著不大,可一旦許可卡住,這點磁體就足以讓整條線停擺。
馬斯克自己有一句話,無意中道破了人形機器人量產的真相。Q1 2025 電話會上他說:「當你有一個全新的複雜製造產品,它的推進速度,取決於整個東西里最慢、最不走運的那個零件。」[6] 一臺 Optimus 約有一萬個零件[13]。一萬個零件裡,只要有一個——比如一塊卡在海關的磁體——掉隊,整臺機器就下不了線。這跟汽車不一樣:汽車的供應鏈經過百年磨合,每個環節都有備胎;人形機器人這條供應鏈,大量環節是第一次被這麼大規模地拉起來,既沒有備胎,還有一段攥在地緣政治手裡。
卡點三:「3 萬美元」是目標價,不是成本
把前兩道坎疊起來,第三道坎——成本——就自然浮現了。
2024 年 We, Robot 發佈會上那個「約 3 萬美元」的售價,從一開始就是個目標價,不是當前成本[1]。要理解這兩者的距離,只需想想前面那隻手:單側約 25 個、雙手約 50 個微型執行器,每一個都是高精度定製件;指尖的觸覺傳感器、前臂的肌腱傳動、撐起這一切的稀土磁體——光是這雙手,就足以讓單臺物料成本遠遠談不上「3 萬美元」。一件產品的售價能不能壓到目標價,要麼靠規模攤薄,要麼靠垂直整合自己造關鍵件。可規模本身就是最難翻的那道坎——產量上不去,成本就攤不薄;成本攤不薄,售價就壓不下來;售價壓不下來,就更難鋪開規模。這又是一個迴路。
所以「3 萬美元」和「有用功」其實是同一道題的兩面:只有當一臺機器人能穩定地幹完真活、產出可計價的有用功,它每小時創造的價值才可能超過它每小時的成本;也只有當產量爬到足夠規模,單臺成本才可能向 3 萬美元靠攏。在這兩件事同時發生之前,3 萬美元是一句願景,不是一張價籤。
中國玩家繞道而行:先窄場景落地,先把貨發出去
就在特斯拉被這三道坎逐年拖住時,另一批玩家選了一條完全不同的路——不去硬碰「通用有用功」這道最難的題,而是先找一個窄場景鑽進去,先把機器人造出來、發出去、用起來。
最具代表性的是優必選。它的 Walker S2 已經進入量產交付:截至 2025 年底,已交付逾 500 臺,Walker 系列訂單總額超過 8 億元人民幣(約 1.12 億美元)[8][9]。訂單清單裡是一串實打實的工業客戶——比亞迪、吉利、富士康、東風柳汽、一汽大眾等[9]。優必選給自己定的產能目標是 2026 年年產 5000 臺、2027 年 1 萬臺[9]。這些機器人沒有被要求「什麼都會」,它們被放進汽車工廠、物流樞紐、數據採集中心,乾的是搬運、分揀、巡檢這類節拍可控、姿態可預期的活——恰恰避開了「在沒見過的場景裡拿捏分寸」那道最難的坎。
宇樹走的是另一條窄路:把價格打到地板。它的 G1 起售價約 4200 美元[12],把「人形機器人」從一個抽象概念變成了今天就能下單發貨的商品——儘管負載、靈巧手能力都低 Optimus 一檔,但它在「出貨量」這個維度上是真實存在的。
海外陣營裡,Figure 選擇鑽進單一客戶的單一產線。它的 Figure 02 在寶馬 Spartanburg 工廠完成了一段約 11 個月的試點:移動超過 9 萬個零件、累計工作約 1250 小時、行走約 120 萬步、協助生產約 3 萬輛寶馬 X3[12]。這是有量化記錄的產線參與,不是營銷視頻裡的「能搬箱子」——而它能做到,正是因為寶馬產線的任務邊界清晰、重複性高,把「有用功」這道題從開卷的通用難度,降到了閉卷的專用難度。
最新的一筆來自深圳。2026 年 6 月 24 日,成立剛一年半的 RoboScience(機器科學)發佈通用具身大模型 Visics,創始人是前蘋果 AI 平臺技術負責人田野[11]。發佈會上最抓眼的演示,是兩條機械臂當眾打了一條領帶[10];模型還展示了拆信封、把硬幣立起來、抓取芯片、注射器操作、在動態傳送帶上抓物等一系列精細力控動作[11]。Visics 主攻的,正是 Optimus 卡住的那道坎——靈巧操作。它的打法也很「中國」:用自研物理仿真引擎加視頻數據搭起「仿真 + 視頻」雙數據飛輪,把數據採集成本壓到傳統方式的二十分之一到二百分之一,以每週數十萬小時的速度擴充[11]。它正面攻打的,正是前面那個「沒有有用功就沒有數據」的迴路,只不過用仿真和視頻,去繞開「必須先在真實世界幹活才能攢數據」這一前提。
這些玩家拼出的,是一張和特斯拉互補又對照的圖。特斯拉的長板,是硬件的垂直整合:它自己造執行器、自研 AI5 芯片、把整套機械結構往人手的複雜度上堆,賭的是「一臺什麼都能幹的通用機器人」。它的短板,是出貨與真實場景驗證:截至 2026 年初,Optimus 還只在自家工廠裡學習,沒有一個外部付費客戶,沒有一段像 Figure 之於寶馬那樣可核查的產線工時記錄,官方還親口承認「沒在做有用功」[2]。
而中國玩家恰好反過來:它們多數沒有特斯拉那樣深的硬件垂直整合,卻已經把貨發進了真實工廠、攢下了真實工時和真實數據。一邊是手攥著最完整的硬件、卻遲遲交不出有用功;一邊是先認窄場景的慫、卻先把機器人用了起來。這不是兩種水平的高低,而是同一枚硬幣的兩面:Optimus 把賭注全壓在「通用」上,所以走得最難、也站得最高;中國玩家先要「能用」、再圖「通用」,所以出貨快、卻暫時夠不到 Optimus 想去的那個天花板。
尺子換了,該盯的東西也換了
回到那把尺子。如果只用「年產能 1000 萬臺」來量 Optimus,會得出「特斯拉遙遙領先」的結論——畢竟沒有第二家公司敢標這個數字。可一旦換上「有用功 × 成本」這把尺子,排序就變了:在「已經在真實工廠裡產出可計價工時」這一欄,優必選、Figure 排在前面,Optimus 暫時還是零。
這兩把尺子量出的不是矛盾,是階段。年產能量的是遠期天花板有多高,有用功量的是眼下離地有多遠。特斯拉的天花板,因為硬件垂直整合而確實夠高;它的離地高度,也因為押注最難的通用路線而確實夠低。這兩件事同時為真。
所以,真正值得盯的,不是下一次發佈會上 Optimus 又能完成什麼炫技動作,而是幾個能被「有用功 × 成本」這把尺子驗證的硬節點:那雙 22 自由度的手,能不能在自家工廠之外、在它沒被預編排過的場景裡,穩定地幹完一件真活;那條攥在稀土管制手裡的執行器供應鏈,出口許可能不能常態化拿到;以及最樸素的一問——特斯拉哪一季的財報裡,會第一次出現一個外部付費客戶的名字,或者一句不再是「no useful work」的定性。
在這些節點被一個個跨過去之前,「2027 年量產數萬臺」會和「2025 年數千臺」一樣,繼續停在「再過一年」。讓它一次次順延的,從來不是廠房那根鋼樑,而是這隻手、這條供應鏈、和這道叫「有用功」的檻。