阿里巴巴近日正式發佈了千問具身智能大模型系列Qwen-Robot,這是其千問大模型家族中首個完整的具身智能模型系列。該系列由三大核心模型構成,分別針對機器人的不同能力維度進行設計。
具體來看,Qwen-RobotManip 作為VLA操作模型,專注於賦予機器人精細的動作執行能力,相當於為機器人裝上了靈巧的雙手。Qwen-RobotNav 則是VLN移動模型,負責解決機器人在複雜環境中的自主導航問題,讓機器人擁有認路的雙腳。而Qwen-RobotWorld 作為世界模型,承擔著認知和決策的核心功能,為機器人提供會思考的大腦。
這三個模型既可以獨立部署,滿足特定場景下的單一需求,也能夠協同運轉,形成完整的智能閉環。阿里方面表示,這一設計旨在為不同形態的機器人提供可靠的通用底座,加速其從實驗室走向真實世界的落地進程。
從行業角度看,具身智能被視為人工智能與物理世界交互的關鍵方向。阿里此次推出系統化的模型系列,展現了其在機器人基礎能力上的佈局深度。與單一的功能模型不同,Qwen-Robot試圖通過操作、移動和認知的三位一體架構,覆蓋機器人應用的主要技術環節。
市場關注點在於,這一通用底座能否有效降低機器人開發的複雜度,並推動更多實際場景的規模化應用。隨著各大科技公司紛紛加碼具身智能,阿里此舉無疑為行業競爭增添了新的變量。