阿里巴巴近日正式发布了千问具身智能大模型系列Qwen-Robot,这是其千问大模型家族中首个完整的具身智能模型系列。该系列由三大核心模型构成,分别针对机器人的不同能力维度进行设计。
具体来看,Qwen-RobotManip 作为VLA操作模型,专注于赋予机器人精细的动作执行能力,相当于为机器人装上了灵巧的双手。Qwen-RobotNav 则是VLN移动模型,负责解决机器人在复杂环境中的自主导航问题,让机器人拥有认路的双脚。而Qwen-RobotWorld 作为世界模型,承担着认知和决策的核心功能,为机器人提供会思考的大脑。
这三个模型既可以独立部署,满足特定场景下的单一需求,也能够协同运转,形成完整的智能闭环。阿里方面表示,这一设计旨在为不同形态的机器人提供可靠的通用底座,加速其从实验室走向真实世界的落地进程。
从行业角度看,具身智能被视为人工智能与物理世界交互的关键方向。阿里此次推出系统化的模型系列,展现了其在机器人基础能力上的布局深度。与单一的功能模型不同,Qwen-Robot试图通过操作、移动和认知的三位一体架构,覆盖机器人应用的主要技术环节。
市场关注点在于,这一通用底座能否有效降低机器人开发的复杂度,并推动更多实际场景的规模化应用。随着各大科技公司纷纷加码具身智能,阿里此举无疑为行业竞争增添了新的变量。