9月23日,智元机器人宣布其通用具身基座大模型GO-1(Genie Operator-1)正式在GitHub开源。这是全球首个基于Vision-Language-Latent-Action (ViLLA)架构的具身智能模型,向全球开发者免费开放。它的开源降低了具身智能的技术门槛,有望加速机器人走向产业落地。
从工厂里精准组装的机械臂,到家庭中灵巧避障的扫地机器人;从自动驾驶的智能汽车,到能跑能跳的机器狗——“具身智能”正悄然跨越实验室与市场间的鸿沟,一步步将技术潜力转化为坚实的商业价值。
价值基石与资本狂飙
“具身”(Embodied)源自哲学与认知科学,意为“使智能进入身体”。但具身智能并非简单的“AI+身体”。根据中国计算机学会(CCF)定义,具身智能(Embodied Artificial Intelligence,EAI)是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。

图片来自于头豹研究院
具身智能同时需要具备“本体+环境+智能”三要素。其中,本体是具身智能的物理载体,即硬件实体。它可以是机器人(如人形机器人、四足机器人、机械臂)、自动驾驶汽车等能够与物理世界交互的设备;智能是具身智能的核心,涵盖算法、模型和决策能力,它包括大模型(如视觉-语言-动作映射模型)、感知算法(图像识别、SLAM)、控制算法(运动规划、力控)等;环境是本体交互的物理世界,包括工业场景(工厂、仓库)、家庭场景(家居)、开放场景(户外、交通)等。
具身智能与离身智能的核心差异在于是否依赖物理载体与环境交互。具身智能强调智能体通过身体(如机器人)与物理世界的实时交互,结合感知、决策和行动形成闭环,从而适应动态环境;而离身智能则完全依赖虚拟环境中的数据和算法,无需物理实体,仅通过抽象计算完成任务。
举例来说:离身智能能教你“如何端咖啡”,但具身智能机器人能实际走进厨房,用“眼睛”定位咖啡杯,“手”稳握杯柄,自主避开障碍物送到你面前。
具身智能和我们所熟悉的机器人有什么区别呢?具身智能是一种智能理论和范式,强调智能行为依赖于身体和环境的互动,具有鲜明的身体性和情境性。而机器人则是这一理论在工程实践中的载体和试验田。

图片来自于头豹研究院
正如斯坦福大学计算机科学教授李飞飞所说,“具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。”
在过去一年,具身智能领域呈现出前所未有的繁荣景象。智元机器人估值已达150亿,宇树科技最新一轮融资后估值也达到120亿,据称上市后有望冲击500亿。Wind数据显示,截至8月底,A股市场“人形机器人”板块中共有40家企业披露2025半年报,其中,有29家企业归属于上市公司股东净利润同比实现增长,有36家企业实现盈利,占比超九成。
一级市场同样火热。IT桔子数据显示,今年前8个月,机器人领域一级市场融资额已达386.24亿元,是2024年全年212.54亿元总融资额的1.8倍。在“拼量产、抢落地”的行业共识下,资本正以前所未有的力度涌入机器人产业链。
值得关注的是,这种估值膨胀在全球范围内看似乎并不夸张。Figure完成C轮融资后估值已达390亿美元,相当于近23家宇树科技。相比之下,国内企业的估值甚至略显保守。从商业逻辑看,具身智能属于“十年后的产业”,当前投入只是“打地基”,不能简单用传统资产逻辑衡量其估值。
技术突围战:三条路线的产业化竞速
中国计量大学副校长王斌锐在接受公开采访时表示,目前具身智能的技术路线可以分为三种。

第一类是类人仿生路线,代表企业如特斯拉、优必选等,重点在于双足行走、灵巧手部操作和全身感知。这一路线优势在于更贴近人类的运动和交互方式,能够在未来适应家庭服务、医疗陪护等复杂环境。但难点在于动力学控制和能耗管理,如何在保障稳定性的同时兼顾续航与成本,仍是待突破的关键。
第二类是专用型机器人路线,例如在制造业场景中开发面向质检、搬运或巡检的“准人形”或“半人形”机器人。这类产品往往不追求完全仿人,而是突出在特定工序上的适配性与效率,优势是落地速度快、商业模式清晰。但局限在于跨场景通用性差,后续需要在柔性和可扩展性上取得突破。
第三类是算法驱动与平台化路线,以大模型、强化学习和多模态感知为核心,打造“通用智能底座”,再赋能不同形态的机器人。比如一些企业强调“软件定义机器人”,通过AI算法不断进化操作技能。优势在于智能水平迭代快、生态开放,但对硬件适配和安全验证提出更高要求。
“不同路线并非彼此排斥,而是互为补充。未来的发展重点是实现硬件平台的标准化、算法的自适应化以及产业链的模块化协同,使具身智能既能在特定任务中高效发挥,又能逐步走向通用化。”王斌锐总结道。
国际先进技术应用推进中心(深圳)主任姚颂表示,具身智能的发展路径好比自动驾驶,从早期对L4级全自动化的高度期盼,到现实落地时更多集中于L2级场景,行业逐步走向务实。他认为,当下多数机器人仍处在L1阶段,向更高等级演进需聚焦真实、迫切且具备商业可行性的场景。
技术路线的分化背后,是产业落地场景的加速拓展。

图片来自于亿欧智库
以工业场景为例,银河通用的机器人已实现流水线搬运、分拣等环节的规模化应用。零售场景中,银河通用在北京海淀已成功落地10多家配备人形机器人的智慧药房,并计划年内在全国开设100家。此外,银河通用的机器人已开始售卖零食、咖啡等商品。
量产元年的前哨战
在资本潮水持续涌入的同时,行业竞争焦点正从"讲故事"转向"拼量产"。最近一段时间以来,已有多家机器人整机厂商披露相关订单及产能情况。例如,9月3日,优必选宣布获得某国内知名企业2.5亿元具身智能人形机器人产品及解决方案采购合同,这是截至目前全球人形机器人最大的合同。而就在两个月前,优必选才刚刚中标觅亿(上海)汽车科技有限公司9051.15万元的机器人设备采购项目。
9月2日,具身智能创业公司星尘智能宣布与上海仙工智能科技股份有限公司达成千台级订单战略合作,将在未来两年内推动上千台AI机器人在工业、制造、仓储、物流等场景大规模、分阶段部署,AI机器人将逐步承担产线的物料配送、周转箱搬运、上下料、空箱回收等作业,将工业制造过程中枯燥重复、不安全的任务自动化。
8月11日,智元机器人宣布与富临精工股份有限公司达成数千万元的合作,近百台远征A2-W将落地富临精工工厂。据悉,A2-W的作业范围从最初的个别产线点位,拓展至动力总成、减速器两大核心车间的15个上料点。预计远征A2-W每日将负责500台以上产能的原材料配送、空箱自动化回收、搬运等传统繁琐工作,减轻工人重复单一作业负担。
政策层面同步按下“加速键”。在2025年3月的政府工作报告中,“具身智能”首次被提及,并纳入未来产业培育体系,明确通过“人工智能+”行动和建立投入增长机制,为产业发展构建长效机制。2023年11月,工信部发布《人形机器人创新发展指导意见》,明确人形机器人作为未来产业的新赛道,提出到2025年初步建立创新体系,突破 “大脑、小脑、肢体”等关键技术,实现整机产品批量生产并在特种、制造、民生服务等场景示范应用。培育2-3家有全球影响力的生态型企业和一批专精特新中小企业,打造2-3个产业发展集聚区,孕育开拓一批新业务、新模式、新业态。
在国家大力支持具身智能产业发展的背景下,2025年国内多省市相继发布具身智能产业相关政策,形成覆盖技术研发、场景开放、生态建设的系统性产业支持体系。
2025年5月,上海浦东新区发布《具身智能产业支持16条政策》,提到将对关键核心技术攻关、新型研发机构、大企业创新中心等给予最高2000万元的资金支持, 鼓励具身智能技术自主突破。浙江发布《关于支持人工智能创新发展的若干措施》,提出建设具身智能产业基地,搭建公共测试环境、 测试验证平台等,有力支撑具身智能软硬件迭代升级,推动形成一批行业标准。天津发布《天津市促进人工智能创新发展行动方案(2025-2027)》,提出聚焦具身智能领域,推动人形机器人大脑、小 脑、本体、传感器、灵巧手等关键领域研究。
中科育成投资董事长、总经理陈静鹤表示,在政策支持、技术迭代与资本助推的三重驱动下,2025年将成为机器人产业从“技术突破”迈向“应用爆发”的分水岭。未来竞争的核心,在于谁能率先破解大规模、低成本、高可靠性的量产密码——这将是决定企业在“下一代生产力革命”中话语权的关键战役。根据麦肯锡的分析,按照现有趋势发展,到2040年全球具身智能的市场规模将达到3700亿美元,中国市场占据50%的份额。
回望科技产业发展史,每一轮技术革命的狂欢之后,必然伴随泡沫的理性出清。当具身智能的资本喧嚣逐渐沉淀,真正的考验在于企业能否构建穿越周期的核心能力——以持续的技术创新突破物理世界交互的边界,以开放的产业协同降低生态准入门槛,以审慎的社会责任平衡技术伦理与安全,更以超越当下的人类想象力定义机器人与社会共生的终极形态。唯有如此,具身智能才能真正走出概念炒作的"热闹",迈向重塑生产力格局的"伟大"。