
如果说过去十年AI人工智能最擅长的事情,是在屏幕里回答问题、生成图片、优化广告投放,那么接下来的三十年,它要做的事会明显“脏一点、重一点、也贵一点”——比如搬箱子、拧螺丝、抓玻璃杯、在雨天起飞、在拥挤街道里刹车。摩根士丹利最新发布的机器人年鉴,试图给这场转向定一个量级:到2050年,全球机器人硬件销售额可能达到25万亿美元,而今天,这个数字还停留在千亿美元出头。
当AI从处理“比特和字节”转向操控“原子和力学”,生产率的提升不再局限于办公室和数据中心,而是开始进入工厂、道路、农田、家庭和空域。于是,原本线性增长的硬件需求,被推入指数曲线。
按照摩根士丹利的测算,全球机器人硬件销售额将在未来几十年经历几次明显的加速拐点。
2025年仍只是起点,2030年市场规模或扩大至数倍,2040年进入万亿美元级别,到2050年,硬件本身的销售就可能堆出一个25万亿美元的体量。这还不包括软件订阅、维护服务、能源消耗以及围绕机器人运转形成的整条供应链。
销量曲线同样惊人。报告认为,到2050年全球每年售出的机器人数量将达到十亿级别,运行中的机器人总量可能远超人口规模。它们的形态并不统一,从工业机械臂、服务机器人、无人机,到自动驾驶车辆、医疗设备和类人机器人,几乎覆盖所有“人类需要动手”的场景。真正的变化不在于机器人变多,而在于它们不再被关在高度结构化的环境里。
过去的机器人,最舒服的工作地点是工厂产线,地面平整、动作固定、变量极少。新一代机器人面对的却是现实世界:地面不平、光线变化、物体形态各异,人类还喜欢把东西随手乱放。抓起冰箱里的一瓶水,在人类看来几乎是肌肉记忆,但对机器人而言,这意味着对力度、角度、摩擦、重心和环境变化的实时判断。难点不在算法是否聪明,而在身体是否跟得上大脑。
这正是摩根士丹利反复强调的一个转向:具身智能的瓶颈,正在从“认知”转移到“执行”。语言模型已经证明,纯软件可以在知识层面快速进化,但当AI试图进入物理世界,训练方式就变得昂贵而笨重。它不再能靠互联网数据“白嫖成长”,而是必须通过大量真实世界的试错,积累关于力、速度和失败的经验。
于是,数据、硬件和制造形成了一种递归关系。要训练更好的机器人,就必须先造出大量“不够好”的机器人,让它们不断犯错;而只有具备规模化制造能力,才能承受这种试错成本。这也是报告中最具现实意味的一部分:当AI真正开始下地干活,胜负的关键不再只是模型参数,而是你能不能造得快、造得多、造得便宜。
在这条赛道上,中国的存在感异常强烈。摩根士丹利的判断是:无论是政策协调能力、关键材料掌控,还是制造体系的完整度,中国都处在明显有利的位置。从工业机器人到服务机器人,从无人机到自动驾驶系统,中国已经在多个细分领域实现量产和规模化部署,而不是停留在实验室和展示视频中。
数据也支撑这一结论。到2050年,中国在全球机器人销量中的占比可能接近三成,在工业机器人和无人机等领域甚至更高。这并非源于某一项“黑科技”,而是长期积累的结果:稀土材料供应、精密零部件产能、电机与轴承制造、整机装配速度,以及一个对新技术容错率极高的应用市场。
上游的变化同样剧烈。如果机器人真的按模型预测的速度扩张,那么对摄像头、电机、轴承、传感器、电池和边缘计算芯片的需求,将呈现出近乎夸张的增长倍率。这不是“多卖一点”的问题,而是整个工业体系要被迫扩容。算力也不再只集中在云端数据中心,而是开始分散到每一台需要实时决策的机器上。延迟在物理世界里是致命缺陷,这让边缘算力从“可选项”变成“刚需”。
这也解释了为什么越来越多的技术路线,开始尝试把计算能力塞进机器人本体,让它们在本地完成推理与协同。分布式算力不只是技术方案,更是一种基础设施重构。未来的计算资源,可能不再主要躺在远郊的数据中心,而是分布在城市街道、仓库、农田和空域中,随机器人一起移动。
这份年鉴,从本质上来看,更像是在暗示一个长期变化:AI 的重心正在离开屏幕,进入一个更慢、更重、也更难复制的世界。在这个世界里,软件依然重要,但无法单独决定胜负;模型依然聪明,但必须长在一个可靠的身体上。
如果说数字AI时代拼的是谁能更快扩展用户,那么具身智能时代拼的,很可能是谁能更快扩展产能。历史上每一次真正改变生产率的技术革命,最终都绕不开制造能力的较量。机器人也不会例外。