商汤“大晓”打出组合拳，具身智能赛道更热闹了

对话财经

2025-12-18 22:23 · 浙江

今年被普遍认为是具身智能的“破圈”之年和落地元年。从蛇年春晚舞台的机器人扭秧歌，到北京亦庄的机器人马拉松，再到浙江杭州的机器人格斗赛，具身智能正从“技术演示”迈向“价值落地”。

当全球科技巨头竞相押注具身智能，将其视为人工智能的“下一波浪潮”时，商汤科技通过其精心孵化的创新实体——大晓机器人，正式亮出了底牌。12月18日，大晓机器人携行业首创的ACE研发范式、首个开源商业化的“开悟”世界模型3.0以及具身超级大脑模组A1登场，不仅展示了深厚的技术储备，更以“开放生态”的姿态，搅动一池春水。

商汤的深度入场，标志着具身智能领域的竞争已从初创公司与特定巨头的“单点突破”，进入生态化、规模化落地的“集团军作战”新阶段，这个本就火热的市场，正变得前所未有的热闹与复杂。

以“人”为尺，破解行业数据荒与泛化难

过去两年，具身智能成为AI领域最炙手可热的赛道之一。特斯拉用FSD V14证明世界模型可驱动自动驾驶；Figure AI联手OpenAI，让机器人听懂指令并执行任务；谷歌、英伟达、Meta等也密集投入仿真训练、多模态控制和通用机器人基座模型研发。资本市场闻风而动，相关初创企业融资额屡创新高。

然而，表面繁荣之下，行业正面临严峻挑战。真机训练成本极高——目前全球具身智能真机数据总量仅约10万小时，而特斯拉FSD每日仿真训练量就相当于人类驾驶员400万小时。更关键的是，现有技术路径存在根本性缺陷：依赖真人遥操作的方案效率低、成本高、模型绑定硬件；纯视频学习虽省人力，却缺乏对物理规律的理解，难以跨越“现实鸿沟”。

简言之，具身智能仍处于“叫好不叫座”的阶段——演示惊艳，落地艰难。

面对已经形成竞争格局的市场，商汤带来的不仅是资本和技术，更是一种新的思考方式。

大晓机器人成立的初衷，并非跟风“本体内卷”或“复杂技能炫技”，而是要回归真正的痛点，并提出“以人为中心”的全新研究范式。

传统做法中，要么靠人操控机器人采集数据（“为难人”），要么让机器人看视频模仿动作（“为难机器”）。两者都忽略了人类行为背后的因果逻辑与物理常识。而大晓机器人ACE范式另辟蹊径，通过部署多视角、多模态的环境感知设备，在真实场景中自动记录“人—物—场”的完整交互过程。

这套系统能同步捕捉第一人称与第三人称视频、触觉反馈、语音指令、运动轨迹甚至力学参数，构建基于物理规律的3D资产库。在即时零售仓库中，它已实现对数万SKU分拣打包全流程的自动数据采集，覆盖13个精细原子动作；在家庭场景中，甚至能精准复现“抓取易损生鲜”这类遥操作都难以完成的高难度任务。

更重要的是，ACE范式将数据采集效率提升百倍以上——一年可积累千万小时级高质量交互数据，并通过开悟世界模型将其价值放大至“上亿小时”效果。这相当于为整个行业装上了“数据引擎”。

打通实验室与产业一线的桥梁

如果说ACE范式解决了“数据从哪来”，那么开悟世界模型3.0则回答了“智能怎么用”。

作为全球首个开源且已实现商业应用的世界模型，Kairos 3.0不是简单的视频预测工具，而是一个融合物理规律、人类意图与机器人动作的统一认知框架。它不仅能“看懂”一个动作，还能理解“为什么这么做”——比如倒水时为何要倾斜杯子、抓取玻璃杯为何要控制力度。

这种“知其然，更知其所以然”的能力，源于其对视觉、3D轨迹、触觉、摩擦力等多模态信息的深度融合。基于此，模型可生成高保真、可控制的长时动态交互场景，并支持跨机器人平台一键部署。

12月18日，大晓同步上线“开悟具身智能世界模型产品平台”。开发者只需输入一句自然语言指令，系统即可自动生成可视化任务模拟，并支持分享与调用。平台已内置115个垂直场景、328个标签，大幅降低开发门槛。

尤为关键的是，开悟3.0已完成与沐曦、壁仞、中科曙光等国产芯片的深度适配，在推理效率上“全面赶超国际顶尖水平”。这意味着，中国不仅掌握了具身智能的核心算法，更实现了从算力底座到上层应用的全链路自主可控。

技术再先进，若不能落地，终是空中楼阁。大晓此次发布的具身超级大脑模组A1，正是打通实验室与产业一线的关键桥梁。

搭载A1的机器狗无需预建高精地图，仅凭纯视觉即可在陌生、动态环境中自主导航。它能理解自然语言指令（如“绕过障碍，去门口等我”），并将其拆解为“前进50厘米”“左转避开箱子”等可执行动作，再由底层控制器精准执行。

结合Insta360全景感知与商汤方舟视觉平台，A1模组已支持超150个智能化应用场景，覆盖安防巡检、能源运维、交通疏导、文旅导览等多个高可靠性需求领域。在某大型变电站试点中，机器人连续三个月无故障运行，准确识别设备异常并自动上报，效率远超人工。

这标志着具身智能正从“炫技”走向“实用”——不再是展厅里的表演者，而是工厂、仓库、社区中的可靠助手。

热闹背后的竞赛升级

大晓机器人的诞生，离不开其深厚的“商汤基因”。董事长由商汤科技联合创始人王晓刚出任，首席科学家陶大程院士领衔的科研团队，核心成员多来自全球顶尖的计算机视觉实验室MMLab，兼具顶尖学术研究与大规模产业实践的双重经验。其名“大千世界，晓识万象”，清晰地表达了其使命：让机器人真正洞察并理解物理世界的万象规律。

商汤大晓的此次亮相，另一个鲜明特点是强烈的“生态共建”导向。这反映出行业一个关键趋势：具身智能的复杂性极高，任何单一企业都难以通吃芯片、硬件、算法、本体、场景应用全链条。未来的竞争，将是生态体系之间的竞争。

目前，大晓已与智元机器人、银河通用、钛虎等本体厂商合作，打通模型与硬件的适配链路；与沐曦、壁仞等国产芯片企业联合优化算力效率；与Insta360、帕西尼等硬件伙伴强化感知能力；同时依托腾讯云、火山引擎、商汤大装置等平台，为中小开发者提供低成本训练与部署服务。

这种“模型—硬件—场景”三位一体的生态打法，正在形成强大飞轮效应：芯片企业通过真实负载验证性能，硬件厂商获得智能升级路径，行业客户快速定制解决方案，开发者轻松接入先进工具链。整个生态越转越快，越转越强。

当前，具身智能市场确实越来越“热闹”。国际上有特斯拉、波士顿动力、Figure AI等巨擘与明星初创同台竞技；国内则有智元、宇树、银河通用、傅利叶智能等一大批企业百花齐放，科技巨头如小米、腾讯等也以不同形式布局。竞争焦点已从早期的步态控制等单一能力，迅速上升到“多模态感知-理解-决策-控制”的全栈技术体系，以及规模化、低成本的数据获取与训练范式。

大晓机器人的发布，将竞争推向了更底层、更系统的层面。它提出的“以人为中心”的ACE范式，直指行业核心的数据荒与泛化难问题；其开源世界模型的举措，则可能改变行业技术迭代的游戏规则，吸引更多开发者共建生态。

可以预见，在资本、技术和市场的共同驱动下，中国具身智能产业将进入一个群雄并起、合纵连横的新阶段。

市场的“热闹”是好事，它意味着资本、人才、关注度的汇聚，将加速技术突破和产业孵化。然而，也必须清醒地认识到，让机器真正拥有理解、适应并改造物理世界的“通用智能”，其挑战远超数字世界的大模型。它涉及到硬件的可靠性、成本控制、安全问题、伦理规范以及最终能否产生切实的经济效益等无数现实难题。

当然，市场的“热闹”，最终将转化为推动技术进步与产业变革的澎湃动力，而谁能在喧嚣中持续沉淀、攻克根本性难题，谁才能真正引领智能体走进物理世界的星辰大海。

具身智能的故事正从“炫技”走向“务实”，大晓机器人展示的从数据引擎到世界模型，再到终端模组的全链路布局，提供了一种可供观察的新范本。热闹已然开场，而通往真正“晓识万象”的智能机器时代，长路依然漫漫，考验着每一位参与者的技术耐力、商业智慧和生态胸怀。