
今年被普遍认为是具身智能的“破圈”之年和落地元年。从蛇年春晚舞台的机器人扭秧歌,到北京亦庄的机器人马拉松,再到浙江杭州的机器人格斗赛,具身智能正从“技术演示”迈向“价值落地”。
当全球科技巨头竞相押注具身智能,将其视为人工智能的“下一波浪潮”时,商汤科技通过其精心孵化的创新实体——大晓机器人,正式亮出了底牌。12月18日,大晓机器人携行业首创的ACE研发范式、首个开源商业化的“开悟”世界模型3.0以及具身超级大脑模组A1登场,不仅展示了深厚的技术储备,更以“开放生态”的姿态,搅动一池春水。
商汤的深度入场,标志着具身智能领域的竞争已从初创公司与特定巨头的“单点突破”,进入生态化、规模化落地的“集团军作战”新阶段,这个本就火热的市场,正变得前所未有的热闹与复杂。
以“人”为尺,破解行业数据荒与泛化难
过去两年,具身智能成为AI领域最炙手可热的赛道之一。特斯拉用FSD V14证明世界模型可驱动自动驾驶;Figure AI联手OpenAI,让机器人听懂指令并执行任务;谷歌、英伟达、Meta等也密集投入仿真训练、多模态控制和通用机器人基座模型研发。资本市场闻风而动,相关初创企业融资额屡创新高。
然而,表面繁荣之下,行业正面临严峻挑战。真机训练成本极高——目前全球具身智能真机数据总量仅约10万小时,而特斯拉FSD每日仿真训练量就相当于人类驾驶员400万小时。更关键的是,现有技术路径存在根本性缺陷:依赖真人遥操作的方案效率低、成本高、模型绑定硬件;纯视频学习虽省人力,却缺乏对物理规律的理解,难以跨越“现实鸿沟”。
简言之,具身智能仍处于“叫好不叫座”的阶段——演示惊艳,落地艰难。

面对已经形成竞争格局的市场,商汤带来的不仅是资本和技术,更是一种新的思考方式。
大晓机器人成立的初衷,并非跟风“本体内卷”或“复杂技能炫技”,而是要回归真正的痛点,并提出“以人为中心”的全新研究范式。
传统做法中,要么靠人操控机器人采集数据(“为难人”),要么让机器人看视频模仿动作(“为难机器”)。两者都忽略了人类行为背后的因果逻辑与物理常识。而大晓机器人ACE范式另辟蹊径,通过部署多视角、多模态的环境感知设备,在真实场景中自动记录“人—物—场”的完整交互过程。

这套系统能同步捕捉第一人称与第三人称视频、触觉反馈、语音指令、运动轨迹甚至力学参数,构建基于物理规律的3D资产库。在即时零售仓库中,它已实现对数万SKU分拣打包全流程的自动数据采集,覆盖13个精细原子动作;在家庭场景中,甚至能精准复现“抓取易损生鲜”这类遥操作都难以完成的高难度任务。
更重要的是,ACE范式将数据采集效率提升百倍以上——一年可积累千万小时级高质量交互数据,并通过开悟世界模型将其价值放大至“上亿小时”效果。这相当于为整个行业装上了“数据引擎”。
打通实验室与产业一线的桥梁
如果说ACE范式解决了“数据从哪来”,那么开悟世界模型3.0则回答了“智能怎么用”。
作为全球首个开源且已实现商业应用的世界模型,Kairos 3.0不是简单的视频预测工具,而是一个融合物理规律、人类意图与机器人动作的统一认知框架。它不仅能“看懂”一个动作,还能理解“为什么这么做”——比如倒水时为何要倾斜杯子、抓取玻璃杯为何要控制力度。
这种“知其然,更知其所以然”的能力,源于其对视觉、3D轨迹、触觉、摩擦力等多模态信息的深度融合。基于此,模型可生成高保真、可控制的长时动态交互场景,并支持跨机器人平台一键部署。
12月18日,大晓同步上线“开悟具身智能世界模型产品平台”。开发者只需输入一句自然语言指令,系统即可自动生成可视化任务模拟,并支持分享与调用。平台已内置115个垂直场景、328个标签,大幅降低开发门槛。
尤为关键的是,开悟3.0已完成与沐曦、壁仞、中科曙光等国产芯片的深度适配,在推理效率上“全面赶超国际顶尖水平”。这意味着,中国不仅掌握了具身智能的核心算法,更实现了从算力底座到上层应用的全链路自主可控。
技术再先进,若不能落地,终是空中楼阁。大晓此次发布的具身超级大脑模组A1,正是打通实验室与产业一线的关键桥梁。
搭载A1的机器狗无需预建高精地图,仅凭纯视觉即可在陌生、动态环境中自主导航。它能理解自然语言指令(如“绕过障碍,去门口等我”),并将其拆解为“前进50厘米”“左转避开箱子”等可执行动作,再由底层控制器精准执行。
结合Insta360全景感知与商汤方舟视觉平台,A1模组已支持超150个智能化应用场景,覆盖安防巡检、能源运维、交通疏导、文旅导览等多个高可靠性需求领域。在某大型变电站试点中,机器人连续三个月无故障运行,准确识别设备异常并自动上报,效率远超人工。
这标志着具身智能正从“炫技”走向“实用”——不再是展厅里的表演者,而是工厂、仓库、社区中的可靠助手。
热闹背后的竞赛升级
大晓机器人的诞生,离不开其深厚的“商汤基因”。董事长由商汤科技联合创始人王晓刚出任,首席科学家陶大程院士领衔的科研团队,核心成员多来自全球顶尖的计算机视觉实验室MMLab,兼具顶尖学术研究与大规模产业实践的双重经验。其名“大千世界,晓识万象”,清晰地表达了其使命:让机器人真正洞察并理解物理世界的万象规律。
商汤大晓的此次亮相,另一个鲜明特点是强烈的“生态共建”导向。这反映出行业一个关键趋势:具身智能的复杂性极高,任何单一企业都难以通吃芯片、硬件、算法、本体、场景应用全链条。未来的竞争,将是生态体系之间的竞争。

目前,大晓已与智元机器人、银河通用、钛虎等本体厂商合作,打通模型与硬件的适配链路;与沐曦、壁仞等国产芯片企业联合优化算力效率;与Insta360、帕西尼等硬件伙伴强化感知能力;同时依托腾讯云、火山引擎、商汤大装置等平台,为中小开发者提供低成本训练与部署服务。
这种“模型—硬件—场景”三位一体的生态打法,正在形成强大飞轮效应:芯片企业通过真实负载验证性能,硬件厂商获得智能升级路径,行业客户快速定制解决方案,开发者轻松接入先进工具链。整个生态越转越快,越转越强。
当前,具身智能市场确实越来越“热闹”。国际上有特斯拉、波士顿动力、Figure AI等巨擘与明星初创同台竞技;国内则有智元、宇树、银河通用、傅利叶智能等一大批企业百花齐放,科技巨头如小米、腾讯等也以不同形式布局。竞争焦点已从早期的步态控制等单一能力,迅速上升到“多模态感知-理解-决策-控制”的全栈技术体系,以及规模化、低成本的数据获取与训练范式。
大晓机器人的发布,将竞争推向了更底层、更系统的层面。它提出的“以人为中心”的ACE范式,直指行业核心的数据荒与泛化难问题;其开源世界模型的举措,则可能改变行业技术迭代的游戏规则,吸引更多开发者共建生态。
可以预见,在资本、技术和市场的共同驱动下,中国具身智能产业将进入一个群雄并起、合纵连横的新阶段。
市场的“热闹”是好事,它意味着资本、人才、关注度的汇聚,将加速技术突破和产业孵化。然而,也必须清醒地认识到,让机器真正拥有理解、适应并改造物理世界的“通用智能”,其挑战远超数字世界的大模型。它涉及到硬件的可靠性、成本控制、安全问题、伦理规范以及最终能否产生切实的经济效益等无数现实难题。
当然,市场的“热闹”,最终将转化为推动技术进步与产业变革的澎湃动力,而谁能在喧嚣中持续沉淀、攻克根本性难题,谁才能真正引领智能体走进物理世界的星辰大海。
具身智能的故事正从“炫技”走向“务实”,大晓机器人展示的从数据引擎到世界模型,再到终端模组的全链路布局,提供了一种可供观察的新范本。热闹已然开场,而通往真正“晓识万象”的智能机器时代,长路依然漫漫,考验着每一位参与者的技术耐力、商业智慧和生态胸怀。