1、智能架构功能与协同
VLT核心功能与作用: VLT是机器人的大脑与决策核心,作为专门为机器人研发的自主行动核心引擎,聚焦高层决策与任务分解。其核心特点包括深度思考与自主决策,通过融合视觉感知、语言指令生成高层任务规划,如从A点到B点、拿起桌子上的杯子等任务。VLT具备类人逻辑推理能力及环境理解与场景适配能力,能够识别地面障碍物、理解用户意图并根据场景调整任务规划。同时,其可整合视觉、语言、触觉等多模态数据,形成对环境的全面认知,将复杂任务拆解为原子子任务。例如,将‘捡起地上的螺丝’拆解为走到螺丝位置、弯腰、伸手抓取,并规划最优路径(如避开人群、选择最短路线),还具备自我学习与进化能力。
VLA动作执行与调整: VLA是机器人的小脑与动作执行核心,负责将VLT的决策转化为具体动作。其核心特点包括端到端动作生成,去除语言转译环节,直接从视觉信号生成动作指令,实现所见即所动的实时响应;具备物理