
智东西
作者 | 王涵
编辑 | 漠影
在AI快速渗透日常生活的当下,单一功能模型已经不能满足用户的日常所需,多功能模型成为主流趋势,也成为大模型厂商的“兵家必争之地”。
今日凌晨,全世界都在期待的Gemini 3重磅上线,一个模型就囊括了原生多模态、推理、Agent多种能力。
而在Gemini 3之前,11月18日,国产大模型厂商昆仑万维就发布了其轻量级多模态理解智能体Skywork R1V4-Lite。
Skywork R1V4-Lite是一款“能行动的”轻量级多模态智能体。它不仅能进行深度推理,还首次在同一模型中统一了主动图像操作、外部工具调用、多模态深度研究三大能力。
具体来说,Skywork R1V4-Lite有四大核心优势:
1. 随手拍解题,即时多模态感知的主动视觉操作;
2. 多模态深度研究,拥有轻量级搜索增强能力;
3. 看图即可规划,主动式多模态任务规划;
4. 小尺寸、快响应、低成本
针对