别只盯着Gemini 3！这款国产模型提前实现“随手拍解题”，速度超Gemini 2.5 Flash五倍

智东西

2025-11-19 21:38 · 北京

智东西

作者 | 王涵

编辑 | 漠影

在AI快速渗透日常生活的当下，单一功能模型已经不能满足用户的日常所需，多功能模型成为主流趋势，也成为大模型厂商的“兵家必争之地”。

今日凌晨，全世界都在期待的Gemini 3重磅上线，一个模型就囊括了原生多模态、推理、Agent多种能力。

而在Gemini 3之前，11月18日，国产大模型厂商昆仑万维就发布了其轻量级多模态理解智能体Skywork R1V4-Lite。

Skywork R1V4-Lite是一款“能行动的”轻量级多模态智能体。它不仅能进行深度推理，还首次在同一模型中统一了主动图像操作、外部工具调用、多模态深度研究三大能力。

具体来说，Skywork R1V4-Lite有四大核心优势：

1. 随手拍解题，即时多模态感知的主动视觉操作；

2. 多模态深度研究，拥有轻量级搜索增强能力；

3. 看图即可规划，主动式多模态任务规划；

4. 小尺寸、快响应、低成本

针对

点击查看全文