别只盯着Gemini 3!这款国产模型提前实现“随手拍解题”,速度超Gemini 2.5 Flash五倍

用户头像
智东西
 · 北京  

智东西

作者 | 王涵

编辑 | 漠影

在AI快速渗透日常生活的当下,单一功能模型已经不能满足用户的日常所需,多功能模型成为主流趋势,也成为大模型厂商的“兵家必争之地”。

今日凌晨,全世界都在期待的Gemini 3重磅上线,一个模型就囊括了原生多模态、推理、Agent多种能力。

而在Gemini 3之前,11月18日,国产大模型厂商昆仑万维就发布了其轻量级多模态理解智能体Skywork R1V4-Lite

Skywork R1V4-Lite是一款“能行动的”轻量级多模态智能体。它不仅能进行深度推理,还首次在同一模型中统一了主动图像操作、外部工具调用、多模态深度研究三大能力。

具体来说,Skywork R1V4-Lite有四大核心优势:

1. 随手拍解题,即时多模态感知的主动视觉操作;

2. 多模态深度研究,拥有轻量级搜索增强能力;

3. 看图即可规划,主动式多模态任务规划;

4. 小尺寸、快响应、低成本

针对

点击查看全文