DeepSeek发布新视觉模型,同为股份AI视觉ISP技术迎
DeepSeek-OCR2是DeepSeek-AI推出的一款先进视觉语言模型,核心创新在于采用DeepEncoder V2编码器,通过将CLIP组件替换为LLM风格架构、引入因果流查询与定制化注意力掩码,实现视觉令牌的语义驱动动态重排,突破传统栅格扫描顺序的局限;该模型维持256-1120视觉令牌压缩范围,在OmniDocBench v1.5基准测试中整体性能达91.09%,较基线模型提升3.73%,阅读顺序编辑距离降至0.057,同时降低线上与PDF处理场景的重复率,兼具研究创新性与实际应用价值,还为真正2D推理和原生多模态融合提供了新路径。
核心创新:
同为股份:公司关于AIISP技术的产品也已经有成熟产品线投放市场
星宸科技:公司核心研发团队具有丰富的SoC芯片设计经验,核心IP均为自研,已形成AI、ISP、音频、视频、显示、感