
2023年,IDEA研究院团队推出了广受关注的开集检测模型Grounding DINO,这些开源模型被国内外很多团队用于各类视觉及多模态应用中。5月24日,记者从IDEA研究院获悉,该团队推出全新升级版Grounding DINO1.5。模型分为Pro和Edge两个版本,其中Edge版实现了端侧可部署的革命性突破,已部署在英伟达的Orin NX卡上,将强力赋能具身智能、自动驾驶等新型应用场景。
据该团队介绍,Grounding DINO1.5在其前身Grounding DINO的基础上,通过结合更大的视觉backbone扩大模型尺寸,并使用超过2000万的Grounding数据获得了丰富的语料,大幅提升了检测精度和速度,且通过Pro和Edge版本分别针对不同应用场景进行了优化。
Grounding DINO1.5 Pro版本实现了当前开集目标检测的最先进水平(SOTA),在图像和文本的