发贴是为了更好的整理、纠偏自己的思考。人是有认知短板的,一种观点之上,极可能存在着别人可见而本人未知的非常明显弱点与逻辑缺陷,当别人理性地不理性地指出(或攻击)的时候,正是聚焦或再次审视这些短板的时机。#商汤科技# $商汤-W(00020)$
商汤的核心客户群体为企业、政府及行业机构,其技术产品(如智慧城市、智能汽车、医疗影像等)多嵌入于B端解决方案中。其技术突破集中在计算机视觉、多模态大模型、AI基础设施(如SenseCore大装置)等前沿领域,这些成果多服务于产业升级需求(如制造业质检、电网巡检),而非消费级应用,普通用户难以直接感知背后的技术提供方。商汤科技的核心技术能力中首先要提的便是其视觉算法领域的贡献:
OpenMMLab是专注于计算机视觉领域(CV)的开源算法体系,由香港中文大学-商汤科技联合实验室(MMLab)发起,旨在推动AI学术研究和开源社区发展。它提供了大量算法和预训练模型,覆盖检测、分割、姿态估计等任务,主要服务于AI研究人员和开发者,帮助降低研发门槛和促进技术复现。商汤通过技术原创性(如MMCV-MMEngine架构)、工业落地能力(算法-芯片-场景闭环)和生态领导力(全球开发者社区),成为OpenMMLab的核心引擎。其作用不仅是技术贡献,更是推动中国AI开源从“跟随”转向“引领”的关键力量——正如林达华所言言:“OpenMMLab是首个实现CV领域全覆盖的统一开源体系,商汤是这一生态的‘地基建设者’”。 如今,OpenMMLab 已经成长为全球最具影响力的计算机视觉开源算法体系之一。累计开源了超 30 个算法库,拥有超 400 种算法实现和 3000 多个预训练模型。代码仓库总下载量超 1700 万次,用户遍及超 140 个国家和地区,覆盖全球顶尖高校、研究机构和企业。更令人振奋的是,OpenMMLab 不再仅仅是一个工具集合,它已经成为了一个蓬勃发展的生态系统。基于 OpenMMLab 开源的生态项目超 2500 个,总 star 数超 30 万。在这个生态中,超 2000 家企业和高校正在基于 OpenMMLab 开展研究和应用,北京大学、清华大学、上海交通大学、浙江大学等高校的研究团队都在使用 OpenMMLab 进行学术探索和技术创新。可以看到其蓬勃的发展势头。OpenMMLab 的意义超越单一技术框架,它构建了一个 “学术-工业-社区”三位一体的生态体系,通过降低研发门槛、加速技术复用和推动开放协作,成为全球 AI 发展的核心基础设施。
而至于在大模型高速发展的今天,专用模型与通用大模型的意义,我想不需要多说,以常人的理解能力便可以知道,通用模型有广度而不一定有深度,甚至其通用能力便是建立在专用模型基础上而来的,而专用模型(算法)的高精度、轻便化、实时性、高效率等,便是其优势。故OpenMMLab 的作用不会被弱化,反而会持续强化其在计算机视觉(CV)领域的专用能力,并通过技术融合与场景创新实现差异化竞争。
商汤科技累计拥有超过1.2万项全球专利,其中发明专利占比高达90%,覆盖计算机视觉、深度学习、智能驾驶等多个核心领域。海外专利覆盖20个国家及地区,主要集中于东亚、美国及东南亚市场。主要领域: 计算机视觉核心算法:商汤在图像识别、视频分析、3D重建等基础领域拥有大量专利。例如,其SenseID 3D ToF人脸认证方案通过深度学习算法实现毫秒级解锁,支持高安全支付场景;此外,其视觉导航专利通过预设视觉地图修正累积误差,提升导航精度。垂直行业应用创新:智能汽车布局超1100项专利,涵盖自动驾驶感知、车辆行为预测等技术,2024年新增定点车型41个,累计交付超360万辆汽车。医疗影像领域,全球AI医学影像专利排行榜第五,拥有536项专利,支持肝脏、心血管等疾病的三维建模与自动化诊断。AR/VR与三维感知领域,在VR/AR领域拥有2194项专利,进入全球前十;点云处理专利(如CN113971712B)推动自动驾驶与工业机器人技术突破。 若还说商汤只会烧钱,那我个人也的确无话可说。
后面有时间再逐步整理商汤科技的:人工智能基础设施平台(大装置)、全栈多模态通用人工智能平台(日日新),以及方舟多模态新智平台、悟能具身智能平台、绝影开悟世界模型等更多的垂直领域平台