AI研究系列34-商业PLTR的慧辰能不能收入加速?

用户头像
江舸投资笔记
 · 浙江  

$慧辰股份(SH688500)$ $Palantir(PLTR)$

慧辰股份-250709电话会研究】

1. 2008年,一直以来是深耕于商业与公共服务领域,其中商业领域的行业包括不限于通信、耐用消费品、快速消费品、汽车、金融、医疗、烟草等世界500强、中国500强和这个行业头部品牌及新消费的品牌为主,过去11年间公司累计服务客户超过2000家,具备数据采集、分析、治理、流通应用等多个数据数要素环节,形成了数据分析、数据挖掘、数据运营的核心竞争力,积累了广泛的数据应用场景。

2. 作为数据要素加AI应用的综合服务提供商,公司聚焦数据算法模型算力、基础设施等业务,运用大数据机器学习,深度学习人工智能自然语言数据可视化、知识图谱等数字技术,然后推动数据资产价值化,还有AI应用场景化算力支持的普及化方面。

3. 很早的时候就深耕数据智能领域,12年就开始做机器学习,然后开始买行业级交付级的数据,业务聚焦从数据采集、数据清洗、数据融合、数据自动标注开始到分析智能的全链条服务,慧辰实际上堪称AI时代的数据炼油厂,不断在交付客户价值的同时,也在不断的沉淀数据资产,构建行业的数据模型和AI垂类模型,形成了独特的数据壁垒。

4. AI中间有4个应用要素,数据、场景、算法和算力,慧辰实际上聚焦的是数据和场景,卖铲子服务有通用镜像,AI自动标注,模拟数据集等,除此之外还致力于帮助客户挖掘数据自动化,通过AI中台和行业垂类模型,然后赋能客户构建专属的智能应用和AI Agent的矩阵,从数据出发,然后向上向下打通数据价值转化的全路径。慧辰定位all in AI,通过AI的算法及技术成为数据价值的重构者。

5. 短期深化数据炼油厂的能力,通过高价值的数据集,比如说消费行业的全量向量数据库,金融风控因子库等垂类数据库,赋能客户模拟训练,中期是打造AI中台加垂类Agent的矩阵,现在慧辰是全行业首个发布AI中台的公司,然后目前覆盖了80%的500强及头部企业的主动决策产品,长期就是构建人类加一级Agent的智能生态。未来所有的公司都会成为AI公司,慧辰成为AI数据智能基础设施的提供商,对标数据版的英伟达和商业版的PLTR的综合性公司。目前的战略路径在商业拓展横向就是产生更多的AI agent和覆盖更多的行业,纵向实际上是更主动、更高频的、更深入的嵌入我们现在目前覆盖客户的主动的决策层。

6. 慧辰具有的核心竞争力-数据价值化:我们AI构建全栈快速交付,就是帮客户生成AI的平台,AI中台实际上是对标PLTR的高端平台,然后进行商业场景的主动决策智能,我们认为未来的所有软件会变成AI的数据库,所以我们从2011年以来,公司每年采集和数据采购的费用占我们营收比在50%以上。从公开数据来看,我们上市以来公司数据采集及采购费用合计营收比重基本上都在50%以上,51.59%、50%、60%、59.74%、59.56%,我们是不计费用的采买,不计代价的采买,所以我们沉淀了非常多的交付级的数据,然后在民企的数据资产我们是最大的,我们公司在全行业内列全球第五,像美国的尼尔森,法国的伊索,然后英国的crs,德国的gfk,然后就是我们慧辰,目前是大中华区的第一,所以我们实际上聚焦企业数据治理,包括AI化的痛点,比如碎片化 低合规,所以我们目前提供的是数据采集、数据清洗、数据融合、数据AI标注训练等全栈的解决方案。

7. 慧辰的融合数据策略:我们目前虽然数据没有计入资产,但是我们每年的采购数据的规模已经很庞大了,比如说按照我们去年或者前年的话,基本上在三个亿左右,而且累计大概十几年,累计了大概两百多家的行业知识图谱,覆盖了500强企业,占80%的消费行业数据链,非常珍贵,很多AI项目一上来很容易就死在数据整合上,说白了很多AI项目不是AI不行,是他们自己的数据治理结构有问题,比如说你要做菜,备各种各样的食材,你家有100个冰箱,每一种食材都在一个冰箱,你每天得在冰箱之间来回折腾,慧辰的优势在于就像相当于是在一个非常大的垂类行业,有一个超大的冰箱,所有的东西都放在一起,你想就拿啥,大冰箱本质上把结构化数据、非结构化、图像量空间这些数据形态全装到一个数据库里面,这是很关键的一点,慧辰股份通过服务、消费、通信ICT、金融等各个行业的客户累积了海量的场景化交付级的数据,这些数据经过深加工之后,正成为企业AI化转型的核心资源,在持续不断的给客户去创造价值,而且持续不断的被调用。

8. 目前发展规划:我们实际上是双500强生态,就是服务世界500强和中国500强的头部80%的品牌,然后我们目前公司累计长协的客户就有2000家头部客户,头部客户是未来最早Agent落地的战略高地。我把我们的客户目前做一个分级,分级的第一梯队肯定是KA(Key Account关键客户),比如移动互联网最开始APP兴起的时候,最开始头部的KA像BATJ这样的公司,所以我们目前的目标市场实际上第一梯队,现在我们的长期客户已经能覆盖能够产生数亿或者数十亿以上的营收预期,第二梯队是中小偏大客户,最后的第三梯队是长尾客户,到最后每家公司都会有自己的垂类模型时候,我们的布局优势就体现出来了,可以把数据比作慧辰的存货,存货周转率越快我们越赚钱。我们现在目前专注的行业是大消费。在全市场41个大类目行业中,只有7个行业增长,里面排第一的就是消费,而且它管理程度高,并且现金流好,并且有付费能力并且高频。所以这是我们现在目前聚焦的客户。

9. 慧辰的卡位优势:

1) 客户优势是我们客户量级足够大,和客户合作的广度和深度,广度比如像华为,我们是它全球最大的数据供应商,比如说像车,Top10都是我们的客户,我们是直接嵌入他的决策和主要的业务流程,这是我们现在目前的客户优势,现在目前客户优势,

2) 数据优势:我们现在目前是有消费级的垂类行业的全量向量数据库,我们还有细分领域主动决策的模型,而且是我们自研的,这是我们现在数据优势,并且每年我们买几个亿的数据,持续了十几年,所以我们形成了庞大的行业级的数据,交互级的数据,高质量的数据,这是我们现在目前最大的优势。

3) 场景优势Know-how的能力:行业Know-how是发现需求的基础,大客户现在目前服务是必须要有Know-how的能力,必须得比客户更专业才可以,客户实际上今年的预算,我们今年接的这些订单都不是在预算内的,是他硬拨出来的,他能够承担一级Agent的开发成本能力,客户现在目前非常主动。

10. 慧辰的Agent客户应用举例-可口可乐:比如给可口可乐客户提供交付的是一个agent的矩阵,可能有几十个agent去解决它方方面面各个流程的问题,我们实际上有一个原则,就是我们只创造客户愿意付费并且可量化的价值产品,其他的像比如说像chat bot这样的玩具我们是不做的,比如可口可乐有20万的销售,可口可乐中间有一个月是停着要去给这些接受培训30天销售的工资,我们现在目前能把30天降到两天,第一天他入职领工牌,领工服,第二天我教会他使用我的Agent,他就可以达到目前销售的中等偏上水平,具体工作流程为,sales每天上班的开始,他打开手机,然后Agent就开始给他推任务,sales不需要思考了,全部是AI主动决策直接给他推动,Agent直接替代了区域经理的岗位(原来区域经理是去规划销售跑哪些门店),销售到地推门店后,Agent推送组货策略(桶装、听装、瓶装、玻璃瓶配货比例),市场策略(这个店投不投,还是下一个店投多少)类似的策略全部是AI直接帮他决策的,决策完了之后, AI自动帮他生成销售合同,把这个组货策略,把市场策略直接都生成在销售合同里,帮助销售跟老板谈,线上签单,Agent之间开始协同,中间是有审批的,大概得有十几个审批一秒钟(以前的人工流程,大审批的节点人是时间的堵点,导致审批很慢),AI直接一秒钟直接审批到货主,然后货主直接Agent的下指令下到物流,然后送货。送货完,Sales还会去做数据采集,它会有空间计算和多模态的图片的数据采集,他会拍7~10张图片,他会拍堆头的,拍库存的、拍仓库的、拍冷柜的,然后假设他拍这个堆头的,他饮料没有放在好的位置,他是影响销售的, Agent会指引他去把布陈跟老板商量,要不要把这个东西直接挪一下。这样提升存货周转效率。光人员培训成本就为客户节省4.2亿,不含中层管理人被去掉了,不含培训人员的部门节支,然后也不含效率提升,然后不含Agent的和Agent的中间的协同效率提升,年节省4.27个亿。因为为什么不算这个?因为可能客户根本就不用计算,就知道目前效率已经比我们的售价要高特别多,所以客户决策也比较容易也比较简单,而且我们后端的取费方式也比较舒服,因为现在目前它的管理频次从最开始的高层延展到了现在目前的sales层调用的更高频,我们后端的取费也会越来越多。

11. 订单展望和收入预期:目前订单还是不缺的,首先我们是一个分层打法,最开始的头部客户已经够支撑非常高的营收了,目前实际上最小的客单也在400多万,交付周期大概在两个多月的周期,所以我们实际上这些长期客户转化,规划在三到五年这个时间能把我们2000家头部的长协客户转化很多,中长尾客户实际上布局非常深,现在精力有限,现在目前规划用有效率的方式去批量服务他们,现在公司态度是他们爱买不买,但是实际上我们目前是有订单的。在目前这些中长尾客户我们是能够服务的,能够在这个平台上服务,然后他能直接在我们平台上来采买,比如说我的预训练数据集,然后能采买我的 AI自动数据标注。目前国内的公司数据治理还是比较头疼的,因为它用各种各样的软件比较多,然后数据治理它可能有一个周期,但是我们交付能力已经中台化了,我们实际上交付周期已经非常快了,再加上我们之前的积累,你可以理解成我们是生成模型的平台,生成Agent平台,然后能够有全量的向量数据库,在这个产业行业实际上非常领先的能够快速交付,但是它之前可能会去做数据治理,把它非结构化数据结构化,最后治理完了再找到慧辰说我数据治理做完了,你可以直接来跟我们签单了,大概这样,现在目前排队的公司做数据治理的很多。

12. 算力调度平台:我们融合算力调配平台,它实际上是有算力的纳管(看到哪坏了去运维),然后算力的客户实际上也是我的客户也需要算力,这是基础功能;中科那边是实际上它们自己各个院所实际上是非常多的算力,我们也是在不断的去纳管,然后服务上面的客户,然后国家级算力节点我们也服务了一些,目前的整个我们AI中台的算力平台是收费的,并且后端算力的各种各样的增值服务是可以收费的,融合算力调配平台是有采买的必要性,首先实际上是能破壁垒的,比如英伟达的异构混合调度,英伟达的某一个卡坏了,可以拿昇腾来补,其次是有防锁卡的关键的软件技术,我们是已经国产化了,比如用海外的非大中华区使用的卡,这两点是能够规避供应链风险。也可以利用该平台去服务长尾客户(单卡算力拆分调度),长尾客户实际上是我们后端未来盈利的非常关键点,所以目前我们这个算力中心平台,实际上我们没有说我们为了做算力而做算力,我们是为了我们后端这个数亿级的 AI Agent的各种各样布局,它实际上是重要的销售渠道,为了服务长尾客户的布局。

13. 大模型接入:AI中台,我们AI全栈的交互和融合能力是已经中台化了,然后深度兼容全部的模型,包括deepseek等,各种的基本上所有的模型都接入了。我们自己形成核心壁垒,就是我们的垂类的算法调优技术,算法调优技术实际上不是算法,它是数据能力体现,但是概括成算法调优的技术,比如说小数据样本的训练技术,比如说像现在我们的模拟数据集,再的话是我们消费行业的全量向量数据库,还有就是生态优势,我们跟很多厂商,比如说像阿里和华为的数据供应商,我们是全华为全球的最大的数据公供应商,比如我们可能占到他数据供应的90%多,可能法国的伊索可能目前只有百分之二三%,基本上模型厂商和 bat级的大厂跟我们都有各种各样的关系,包括我们做数据采集的时候,我们也找他们买,包括软件公司大概是这样。

A. 过往业绩情况:

1. 收入:16年开始到现在,一直在3-5亿的收入区间,收入增长乏力,并且24年收入开始下滑,同比-17.68%。整体收入季节性特征明显,一季度收入最少。25Q1同比有个位数增长,前提是建立在24年低基数(同比-25%)的背景下。

2. 扣非净利润:16-19年每年还能盈利1000-3000万,20年开始亏损,平均每年亏一个亿,亏损也有季节性,平均Q1-Q3亏损差不多,Q4一般亏损较多,25Q1亏损相比24Q1略有收窄,但变化不大都是亏损2000万左右。

3. 市场一致预期:目前只有海通国际给出最近的业绩预测,预测2025-2027年慧辰股份营业收入分别为5.81/7.47/9.41亿元,同比+30.8%/+28.7%/+25.9%;归母净利润分别为0.54/0.81/1.17亿元,同比+201.0%/+50.9%/+44.0%,这个公司目前没法看PE估值,目前56.4亿对应5.81亿收入为9.7倍PS。估值10倍PS,很难再给空间了。比如Scale AI 在技术深度(合成数据、军事级标注)、客户结构(国际巨头 + 国防)上都远远超过慧辰,其25年估值也才15PS;比如在军工领域最像PLTRPalantir)的华如科技,对应25年也才10倍PS,而且其跟PLTR一样,其 XSim 军事智能体系支撑陆军数据平台建设,订单锁定未来增长,军工属性赋予估值溢价后也才10PS。

B. 慧辰股份-虚假记载黑历史研究:

1. 处罚当事人:慧辰股份、赵龙时任慧辰股份董事长、徐景武时任慧辰股份财务负责人、董事会秘书、马亮时任慧辰股份董事、审计委员会委员、技术总监。

2. 目前:距离虚假记载时期,董事长仍为赵龙,董秘换成了何东炯,马亮仍持有股份,为核心技术人员。

3. 2017年6月,慧辰股份收购信唐普华48%的股权,信唐普华成为慧辰股份参股的公司。2020年12月,慧辰股份进一步收购信唐普华22%的股权,信唐普华成为慧辰股份的控股子公司。信惠普华通过虚构与第三方业务、签订无商业实质的销售合同、提前有以项目收入的方式虚增收入和利润,导致慧辰股份2020年7月13日披露的招股说明书,及首发上市后披露的2020年至2022年年度报告存在虚假记载。

备注:从这个子公司造假的时间点可以分析,母公司慧辰一定也有参与,17年收购子公司信唐普华后,子公司18年开始造假,2020年慧辰继续增资控股,此前和此后,子公司信唐普华依然在继续造假,所以可以认定母公司慧辰和董事长均知情并主导参与了此次造假行为。

4. 2018年,信唐普华通过签订无商业实质销售合同的方式,在4个项目中虚增收入和利润,综合考虑坏账损失、减值等因素影响,导致慧辰股份2018年虚增利润55.31万元,占当期披露利润总额的7.3%。

5. 2019年,信唐普华等通过签订无商业实质的销售合同、提前确认项目收入的方式,在5个项自中虚增收入和利润导致慧辰股份2019年虚增营业收入721.70万元,占当期披露营业收入的1.88%,综合考虑坏账损失、减值等因素影响,虚增利润1,785.88万元,当期披露利润总额的25.16%。

6. 2020年,信唐普华等通过虚构与第三方业务、签订无商业实质的销售合同、提前确认项目收入的方式,在10个项目中虚增收入和利润,导致慧辰股份2020年虚增营业收入4,396.81万元,占当期披露营业收入的11.29%;综合考虑坏账损失、减值等因素影响,虚增利润6.096,16万元,占当期披露利润总额的60.69%。

7. 2021年,信唐普华等通过虚构与第三方业务、提前确认项目收入的方式,在6个项目中虚增收入和利润,导致慧辰股份2021年虚增营业收入2424.13万元,占当期披露营业收入的5.09%:综合考虑坏账损失、减值等因素影响,虚减利润1,721.19万元,占当期披露利润总额绝对值的36.45%。

8. 受2018年至2021年相关项目影响,慧辰股份2022年多计坏账捐失,商誉减值等,虚减利润10496.20万元,占当期披露利润总额绝对值的49.84%。

C. 慧辰股份主要业务简短研究:

1. 简介:慧辰股份是国内领先的数据分析服务提供商。随着人工智能技术和相关 AI 大模型应用市场的发展,公司积极布局与数据智能应用相关的算法模型,并切入算力调度市场,形成“数据、算法及算力”业务覆盖。

2. 数据分析业务:公司主要为行业头部企业、政府机构提供基于企业内外部数据、消费者态度与行为数据、行业数据的业务经营分析与应用、定制化行业分析应用解决方案等服务,目前,基于数据分析行业标准化、智能化趋势,公司积极布局 AI 产品,自研的多个 AI 算法模型已经通过国家网信办备案。同时将 AIGC 与业务结合,开发了 AI 虚拟人、AIGC 商业分析产品,推出 AIGC Agent 应用平台-慧 AI,将 AIGC 应用融合扩展到数据智能化场景,预计开始进行多个行业的渠道推广。

3. 算力调度平台业务:算力需求持续增长,国家持续规划推进智能计算基础设施建设、合理梯次布局。算力调度与电力调度类似,可以跨服务商、跨架构、跨地域,以实现算力供给和需求的动态平衡。算力调度运营商能够对接算力供需,同时提供算力容器化、运营等服务,预计未来可以从算力 IDC 建设费用中收取调度费,实现“抽成”收入。2024 年 7 月,慧辰股份联合中科信控与棱镜数聚共同签署战略合作协议,联合打造融合算力管理服务平台,通过 Slurm的精细化算力资源编排模式,同时融合英伟达镜像资源,大幅提升算力计算效率和管理深度。

D. 慧辰股份潜在对标个股—Scale AI研究:

1. 2025年6月,Scale AI被Meta以143亿美元收购49%股份,公司估值约290亿美元。对应估值15PS。

2. 收入:2024年营收8.7亿美元,Google单一客户的贡献约1.5亿美元,2025年预计突破20亿美元(年增超100%)。

3. 收购原因:Meta的Llama4模型表现未达预期,急需通过Scale的数据能力补强模型性能,同时将创始人,28岁的天才CEO Mr Wang纳入麾下,领导Meta“超级智能”部门。

4. 业务简介:Scale AI是提供数据标注服务的,数据标注(Data Labeling)就是给原始数据(图片、文本、语音等)打标签的过程。就像教孩子看图识物时指着猫说“这是猫”,数据标注员就是在数字世界里做同样的事,使AI模型能够理解这些数据的含义。比如:

1) 图像标注:框出图中的猫、标记肿瘤CT区域;

2) 文本标注:标注句子情感倾向(正面/负面/中性);

3) 语音标注:转写并标记说话人情绪;

4) 视频标注:追踪车辆运动轨迹;

5. 应用场景:

1) 自动驾驶:一辆L4级自动驾驶车需标注1亿+张图像;

2) 大模型需求:Chat GPT需人类标注员排序答案质量;

3) 医疗AI:肿瘤影像标注市场年增45%

6. 市场规模:根据麦肯锡预测,2030年AI数据基础设施市场(含标注、清洗、合成等)将达到420亿美元。而Scale AI所在的基础标注服务市场,2023年的市场规模是22亿美元,2030年将达到102亿美元。

7. 数据标注的重要性:Scale AI成立于2016年,创始人兼CEOAlexandrWang17岁从MIT辍学,是前Quora工程师,创始人可以说是技术极客,深谙AI行业“数据饥渴”的痛点,将枯燥的数据标注变为了百亿生意。正如他所说:“没有高质量标注,AI就是瞎子聋子——只要AI需要训练,数据标注就永不消失,但形态将持续进化。”

8. 客户:客户涵盖Open AI、谷歌特斯拉、美国国防部等顶级机构,

9. Scale AI的毛利高达80%,净利高达40%,分布在全球100+国家的数据标注师超50万人。

10. 核心能力:资本市场对Scale AI的估值反映了数据在AI竞赛中的战略地位——当算力军备竞赛陷入瓶颈,高质量数据成为巨头争夺的下一个高地。而高质量标注数据是训练大模型的核心瓶颈,Scale通过“人力标注+AI质检+合成数据”三位一体模式,成为AI产业链的“隐形军火商”。

11. 商业模式:相较于竞品的“纯人工标注的人力服务商”,Scale已成AI数据基础设施

1) Human in the loop模式:AI预标注+人类校对,强化数据质量与效率;

2) 主动学习:自动识别模型难例(如模糊交通标志)→优先标注,数据价值提升300%

3) Zero-Shot质检:AI模型检测标注错误(如漏标行人),人工复核量减少70%

4) 多模态兼容:支持复杂任务如医学影像、视频理解、LLM强化标注等;

5) 垂直场景拓展:从自动驾驶扩展至更高价值的数据科学与RLHF(人类反馈强化学习)应用。

12. 典型应用:特斯拉(2023年订单),需求为标注10万张暴雨夜间行车图像,识别模糊行人/故障车,成本只有特斯拉自建团队的10分之一。

1) 数据增强:Scale Gen生成合成数据(如暴雨+霓虹光干扰),补足真实数据缺口;

2) AI预标:预标注行人/车辆→准确率75%→人工修正重点;

3) 全球众包调度:基础框选(菲律宾$1.8/时)→3D融合(波兰$4.5/时)→军事级质检(美国$22/时);

4) 主动学习迭代:发现模型漏检“撑伞行人”→新增5万张专项标注;

5) 结果:标注成本:$0.18/张(特斯拉自建团队成本$1.2/张);模型误检率下降37%;

免责声明:以上内容均为公开数据推导,力争做到有证可靠,有据可依,不代表买入意见,不代表上市公司观点,仅供研究讨论交流公司基本面用,未来新信息更新还会不断修正,也欢迎各位球友提供修改意见,股市有风险,估值随着人心随时变动,据此买卖,后果自负。