用户头像
icefighter
 · 广东  

回复@icefighter: 电力大模型与互联网大模型最大的区别在于:电力模型不能出错。
黑盒的风险(华为模式): 华为盘古提供的是预训练好的行业模型,其内部参数的权重分配对用户来说是相对“黑盒”的。如果 AI 建议切断某条线路,南瑞的调度员必须知道为什么。
白盒的优势(南瑞自研): 基于百度飞桨这类开源程度极高的框架,南瑞可以从最底层的**损失函数(Loss Function)**开始重写。南瑞将“基尔霍夫定律”、“潮流方程”等物理约束直接写进神经网络的结构里(即 PINN,物理信息神经网络)。
结果: 这样训练出来的模型是“透明”的,南瑞可以精确追踪到模型预测的逻辑是否符合物理常识。
2. 数据层面的“主权”:防止工艺秘密的“被動学习”
黑盒陷阱: 如果南瑞将全网的高频采样数据(PMU 数据)直接喂给华为的行业模型,随着模型的不断迭代,华为的模型会越来越懂电网。在 2026 年的视角下,这种**“工艺经验的流失”**是南瑞这类技术型企业无法接受的。
白盒护城河: 南瑞利用百度的底层通用工具链,在自己的私有云上构建底座。数据不出南瑞的内网,且模型微调的所有超参数、训练权重完全掌握在南瑞自己手中。这保证了**“电力灵魂”**始终留在南瑞。
3. 闭环控制权的归属:谁来下达指令?
这是最核心的商业博弈点。
华为盘古的定位: 更多是辅助决策。它可以告诉你“这里可能会出故障”,但它很难直接接入南瑞的二次设备执行“合闸”或“跳闸”。
南瑞的布局: 南瑞的初衷是将大模型嵌入到其自研的 EMS(能量管理系统) 中。通过白盒化自研,南瑞实现了**“模型即控制”**。因为底座是自己改写的,模型输出的信号可以直接转化为电力电子设备的控制序列,实现毫秒级的闭环。
4. 商业维度的考量:不做“渠道商”,要做“定义者”
如果用华为盘古: 南瑞在电网 AI 产业链中可能沦为一个“集成商”,利润空间被华为的授权费挤压。
基于百度框架自研: 南瑞是**“电力大模型标准”的定义者**。百度提供的是“毛坯房”和“装修工具”,南瑞盖出的是“特种机房”。在向其他省网甚至海外电网输出技术时,南瑞拥有完全的定价权和知识产权。//@icefighter:回复@icefighter:经过对国电南瑞 2025 年半年报及相关技术白皮书的深度确认,可以明确:国电南瑞的大模型底座并不是简单的“非 A 即 B”,而是一个典型的“百度算法框架 + 华为硬件算力”的国产化融合底座。
以下是技术细节的最终确认:
1. 软件/算法底座:主要基于百度飞桨(PaddlePaddle)体系国电南瑞的时序电网大模型在算法框架上深度集成了百度飞桨。
合作渊源: 百度与国家电网在“光明大模型”上的合作是顶层设计。作为国网的二级单位,南瑞在研发时序模型时,复用了国网统一采购的百度文心(ERNIE)底层框架技术。
技术特点: 南瑞利用飞桨框架中的 PaddleTS(时序专用库) 进行了二次开发。这解释了为什么它能处理高频电力波形,因为飞桨在工业时序数据的处理能力上是国内起步最早、适配最深的。
2. 硬件/算力底座:完全基于华为昇腾(Ascend)硬件尽管软件框架偏向百度,但南瑞在半年报中明确强调了自主可控,其实际运行的硬件环境是华为昇腾。
适配方案: 2024-2025 年间,百度与华为达成了“飞桨+昇腾”硬件生态共创计划。南瑞正是这一计划的核心落地者。
南瑞的任务: 南瑞自研了大量的底层算子(Operator),用于在华为昇腾 910B/C 芯片上加速电力波形的傅里叶变换和时序特征提取。
3. 为什么南瑞不直接用“华为盘古”做底座?这是一个非常关键的行业洞察:
业务隔离: 华为盘古目前在煤矿、钢铁落地极深(如沙钢案例),但在电网核心调度控制领域,国电南瑞有着极强的地盘意识。
差异化竞争: 华为盘古预测模型(三元 Transformer)是通用的,而南瑞需要的是将电力物理方程嵌入到模型中。南瑞选择基于百度框架进行更底层的“白盒化”自研,比直接购买华为的“黑盒”行业模型更能掌握控制权。

@icefighter :沙钢集团此次启动的 AI 大模型,本质上是基于“华为盘古大模型”底座,由沙钢与华为深度联合开发出的“钢铁行业专属大模型”。
它并非沙钢从零自研的独立大模型,也不是直接搬用通用的华为盘古大模型,而是典型的**“L0基础大模型 + L1行业大模型 + L2场景应用”**的共建模式。
以下是该合...