回复@icefighter: 电力大模型与互联网大模型最大的区别在于：电力模型不能出错。黑盒的风险（华为模式）：华为盘...

icefighter

2026-03-10 16:41 · 广东

回复@icefighter: 电力大模型与互联网大模型最大的区别在于：电力模型不能出错。
黑盒的风险（华为模式）：华为盘古提供的是预训练好的行业模型，其内部参数的权重分配对用户来说是相对“黑盒”的。如果 AI 建议切断某条线路，南瑞的调度员必须知道为什么。
白盒的优势（南瑞自研）：基于百度飞桨这类开源程度极高的框架，南瑞可以从最底层的**损失函数（Loss Function）**开始重写。南瑞将“基尔霍夫定律”、“潮流方程”等物理约束直接写进神经网络的结构里（即 PINN，物理信息神经网络）。
结果：这样训练出来的模型是“透明”的，南瑞可以精确追踪到模型预测的逻辑是否符合物理常识。
2. 数据层面的“主权”：防止工艺秘密的“被動学习”
黑盒陷阱：如果南瑞将全网的高频采样数据（PMU 数据）直接喂给华为的行业模型，随着模型的不断迭代，华为的模型会越来越懂电网。在 2026 年的视角下，这种**“工艺经验的流失”**是南瑞这类技术型企业无法接受的。
白盒护城河：南瑞利用百度的底层通用工具链，在自己的私有云上构建底座。数据不出南瑞的内网，且模型微调的所有超参数、训练权重完全掌握在南瑞自己手中。这保证了**“电力灵魂”**始终留在南瑞。
3. 闭环控制权的归属：谁来下达指令？
这是最核心的商业博弈点。
华为盘古的定位：更多是辅助决策。它可以告诉你“这里可能会出故障”，但它很难直接接入南瑞的二次设备执行“合闸”或“跳闸”。
南瑞的布局：南瑞的初衷是将大模型嵌入到其自研的 EMS（能量管理系统）中。通过白盒化自研，南瑞实现了**“模型即控制”**。因为底座是自己改写的，模型输出的信号可以直接转化为电力电子设备的控制序列，实现毫秒级的闭环。
4. 商业维度的考量：不做“渠道商”，要做“定义者”
如果用华为盘古：南瑞在电网 AI 产业链中可能沦为一个“集成商”，利润空间被华为的授权费挤压。
基于百度框架自研：南瑞是**“电力大模型标准”的定义者**。百度提供的是“毛坯房”和“装修工具”，南瑞盖出的是“特种机房”。在向其他省网甚至海外电网输出技术时，南瑞拥有完全的定价权和知识产权。//@icefighter:回复@icefighter:经过对国电南瑞 2025 年半年报及相关技术白皮书的深度确认，可以明确：国电南瑞的大模型底座并不是简单的“非 A 即 B”，而是一个典型的“百度算法框架 + 华为硬件算力”的国产化融合底座。
以下是技术细节的最终确认：
1. 软件/算法底座：主要基于百度飞桨（PaddlePaddle）体系国电南瑞的时序电网大模型在算法框架上深度集成了百度飞桨。
合作渊源：百度与国家电网在“光明大模型”上的合作是顶层设计。作为国网的二级单位，南瑞在研发时序模型时，复用了国网统一采购的百度文心（ERNIE）底层框架技术。
技术特点：南瑞利用飞桨框架中的 PaddleTS（时序专用库）进行了二次开发。这解释了为什么它能处理高频电力波形，因为飞桨在工业时序数据的处理能力上是国内起步最早、适配最深的。
2. 硬件/算力底座：完全基于华为昇腾（Ascend）硬件尽管软件框架偏向百度，但南瑞在半年报中明确强调了自主可控，其实际运行的硬件环境是华为昇腾。
适配方案： 2024-2025 年间，百度与华为达成了“飞桨+昇腾”硬件生态共创计划。南瑞正是这一计划的核心落地者。
南瑞的任务：南瑞自研了大量的底层算子（Operator），用于在华为昇腾 910B/C 芯片上加速电力波形的傅里叶变换和时序特征提取。
3. 为什么南瑞不直接用“华为盘古”做底座？这是一个非常关键的行业洞察：
业务隔离：华为盘古目前在煤矿、钢铁落地极深（如沙钢案例），但在电网核心调度控制领域，国电南瑞有着极强的地盘意识。
差异化竞争：华为盘古预测模型（三元 Transformer）是通用的，而南瑞需要的是将电力物理方程嵌入到模型中。南瑞选择基于百度框架进行更底层的“白盒化”自研，比直接购买华为的“黑盒”行业模型更能掌握控制权。

@icefighter :沙钢集团此次启动的 AI 大模型，本质上是基于“华为盘古大模型”底座，由沙钢与华为深度联合开发出的“钢铁行业专属大模型”。
它并非沙钢从零自研的独立大模型，也不是直接搬用通用的华为盘古大模型，而是典型的**“L0基础大模型 + L1行业大模型 + L2场景应用”**的共建模式。
以下是该合...