回复@icefighter: 这是一个非常专业且切中要害的问题。答案是：华为盘古（Pangu）不是单一的模型，而是一个“...

icefighter

2026-03-10 16:15 · 广东

回复@icefighter: 这是一个非常专业且切中要害的问题。答案是：华为盘古（Pangu）不是单一的模型，而是一个“多模态家族”；它既包含自然语言（NLP）大模型，也包含专门的预测（时序）大模型。
在 2026 年的华为盘古 5.5/6.0 体系中，它是通过**“分层架构”**来同时处理这两种逻辑的：
1. 它是自然语言大模型（Pangu NLP）这是大家最熟悉的“对话”和“理解”能力。
定位：负责处理非结构化数据（文字、文档、报告）。
最新进展（2025-2026）：盘古 NLP 已进化为 MoE（混合专家架构），拥有超千亿参数。它在钢铁、矿山行业的用途是阅读数万份冶金论文、技术规程和操作手册，成为企业的“首席知识官”。
特点：侧重于逻辑推理、语义理解、公文写作。
2. 它也是时序/预测大模型（Pangu Prediction）定位：专门处理结构化的时序数据（Time Series）。
技术核心：采用行业首创的 “三元 Transformer（Triplet Transformer）” 统一预训练架构。
工业用途：
传感器数据：实时处理高炉温度、压力、流量等随时间变化的数据流。
定量预测：预测 10 分钟后的钢水成分，或者预测未来一小时的用电负荷。
特点：侧重于定量计算、趋势预测、异常检测。它不产生文字，它产生“数值预测”。
3. 为什么你会在沙钢/宝信的案例中看到这种模糊性？在实际应用中，华为将两者耦合在一起，形成了“工业协同”：
场景
使用的模型
具体动作高炉
故障诊断
NLP + 时序
时序模型发现压力曲线异常（时序），NLP 模型查阅维修手册并给出文字建议（NLP）。
焦炭配比
优化预测模型
输入当前的原材料参数（时序/表单），输出最优的配比数值。
废钢定级
CV + NLP
摄像头拍下图片（CV），NLP 将其转化为定级报告。//@icefighter:回复@icefighter:关于宝信软件（及所属的中国宝武集团）研发的钢铁大模型，其技术架构呈现出一种**“自主研发三层架构”与“华为底座深度适配”**并行的局面。
简单来说：宝信对外宣称的是“自主研发”，但在底座层深度集成了华为的算力与部分模型能力。
以下是详细的层级拆解：
1. 官方定义：中国宝武自主研发根据 2024 年 10 月宝武集团在学术年会上的首发信息，宝武钢铁行业大模型明确定义为自主研发。其架构分为三层：
L0 基础大模型：整合通用能力。
L1 行业垂类大模型：针对钢铁行业的专业知识库。
L2 应用场景领域模型：如高炉大模型、热轧自然宽展模型等。
2. 核心底座：华为盘古与昇腾的支撑虽然品牌属于宝信/宝武，但在**“底层算力”和“预测模型底座”**上，宝信与华为是深度绑定的共建关系：
预测大模型底座： 2024 年 9 月，宝钢股份（由宝信提供技术支持）首发了基于华为云盘古预测大模型的热轧自然宽展模型。这证明在需要复杂物理参数预测的场景下，宝信使用的是华为盘古的 L0 底座。
算力底座：宝武集团的 AI 算力中心是融合了华为昇腾（Ascend） AI 基础软硬件平台的。这意味着模型是在华为的芯片和框架上“跑”出来的。

@icefighter :沙钢集团此次启动的 AI 大模型，本质上是基于“华为盘古大模型”底座，由沙钢与华为深度联合开发出的“钢铁行业专属大模型”。
它并非沙钢从零自研的独立大模型，也不是直接搬用通用的华为盘古大模型，而是典型的**“L0基础大模型 + L1行业大模型 + L2场景应用”**的共建模式。
以下是该合...