回复@icefighter: 这是一个非常专业且切中要害的问题。答案是:华为盘古(Pangu)不是单一的模型,而是一个“多模态家族”;它既包含自然语言(NLP)大模型,也包含专门的预测(时序)大模型。
在 2026 年的华为盘古 5.5/6.0 体系中,它是通过**“分层架构”**来同时处理这两种逻辑的:
1. 它是自然语言大模型(Pangu NLP)这是大家最熟悉的“对话”和“理解”能力。
定位: 负责处理非结构化数据(文字、文档、报告)。
最新进展(2025-2026): 盘古 NLP 已进化为 MoE(混合专家架构),拥有超千亿参数。它在钢铁、矿山行业的用途是阅读数万份冶金论文、技术规程和操作手册,成为企业的“首席知识官”。
特点: 侧重于逻辑推理、语义理解、公文写作。
2. 它也是时序/预测大模型(Pangu Prediction)定位: 专门处理结构化的时序数据(Time Series)。
技术核心: 采用行业首创的 “三元 Transformer(Triplet Transformer)” 统一预训练架构。
工业用途:
传感器数据: 实时处理高炉温度、压力、流量等随时间变化的数据流。
定量预测: 预测 10 分钟后的钢水成分,或者预测未来一小时的用电负荷。
特点: 侧重于定量计算、趋势预测、异常检测。它不产生文字,它产生“数值预测”。
3. 为什么你会在沙钢/宝信的案例中看到这种模糊性?在实际应用中,华为将两者耦合在一起,形成了“工业协同”:
场景
使用的模型
具体动作高炉
故障诊断
NLP + 时序
时序模型发现压力曲线异常(时序),NLP 模型查阅维修手册并给出文字建议(NLP)。
焦炭配比
优化预测模型
输入当前的原材料参数(时序/表单),输出最优的配比数值。
废钢定级
CV + NLP
摄像头拍下图片(CV),NLP 将其转化为定级报告。//@icefighter:回复@icefighter:关于宝信软件(及所属的中国宝武集团)研发的钢铁大模型,其技术架构呈现出一种**“自主研发三层架构”与“华为底座深度适配”**并行的局面。
简单来说:宝信对外宣称的是“自主研发”,但在底座层深度集成了华为的算力与部分模型能力。
以下是详细的层级拆解:
1. 官方定义:中国宝武自主研发根据 2024 年 10 月宝武集团在学术年会上的首发信息,宝武钢铁行业大模型明确定义为自主研发。其架构分为三层:
L0 基础大模型: 整合通用能力。
L1 行业垂类大模型: 针对钢铁行业的专业知识库。
L2 应用场景领域模型: 如高炉大模型、热轧自然宽展模型等。
2. 核心底座:华为盘古与昇腾的支撑虽然品牌属于宝信/宝武,但在**“底层算力”和“预测模型底座”**上,宝信与华为是深度绑定的共建关系:
预测大模型底座: 2024 年 9 月,宝钢股份(由宝信提供技术支持)首发了基于华为云盘古预测大模型的热轧自然宽展模型。这证明在需要复杂物理参数预测的场景下,宝信使用的是华为盘古的 L0 底座。
算力底座: 宝武集团的 AI 算力中心是融合了华为昇腾(Ascend) AI 基础软硬件平台的。这意味着模型是在华为的芯片和框架上“跑”出来的。