用户头像
icefighter
 · 广东  

关于宝信软件(及所属的中国宝武集团)研发的钢铁大模型,其技术架构呈现出一种**“自主研发三层架构”与“华为底座深度适配”**并行的局面。
简单来说:宝信对外宣称的是“自主研发”,但在底座层深度集成了华为的算力与部分模型能力。
以下是详细的层级拆解:
1. 官方定义:中国宝武自主研发根据 2024 年 10 月宝武集团在学术年会上的首发信息,宝武钢铁行业大模型明确定义为自主研发。其架构分为三层:
L0 基础大模型: 整合通用能力。
L1 行业垂类大模型: 针对钢铁行业的专业知识库。
L2 应用场景领域模型: 如高炉大模型、热轧自然宽展模型等。
2. 核心底座:华为盘古与昇腾的支撑虽然品牌属于宝信/宝武,但在**“底层算力”和“预测模型底座”**上,宝信与华为是深度绑定的共建关系:
预测大模型底座: 2024 年 9 月,宝钢股份(由宝信提供技术支持)首发了基于华为云盘古预测大模型的热轧自然宽展模型。这证明在需要复杂物理参数预测的场景下,宝信使用的是华为盘古的 L0 底座。
算力底座: 宝武集团的 AI 算力中心是融合了华为昇腾(Ascend) AI 基础软硬件平台的。这意味着模型是在华为的芯片和框架上“跑”出来的。

@icefighter :沙钢集团此次启动的 AI 大模型,本质上是基于“华为盘古大模型”底座,由沙钢与华为深度联合开发出的“钢铁行业专属大模型”。
它并非沙钢从零自研的独立大模型,也不是直接搬用通用的华为盘古大模型,而是典型的**“L0基础大模型 + L1行业大模型 + L2场景应用”**的共建模式。
以下是该合...