中国冶金报社
记者 刘加军 刘经纬 报道
7月27日,2025语料数据智能创意大赛(CICC)获奖榜单在世界人工智能大会揭晓。宝信软件“钢铁行业高质量多模态数据集筑基企业AI+应用”课题斩获一等奖,研究成果入选2025年语料风云榜。

语料数据(Corpus Data)指为语言分析、模型训练等目的系统化收集的真实文本或语音材料的集合,是自然语言处理(NLP)领域的核心资源,相当于AI学习语言的“教材”。在AI时代,语料是人工智能发展的核心基础之一,甚至被誉为AI产业的“金矿”,是决定模型能力上限的核心要素。

上海作为中国人工智能发展的前沿阵地,已采取一系列措施来加强语料库的建设和应用。此次大赛由上海市经信委指导,旨在面向全社会寻找“好语料、好技术、好场景”,为上海“模塑申城”工程筑牢语料基石,打通高质量语料数据采集、标注、共享、应用全链路。大赛吸引了150余支高水平团队参赛,竞争激烈。