邮发代号 2-786
征订热线:010-82341063
8月28日,2025中国国际大数据产业博览会(以下简称“2025数博会”)在贵州省贵阳市开幕。大会由国家数据局主办、贵州省人民政府承办,以“数聚产业动能 智启发展新篇”为主题,旨在全面展现数据要素与人工智能技术融合创新的最新成果,推动数据资源的高效汇聚与价值释放,为产业升级和经济高质量发展注入强劲动力。
作为大会重要组成部分,由国家数据局主办、中国互联网协会承办的“数据安全治理与发展”交流活动同期举行。天翼安全科技有限公司总经理刘紫千出席交流活动,与参会嘉宾围绕“AI时代数据安全风险与应对”展开讨论。
刘紫千介绍,中国电信是我国关键信息基础设施的主要建设者和运营者,正在进行“云改数转智惠”战略升级。在中国电信全面拥抱人工智能的进程中,天翼安全作为集团网络安全专业子公司积极扛起维护网信安全、守护人工智能安全主力军作用,上线了大模型安全风险感知平台,建设了基础模型靶场,首个开源了大模型基础护栏,发布了国内首款大模型安全扫描器,展现了中国电信在人工智能安全发展中的决心和实力。
刘紫千表示,人工智能时代下数据安全面临四种新的风险和挑战。
第一,数据安全治理方式方法面临新挑战。现有的数据安全治理主流做法是将数据资产识别清楚后从数据分级分类切入。但在大模型训练时,从训练者角度讲为了模型泛化能力更强,往往希望使用到尽可能多的各类数据,这会突破原来的数据资产和分级分类管理,而如果数据管理过于严苛,大模型就会“降智”。
第二,数据脱敏脱密面临新挑战。如果较多的隐藏敏感信息,或者用通配符模糊一些敏感字段,在模型训练时,则难以构建准确的关联,模型应用效果大打折扣。此外,原来的数据安全保护惯用的方法之一就是把原始数据访问、数据库调用与公网访问隔离,但模型使用是开放的直接面向用户的,用户完全可能通过上下文引导、提示词注入、大模型越狱等方式获取模型记忆深处的数据信息。
第三,不同模型之间高效传递“智慧”面临挑战。模型之间、智能体之间目前还是通过类似脚本指令和“类语言化”来交流,效率不高,也不是机器语言。模型之间到底如何传递信息或者说“智慧”进行更深层次的联动配合是新的研究方向。大家应该注意到,不同的大模型在对同一段语料进行词元化也就是token化之后的数字是截然不同的,由此形成了独特的weights权重矩阵,数据安全的控制方法要跟上未来模型交互的数据要素交互的需要。
第四,数据要素的跨行业流动面临挑战。近年来,我国全力推动数据要素流动,但是随着大模型特别是国产开源大模型的私有化部署热潮,一个判断是各行业内各部委内的数据会加速聚集,但跨行业数据要素流动会被迟滞。因此,如何继续保护跨行业的数据要素流动,用什么样的治理模式鼓励引导应该是需要重点考虑的。
在谈到人工智能面临的整体风险挑战时,刘紫千指出,人工智能时代网络安全有不变的内涵,也有新的明显变化。不变的是算力环境安全,比如IaaS、PaaS,它依旧会出现软硬件载体的漏洞。新的变化主要发生在数据层DaaS和模型层MaaS,以及更加复杂多变的应用层SaaS。短短两年多,模型已经实现从聊天对话到可以执行真实任务的智能体和具身智能上。从运营商的角度来讲,需要解决的仍是客户业务安全问题,客户真正要的永远是业务安全,而不仅仅是某一个层面某一项技术的风险应对。我们基于运营商的资源禀赋,多层次立体化地解决客户在数字化智能化中的业务安全,包括了IaaS/PaaS层云网基础设施安全、DaaS层数据安全,以及MaaS/SaaS层的智能应用安全等。例如,在数据层,天翼安全持续建设“阡陌”高质量安全数据集,在模型层训练出见微安全大模型,近期又开源了基础护栏,发布了模型安全的风险感知平台和本地化模型安全扫描器。通过构建云堤一体化安全托管服务平台(MSSP),为客户提供一站式的安全运营服务。
中国电信自身也是一个大体系,在更加积极推动人工智能内部应用过程中,积累了大量的安全运营实战经验,这些经验通过技术研发也将固化到我们的系统平台上,使电信更有能力和信心为千行百业的客户做好智能化进程中的安全运营服务。