# 关于推进AI安全基础设施建设的建议

**任 奎**
**浙江大学求是讲席教授**
**计算机科学与技术学院院长**
**区块链与数据安全全国重点实验室常务副主任**

---

国家自然科学基金委信息学部：

当前，人工智能技术正以前所未有的速度重塑网络安全攻防格局。基于我在浙江大学从事网络空间安全研究的深厚积累，以及近期参与军方项目、上海AI实验室闭门研讨和国际交流的实地观察，我认为我国AI安全基础设施建设已到了必须系统性谋划、战略性布局的关键时刻。现将有关思考和建议汇报如下。

## 一、形势研判

### 1.1 AI驱动网络安全进入代际跃迁期

网络空间安全正在经历从"人工对抗"向"智能博弈"的根本性转变。我在军方四千万元网络安全项目中亲身实践体会到，基于AI的漏洞挖掘技术已经展现出惊人的效能——原定交付5个高危漏洞的研究任务，团队在AI辅助下提前完成。这绝非偶然现象，而是AI技术对安全研究范式的系统性赋能。

正如黄仁勋所提出的主权AI五层架构理论，真正的自主可控必须贯穿从芯片、硬件、系统、模型、治理到通信网络、数据中心的全链条。浙江在变压器、开关、网络交换机等基础设施产业链已初步成形，这为我国构建主权AI体系提供了有利条件。然而，各国都在加速布局主权AI，token出海正面临日益严峻的政策壁垒，我们必须做好"两面布局"：既要坚持自主主权路线，又要积极向全球输出中国的技术方案。

### 1.2 漏洞发现与修复的"剪刀差"成为战略风险

当前网络安全领域存在一个极为严峻的结构性矛盾：攻击速度快、修复速度慢的不对称性格局正持续加剧。据武汉大学王骞教授团队的研究数据，安全领域AI发现的漏洞打补丁率不到1%。这意味着，每发现100个漏洞，只有不到1个能够得到有效修复。这种"剪刀差"现象正在成为国家网络安全的重大战略风险。AI辅助漏洞修复将是网安界实现弯道超车的历史性机会。如果我们能够将AI技术大规模应用于漏洞修复流程，不仅可以大幅提升修复效率，更能在这一新兴赛道上建立国际领先优势。

### 1.3 国内能力差距持续拉大，窗口期有限

我刚从上海AI实验室闭门会议和英国DeepMind交流回来，带回的信息令人警醒。DeepMind拥有约6000名研究人员，但他们坦言自己的技术成果与Claude仍存在明显差距。更值得关注的是，DeepMind投入了4000人专门攻关coding能力提升，并将相关能力整合到基础模型中。国外头部大公司在这方面的投入"非常非常强"。

上海人工智能实验室杨珉教授的研究数据显示，到2025年末，国内外基础模型在网络安全能力方面的差距已达到30%-40%（以千问、Kimi等对比OpenAI Codex衡量）。这一差距如果不能在短期内有效缩小，将直接影响我国在网络空间安全领域的战略主动权。

## 二、关键挑战

### 2.1 高质量攻防训练数据严重匮乏

经过深入分析，我认为国内AI安全发展面临的最核心瓶颈是高质量网安攻防数据的严重不足。无论是预训练、后训练还是模型蒸馏，都需要大量高质量的实战数据作为支撑。西方在这一领域具有明显优势，我国如果不能尽快建立自主的高质量攻防数据集，AI安全能力的持续提升将成为无源之水。这一挑战与主权AI全链条自主的战略需求高度契合，必须在数据层面实现真正的自主可控。

### 2.2 模型内生安全机制尚未突破

我在研究中发现，模型的安全相关参数约占整体参数的3.5%。通过对这3.5%参数进行精准识别和定向优化，再进行下游任务微调，模型的性能下降并不明显。这一发现为内生安全机制的研究指明了方向。真正的内生安全应当实现三重目标：可观测、可干预、在不下降性能的前提下体现安全属性。目前这些技术路径尚未完全打通，亟需持续的基础研究投入。

### 2.3 信创适配体系亟待完善

在推进国产化替代过程中，我亲身经历了信创适配的紧迫挑战。DeepSeek V4在华为昇腾芯片上的官方镜像版本（基于MindIE MLA加MAA架构）实际上无法正常运行。这一案例深刻说明，国产硬件芯片的整套适配是一个系统性的工程挑战，而非简单的技术移植问题。值得欣慰的是，浙江大学已率先实现万卡集群DeepSeek V4满血版后训练，成为全国首个完成此项工作的单位，积累了重要经验。这些实践经验表明，我国在技术能力上并不欠缺，关键在于如何建立完善的适配体系和生态。

### 2.4 复合型高端人才严重短缺

杨珉教授提出的"三种复合团队需求"让我深感认同：真正有效的网络安全AI研究团队，需要同时具备AI模型理解能力、安全攻防实战经验、系统级技术实现能力。这三种能力的复合型人才极为稀缺。当前高校培养体系仍以单一学科为主，学科之间的壁垒尚未打破。培养真正能够胜任AI安全研究任务的复合型人才，需要从根本上改革现有培养模式，建立跨学科协同机制。

## 三、对策建议

### 3.1 设立AI赋能漏洞智能修复专项

建议国家自然科学基金委设立"AI赋能漏洞智能修复"专项，聚焦以下方向：一是构建高质量网络安全攻防数据集，建立数据采集、标注、共享的标准化体系；二是研发基于大语言模型的漏洞自动修复系统，重点突破代码理解、修复策略生成、补丁验证等关键技术；三是建立漏洞修复效果评估基准，推动技术成果的规范化评估。该专项可参照我在军方项目中积累的实战经验，将AI漏洞挖掘与AI漏洞修复作为一个完整的闭环进行研究，切实提升我国网络安全的主动防御能力。

### 3.2 布局模型内生安全与安全底座研究

建议在现有AI研究体系中单列"内生安全机理"研究方向，重点支持以下研究：一是深入研究安全参数的优化机制，探索在不显著影响模型性能前提下的安全增强路径；二是研发可观测、可干预的内生安全评测框架，为安全机制的有效性评估提供科学依据；三是推进开源与闭源并行的安全研究策略，在开源社区中繁荣内生安全生态，同时在闭源体系中投入更多基础研究，形成自主可控的技术底座。

### 3.3 加快复合型网安AI团队建设

建议从以下三个层面推进复合型人才培养：一是改革研究生培养模式，鼓励计算机科学、网络空间安全、人工智能等学科联合培养，设立交叉学科项目；二是建立产学研协同创新平台，让高校研究团队与头部企业、安全厂商形成紧密合作；三是设立"AI安全卓越人才"计划，为具备三种复合能力的顶尖人才提供长期稳定支持，同时建立符合交叉领域特点的评价机制。

### 3.4 前瞻布局远端AI安全风险管控

杨珉教授提出的"四个远端红线风险"——网络自主渗透、说服欺骗诱导、生化武器教唆、AI自我繁殖——需要引起高度警觉。这些风险虽看似遥远，但随着模型能力持续提升，其现实威胁正在加速逼近。建议基金委设立前瞻性研究课题，组织力量研究这些远端风险的演化机理、防范策略和应急机制，同时加强国际学术交流，在全球AI安全治理中发出中国声音、贡献中国方案。

## 四、结语

综上所述，AI安全基础设施建设是一项关乎国家网络空间安全的战略性工程。我深切感受到，当前正是抢抓机遇、缩小差距的关键窗口期，刻不容缓。作为一名从事网络空间安全研究二十余年的科研工作者，我愿意充分发挥浙江大学区块链与数据安全全国重点实验室的平台优势，带领团队在AI赋能网络安全这一领域持续深耕，为国家AI安全基础设施建设贡献智慧和力量。

恳请国家自然科学基金委予以审慎考虑，如需进一步论证或配合相关工作，我随时准备接受安排。

此致

敬礼

**任 奎**
**浙江大学**
**二〇二六年四月**
