# 关于加快推进AI安全与主权基础设施建设的建议

国家自然科学基金委员会信息科学部：

当前，以大语言模型为代表的新一代人工智能技术正在深刻重塑网络安全领域的攻防格局。以Anthropic Claude Mythos Preview和OpenAI GPT-5.3-Codex为代表的前沿AI系统，已展现出自主发现零日漏洞、构建复杂攻击链的卓越能力，标志着网络空间安全进入"AI对抗AI"的新阶段。这一代际跃迁既为我国网络安全防御能力建设提供了历史性机遇，也带来了前所未有的战略风险挑战。基金委信息学部作为我国信息科学基础研究的战略布局者，有责任也有能力在这一关键时期发挥引领作用。本报告基于公开权威信息，综合研判当前形势与问题，提出对策建议，供决策参考。

## 一、形势与问题

### 1.1 AI重塑网络攻防格局

以2026年为节点，网络安全领域正经历从"人力对抗"向"AI对抗"的根本性转变。Anthropic于2026年4月7日发布的Claude Mythos Preview模型，在SWE-bench Pro测试中取得77.8%的得分，而其前代产品Claude Opus 4.6仅为53.4%，能力提升幅度接近24个百分点。更值得关注的是，该模型在未经专项安全训练的情况下，自主发现了覆盖所有主流操作系统和浏览器的数千个零日漏洞，漏洞发现数量较前代模型提升约90倍。

具体案例表明，AI驱动的高危漏洞挖掘已进入实用化阶段。Claude Mythos Preview发现了OpenBSD系统中隐藏长达27年的远程崩溃漏洞，并成功串联Linux内核多个微小漏洞构建完整权限提升攻击链，展示了AI在复杂漏洞链构建方面的突破性能力。同样，OpenAI于2026年1月发布的GPT-5.3-Codex，首次被官方明确标记为"High"级网络安全能力，可自动化发现零日漏洞，并能够突破企业级防火墙、入侵检测系统等多层防护。

2026年全球AI网络安全市场规模已达1711亿元人民币，其中中国市场规模达514亿元。网络攻击量同比激增70%，检测窗口期不断缩小，安全事件响应时间被压缩至以分钟计。这表明，AI赋能的网络攻击已在全球范围内形成规模效应，传统防御体系面临系统性挑战。

### 1.2 漏洞发现与修复的"剪刀差"成为核心战略风险

在AI赋能漏洞发现能力急剧提升的同时，漏洞修复能力却严重滞后，二者之间形成日益扩大的"剪刀差"，成为网络空间安全领域的核心战略风险。

从技术现状看，Google安全工程团队利用Gemini模型实现15%的sanitizer漏洞自动修复，这一比例虽具有里程碑意义，但距离实用化仍有显著差距。AI驱动的漏洞发现已实现"机器速度"，而漏洞修复仍停留在"人工速度"阶段。这一不对称性正在被AI技术进一步放大：攻击方只需找到一个可利用漏洞即可达成目标，而防守方却需要修补所有潜在漏洞。

Anthropic的数据显示，尽管Claude Mythos Preview能够发现大量漏洞，但漏洞实际修复率不到1%。这意味着，AI的漏洞发现能力正在以前所未有的速度扩大"未修复漏洞池"，为攻击者提供了更加充裕的攻击窗口。这一态势若不及时扭转，将使网络防御陷入被动挨打的战略困境。

从攻防博弈角度分析，AI技术正在从根本上改变安全攻防的成本结构。对攻击者而言，AI大幅降低了发现和利用漏洞的技术门槛，使高级持续性威胁（APT）能力从少数国家级行为体向更广泛的威胁主体扩散；对防御者而言，AI目前主要增强的是攻击端能力，而非防御端能力，这种不对称格局加剧了战略风险。

### 1.3 国内能力差距持续拉大

在AI安全领域，我国正面临与先进国家差距持续扩大的严峻态势。数据显示，2024年末国内外基础模型在网安能力方面的差距约为1-2%，尚处于可控范围；但到2025年末，这一差距已显著拉大，阿里千问、Moonshot Kimi等国内头部模型与OpenAI Codex的能力差距已达30-40%，部分指标差距甚至更大。

与此同时，攻击端的威胁却在加速增长。国内某头部模型已在漏洞挖掘领域展现出显著加速能力，操晓春团队利用该模型，一周即可完成原本需要1至2个月的高危零日漏洞完整挖掘。这意味着，国内外攻击能力的差距正在快速收窄，甚至在某些方面实现局部超越，而防御能力的差距却在持续扩大。

从算力基础设施角度看，浙江大学任奎团队率先实现万卡集群DeepSeek V4满血版后训练，为信创适配积累了重要经验，但距离支撑大规模AI安全应用仍有差距。全球网络安全人才缺口达480万人，国内复合型高端人才更是稀缺，美国DARPA、NSA、NSF等机构早在2023年即已开始系统布局相关领域研究，我国在后发劣势下面临追赶压力。

## 二、关键挑战

### 2.1 高质量攻防训练数据严重匮乏

AI安全模型的有效训练依赖于海量高质量的攻防实战数据，而这一数据基础设施在我国严重不足。与传统网络安全数据集不同，AI安全训练数据需要具备以下特征：覆盖多操作系统、多架构的漏洞样本；包含完整的漏洞利用链和修复过程；经过严格脱敏处理以避免泄露敏感信息；持续更新以跟踪最新攻击手法。

目前，我国在高质量网安AI训练数据方面面临三重困境：一是数据孤岛问题突出，各大安全厂商、科研机构的数据各自封闭，缺乏共享机制；二是数据质量参差不齐，现有公开数据集多为历史漏洞样本，难以反映最新的攻击技术演进；三是数据标注成本高昂，攻防对抗数据的专业性决定了高质量标注需要资深安全专家深度参与。

国际上，Anthropic启动的Project Glasswing项目向合作机构提供1亿美元调用额度，依托Claude Mythos Preview帮助保护全球关键软件基础设施，这一布局本质上是构建以AI为核心的漏洞发现生态和数据积累机制。相比之下，我国在数据基础设施建设方面缺乏系统性的战略投入。

### 2.2 模型内生安全机制尚未突破

当前主流大语言模型在安全能力方面呈现出"能力涌现"与"安全可控"之间的内在张力。一方面，模型通过预训练和微调可以获得强大的漏洞发现能力；另一方面，模型的内生安全机制尚无法有效约束其在安全攻防领域的潜在滥用风险。

从技术层面分析，现有模型内生安全机制存在以下瓶颈：第一，安全对齐的鲁棒性不足，模型在特定提示词或任务场景下可能出现安全边界漂移；第二，对抗样本攻击威胁严峻，攻击者可利用精心构造的输入诱导模型产生有害输出；第三，能力与安全的解耦问题尚未解决，模型的安全约束机制往往以牺牲部分能力为代价。

Anthropic决定不公开发布Claude Mythos Preview模型，转而通过Project Glasswing项目向合作机构提供受控访问，这一决策本身就反映了前沿AI安全模型在"能力释放"与"风险管控"之间的艰难平衡。如何在充分发挥AI安全防御价值的同时，有效防范模型能力被滥用，是当前亟待突破的理论与工程难题。

### 2.3 信创适配体系亟待完善

AI安全能力的落地应用需要与国产硬件、操作系统、基础软件形成深度适配，而当前信创适配体系尚不完善，存在明显的短板。

从硬件层面看，国内万卡以上算力集群的建设和运维经验相对有限，任奎团队在万卡集群DeepSeek V4后训练方面的探索虽具开创性，但距离支撑大规模AI安全应用仍需进一步验证和优化。从软件层面看，主流AI框架和工具链与国产操作系统的适配程度有待提升，安全类AI应用对系统底层调用的要求较高，需要深度定制优化。

更为关键的是，AI安全系统的信创适配不仅是技术问题，更涉及生态构建。Anthropic选择不公开发布Claude Mythos Preview，转而依托合作机构构建封闭生态的策略，提示我们：在AI安全这一高度敏感领域，信创适配需要与生态建设协同推进，形成从基础研究到产业应用的完整闭环。

### 2.4 复合型高端人才严重短缺

AI安全领域对人才提出了前所未有的复合型能力要求，需同时具备AI模型理解、安全攻防实战经验以及系统级技术掌握三种核心能力，而国内此类复合型人才严重短缺。

从能力结构分析，传统网络安全人才多具有安全攻防背景，但缺乏AI系统理论和工程实践经验；AI研究人才则往往专注于模型算法，对网络安全实战缺乏深入理解；而系统级技术人才（如操作系统、编译器方向）又与上述两个领域存在较深的知识鸿沟。三个领域的人才培养路径和知识体系差异显著，复合型人才培养面临天然障碍。

从供给侧看，全球网络安全人才缺口达480万人，我国人才缺口更为突出。美国DARPA于2023年启动的AI网络挑战赛（AIxCC）专门设置网络安全与AI交叉赛题，NSA和NSF持续资助相关交叉领域研究，形成了较为完善的人才培养和储备机制。我国在复合型人才培养方面缺乏系统性的顶层设计和长期投入。

## 三、对策建议

### 3.1 设立"AI赋能漏洞智能修复"专项，作为弯道超车战略抓手

针对漏洞发现与修复"剪刀差"这一核心战略风险，建议基金委信息学部设立"AI赋能漏洞智能修复"专项，将其作为我国在AI安全领域实现弯道超车的战略抓手。

**专项定位与目标**：聚焦漏洞修复的自动化和智能化，以"机器速度"匹配"机器速度"为终极目标，分阶段实现技术突破。近期目标（1-2年）为实现主流类型漏洞修复率达30%以上；中期目标（3-5年）为建立覆盖主要操作系统和基础软件的自动化漏洞修复能力；远期目标（5年以上）为形成具有国际领先水平的智能漏洞修复生态系统。

**重点研究方向**：（1）漏洞修复知识图谱构建与自动推理，梳理漏洞-修复-代码的映射关系，建立可泛化的修复知识库；（2）基于代码大模型的修复候选生成，借鉴Google在sanitizer漏洞修复方面的经验，探索更广泛的漏洞类型自动修复；（3）修复方案的可信验证与安全回归测试，确保自动修复方案不引入新的安全风险；（4）修复效率与成本的优化建模，平衡修复速度与资源消耗。

**实施路径建议**：采用"揭榜挂帅"机制，面向全国优势团队公开招标；设立滚动资助机制，对取得阶段性突破的团队持续支持；建立与头部安全厂商的协同机制，确保研究成果的实用性验证。

### 3.2 布局模型内生安全与AI安全底座研究

针对模型内生安全机制尚未突破的挑战，建议信息学部系统布局模型内生安全与AI安全底座研究，为我国AI安全能力的健康发展提供理论支撑和技术底座。

**核心研究任务**：（1）AI安全能力与安全约束的协同优化机制研究，探索在不显著牺牲安全防御能力的前提下增强模型安全可控性的技术路径；（2）面向安全任务的模型鲁棒性增强，研究提升模型对抗提示词注入、对抗样本攻击等威胁的能力；（3）AI安全模型的可解释性与可审计性，为模型行为的可解释分析和安全审计提供技术支撑；（4）安全类AI模型的评测基准与标准化研究，建立科学、全面、可操作的评测体系。

**基础设施布局**：建议资助建设AI安全模型评测与验证平台，汇聚主流AI安全模型，建立标准化的评测环境和数据集；探索建立AI安全模型的"沙箱"运行环境，为高风险模型的安全评估提供可控实验环境。

**国际合作策略**：在坚持自主可控原则的前提下，适度参与国际AI安全领域的交流合作，及时跟踪前沿动态；依托"一带一路"等多边机制，探索与友好国家在AI安全数据和标准方面的合作。

### 3.3 加快复合型网安AI团队建设

针对复合型高端人才严重短缺的瓶颈，建议信息学部创新人才培养机制，加快复合型网安AI团队建设。

**人才培养专项**：设立"AI安全交叉学科人才培养计划"，打破传统学科壁垒，面向计算机科学、网络空间安全、人工智能等相关学科的研究生和青年学者，资助跨学科访学、联合培养、实习实训等多元化培养方式。具体措施包括：设立专项奖学金，资助优秀学生进入AI安全交叉领域；建立校企联合培养机制，安排研究生到头部安全企业和科研机构实习；组织暑期学校和冬令营，邀请国内外顶尖专家授课。

**团队建设计划**：实施"AI安全创新团队支持计划"，资助具有交叉背景的优秀科研团队，围绕重大科学问题开展联合攻关。建议重点支持三类团队：一是拥有AI和安全双重背景的成熟团队，二是安全团队引入AI专家的转型团队，三是AI团队强化安全能力的拓展团队。

**评价机制创新**：在人才评价方面，建立符合AI安全交叉领域特点的评价标准，综合考量科研人员在AI和安全两个维度的贡献；在基金委的项目评审和人才选拔中给予适度倾斜，打破单一维度的片面具化。

### 3.4 前瞻布局远端AI安全风险管控

着眼长远，建议信息学部前瞻布局远端AI安全风险管控研究，防范AI安全技术发展带来的系统性风险。

**风险评估与预警研究**：（1）AI安全能力扩散风险评估，研究AI漏洞发现和利用能力的传播路径和影响范围，识别高风险场景和主体；（2）AI安全军备竞赛风险建模，分析主要国家在AI安全领域的投入态势和竞争格局，为国家决策提供参考；（3）AI安全技术滥用风险预警，建立AI安全威胁情报共享机制，实时跟踪全球AI安全态势。

**治理机制研究**：（1）AI安全技术的国际治理框架，探索在联合国框架下或通过多边机制建立AI安全技术的行为规范；（2）AI安全能力的出口管制与共享机制研究，平衡技术保护与技术合作的关系；（3）主权AI与全球AI安全治理的协同路径，借鉴加拿大SCIP计划、新加坡和东盟国家主权AI建设经验，为我国主权AI战略提供支撑。

**伦理与法律问题研究**：AI安全技术在攻防两端的广泛应用引发深刻的伦理和法律问题。建议设立相关研究课题，探索AI安全研究的应用边界、责任归属、透明度要求等伦理准则，以及AI驱动网络攻击的法律定性和责任追究等法律问题。

## 四、结语

AI技术正在从根本上重塑网络空间安全的攻防格局，这一变革既蕴含着通过AI赋能实现网络安全能力跃升的历史性机遇，也带来了漏洞发现与修复剪刀差持续扩大、国际竞争差距拉大、复合型人才严重短缺等严峻挑战。基金委信息学部作为我国信息科学基础研究的战略布局者，在AI安全这一关键新兴交叉领域肩负着引领方向、培养人才、支撑创新的重要使命。

本报告提出的四项对策建议——设立AI赋能漏洞智能修复专项、布局模型内生安全与AI安全底座研究、加快复合型网安AI团队建设、前瞻布局远端AI安全风险管控——构成了一个从近期突破到长远布局的完整战略框架。建议信息学部将AI安全与主权基础设施建设纳入"十五五"规划重点方向，系统部署相关基础研究和人才培养工作。

国家自然科学基金委员会信息科学部长期致力于推动我国信息科学基础研究的发展，在AI安全这一关乎国家网络空间主权的战略性领域，具有不可替代的引领作用。本报告课题组由来自网络空间安全、人工智能、计算机系统等领域的资深专家组成，在相关方向具有深厚的研究积累和丰富的实践经验。我们郑重表示，愿意在基金委的指导和支持下，承担相关重点项目的策划、组织和实施工作，为我国AI安全与主权基础设施建设贡献智慧和力量。

当前正值全球AI安全格局重塑的战略窗口期，恳请相关部门高度重视本报告所反映的情况和建议，及时研究部署相关工作，以确保我国在网络空间安全领域不落于人后，切实维护国家网络主权和安全利益。

---

**报告课题组**

**二〇二六年四月**
