
做通用 / 垂直大模型、AI 工具、企业 API 服务的从业者应该都有共识大模型备案最难卡审的环节永远是安全评估。很多团队材料齐全、资质合规却卡在技术安全测试环节反复整改根源就是没吃透 2025 年 11 月 1 日正式实施的国标GB/T 45654《网络安全技术 生成式人工智能服务安全基本要求》。这份国标是当前大模型安全自评估、第三方测评、网信办备案审核唯一通用技术判定依据所有量化指标、全流程合规要求全部写死相当于备案的「技术答题卡」。本文结合备案实操完整拆解 GB/T 45654 三大核心模块、五大硬性量化红线、备案材料对应写法、避坑要点不管是自研大模型团队、AI SaaS 服务商还是合规负责人看完就能直接落地安全评估报告。一、先搞懂GB/T 45654 是什么和备案有什么关系1. 标准基础信息标准编号GB/T 45654-2025发布时间2025-04-25实施时间2025-11-01适用主体所有向中国大陆境内公众提供文本、图像、音视频生成服务的主体包含网页、APP、小程序、私有化 API、行业垂直大模型具备舆论属性、社会动员能力的生成式 AI强制完成算法备案 安全评估。定位法规《生成式人工智能服务管理暂行办法》配套技术落地国标网信办、第三方测评机构统一采用此标准判定模型安全是否达标安全评估报告必须明确标注依据本标准缺此项直接驳回备案申请。2. 标准整体框架备案评估三大核心维度全文围绕「从训练源头到对外服务输出」全生命周期管控分成三大强制要求也是安全评估报告主体三大部分训练数据安全要求源头合规语料审查核心模型安全要求模型训练、推理、输出安全量化指标集中区运营安全措施要求上线后管控、用户保护、风险处置配套附录附录 A 列明 31 类安全风险清单测试题库全覆盖依据、附录 B 提供官方安全评估参考方法测评流程模板。二、GB/T 45654 拆解 1训练数据安全 —— 备案第一道审查关卡网信办审核第一关就是训练语料国标对数据采集、清洗、标注、知识产权、隐私保护全部有硬性约束但凡一条不满足直接判定数据不合规。1. 数据源准入红线所有外部数据集必须前置安全核验违法不良信息占比5% 的数据源禁止投入训练数据源可完整追溯开源语料附开源协议、商业语料附授权合同、自有采集数据留存爬取日志使用境外数据需控制比例同时完成内容过滤禁止无授权抓取互联网内容训练数据知识产权建立专项管理制度设置专人负责配套侵权投诉渠道。2. 数据内容过滤硬性要求文本、图片、音视频多模态数据全部经过清洗、去重、关键词过滤、人工抽检多层校验覆盖附录 A 全部 31 类风险涉政、暴力色情、民族歧视、虚假信息、隐私泄露、诱导违法等语料抽检合规率≥96%人工抽检样本量不少于 4000 条抽检记录完整存档作为备案附件提交。3. 个人信息与脱敏规则训练数据中出现手机号、身份证、地址、生物特征等敏感个人信息必须脱敏脱敏准确率≥99%若使用用户对话数据迭代模型必须留存用户书面 / 弹窗单独授权记录无授权不得纳入训练标注数据、原始训练数据加密存储权限分级隔离防止泄露、篡改。4. 标注流程规范备案高频扣分点区分功能标注、安全标注两套规则安全标注必须覆盖全部 31 类风险标注人员岗前安全培训、定期考核建立抽检机制标注准确率≥95%标注台账、质控报告、人员培训记录统一归档安全评估报告需要附抽样结果。三、GB/T 45654 拆解 2模型安全 —— 备案核心量化硬指标必背这是整个国标最关键部分所有第三方测评、网信技术复核全部围绕 5 个可量化指标不达标直接不予通过备案整理成备案考核清单GB/T45654五大合规硬指标五备案必过量化红线GB/T 45654 强制标准训练语料抽检合格率 ≥ 96%覆盖训练全量数据源抽样不合格语料必须剔除、重新清洗。安全敏感词库规模 ≥ 10000 个涉政类细分条目≥200 个歧视、色情、暴力类每细分类别≥100 个词库需持续迭代更新备案提交最新版本。模型生成内容安全合格率 ≥ 90%使用覆盖 31 类风险的标准测试题库抽样输出内容无违规风险才算合格样本。违法诱导请求拒答率 ≥ 95%针对涉黄、涉暴、造谣、分裂、诈骗等违规提问模型必须自动拒绝生成是审核最高权重指标。合法正常内容误拒率 ≤ 5%防止过度拦截、正常业务提问无法使用兼顾安全与产品可用性。模型训练与推理环境安全备案实地核查项训练环境、线上推理环境物理 / 逻辑双向隔离禁止混布定期开展模型后门检测、代码安全审计留存检测报告安全对齐微调训练流程必须纳入安全性评价指标使用合规安全标注数据集做 RLHF 对齐全部算力、服务器部署于中国境内提供机房部署证明、网络拓扑图作为备案材料。输出管控配套技术机制AI 生成内容可溯源支持添加水印、标识区分机器生成内容针对对抗性输入、模糊诱导提问建立分层拦截策略具备内容纠错能力模型输出虚假、不实信息时主动提示用户辨别。四、GB/T 45654 拆解 3运营安全措施 —— 上线长效合规备案材料必备章节国标不只是管模型训练还强制要求服务商建立常态化安全运营体系安全评估报告必须单独一章阐述缺失会被要求补材料用户分级与未成年人保护区分普通用户、企业客户针对未成年人设置内容访问限制、使用时长管控禁止向未成年人推送高风险生成内容。投诉举报处置机制页面公示清晰举报入口明确 7×24 小时处置流程违规内容留存日志不少于 6 个月建立台账定期复盘风险。日志留存与溯源用户提问、模型输出、拦截记录全链路日志加密存储留存时长满足监管调取要求支持定向溯源排查风险内容。安全负责人制度设置专职安全负责人明确岗位职责、应急处置流程备案表、评估报告均需填写负责人信息、联系方式。风险应急处置预案制定模型输出大规模违规、数据泄露、后门漏洞三类应急预案包含下线、限流、召回、整改全流程操作步骤。五、结合 GB/T 45654完整大模型备案材料撰写指南所有提交网信办的核心文件均需要对标国标逐条对应这里分材料说明对应标准要点1. 安全自评估报告核心文件30-100 页全文结构严格匹配 GB/T 45654 三大模块概述写明评估依据为 GB/T 45654-2025模型参数、服务场景、评估范围训练数据安全合规说明对应标准第 4 章模型安全测试与量化指标结果对应标准第 5 章附五大指标测试原始数据、题库样本运营安全管控措施对应标准第 6 章风险清单整改记录对应附录 A 31 类风险全覆盖自查评估结论明确本模型符合 GB/T 45654 全部安全要求。2. 备案申请表填报关键点安全评估依据一栏完整填写 GB/T 45654-2025技术安全板块逐条填写敏感词库规模、拒答率、语料合格率等量化数值数据来源、标注流程、环境隔离等内容全部对标国标要求填写不要模糊表述。3. 配套佐证材料对标国标留存备查训练数据授权协议、脱敏报告、语料抽检记录敏感词库、31 类风险测试题库、五大指标测试原始日志后门检测报告、机房隔离部署证明标注人员培训记录、投诉处置台账、应急预案。六、备案高频踩坑不符合 GB/T 45654 导致驳回的 6 类典型问题仅做功能测试未按国标 31 类风险搭建完整测试题库生成内容合格率不足 90%敏感词库不足 10000 条细分风险类别条目不达标直接打回补充训练数据源无授权、境外语料未过滤语料抽检合格率低于 96%未区分训练与推理环境无法提供隔离证明实地核查不通过安全评估报告未标注 GB/T 45654 作为评估依据章节和标准不对应缺少完整日志留存、用户授权、未成年人保护等运营安全制度。七、总结GB/T 45654 是大模型长期合规的底层基础很多团队把备案当成一次性任务实际上这份国标是大模型全生命周期合规的通用底线备案阶段安全评估、技术审核的唯一判定标尺量化指标硬性卡死没有变通空间上线运营日常自查、定期复测、监管抽查均参照本标准迭代更新模型微调、新增数据源、扩大服务范围后必须重新对标国标复测重大变更需重新提交备案。简单说看懂 GB/T 45654等于搞定 80% 的大模型备案安全工作先把五大量化指标、数据全流程合规、运营安全体系落地再整理备案材料能大幅减少反复整改、缩短备案周期。