> **来源:[研报客](https://pc.yanbaoke.cn)** # 《MAKE SAFE AI》文档总结 ## 核心内容 《MAKE SAFE AI》聚焦于人工智能技术的安全治理,强调“守己、利他、合作”三大核心原则,倡导构建安全、可信、可持续发展的AI生态。文档系统阐述了阿里巴巴集团及其上海人工智能实验室在AI安全治理方面的实践与探索,包括模型安全体系构建、开源生态建设、安全评测与内生安全技术等。 ## 主要观点 1. **AI安全是发展的必要前提** AI技术的快速发展带来了前所未有的安全挑战,必须以“守己”为出发点,构建全面、动态、可进化的安全体系,以保障技术的可持续发展与社会信任。 2. **开源是推动AI安全与普惠的重要路径** 开源不仅降低了技术门槛,还通过社区协作、代码透明与敏捷反馈,促进了安全知识的共享与治理能力的提升,构建了一个多方协同、信息透明的AI治理生态。 3. **安全需要多方协作与治理机制** AI安全治理需要政府、企业、研究机构与国际社会的共同参与,通过标准共建、跨国对话与协同共治,实现安全与性能的平衡发展。 4. **安全技术需与AI技术同步演进** 安全技术不能滞后于AI能力的提升,必须在模型的全生命周期中进行深度介入,从数据、算法、架构等层面构建内生安全能力。 ## 关键信息 ### 2025年重要进展 - 开源Qwen3-Next、Qwen3-VL、Qwen3-Omni、Qwen3Guard等模型。 - Owen取得大规模预训练模型(文本生成功能)安全认证。 - Wan首批通过AIGC标识测评。 - 阿里云通过ISO42001人工智能管理体系认证。 - Wan大模型通过大模型备案。 ### 2024年重要进展 - 开源Qwen3-Coder、Wan2.2等模型。 - 阿里巴巴大模型通过大模型备案。 ### 2023年重要进展 - 开源Qwen-7B模型。 ## AI治理知识产品 阿里巴巴连续四年发布人工智能治理知识产品,包括: - 《智能时代做负责任的技术》(2025) - 《大模型技术发展及治理实践报告》(2024) - 《生成式人工智能治理与实践白皮书》(2023) - 《人工智能治理与可持续发展实践白皮书》(2022) 这些白皮书系统阐述了AI治理的路径、理念与实践,推动了行业治理标准的建立与技术实践的深入。 ## 安全与性能的平衡发展 - **AI-45°平衡律**:强调AI性能与安全应协同演进,形成一种动态平衡。 - **多模态与强推理**:AI技术正朝着多模态、强推理方向发展,安全技术也需同步跟进,如理解生成统一建模、视频生成能力、对抗性攻击防御等。 - **评测体系**:构建全面、可度量、可迭代的评测体系,涵盖模型全链路、全模态、全场景,以量化方式评估安全水位并持续优化。 ## 内生安全体系 阿里巴巴通过“评测驱动训练、语料筑基、多阶段安全任务协同”构建了内生安全体系,实现从“知道安全”到“偏好安全”再到“本能安全”的跃迁。 ### 安全语料的构建 - **可定义**:建立清晰、可操作的安全回应定义,如拒绝、危害说明、替代建议等。 - **可度量**:通过多维度的质量度量体系,量化语料对模型安全能力的提升效果。 - **可迭代**:语料生产需动态更新,基于风险、技术与反馈进行持续优化。 ### 安全训练方法 - **预训练(PT)**:通过数据筛选与清洗,为模型打下安全知识基础。 - **有监督微调(SFT)**:通过高质量“Query-Answer”对,教会模型在特定情境下生成安全回应。 - **直接偏好优化(DPO)**:通过正负样本对比,使模型内化人类安全偏好,实现“偏好安全”。 - **组相对策略优化(GRPO)**:通过组内比较机制,优化模型安全策略,实现“本能安全”。 ## 技术与治理的融合 - **安全与智能的辩证关系**:安全与智能并非对立,而是相辅相成,共同推动AI技术的可持续发展。 - **技术手段与治理理念结合**:通过红队评测、数字水印、合成识别等技术手段,实现对AI应用的全链路安全控制。 - **多方协同治理**:通过政产学研合作,推动AI治理的标准化、制度化与国际化。 ## AI治理的上海经验 上海人工智能实验室作为阿里巴巴的重要合作伙伴,在AI治理方面发挥了关键作用。通过“AI-45°平衡律”、“可信AGI”等技术理念,推动了AI安全与性能的协同发展,构建了具有前瞻性的治理范式。 ## 未来展望 阿里巴巴致力于构建一个更安全、更可信、更负责任的AI生态,推动AI技术在全球范围内服务人类社会。通过开源、标准共建、跨国合作,阿里巴巴期望成为全球AI治理的推动者与贡献者。 ## 结语 《MAKE SAFE AI》不仅是一份技术白皮书,更是阿里巴巴在AI安全治理领域持续探索的系统性成果。它体现了企业对技术伦理的深刻思考,也展示了在智能时代,负责任的技术创新与治理实践的重要性。