2026守己利他-智能时代做负责任的技术白皮书_70页_5mb

> **来源：[研报客](https://pc.yanbaoke.cn)** # 《MAKE SAFE AI》文档总结 ## 核心内容 《MAKE SAFE AI》聚焦于人工智能技术的安全治理，强调“守己、利他、合作”三大核心原则，倡导构建安全、可信、可持续发展的AI生态。文档系统阐述了阿里巴巴集团及其上海人工智能实验室在AI安全治理方面的实践与探索，包括模型安全体系构建、开源生态建设、安全评测与内生安全技术等。 ## 主要观点 1. **AI安全是发展的必要前提** AI技术的快速发展带来了前所未有的安全挑战，必须以“守己”为出发点，构建全面、动态、可进化的安全体系，以保障技术的可持续发展与社会信任。 2. **开源是推动AI安全与普惠的重要路径** 开源不仅降低了技术门槛，还通过社区协作、代码透明与敏捷反馈，促进了安全知识的共享与治理能力的提升，构建了一个多方协同、信息透明的AI治理生态。 3. **安全需要多方协作与治理机制** AI安全治理需要政府、企业、研究机构与国际社会的共同参与，通过标准共建、跨国对话与协同共治，实现安全与性能的平衡发展。 4. **安全技术需与AI技术同步演进** 安全技术不能滞后于AI能力的提升，必须在模型的全生命周期中进行深度介入，从数据、算法、架构等层面构建内生安全能力。 ## 关键信息 ### 2025年重要进展 - 开源Qwen3-Next、Qwen3-VL、Qwen3-Omni、Qwen3Guard等模型。 - Owen取得大规模预训练模型（文本生成功能）安全认证。 - Wan首批通过AIGC标识测评。 - 阿里云通过ISO42001人工智能管理体系认证。 - Wan大模型通过大模型备案。 ### 2024年重要进展 - 开源Qwen3-Coder、Wan2.2等模型。 - 阿里巴巴大模型通过大模型备案。 ### 2023年重要进展 - 开源Qwen-7B模型。 ## AI治理知识产品 阿里巴巴连续四年发布人工智能治理知识产品，包括： - 《智能时代做负责任的技术》（2025） - 《大模型技术发展及治理实践报告》（2024） - 《生成式人工智能治理与实践白皮书》（2023） - 《人工智能治理与可持续发展实践白皮书》（2022） 这些白皮书系统阐述了AI治理的路径、理念与实践，推动了行业治理标准的建立与技术实践的深入。 ## 安全与性能的平衡发展 - **AI-45°平衡律**：强调AI性能与安全应协同演进，形成一种动态平衡。 - **多模态与强推理**：AI技术正朝着多模态、强推理方向发展，安全技术也需同步跟进，如理解生成统一建模、视频生成能力、对抗性攻击防御等。 - **评测体系**：构建全面、可度量、可迭代的评测体系，涵盖模型全链路、全模态、全场景，以量化方式评估安全水位并持续优化。 ## 内生安全体系 阿里巴巴通过“评测驱动训练、语料筑基、多阶段安全任务协同”构建了内生安全体系，实现从“知道安全”到“偏好安全”再到“本能安全”的跃迁。 ### 安全语料的构建 - **可定义**：建立清晰、可操作的安全回应定义，如拒绝、危害说明、替代建议等。 - **可度量**：通过多维度的质量度量体系，量化语料对模型安全能力的提升效果。 - **可迭代**：语料生产需动态更新，基于风险、技术与反馈进行持续优化。 ### 安全训练方法 - **预训练（PT）**：通过数据筛选与清洗，为模型打下安全知识基础。 - **有监督微调（SFT）**：通过高质量“Query-Answer”对，教会模型在特定情境下生成安全回应。 - **直接偏好优化（DPO）**：通过正负样本对比，使模型内化人类安全偏好，实现“偏好安全”。 - **组相对策略优化（GRPO）**：通过组内比较机制，优化模型安全策略，实现“本能安全”。 ## 技术与治理的融合 - **安全与智能的辩证关系**：安全与智能并非对立，而是相辅相成，共同推动AI技术的可持续发展。 - **技术手段与治理理念结合**：通过红队评测、数字水印、合成识别等技术手段，实现对AI应用的全链路安全控制。 - **多方协同治理**：通过政产学研合作，推动AI治理的标准化、制度化与国际化。 ## AI治理的上海经验 上海人工智能实验室作为阿里巴巴的重要合作伙伴，在AI治理方面发挥了关键作用。通过“AI-45°平衡律”、“可信AGI”等技术理念，推动了AI安全与性能的协同发展，构建了具有前瞻性的治理范式。 ## 未来展望 阿里巴巴致力于构建一个更安全、更可信、更负责任的AI生态，推动AI技术在全球范围内服务人类社会。通过开源、标准共建、跨国合作，阿里巴巴期望成为全球AI治理的推动者与贡献者。 ## 结语 《MAKE SAFE AI》不仅是一份技术白皮书，更是阿里巴巴在AI安全治理领域持续探索的系统性成果。它体现了企业对技术伦理的深刻思考，也展示了在智能时代，负责任的技术创新与治理实践的重要性。