守己利他_—_智能时代做负责任_的技术_70页_29mb

> **来源：[研报客](https://pc.yanbaoke.cn)** # MAKE SAFE AI 项目总结 ## 核心内容 阿里巴巴集团致力于构建安全、可信、负责任的人工智能生态系统，强调“守己、利他、合作”三大核心理念。项目以“利守他己”为指导思想，旨在推动AI技术向善发展，保障AI在产业应用中的安全性和可控性，同时促进全球AI治理的协同发展。 ## 主要观点 - **安全与发展的辩证统一**：AI的安全性与创新性并非对立，而是相辅相成，需在技术发展过程中同步推进安全治理。 - **开源推动生态共建**：阿里巴巴持续开源AI模型，如Qwen系列、Wan系列等，降低技术门槛，促进技术普惠与生态繁荣。 - **长期主义安全建设**：阿里巴巴强调以长期主义为指导，构建覆盖模型全生命周期的安全体系，提升AI的可信度和可控性。 - **多方协同治理机制**：通过政产学研合作，阿里巴巴与上海人工智能实验室、中国电子技术标准化研究院等机构共同推进AI治理的实践与研究。 - **AI治理的上海经验**：上海人工智能实验室作为重要参与者，推动AI技术发展与安全治理的深度融合，为全球提供治理范式参考。 ## 关键信息 ### 模型与技术发展 - **2023年**：开源Qwen-7，Qwen大模型通过大模型备案。 - **2024年**：开源Qwen1.5、Qwen2系列，Wan2.2通过AIGC标识测评。 - **2025年**：开源Qwen3-Coder、Qwen3-VL、Qwen3-Omni、Qwen3Guard等模型，Qwen取得大规模预训练模型安全认证，阿里云通过ISO42001人工智能管理体系认证，Wan通过大模型备案。 ### AI治理实践 - **2022年**：发布《人工智能治理与可持续发展实践白皮书》，系统总结治理实践。 - **2023年**：发布《生成式人工智能治理与实践白皮书》，提出敏捷治理、协同共治理念。 - **2024年**：发布《大模型技术发展及治理实践报告》，强调全生命周期治理与多角色责任划分。 - **2025年**：发布《智能时代做负责任的技术》，系统阐述“守己、利他、合作”三大治理路径。 ### 安全治理体系 - **评测牵引、内外兼备、能力全面、技术领先**：阿里巴巴构建了覆盖模型训练、部署与应用的全生命周期安全体系。 - **内生安全**：通过数据与算法协同设计，将安全能力内化于模型之中，使其具备“本能安全”。 - **外层护栏**：部署规则驱动或模型辅助的过滤机制，防止AI被滥用。 ### 安全语料与训练机制 - **多阶段协同训练**：预训练（PT）、有监督微调（SFT）、直接偏好优化（DPO）、组相对策略优化（GRPO）等阶段，共同构建模型安全能力。 - **可定义、可度量、可迭代**：安全语料需具备清晰定义、量化评估和持续更新能力，以适应AI技术的快速发展。 - **安全QA对构建**：高质量安全语料是模型安全能力的基础，需覆盖多种风险类型与应用场景。 ### 多模态与强推理挑战 - **多模态安全**：针对文本、图像、音频、视频等多模态内容，构建统一的安全评测体系，提升模型对不同模态内容的理解与生成能力。 - **强推理安全**：关注推理过程中的错误累积、幻觉等风险，推动更精细的内生安全加固。 ## 治理框架与技术路径 - **AI治理的四大原则**：守己、利他、合作、安全。 - **评测体系**：构建全面、可度量、可持续迭代的评测体系，帮助识别与评估模型在不同场景下的安全表现。 - **安全技术路径**：包括红队测试、数字水印、合成识别、神经元分析等，提升AI治理能力。 - **AI安全生态**：构建“海洋安全生态”，以牡蛎、八爪鱼、海豚、鲨鱼、水母、海带等象征性技术组件，实现多维度、多层级的安全防御。 ## 未来展望 阿里巴巴持续推动AI治理知识基础设施的建设，通过发布白皮书、开源模型、参与国际对话等方式，为全球AI治理贡献中国智慧与技术能力。AI治理不仅是技术问题，更是社会责任的体现，需以长期主义思维推动AI技术向善发展，构建安全、公平、包容的AI生态系统。 ## 编写与合作 - **编写组**：由阿里巴巴集团、上海人工智能实验室、阿里云、达摩院等单位组成，涵盖多个领域专家。 - **指导委员会**：包括邵晓锋、闻佳、俞思瑛、钱磊、胡侠等高层管理者与专家。 - **特别鸣谢**：多位技术人员与研究人员对项目提供了重要支持。 ## 结语 通过“守己、利他、合作”的治理路径，阿里巴巴与上海人工智能实验室等机构正推动AI治理从“让AI变得安全”到“打造安全的AI”，为全球AI技术发展提供负责任、可持续的范式。