> **来源:[研报客](https://pc.yanbaoke.cn)** # MAKE SAFE AI 项目总结 ## 核心内容 阿里巴巴集团致力于构建安全、可信、负责任的人工智能生态系统,强调“守己、利他、合作”三大核心理念。项目以“利守他己”为指导思想,旨在推动AI技术向善发展,保障AI在产业应用中的安全性和可控性,同时促进全球AI治理的协同发展。 ## 主要观点 - **安全与发展的辩证统一**:AI的安全性与创新性并非对立,而是相辅相成,需在技术发展过程中同步推进安全治理。 - **开源推动生态共建**:阿里巴巴持续开源AI模型,如Qwen系列、Wan系列等,降低技术门槛,促进技术普惠与生态繁荣。 - **长期主义安全建设**:阿里巴巴强调以长期主义为指导,构建覆盖模型全生命周期的安全体系,提升AI的可信度和可控性。 - **多方协同治理机制**:通过政产学研合作,阿里巴巴与上海人工智能实验室、中国电子技术标准化研究院等机构共同推进AI治理的实践与研究。 - **AI治理的上海经验**:上海人工智能实验室作为重要参与者,推动AI技术发展与安全治理的深度融合,为全球提供治理范式参考。 ## 关键信息 ### 模型与技术发展 - **2023年**:开源Qwen-7,Qwen大模型通过大模型备案。 - **2024年**:开源Qwen1.5、Qwen2系列,Wan2.2通过AIGC标识测评。 - **2025年**:开源Qwen3-Coder、Qwen3-VL、Qwen3-Omni、Qwen3Guard等模型,Qwen取得大规模预训练模型安全认证,阿里云通过ISO42001人工智能管理体系认证,Wan通过大模型备案。 ### AI治理实践 - **2022年**:发布《人工智能治理与可持续发展实践白皮书》,系统总结治理实践。 - **2023年**:发布《生成式人工智能治理与实践白皮书》,提出敏捷治理、协同共治理念。 - **2024年**:发布《大模型技术发展及治理实践报告》,强调全生命周期治理与多角色责任划分。 - **2025年**:发布《智能时代做负责任的技术》,系统阐述“守己、利他、合作”三大治理路径。 ### 安全治理体系 - **评测牵引、内外兼备、能力全面、技术领先**:阿里巴巴构建了覆盖模型训练、部署与应用的全生命周期安全体系。 - **内生安全**:通过数据与算法协同设计,将安全能力内化于模型之中,使其具备“本能安全”。 - **外层护栏**:部署规则驱动或模型辅助的过滤机制,防止AI被滥用。 ### 安全语料与训练机制 - **多阶段协同训练**:预训练(PT)、有监督微调(SFT)、直接偏好优化(DPO)、组相对策略优化(GRPO)等阶段,共同构建模型安全能力。 - **可定义、可度量、可迭代**:安全语料需具备清晰定义、量化评估和持续更新能力,以适应AI技术的快速发展。 - **安全QA对构建**:高质量安全语料是模型安全能力的基础,需覆盖多种风险类型与应用场景。 ### 多模态与强推理挑战 - **多模态安全**:针对文本、图像、音频、视频等多模态内容,构建统一的安全评测体系,提升模型对不同模态内容的理解与生成能力。 - **强推理安全**:关注推理过程中的错误累积、幻觉等风险,推动更精细的内生安全加固。 ## 治理框架与技术路径 - **AI治理的四大原则**:守己、利他、合作、安全。 - **评测体系**:构建全面、可度量、可持续迭代的评测体系,帮助识别与评估模型在不同场景下的安全表现。 - **安全技术路径**:包括红队测试、数字水印、合成识别、神经元分析等,提升AI治理能力。 - **AI安全生态**:构建“海洋安全生态”,以牡蛎、八爪鱼、海豚、鲨鱼、水母、海带等象征性技术组件,实现多维度、多层级的安全防御。 ## 未来展望 阿里巴巴持续推动AI治理知识基础设施的建设,通过发布白皮书、开源模型、参与国际对话等方式,为全球AI治理贡献中国智慧与技术能力。AI治理不仅是技术问题,更是社会责任的体现,需以长期主义思维推动AI技术向善发展,构建安全、公平、包容的AI生态系统。 ## 编写与合作 - **编写组**:由阿里巴巴集团、上海人工智能实验室、阿里云、达摩院等单位组成,涵盖多个领域专家。 - **指导委员会**:包括邵晓锋、闻佳、俞思瑛、钱磊、胡侠等高层管理者与专家。 - **特别鸣谢**:多位技术人员与研究人员对项目提供了重要支持。 ## 结语 通过“守己、利他、合作”的治理路径,阿里巴巴与上海人工智能实验室等机构正推动AI治理从“让AI变得安全”到“打造安全的AI”,为全球AI技术发展提供负责任、可持续的范式。