> **来源:[研报客](https://pc.yanbaoke.cn)** # 科研智能案例集(2025年) 中国人工智能产业发展联盟 科学智能(AI4S)工作组 2026年1月 # 版权声明 本报告版权属于中国人工智能产业发展联盟科学智能工作组,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国人工智能产业发展联盟科学智能工作组”。违反上述声明者,本工作组将追究其相关法律责任。 # 目录 # 一、科研智能基础平台 3 (一)星河启智科学智能开放平台 3 (二)石景山区AI for Science平台项目 12 # 二、材料研发 20 (一)基于科研智能的高分子材料研发 20 (二)AI自驱动大压铸工艺闭环系统 26 (三)AI赋能特钢研发 1 (四)AI驱动的碳捕集材料研发与验证平台 8 (五)材料显微图像智能分析及应用 15 (六)统一NMR智能解析在化学与材料科学的应用 23 (七)基于科研智能的锂电电解液研发 31 (八)深势科技Piloteye®电池设计智能研发平台 37 (九)基于专用算力的电解液AI数据平台建设 47 (十)基于数理双驱模型组合的二维材料发现 56 # (十一)多模态技术赋能有机分子谱图解析模型研发 60 # 三、工业仿真 64 (一)高速动车组空气动力学智能化仿真大模型-研轮·风驰 64 (二)民用客机超临界翼型函数生成和编辑模型 72 (三)风扇叶轮智能优化设计 77 (四)代理模型在轮胎设计仿真中的应用及仿真自动化 84 (五)ChatCAD生成式辅助工业设计 93 (六)面向高端制造业的多模态交互式预测性智能运维决策支持关键技术 100 (七)基于大数据的色漆漆料优化系统 110 (八)基于MWORKS的具身空间仿真平台 115 # 四、地球科学 130 (一)基于OneScience框架的气象AI大模型并行训练示范案例 130 (二)伏羲系列气象大模型研发项目 136 (三)基于深海基础模型的深海海山数字化智能系统 142 (四)大模型驱动的灾害防御智能体 150 (五)一站式遥感变化监测智能体 156 (六)时空可信验证智能体 161 (七)滑坡隐患关联要素智能识别系统 168 # 五、生物医药 179 (一)人工智能辅助极端耐碱抗体的设计 179 (二)百度PaddleHelix平台针对GPCR难成药靶点的多肽设计系统的构建……185 (三)华为云盘古药物分子大模型助力华中科大快速研制出全球首个利什曼病抑制剂 (四)智慧芽Eureka平台:垂直领域大模型赋能生物医药研发全流程智能化……199 # 六、智慧农业 208 (一)华为云 $\times$ 中国农业科学院联合研发农科大模型 ..... 208 # 七、可控核聚变 215 (一)基于深度强化学习的球形托卡马克等离子体高精度磁控制 215 # 一、科研智能基础平台 # (一)星河启智科学智能开放平台 # 1. 案例实施单位: 上海科学智能研究院、复旦大学、无限光年(上海)技术有限公司 # 2.案例背景: 在科学智能的1.0时代,人工智能主要作为科研的“加速器”,科学家定义重大科学问题并积累领域数据,由AI专业人才针对性设计并优化算法模型,在特定领域取得突破,充分验证了AI赋能科学研究的巨大潜力。随着科学问题复杂度的指数级提升、多模态数据的爆发式增长以及大模型技术的成熟,科学智能正加速迈向2.0时代。2.0时代的核心使命是让AI成为贯穿科学家科研全链条的核心伙伴,直接助力科学家去回答深邃的“科学之问”。科学领域迫切需要功能更强大、使用更便捷的基础设施和协作平台,让科学家能够直接利用平台化的AI工具,低门槛地处理高维异构数据、构建领域大模型、进行智能推理与实验规划,从而更高效地探索未知、验证猜想、发现规律。 # 3.案例概述: 星河启智是智能体原生的全链路科学智能开放平台,致力于加速科学发现,为全球科学家提供覆盖高价值科学数据、开源科学智能模型、面向科研领域的高效智算、干湿实验闭环、多智能体推理规划及多学科众研的全栈基础设施,驱动科学智能进入新纪元。面向科学家、AI工程师及广大开发者提供全链路服务,全面释放人工智能的生产 力,推进跨学科协作、攻坚关键科学问题、大幅加速科学发现,从而服务各个领域和行业。 # 4.行业痛点: 科学智能基础平台面临如下核心挑战:一是高价值科学数据分散成孤岛,整合加工难度大,海量科研数据难以实现标准化沉淀与跨学科复用;二是智算基础设施适配不足,科学智能对智算基础设施提出了有别于大语言模型的新要求,需要满足异构融合、训推一体及多精度计算等多元需求;三是流程割裂化,数据管理、模型训练、实验模拟等环节相互孤立,跨学科协作缺乏支撑,AI难以贯穿科研全链,严重制约科学发现效率;四是技术门槛高,多数平台由技术驱动,界面复杂、流程繁琐,缺乏对领域科学家使用习惯的深度理解,导致“科学家想用不会用”;五是生态封闭性,缺乏开放共享的模型、数据和工具社区,跨机构、跨学科的协作创新受阻,难以形成“众研共创”的创新生态。 # 5.案例详述: 星河启智科学智能开放平台以“AI驱动科研范式重构”为核心理念,围绕科学家科研全流程,构建覆盖数据、模型、算力、实验、推理与协作的全链路基础设施。平台致力于解决科学智能2.0时代中科学家主导科研过程中面临的数据割裂、智算新需求、模型门槛高、实验闭环难、协作效率低等核心痛点,推动科研从“工具辅助”走向“智能伙伴”的新范式。 # (1) 总体思路 星河启智平台以“AI原生、全链路贯通、开放协同”为设计理念,构建六大核心能力模块,形成“数据—模型—算力—实验—智能体—社区”一体化的科研智能闭环,旨在实现三大目标。一是降低科研门槛,通过开箱即用的模型广场、低代码实验编排与智能体辅助,使非AI背景的科学家也能高效开展智能科研。二是贯通科研流程,打通“数据采集—模型训练—干湿实验—结果验证”全链路,实现从假设生成到实验验证的智能闭环。三是构建开放生态,通过众研社区与开源机制,促进跨学科、跨机构协同,推动科学智能成果的快速传播与复用。 # (2) 软件平台 星河启智科学智能开放平台是面向科研全场景的一站式基础软件体系,其核心功能模块包括数据广场、模型广场、启智Lab、AI费米、自主科学探索引擎与众研社区。平台底层构建了统一的异构算力调度引擎与数据基座,实现CPU/GPU资源的弹性管理与海量多模态科学数据的可信治理。模型广场汇聚并管理来自多个学科的预训练模型,支持开箱即用与在线微调。自主科学探索引擎作为平台的智能中枢,内置多智能体框架与工作流编排系统,可自动调度数据、模型与计算资源,驱动“假设—仿真—实验—分析”的科研闭环。众研社区则构建了覆盖项目匹配、协同开发与成果共享的开放科学生态。该平台通过将分散的科研工具链系统性地整合,为科学家提供了贯穿研发全流程的智能伙伴。 图1 星河启智科学智能开放平台 来源:上海科学智能研究院 # (3) 技术方案 星河启智平台的技术方案围绕构建“数据—模型—计算—实验”的智能科研闭环展开。方案实施始于数据与模型资源化,通过区块链技术实现科学数据的可信确权与标准化治理,并将涵盖气象、生物、材料等12+学科的200余个前沿模型资源化,形成开箱即用的模型服务。 图2 星河启智智能平台科学数据集 来源:上海科学智能研究院 核心流程为智能驱动的科研工作流:首先用户可通过自然语言或 可视化方式定义科研问题与约束条件,平台随即调用自主科学探索引擎,自动编排数据处理、模型调用与仿真计算任务,形成可执行的科研流水线。进而实现干湿实验的精准闭环,通过“AI费米”模块连接虚拟仿真与高校、机构的实体实验设备,利用实验灵巧手等自动化装置执行物理实验,并将结果数据实时回传,用于验证AI预测并迭代优化假设。全过程由多智能体系统协同支撑:平台内嵌的专用智能体在统一编排下自主协同,并通过众研社区机制融汇专家知识,最终形成从问题提出到解决方案验证的全链路、自进化科研范式。 图3 多模态、多学科融合的科学智能模型 来源:上海科学智能研究院 # (4) 关键指标参数 建成超过4万个高质量科学数据集,数据总量达12PB,平台打通CPU/GPU计算能力,大规模加速科学智能场景的强化学习,科研任务按照计算类型分层处理,小时级加速至分钟级;低成本Serverless动态部署,打通GPU显存、CPU内存、SSD闪存三级资源,同等计算资源下,可部署模型数量翻倍;子链路级别问题识别和任务恢复,异常中断秒级恢复,自动续训率 $99.9\%$ 。 # 6. 创新情况: # (1) 技术创新情况 数据层面:高质量数据集支持用户下载至本地使用,或直接在平台的其他模块中调用。零样本预测与多任务学习的蛋白质语言模型平台汇聚多个高质量特色科学数据。生命科学领域,以 siRNAOD $^3$ 数据集为例:是目前唯一一个个集多项关键特征于一体的公开数据库,汇聚了超过 11 万条 siRNA 记录,具备前所未有的数据规模。它不仅具备科研价值,更对 RNA 药物开发、临床转化、AI 靶点筛选等领域具有高度适应性,是构建未来 siRNA 研究与应用生态的重要基础设施之一。 模型层面:学科前沿模型支持直接在平台中使用,并支持用户自行部署模型,在“先验知识+模型微调”的范式下,模型无需从零学习,即可在新场景中产生具有原创价值的科学发现。平台聚集了高校、科研机构和企业的优质科学模型,前沿成果包括打破气候科学知识碎片化与学科壁垒,实现跨生态、经济、社会系统的智能认知与推理支撑的气候科学大语言模型PI@Climate;经ECMWF和谷歌认证精度领先的“伏羲气象大模型”;涵盖分子、细胞、组织、器官等多尺度、多模态的女娲生命系列大模型;预测精度达到世界一流商用软件薛定谔FEP+水平的物质大模型等。 算力层面:平台打通CPU/GPU计算能力,大规模加速科学智能场景的强化学习,科研任务按照计算类型分层处理,小时级加速至分钟级;低成本Serverless动态部署,打通GPU显存、CPU内存、SSD 闪存三级资源,同等计算资源下,可部署模型数量翻倍;子链路级别问题识别和任务恢复,异常中断秒级恢复,自动续训率 $99.9\%$ 。 实验层面:除了高校/产业丰富的湿实验资源,融合自动化的实验智能体以及通用的实验灵巧手。灵巧手具备长程动作思维链CoAT能力、泛化能力,在小样本数据下可以做到超高复杂、灵巧的操作。 # (2)模式创新情况 Agent广场汇聚了丰富的科研智能体资源,涵盖模型、数据处理、实验控制等多个方向。不仅提供资源集合,还通过“组合—执行—记录—反馈”的闭环机制,实现科研模式由分散化工具使用走向系统化、平台化的智能科研范式。同时,过往科研合作多靠学术关系或线下网络推动,存在匹配效率低、跨界沟通成本高等问题,众研社区构建科研任务拆解与合作对象匹配机制,将不同背景的科学家、AI研究人员和工程师快速聚合,显著提升科研合作的组织效率与契合度。实现从被动合作到主动匹配、从封闭小组到开放生态的模式创新。 # 7.应用实效: 星河启智平台已于2025年7月25日在2025世界人工智能大会(WAIC2025)上发布,开放产品试用,进入正式运营阶段。目前用户主要为:复旦大学在校师生、其他合作高校科研用户、上智院科研用户。同时,通过与魔搭社区的深度合作,共建AI4S(AIforScience)专区面向广大开发者、C端用户,目前已实现热门模型的代码共享、权重共享,全面落实开源开放理念。未来通过精细化的产品运营,将进一步拓展B/C端用户。 星河启智自主科学探索引擎已实际服务科研人员进行科学研究。基于用户问题自动检索科研知识库,提取关键信息并形成科研方案,并自动化编排科研流程。用户一方面可以在Agent广场中查看、编辑、迭代流程,一方面可以通过平台集成的计算资源与算法库,自动运行实验、模拟或分析任务,实时返回结果,并支持反复重跑。最终以图表、代码片段、文献引用等形式可视化输出,支持一键导出报告。 考虑科研问题的深度和流程的复杂性,当前在生命科学和物质科学领域的部分细分话题中,任务规划和推理能力已受到科学家的高度认可,特别是在“逻辑编排能力”“可视化与流程监控”“路径迭代与反馈驱动优化”层面。展示案例验证包括但不限于: # (1) 多肽设计 胰高血糖素受体在葡萄糖稳态中扮演着关键角色。靶向它的多肽可以作为2型糖尿病的治疗方法,通过调节胰高血糖素的作用来发挥效用。设计一个肽序列(15-30个氨基酸),该序列能作为人胰高血糖素受体(GCGR,Uniprot ID:P47871)的选择性拮抗剂。 来源:上海科学智能研究院 图4多肽设计应用 # (2) 靶向药小分子结构预测 为治疗银屑病,寻找能够作用于 Tyk2 靶点的小分子结构。 # (3) 新材料结构发现 为设计医疗诊断应用和精密加工具有应用场景的深紫外光电器件,需要在禁带连续可调AlGaN上实现能带值大于4.5eV的配比,帮用户设计一个配比方案。 # (二)石景山区 AI for Science 平台项目 # 1.案例实施单位: 北京火山引擎科技有限公司、北京枫清科技有限公司、中化数智科技有限公司 # 2.案例背景: 从国家层面,科技部会同国家自然科学基金委启动了“人工智能驱动的科学研究”(AI for Science)专项部署工作,布局“人工智能驱动的科学研究”前沿科技研发体系。石景山区作为全国首个AI大模型产业集聚区,近年重点布局人工智能产业,当前区域内尚未形成覆盖“数据—算法—算力—场景”的AI for Science一体化平台。与此同时,聚焦未来制造、未来信息、未来材料、未来能源、未来空间、未来健康六个方向,以AI for Science平台助力产业聚集,探索AI+新材料等新领域,带动未来产业发展。 # 3.案例概述: 打造国内领先的区级AI for Science平台,赋能科研院所与企业在新材料合成、化工研发、生物医药等领域的创新实践,推动石景山区产业数字化转型。紧密围绕发展趋势,进一步加强石景山区智能科研服务平台建设,为新材料、生物医药等领域科研项目提供支撑: 一是提供 AI for Science 门户,将整体能力统一至平台之上,并且提供基础设施服务进行平台运行。二是打造 AI for Science 全流程的支撑平台和工具链,通过行业智能体平台、通用工具链和场景工具链,实现对各 AI for Science 业务场景的串联,助力新材料发现、药 物分析发现、生物信息分析等场景的智能实现。三是构建 AI for Science 领域大模型,优先根据客户需求实现化工材料大模型,统一框架和科学规律建模,打破学科边界,实现数据、算法与实验的深度协同。四是积极参与 AI for Science 数据集标准制定,支持构建 AI for Science 高质量数据集。 # 4.行业痛点: 在 AI for Science 的工作中,有如下挑战:一是高质量科学数据稀缺;二是跨学科人才(AI+领域科学)缺口大,培养周期长;三是 AI 模型训练对算力需求激增,需平衡硬件成本与能耗;四是缺乏支持 AI for Science 全生命周期的统一平台;五是需针对科学场景定制专用算法与大模型(如 AlphaFold),而非依赖通用模型;六是需从科研向产业延伸,看重实际落地。 # 5.案例详述: # (1) 总体思路 本项目以“平台化、场景化、生态化”为核心建设理念,打造覆盖“数据—算法—算力—场景”的AI for Science一体化平台。总体思路围绕“四个一”展开:一套基础设施,整合通用计算与智能算力,实现资源的弹性调度与高效利用;一个领域模型工厂,基于通用大模型底座,训练如化工材料、生物分子等垂直领域大模型,注入行业知识;一条智能支撑工具链,通过低代码智能体平台与可视化工作流引擎,将通用工具与场景化工具(如生物信息分析、量子化学计算)模块化封装,支撑科研全流程;一个统一门户,集成用户管理、资源调度与 场景应用,为区域创新主体提供一站式智能科研服务入口,最终构建产学研用深度融合的开放创新生态。 # (2) 软件平台 AI for Science 平台采用分层架构设计,构建了四大核心子系统。一是平台以 AI for Science 基础设施服务为底层支撑,提供通用计算与智能算力资源;二是在其上构建 AI for Science 领域模型平台,专注于化工材料、分子表征等垂直领域大模型的训练与调优;三是 AI for Science 支撑平台通过行业智能体平台、通用工具链和场景工具链,为科研全流程提供低代码开发与自动化支撑;四是最终通过统一的 AI for Science 门户,集成用户管理、业务导航与多场景应用,为科研人员提供一站式智能科研服务入口,形成完整闭环。 图5石景山区AIforScience平台架构 来源:北京火山引擎科技有限公司 # (3) 技术方案 平台采用"通用大模型+领域大模型+领域小模型"的协同技术路线。基于通用大模型的广泛知识理解能力,通过领域知识注入与专业 训练,构建具备行业深度的领域大模型;同时针对特定科研任务开发轻量级领域小模型,确保专业场景下的精度与效率。技术实施层面,通过智能体平台实现工作流可视化编排,将数据预处理、模型调用、仿真计算等环节串联成自动化科研流水线,并与信通院合作推进数据集标准制定,构建从数据管理、模型训练到智能应用的完整技术闭环。 # (4) 关键指标参数 平台已覆盖化工、材料、生物医药等5大重点领域,集成超过10套科研工具链,通过低代码智能体平台,将科研智能应用的开发周期从传统的4—6周缩短至3—5天,效率提升8倍以上,极大降低了AI技术的应用门槛。 # 6. 创新情况: # (1) 技术创新 针对 AI for Science 平台,构建通用智能体平台,并且提出通用工具链和场景工具链的概念,从通用工具和科研场景角度对 AI for Science 提供支持。 在 AI for Science 科研支撑平台建设中,搭建低代码的智能体平台具有迫切的现实需求。随着科研数据多模态化(文本、图像、数值等)和工具平台异构化加剧,科研人员需频繁整合 NLP 模型、数据分析工具、实验模拟系统等资源,但技术实现门槛导致智能体开发效率低下(平均周期达 4—6 周)。科研智能体平台分系统通过低代码架构,提供可视化工作流编排、组件化 AI 能力封装和跨系统 API 集成,支持科研人员以拖拽方式快速构建诸如实验数据智能处理、文献 知识图谱分析、模型自动化调参等智能体应用,将开发周期缩短至3-5天,显著降低技术转化成本。 平台建设顺应AI与科研深度融合趋势,旨在突破技术开发瓶颈,赋能生物信息学、材料科学等领域科研人员自主构建智能化工具,推动科研范式从"试错驱动"向"智能设计"转型。作为区域科技创新的核心载体,石景山区聚焦新材料、生物医药、智慧农业等战略领域,但传统科研模式存在跨学科协作低效、数据资产利用率低、算力资源调度粗放等问题。例如,化工领域重复计算材料性能的项目占比达 $42\%$ ,农业智能化场景中数据标注成本占研发周期 $60\%$ 以上。构建AI for Science科研智能体平台,是破解区域科研资源碎片化、加速科技成果转化的关键抓手。 提供科研所需智能体平台,用户在智能体平台之上可以进行以下工作:一是利用通用工具链辅助论文阅读、对论文进行翻译以及提供论文摘要,提供科研效率;二是利用场景工具链进行科研任务,比如利用生物医药平台进行蛋白质预测,利用量子化学工具链加速量子化学计算;三是用户也可以基于平台进行工具链扩展,助力自身的科研任务;四是在化工材料大模型方面,为新材料设计等提供助力,提供物质信息检索、逆合成、反应条件查询等功能。 # (2)模式创新 通过产学研用一体化的方式实现运营模式的创新,具体流程为: 图6产业研用具体流程 来源:北京火山引擎科技有限公司 以AI+新材料联合实验室为起点,逐步实现从能力供给 $\rightarrow$ 数据应用 $\rightarrow$ 场景需求落地 $\rightarrow$ 平台影响力提升 $\rightarrow$ 更多行业场景拓展 $\rightarrow$ 反哺平台建设的循环闭环。其中关键环节包括:一是通过科研院所、央企、联合实验室和生态链伙伴形成创新共同体,以AI+新材料为切入口;二是以“火山构建的核心能力平台”为基础,逐步沉淀通用能力;三是数据与场景驱动,通过行业数据采集、应用实践和生产数据积累,不断形成高质量数据和场景应用;四是将平台能力迁移到更多垂直行业和跨领域场景,带动影响力;五是平台在实际应用中不断迭代升级,实现能力重塑,形成长期可持续的创新循环。 # 7. 应用实效: 平台构建全链条智能体开发与管理体系,覆盖工具链支撑、多模型兼容、协作管理、生态运营、数据监测及安全防护等核心维度,形成功能完备的AI for Science科研智能体开发与运行环境,具备如下能力且对外提供服务: # (1) 智能体全生命周期工具链 提供完整的智能体搭建工具集合,支持提示词工程、插件开发、知识库构建、工作流设计、评测对比及内容审核等核心功能模块,实现从智能体设计、训练到部署的全流程可视化操作,降低技术门槛,提升开发效率。 # (2) 多模态模型适配与接入 支持开源模型、商业模型、本地部署模型、领域大模型等多元类型,具备灵活的模型适配框架,可快速集成不同技术路线的AI模型,满足科研场景对算法多样性和定制化的需求,实现“一键接入、统一管理”。 # (3) 协作空间与权限管理 构建层级化协作管理体系,支持工作空间创建、成员角色管理(添加/删除)及资源隔离共享,实现智能体、插件、知识库等资产在工作空间维度的安全管控。通过精细化权限配置,保障跨团队协作中的数据安全与知识产权保护。 # (4) 智能体与插件生态市场 搭建开放的智能体与插件交易中心,支持用户将自研智能体及插件发布至平台生态市场,实现科研工具与成果的沉淀、共享与复用。通过生态运营机制,促进跨机构技术交流,加速AI for Science应用创新与产业化进程。 # (5) 智能体数据分析与监控 开发多维度数据分析看板,实时跟踪智能体运行状态,涵盖消息 总量、互动用户画像、平均会话时长、Token输出效率、用户满意度等关键指标。配套完善的日志系统与标注工具,全面记录智能体运行轨迹,为优化迭代提供数据支撑。 # (6) 安全合规与内容管控 建立多层次安全防护体系,通过敏感词库管理、内容实时审核、数据加密传输存储等机制,确保模型输出合规可控。支持违规会话追溯与审计,可快速定位命中敏感词的交互记录,满足科研数据安全与合规要求。 # (7) 安全合规与内容管控 提供开箱即用的问答会话页面组件及完备的OpenAPI接口,支持第三方应用快速接入平台能力,实现智能体功能与科研业务系统的深度融合,降低技术集成成本,提升平台服务的可扩展性与兼容性。平台提供的化工材料大模型,以中化信息的天枢大模型为基础版本,对中化各二级公司以及化工类企业可以以对话交互的形式提供针对分子检索、逆合成设计、反应条件推荐等研发任务的问答,为用户提供高效、便捷、精准的化工新材料合成提供助手服务,具有重要的应用价值。 # 二、材料研发 # (一)基于科研智能的高分子材料研发 # 1. 案例实施单位: 厦门大学、嘉庚创新实验室、厦门智储大装置研究院有限公司、厦门依华智慧科技有限公司 # 2.案例背景: 高分子材料在世界科技前沿应用广泛,涵盖从高性能工程塑料到新能源材料、柔性电子材料等多个领域。传统依赖人工试错的研发模式存在周期长、成本高等瓶颈,严重制约高分子材料发展进程。国际科研机构加速推进人工智能驱动的科技研发,已在材料性能预测、合成路径设计等领域取得突破性进展,展现出颠覆传统研发范式的潜力。因此,亟需通过人工智能和机器人融合方式提升高分子材料研发效率,服务国家重大需求和新质生产力发展。 图7 AI for science是高分子材料研发革命性的突破口 来源:厦门大学 # 3.案例概述: 基于科研智能的高分子材料研发是以大数据和人工智能算法为基础,将高通量样品制备(手)、多维度样品表征系统(眼)、智能 决策迭代(脑)技术深度融合,以国家战略领域关键材料研发需求为牵引建设的无人智能材料研发实验系统。系统通过机器人技术和人工智能决策的结合,突破了无人干预条件下材料制备、表征和智能迭代的材料研发实验系统关键技术,实现材料的“决策一制备一表征”的干湿闭环研发。 # 4.行业痛点: 高分子材料单体种类繁多且配方复杂,反应参数空间巨大,传统材料研发高度依赖人工试错,效率低、成本高,难以适应快速迭代需求;智能化转型中,国内缺乏自主可控的核心技术工具,实验数据碎片化且标准化不足,制约模型训练与验证;实验室研发与产业需求脱节,导致新材料从设计到量产验证周期长、风险高。人工智能与高分子材料研发深度融合不足,缺乏成功落地应用案例,亟需高效智能的新范式突破效率瓶颈。 # 5.项目获奖、专利授权及获得投融资情况 (1)研发范式获批多个项目支持。 (2) 与行业龙头企业联合开展技术研发, 合同金额达数千万元。 # 6. 案例详述: # (1) 总体思路 针对高分子材料高效研发的技术挑战,项目组自主研制一系列结合机械手、精密位移运动控制系统等以多智能体协同为基础的智慧材料研发技术。针对高分子材料高通量制备和多维度表征的技术挑战,建立对所制备材料的核磁、质谱、色谱、红外、拉曼等谱学表征和力 学、热学、电磁学等性能表征的多维度数据采集和自动化分析系统。针对高分子材料研发对象复杂、依赖试错和经验积累、难以理性设计的技术挑战,建立以科学智能(AI4S)为核心的智慧材料研发新范式,推动高分子材料开发进入人工智能驱动的新阶段。 # (2) 软件平台 项目组自主建设了基于具身科学智能的高分子材料研发系统,突破复杂配方设计及巨量参数空间的智能化寻优瓶颈,实现高分子复杂体系的高通量合成-多尺度结构表征一性能预测算法的闭环研发,并完成实验设备全链条国产化替代。通过联合国家实验室构建“人工智能模型-机器人实验-产业验证”三位一体的智能研发底座,并与相关企业共建垂直领域研发子平台,为多场景高分子材料提供定制化智能研发解决方案,构建自主可控的高分子材料研发体系,保障国家战略产业供应链安全。 # (3) 技术方案 # 基于科研智能的高分子材料研发由三个子系统组成: 一是高通量样品制备系统(手),以基于智能决策和机器人自动高通量材料—器件制备为目标,建立自动化、高通量的材料—器件制备平台,形成材料智能制备的自主可控仪器装备能力;二是多维度样品表征系统(眼):建立面向材料研发的涵盖核磁、质谱、色谱、红外、拉曼等谱学表征和力学、热学、电磁学等性能表征的多维度数据采集和自动化分析平台,形成满足材料智能研发的多维度综合表征能力,三是智能决策迭代系统(脑):建立结合标准化数据库、人工智 能算法与大模型的智能决策技术, 实现材料研发全流程的决策、调度、控制、监测和反馈, 形成“决策—制备—表征”的干湿闭环迭代研发能力。 # (4) 关键指标参数 一是实现了材料的自动化高通量制备与表征,24小时内在无人干预情况下完成超过100种制备条件的材料制备和表征;二是无人干预情况下自动运行连续工作时长大于240小时;三是针对特定材料需求,形成包括超过10000种制备条件及对应材料性能的数据库以及具有预测能力的智能预测算法。 # 7. 创新情况: # (1) 技术创新 针对材料研发多尺度耦合、数据孤岛严重、依赖进口设备等行业痛点,项目在数据治理、模型与算法等层面实现多项关键突破,形成可落地的技术体系。 在数据层面,通过“感知—学习—交互”的智能体协作,将材料研发的“表征-决策-制备”流程智能化、高效化,联合苏州实验室、上海人工智能实验室、北京科学智能研究院等平台,中国科学技术大学、中国科学院高能物理研究所等一流科研院所,以及深势科技等企业,初步构建了高分子材料的百万级实验数据集、计算数据集和文献数据集,以及相关高分子材料大模型语料库。 模型与算法层面,突破跨尺度关联技术,首次构建了特种高分子材料微观分子结构一分子间作用力一宏观流变性能的跨尺度关联模 型,为材料性能的精准优化与高效迭代奠定了坚实基础。项目阶段性产品性能已得到应用单位的验证;开发了聚酰亚胺等高分子材料大模型,建立了结构化的知识库体系。基于材料性能需求,大模型智能推荐合成方案,并指导自动化实验平台完成全流程验证,成功开发出玻璃化转变温度突破 $550^{\circ} \mathrm{C}$ 的高性能聚酰亚胺材料。 # (2) 模式创新 依托技术突破,实验室构建“跨领域协同+全链条智能化+场景化落地”的创新模式,形成高分子材料研发领域的新产品与新业态,推动行业范式升级。 在产学研协同模式上,打造“高校-科研院所-企业”跨领域创新网络,联合国家级平台、一流科研院所、以及行业龙头企业,构建智能实验室“算法驱动—材料创新—场景验证”闭环攻关体系。 在服务模式上,推出“定制化智能研发解决方案”,针对新能源、电子电器、航空航天等不同领域需求,提供从数据生产到模型验证的全链条服务。面向新能源电池领域,为相关企业定制基于AI算法的电池关键原料智能研发系统,实现原料的智能制备、自动表征、配方的智能筛选和迭代;面向芯片制造领域,与恒坤新材料共同构建高通量智能有机合成系统和开发专用智能算法,实现研发全流程闭环优化。 在成果转化模式上,基于科研智能的高分子材料研发,孵化厦门智储大装置研究院有限公司、厦门依华智慧科技有限公司等企业,推动技术向产业化延伸。同时,积极参与智能实验室和智能平台相关标准制定工作,形成“技术研发-标准制定-产业应用”的良性循环,为材 料领域智能化转型提供可复制的“产学研用”范本。 # 8.应用实效: # (1) 新能源电池高分子材料领域 与新源企业密切合作,建立基于AI算法的电池关键原料智能研发系统,实现原料的智能制备、自动表征、配方的智能筛选和迭代,具备每日100组配方的智能研发能力。初步对氟代羧酸酯、环状氟代羧酸酯以及氟代芳香类化合物组成的巨大配方空间进行搜索,实现锂电池电解液“干湿闭环”研发范式—非常规温度电解液的智能研发,通过自动化实验完成40组配方内筛选四元电解液配方的最优值。 # (2) 电子电器高分子材料领域 与光刻胶企业开展多项科研项目合作,共建校企联合研发中心,合作领域涵盖先进半导体材料、电子化学品,已实现对标ArF光刻胶树脂合成工艺路线开发;共建联合研发中心开展多项技术联合攻关。 # (3) 航空航天高分子材料领域 与航天企业合作,突破了无人干预条件下航空航天特种高分子材料合成、表征和智能迭代的材料研发实验系统关键技术,实现了实验系统全链条软硬件的国产化自主可控。 # (二)AI自驱动大压铸工艺闭环系统 # 1.案例实施单位: 小米技术委AI实验室:核心算法开发 小米汽车质量部:核心数据支持 小米汽车工厂压铸车间:生产实验测试支持 小米汽车智能智造装备部:压铸设备 plc 控制打通 小米汽车智能智造制造工艺部:现场工程实施 小米汽车数字化团队:MES系统打通院 # 2.案例背景: 当前,以Deepseek为代表的前沿大模型技术持续迭代,在全球多行业形成技术赋能趋势,展现出广泛的应用潜力。从行业发展现状来看,AI与制造业的融合正处于加速渗透期,但传统智能制造领域在核心生产环节的技术转化效率仍有提升空间,大模型的赋能价值尚未完全释放。 2024年小米SU7上市后获得市场广泛关注,面对规模化交付需求,小米将AI大模型技术深度应用于汽车生产制造全流程,重点聚焦一体化压铸这一关键工艺环节,构建了一套赋能压铸全链路的工艺自驱动闭环系统。该系统以大模型为核心支撑,分别在材料研发、工艺优化、质量检测三大核心场景实现技术落地——通过AI配方寻优缩短新材料研发周期,依托智能算法优化生产参数,借助视觉大模型实现毫米级缺陷精准检测,为高效交付提供了技术保障。 图8 小米工艺自驱动闭环系统 来源:小米汽车 # 3.案例概述: 本案例聚焦“小米在汽车制造领域推出的工艺自驱动闭环系统”,面向一体化压铸全链路首创小米擎天柱工业大模型作为系统核心引擎。该系统精准瞄准行业大压铸生产中的核心痛点,具体解决三大关键问题:材料研发层面研发周期长成本高、工艺优化层面生产稳定性欠缺与参数协同不畅、质量检测层面全流程质量管控难。 在技术层面,系统通过三大核心路径,分别突破材料研发、工艺优化、质量检测领域瓶颈,构建全链路价值闭环:一是深度挖掘多源异构材料知识,涵盖材料成分、力学性能、材料机理等多个维度,完成高维材料特征的统一提取、精准表征与深度融合,通过自研的多元材料AI仿真系统,降低材料研发阶段的试验成本与时间成本;二是搭建高度集成的中控系统,结合半监督学习、多模态信息融合和数据生成等技术,构建“机械性能全量预测—工艺优化—参数自动调控”的完整闭环链路,打通设备与系统协同的“最后一公里”,实现一体化压铸全链路的工艺闭环优化;三是深度集成X光射线等高性能工业检 测硬件设备,创新设计全自动提示与多阶段精细化微调技术方案,构建面向一体化压铸场景的工业视觉大模型,仅需少量标注数据即可实现毫米级微小缺陷的高精度检测与分割,打破传统人工质检与半自动化检测的效率和精度瓶颈,实现压铸件的高可靠性、自动化闭环。 # 4.行业痛点: 一体化大压铸技术是极高的工艺控制壁垒——虽发展多年却迟迟未能应用于汽车结构件的核心瓶颈。其关键挑战在于模具热场的纳米级稳定性控制:仅几度的温度波动,就可能导致整批次后车身铸件产生蜂窝状气孔等致命缺陷,凸显了该工艺在热力学平衡与过程精度控制上的极端复杂性。工艺控制不好,不仅造成大量铝合金原料报废,严重的更会引发产线停摆、模具返修及交付违约的连锁损失,会严重影响整个产线的车辆交付力,综合以上,存在以下三项痛点:一是质量检测主要依赖破坏性检测和抽检,难以全面掌控每一件产品的质量全生命周期,导致缺陷品易流入下游环节,增加风险。二是生产过程复杂且动态,缺乏有效的实时监控和异常反馈,导致问题一经发现已造成大量不合格品,错失及时调整机会。三是AI模型难以与底层设备系统高效对接,缺乏自动化闭环调节能力,对模型可解释性与鲁棒性要求极高。 # 5. 创新情况: 工艺自驱动闭环系统已率先在多条压铸产线落地应用,推动质量管理实现从“事后救火”到“事前防火”的关键跃迁。在量产场景中,该系统不仅实现全流程质量可控,更达成废品率降低、用人成本最小化 的多重效益,成功斩获国际领先技术鉴定2项,为行业树立起智能制造的新标杆。 (1) AI驱动材料开发模式变革,推动材料研发迈入大模型时代 本系统突破传统材料研发瓶颈,实现从“实验驱动”到“大模型驱动”的创新跃迁:将传统依赖专家经验摸索配方的研发范式,升级为大模型研发范式,并创新性提出MEEAI模型,通过“性能预测 $+$ 配方寻优”的双重能力,精准锁定性能最优的材料配方。依托大模型研发范式,材料研发周期缩短约 $50\%$ ,其自主研发的小米泰坦合金已成功应用于汽车工厂的大压铸件生产,实现技术成果向实际产能的高效转化。 (2)“超级工业巨兽”智慧大脑,引领压铸工厂迈向行业领先 压铸自驱动工艺闭环系统构建“感知—决策—执行”三位一体的智慧架构:感知系统方面,通过开发高度集成的中控系统,实现全流程数据实时采集,为后续决策提供精准数据支撑;决策系统方面,依托AI技术实现最优工艺参数推荐、非破坏性力学性能预测、事前质量预警与故障报警三大核心能力;执行系统方面,高度集成终端数百台设备,确保决策指令高效落地。这一架构彻底变革传统力学性能检测模式,从“破坏性抽检”升级为“100%AI全检”;同时,AI推荐的工艺参数不仅提升压铸件力学性能指标,还大幅缩短压铸岛设备调试时间,双管齐下保障工厂的质量与产能双达标。 (3) 创新大压铸件质检大模型技术,实现缺陷精准识别与闭环管控 针对大压铸件内部缺陷“样本量小、尺寸微小、形态多样”的行业难题,自研视觉大模型,质检准确率突破 $99\%$ ,该技术能够实现毫米级缺陷的像素级分割,精准还原缺陷的位置与尺寸,检测效果远超人工。通过搭载该大模型大幅降低了人工成本,保障产品高质量交付。此外,系统通过缺陷分析反向辅助工艺优化,形成“检测—分析—提升”的质量闭环流程,并已实现平台化落地,可实时开展检测与质量改进。目前,该质检大模型已成功应用于量产的SU7与YU7两款车型。 # 6.应用实效: # (1)质量智能检测系统 当前,涵盖“内部缺陷检测”与“力学性能检测”的质量检测系统,已在小米汽车工厂压铸车间的各个压铸岛全面落地应用。这一系统彻底改变了传统质检模式:此前大压铸产品的机械性能质检采用“3%人工破坏性检测”,如今已升级为基于AI技术的“大压铸后地板100%全检”。从检测效果来看,机械性能预测准确率高达95%以上,其中UTS(抗拉强度)、YS(屈服强度)、EL(延伸率)等关键力学性能指标的平均误差分别控制在4.13MPa、4.01MPa、0.91%的优异水平。 图9小米一体化压铸集群 来源:小米汽车 # (2) 智能参数优化系统 智能参数优化系统已全面覆盖小米汽车工厂压铸车间的各个压铸岛,为现场生产工艺参数调优带来全方位提效。借助该系统,工程师无需手动逐一监测生产测量参数,可通过智能监控系统直接识别设备异常,并依托参数推荐系统实现生产参数的自动调优。实际应用中,各压铸岛铸件的机械性能显著提升,其中机械性能平均合格率提高 $3.6\%$ ,有效夯实了量产质量基础。 # (三)AI赋能特钢研发 # 1.案例实施单位: 之江实验室、中信泰富特钢集团股份有限公司 # 2.案例背景: 传统特钢企业在合金钢材材料研发与生产过程中,长期依赖专家经验与反复试验,面临研发周期长、成本高、知识难以沉淀等问题。尽管掌握丰富的工业数据资源,受限于技术门槛与数据壁垒,智能化工具难以落地。之江实验室与中信泰富特钢联合开展AI4S探索,构建以大语言模型为核心的智能研发系统,融合企业真实产线数据和专业知识,实现合金钢材设计、工艺优化、故障诊断等场景的一体化智能赋能,推动特钢行业从经验驱动迈向智能驱动。 # 3.案例概述: 本案例聚焦“AI赋能特种钢材研发”,通过“大模型+小模型/工具(1+X)”混合架构,构建以自然语言为接口的智能合金材料设计与工艺优化系统。系统基于32B大语言模型,融合冶金领域知识与企业私有数据,融合多种性能预测和视觉识别小模型,覆盖从文档问答、参数推荐到逆向设计、智能巡检等多类业务场景,实现特钢企业领域大语言模型落地应用。平台系统已在多个产线试点运行,显著提升研发效率与生产决策质量,形成“可推广、可自持、可信赖”的智能化转型范式。 # 4.行业痛点: 钢铁行业研发依赖经验、试错成本高,传统信息化系统与实际业 务耦合难度大。同时,AI模型部署门槛高、模型泛化能力差、缺乏行业语义理解能力,难以在生产一线广泛应用。亟需一种融合专业知识与通用智能的AI系统,打通从知识获取、数据分析到决策优化的全链条,赋能特钢企业高质量发展。 # 5.案例详述: # (1) 总体思路 面对特钢行业材料设计周期长、试错成本高、专家经验难以复用等痛点,之江实验室联合中信泰富特钢,提出以“大语言模型为中枢、小模型为工具”的AI4S智能研发新范式。该范式通过将通用模型与企业私有数据、合金材料领域知识深度融合,构建对话式研发平台系统。平台系统支持自然语言交互,融合文本、结构化数据和图像信息,实现从知识问答、性能预测到合金材料逆向设计的多任务协同,同时推动从“AI辅助专家”向“专家增强AI”的范式转变。 # (2) 软件平台 平台系统采用“1+X”混合智能架构。 图10 特钢企业领域大语言模型平台架构 来源:之江实验室 包括以下核心模块:一是32B合金材料领域大语言模型。基于通用模型微调训练,具备冶金工艺问答、研发流程推理、文档解析等能力。二是X个专业领域模型/工具。专家模型包含炉温预测、淬透性计算、碳化层厚度预测、轧制工艺优化、合金材料逆向设计、图像识别等模块,支持高精度预测与模拟。RAG知识库整合企业供应商信息、选材资料等文本,支持多轮语义检索与文档级对话。三是可视化工作流编排平台。用户通过自然语言描述需求,系统自动调度模型和工具执行任务,支持可视化流程监控与结果回溯。整个系统已在特钢多个产线试点,适配炼钢、轧制、热处理等典型流程场景。 图11 模型通用能力和合金领域评测 来源:之江实验室 图12 专业领域工具应用 来源:之江实验室 # (3) 技术方案 一是大模型训练与行业适配。以Qwen2.5-32B为基础模型,利用收集的TB级合金材料领域语料进行微调训练,增强模型的行业专业性与本地化表达能力。二是领域模型/工具集成与异构桥接。围绕特钢场景构建多个轻量化预测模型与工具,包括产线参数预测模型、合金材料性能预测模型、图像识别模型、企业文档和数据库查询。通过设计规范的专用中间件模块,实现模型与工具之间的数据格式自动转化与传递(如自然语言到结构化数据、数据库查询结果到自然语言解释),确保流程无缝衔接。三是安全隔离与可控部署。平台系统支持本地化部署,所有模型推理均可在企业内网环境完成,知识库与模型权重完全可控,符合工业级数据安全要求。平台系统具备持续扩展与版本迭代能力,便于后续适配其他产线与应用场景。四是关键指标参数。32B在通用评测集中表现与千问模型相当,在冶金专业考题和合金材料科学专家测试题中超越千问;炉温、碳化层、轧制工艺等产线参数预测拟合度均达到 $90\%$ 以上;合金材料力学性能预测拟合度达到 89%;图像识别模型准确率 92%。 # 6. 创新情况: # (1) 技术创新 一方面行业专属语料与多模态数据融合,助力模型在专业测试中表现领先。平台构建了覆盖特钢全流程的专属行业语料库,并融合合金材料领域知识和通用开源语料,通过统一的预处理与标准化流程,实现不同领域、多模态数据的高质量集成。训练后的大模型在专业测试集中表现优异,专业能力显著超越同类模型,充分验证了“通用+行业”融合语料在提升模型准确性、稳定性与可信度方面的有效性和可行性。另一方面异构模型智能路由与统一接口,支撑复杂任务的高效调度。平台创新性构建“通用语言模型+垂直专家模型/工具链”的异构协同架构,具备高精度的自然语言意图识别与动态任务路由能力,能够根据用户输入自动识别任务类型并匹配最优的处理路径。通过统一接口机制打通大模型与各类结构化子模型之间的调用链路,实现知识问答、工艺推荐、预测计算等任务的自动化流转,显著提升系统的任务调度效率和跨场景泛化能力。 # (2) 模式创新 一方面从专家辅助到专家增强的合作开发新范式,重塑AI系统建设流程。本案例打破传统“AI工程师单向服务业务专家”的建模范式,提出一种以大语言模型为中介的人机共创新模式。通过自然语言交互机制,业务专家可专注于知识体系构建、关键问题梳理与评测目标设定,AI工程师则聚焦于技术实现与数据流程管理。借助LLM对 复杂语言指令的理解与转译能力链接知识与工具,降低双方协作门槛,实现跨专业高效协同开发,推动从“AI辅助专家”向“专家增强AI”的转型。另一方面面向企业多场景部署的智能中台结构,支撑制造多环节协同升级。平台采用高度模块化与解耦的架构设计,具备跨产线、跨流程、跨场景部署能力。在同一企业内部,不同产线或业务部门可按需部署平台子节点,并通过统一的接口协议接入中央智能中台,实现异地协同、数据互通、模型共享。该模式不仅满足制造企业在炼钢、轧制、热处理、质检等多环节的智能化升级需求,也具备良好的横向可扩展性,为行业内构建“可迁移、可组装、可控可管”的企业级AI基础设施提供了范式示范。 # 7.应用实效: # (1) 应用场景 平台现已在特钢企业的炼钢、热处理、设备巡检等环节实现落地应用,典型用户包括生产调度员、设备巡检员、材料研发工程师等。系统通过自然语言交互接口,降低非AI背景员工使用门槛,广泛赋能一线操作人员与工艺专家,实现了从“辅助决策”到“协同优化”的能力升级。 # (2) 解决行业痛点情况 一是合金材料材料设计与成分预测模块支持从目标性能出发进行逆向设计,有效减少试验轮次,提升新材料开发速度与成功率。二是在炼钢测温场景中,通过部署炉温预测小模型,中包过热度降低 $2^{\circ}\mathrm{C}$ ,避免钢水过热或温度波动导致的质量不稳定问题,可提升钢种开发和 生产过程的稳定性与可控性。三是在设备巡检环节,通过图像识别模型实现高炉主皮带异物检测,识别准确率达 $92\%$ ,故障从无法及时发现缩短至毫秒识别,报警提示生产人员做出相应操作,降现场人力作业强度与环境高危问题。 图13 多场景领域检测与应用 # (3) 经济社会效益 以精炼炉温度预测场景为例,平台系统通过智能预测替代部分人工测温操作,并优化加热策略,使测温设备使用频次减少 $50\%$ ,年均可节省设备辅材消耗与能耗成本约百万元。平台部署后,产线事故发生率降低约 $40\%$ ,产品合格率提升 $2\%$ ,有效保障高端特钢的稳定生产与准时交付,显著提升企业整体运营效率与产品竞争力。 # (四)AI驱动的碳捕集材料研发与验证平台 # 1.案例实施单位: 中国华能集团清洁能源技术研究院有限公司 # 2.案例背景: 在碳达峰碳中和目标推动下,碳捕获、利用与封存(CCUS)技术成为高排放行业减排的重要路径。然而,传统吸收剂开发周期长、效率低,阻碍了CCUS的大规模部署。为此,本项目聚焦吸收剂研发环节,探索AI赋能材料开发的路径,推动形成智能化、自动化、快速响应的碳捕集研发体系。 # 3.案例概述: 项目构建了一体化智慧 CCUS 材料研发平台,融合分子建模、机器学习、自动化实验与高通量筛选技术,实现吸收剂从虚拟筛选、性能预测到实验验证的闭环流程。平台已应用于 $\mathrm{CO}_{2}$ 吸收剂的结构-性能预测与新材料筛选,显著缩短研发周期,提高开发成功率。 # 4.行业痛点: 碳捕集吸收剂研发普遍存在试错周期长、数据积累难、成本高、依赖专家经验等问题,亟需构建高效、智能、可扩展的研发范式。同时,缺乏统一平台协同推进算法、实验与产业验证,导致技术难以规模化转化。 # 5.案例详述: 碳捕集吸收剂是 CCUS 技术的核心之一,目前吸收剂性能和成本仍不满足大规模应用需求,开发更高效、更稳定、更经济的吸收剂配 方,可有效降低碳捕集成本,促进CCUS产业化进程。本项目围绕“AI赋能碳捕集吸收剂研发”核心目标,构建了一套集数据整合、性能预测、高通量验证于一体的智能研发平台,实现碳捕集材料从分子结构设计到工艺适配的全流程数字化与自动化支撑。平台系统性整合机器学习算法、分子模拟工具与自动实验装置,具备预测-验证-反馈的闭环优化能力,显著提升研发效率和吸收剂性能表现。 # (1) 总体思路 项目设计遵循“数据驱动、模型预测、实验验证、持续迭代”机制,致力于破解传统吸收剂开发周期长、成本高、成功率低的技术瓶颈。研究从分子结构出发,构建高维描述符特征空间,利用机器学习模型预测其在特定工况下的 $\mathrm{CO}_{2}$ 吸收能力,再通过自动化实验平台进行快速验证与模型反馈迭代,实现精准筛选与性能优化。 图14项目设计流程图 来源:中国华能集团清洁能源技术研究院有限公司 # (2)软件平台 本平台构建了覆盖“数据-模型-实验-设计”全流程的碳捕集吸收剂智能研发体系。平台集成由134种有机胺构成的分子数据库与多维 描述符库,并融合XGBoost、神经网络等AI算法,精准预测 $\mathrm{CO}_{2}$ 溶解度与吸收能力,模型具备SHAP可解释性。同时,自主研发的高通量自动化实验装置实现吸收性能的快速验证,效率提升10倍以上。通过反馈迭代与虚拟筛选系统,平台可根据目标性能反向推荐最优分子配方,形成“预测-验证-优化”的智能研发闭环,显著加速高性能吸收剂的发现与应用。 # (3) 技术方案 一是吸收剂分子数据库与描述符库。基于化学信息学工具,对134种主流有机胺提取分子结构特征,构建描述符矩阵;引入自定义特征,增强预测精度。通过大模型分析收集碳捕集领域吸收剂文献理论数据、实验数据。 图15 有机胺分子特征提取图 来源:中国华能集团清洁能源技术研究院有限公司 二是AI预测模型模块。采用XGBoost、全连接神经网络(FCNN)、随机森林(RF)等算法,分别构建回归模型预测 $\mathrm{CO}_{2}$ 溶解度与吸收能力( $\alpha \mathrm{CO}_{2}$ )。模型通过十折交叉验证进行稳健评估,融合SHAP解 释框架识别关键影响因素,实现预测的可解释性。 $\mathbf{R}^2 = 0.990$ 图16 回归模型预测图和SHAP框架图 来源:中国华能集团清洁能源技术研究院有限公司 三是自动化实验模块。自主开发一套碳捕集吸收剂高通量自动化开发系统,集成精密配液系统、物性参数检测模块、吸收反应模块、在线气体分析与自动记录系统、自动化仪器检测,支持温压可调、吸收反应实时监控、反应瓶重复利用,较人为实验研发效率提升约10倍以上。 图17 碳捕集吸收剂高通量自动化开发系统 来源:中国华能集团清洁能源技术研究院有限公司 四是反馈迭代与虚拟筛选系统。系统以分子结构为输入,结合已有吸收性能数据库与实验回流数据,基于物化特征构建多维特征矩阵, 并集成吸收容量、吸收速率等指标的历史数据,形成初步结构筛选库。在此基础上,系统可根据目标工况反向推导出满足性能要求的结构组合,优先输出具有可测性与可工艺适应性的候选配方,为实验阶段提供明确方向,形成反馈迭代。 # (4) 关键指标参数 一是吸收剂数据库参数量达到10万以上;二是吸收剂关键性能预测模型在验证集中达到 $\mathrm{R}^2 = 0.95$ 以上;三是筛选出的1种新型胺类吸收剂经实测性能优于现有MDEA/PZ(3mol/L/1mol/L)基准体系;四是开发AI驱动的碳捕集材料研发与验证平台,实现吸收剂自动化配制与性能检测,新配方材料实验开发验证周期由原来的6个月缩短至3周,兼容其他液体配方材料开发。 # 6. 创新情况: # (1) 技术创新 本项目紧扣碳达峰碳中和背景下的技术需求,聚焦CCUS关键环节中捕集端吸收剂的开发瓶颈,创新构建了面向工程应用的研发与测试一体化平台,并在机制、流程和服务体系上形成了一套具有推广价值的研发组织模式。传统碳捕集吸收剂开发依赖人工配制和逐批测试,不仅周期长、效率低,且易受操作误差影响。针对这一问题,项目以性能可控、效率可复制为目标,搭建了具备制备、吸收性能评价、稳定性测试等功能的高通量自动化开发系统,贯通了吸收剂研发从实验室设计到工程选型的全流程。 该系统具备多配方并行处理、数据自动记录与批次对比分析能力, 在维持实验精度的前提下大幅提升了实验通量,适用于碳捕集工程中常见胺类、混胺类、添加剂配方等类型的快速筛选和工况适配,为大规模结构组合提供了支撑。围绕这一系统,项目制定了统一的配方试验流程模板、数据记录模板、评估标准、数据标准,使得研发过程具备可追溯性,提升协同研发效率。 # (2) 模式创新 在服务机制上,平台可灵活部署于CCUS示范工程配套实验室、高校研究平台或企业研发中心,支持内部使用和对外服务双路径运行,具备结构筛选、性能验证、指标对比、方案推荐等多项功能。目前已在华能正宁150万吨/年CCUS示范工程中投入使用,为捕集系统的吸收剂选型、能耗优化和运行稳定性提升提供了关键支撑。项目整套模式为CCUS行业在吸收剂开发阶段提供了自动化、系统性、可落地的新的研发范式,具备良好的推广基础和应用前景。 # 7.应用实效: 本项目构建的AI驱动的碳捕集材料研发与验证平台,已在真实应用场景中完成部署和实用验证,显著提升了碳捕集材料的研发效率和筛选质量,助力关键技术工程化突破。目前该平台已开展与高校科研单位的推广意向交流,如中国科学技术大学、湖南大学、怀柔实验室等。当前,正加快推进一体化、智慧化CCUS实验室建设,系统整合吸收剂等关键材料研发、高通量实验验证、工艺验证与系统优化等关键环节,构建覆盖CCUS全研发链条的智能化、集成化研发体系。 从社会效益层面来看,该系统显著提升了碳捕集材料开发的规范 化水平和转化效率,为我国CCUS产业的加速落地提供了有力的支撑手段。上述成果为CCUS技术持续创新和产业化应用提供了具有示范意义的支撑平台,对推动行业技术进步和产业高质量发展发挥了重要引领作用。项目部分组件和结构参数模块已完成开源,推动科研成果共享,降低行业应用门槛;已申请国家发明专利3项,形成了具备可复制推广条件的核心技术成果,相关成果相关项目已获得国家发展改革委“两重”专项和北京市科委项支持,并获得人民日报报道。 展望未来,随着全国CCUS产业链加速构建和规模化示范项目密集启动,碳捕集环节对新型吸收剂的需求将持续增长,对研发速度、筛选准确性与实验验证能力也提出更高要求。本项目所形成的研发机制与平台体系,顺应了CCUS产业化对材料端和工艺端一体化协同的趋势,不仅可服务于现有以电厂烟气为主的应用场景,也可拓展至钢铁、氢能、化工、天然气净化等新兴领域,为我国构建技术自主、安全可控、经济可行的CCUS产业体系提供基础支撑和工具保障,具备广阔的推广前景和长远的战略价值。 # (五)材料显微图像智能分析及应用 # 1.案例实施单位: 北京低碳清洁能源研究院 # 2.案例背景: 在材料科学研究中,颗粒尺寸及其分布对材料性能具有重要影响。扫描电子显微镜(SEM)作为微观结构分析的重要工具,广泛用于微米和纳米尺度的颗粒表征,提供直观、真实的数据支持,帮助科研人员深入理解和优化材料结构。然而,传统分析方式依赖人工标注与统计,操作繁琐、效率低,尤其在处理不规则颗粒时易引入误差。为提升分析效率与准确性,有必要引入智能化手段对SEM图像进行高效和精准的分析。 # 3.案例概述: 本案例开发了基于人工智能的SEM图像分析模型,采用SAM架构,基于低碳院积累的上万张SEM图像,针对多组参数进行调优和适配,识别准确率达到 $95\%$ ,处理速度较人工提升200倍(以500个颗粒物计算)。同时,构建了端到端的智能分析平台,支持批量图像上传、一键处理和多维统计等功能。平台上线后已应用于超过20个研发项目,覆盖多个材料研究领域,累计处理图像超2000张,节省约170小时分析时间,显著提升了SEM图像分析的效率与准确性。 # 4.行业痛点: 在材料研究中,SEM图像分析是不可或缺的重要微观表征和分析手段。当前该分析仍普遍依赖人工标注和统计,面临效率低、主观 误差大等问题。尤其在处理大量、不规则形状颗粒时,人工方法耗时长、重复性差,影响数据分析的准确性与一致性。此外,传统流程缺乏标准化,难以满足科研和工业应用对高通量、高精度图像处理的需求。因此,有必要引入高效、智能的图像分析手段,以提升分析质量与处理效率,支撑材料研究的深入发展。 # 5.案例详述: 微观颗粒尺寸及其分布的精确表征是评估材料性能的核心环节。SEM凭借其高分辨率和直观成像能力,成为微观尺度材料分析的常用工具。然而,传统SEM图像分析依赖人工标注和统计,不仅效率低下,且易受操作者经验影响,尤其在处理大量图像或复杂颗粒形态时,误差率显著增加。例如,在催化剂研究中,颗粒的不规则形状和密集分布会导致人工标注耗时长达数小时,且难以保证数据的一致性。 图18传统人工SEM图像分析流程 来源:北京低碳清洁能源研究院 # (1) 总体思路 针对上述问题,开发了一套显微图像智能分析模型及平台系统。总体思路围绕“算法优化+平台集成”展开,旨在通过人工智能技术实现SEM图像的高效、精准分析。技术路线分为三个阶段:模型定制化开发、平台功能构建与多场景应用。首先,针对SEM图像的特殊性(如对比度较低、颗粒边界模糊、背景噪声干扰等),从基础模型 架构入手,逐步完成从V1.0到V2.0的迭代升级。V1.0版本基于ViT(Vision Transformer)架构初步实现了颗粒识别功能,但在复杂场景下存在边界识别不准确、小颗粒和模糊颗粒漏检等问题。为解决这一瓶颈,V2.0版本引入SAM(Segment Anything Model)架构,经过定制化适配调优,并结合自研的预处理与后处理模块,显著提升了模型的泛化能力和分割精度。在适配调优过程中,基于低碳院积累的上万张图像,筛选了涵盖不同材料类型的典型SEM图像作为基础数据,进行模型参数调优,最终使识别准确率从V1.0的 $87.5\%$ 提升至 $95\%$ 以上。 # (2)软件平台 基于上述模型构建了一套端到端的材料显微图像智能分析平台。平台采用模块化设计,核心功能包括:批量图像上传(支持多格式文件导入)、一键自动处理(无需人工干预即可完成多张图像分割与统计)、参数优化配置(可根据不同材料颗粒特征调整分割能力)、多维度结果输出(颗粒数量、平均尺寸、尺寸分布直方图等可视化图表)。平台界面设计简洁直观,用户仅需上传图像后,系统最快可在数秒内生成包含颗粒统计信息的完整报告。例如,在粉煤灰研究中,平台可在10秒内处理单张包含约500个颗粒的SEM图像,并输出直径和面积等分布统计结果和曲线,而传统人工标注需耗时20分钟以上。 图19 材料显微图像智能分析模型及系统架构图 来源:北京低碳清洁能源研究院 # (3) 技术方案 在颗粒识别任务中,模型能够对不同尺寸的颗粒均能实现精准识别,且对形状不规则颗粒(如椭圆形、多边形、立方体)的识别准确率超过 $95\%$ 。在处理速度上。支持并发处理,可同时处理多张图像而无性能衰减。此外,平台通过引入多维度统计功能,能够自动生成粒径分布直方图、D50/D90计算值及颗粒直径和面积分布图,为材料性能评估提供直观数据支持。例如,在工业分子筛催化剂研发中,根据颗粒尺寸进行分级利用具有重要意义。其中小颗粒分子筛,特别是纳米级别的颗粒,由于其较短的孔道,可以显著提升反应物和产物的扩散速率,从而大幅提高催化剂的性能和寿命。借助于本案例的平台,可以实现不同尺寸催化剂颗粒尺寸的快速统计和分类,助力分子筛催化剂的分级利用。 图20v2.0模型不规则颗粒识别可视化渲染结果 来源:北京低碳清洁能源研究院 # (4) 关键指标参数 目前该模型已为20个科研项目提供技术支持,涵盖包括电池材料、煤化工催化剂、氢能材料、碳纤维材料等多个研究领域,累计处理图像超2156张,模型调用次数达2634次,累计节省约170小时人工成本。 # 6. 创新情况: # (1) 技术创新 在模型研发过程中,术框架从 v1.0 的 ViT 过渡到 v2.0 的 SAM,同时结合上万张 SEM 图像的数据积累,实现了针对材料科学场景的定制化优化。原始数据涵盖电池材料、煤化工催化剂、粉煤灰等多种材料类型图像,颗粒形态包括规则球形、针状、多边形以及不规则形状等典型特征,为模型调优提供了丰富的样本基础。通过构建覆盖多尺度、多噪声水平的基础数据集,使模型具备适应材料颗粒边缘模糊、背景干扰等复杂场景的识别能力。在此基础上,参数组合优化框架针对多个关键指标进行了多参数精细化调整,最终使模型在识别准确率、响应速度及鲁棒性方面实现显著提升。这种基于行业数据的定制化适配,使模型能够精准捕捉材料微观结构特征,为材料性能预测提供可 靠数据支撑。例如,在粉煤灰利用研究中,模型通过分析颗粒尺寸分布,快速筛选出不同层级的粒径区间,显著缩短了实验周期,助力粉煤灰分级利用的相关研发。 在技术实现层面,预处理与后处理模块的设计进一步增强了模型的实用性。预处理阶段包含多种不同的图像增强功能,包括动态对比度增强(通过CLAHE算法调整局部亮度分布)、噪声抑制(结合多尺度高斯滤波与频域降噪)、多尺度边缘锐化(保留颗粒边界细节)、尺寸剪裁(提高处理效率和精度)以及图像归一化(消除成像条件差异)等。这些增强处理有效降低了图像质量波动对识别结果的影响。后处理环节则采用人机交互式操作模式,针对模型难以自动分割的粘连颗粒或漏检区域,用户可通过标注误识别区域优化结果,仅需少量人工干预即可完成修正。例如在催化材料分析中,通过对比度增强和少量后处理操作,解决了因材料表面反光导致的局部过曝问题,以及由于样本杂质噪声导致的背景干扰问题,使颗粒边界更清晰可辨,结果更可靠。 # (2)模式创新 在应用创新层面,该模型通过技术适配实现了多领域的拓展与优化。一方面,模型通过行业数据积累与参数优化,逐步覆盖电池材料、氢能催化剂、碳纤维、粉煤灰等多种材料类型,支持从纳米级颗粒到微米级纤维的全尺度分析。例如,在碳纤维材料研究中,通过统计纤维直径分布,为工艺参数调整提供数据依据;在氢能催化剂研发中,则通过分析颗粒尺寸分布,辅助研究人员优化催化性能。另一方面, 通过端到端应用模式,支持科研团队按需调整分析参数,并提供参数模板库以适配不同材料场景,降低了技术应用门槛。 # 7. 应用实效: 材料显微图像智能分析模型已在多个材料科学研究领域实现应用,覆盖电池材料、煤化工催化剂、氢能催化剂、碳纤维及粉煤灰利用等方向,覆盖科研机构及化工企业实验室,验证了其在材料分析中的实际价值。平台上线后,已处理超过2156张SEM图像,模型调用次数达2634次,支持超20个科研项目的开展,累计节省约170小时的人工标注与统计时间。 一方面智能模型替代传统人工操作,解决了SEM图像分析中颗粒密集分布、形态多样性及团聚噪声干扰等问题。例如,在研发MTO/ZSM-5分子筛催化剂过程中,模型解决了传统方法在测量分子筛SEM图像中颗粒尺寸时因团聚或光学干扰产生的误差问题,达到对分子筛的孔道结构、晶体形貌及颗粒分布进行高精度表征,更全面地了解其催化活性位点分布和反应路径,从而为优化催化剂的制备工艺,提高其在甲醇制烯烃等反应中的选择性和稳定性提供深层次的洞察,显著提升科研工作效率的效果。 另一方面在粉煤灰分级利用研究中,基于模型的高效准确智能分割能力,通过分析颗粒尺寸分布,快速筛选出适合制备高性能材料的粒径区间,解决了传统方法在测量粉煤灰颗粒尺寸时因团聚或光学干扰产生的误差问题,达到高分辨表征粉煤灰的微观形貌、颗粒分布、孔隙结构等特性,准确率达到 $95\%$ 以上,远高于人工标注和统计。另 外,基于模型的应用平台支持批量处理(单次可分析超100张图像)及灵活的参数配置(如阈值调整、粒径范围筛选),通过多图的批量处理、分析和筛选,可在10秒内处理单张包含约500个颗粒的SEM图像,并输出直径和面积等分布统计结果和曲线,而传统人工标注需耗时超过20分钟,分析速度提升至人工的200倍,帮助科研人员全面快速地了解其在不同利用途径中的适用性,为实现粉煤灰的高效分级利用,开发高附加值产品提供更详细、准确的材料特性信息。 模型上线以后,集团准能科创中心、中科院物理所、山西煤化所、广西大学、德国弗劳恩霍夫材料回收与资源策略研究所(安卡院士团队)、ThermoFisher(原FEI)、蔡司、日立、国仪量子等国内外多家单位应邀试用,样品涉及催化剂、电池材料、多孔材料、粉煤灰、金属材料、合金、陶瓷、细菌等多种类别,分析结果得到用户的肯定和好评。 上述应用表明显微图像智能分析模型能够满足不同材料场景的实际需求,显著降低了SEM图像自动和高通量分析的技术门槛,提升了科研工作效率。 # (六)统一NMR智能解析在化学与材料科学的应用 # 1.案例实施单位: 厦门大学、深势科技(宜宾)有限公司 # 2.案例背景: 核磁共振(NMR)是化学、生物学和材料科学中用来解析分子结构和动力学的重要工具。准确预测NMR化学位移对光谱解析、结构修订以及构型确定具有重要意义。因此,研究结构与光谱之间的关系至关重要,它不仅影响光谱解析的精确度,还直接关系到分子结构的正确解析及材料设计的优化。 # 3.案例概述: 本项目提出了NMRNet,一个基于SE(3)Transformer架构的深度学习框架,采用预训练与微调的范式,旨在精准预测液相和固相NMR的化学位移。通过对原子环境的建模,NMRNet能够统一处理不同状态下的NMR数据。此外,项目还构建了一个全面的基准数据集,并通过多个液相与固相NMR数据集验证了NMRNet的优越性,展示了其在实际应用中的鲁棒性和有效性。 # 4.行业痛点: 传统的NMR化学位移预测方法,在面对复杂分子结构时,往往难以兼顾准确性与效率。同时,现有的深度学习框架多针对液相或固相NMR进行单独设计,缺乏通用性。另一方面,实验性NMR数据较为稀缺,这对模型的泛化能力构成了挑战。结构与光谱之间的复杂关系使得从分子结构预测光谱成为一项极具挑战性的任务。 # 5.项目获奖、专利授权及获得投融资情况 发表学术文章一篇:《Toward a unified benchmark and framework for deep learning-based prediction of nuclear magnetic resonance chemical shifts》 # 6.案例详述: # (1) 总体思路 本项目旨在打破传统的液相与固相核磁共振(NMR)化学位移预测各自为政的局面,建立一个统一的深度学习预测框架。总体思路是采用“预训练-微调”的范式:首先利用海量的分子和晶体三维结构数据进行自监督预训练,使模型学习到通用的原子环境表征,从而缓解实验NMR数据稀缺的问题并提高模型的泛化能力。随后,针对具体的液相或固相NMR数据进行监督微调,以适应不同的物理状态和化学环境,最终实现对多样化化学系统(从有机小分子到复杂固体材料)的高精度、高效率光谱预测。 # (2) 软件平台 本项目开发的NMRNet是一个集成了数据准备、预训练、微调和推理四个模块的综合性深度学习工具,现已集成至人工智能应用电化学实验室(AI4EC)在线app平台。 核心能力方面,能够统一处理液相、固相甚至气相状态下的原子级任务,进行精确的NMR化学位移预测。应用场景方面,不仅提供数值预测,还支持峰归属(Peak Assignment)、构型确定(Configuration Determination)和结构分析等关键应用,帮助研究人员深入理解结构 与光谱的相关性。用户服务方面,为提高易用性,平台包含一个基于Web的工具,使研究社区能够简便地进行化学位移预测。数据资源方面,平台内置了经过清洗和验证的标准化基准数据集(如nmrshiftdb2-2024),为模型评估提供了可靠资源。 # (3) 技术方案 一是模型架构方面,采用基于SE(3)Transformer的模型架构作为核心,该架构能够有效捕捉原子的三维空间信息和局部化学环境。二是预训练机制方面,利用超过480万个结构进行大规模自监督预训练。三是采用掩码原子预测(Masked Atom Prediction)和三维坐标恢复(3D Position Recovery)作为预训练任务。引入对数加权重采样(Log-weighted Resampling)技术解决数据集中元素分布不平衡的问题。四是差异化微调策略,液相NMR基于单分子结构进行微调,输入原子类型列表和成对原子距离矩阵。固相NMR引入周期性边界条件(PBC),采用6Å的截断半径来定义局部原子环境,以准确描述晶体中的长程相互作用。五是推理与应用,在推理阶段冻结模型参数,将其应用于各类下游任务,如利用预测的化学位移与实验值的比对来进行立体化学异构体的鉴定。 # (4) 关键指标参数 在液相 NMR 预测精度方面,在实验场景中验证,NMRNet 的 ${ }^{1} \mathrm{H}$ NMR(氢谱)平均绝对误差(MAE)为 $0.18 \mathrm{ppm}$ , ${ }^{13} \mathrm{C}$ NMR(碳谱)平均绝对误差(MAE)为 $1.09 \mathrm{ppm}$ 。在固相 NMR 预测精度方面,在 P2 型 $\mathrm{Na}_{2 / 3}(\mathrm{Mg}_{1 / 3} \mathrm{Mn}_{2 / 3}) \mathrm{O}_{2}$ 材料中, ${ }^{23} \mathrm{Na}$ 的化学位移预测均方根误差 (RMSE)为 $48~\mathrm{ppm}$ ; 对于分子晶体的 ${ }^{1} \mathrm{H},{}^{13} \mathrm{C},{}^{15} \mathrm{~N},{}^{17} \mathrm{O}$ 固体 NMR 数据,预测结果与密度泛函理论(DFT)计算值表现出高度相关性。 # 7. 创新情况: # (1) 技术创新 在数据层面,一方面项目建立了一个全新的、标准化的基准数据集nmrshiftdb2-2024。该数据集通过对现有数据库(nmrshiftdb2)进行手动筛选、纠正错误条目和广泛的清洗验证而创建。新的数据集相较于旧版(nmrshiftdb2-2018)包含更多的原子、更广泛的元素范围和更复杂的结构,为评测模型在更具挑战性、更接近真实场景的任务中的表现提供了可靠基准。另一方面为预训练收集了包含超过480万个结构的广泛结构数据库。大规模的预训练旨在缓解实验性NMR数据稀缺的问题,并提高模型的泛化能力。 在模型层面,提出了一个名为NMRNet的统一深度学习框架。该框架的核心是采用了SE(3)Transformer架构,使其能适应原子级的表示,并扩展到固相、液相和气态体系。现有的深度学习框架通常只针对液相或固相NMR,限制了其通用性。NMRNet通过共享的架构和统一的框架,首次实现了对液相和固相系统原子环境的有效建模。 在算法层面,一是采用了“预训练与微调”范式。预训练阶段使用大型结构数据库进行自监督学习,任务包括掩蔽原子类型预测和3D坐标重建。预训练使模型能学习到原子环境的鲁棒表示。对比实验证明,使用预训练权重可以显著降低预测误差,尤其是在训练数据量有限时(如 $^{19}\mathrm{F}$ )。二是针对固相系统,开发了基于截止半径的局部环境 表示策略,并结合了针对晶体数据库的专门预训练。该策略被证明在固相NMR预测中表现最佳,优于仅使用晶胞或未针对晶体优化的预训练策略。三是在晶体预训练阶段,实施了对数加权重采样方法。此举解决了预训练数据中元素分布极度不均的问题,确保模型能有效学习稀有元素的化学环境。 在价值对齐(可解释性)层面,利用Transformer模型的多头注意力机制来可视化和分析原子间的相互作用。该技术提供了一种无需先验化学知识即可分析原子级相互作用的工具,增强了光谱解析和对复杂材料结构-性质关系的理解。 # (2) 模式创新 在解决方案创新层面,NMRNet 提供了一个集成的四模块框架(数据准备、预训练、微调、推理)。该框架不仅能进行高精度预测,其推理模块还被设计用于解决实际的化学问题。该框架超越了数值预测,将深度学习模型的能力从单纯的光谱预测拓展到更复杂的下游化学应用,包括:光谱峰归属、构型确定与结构修正与手性异构体鉴定。 在服务模式创新层面,项目成果以基于Web的工具和在线服务的形式提供。这种模式增强了模型的可及性,为广大的研究社区(包括非AI专业的化学家)提供了简化的化学位移预测服务。 在应用范围拓展层面,NMRNet是统一框架,其应用范围同时覆盖了液相和固相NMR。该模型被证实可广泛应用于多样化的化学系统,包括天然产物、大型有机分子(多达150个原子以上)和固体材料,展示了强大的泛化能力和外推鲁棒性。 # 8.应用实效: # (1) 案例应用场景 NMRNet 框架已在多个关键科研与工业场景中实际落地应用。其核心应用是高精度的核磁共振(NMR)化学位移预测,并在此基础上拓展至多种复杂化学任务:一是光谱解析与结构阐明。作为化学、生物学和材料科学中的基础工具,辅助研究人员解析光谱,修正或确定分子结构。二是构型与立体化学确定。解决传统光谱解析中极具挑战性的任务,包括结构修正(如 TIC10、nevirapine)和手性 R/S 异构体的鉴定。三是光谱峰归属。将实验测得的 NMR 信号自动匹配到分子结构中的特定原子。四是材料设计与分析。应用于复杂固体材料的分析,例如 P2 型阴极电池材料,以及分析原子级相互作用以理解结构—性质关系。五是公共安全。应用于关键分子的识别,如对五种神经毒剂的化学位移进行精准预测,为应对新型化学威胁提供支持。 该案例的目标用户是化学、生物化学、材料科学以及药物研发等领域的科研人员、工程师和学生。目前,该项目已通过在线服务实现了广泛部署。截至目前,该应用已吸引超过5,000名用户订阅,累计处理了超过1,700次预测任务提交,显示出研究社区的高度活跃度和对该工具的实际需求。 # (2) 解决行业痛点情况 一是解决了准确性与效率的平衡问题。传统方法在面对复杂分子时难以兼顾准确与高效。NMRNet 在保持高精度的同时,展现了对大型复杂分子的强大外推鲁棒性。二是解决了模型的泛化性限制。现有 深度学习框架通常局限于液相或固相之一。NMRNet 通过统一的 SE(3)Transformer 架构和预训练范式, 首次实现了对液相和固相 NMR 预测的统一建模, 并均达到顶尖水平。三是缓解了实验数据稀缺的瓶颈。实验 NMR 数据稀缺限制了模型的泛化能力。NMRNet 通过在超过 480 万个无标签结构数据上进行大规模预训练, 成功学习了原子环境的鲁棒表示, 显著提升了模型在数据稀缺任务上的性能。 # (3)经济社会效益 社会效益方面,该框架为分析化学和结构化学领域提供了强大的AI辅助工具,推动了该领域的发展。它通过提供开放的工具和服务,降低了高精度计算化学的门槛,使全球研究者受益。同时,其在神经毒剂识别等领域的应用也展现了潜在的公共安全价值。经济效益方面,NMRNet能够显著加速新材料(如电池材料)和新药物的研发周期。通过提供比肩甚至超越传统DFT方法的预测精度,它极大降低了研发过程中对昂贵算力和时间的依赖,为企业和研究机构节省了大量的研发成本。 # (4) 示范推广价值及现状 NMRNet 作为统一 NMR 预测框架的成功范例,具有极高的示范推广价值。其“大规模结构预训练+领域数据微调”的策略可被推广至其他光谱(如拉曼、红外)或材料性质预测任务。项目推广现状良好,获得了学术界和产业界的广泛认可。从学术影响力来看,相关论文发表后,已迅速获得超过 10 次引用,表明其学术价值和创新性得到了同行的认可。从产业与科研合作来看,项目已与多家企业、高校和研 究院所达成合作,将NMRNet框架集成到不同的科研和工业体系中,有效助理了科研进度。 # (5) 开源情况 该项目秉持开放科学精神,成果已全面开放。NMRNet 框架的源代码已在 GitHub 和 Zenodo 上开源。目前,GitHub 仓库已获得超过 45 个星标(star),吸引了业界的关注。一方面是模型开源,所有预训练的模型参数均在 Zenodo 上公开,便于复现和二次开发。另一方面是数据开源,所有用于微调的处理后 NMR 数据集,包括新建立的基准,均已在 Zenodo 上发布,已获得超过 400 次下载和 900 次访问。 # (6) 相关标准成果产出 本项目最重要的成果之一是建立了一个新的行业标准基准:一方面是数据集,项目通过对现有数据进行广泛的清洗、验证和手动纠错,建立了一个更全面、更可靠的NMR化学位移基准数据集nmrshiftdb2-2024。另一方面是统一基准框架,NMRNet框架本身也为评估跨越液相和固相的NMR预测模型提供了一个统一的基准平台。 # (七)基于科研智能的锂电电解液研发 # 1.案例实施单位: 嘉庚创新实验室、厦门智储大装置研究院有限公司、厦门依华智慧科技有限公司 # 2.案例背景: 本案例构建了一套人工智能驱动的锂电电解液智能研发系统。该系统通过集成高通量自动化制备平台、多模态在线表征技术和大模型,实现了电解液配方从“设计-配制-测试-优化”的全流程闭环研发。有效将研发人员从重复性劳动中解放,极大提升了实验通量和数据一致性,显著缩短了研发周期,为快速获得高性能、高适配性的电解液配方提供了全新的智能化解决方案,并首次在低温电解液领域实现了“干湿闭环”。 # 3.案例概述: 本案例构建了一套人工智能驱动的锂电电解液智能研发系统。该系统通过集成高通量自动化制备平台、多模态在线表征技术和大模型,实现了电解液配方从“设计-配制-测试-优化”的全流程闭环研发。有效将研发人员从重复性劳动中解放,极大提升了实验通量和数据一致性,显著缩短了研发周期,为快速获得高性能、高适配性的电解液配方提供了全新的智能化解决方案,并首次在低温电解液领域实现了“干湿闭环”。 # 4.行业痛点: 当前锂电池行业面临三大难题:一是效率瓶颈,电解液研发依赖 人工试错,配方空间巨大,导致研发周期长达数年,无法满足市场快速迭代需求。二是数据瓶颈,人工操作易引入误差,数据质量差、一致性低,难以构建高质量数据库以支持有效的构效关系分析和模型训练。三是能力瓶颈,传统手段仅能监测电压、温度等宏观参数,对析锂、副反应等微观安全隐患缺乏有效的原位、实时监测与预警能力,制约了电池安全性能的提升。 # 5.案例详述: # (1) 总体思路 本系统围绕锂离子电池电解液材料研发的迫切需求,瞄准人工智能和高通量自动化实验技术对缩短其材料筛选与优化周期的显著优势,通过人工智能筛选、高通量自动化制备技术、电池自动化装配技术和材料电化学性能高通量表征深度融合,解决电解液材料选择和配方设计决策等关键问题,通过人工智能预测及高通量制备系统所获取实验数据,助力电解液材料筛选效率的提升。 # (2) 软件平台 项目组自主建设了基于科研智能的锂电电解液研发系统,实现了智能化自动化制备、能源电池工况表征和数据驱动算法的闭环研发,及实验室仪器设备的全链条国产自主可控,建立了面向产业的锂电电解液研发新范式。通过与国家能源实验室和龙头企业开展深度战略协同,共同构建了“基础理论—技术攻关—标准制定”三位一体的创新生态,为引领新能源材料研发智能化变革、服务国家能源安全战略提供核心支撑。 # (3) 技术方案 基于科研智能的锂电电解液研发系统由“手、眼、脑”三个模块组成。一是“手”代表电解液智能制备模块,配备智能机器手,可执行编程控制、长时间不间断工作,自动高通量完成电解液配置、表征检测定制实验。通过自动化集成和AI学习决策指导,有效缩短材料研发周期、节约人力成本,有效结合领域学科积累、数据分析挖掘、机械自动化,将直觉经验数据化,减少无效试错,实现电解液材料的理性设计和精准配置。二是“眼”代表能源电池工况表征模块,能够实时监测并反馈电池制造和运行过程中的关键参数,显著提高电池器件的制造良率,确保生产过程的精确性和一致性以及电池使用过程中的安全监测。三是“脑”代表闭环调控模块,通过引入“工况表征一精准解析一实时调控”智能闭环系统,实现储能锂离子电池异常早期预警和精准调控,革新电池的研究范式,推动电池技术向更高效、更安全的方向发展。 # (4) 关键指标参数 一是智能扣式电池组装设备单机通量大于2500枚/周,较传统人工效率提升50倍;二是无人干预情况下自动运行连续工作时长大于240小时;三是数据生产质量显著提升,在无数据筛选模式下克容量波动率(COV)小于 $0.67\%$ 、库伦效率波动率小于 $0.45\%$ ,而在启用 $80\%$ 数据分析后,克容量波动率进一步降至 $0.40\%$ 以下,库伦效率波动率更优化至 $0.05\%$ 以内。 # 6. 创新情况: # (1) 技术创新 创新性地实现了锂电池电解液“干湿闭环”研发范式,针对非常规温度条件下的电解液研发需求,通过自动化实验完成40组配方筛选,精准锁定四元电解液配方最优值,为极端工况下电解液的性能优化提供了高效解决方案,推动了电解液研发从传统试错向数据驱动的范式转变。 数据采集层面,本系统深度融合AI技术与自动化实验平台,实现了多源异构数据的统一采集与实时处理。依托自动化电解液检测平台(包括电导率、拉曼光谱等多维度表征设备),系统集成电压、电流、温度、压力及气体排放等关键参数,并融合电化学工作站、质谱仪等设备输出,构建覆盖“配方—结构—性能”的电池电解液多模态数据库。AI驱动数据清洗模块自动剔除噪声与异常值,实现高通量、高一致性数据预处理,显著提升数据质量与可用性,为智能推荐模型提供可靠输入。 算法优化层面,融合单目标与多目标参数协同策略。基于贝叶斯优化框架,首阶段(第1—3轮配方)聚焦4.4V库伦效率单目标寻优,快速锁定局部最优解;次阶段(第4—7轮配方)进行常压容量、高压库伦效率、高压容量以及常压库伦效率的多目标参数协同优化,实现在广泛参数空间内进行配方性能搜索。材料推荐模型通过持续学习实验数据,实现了更高的推荐精度,突破传统试错研发的盲目性。 性能与安全监测方面,发展多模态谱学工况表征和传感方法,集成电化学阻抗谱(EIS)、在线电化学质谱(OEMS)和光纤传感技 术。EIS 精准解析电池内部电阻/电容动态变化,捕捉离子扩散异常等;OEMS 监测氢气、一氧化碳等副产气体浓度,预警热失控风险;光纤传感器技术能够实时监测电池内部的温度、压力和应力等关键参数,防止安全事故的发生。这种“电化学—气体—力学”多模态联用方案,实现对电池从微观反应到宏观热失控的全链路监控。 # (2) 模式创新 创建研发流程革命的无人实验室新范式。系统通过构建具身智能研发平台,集成机械臂智能化配置、多模态表征设备监测及人工智能决策,形成“配置—表征—优化”闭环,显著缩短研发周期,推动电解液研发从“试错法”转向“理性设计”,形成可复制的智能化研发框架。 一方面建立产学研深度协同的产业化加速机制。联合国家实验室协同开展国家级战略研究,参与筹建能源领域国家实验室体系创新联盟,开发适用应用场景的智能优化算法,赋能从假设提出到实验优化的干湿实验闭环;与龙头企业共建联合研究院,开展千万级科研项目合作。另一方面拓展跨领域的智能研发服务生态。将电解液智能研发平台复用至机械加工切削液配方开发、氢能膜材料工艺等领域,形成覆盖新能源、高端制造的智能材料研发服务体系。 # 7. 应用实效: # (1) 目标用户及应用情况 与新能源龙头企业密切合作,共同搭建了基于AI算法的电池关键原料智能研发系统,实现原料的智能制备、自动表征、配方的智能筛选和迭代。目前,系统的无人化配置及在线表征硬件已通过企业转 阶段验收,具备每日100组配方及每种电解液配方5种表征数据的智能研发能力,集成拉曼光谱、电导、饱和蒸汽压和黏度等多维自动化表征手段,实现了数据的智能化处理与分析,有效支撑了高性价比电解液的快速研发。 # (2) 标准编制与成果输出 团队积极参与智能实验室国标体系建设任务。由本项目团队牵头编制的《智能实验室行业发展报告》也将于近期发布。 # (八)深势科技Piloteye®电池设计智能研发平台 # 1.案例实施单位: 北京深势科技有限公司、深势科技(宜宾)有限公司 # 2.案例背景: 电池作为现代社会的核心储能载体,已深度融入电动汽车、移动电子等战略领域。随着“双碳”目标的推进与新能源产业的爆发,市场对电池安全性、快充效率、循环寿命等提出了更高要求。然而,电池研发往往涉及从微观反应机理到宏观电芯结构设计的跨尺度科学难题,且传统研发模式受限于单一尺度研究手段,难以实现多物理场耦合的系统性突破。在此背景下,深势科技推出Piloteye®电池设计智能研发平台,助力电池材料开发与电芯设计的智能化升级。 # 3.案例概述: Piloteye®电池设计智能研发平台是深势科技自主研发且全球领先的电池设计自动化平台。平台基于机器学习、跨尺度建模等先进算法,为电池企业提供从Read-文献调研、Design-实验设计、Make-合成制备、Test-表征测试到Analysis-分析优化的一站式智能解决方案。平台通过构建材料微观尺度到电芯宏观性能的跨尺度预测体系,打破传统研发的信息壁垒,实现研发效率与创新能力的双重提升。自推出以来,已与多家头部电池企业展开合作,成功应用于电极材料开发、电芯性能优化等项目。 # 4.行业痛点: 当前,电池行业面临诸多痛点。一方面,传统试错法研发周期长、 成本高、创新难,难以快速响应市场对电池高速迭代的需求,尤其是近年来备受关注的电池的安全性、稳定性、快充效率、循环寿命及能否大规模储能等。另一方面,电池研发涵盖从微观反应机理到宏观电芯结构设计的跨尺度复杂过程,涉及材料相变、离子输运、物化稳定性、析锂检测等诸多难题,传统手段难以高效解决。此外,负极新材料体系开发等关键领域也存在技术瓶颈,亟待智能化工具加速研发进程。 # 5.项目获奖、专利授权及获得投融资情况: 奖项方面,Pilotye电池设计自动化计算平台入选全球数字经济大会《2024北京数字经济标杆企业成果集》、第七届数字中国建设峰会《2024中小企业数字化转型典型应用案例》、36氪《AI Partner·2024年AI应用标杆案例》;专利授权方面,包括一种用于锂电池电解液模拟的工作流任务处理系统;一种用于构建极化力场模型的处理方法和装置。 # (1) 总体思路 随着国内外新能源产业的高速发展,电池材料的设计研发成为制约产业进一步突破的关键环节。传统的研发模式依赖试错法,存在周期长、成本高、效率低等痛点问题。深势科技围绕这类电池领域企业研发的关键需求,主要针对电极材料、电解液以及电芯这三个方向的应用场景,推出Piloteye®电池设计智能研发平台,从创新算法、工程化及“最后一公里”落地等方面系统的赋能电池材料开发和设计,为电池材料开发者提供创新算法与行业know-how相结合、操作便捷的 平台类工具。 # (2) 软件平台 深势科技Piloteye®电池设计智能研发平台是基于AI for Science新范式,利用Deep Potential系列多尺度建模算法、Uni-Mol分子大模型、DPA原子大模型、Uni-ELF配方大模型、具有GPU加速与自动微分功能的新一代电化学计算模型、电芯老化模式定量分析算法等一系列人工智能新技术,致力于突破电池研发难点的电池设计自动化平台。平台从材料性质参数出发,预测材料颗粒的物化性质,进一步模拟电极与电芯尺度的性能;同时对加工工艺进行理性建模,同步模拟加工工艺对电极、电芯性能的影响,提高了电池设计的精确度和可靠性,并大幅缩短创新到量产间的周期,推动电池材料“设计理性化”、“开发平台化”和“制造智能化”的实现。 # (3) 技术方案 深势科技Piloteye®电池设计智能研发平台整体架构从底层到顶层依次为数据库、模型库和应用平台,三层紧密相连、协同运作,聚焦电池材料从理论设计到实验验证的核心环节,为电池研发设计提供全流程的智能化升级服务。 图21 深势科技Pilotye®电池设计智能研发平台整体架构 来源:北京深势科技有限公司 数据库层:由深势科技玻尔科研空间站的数据库提供服务,其公共数据库涵盖电解液分子、正极材料等多领域的丰富数据资源,包括但不限于文献、专利、表征、测试、工艺等数据,且在实时更新拓展中,面向电池研发领域提供数据检索、结构保存、分子SMILES导出等功能,为电池研发提供全面、专业的数据支持。 模型库层:利用Deep Potential系列多尺度建模算法,融合电芯老化模式定量分析算法、Uni-Mol分子大模型、DPA原子大模型、Uni-ELF配方大模型等多种能力,突破电池研发设计研发难点。 应用平台层:由 AI 读文献、AI 做计算、AI 做实验三个模块支撑组成应用平台层,实现电池研发设计全流程的系统打通、加速闭环,直接解决传统电池研发依赖“试错法”、成本高、效率低、创新难等痛点问题。AI 读文献方面,由 Uni-SMOTE 科学文献大模型作为数据底 座,Uni-Finder文献阅读和信息提取系统提供知识库检索、数据整合、交互问答等服务,对电池材料研发设计涉及的分子结构、关键信息等进行分析总结。AI做计算方面,由原子尺度的DFT计算、分子尺度的分子动力学模拟等多尺度模拟手段和Uni-Mol分子构象大模型、DPA原子大模型、Uni-ELF配方大模型驱动,可实现第一性原理正极掺杂筛选评估、“百万级”电解液配方设计和筛选、高精度固态电解质预训练大模型性质预测、高精度高效的电芯短期性能预测等多项关键场景的计算实践。AI做实验方面,由SimpFine数据建模与分析平台和基于Uni-AIMS表征大模型的智能化电镜图像分析软件支撑,涵盖数据建模、数据预测、采样优化,表征分析等多种功能并可根据电池研发设计需求自由组合。 # (4) 关键指标参数 一是平台预测电解液分子、配方的输运性质、电化学性质可达到高达 $95\%$ 的预测精度,可将研发周期缩短至传统实验周期的三分之一;二是平台预测固态电解质不同掺杂方案的离子电导率,计算结果和实验数据吻合度较高,超过 $90\%$ ,加速固态电解质研发周期;三是平台通过电化学参数辨识以及利用电化学模型进行电芯短期性能预测,计算效率提升2-3倍,替代 $60\%$ 实验测试;四是基于平台工艺优化工具,通过数据搜集—算法建模—采样优化—迭代反馈,使用主动学习+实验强耦合,经过少量的优化迭代提高材料的性能,将开发成本减少至一半;五是平台基于高精度的电镜图像识别算法,颗粒识别准确率> $90\%$ ,边界形状准确度 $>95\%$ ,单张图片分析时间 $< 1$ 分钟,与人工分析相比效率提升约30倍。 # 6. 创新情况: # (1) 技术创新 一是基于Uni-Mol电解液分子模型、Uin-ELF电解液配方设计模型以及分子动力学方法对电解液分子和配方物性进行高通量高精度的快速预测,实现配方的设计和筛选。目前已支持将电解液探索空间扩展至 $10^{\wedge}20$ ,性质预测精度高达 $95\%$ ,配方设计研发周期缩短至1/3。 二是在第一性原理精度下对电池正极材料进行全面性质计算和掺杂评估。基于 DeePMD、主动学习策略等先进手段,建立可描述广泛正极掺杂空间的量子力学精度的势函数模型,基于该势函数模型能实现快速精确的材料性质探索,计算效率比主流 DFT 方法快 1000 倍。涵盖 27 种元素, $12\mathrm{w}+$ 样本数的 DPA 固态电解质原子大模型,具有第一性原理预测精度。基于该模型能模拟复杂组分固态电解质的性质,筛选最优固态电解质配方。 三是通过高效的参数优化和并行计算算法,对电化学模型参数进行辨识,利用精度更高的电化学模型预测电芯短期性能,计算结果与输入实验测试结果具有定量级的可比性。 四是通过建立基于多模态数据的正极前驱体工艺性能预测模型并对前驱体工艺进行优化,生产成本降低 $30\%$ ,研发效率提高4倍。除此之外还广泛应用到电池原材料配方设计、溶液性能调优、金属成分工艺设计、陶瓷工艺性能设计等多个领域。 五是利用深度学习算法准确识别SEM图像的形态、尺寸、组成和分布,自动化批量处理电镜图像,与实验形成有效迭代,提升识别分析效率。 # (2) 模式创新 一是解决方案创新,即多尺度模拟与AI融合的创新算法体系。平台创新性地整合了从微观到宏观尺度的建模与仿真方法,将DPA、Uni-Mol、Uni-AIMS和电化学模型AI自动调参等一系列基于AI for Science原理和数据驱动的创新算法融入电池研发过程。弥补了传统通用性仿真软件中经验参数过多导致模型精度不确定的缺陷,实现了从微观材料性质计算到介观材料颗粒物化性质,再到电极电芯尺度电化学性能的“全链条”全局优化,提高了计算模拟研究电池的精度和可靠性。 二是服务模式创新,即端到端的一站式智能解决方案。平台聚焦电池研发设计的正极材料、CEI、负极材料、电解液、SEI、电极、电芯、工艺等多个关键环节,通过多场景端到端的APP应用,实现文献解析、智能计算与实验仿真三轮驱动,为电池全生命周期的开发设计提供一站式智能解决方案,并根据个性化需求提供定制化服务,将传统试错式的电池研发模式转变为基于理性设计的智能研发模式,助力产业升级。 三是用户友好的交互设计与协同服务。平台采用了用户友好的设计理念,通过清晰的工作流、简单的输入和可视化交互的方式实现高通量、数据管理等一系列能力,让不同应用场景的研发人员都能轻松 上手,降低用户使用门槛,高效进行电池研发。 # 7. 应用实效: # (1) 正极掺杂计算 在电极材料的预测分析环节,平台基于 DeePMD 方法和 DPA 原子间势函数预训练模型,评估预测正极材料和固态电解质全掺杂空间的关键性质,准确度与实验可比,效率比主流方法快至少 1000 倍。平台支持产品级正极材料和固态电解质掺杂评估,交互式完成万级别的材料筛选,加速新材料研发周期缩短至原来 1/3。 图22 正极材料和固态电解质掺杂评估 来源:北京深势科技有限公司 电池研发企业多氟多目标通过掺杂改性开发高性能钠电正极材料。深势利用“正极性质计算”APP功能计算不同掺杂方案下正极材料的基本性质,快速筛选出性能表现最优的掺杂方案,经客户实验验证50周容量保持率提升 $5\%$ ,加速正极材料开发。 # (2) 电解液配方筛选 基于 Uni-Mol 分子三维结果预训练模型, 准确预测电解液全分子空间的多种关键物性, 快速推荐候选目标分子。基于 Uni-ELF 配方模 型,几分钟内准确预测上千个电解液配方关键性质结果,快速设计和优化电解液配方。产品级电解液分子和配方性质预测和高通量筛选,一键式获得电解液配方性质报告,加速筛选流程,将百万级配方筛选缩短至天。 图23 电解液分子及配方预测和筛选 来源:北京深势科技有限公司 头部新能源车企广汽埃安目标筛选耐高压的电解液配方。深势结合客户的实验经验,利用Uni-ELFAPP分子生成以及物性预测功能,帮助客户从千万级空间中筛选十个符合目标需求的候选分子,经过客户实验迭代和验证,理论耐氧化电位大幅提升,电导率提升近1倍。 # (3) 电芯性能预测 平台基于电化学模型预测电芯性能,与实验测试结果进行详细对比分析。结合电芯机理模型,全面、准确、定量分析电池循环过程中各种衰减模式。利用AI数据驱动方式,基于少量电芯早期测试数据精确预测电芯健康状态。产品级电芯设计工具,涵盖“电芯仿真设计 ->测试->分析->优化”全流程,一键式完成电芯性能的综合评估,将过去几个月的实验测试缩短至天级别。 图24 电芯设计流程图 来源:北京深势科技有限公司 电池研发企业多氟多目标在已有的电芯数据基础上,快速评估电芯的长期性能,加速电芯开发迭代。深势引入AI机理模型有效处理已有的测试数据,对客户设计的电芯容量衰减情况进行全面的评测,预测结果与实验结果相比,误差不足 $1\%$ 。 # (九)基于专用算力的电解液AI数据平台建设 # 1.案例实施单位: 上海思朗科技股份有限公司、长江(孝感)3D科学计算中心、上海科学智能研究院 # 2.案例背景: 电解液是电池中离子传输的关键介质,作为新能源电池的核心材料之一,直接影响电池的能量密度、循环寿命、安全性及适用温度范围,这些关乎新能源电池的性能。由于电解液的结构的复杂性以及配方成分的多样性,传统实验手段需投入大量的人力物力成本,且研发效率低下,难以满足市场对新型电解液材料的开发需求,亟需新的研发模式。 人工智能技术的兴起带来了新的思路,借助电解液数据集训练领域专用模型,成为加速电解液材料设计的重要破局手段之一。然而,当前既有的电解液数据集普遍存在配方覆盖不足、体系规模受限等局限性,难以支撑起AI4S在电解液研发领域落地,行业在呼吁更高质量的AI-ready的电解液数据集建设。 # 3.案例概述: 本案例借助“天穹”材料计算专用科学计算机以及专为专用硬件架构设计的 Logic MD 软件,对不低于 10000 组电解液体系进行长时间大尺度的分子动力学模拟,其中单体系模拟时间至少 $25 \mathrm{~ns}$ ,模拟尺寸达到 10 万原子级别,确保模拟计算数据结果具备统计稳定性与物理可靠性;针对每组模拟轨迹,提取并计算其密度、黏度、扩散系 数、电导率、介电常数、结合能等关键物理化学性质;针对上述得到的电解液性质数据,进行智能化标注管理,并构建多模态检索功能、元数据管理功能、数据资产管理功能,形成便捷的对外服务接口。同时,利用上述电解液数据训练先进的机器学习模型,建立从电解质的分子结构(或配方组成)到其宏观物理化学性能的精准、快速的定量构效关系模型,实现近乎实时地预测新分子或新配方的性能。 # 4.行业痛点: 电解液设计面对巨大的挑战:一是化学空间庞大,潜在的溶剂、盐、添加剂组近乎无限,传统试错法效率极低;二是多目标很难同时优化,单一模型仅预测单性能(如电导率),缺乏统一框架协同优化多指标,现有模型仅适用特定电解液类别,泛化性差;三是实验数据分散且规模小,覆盖的化学空间有限,同时缺乏微观结构信息,难以预测配方设计所需的多种物化性质。与此同时,国内外现有电解液数据库存在配方覆盖不足、微观信息不足、体系规模较小等局限性,这些缺陷共同导致无法满足令人满意的电解液AI模型训练需求,电解液研发陷入低效循环,亟需构建覆盖完整化学空间的高精度数据库以突破瓶颈。 # 5. 案例详述: # (1) 总体思路 借助“天穹”材料计算专用系统,对不低于10000组电解液体系进行长时间大尺度的分子动力学模拟,其中单体系模拟时间至少25ns,模拟尺寸达到10万原子级别,打造面向AI for Science领域的高精度、 高可靠性电解液分子动力学数据库, 显著提升电解液分子动力学模拟的精度与效率, 以此为电解液 AI 大模型训练提供高质量数据支撑,突破传统电解液研发的瓶颈局限, 实现从经验驱动向数据驱动的根本性跃迁, 大幅缩短新材料研发周期, 有效降低研发成本。 # (2) 软件平台 平台以构建“算力-数据-模型”三位一体的科研创新底座为核心战略目标,依托思朗科技全球领先的专用科学计算机"天穹"与上智院数据治理平台的深度融合,实现从科学计算、数据治理、质量控制到模型训练的全链条能力升级。其中,思朗科技“天穹”专用科学计算机基于512颗MaPU架构芯片组成的 $8\times 8\times 8$ 立方体计算网络,辅以自研的SL-link通讯协议,实现分子动力学模拟效率较传统超算快2个数量级以上(达5,000-10,000ns/天),为海量电解液体系计算提供高效算力支撑。上智院提供的数据治理模块涵盖数据采集、清洗、标注、存储、验证的全流程治理体系,形成“计算加速-数据治理-模型训练”的完整技术闭环。这一创新平台通过算力与数据的深度协同,显著提升数据库精度与可用性,为行业构建可复用的科学智能基础设施奠定核心基础。 # (3) 技术方案 配方清洗和数据生产方面,针对行业应用需求与文献数据库,系统收集并清洗典型商用或学术关注度高的溶剂分子及锂盐配方组合,形成配方清单。利用“天穹”专用科学计算机对不低于10000组电解液体系进行长时间大尺度的分子动力学模拟,单体系模拟时间为至少 25 ns,模拟尺寸达到10万原子级别。为了确保模拟结果具备统计稳定性与物理可靠性,需对部分代表性电解液体系性质数据进行实验测量,基于实验数据对现有力场模型的精度进行评估并进行调优。 数据清洗归类后溶剂和锂盐种类贴近商业配方 10万原子电解液模型 图25 高精度锂电池电解液配方分子动力学数据库构建示意图 来源:上海思朗科技股份有限公司 关键物化性质提取方面,针对每组模拟轨迹,提取并计算其密度、黏度、扩散系数、电导率、介电常数、结合能等关键物理化学性质,并对得到的模拟计算数据进行集成标注、系统治理,构建结构化数据库。 电解液机器学习模型训练方面,利用上述高质量电解液数据集可训练先进的机器学习模型,建立从电解质的分子结构(或配方组成)到其宏观物理化学性能的精准、快速的定量构效关系模型,实现接近实时预测新分子或新配方的性能,为研发人员的快速迭代和配方优化提供强大且可靠的智能预测工具。 # (4) 关键指标参数 一是电解液体系配方数量不少于10000组,每组模拟体系原子数量不低于10万个,每组体系的分子动力学轨迹时间长度不低于25ns;二是确保 $95\%$ 以上的数据资产在完整性、规范性、可追溯性、可用性方面保持一致;三是完成标注平台产品能力部署,支持解析电解质数 据领域核心文件格式,包含电化学测试数据(CSV、Excel)、分子式smiles等,确保支持解析的文件格式不少于3种; # 6. 创新情况: # (1) 技术创新 一是全新的材料计算架构:形成面向材料计算的专用算力架构,支持10万原子体系规模的超快速模拟计算,突破传统计算平台的规模限制,为电解液研发提供前所未有的计算效率。 二是全新的电解液数据库:实现10万级电解液大体系模型仿真计算,可提供更多高价值的微观溶剂化结构信息,达到配方级完整电解液性质功能信息覆盖;仿真力场基于实验数据优化、验证,电解液数据精度高,数据质量更加可靠;覆盖的配方种类数多,AI成熟度高,可有效支撑电解液AI模型训练。 三是一体化全链路设计:突破传统数据平台单一功能的局限,创新性地将数据资产管理&治理、对外服务体系、集成标注能力三大核心模块深度融合,构建从数据采集、处理、标注到服务输出的完整闭环体系,实现科学数据全生命周期的统一管理。 四是多模态智能检索:针对科学数据的复杂性和多样性,创新性地融合文本、图像、数值、结构化数据等多种模态的检索算法,支持化学分子结构相似性检索、实验图像内容检索等专业化检索方式,实现跨模态语义关联和智能聚合展示。 五是任务驱动的智能标注调度:创新性地采用任务拆分算法和智能调度机制,将复杂标注任务高效分解为细粒度单元,支持基于标注 人员技能和专业领域的智能分配,实现标注工作的并行化处理和动态优化管理。 # (2) 模式创新 一是构建行业级数据基础设施,重塑新材料研发范式:项目依托具有完全自主知识产权的科学计算核心技术和软硬件产品体系,在分子动力学等关键领域实现2-4个数量级的计算效率提升;基于此构建覆盖10,000组电解液体系的标准化数据库,提供高精度、大规模、长时间的分子动力学模拟数据,形成面向AI模型训练的高质量数据基础设施。这不仅为电解液研发、AI辅助材料设计等提供核心数据支撑,更通过构建“算力-数据-模型”三位一体的科研创新底座,有效支撑我国在新型电池设计乃至新材料研发等战略领域形成技术代差优势,是夯实我国科技创新基础能力的关键举措。 二是推动 AI for Science 的产业化落地:项目成果将有效解决 AI 在材料科学领域应用的数据瓶颈问题,为 AI 大模型提供关键训练数据,解决 AI 在材料科学领域应用的数据瓶颈问题,推动 AI 在电池材料研发、电池管理系统优化等领域的应用,将传统“设计-合成-测试”流程重构为“数据驱动-AI 预测-实验验证”智能闭环,实现研发效率的大幅提升。 三是推动科学数据要素化和生态化:项目成果将推动材料学科学数据要素化和生态化。一方面,通过大规模建设物质科学领域的多模态语料库,显著增强科研数据供给能力;另一方面,通过加快科学语料的分类和有序开放共享,培育和壮大科学数据的种子用户群体,形 成广泛应用与价值转化的基础,进一步加速科研范式由算力驱动向数据价值驱动跃迁。 # 7. 应用实效: # (1) 案例应用场景 电池研发与优化方面,一是通过分析锂离子电池电解液成分(如溶剂、锂盐、添加剂)与性能的关系,优化配方设计。二是辅助开发宽温域( $-40^{\circ}\mathrm{C} \sim 80^{\circ}\mathrm{C}$ )极端环境电池电解液。材料科学研究方面,一是通过分子动力学模拟数据,辅助探讨验证电解液离子传输机制;二是筛选高稳定性、低成本的溶剂或功能性添加剂。机器学习与AI应用方面,训练模型预测电解液性能(如离子电导率),辅助特定性质的电解液设计开发,加速新材料发现。目前,该电解液数据集已上架国家新材料大数据中心,面向公众服务全国范围内的电解液乃至电池材料开发科研工作者。 # (2)目标用户及当前用户情况 目标客户为国内大型动力电池生产企业,以及国内诸多涉及电池材料研发的高校/科研院所。 # (3) 解决行业痛点情况 想要开发一款性能优异的电解液十分困难:化学空间庞大,潜在的溶剂、盐、添加剂组合近乎无限;加之现有可利用的电解液数据集往往覆盖的化学空间有限,缺乏足够体现微观结构的信息,导致难以预测配方设计所需的多种物化性质,也无法满足AI模型训练需求;同时,传统试错法效率极低,需要耗费大量的时间成本和经济投入, 难以满足现代更高性能电池技术迭代对于电解液的研发需求。行业亟需构建覆盖完整化学空间的高精度数据库,以及基于仿真模拟+AI技术手段的电解液研发新模式。 基于此背景,本项目通过强大的3D科学计算机对众多电解液体系进行大体系、长时间的分子动力学仿真模拟计算,从而得到高精准性、覆盖足够广度的高质量电解液数据集。一方面,通过进一步揭示了电解液微观结构层面关键性“构效关系”信息,另一方面能够有效支撑电解液AI大模型的训练开发,为AI4S在电池材料领域的落地实施打通了道路,最终助力实现新型电解液材料的高效开发。 # (4) 经济社会效益 电解液作为新能源电池的核心材料,传统试错方法的研发模式存在研发周期长、成本高的弊端,且需依赖大量实验验证,难以满足新能源产业快速发展的需求。本案例构建面向AI的高质量电解液分子动力学数据库,并推动AI赋能新型电解液材料研发落地应用,将显著缩短研发周期与成本,是推动我国电池技术革新和产业升级的关键路径。 与此同时,当前核心数据的竞争已上升为世界各国安全博弈的核心领域,国际上常用的材料数据库约 $90\%$ 由欧美国家建设,一旦这些材料数据库的访问对中国实施封锁,会极大阻碍中国材料研发的发展。本案例基于国产的软硬件基础设施,构建自主、安全、可控的面向AI的高质量电解液分子动力学数据库,是有效抵御国外相关材料数据库“卡脖子”风险、确保新材料产业链创新链安全的必要手段。 # (5) 示范推广价值及现状 本项目深刻践行国务院印发的《关于深入实施“人工智能+”行动的意见》要求,高度契合国家支持的“AI+科学技术”以及“人工智能+”产业发展,将助力打造国内AI4S在电解液材料领域落地应用的标杆样板,并成为AI在其他新材料,如橡胶材料、玻璃材料、水泥材料等研发领域推动新范式落地的典型示范。 # (6) 开源情况 一方面,本案例涉及的电解液数据库一期上架国家新材料大数据中心,直接面向公众用户,服务全国范围内的电解液乃至电池材料开发科研工作者与企业研发人员。另一方面,案例中涉及基于“天穹”科学计算机构建的“算力—数据—模型”三位一体的科研创新“底座”平台,并将融入国家"1+N"架构体系的材料数据资源网络,成为重要的材料计算数据节点,通过对外提供算力服务接口,为广大的新材料科研工作者与企业研发人员提供高质量的材料仿真模拟算力服务;同时,平台也提供便捷完备的软件编译开发环境,能够让材料计算科学家围绕特定的计算任务需求灵活自主地设计相应的软件功能,满足各类计算场景需求。 # (7) 相关标准成果产出 本案例服务于3家以上科研机构或企业,同时,围绕力场模型发表1篇文章和申请1篇专利。 # (十)基于数理双驱模型组合的二维材料发现 # 1.案例实施单位: 北京百度网讯科技有限公司、苏州实验室 # 2.案例背景: 二维材料因其独特的量子限域效应与高比表面积,在柔性电子、光电、催化与储能等前沿领域具有重大应用前景。然而,新材料研发长期受限于传统“试错法”的高成本与长周期,且现有理论数据库规模有限、化学多样性不足,严重阻碍了“按需设计”的产业化进程。为突破此瓶颈,本项目旨在融合人工智能的数据驱动能力与第一性原理计算的物理机理,构建数理双驱的智能发现新范式,以实现对二维材料宇宙的系统性探索与高效定向设计,为前沿科技产业提供颠覆性的材料解决方案。 # 3.案例概述: 二维材料因量子限域、高比表面积等特性,在柔性电子、光电、催化与储能等领域具有关键应用价值,但现有数据库规模与成分多样性有限,难以支撑“按需设计”的产业化需求。为突破瓶颈,项目组提出以“数据驱动+物理机理”数理双驱为核心的闭环主动学习流程,融合深度神经网络与DFT高通量验证,系统扩展2D材料版图并面向目标性能开展条件生成。 # 4.行业痛点: 当前,二维材料的探索严重依赖传统“试错法”与有限的计算模拟,面临三大核心瓶颈:一是现有数据库规模小、化学多样性不足,难以 支撑功能导向的材料定向设计;二是第一性原理计算虽精确但算力成本高昂,无法实现亿级候选空间的高通量筛选;三是材料生成与稳定性预测脱节,常产生大量不合理结构,导致研发周期长、成功率低。这些因素共同制约了新型二维材料的快速发现与产业应用。 # 5.案例详述: # (1) 总体思路 构建“数据收集—物理引导元素替换—MLIP(机器学习势)快速筛选—DFT 验证—条件扩散生成”的五段式闭环框架:以原型库与元素替换生成亿级候选相空间,轮次化抽样与 MLIP 预测凸包能 $\mathrm{E}_{\mathrm{hull}}^{\mathrm{MLIP}}$ 筛选,阈值通过 DFT 精确校核 $\mathrm{E}_{\mathrm{hull}}^{\mathrm{MLIP}}$ ,合格结构入库并反哺模型迭代;在稳定库基础上训练等变分数网络,实现按化学组成与对称性等条件的结构生成。 # (2) 软件平台 平台分层包括:数据层(二维材料结构/能量/力数据与凸包参照)、模型层(CHGNetPaddle-MLIP、等变扩散生成器)、应用层(相图构建与定制生成)。流水线以JAMIP执行DFT校核,并以MLIP快速预测与筛选;在应用层可按给定体系构建相图并开展空间群约束生成,支撑从“筛—验—生”的一体化研发。 # (3) 技术方案 一是元素替换+主动学习,从已知2D原型出发,物理启发元素替换生成候选;每轮随机采样百万级结构,用MLIP筛选EhullMLIP<50meV/atom者进入DFT验证;迭代更新后,MLIP稳定 判别准确率由 $19.01\%$ 跃升至 $92.36\%$ 。二是条件扩散生成,联合原子种类、坐标与晶格参数的联合扩散,并引入厚度与目标性质嵌入与适配器,实现按元素/空间群等条件的 S.U.N.(Stable/Unique/New)结构生成;在 1,024 个生成结构的 DFT 复核中, $74.8\%$ 满足 EhullMLIP<100meV/atom, $59.6\%$ 满足严格的 EhullMLIP<0 标准。三是相图与快速验证,结合高精度 MLIP 对给定化学体系快速构建相图(如 V-Se-O),与 DFT 相图一致,MAE 仅 54 meV/atom。 # (4) 关键指标参数 一是数据库规模与覆盖,构建ML2DDB,收录242,546个经DFT验证的稳定单层结构,元素覆盖达81种,显著优于既有2D数据库。二是筛选精度,主动学习5轮后,MLIP稳定性判别准确率达 $92.36\%$ 能量/力MAE降至 $41\mathrm{meV / atom}$ 与 $74\mathrm{meV / A}$ 。三是生成质量:生成结构与DFT弛豫后结构的 $\mathrm{RMSD} < 0.26\AA$ ;千级生成保持 $100\%$ 唯一性,万级时唯一性仅下降 $4.4\%$ 。 # 6. 创新情况: # (1) 技术创新 一方面提出“数理双驱”的2D材料发现范式,以MLIP加速与DFT校核构成内环精化;以条件扩散在稳定域上进行外延探索,贯通“发现—验证—再发现”的闭环。另一方面在生成侧实现A/X/L三变量联合扩散与性质约束适配,显式处理二维晶格周期与对称,提升S.U.N.材料产出与可控性。 # (2)模式创新 以闭环主动学习替代“一次性高通量”,在相同算力下实现更高的有效样本率与更快的“从候选到新材”转化。 # 7. 应用实效: 一是库级扩容,相对现有2D库实现数量级提升,并显著增加三元/四元复合体系,为产业端的复合功能材料设计提供更大搜索空间。二是从筛到生一体化,面向具体化学体系(如V-Se-O)快速构建相图并定向生成,缩短从“构想 $\rightarrow$ 候选 $\rightarrow$ 验证”的周期。三是面向多场景可迁移:可直接支撑柔性电子、光电与催化等方向的组合优化与参数倒推,提升研发效能与成功率。 # (十一)多模态技术赋能有机分子谱图解析模型研发 # 1.案例实施单位: 北京百度网讯科技有限公司、苏州实验室 # 2.案例背景: 有机分子结构鉴定是药物发现、代谢物分析及环境检测等领域的关键环节,其核心任务是从核磁共振(NMR)等谱图数据中精准反推出分子结构。传统方法完全依赖化学专家的人工经验,通过比对谱图表征与已知结构数据库进行手动解析。这一过程不仅耗时冗长、成本高昂,且严重受制于分析人员的主观经验与知识储备,已成为制约新药研发与化学品创新的重要瓶颈。为突破此限制,本项目旨在利用多模态人工智能技术,开发能够自动、精准解析有机分子谱图的智能系统,推动化学分析从"经验驱动"迈向"数据驱动"的智能化新范式。 # 3.案例概述: 有机分子结构解析长期依赖专家对NMR谱的手工判读,流程慢、依赖经验且可扩展性弱。该案例提出以“光谱—分子”多模态对齐为核心、以条件离散扩散为生成骨干的DiffNMR框架,旨在实现从1H/13CNMR到分子图的自动化反演。 # 4.行业痛点: 当前,有机化合物的谱图解析面临三大核心挑战:一是高度依赖专家经验,解析结果主观性强,且资深专家资源稀缺,难以满足高通量研发需求;二是传统计算方法局限性大,基于规则的系统难以处理复杂或未知结构,而早期的机器学习方法存在准确率低、泛化能力弱 的问题;三是效率与精度难以兼得,人工解析耗时数小时甚至数天,且随着分子复杂性增加,正确率显著下降。这些痛点严重制约了科研与产业创新的速度,行业亟需一种能够兼顾自动化、高精度与强泛化能力的智能解析新方法。 # 5.案例详述: # (1) 总体思路 通过“两阶段预训练+端到端微调”实现谱-分子表征对齐与条件扩散生成:第一阶段以扩散自编码器建立分子图与潜表征的双向映射;第二阶段以对比学习将NMR编码对齐到分子潜空间;最终以NMR编码作为条件引导扩散解码器生成分子图。 # (2) 软件平台 一方面提供 NMR 编码器,采用 RBF 连续嵌入+双向跨模态注意力融合 1H 与 13C 信息,保留化学位移的连续性并刻画氢-碳对应等关键关系。另一方面提供图扩散解码器,以图 Transformer 为去噪网络,结合 FiLM 与 PNA 算子,迭代生成满足谱图约束的分子结构。 # (3) 技术方案 一方面支持对比表征对齐,通过谱-分子对的对比学习,获得具有判别性的公共潜空间,为相似度检索初始化与相似度过滤提供基础。另一方面支持推理增强:在无外部分子式先验时,引入相似度过滤将候选按谱相似性重排;当可用数据库时,以检索分子作为扩散初始状态,减少步数并提高准确率。 # (4) 关键指标参数 一是多模态协同增益,在提供分子式的设置下,1H+13C联合输入Top-1达 $68.26\%$ ( $\leq 15$ 个重原子),优于单一模态;该趋势在 $\leq 20$ 与 $\leq 25$ 组别保持一致。二是无分子式场景的鲁棒性,仅用谱信息时(无分子式),相似度过滤将 $\leq 25$ 组别Top-1由 $35.76\% \rightarrow 53.10\%$ ,引入检索初始化后进一步至 $58.47\%$ ;平均Tanimoto相似度同步提升。三是效率提升,检索初始化可将去噪步数由500步降至200步并给出正确结构示例。 # 6. 创新情况: # (1) 技术创新 提出条件离散扩散+多模态对齐的谱图反演架构,避免自回归式顺序误差累积,整体保证结构一致性;RBF连续嵌入显著增强对近似位移差异的分辨能力。设计“检索初始化+相似度过滤”的推理增强策略,在大分子复杂场景下有效缩小准确率劣化。 # (2) 模式创新 将谱图解析从“专家规则+手工匹配”升级为“数据驱动+知识增强”的自动化流水线,既可离线训练,也可在线接入实验室数据库与生产QC系统。 # 7.应用实效: # (1) 降本增效 联合模态与推理增强在无分子式场景显著提升 Top-1 与 Tanimoto 指标,显著减少人工试错与谱图解读时间。 # (2)场景落地 可用于药物先导筛选、代谢组学鉴定、精细化工质检等高通量场景;在有数据库的企业内网条件下进一步缩短推理时间与提升命中率。 # (3) 生态融合 基于PaddlePaddle与PaddleMaterials实现,便于与国产算力与材料研发工具链集成升级。 # 三、工业仿真 # (一)高速动车组空气动力学智能化仿真大模型-研轮·风驰 # 1. 案例实施单位: 中车青岛四方机车车辆股份有限公司、国家高速列车青岛技术创新中心、北京百度网讯科技有限公司 # 2.案例背景: 轨道交通装备已成为世界各国推动经济发展的战略性竞争新高地,速度是轨道交通装备研发的永恒追求。速度提升引发的空气动力学效应直接影响列车运行安全和节能环保,是整车设计的关键问题。气动性能的精准评估和优化是列车研发的核心技术,仿真是评估列车气动性能的核心手段。列车研发过程中,需开展多方案、多轮次、多车速、多场景的仿真评估优化,重点型号气动外形设计往往耗时数月至数年时间,严重制约研发效率。 # 3.案例详述: 传统空气动力学仿真存在“精度-效率-成本”难以协调的突出问题,高精度的仿真结果依赖精细化的仿真建模策略和高精度的物理模型算法,导致计算量大幅增加。为了缓解仿真精度与效率之间的矛盾,需要采用大规模超算资源,仿真成本显著提升,且仿真效率仍然难以完全满足研发需求。同时,跨尺度的列车复杂几何模型前处理困难,耗时长;仿真软件的使用门槛高,需要具备专业的知识;海量历史数据的使用率低,未发挥潜在价值。依托中车研轮大模型框架,基于科学计算大模型,以我国高速动车组二十余年自主研发过程中积累的 TB级数据为基础,融合几何信息神经算子和傅里叶神经算子,开展深度神经网络模型训练和优化,开发高速动车组空气动力学智能化仿真大模型- 研轮·风驰,替代传统空气动力学仿真流程,使用单机显卡实现高速动车组气动性能的高精度快速仿真,解决传统空气动力学大计算量、长周期仿真“精度- 效率- 成本”难以协调的基本矛盾问题。 # (1) 总体思路 与传统CFD计算的技术路线不同,仿真大模型采用数据驱动的方法,以我国高速动车组二十余年自主研发过程中积累的TB级数据为基础,基于科学计算大模型,开展深度神经网络模型训练和优化,开发高速动车组空气动力学智能化仿真大模型-研轮·风驰,替代传统的流场仿真求解,简化仿真建模过程,省略网格划分及流场求解时间,仿真效率大幅提升。 图26 矸轮·风驰总体思路 来源:中车青岛四方机车