> **来源:[研报客](https://pc.yanbaoke.cn)** # 科技创新赛道 # 一等奖 # 科学数据汇青藏,乘数效应聚发展 高质量高原数据的获取与应用,是承接国家“东数西算”战略、驱动青藏高原生态文明高地建设与高质量发展的关键引擎,在带动西藏数字经济产值增长中发挥重要作用。针对高原极端环境下数据“获取难、传输难、共享难”的痛点,依托中国科学院青藏高原研究所建设的国家青藏高原科学数据中心联合西藏大学,聚焦“地球第三极”,构建了系统化、标准化与智能化的科研数据治理体系,以汇聚、治理、服务举措,促进高原数据获取、传输、共享,构筑全球最大青藏数据库,实现“数据在西藏、服务在全国”。 科学数据汇青藏 乘数效应聚发展 图1 总体成效 一是以“数据+平台”为基础,集成极端环境多维综合数据。一方面研发卫星物联网观测终端、广域高清综合智能仿生鹰眼等观测设备,实现极端环境观测数据的自动采集与实时传输。另一方面通过科技计划项目数据汇交、野外台站、科研论文数据仓储、历史数据追溯等综合方式集成青藏高原地区科学数据资源。此外,构建国际论文关联数据仓储、智能汇交评审系统、全生命周期动态安全评估机制,全面践行“FAIR原则”(FAIR原则是科学数据管理领域的核心准则,要求数据具备可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable)四大特性,旨在提升数据共享效率与科研协作价值)。 二是构建数据要素化新范式,提升数据治理能力。采用立体感知替代单点观测,构建“空天地”一体化监测网络,结合自主研发智能鹰技术,实现全域数据实时获取与传输。推动数据要素协同共治,建立“项目-数据-出版”闭环管理机制、总中心-分中心协同的数据汇交机制以及国内国际双循环合作机制。AI融合填补数据空白,利用深度学习融合多源异构数据,生成长时序、高分辨率数据产品,解决传统数据产品精度不足问题。 三是建立智能数据生产模式,推动特色数据产品应用。构建“多源观测+AI智能融合+数据同化”的智能生产模式,建设七大类开源分析方法库(GitHub托管),利用人工智能新方法,实现高质量、长时序特色数据产品的应用。应用于雅下水电、川藏铁路等重大工程,支撑国家清洁能源潜力估算与基地选址,实现光资源商业数据库的国 产化替代,打破国外垄断,服务30余个电站与5200个光伏项目。 四是提供“开放共享+增值服务”,促进产业数据交易。在商业模式上,探索“免费基础数据引流+增值服务产品收费+项目定制化服务”模式,通过数据引用确权激励共享。通过国家青藏高原科学数据中心门户提供开放共享服务,不仅与华为、航天宏图等企业开展商业合作,提供定制化数据产品与服务,还在谷歌学术等国际平台建立索引。 # 二等奖 # VenusPod-融合AI与超大规模蛋白质数据,赋能生物制造研发范式变革 生物制造研发领域长期存在痛点,如传统蛋白质设计依赖专家经验试错、周期长、成功率低,以及现有AI模型受限于数据规模(如ESM-C仅21亿条)等。上海交通大学构建了全球最大蛋白质数据集VenusPod,打造AI蛋白质设计引擎,从“大海捞针”转变为精准设计,激活蛋白质数据要素的潜在价值,推动生物医药与合成生物学产业降本增效。 一是汇聚深海与盐湖极端环境高价值数据,保持数据持续更新。一方面,数据集汇聚了全球公共数据库(UniProt、NCBI等)数据,以及MEER计划深海微生物、国内盐湖耐极端环境微生物宏基因组数据,涵盖150亿条蛋白质序列,其中65亿条带有温度、pH值、压强等关键环境标签数据。另一方面,采用“开源清洗+自有采集+实验反哺”方式,依托“奋斗者”号及盐湖测序采集特有数据,通过Venus-Auto自动化湿实验平台,将验证后的高精度数据实时回流至数据库,实现数据持续更新。 二是以模型为基础,促进实验数据精准预测。基于Transformer架构预训练VenusPLM基础模型,面对不同的下游应用场景进行模型微调,融合干湿实验数据,通过清洗、降重、结构化处理,将海量序列转化为“模板挖酶”和“反应挖酶”的精准预测能力。 三是广泛应用于生物医药场景,实现经济社会双重收益。模型 应用于生物医药(抗体稳定性优化)、体外诊断(高灵敏酶改造)、合成生物学(耐高温/酸碱酶开发)等场景。在经济效益上,已服务30余家企业,帮助多家合作企业缩短研发周期 $50\%$ 以上,如某体外诊断原料成本降低 $52\%$ ,单域抗体耐碱性提升4倍并实现大规模量产。在社会效益上,突破耐极端环境酶设计瓶颈,助力绿色生物制造与节能减排;构建具有战略意义的国产蛋白质“数据领海”,保障生物数据安全;加速创新药与高灵敏诊断试剂开发,提升公共健康水平。 图1 产业化案例 四是对外提供多层次数据服务,创造数据价值。通过“基础库免费 $+$ 高价值数据订阅 $+$ CRO技术服务”获取收益。提供服务包括数据库订阅及API调用服务;基于数据的AI设计CRO服务;自研高性能酶产品(如耐碱VHH抗体)的销售与授权,签约多家制药企业进行技术转化。 # 二等奖 # 民航出行高质量数据集及行业大模型应用 “智慧民航”作为“数字中国”建设的关键应用场景,其发展离不开高质量数据的支撑与行业大模型的深度赋能。本项目着重关注民航业数字化建设进程中的三大核心难题:其一,数据治理复杂度高,专业数据标注匮乏,多源异构数据融合存在困难;其二,模型适配性欠佳,通用人工智能对民航专业术语及复杂场景的理解不够深入,导致客服人工转接率居高不下、监控误报现象频发;其三,应用落地进程缓慢,“数据-模型-场景”闭环缺失,限制了智能化实际成效。中航信移动科技股份有限公司通过构建高质量民航数据集以及“千穗”行业大模型,整合多源数据并实施智能治理,为智能客服、机坪监控等核心场景的智能化升级提供支撑,以挖掘数据要素价值,推动民航数字化转型并提升运营效率。 图1数据要素基础 一是完善高质量发展的数据要素供给体系,提升民航领域人工智能基础支撑能力。整合多模态数据,其中包括企业内部数据(如航班运行日志、监控图像、语音交互录音、安检数据等)、互联网开放数据(如天气、社交媒体数据等),以及联合科研机构标注的智慧机坪行为样本数据。数据的汇聚主要通过企业内部集成采集、互联网公开资源获取,以及与航司、机场集团、科研院所等合作方开展共建共享、授权运营等方式实现。同时,建立了涵盖API调用、分发授权、联合数据库池的可持续更新与协同机制。 二是构建高质量数据集与高价值场景应用,持续挖掘数据价值。整合文本、图像、音频、视频等多模态数据,并基于“千穰”民航大模型等统一语义嵌入框架与知识图谱技术进行清洗、标注和融合处理,数据被应用于支撑行业大模型训练、智能客服语义理解、机坪全景智能识别及客舱语音识别等核心业务环节,实现从智能分析到运行安全保障的全链条赋能。 三是创新服务模式,提高安全管理水准,为旅客提供更加优质、安全的航空服务。在旅客服务领域,航空公司借助精准的数据分析,为旅客提供更为贴心、独特且便捷的个性化服务体验。借助智能客服等应用,企业每年可节省人力成本约1亿元。在商业模式创新层面,航空公司通过对海量数据集合进行深度挖掘与分析,能够洞察市场新趋势以及旅客的潜在需求,进而开发出更契合市场需求的新航线与服务产品。其支撑的航旅纵横APP服务用户超1.5亿,显著 提升了民众出行效率与体验。在绿色环保方面,航空公司通过对飞行数据的深入剖析,能够精准掌握燃油消耗与碳排放状况,进一步优化飞行路线。该项目通过优化运行,每年可助力减少碳排放2.5万吨。 四是构建资源共用、协同联动、共创共享的民航人工智能融合创新生态。在数据流通领域,平台面向外部提供数据集授权下载、标准化格式的应用程序编程接口(API)输出以及训练集任务化分发等服务。同时,借助数据访问控制与安全机制,构建了数据包交易、标注服务共享等具备稳定性与可持续性的内外部数据协同及价值实现模式。数据服务创造的产值超过1亿元,年增长率超过 $20\%$ 累计支撑的商品交易总额(GMV)超过500亿元。 # 三等奖 # 海洋云助力海洋数据赋能新质生产力 当前,大规模海洋数据汇聚治理、海洋大数据关键技术和数据安全流通等方面,存在海洋数据多来源、多模态、数据量大、碎片化、时效性不一、质量参差不齐等问题,在一定程度上制约了海洋数据要素赋能保障作用的发挥。国家海洋信息中心针对海洋数据汇聚治理和共享挑战,打造国家海洋大数据服务平台“海洋云”,构建广域覆盖、按需共享、精准服务的共享模态,有效提升海洋数据质量。 图1 国家海洋综合数据库 一是建立海洋数据库,汇聚“空-天-岸-海-潜”海洋大数据集。基于3.5万余个国家和地方海洋观监测站点、130余个海洋专项调查和极地大洋科考任务、200多个来源的国际公开共享数据,以及海洋经济统计、海域海岛动态监视监测、海洋生态预警监测等 海洋综合管理业务数据,构建了海洋大数据资源体系,数据总量1.6PB时间最早可追溯至1662年。存储数据记录超3000亿条,更新时效最高达秒级。 二是采用关键技术集成方式,提升海洋数据处理效率和质量。突破海量海洋数据的排重整合、联合质控、快速融合与迁移重构等关键技术,研发出覆盖中国近海管辖海域、公海和国际海底以及南北两极的海洋数据信息产品,包括标准数据集、整合数据集、融合数据集、统计分析产品、实况分析和再分析产品、图集图件、专题报告等。 图2 海洋观测实时数据 三是提供多元化的海洋数据服务场景,带动沿海省市效益提升。组织编制了我国首批海洋数据开放共享目录,在自然资源部官网公开发布。以查询浏览、数据下载、定制推送等方式,为相关部门、沿海地方、涉海企业、社会公众等用户提供数据下载80余万次, 实现向地方沿海省市每分钟实时精准推送海洋观测数据超2亿次。应用于14个省、市海洋灾害综合防治体系建设、海洋科学研究、海洋经济发展等场景,创造经济效益达2.3亿元。 四是为国际海洋大数据建设贡献中国方案,提升全球海洋治理能力。国家海洋大数据服务平台在第16个世界海洋日面向国内外公开发布;中国全球海洋融合数据集(CGOF1.0)在法国尼斯召开的第三届联合国海洋大会现场面向国际社会公开发布。平台为中国一欧盟海洋数据互操作、马来西亚国家级海洋大数据中心建设等提供了政策、数据与信息支撑,彰显了大国担当。 # 三等奖 # 基于全域数据安全技术的电力实时量测数据中心建设 为实现“碳达峰、碳中和”的战略目标,国家提出新型电力系统和新型能源体系解决方案,面对新能源接入波动性、间歇性、碎片性等痛点,广东电网公司发挥全国最大省级电网海量数据及人工智能创新应用优势,聚焦数据要素获取、存储、融合、流通、应用、安全全生命周期管理,构建实时量测数据中心,通过将数据要素持续注入电网孪生世界,融合物联网、大数据、人工智能等技术,突破实时性传输、大规模存储、高性能计算的技术瓶颈,实现了物理电网的“可观、可测、可调、可控”。 图1 物理电网多源实时数据处理与展示 一是构建多模态数据资源池,提供高质量数据应用支撑。数据类型方面,核心数据要素来自广东电网实时运营数据(覆盖5000万+用户),包括发电、输电、用电负荷及设备状态信息。同时通过政务数据开放目录接入政府公共资源(如城市规划、经济指标),并整合气象、地理信息等第三方数据。数据汇聚方式方面,依托海 量全栈自主可控物联感知终端,汇聚能源行业上下游企业数据,构建毫秒级、TB级海量实时数据处理底座,实现千万级终端实时数据毫秒级入库。 二是围绕数据跨域流通与价值挖掘,开展数据协同。创新行业多维多态电网模型,实现最大省级电网数字孪生。汇聚融合反映物理世界的气象环境等多源头、多精度、多尺度海量数据要素,构建数字电网孪生视图,以数据要素的“看得见”提升数据治理与服务水平,确保“供得出、流得动、用得好”。 三是全链协同场景落地,释放数据乘数效应。创新应用成果赋能超强台风等自然灾害应急抢险场景。通过实时量测数据中心提供的高精度气象预测、电网设备状态预警及负荷动态模拟,实现台风路径与电网脆弱区域的智能匹配,提前完成重点线路负荷转移与抢修资源调度,较传统模式缩短应急响应时间 $40\%$ 以上。 四是形成“数据共享-价值共创-利益共享”的产业生态闭环,为新型电力系统建设提供长效支撑。通过建立数据要素市场化配置机制,推动电网数据与新能源企业、储能运营商、电力用户等主体的合规共享,联合开展负荷预测、需求响应等协同创新,形成多方参与、互利共赢的能源数据生态。依托能源行业首个可信数据空间,联通多家数据要素各方,形成“电力看经济”“电力看民生”等“电力+”八大数据产品矩阵并上架广州、深圳等数据交易所。 # 三等奖 # 数据要素赋能勘探开发一体化协同研究场景应用 深海深地油气资源勘探开发科学研究,发现地下油气“宝藏”是一项极具挑战性的系统工程。传统浅水浅层油气勘探开发研究多以经验知识为主导,基于原有科研范式的深海深地勘探成功率低,研究设计周期长,中海油研究总院有限责任公司通过整合地质、地球物理、钻井工程等多学科数据,搭建协同研究平台,创新全要素数据产品,构建覆盖勘探开发全流程的协同研究体系,形成数据和智能驱动的科研范式,有效提升对复杂油气藏的识别精度和开发效率,为深海深地油气资源的高效勘探与可持续开发提供有力的数据支撑和技术保障。 图1“数据-知识-算法-软件-流程”五要素融合的油气协同研究平台 一是打通多环节数据壁垒,构建覆盖从盆地评价到开发动态监测的全生命周期数据资源池。一方面,整合汇聚从盆地尺度到分子 尺度18PB多模态地质学、海洋学和工程学等50余类学科数据,包括结构化数据、文档报告、图件数据、媒体数据、时序数据。另一方面,制定深海深地多学科、全数据类型41册数据标准,创新多源异构统一元数据等技术,建成行业自主可控“湖仓一体”大数据平台底座,以现场采集、实验分析、外部采购等方式实时汇聚形成勘探开发多源异构数据资产。 二是技术创新破解协同难题,激活数据要素价值。通过空间配准协同建模等技术实现数据知识多源融合,建成研究要素协同共享的一体化协同研究平台,形成134个数据产品,包括7类高质量数据集、101款工具、10款自主研发软件等,实现“数据-知识-算法-工具-软件”五维融合,工作模式由链式接力转变为并行协同,支撑 $100+$ 项目研究实施。 三是全链协同场景落地,释放数据乘数效应。一是融合地震、测井、岩心等11.5PB多模态、多尺度数据,建立勘探大模型,驱动实现从盆地千米级到孔喉微米级精准认识,指导在超1500米水深深层发现大气田。二是建立“地下-海底-水面”大数据和“油藏-井筒-平台”AI孪生模型双驱动的研究范式,实现“油气田自主感知-数据实时传送-模型自动更新-生产智能调控”的研究闭环,生产研究调整效率由“周级”提升至“分钟级”,保障深海一号千年一遇海况生产安全,缩短研究周期 $58\%$ ,年均节省投资超45亿元。 四是生态共建与可持续运营,赋能产业高质量发展。支持中海 油6家分公司超过100个项目线上开展研究,支撑2023年以来油气增储年均超7亿吨、上产超7000万吨油当量。推动在南海北部深水区发现千亿方大气田和亿吨级大油田,每年向粤港澳大湾区稳定供气30亿方以上,可实现销售收入超2520亿元。已从中海油油气公司推广至集团三家专业服务公司,推动海外业务发展。 # 优秀奖 - 技术创新奖 # 数据赋能深远海工船养殖高质量发展 近年来,我国近海海洋养殖面临“水产品需求猛增,捕捞资源衰退”和“环境污染养殖区域缩减”的双重挑战。但深远海养殖领域长期存在数据样本量少且分散、数据标准化不足、数据融合难、数据安全难以保证、数据流通存在壁垒等多重问题,导致数据无法转化为生产效能,难以驱动深远海养殖领域产业发展。青岛国信集团构建了采集、融合、治理、共享、流通、安全“六位一体”的数据管理体系,为深远海养殖和海洋生态的数字化和智能化发展提供了可持续的数据资源保障。 图1 深远海工船养殖行业大模型体系 一是实现全维度、标准化的基础数据沉淀,促进多源数据融合。一方面融合8大类自有数据(生物学、环境、生产等养殖全链路) 和4大类外部数据(公共、科研、企业等),累计治理约3PB、日增2.7TB。通过3150路摄像头、2.6万个传感器实现全流程实时采集,叠加“购买+交换”等方式引入外部数据,按政策、科研、市场等场景精准匹配,为生产调度、经营决策、风险预警等提供数据基础。另一方面搭建统一的数据中台,通过格式转换、字段映射等技术,将设备采集的养殖数据、第三方的环境数据、生产端的运营数据进行关联融合;同时引入时空标签等技术,实现“某一海域+某一时间段+某一养殖舱”的多维度数据绑定,解决“数据孤岛”下的融合难题。 二是输出高质量的可用数据,构建行业级的数据协作机制。一方面建立数据清洗、校验、标注的全流程规则,如剔除异常传感器数据、标注鱼群生长阶段等标签;同步制定深远海养殖数据的行业标准,如数据分类、元数据规范等,对治理后的数据进行质量评级,形成结构化、标准化的高质量数据集,解决数据“非标、无效”的问题。另一方面搭建跨主体数据协作平台,明确不同参与方的数据使用权限与应用场景边界;建立柔性化数据价值转化机制,鼓励多方基于合规前提开展数据资源协同应用,推动数据价值最大化释放。 三是数据驱动智能化生产管理,支撑深远海养殖的智能决策。通过技术手段实现数据使用全流程可追溯,在明确数据使用边界与合规要求的前提下,搭建多方参与的协作架构,既促进数据要素合理流动,又保障数据使用的规范性与可控性,不仅促进了深远海养殖的智能化管理,而且向应急、海事、气象等部门提供高质量数据 支持,提升海上安全与生态监测能力。 图2 深远海养殖生产智能管理平台 四是发挥数据要素驱动作用,形成综合效益。在深远海养殖数据的驱动下,三年累计降低成本4.8亿元、年增收0.65亿元,养殖效率和关键指标达到全球领先水平。在规模化智能化运营方面,将优质大黄鱼价格从数千元降至百元区间,显著提升优质水产品供给能力,惠及广大群众。在产业协同上,在链主带动下构建创新联合体,推动数据共享与标准推广,带动多省工船建造与运营成本下降,促进渔业产业链整体升级。 # 优秀奖 - 应用实践奖 # 数据驱动材料科学与工程大模型训练与应用 材料数据是智能创制的基础,但目前材料研发面临数据集规模较小、局域化特征明显的问题,导致数据分布泛化能力差。中国科学院上海硅酸盐研究所聚焦材料研发数据难以利用的难题,提出数据与知识驱动的材料智能研发新范式,以科学数据为基础,以材料大模型为载体,以机器人协作的自主实验为实施主体,推动材料研发智能化探索的关键突破。 图1 业务逻辑 一是聚合结构化材料数据和非结构化材料数据,扩大数据基础。一方面汇集来自高通量材料计算、自主实验以及文献、专利的数据,以材料组分、结构、工艺参数、性能等数据构成材料科学与工程大模型MatMind领域知识问答、性能预测、结构生成与工艺推荐等功能训练的基础。另一方面利用材料科学与知识大模型的材料知识网 络及信息提取能力,通过数据生成的方式,实现数据信息补全和数据量扩充,极大地提升了材料数据种类和数量。 二是构建“数据工程—模型推荐—自主实验”的数据治理新模式,激发材料数据价值。建立以数据为基础、模型为载体、自主实验实施验证的材料创制闭环,围绕发挥数据要素乘数作用,聚焦新材料创制领域,利用大语言模型算法的核心能力,加速数据收集与应用,实现材料高效、精准创制。 三是拓展广泛的数据应用主体,加速材料工程领域产业升级。企业、科研院所还是政府部门,均可依托平台实现高效协同,通过数智融合加速推动材料工程领域技术创新。这缓解了新材料从实验室设计到商业化应用需要10—15年的研发周期,投入巨大且失败率高的问题,此外也在加速材料发现与创新、优化资源利用、提升产业竞争力、推动可持续发展以及促进跨学科融合能力上发挥作用。 四是由“任务驱动”转向“平台驱动”,赋能材料科研高质量发展。通过数据支撑、模型赋能、协议开放,从数据、模型、材料智能创制和应用4个层面,向科研院所和产业界推广。构建开放协作的数据生态,推动先进材料实现“智能自主实验—工业(工程)应用验证”。 # 优秀奖-商业价值奖 # 人工智能行业的数据合伙人——多模态数据智能中枢 数据、算法、算力,是人工智能大模型发展的三大基石。当前,全球AI产业面临多模态数据处理能力不足、标注工程效率低下、高质量数据集稀缺等瓶颈,数据工程时长占大模型开发周期的 $80\%$ 以上。整数智能信息技术(杭州)有限责任公司以“多模态数据智能中枢”为核心,研发智能数据工程平台,实现图像、视频、文本、音频、点云等多模态数据的AI Power智能标注与MLOps(机器学习运营)训练闭环工作,为大模型训练提供丰富的PB级高质量数据集。 图1产品能力介绍 一是构建AI数据智能工程新范式,促成大规模数据汇聚。利用多模态数据融合、4D时序标注、CoT思维链数据等关键技术, 推动数据工程从“人工密集型”向“技术密集型”与“专家密集型”的产业范式跃迁。平台集成自主研发的AI Power引擎,支持垂直模型预标注,准确率可达 $99\%$ ,日均处理能力达百万量级。通过MLOps闭环,平台打通“数据-模型-专家”闭环,构建越训越强的模型“数据飞轮”。 二是建立智能全链路数据流程,驱动数据要素流通与价值释放。一方面,数据流程覆盖数据采集、数据清洗、数据标注、数据治理、模型测评、成品数据集,形成高质量、多场景、全模态数据资源池。累计汇聚超9.6亿张图片、1.2亿部视频、10亿份文本及多模态题库数据集,累计交付超10PB的高质量成品数据集。另一方面,探索形成“企业-科研-产业”多元参与的数据流通机制,鼓励高质量数据集在数据交易所(中心)挂牌,实现数据要素从资源到资产的价值释放。 三是以高质量数据集训练提升大模型能力,推动应用提质增效。在缩短模型开发周期上,头部车企通过应用智能数据工程平台后,缩短端到端VLM智驾模型开发周期3个月以上,标注效率提升 $500\%$ ,关键帧识别准确率提升 $80\%$ ,降低标注成本超500万元。在模型推理能力提升上,某大模型公司在应用项目的高质量思维链(CoT)数据集后,模型推理能力提升 $100\%$ 以上,实现从对话能力到推理能力的跃迁。在构建评测基准上,SuperGPQA数据集涵盖285个研究生级别学科的AI评测基准,已被字节跳动的豆包、阿里巴巴的通义千问、小米的蜜莫等大模型选为技术报告中核心能力的 评测标准。 四是营造“数据+平台+生态”的开源生态,提供产业创新不竭动力。发起的2077AI全球开源数据社区,吸引哈佛大学、斯坦福大学、麻省理工、浙江大学等全球顶尖高校师生,共同构建高质量前沿数据集,推动了大模型训练数据从“闭源”转向“开源”的根本性转变,解决现有大模型在复杂视觉理解与多模态关系推理上的关键痛点。目前已累计服务全球近2000家科技企业与科研机构,交付高质量数据集总量超10PB,支持的智能驾驶标注数据里程超200万公里,直接或间接创造数据标注师就业岗位超10000个。 # 优秀奖 - 发展潜力奖 # 基于形式化方法的数据智能体高可信安全验证平台 数据智能体作为人工智能时代赋能数据要素在千行百业实现价值释放的关键组件,为各行业提供了智能化解决方案。目前数据智能体被广泛应用于安全攸关领域,如何保证其在整个生命周期的安全可信成为目前业界急需解决的问题。科大国创软件股份有限公司借助形式化验证、可信计算等核心技术,解决了数据智能体的正确性、抗干扰等难题,为国家数据基础设施建设提供重要安全构件。 图1 总体架构图 一是采用形式化方法增强数据覆盖的完整性,夯实安全监测数据基础。把传统的形式化方法应用于数据智能体的安全性和鲁棒性检测,通过数学证明的方式,达到对模型输入数据的完整覆盖,能有效地检测数据智能体中是否存在影响安全的条件。 二是对数据智能体多维管控,保障数据安全可信。围绕数据智能体正确性和抗干扰性,在形式化方法下对数据智能体的输入数据、智能体模型、输出结果,从标准、规范、安全性和鲁棒性等多维度 进行管控,促进智能体检测精度提升、持续优化,提升其安全可信度。 三是应用于数据智能体全生命周期,实现全流程数据安全管理。在国防军工、航空航天等安全攸关领域,项目正式推出不足9个月就实现标杆客户落地应用,达到产值一千余万元,预计三年内产值达到10亿元,能带动上下游降低安全损失100亿元。在国家战略服务领域,参与多个国家重点项目、标准制定。 四是推出“平台+解决方案”的产品服务体系,赋能千行百业。建立“基础验证平台+行业解决方案”的产品服务体系,构建了可跨行业适配的验证体系,为人工智能时代的数据要素安全提供重要技术支撑和示范样板。 图2应用场景 # 优秀奖 - 发展潜力奖 # 数据赋能“机械智心”,构建智能工程机器人 工程机械行业面临劳动力短缺与用工成本攀升的双重压力,矿山、港口等作业场景安全事故频发,且人工操作在精准度与效率上存在局限,难以满足大型工程的高标准要求,这些均为行业亟待解决的痛点问题。网易灵动(杭州)科技有限公司联合网易(杭州)网络有限公司借助杭州滨江区数字经济优势,以数据为核心驱动力,打造挖掘机器人、装载机器人等核心产品,形成可推广的“数据+工程机器人”行业解决方案,推动工程机械行业向智能化、自动化转型。 一是工程现场全链路动态数据汇聚,筑牢数据应用基础。搭建全场景多维度数据采集网络,通过激光雷达、摄像头等20余种传感器,实时采集设备运行、作业环境、协同调度等多类型数据,累计沉淀挖掘机作业数据10PB、装载机作业数据3PB,形成覆盖7大应用领域的立体化数据体系。建立跨企业数据协同机制,与徐工集团、中铁二十局等50余家龙头企业共享数据资源,实现产业链数据互通。 二是构建“感知-传输-决策-执行”毫秒级响应闭环,推动数据要素从资源属性向价值属性转化。一方面,以自研“机械智心”具身智能训练框架和“灵掘”端到端模型为核心,采用AOP(面向切面编程)范式赋予设备自主学习与决策能力。构建“感知-决策-执行-管理”四层技术架构,融合数字孪生、边缘计算、5G低 延时传输等技术,实现作业全流程数据驱动。另一方面,构建了覆盖数据采集、存储、处理、销毁的全生命周期管理体系及数据标准化体系,先对主要核心数据进行标准化处理,再通过加密存储、权限管控等措施保障数据安全,最终实现 $80\%$ 以上存储数据的开发利用。 三是打造“单机智能-集群协同-场景重构”三级落地路径,推动工程机械行业数字化变革。推出挖掘机器人、装载机器人等核心产品,适配矿山、港口、搅拌站等多场景需求。例如在104国道搅拌站的装载作业场景中,实现104国道搅拌站生产成本降低 $70\%$ 、管理成本降低 $30\%$ ,设备作业效率较人工提升超 $20\%$ ,无人装载机满斗率达 $98\%$ 以上,挖掘机器人装车效率达人工的 $80\%$ ,且 $70\%$ 作业时间无需干预,当前已服务100余家客户。社会与行业应用成效价值突出,高危场景人工替代率超 $80\%$ ,安全事故发生率降低 $85\%$ 以上,带动上下游企业订单与市场份额增长 $20\%$ 。 四是搭建开放共享的产业服务平台,赋能产业“降碳、减污、扩绿、增长”协同推进。运营模式方面,采用“数据飞轮”驱动的迭代模式,依托真实作业数据优化模型,搭配模块化技术架构实现多场景快速适配与规模化复制,同时构建跨企业数据协同生态,实现年10PB的数据合规流通。在收益渠道方面,采用软件收费、硬件整车、项目定制三类商业模式,并搭配租赁与买断双轨推广模式获取收益,这种多元组合模式降低了客户准入门槛,有利于扩大收益规模。