> **来源:[研报客](https://pc.yanbaoke.cn)** # 知识图谱行业应用 # CONTENTS 01 知识图谱概览 02 构建领域知识图谱 03 知识图谱在医疗行业应用 04 知识图谱在其他领域应用 # 01 # 知识图谱概览 知识图谱(Knowledge Graph)于2012年5月首先由Google提出 # 知识图谱旨在描述真实世界中存在的各种实体或概念,以及它们之间的关联关系。其中: - 每个实体或概念用一个全局唯一确定的ID来标识,称为标识符; - 每个属性一值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。 现实世界中有多种类型的事物 事物之间有多种类型的链接 # 1.1 通用知识图谱 VS 行业知识图谱 # 通用知识图谱 # Google's Knowledge Graph Enterprise Knowledge Graph 行业知识图谱 面向通用领域 以常识性知识为主 “结构化的百科知识” 强调知识的广度 使用者是普通用户 面向某一特定领域 基于行业数据构建 “基于语义技术的行业知识库” 强调知识的深度 潜在使用者是行业人员 # 1.2行业知识图谱助力人工智能应用 # 1.3 知识图谱产业概览 # 底层支撑系统与产品 1支撑知识图谱运作的混合型系 统,提供高效稳定的查询; 2 领域知识图谱构建的工具集成系统,提供知识图谱构建能力 智能数据获取系统 图数据库系统 知识库构建工具集 # 知识图谱数据与服务 构建大规模通用知识图谱和领域图谱,为机器认知提供背景知识 百科图谱 商情图谱 垂直图谱 # 知识图谱咨询与方案 提供领域知识图谱构建与应用咨询服务或落地解决方案,给华为、电信、移动、阿里巴巴、滴滴等数十家应用单位提供了知识图谱解决方案。 # 1.4 知识图谱能力体系 # 02 # 构建领域知识图谱 # 1、什么是领域知识图谱? - Knowledge Graph is a large scale semantic network - Consisting of entities/concepts as well as the semantic relationships among them - Domain-specific Knowledge Graph 医学知识库 代码知识库 军事知识库 电信知识库 工商知识库 电商知识库 计算机知识库 网络运维知识库 一带一路知识库 各类领域知识图谱 # NoKG (Not only KG): 从“小”知识到“大”知识 - Ontology, Frame $$ \forall x \forall y (P (f (x)) \rightarrow \neg (P (x) \rightarrow Q (f (y), x, z))) $$ Logic rules Decision tree - 传统知识工程,专家构建,代价高昂,规模有限;知识边界易于突破,难以适应大数据时代开放应用到规模化需求 - 大规模开放应用需要“大”知识(大规模知识库) Big Knowledge Small knowledge+ big data= big knowledge 知识图谱引领知识工程复兴 # 2、DKG与GKG的关系?-区别 - DKG与GKG在知识表示、获取与应用等方面有着显著差异 <table><tr><td></td><td></td><td>DKG</td><td>GKG</td></tr><tr><td rowspan="3">知识表示</td><td>广度</td><td>窄</td><td>宽</td></tr><tr><td>深度</td><td>深</td><td>浅</td></tr><tr><td>粒度</td><td>细</td><td>粗</td></tr><tr><td rowspan="3">知识获取</td><td>质量要求</td><td>苛刻</td><td>高</td></tr><tr><td>专家参与</td><td>重度</td><td>轻度</td></tr><tr><td>自动化程度</td><td>低</td><td>高</td></tr><tr><td rowspan="2">知识应用</td><td>推理链条</td><td>长</td><td>短</td></tr><tr><td>应用复杂性</td><td>复杂</td><td>简单</td></tr></table> - DKG是从GKD通过隐喻得到 开放知识 行业应用中的知识需求难以封闭于预设的领域知识边界内 GKG对于DKG有着显著支撑作用 通用知识图谱与领域知识图谱的关系 # 3、为何需要符号化表示的知识图谱? # - 符号表示与分布式表示是两种重要的知识表示方式 符号化表示 <table><tr><td>DKG</td><td>DR(Distributed Representation)</td></tr><tr><td>显式</td><td>隐式</td></tr><tr><td>可解释(易理解)</td><td>难解释(难理解)</td></tr><tr><td>可推理</td><td>难推理</td></tr><tr><td>符号表示</td><td>数值表示</td></tr><tr><td>面向人</td><td>面向机器</td></tr></table> # 4、为什么需要领域知识图谱DKG 大数据时代需要知识引擎 释放大数据价值 形成行业认知能力 实现简单工作自动化 人工智能时代需要机器智脑实现自然人机交互 # 领域知识的积累与沉淀是智能化的必经路径 依赖领域专家的传统信息化 缺点 成本高 效率低 传统信息化 领域知识 将领域知识赋予机器,实现简单知识工作自动化 优点 高度自动化效率高 未来智能化 # 5、领域知识图谱系统的生命周期? 领域知识图谱的迭代周期 # 6、DKG中知识如何表示? - 三元组SPO表示 • <七里香, MV导演,邝盛> • <七里香,发行时间,2004年08月03日> • <七里香,填词,方文山> • <七里香,歌曲原唱,周杰伦> - 时空语义扩展 时间维度/空间维度 (贝拉克·奥巴马,职业,美国总统,2009年1月20日,2017年1月20日) (唐纳德·特朗普,职业,美国总统,2017年1月20日,--) (复旦大学, 类别, 公立大学, 121.4989 (经度), 31.2932 (纬度) 跨媒体表示 - 文本、图片、视频 Tesla Model S 销售 Tesla Model S是一款由Tesla汽车公司制造的全尺寸高性能电动轿车,外观造型方面,该车定位一款四门Coupe车型,动感的车身线条使人目不迭。此外在前脸造型方面,该车也采用了自己的设计语言。且值得一提的是,特斯拉Model S的猎豹门把手在触摸之日可以自动伸出,充满科技感的设计以及拉开车门时便开始体现。预计于2012年半年产销销售,而它的竞争对手相信宝马3系,这款车的设计者Franz von Holsthausen。曾在马丁哈弗北美分公司担任设计师。Model S在汽车中,Model S仍旧有一独一无二的底盘、车身、发动机以及能源储备系统。Model S的第一代亮相是在2009年四月的一天《大卫探求秀》节目中。 日前区首家表示由于2014年第一季度在北京侨福芳草地开业。目前区官方获悉,特斯拉为了满足不同消费者的需求,于近日再次推出了四款车型,包括最入门的ModelS70车型,以及包含P3、P90以及P90D在内的三座9款车型,新车市场指导价54.11- 97.93万元。四 2017年4月26日,美国权威杂志《消费者报告》(ConsumerReports)最新发布的数据显示,特斯拉ModelS电动汽车已经失去了最安全汽车的头衔。2018年3月30日,特斯拉公司在周四宣布,由于动力转向存在问题,公司将召回大量ModelS。 Tesla Model S 通过文字、图片和视频来表示实体“Tesla ModelS” (Tesla Model S, 图片,“//123.jpg”) (Tesla Model S,视频,“//123.avi”) # 7. 行业知识图谱生命周期 # 知识建模 # 知识获取 # 知识融合 # 知识存储 # 知识计算 # 知识应用 业务专家参与图谱Schema设计 增量式图谱自动构建 人工可交互干预 专家参与业务需求及应用沟通 # 常用方法 自顶向下的方法:专家手工编辑形成数据模式 自底向上的方法: 基于行业现有的标准进行转换 从现有的高质量行业数据源(如业务系统数据库表)中进行映射 # 需要考虑 行业全数据分析,制定统一的知识分类体系 能够支撑事件、时序等复杂知识表达 - 多人在线协同编辑,并且实时更新 能够导入集成使用现有的(结构化)知识 - 支持大数据量可以与自动算法进行结合,避免全人工操作 # 7.1 知识建模:本体知识库结构设计 # SNOMED CT (Systematized Nomenclature of Medicine -- Clinical Terms)医学系统命名法-临床术语,是当前国际上广为使用的一种临床医学术语标准。提供了一套全面统一的医学术语系统,涵盖大多数方面的临床信息,如疾病、症状、指标、操作、微生物、药物等 从不同来源、不同结构的数据中进行知识提取,形成知识存入到知识图谱。 # 7.2 知识抽取的方法:多策略学习方法 - 多数据源:结构化数据、半结构数据、文本数据 <table><tr><td>属性</td><td>类型</td><td>来源</td></tr><tr><td>药材名称</td><td>数值型</td><td>处理后的《药品库.xlsx》</td></tr><tr><td>药材编号</td><td>数值型</td><td>《药品库.xlsx》</td></tr><tr><td>规格</td><td>数值型</td><td>药品说明书</td></tr><tr><td>...</td><td>...</td><td>...</td></tr></table> WIKIPEDIA 互动百科baike.com # 多策略学习 自监督学习 基于规则 封装器 子图提取 基于统计 利用不同数据源之间的冗余信息,使用较易抽取的信息(结构化数据库)来辅助抽取那些不易抽取的信息。 # 7.2 知识抽取:病历结构化 # 【主诉】两周内便血2次 【现病史】患者2周前无明显诱因下出现大便带鲜红色液体2次,无肛门口异物感,肛门口无突出物, 大便色黄,无粘胨胶液,无恶心呕吐,无胃寒发热,无尿频尿急尿痛血尿,无腹痛腹泻里急后重,至我 院门诊查肠镜示“距肛9-12cm见一浸润性肿块,累及近2/3肠腔——直肠癌”,今为进一步诊治,门诊拟 “直肠癌”收入我科” 3. 矛以西力欣、圣诺安抗感染、巴曲亭、捷凝止血,耐信制酸,潘金南、卫美佳、培尔吉、乐凡命、血 必净、天晴宁、力能、氯化钾等营养支持,环磷酰苷营养细胞,开顺化痰,贝科能保肝,甲硫氨酸维B1 保肝治疗,托烷司琼止吐治疗,丙帕他莫止痛。 # 数据模式层融合 - 概念合并 - 概念上下位关系合并 - 概念的属性定义合并 # 数据层融合 实体合并 实体属性融合 - 冲突检测与解决 # 知识融合需要考虑什么 - 实现不同来源、不同形态数据的融合 海量数据的高效融合 新增知识的实时融合 多语言的融合 行业知识图谱的数据模式通常采用自顶向下和自底向上结合的方式,因此基本都经过人工的校验,保证了可靠性;因此,知识融合的关键任务在数据层的融合。 # 7.3 知识融合——疾病库知识的融合 # 知识离线融合-识别sameAs关系 # 7.3 知识融合——疾病库知识的融合 # 知识在线融合-知识卡片 >bing # Acetaminophen Prescription drug:Over-the-counter drug Paeetamol, also known as acetaminophen or APAP, is a widely used over-the-counter pain medication and medication to reduce fever. It is commonly used to help with headaches, other minor aches and pains, and is a major ingredient. # W Wikipedra Brand names: Tylerol, Panadol, Ofremy, Fenval, Mapap, Tempta, Acehen, Mepalito, Aphen, Notamp Ring. Drug class: Analgesic May treat: Fever Pain Sustains Pharyngitis Lyme disease Page's disease of bone Ulcerative colitis Pregnancy risk category: Pregnancy Category C (FDA) Legal status: Over-the-counter drug. Prayership drug. # Usage By month: Side effects: Warming. How to use Injection Side effects Warning How to use Rectal Side effects Warning: How to use More on National Library of Medicine Google # Acetaminophen Brand name: Tylenol # Analgesic It can treat minor aches and pains, and reduces fever. < Precautions by mouth SIDE EFFECTS INTERACTIONS WARNING # Brands:Paradol, Tylenol, Anacin, Mapap, Ofimev, Mejoralito, Feverall Xi-dol, Acophen, Bf-paradac, Aypanal, Aphan, Tempra, Nortemp, Rugby, Apap, Ringl, Easy, and Select Availability: Prescription sometimes needed Pregnancy: Consult a doctor Alcohol: Consult a doctor. Interactions can occur # 合并后卡片 Acetaminophen Brands: Tylenol, Panadol, Ofirmev, Feverall, Mapap, Tempra, Acephen, Mejoralito, Aphen, Nortemp Drug class: Analgesic Availability: Prescription sometimes needed Pregnancy: Pregnancy Category C (FDA) # 知识图谱数据存储需要完成的基本数据存储: 三元组知识的存储 事件信息的存储 时态信息的存储 - 使用知识图谱组织的数据的存储 # 知识图谱上层应用需要支持: 知识推理 知识快速查询 图实时计算 # 7.4 事件及时序知识存储方案 通过第四元来进行时间的存储 <table><tr><td>S.</td><td>P.</td><td>O.</td><td>C.</td></tr><tr><td>张三</td><td>拥有</td><td>就医记录 2017.05.08</td><td>2017.05.08</td></tr><tr><td>就医记录- 2018.01.20</td><td>诊断结果</td><td>胁痛</td><td>2018.01.20</td></tr><tr><td>...</td><td>...</td><td>...</td><td></td></tr></table> <table><tr><td>S.</td><td>P.</td><td>O.</td></tr><tr><td>张三</td><td>拥有</td><td>就医记录 2018.01.20</td></tr><tr><td>就医记录- 2018.01.20</td><td>诊断结果</td><td>胁痛</td></tr><tr><td>就医记录- 2018.01.20</td><td>时间</td><td>胁痛</td></tr><tr><td>…</td><td>…</td><td>…</td></tr></table> 通常,我们采用匿名节点的方式来对事件进行存储 # 7.4大规模知识图谱存储解决方案 知识图谱是基于图的数据结构,其存储方式主要有两种方式: RDF存储 & 图数据库(Graph Database) # 指导思想 # 数据思维 依据数据特点进行数据存储结构选择与设计 # No Size Fits All 没有一种通用的存储方案能够解决所有问题 # 整体原则 基础存储支撑灵活 - 基础存储可扩展、高可用 - 按需要进行数据分割 - 适时使用缓存和索引 - 善于利用现有成熟存储 - 保持图形部分数据的精简 - 不在图中作统计分析计算 # 图挖掘计算 基于图论的相关算法,实现对图谱的探索和挖掘。 # 基于本体的推理 - 使用本体推理进行新知识发现或冲突检测。 # 基于规则的推理 使用规则引擎,编写相应的业务规则,通过推理辅助业务决策。 # 7.5 基于知识图谱的用药安全检测 李四 就医记录 既往病史:高血压 诊断结果:类风湿性关节炎 开药:布洛芬片 类风湿性关节炎 痛风性关节炎 适用症 布洛芬片 . 禁忌 肾功能不全慎用 高血压慎用 # # 语义搜索 基于知识图谱中的知识,解决传统搜索中遇到的关键字语义多样性及语义消歧的难题;通过实体链接实现知识与文档的混合检索。 # 智能问答 针对用户输入的自然语言进行理解,从知识图谱中或目标数据中给出用户问题的答案。 # 可视化决策支持 通过提供统一的图形接口,结合可视化、推理、检索等,为用户提供信息获取的入口。 8、DKG如何评价? # 9、DKG如何存储? # - 数据库选型依据 - 操作复杂度 - 全局计算 - 多步遍历 - 复杂子图 知识库规模 - 节点 - 关系 - 密度 - 三元组中存储哪些信息? - 关联事实 规模 Graph DB NoSQL DB Relational DB Graph DB Graph DB 操作复杂度 # 10、DKG如何查询? # - SPARQL • 优点:表达能力强、可推理 - 缺点:较复杂、难书写、复杂查询执行代价高昂 # - SQL - 优点:简单,普及 • 缺点:表达能力相对较弱 e.g., 找到所有朋克摇滚(Punk Rock)风格的乐队和它的成员名 # 11、DKG如何应用? 搜索 推荐 问答 解释 决策 <table><tr><td>领域</td><td>内容</td><td>状态</td><td>效果</td><td>应用</td></tr><tr><td>政务知识图谱</td><td>构建政务知识图谱,实现市民服务的精准推荐</td><td>已上线</td><td>服务600万上海市民</td><td>推荐</td></tr><tr><td>“一带一路”地缘环境知识图谱</td><td>展示“一带一路”沿线国家的地缘环境,支撑专家决策</td><td>已上线</td><td>为某部门的信息决策起到了重要的支撑作用</td><td>决策</td></tr><tr><td>多媒体素材知识图谱</td><td>针对多媒体素材,实现精准推荐和智能索引</td><td>开发中</td><td>对多媒体素材的管理、推荐和检索,强化了平台的实用性</td><td>搜索、推荐</td></tr><tr><td>代码知识图谱</td><td>针对公司内部数千代码库,上百万条代码难以复用的现状,加以规整便于检索</td><td>已上线</td><td>为几万名公司软件工程师提供了代码检索功能,代码平均搜索时间从10分钟降低到1分钟</td><td>搜索</td></tr><tr><td>运营商业务知识图谱</td><td>丰富的搜索召回和个性化推荐,运营商的知识管理和分析支撑平台</td><td>已上线</td><td>在与运营商的服务层面,显著提升了业务的复用率。</td><td>决策、分析</td></tr><tr><td>商业情报知识图谱</td><td>降低企业获取商业的门槛,帮助发现并对接客户、友商、供应商</td><td>开发中</td><td>让商业信息的管理流程化,对接成功率提升明显</td><td>决策、分析</td></tr><tr><td>电信知识图谱</td><td>为电信营销、运营提供支撑</td><td>已上线</td><td>有力支撑了上海电信的互联网营销平台(每年数千万产值),技术转移给移动的方案中</td><td>推荐</td></tr><tr><td>电子商务知识图谱</td><td>构建电商图谱,实现商品智能推荐</td><td>已上线</td><td>部分品类下的商品销售率提高了2.8个百分点</td><td>搜索、推荐</td></tr></table> # 12、DKG落地有哪些最佳实践? - 应用引领 - 避难就简 - 结构化->半结构化->非结构化 - 避免从零开始 - 以通用图谱中的领域图谱作为种子 - 问题:如何有效发现领域实体与关系? - 跨领域迁移 - 从邻近领域迁移 - 问题:如何迁移具有共性的知识? # 13、DKG还存在哪些挑战? # 知识表示 - 知识图谱只能表达简单关联事实,对于时空语义、跨媒体语义支撑力度不够 # 知识获取 - 领域样本缺失现象严重,手工构建代价高昂;稀疏样本下的高质量自动化构建缺乏有效手段 # 知识应用 - 领域知识图谱在行业的深入应用中仍缺乏有效手段,特别是推荐、推理与解释。 如何增强知识图谱的语义表达能力? 如何实现稀疏样本下的图谱自动构建? 如何深化基于领域知识图谱智能应用? # 03 # 知识图谱在医疗行业应用 # 国外医疗知识图谱案例:IBM Waston • 通过对医学文献进行打分评级,迅速整理病患医疗记录,以提高肿瘤学家的工作效率; 通过分析海量医学文献,确定个性化诊疗方案,助力肿瘤学家为患者提供高质量、循证型癌症治疗方案; 通过美国纪念斯隆-凯特琳癌症中心获得世界顶级肿瘤学专业国际水准肿瘤治疗专业知识。 阿霉素导致细胞外信号调节激酶(ERK)2的激活,反过来磷酸化p53在以前未知的站点,Thr55…… 抽取 $\bullet$ 学习 测试 $\bullet$ 经验 # 标记规则 药品 = 实体 • 副作用 = 实体关联事件 事件 = 相关动词 • 规则 = 一个药品对应一个副作用 # 在文本中进行标注 - 阿司匹林的抗血栓作用能够减少心机梗死的风险 - 已知副作用包括:胃肠道疼痛、肠胃不适、胃溃疡、消化道出血 - 安定和安定是苯二氮卓类衍生物,用于治疗焦虑,肌肉痉挛 • 安定片,又名地西泮片,是苯二氮卓类精神药物,常用于医治焦虑、肌肉痉挛 • 安定可引起抑郁、自杀意念、多动、激动、攻击、发怒…… # 构建知识图谱 # 胃肠道疼痛 # 阿甸匹林 # 安定片 # 抑郁 # 基于专家知识进行图谱扩展 抽取 学习 测试 经验 # 问题 什么样的基因会促使结肠癌的形成? 药物的副作用 • 实验室记录 基因 发表刊物 # 文本抽取 # 分值& 权重 数量 相关性 - 关系 领域事实/业务规则 抽取 学习 测试 $\bullet$ 经验 共现关系表 • 从两个不同的概念中选择实体(即,疾病/基因) - 可视化共现关系 • 利用统计数据确定交叉点 深入查看数据 基因网络 选择两个或多个感兴趣的基因 - 查看关系网 - 展示关系的强度、性质、距离 - 有色向量表示相互作用的性质 - 悬停在关系上查看证据 # “医疗” + 知识图谱应用 # 医疗知识图谱应用:搜索范式迁移 (1) 让医疗相关从业人员更高效精准的获取信息 语义搜索 全文匹配 实体检索 # 医疗知识图谱应用:搜索范式迁移 (2) # DRUGBANK # Letermovir Targets (3) Enzymes (8) Transporters (7) Biointeractions (19) # IDENTIFICATION Name Letermovir Accession Number DB12070 Type Small Molecule Groups Approved Description Letermovir recieved approval from the FDA on November 8th, 2017 for use in prophylaxis of cytomegalovirus (CMV) infection in allogeneic hematopoietic stem cell transplant patients [6]. It represents the first entry into a new class of CMV anti-infectives, DNA terminase complex inhibitors [3]. Letermovir has recieved both priority and orphan drug status from the FDA. It is currently marketed under the brand name Prevymis [6]. Structure C 3D Download Similar Structures Synonyms Not Available External IDs AIC 246/AIC-246/AIC246/MK-8228 # 大型药物数据集 DrugBank目前收集了6707药物实体,其中包括FDA批准的1436种小分子药物及其5086种实验性药物。 # 医疗知识图谱应用:搜索范式迁移 (3) (1)模板:drug entity+attribute 说明:查询药的属性值信息,例如药物的适用症、副作用等。 例句:青霉素G的副作用有哪些? (2)模板:(attributevalue) $*+$ drugconcept 说明:已知属性和属性值(一个属性的信息或者两个属性的信息),查询药名,查询的结果应是列表型。 例句:与别嘌呤醇相互反应的药物是? (3)模板:(attributevalue)\*+diseaseconcept 说明:已知属性和属性值(一个属性的信息或者两个属性的信息),查询疾病名称,查询的结果应是列表型。 例句:与FOXP2基因有关的疾病是? (4)模板:(attributevalue) $*+$ drugconcept/diseaseconcept $^+$ attribute说明:前面两种句型的融合,通过第2,3种查询得到药品或疾病名称,然后再进一步查询药品或疾病的属性信息。 例句:用于结核病的药物副作用是什么? # 挂号、导医 VS # 基础医疗在线问答 加号 患者排队挂号 掌上导医 对大关在线 部合香 百度医生 就医宝 翼健康 通医院 窗口1 窗口2 窗口3 医院窗口 内部管理系统 医生 毒雨医生 微问诊 问医生 其他预约加号平台 日常效率工具缺乏 与传统就医模式不同,轻问诊是将智能问答的应用与互联网相结合,面向患者提供的一种新型在线式的基础医疗问答服务,该应用依托于基于知识图谱的智能问答。 # 医疗知识图谱应用:轻问诊 (2) 智能问答 告诉我你的症状是什么? - 我觉得疲劳,而且头疼、关节疼,还伴随有呕吐。 患者 - 据我所知,你很可能 虚拟医生 # 医疗知识图谱应用:轻问诊 (3) # 智能问答 # Dengue fever From Wikipedia, the free encyclopedia For other uses, see Dengue fever (disambiguation). Dengue fever is a mosquito-borne tropical disease caused by the dengue virus.[1] Symptoms typically begin three to fourteen days after infection.[2] This may include a high fever, headache, vomiting, muscle and joint pains, and a characteristic skin rash.[1][2] Recovery generally takes two to seven days.[1] In a small proportion of cases, the disease develops into the life-threatening dengue hemorrhagic fever, resulting in bleeding, low levels of blood platelets and blood plasma leakage, or into dengue shock syndrome, where dangerously low blood pressure occurs.[2] Dengue is spread by several species of mosquito of the Aedes type, principally A. aegypti.[1] The virus has five different types;[7][8] infection with one type usually gives lifelong immunity to that type, but only shortterm immunity to the others.[1] Subsequent infection with a different type increases the risk of severe complications.[1] A number of tests are available to confirm the diagnosis including detecting antibodies to the virus or its RNA.[2] A novel vaccine for dengue fever has been approved and is commercially available in a number of countries.[4] Other methods of prevention are by reducing mosquito habitat and limiting exposure to bites.[1] This may be done by getting rid of or covering standing water and wearing clothing that covers much of the body.[1] Treatment of acute dengue is supportive and includes giving fluid either by mouth or intravenously for mild or moderate disease.[2] For more severe cases blood transfusion may be required.[2] About half a million people require admission to hospital a year.[1] Nonsteroidal anti-inflammatory drugs (NSAIDs) such as ibuprofen should not be used.[2] Dengue has become a global problem since the Second World War and is common in more than 110 countries.[9][10] Each year between 50 and 528 million people are infected and approximately 10,000 to 20,000 die.[11][5][6][12] The earliest descriptions of an outbreak date from 1779.[10] Its viral cause and spread were understood by the early 20th Synonyms Dengue, breakbone fever[1][2] Dengue fever The typical rash seen in dengue fever Pronunciation uk: /dengger/ or us: /denggi/ Specialty Infectious disease Symptoms Fever, headache, joint pain, rash[1][2] Complications Bleeding, low levels of blood platelets, dangerously low blood pressure[2] Usual onset 3-14 days after exposure[2] Duration 2-7 days[1] Causes Dengue virus by mosquitoes Diagnostic Detecting antibodies to the virus or its RNA[2] Similar Malaria, yellow fever, viral hepatitis, leptospirosis[3] Prevention Dengue fever vaccine, decreasing mosquito exposure[1][4] Treatment Supportive care intravenous # 虚拟医生使用Wiki数据知识 WIKIDATA 虚拟医生 # 医疗知识图谱应用:轻问诊 (4) # 智能问答 虚拟医生 针对中医药知识体系系统梳理、建模和展示 以图形可视化方式展示核心概念之间的关系 辅助中医专家厘清学术发展脉络,浏览中医知识,发现知识点之间的联系。 与阅读文献等手段相比,可大幅度节约知识检索获取时间。 # 中医药知识服务平台 搜索...... Q 点击注册/登录,访问更多资源 # 方药 集成包括中药、中成药、西药、院内制剂、药典中药数据在内的各类数据。 # 名医经验 整合名医医案、名医方剂、名医理论、名医介绍等知识资源。 # 循证 整合系统评价、文献质量评价、临床研究等循证医学数据。 # 指南与规范 整合国家权威机构发布的指南、编码、术语等数据。 # 养生 整合中医养生文献,整合各方面中医养生知识。 # 诊疗技术 整合中医特色疗法、诊疗技术及其评价等临床知识资源。 # 文献 整合报纸、期刊、古代文献、外文文献等数据资源。 # 本体 收集证候、临床、养生、中药、中医文献等方面的本体。 # Open PHACTS 新药物发现 # Open PHACTS Bringing together pharmacological data resources in an integrated, interoperable infrastructure # Explore. Researchers can use Open PHACTS to access vast amounts of pharmacological data, all from a single, simple interface # Build. Developers get free access to the Open PHACTS API, to query the pharmacological data resources in our integrated triple store # Join. Members of the Open PHACTS Foundation get prioritised access to data, support and updates, as well as training opportunities # 欧盟重大联合攻关项目 面向药物研发的开放数据访问平台开发,其核心技术就是采用语义技术为有关研究人员提供高效的数据访问技术环境的支持。 # 查找阿尔茨海默病的靶标 信号转导通路(Signal transduction pathways)在药物靶标中很丰富——对化学疗法有反应的蛋白 CA1锥体神经元(CA1 Pyramidal Neurons)在阿尔茨海默病中遭到了损伤 我们可以找到参与信号转导和活跃在锥体神经元中的候选基因(candidate genes)吗? # 医疗知识图谱应用:药物发现 (3) <table><tr><td>DRD1, 1812</td><td>adenylate cyclase activation</td></tr><tr><td>ADRB2, 154</td><td>adenylate cyclase activation</td></tr><tr><td>ADRB2, 154</td><td>arrestin mediated desensitization of G-protein coupled receptor protein signaling pathway</td></tr><tr><td>DRD1IP, 50632</td><td>dopamine receptor signaling pathway</td></tr><tr><td colspan="2">基于SPARQL进行跨数据源的查询</td></tr></table> # 医疗大数据辅助诊疗 # 医疗机器人 # TINAVI|天智航 # SIMSun 新松 B # BOSHI 博买 天智航 妙手机器人 新松机器人 博实自动化 # 沈阳六雄康复机器人有限公司 SANGGU # ANKON () 祈飞科技 六维康复 桑谷医疗 安翰医疗 金山科技 Remebot 李群自动化 - 医疗大数据诊疗,其中包括基于认知计算,以IBM Watson for Oncology为代表的的辅助诊疗解决方案 针对诊断与治疗环节的医疗机器人 # 病情理解 电子病历 疾病特征 # 备选诊断生成 # 医疗行情数据覆盖摘要 # 医疗行情数据 1000万条 物料价格数据 1000+ 综合+行业新闻源 16万 国产药品目录 4000万 法律信息 10000+ 供应商信息 30万 药企资质信息 约700万 历史天气数据 2000多 采购物料 100多种 重点物料医药知识 # 医疗知识图谱应用:医疗行情分析 (2) # 原材料供应链可视化分析 支持某医药企业全部一百多种重点物料的全景图展示 ✓ 政策变更、异常天气等预警信息在图中直观显示,且实时更新 √ 可根据需求只查看特定类型的节点或高亮某一影响链路,影响关系/组成关系一目了然 原材料价格的影响路径 公司与物料的关系可视化 # 医疗知识图谱应用:医疗行情分析 (3) 药物采购量预测 助力学术科研 提升服务效率 促进业务转型 # 04 # 知识图谱在其他领域应用 # 基于代码知识图谱的搜索与推荐管理 - 贴合全球最大规模软件项目实际情况代码的搜索引擎,管理对象为代码仓库,包括代码,项目,程序员等。 - 实现某代码平台的精准、高效搜索 - 平均代码搜索时间从10份中降低到一分钟 # 运营商业务分析智能化解决方案 - 项目背景 通过知识图谱实现更丰富的搜索召回和更精准的个性化推荐,为运营商业务知识管理和分析提供支撑 - 关键技术/模块 - Kade知识库编辑系统 - 搜索、推荐技术 - 落地应用成果 - 已作为基础组建集成进入某大型民营企业知识管理平台 场景:上海联通局点,搜索“离网” # 商业情报分析智能化解决方案 # - 项目背景 - 该系统实现面向企业商业情报分析,旨在降低企业获取商机的门槛,帮助企业发现并对接客户、友商、供应商。 # - 关键技术 - 智能信息获取 - 文本标签化、实体链接 - 关联分析、知识推理 - 用户画像与个性化推荐 # - 落地应用成果 - 与河南省某孵化器公司深度对接,帮助其旗下数百家中小型企业发现商业机会。 # - 项目背景 - 为提高简单案件的审判效率,减少宝贵的司法资源的浪费,本项目建立了一套智能判案辅助机器人系统,为当事人提供专业的案件咨询,案件风险评估,法院服务和法律援助等。 # - 关键技术 - 专家系统、知识推理 - 结构化信息抽取 # - 落地应用成果 - 与上海市长宁区人民法院对接,已在民间借贷案由下取得初步成果, # 一带一路地缘环境知识图谱 - 项目背景 - 展示一带一路沿线国家的地缘环境,用以支持专家决策 - 关键技术 - 领域实体发现 - 多源数据融合 - 落地应用效果 - 已作为基础组件集成进入某军事部门的信息系统,用以支持领导策略 # 基于政务大数据的市民服务云应用 # - 项目背景 通过信息惠民综合试点,以创新社会管理、方便百姓服务为目标,建立了市民服务云,整合教育、医疗、卫生、社保、民政等多部门信息资源,引入优质社会服务资源,提供多渠道、多形式的信息服务,满足了居民多样化需求,逐步实现公共服务事项和社会信息服务的的全人群覆盖、全天候受理和“一站式”办理 # - 关键技术 - 领域知识图谱构建技术 - 针对领域数据的实时爬虫系统、多源异构数据自动抽取、多源数据融合 - 用户画像技术 用户关联技术、用户画像技术 数据安全支撑 # 基于知识图谱的网站多媒体推荐 - 项目背景 - 北京长城网作为北京市党员干部现代远程内容推送给目标用户。 - 关键技术 - 基于标签的领域知识图谱构建 - 多媒体的语义搜索和个性化推荐 - 可视化展示 - 落地应用 - 作为网站模块开发 # 电信知识图谱与标签系统 # 14 复旦知识工场平台:知识图谱数据与认知服务平台 知识工场平台:国内首个知识服务平台(2015年上线),对外提供10多类知识API服务;服务数百家用户单位,累计API调用量达到近8亿次 CN Dbpedia:大规模中文百科知识图谱,涵盖1800万实体,2.2亿关系,准确率达到 $99\%$ CN Probase:大规模中文概念图谱,涵盖1700万实体,27万概念,3300万关系,准确率达到95% # CN-Dbpedia 服务列表 1. api/mention2entity 2. api/entityAVP 3. api/entityAttribute 4. api-entityType 5. api/entityTag 6. api/ entityInformation # ProbasePlus服务列表 1. api/probase/getconceptsapi-entityAV P 2. api/probase/getentities # - SuperV: 验证码服务 知识问答服务 实体链接服务 # 实体理解 实体识别与链接 实体概念化 实体推荐 Input: 李娜网球打得怎么样? Output: 李娜[李娜(中国女子网球名将)]网球打得怎么样? china, japan, india, korea - > asian country 知识图谱的其他技术和应用: 深度问答与情感分析 # 面向知识图谱查询的Query理解 演过还珠格格的台湾演员 百度一下 演过还珠格格的台湾演员: 4.1.1 1 解码算法:-Transition(shift-reduce) decoding 2 结构特征:-依存分析的结果 3 语义特征:-角色标签,知识库Scheme # 深度问答的不同产品形态 # 花生发芽了还能吃吗(共89条网友回答) # 情感分析 # 玉龙雪山怎么样? 8.7分 已有45人参与评价 好评王龙雪山一定要去!山上有租军大衣的,老谋子的跳个人比拉推荐,歌舞表演的地点就设立在雪山脚下,神圣,爱惜。记得最后我都泪了 amy_dan:来自:妈妈 2013.11.16 差评学太少了,可能是最近干旱的缘故,只有山尖尖一点雪,所以不推荐 20qf0422来自:妈妈网 2013.11.25 # 集思广议如此评价迈情 # # 情感分类 目前平均油耗11升,很不错的内容,细节做工比较不错,体 谨,车是好车,但性价比一般。外观沉绝大气,前脸霸气,是 动力完全够用,推背感还是有的,百公里提速很快。后备箱空间 随着二郎腿,操控方面,其实悬挂是偏软的,但方向比较准确。 感觉还可以,舒适性还可以啦,只是座椅稍微有点硬,风噪胎爆 # 评论摘要 # 起亚k5口碑 # 【起亚K5】口碑怎么样 优点缺点百度知道 □牌排名:第增名 报价:124万20.79万 指导价:20.79万-15.98万 网友评价:全部1185条,好评306条,中评762条,重评117条 全部评论 操控 空间 舒适性 动力 沛 $\therefore m = \frac{3}{11}$ ; 优点: 家用还是不错的(21) 后备箱空间铜供给力(19) 回头看那个高(17) 缺点: 2.0的动力只能说耐用(40) 中控台是硬塑料的21 唯一不足的就是头部空间(16) # 关于配业K5的车友评论: :车架能改,在船前路面时能感觉到车身轻微扭曲,通过天窗与胶条的吱吱声就能判断出车身有轻微扭曲,但我觉得此点并不影响车身安全性,车架软主要是因为K5防盗钢梁是焊接而成的,不是整体结构。车辆碰撞时并不会影响安全行。 减需,过成德带时邦扣的,很德!确实有点不备供20万的车子!高速时的拍噪,你听去吧再就是在4S始装了导威一体机后中控台的左前方靠近挡风玻璃处有时响的异响。塑料弱强,行驶中能听到虚增的响声,很是使人的哦 # 比格比萨(台湾街) 认证商户 ★★★★★4.0 人均¥45 评语310 010-57153866 北京石景山区石景山第2号台南街6-24号5层(五)上海杨树 21-30 # 网友评论 4.0 # # 评论观点 # 评论Tag 知识图谱的其他技术和应用: 智能交互 # 百度考霸 们联系,我们会及时更正,谢谢。 # 1轮 600分可以上哪些学校推荐 使用2013的600的学校"搜索百度教育知识库结如下: <table><tr><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生省份</td><td>大学名</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>北京</td><td>大连海事</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>辽宁</td><td>湖南</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>陕西</td><td>湖南大</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>重庆</td><td>中央民族大</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>宁夏</td><td>北京航空航天</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>陕西</td><td>北京邮电大</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>山东</td><td>西南交通大</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>甘肃</td><td>对外经济贸易</td></tr></table> 简单输入,精准信息即刻展现~~ # 百度考霸:基于知识图谱的多轮交互 哪个省份的考生呢? # 2轮 使用“2013的辽宁600的学校”搜索结果如下: <table><tr><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>辽</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>辽</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>辽</td></tr></table> 简单输入,精准信息即刻展现~~ # 百度考霸 <table><tr><td>第一批</td><td>2013</td><td>文科</td><td>598</td><td>辽宁</td></tr><tr><td>第一批</td><td>2013</td><td>文科</td><td>598</td><td>辽宁</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>598</td><td>辽宁</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>598</td><td>辽宁</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>598</td><td>辽宁</td></tr></table> (共有285条结果,点击这里查看更多 文科还是理科? # 3轮 使用*2013的辽宁理科600的学校*识库结果如下: 简单输入,精准信息即刻展现~~ <table><tr><td>598</td><td>辽宁</td></tr><tr><td>598</td><td>辽宁</td></tr><tr><td>598</td><td>辽宁</td></tr><tr><td>598</td><td>辽宁</td></tr><tr><td>598</td><td>辽宁</td></tr></table> # 百度考霸 <table><tr><td>第一批</td><td>2013</td><td>理科</td><td>596</td><td>辽宁</td><td>中国药科大学</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>596</td><td>辽宁</td><td>中央民族大学</td></tr></table> (共有138条结果,点击这里查看更多结果) 您想找的'录取批次'是什么? # 4轮 第一批 使用“2013的辽宁第一批理科600的学校”搜索百度教育知识库结果如下: <table><tr><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生省份</td><td>大学名</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>辽宁</td><td>兰州大学</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>辽宁</td><td>合肥工业大学</td></tr></table> 简单输入,精准信息即刻展现~~ # Query解析与知识图谱查询 - 实体知识库查询机制:从自然语言Query到结构化知识库 北京市 600分 能上 什么 大学 依存分析 北京市 600分 能上 什么 大学 知识库查询query has('scoreLine',LT,'600').has('scoreLine',GT,'550').has('type','universityScoreLine').has('province','北京').has('type','universityScoreLine').vertices() 知识库查询 <table><tr><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生省份</td><td colspan="2">大学名</td></tr><tr><td>第一</td><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生省份</td><td>大学名</td></tr><tr><td>第一</td><td>第一</td><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生省份</td></tr><tr><td>第一</td><td>第一</td><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>北京</td></tr><tr><td>第一</td><td>第一</td><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>辽宁</td></tr><tr><td>第一</td><td>第一</td><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>陕西</td></tr><tr><td>第一</td><td>第一</td><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>重庆</td></tr><tr><td>第一</td><td>第一</td><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>宁夏</td></tr><tr><td rowspan="3">第一</td><td>第一</td><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>陕西</td></tr><tr><td rowspan="2">第一</td><td>第一批</td><td>2013</td><td>文科</td><td>599</td><td>山东</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>599</td><td>甘肃</td></tr></table> # 基于知识图谱的多轮交互技术 - 基于实体知识库查询结果的交互生成技术 - 综合考虑动态交互优先级与静态交互优先级,无需人工配置 - 动态交互优先级 - 基于知识库返回结果自动统计计算出对当前搜索结果数据集“切分度”最好的知识库属性作为交互点 - 静态交互优先级 - 基本假设:在用户日志中被经常搜索的属性是更为重要的属性 例子: • 查询:630分能考上什么大学 - (分析: 分数线的 “省份” 属性对当前数据表的切分度最好, 且高频出现在高考类分数线相关的query中) - 交互:哪个省份的呢? # 基于知识图谱的对话指代消解 Q:北京大学分数线 北京大学分数线 使用“北京大学的分数线”搜索百度教育知识库结果如下: <table><tr><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生省份</td><td>大学名</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>678</td><td>辽宁</td><td>北京大学</td></tr><tr><td>第一批</td><td>2012</td><td>理科</td><td>671</td><td>辽宁</td><td>北京大学</td></tr><tr><td>第一批</td><td>2011</td><td>理科</td><td>680</td><td>辽宁</td><td>北京大学</td></tr><tr><td>第一批</td><td>2010</td><td>理科</td><td>668</td><td>辽宁</td><td>北京大学</td></tr><tr><td>提前批</td><td>2010</td><td>理科</td><td>657</td><td>辽宁</td><td>北京大学</td></tr><tr><td>第一批</td><td>2009</td><td>理科</td><td>673</td><td>辽宁</td><td>北京大学</td></tr><tr><td>提前批</td><td>2009</td><td>理科</td><td>661</td><td>辽宁</td><td>北京大学</td></tr><tr><td>第一批</td><td>2008</td><td>理科</td><td>670</td><td>辽宁</td><td>北京大学</td></tr></table> 简单输入,精准信息即刻展现~~ Q: 那清华的呢 使用“清华大学的分数线”搜索百度教育知识库结果如下: <table><tr><td>录取批次</td><td>年份</td><td>学科类型</td><td>平均分</td><td>考生省份</td><td>大学名</td></tr><tr><td>第一批</td><td>2013</td><td>理科</td><td>690</td><td>吉林</td><td>清华大学</td></tr><tr><td>第一批</td><td>2012</td><td>理科</td><td>678</td><td>吉林</td><td>清华大学</td></tr><tr><td>第一批</td><td>2011</td><td>理科</td><td>686</td><td>吉林</td><td>清华大学</td></tr><tr><td>第一批</td><td>2010</td><td>理科</td><td>677</td><td>吉林</td><td>清华大学</td></tr><tr><td>第一批</td><td>2009</td><td>理科</td><td>682</td><td>吉林</td><td>清华大学</td></tr><tr><td>第一批</td><td>2008</td><td>理科</td><td>685</td><td>吉林</td><td>清华大学</td></tr><tr><td>第一批</td><td>2007</td><td>理科</td><td>689</td><td>吉林</td><td>清华大学</td></tr></table> 简单输入,精准信息即刻展现~~ Q: 它的排名是多少 (搜索使用了您的信息:理科吉林,如果不正确,可以回复正确信息更正,比如我是山东的或我是文科的) 它的排名是多少 使用“清华大学排名”搜索百度教育知识库结果如下: <table><tr><td>大学名</td><td>综合排名</td></tr><tr><td>清华大学</td><td>1</td></tr></table> 简单输入,精准信息即刻展现~~ # 基于知识图谱的泛需求满足 Q: 美女多的大学 美女多的大学 <table><tr><td>名称</td><td>置信度</td><td>详情</td></tr><tr><td>东华大学</td><td></td><td>点这里</td></tr><tr><td>北京电影学院</td><td></td><td>点这里</td></tr><tr><td>北京外国语大学</td><td></td><td>点这里</td></tr><tr><td>中国传媒大学</td><td></td><td>点这里</td></tr><tr><td>北京大学</td><td></td><td>点这里</td></tr><tr><td>华中师范大学</td><td></td><td>点这里</td></tr><tr><td>东南大学</td><td></td><td>点这里</td></tr><tr><td>上海外国语大学</td><td></td><td>点这里</td></tr></table> 简单输入,精准信息即刻展现~~ Q: 理科女生学什么专业好 理科女生学什么专业好 <table><tr><td>名称</td><td>置信度</td><td>详情</td></tr><tr><td>金融学</td><td></td><td>点这里</td></tr><tr><td>会计</td><td></td><td>点这里</td></tr><tr><td>旅游管理</td><td></td><td>点这里</td></tr><tr><td>国际经济与贸易</td><td></td><td>点这里</td></tr><tr><td>市场营销</td><td></td><td>点这里</td></tr><tr><td>广告学</td><td></td><td>点这里</td></tr><tr><td>财务管理</td><td></td><td>点这里</td></tr><tr><td>工业设计</td><td></td><td>点这里</td></tr><tr><td>英语</td><td></td><td>点这里</td></tr><tr><td>工程造价</td><td></td><td>点这里</td></tr></table> 简单输入,精准信息即刻展现~~ <table><tr><td>摘要</td><td>来源</td></tr><tr><td>理科女生适合学什么专业</td><td>详馆</td></tr><tr><td>理科女生适合学什么专业</td><td>详馆</td></tr><tr><td>理科女生学什么专业好</td><td>详馆</td></tr><tr><td>理科女生学什么专业好</td><td>详馆</td></tr><tr><td>理科女生学什么专业好</td><td>详馆</td></tr><tr><td>理科女生学什么专业好?</td><td>详馆</td></tr><tr><td>理科女生学什么专业比较好</td><td>详馆</td></tr><tr><td>有什么二本专业适理工科女生学的</td><td>详馆</td></tr><tr><td>我今年高考女生理科,学什么专业将来好就业</td><td>详馆</td></tr></table> # 智能交互:去哪儿订票 # 智能交互:多模交互 知识图谱的其他技术和应用: App Tagging # App Tagging # - 应用 - 基于tag的app搜索与推荐技术有助于提高移动端app分发 知识图谱的其他技术和应用: 需求图谱与兴趣图谱 # 百度指数需求图谱 在百度指数上线后,需求图谱作为新功能受到用户好评 # 百度风云榜兴趣图谱 # 谢谢 Tha n k you o u