段浩 & 韩昆 & 赵红莉 & 蒋云钟 & 李豪 & 毛文山
人工智能 水利 知识图谱 知识工程
Publisher: 水利学报
Published: Aug 30, 2021
水利综合知识图谱构建研究
段浩,韩昆,赵红莉,蒋云钟,李豪,毛文山
(中国水利水电科学研究院,北京100038)
摘要:基于对水利知识特点的分析,提出了水利综合知识体系的描述方法,包括水利知识的定义、组成与关联;构建了水利知识图谱的构建框架和关键技术体系,以水利行业结构化业务数据的实体关系转换为基础,采用双向长 短 期 记 忆 神 经 网 络(Bi-directional Long Shot-Term Memory Neural Network, BiLSTM)与 条 件 随 机 场(ConditionalRandom Fields,CRF)方法识别半结构化、非结构化学科知识文本以及互联网数据中的水利实体,使用模式匹配和共现网络分析方法抽取各实体间关系,对涉水对象及其属性进行补充,基于风险最小化的最小风险映射模型(Risk Minimization based Ontology Mapping,RiMOM)进行了多源异构水利实体的融合,实现了涉水对象与水利学科知识的融合与关联,形成水利综合知识的建模和表达。在图谱构建过程中,累计抽取水利实体 136 万个,构建实体关系 300 余万条,抽取的水利实体对象的标注准确率在 80%以上。基于该图谱可实现水利知识的跨域查询与检索,学科图谱与水网图谱间关系查询,挖掘不同水利实体间的隐含关系,提高水利知识检索的效率和知识挖掘发现的能力。
关键词:知识图谱;水利综合知识;水资源管理;学科知识;BiLSTM;CRF
中图分类号:TP391
文献标识码:A
doi:10.13243/j.cnki.slxb.20200924
Description:
水利综合知识图谱构建研究
段浩,韩昆,赵红莉,蒋云钟,李豪,毛文山
(中国水利水电科学研究院,北京100038)
摘要:基于对水利知识特点的分析,提出了水利综合知识体系的描述方法,包括水利知识的定义、组成与关联;构建了水利知识图谱的构建框架和关键技术体系,以水利行业结构化业务数据的实体关系转换为基础,采用双向长 短 期 记 忆 神 经 网 络(Bi-directional Long Shot-Term Memory Neural Network, BiLSTM)与 条 件 随 机 场(ConditionalRandom Fields,CRF)方法识别半结构化、非结构化学科知识文本以及互联网数据中的水利实体,使用模式匹配和共现网络分析方法抽取各实体间关系,对涉水对象及其属性进行补充,基于风险最小化的最小风险映射模型(Risk Minimization based Ontology Mapping,RiMOM)进行了多源异构水利实体的融合,实现了涉水对象与水利学科知识的融合与关联,形成水利综合知识的建模和表达。在图谱构建过程中,累计抽取水利实体 136 万个,构建实体关系 300 余万条,抽取的水利实体对象的标注准确率在 80%以上。基于该图谱可实现水利知识的跨域查询与检索,学科图谱与水网图谱间关系查询,挖掘不同水利实体间的隐含关系,提高水利知识检索的效率和知识挖掘发现的能力。
关键词:知识图谱;水利综合知识;水资源管理;学科知识;BiLSTM;CRF
中图分类号:TP391
文献标识码:A
doi:10.13243/j.cnki.slxb.20200924