水利综合知识图谱构建研究

段浩 & 韩昆 & 赵红莉 & 蒋云钟 & 李豪 & 毛文山

Publisher: 水利学报

Published: Aug 30, 2021

类型: J

Description:

水利综合知识图谱构建研究

段浩,韩昆,赵红莉,蒋云钟,李豪,毛文山

(中国水利水电科学研究院,北京100038)

摘要:基于对水利知识特点的分析,提出了水利综合知识体系的描述方法,包括水利知识的定义、组成与关联;构建了水利知识图谱的构建框架和关键技术体系,以水利行业结构化业务数据的实体关系转换为基础,采用双向长 短 期 记 忆 神 经 网 络(Bi-directional Long Shot-Term Memory Neural Network, BiLSTM)与 条 件 随 机 场(ConditionalRandom Fields,CRF)方法识别半结构化、非结构化学科知识文本以及互联网数据中的水利实体,使用模式匹配和共现网络分析方法抽取各实体间关系,对涉水对象及其属性进行补充,基于风险最小化的最小风险映射模型(Risk Minimization based Ontology Mapping,RiMOM)进行了多源异构水利实体的融合,实现了涉水对象与水利学科知识的融合与关联,形成水利综合知识的建模和表达。在图谱构建过程中,累计抽取水利实体 136 万个,构建实体关系 300 余万条,抽取的水利实体对象的标注准确率在 80%以上。基于该图谱可实现水利知识的跨域查询与检索,学科图谱与水网图谱间关系查询,挖掘不同水利实体间的隐含关系,提高水利知识检索的效率和知识挖掘发现的能力。

关键词:知识图谱;水利综合知识;水资源管理;学科知识;BiLSTM;CRF

中图分类号:TP391

文献标识码:A

doi:10.13243/j.cnki.slxb.20200924