[发明专利]一种中医理论典籍的知识图谱构建方法有效
申请号: | 201810910004.1 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109190113B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 张德政;金佩;谢永红;张妍;贾麒 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/295;G06F16/951;G06N3/04;G06N3/08 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中医理论 典籍 知识 图谱 构建 方法 | ||
本发明提供一种中医理论典籍的知识图谱构建方法,能够提高构建的知识图谱的准确率。所述方法包括:确定中医理论典籍中的实体词表和动词词表;根据确定的实体词表,对中医理论典籍中的实体进行标注;根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体;根据识别出的中医理论典籍中的实体,利用结合注意力机制的双向门控循环单元神经网络进行关系抽取,获取中医理论典籍中实体之间的关系,形成实体关系表;以实体关系表中的实体为节点集,实体关系表中的关系为边集,构建中医理论典籍的知识图谱。本发明涉及知识工程领域。
技术领域
本发明涉及知识工程领域,特别是指一种中医理论典籍的知识图谱构建方法。
背景技术
从古至今,中医领域积累了大量的医学理论典籍,如《黄帝内经》、《难经》、《类经》等。这些典籍采用古文言文的形式,且大多是非结构化的文本。中医是一门渊源很久的学科,古代医学大家的理论典籍对后人了解中医知识和运用前人经验至关重要。而目前没有对中医理论典籍知识的结构化认识,如何将这些蕴含在中医理论典籍中的海量资源进行梳理并利用,已成为中医领域一个关注的热点问题。
知识图谱是描述真实世界中存在的各种概念或实体,以及各种实体、概念之间的关系。本质上是将领域知识数据体系化、关系化的语义网络,是一种基于图的数据结构。通俗来说,知识图谱是基于信息系统建立的知识库,根据提取的实体间关系通过可视化技术把复杂知识领域系统地展示出来。知识图谱的应用,能够实现对知识的共建、共享及重用。
但目前中医领域的知识图谱的应用很少,尤其是针对中医理论典籍这一类描述中医认识方法和辩证论治的理论书籍的知识图谱。
发明内容
本发明要解决的技术问题是提供一种中医理论典籍的知识图谱构建方法,以解决现有技术所存在的缺少描述中医认识方法和辩证论治的理论书籍的知识图谱的问题。
为解决上述技术问题,本发明实施例提供一种中医理论典籍的知识图谱构建方法,包括:
确定中医理论典籍中的实体词表和动词词表;
根据确定的实体词表,对中医理论典籍中的实体进行标注;
根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体;
根据识别出的中医理论典籍中的实体,利用结合注意力机制的双向门控循环单元神经网络进行关系抽取,获取中医理论典籍中实体之间的关系,形成实体关系表;
以实体关系表中的实体为节点集,实体关系表中的关系为边集,构建中医理论典籍的知识图谱。
进一步地,所述确定中医理论典籍中的实体词表和动词词表包括:
根据中医理论典籍的语言特点,按照特殊标点符号、数字和中医理论典籍中出现的固定句式,形成实体词表,并根据形成的实体词表进行实体的分类;
利用固定句式总结中医理论典籍中的动词关系,形成动词词表,并根据形成的动词词表进行实体间关系的分类。
进一步地,所述根据中医理论典籍的语言特点,按照特殊标点符号、数字和中医理论典籍中出现的固定句式,形成实体词表包括:
根据预先设置的特殊标点符号,确定中医理论典籍中的概念和子概念,根据确定的概念和子概念进行细分,得到中医理论典籍中的实体;
按照数字,确定中医理论典籍中的概念词实体和量词实体;
按照固定句式,确定中医理论典籍句子中包含的实体;
对得到的中医理论典籍中的实体进行汇总,形成实体词表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810910004.1/2.html,转载请声明来源钻瓜专利网。