[发明专利]一种中医理论典籍的知识图谱构建方法有效
申请号: | 201810910004.1 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109190113B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 张德政;金佩;谢永红;张妍;贾麒 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/295;G06F16/951;G06N3/04;G06N3/08 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中医理论 典籍 知识 图谱 构建 方法 | ||
1.一种中医理论典籍的知识图谱构建方法,其特征在于,包括:
确定中医理论典籍中的实体词表和动词词表;
根据确定的实体词表,对中医理论典籍中的实体进行标注;
根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体;
根据识别出的中医理论典籍中的实体,利用结合注意力机制的双向门控循环单元神经网络进行关系抽取,获取中医理论典籍中实体之间的关系,形成实体关系表;
以实体关系表中的实体为节点集,实体关系表中的关系为边集,构建中医理论典籍的知识图谱;
其中,所述确定中医理论典籍中的实体词表和动词词表包括:
根据中医理论典籍的语言特点,按照特殊标点符号、数字和中医理论典籍中出现的固定句式,形成实体词表,并根据形成的实体词表进行实体的分类;
利用固定句式总结中医理论典籍中的动词关系,形成动词词表,并根据形成的动词词表进行实体间关系的分类。
2.根据权利要求1所述的中医理论典籍的知识图谱构建方法,其特征在于,所述根据中医理论典籍的语言特点,按照特殊标点符号、数字和中医理论典籍中出现的固定句式,形成实体词表包括:
根据预先设置的特殊标点符号,确定中医理论典籍中的概念和子概念,根据确定的概念和子概念进行细分,得到中医理论典籍中的实体;
按照数字,确定中医理论典籍中的概念词实体和量词实体;
按照固定句式,确定中医理论典籍句子中包含的实体;
对得到的中医理论典籍中的实体进行汇总,形成实体词表;
以中医的认识方法和辩证论治为依据,对实体词表中的实体进行分类。
3.根据权利要求1所述的中医理论典籍的知识图谱构建方法,其特征在于,实体的分类类别包括:生理、病理、自然、认识方法、治法;
实体间关系的分类类别包括:表征、概念、因果、促进、抑制、包含、unknown,其中,unknown表示实体间有关系,但关系不明确。
4.根据权利要求1所述的中医理论典籍的知识图谱构建方法,其特征在于,在确定中医理论典籍中的实体词表和动词词表之后,所述方法还包括:
收集预先设置的词库中与中医相关的词表;
爬取预先设置的网站中的中医术语;
根据收集的与中医相关的词表和爬取的中医术语,扩充实体词表。
5.根据权利要求1所述的中医理论典籍的知识图谱构建方法,其特征在于,所述根据确定的实体词表,对中医理论典籍中的实体进行标注包括:
根据确定的实体词表,采用BIOES的标注方式,为中医理论典籍中包含的实体打标签;
其中,BIOES中的B表示实体的开始、I表示实体的中间、E表示实体的结尾、S表示单个字符的实体、O表示非实体。
6.根据权利要求1所述的中医理论典籍的知识图谱构建方法,其特征在于,所述根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体包括:
从网络上爬取和所述中医理论典籍相关的古籍,形成训练语料,根据形成的训练语料进行训练,得到中医理论典籍的字向量;
根据已标注实体的中医理论典籍和得到的中医理论典籍的字向量,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体。
7.根据权利要求6所述的中医理论典籍的知识图谱构建方法,其特征在于,所述从网络上爬取和所述中医理论典籍相关的古籍,形成训练语料,根据形成的训练语料进行训练,得到中医理论典籍的字向量包括:
从网络爬取和所述中医理论典籍相关的古籍,形成训练语料;
将训练语料中的古籍合并成一个文本,进行数据清洗后按字分割,其中,所述数据清洗包括:乱码清除、繁简体转换;
根据分割后得到的字,利用词向量生成工具的连续词袋模型进行训练,得到中医理论典籍的字向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810910004.1/1.html,转载请声明来源钻瓜专利网。