[发明专利]一种中医药及民族医药知识图谱的构建方法有效

专利信息
申请号: 202110173750.9 申请日: 2021-02-06
公开(公告)号: CN112800244B 公开(公告)日: 2022-12-27
发明(设计)人: 郑世超;温川飙;张艺;萧文科;甘彦雄;杨超;高园 申请(专利权)人: 成都中医药大学
主分类号: G06F16/36 分类号: G06F16/36;G06F16/35;G06F40/289;G06F40/295;G16H70/40
代理公司: 四川力久律师事务所 51221 代理人: 冯精恒
地址: 610075 *** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 中医药 民族 医药 知识 图谱 构建 方法
【权利要求书】:

1.一种中医药及民族医药知识图谱的构建方法,其特征在于,包括以下步骤:

S1:录入医学文本数据集并对其进行预处理,获取医学文本并存入文本数据集;

S2:将所述文本数据集中的所述医学文本转换为词向量,并将所述词向量输入到CBOW模型中进行更新处理;

S3:对所述词向量进行实体标注,并通过双向长短时记忆神经网络技术构建自适应层次注意网络,对所述实体标注的类别进行自动注释;其中,所述类别包括症状、疾病以及药物;

所述实体标注动作采用基于熵扩展术语抽取技术,令检索关键词对应的所述词向量为S,其他所述词向量为x,其计算式为:

Entrop(S)=-∑x∈XP(xS|S)log2P(xS|S);

其中,为所述关键词S出现时,x作为其相邻词向量的条件概率;X为所述关键词S周围出现的词向量集合;xS为S周围出现的所述词向量x与S共同出现时的字符串组合;

S4:将标注注释完成后的所述词向量输入到中医药及民族医药数据库,并根据所述中医药及民族医药数据库进行知识图谱信息抽取,通过Fruchterman Reingold算法构建并输出中医药及民族医药知识图谱模型。

2.根据权利要求1所述的一种中医药及民族医药知识图谱的构建方法,其特征在于,所述步骤S1包括以下流程:

S11:录入医学文本数据集;其中,所述医学文本数据集包括多个数据列,每个所述数据列包括多条含有医学文本的标准数据;

S12:对所述医学文本数据集进行清洗,去除脏数据;

S13:通过NLPIR-ICTCLAS汉语分词系统对所述医学文本数据集进行分词,获取医学文本并存入文本数据集。

3.根据权利要求2所述的一种中医药及民族医药知识图谱的构建方法,其特征在于,所述步骤S12包括:

S121:在所述医学文本数据集中选择需要的数据列;

S122:遍历所述数据列,对列名相同或含义指向相同的数据列进行重命名;

S123:遍历所述数据列中的所述标准数据,删除与所述标准数据的相同含义的重复数据;

S124:遍历所述医学文本数据集,获取所述数据列的空白数据,并发送至工作人员补充缺失值。

4.根据权利要求2所述的一种中医药及民族医药知识图谱的构建方法,其特征在于,所述步骤S13还包括根据停用词表过滤无效、无实质意义或者干扰词汇,提高分词的准确性和针对性。

5.根据权利要求1所述的一种中医药及民族医药知识图谱的构建方法,其特征在于,所述步骤S2包括:

S21:通过独热码将所述文本数据集中的所述医学文本转换为词汇编码;

S22:通过Word2Vec模型将所述词汇编码转换为词向量;

S23:将所述词向量输入到CBOW模型中进行更新处理。

6.根据权利要求5所述的一种中医药及民族医药知识图谱的构建方法,其特征在于,所述步骤S23包括:

S231:将所述词向量输入到CBOW模型,并对所述词向量进行累加求和操作,其计算式为:

其中,ω为所述词汇编码,Xω为所述词向量的累加和值,V(Coentext(ω)i)为所述医学文本数据集第i个所述词向量,2c为所述词向量的总数;

S232:根据公式对所述词向量反向迭代和更新;其中,V(ω)为所述词汇编码ω的词向量,lω为所述词汇编码ω对应的联立路径中节点的个数,为所述词汇编码ω的哈夫曼编码,为所述词汇编码ω对应的联立路径中非叶子节点个数。

7.根据权利要求1所述的一种中医药及民族医药知识图谱的构建方法,其特征在于,所述医学文本数据集包括中文医学主题词表以及中医药及民族医药文献数据,且所述医学文本数据集符合卫生信息交换标准、ISO/TS 23030国际标准以及ISO 18668-2:2017国际标准。

8.一种电子设备,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都中医药大学,未经成都中医药大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110173750.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top