[发明专利]基于畜禽疾病知识图谱的畜禽疾病的预测分类方法在审
申请号: | 202111528440.0 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114188024A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 陈家合;朱毅;孙小兵;杨章平;常国斌 | 申请(专利权)人: | 扬州大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06F16/36;G06F40/242;G06F40/289;G06K9/62 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;陈栋智 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 畜禽 疾病 知识 图谱 预测 分类 方法 | ||
1.一种基于畜禽疾病知识图谱的畜禽疾病的预测分类方法,其特征在于,包括以下步骤:
步骤1)根据畜禽疾病文本进行特征提取:选定一种畜禽疾病的病情陈述文本集合,使用汉语分词系统NLPIR导入提前准备的疾病和症状词典,对文本进行处理得到初始特征词集,之后进行词性选择得到中间特征词集,最后对中间特征词集进行加权TFIDF排序得到最终特征词集;
步骤2)使用图计算方法构建特征关联网络:对步骤1)得到的最终特征词集,通过基于图计算的方法建立该种疾病的特征关联网络,以此挖掘描述同种疾病的特征词之间出现的模式;将所有的特征词作为节点建立完全图,并且计算任意两个节点之间的有向关联度作为边的权重,然后通过去除弱关联获得强关联的特征关联网络,最后通过重构得到最终的特征词关联网络;
步骤3)构建畜禽疾病知识图谱:在步骤2)特征关联网络中,找出节点数在3以上的极大词团,通过筛选得到在描述该种疾病时同时出现的词团用于疾病类型推理,通过词团语义关系建立知识图谱;
步骤4)结构化抽取畜禽疾病特征:通过对知识图谱中的连通子图进行分解抽取,最终整理得到具有加权度的结构化特征;
步骤5)基于朴素贝叶斯,通过添加权重的改进算法计算单个特征对疾病的影响因子IMPT:设计基于朴素贝叶斯的单个症状对疾病的影响因子的计算方法,对所提取的结构化特征进行加权处理得到改进后的影响因子计算方法;
步骤6)基于步骤5)计算多个特征对疾病的影响因子:考虑到现实情况中往往出现两个或者多个症状对应一个疾病的情况,改进步骤5)的影响因子计算方法;
步骤7)得到畜禽疾病预测分类的结果:基于步骤5)、步骤6)中的改进算法,计算特征对于畜禽疾病的影响因子,通过影响因子的排列进一步辅助进行疾病预测推理,最终得到畜禽疾病预测分类的一个或多个推荐结果。
2.根据权利要求1所述的基于畜禽疾病知识图谱的畜禽疾病的预测分类方法,其特征在于,所述步骤1)具体包括:
步骤1.1)根据畜禽疾病文本进行特征提取:选定一种畜禽疾的病情陈述文本集合,使用汉语分词系统NLPIR导入提前准备的疾病和症状词典,对文本进行分词,词性标注,单字过滤和停用词去除得到初始特征集,之后对初始特征集进行词性选择、筛选与疾病密切相关的名词、动词、形容词,得到中间特征集;最后对得到的中间特征集进行加权TFIDF排序,得到最终特征集。
3.根据权利要求1所述的基于畜禽疾病知识图谱的畜禽疾病的预测分类方法,其特征在于,所述步骤2)具体包括:
步骤2.1)定义有向关联度:对于步骤1)中得到的最终特征词集,采用基于图计算的方法建立该种疾病的特征关联网络,以此挖掘描述同种疾病的特征词之间出现的模式;对于一种疾病的特征词集W,对于特征词集中的关键词wi,wj计算wi与wj的有向关联度,定义计算方式如下所示:
其中,w(wj|wi)是计算的有向关联度,p(wj|wi)是词wi出现时词wj出现的概率t(wi)是词wi的TFIDF值,q(wi,wj)是特征词对共现次数,q(wi)是词wi的词频;
步骤2.2)得到特征词关联网络:将所有特征词作为节点建立完全图,计算任意两个节点之间的有向关联度作为边的权重,去除不符合条件的关联边,定义若两节点之间的关联边小于2,则作为弱关联进行去除,得到强关联的特征关联网络;最后对得到的特征关联网络进行重构,将关键词对出现的次数q()作为新的权值重构得到关联网络G,然后根据G中权值的阈值进行过滤,得到最终的特征词关联网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111528440.0/1.html,转载请声明来源钻瓜专利网。