[发明专利]一种基于主要症状与伴随症状词的疾病认知系统有效
申请号: | 202010876663.5 | 申请日: | 2020-08-27 |
公开(公告)号: | CN111985246B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 杜乐;杜小军 | 申请(专利权)人: | 武汉东湖大数据交易中心股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/216;G06F18/22;G16H15/00;G16H50/70 |
代理公司: | 武汉红观专利代理事务所(普通合伙) 42247 | 代理人: | 李季 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主要症状 伴随 症状 疾病 认知 系统 | ||
1.一种基于主要症状与伴随症状词的疾病认知系统,其特征在于,所述基于主要症状与伴随症状词的疾病认知系统包括:
数据获取模块,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
数据获取模块包括数据集建立模块,用于获取疾病特征信息以及对应的症状特征信息,所述疾病特征信息包括:疾病特征词,症状特征信息包括:主要症状特征词以及伴随症状特征词,根据疾病特征信息以及该症状特征信息建立不同的特征词集合,包括:疾病特征词集合、主要症状特征词集合以及伴随症状特征词集合;
数据获取模块还包括数据库建立模块,用于根据疾病特征信息以及对应症状特征信息之间的对应关系建立疾病特征信息与对应症状特征信息的关系表,将该特征词集合与关系表组合,作为疾病知识数据库;
特征提取模块,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词,待识别临床症状特征信息包括临床主症状与伴随症状特征信息;
匹配模块,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息,得出相应类别疾病;
认知模块,用于建立Jaccard系数相似性算法,在得出的相应类别疾病的基础上,通过Jaccard系数相似性算法计算待识别症状特征词中的伴随症状特征信息与症状特征信息中的伴随症状特征信息之间的相似性,并生成对应认知报告,得出相应类别疾病。
2.如权利要求1所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:特征提取模块包括特征分词提取模块,用于获取待识别临床症状特征信息,所述待识别临床症状特征信息包括:疾病文本描述以及对应的症状文本描述,利用TF-IDF从待识别临床症状特征信息中提取各个词条的出现频率数据,设定出现频率阈值,将各个词条的出现频率数据与出现频率阈值进行比较,将出现频率数据大于出现频率阈值的词条作为特征分词。
3.如权利要求2所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:特征提取模块包括特征词提取模块,用于设定常用词库,根据该常用词库对特征分词进行筛选,将筛选出的常用词从对应的特征分词中删除,保留剩余特征分词作为待识别疾病特征词。
4.如权利要求3所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:匹配模块包括匹配计算模块,用于设定匹配相似度阈值,将疾病特征词集合中的各特征词与待识别疾病特征词进行匹配计算,计算出对应的匹配相似度,将该匹配相似度与匹配相似度阈值进行比较,当该匹配相似度大于匹配相似度阈值时,对疾病特征词集合中的特征词进行标记,并通过该特征词从疾病知识数据库查询对应的症状特征信息。
5.如权利要求4所述的基于主要症状与伴随症状词的疾病认知系统,其特征在于:认知模块包括计算认知模块,用于建立Jaccard系数相似性算法,设定相似性阈值,通过Jaccard系数相似性算法计算待识别症状特征词与症状特征信息之间的相似性,将该相似性与相似性阈值进行比较,当相似性大于相似性阈值时,生成对应的认知报告。
6.一种基于主要症状与伴随症状词的疾病认知设备,其特征在于,所述基于主要症状与伴随症状词的疾病认知设备包括:
数据获取单元,用于获取疾病特征信息以及对应症状特征信息,根据该疾病特征信息以及对应的症状特征信息建立疾病知识数据库;
数据获取单元包括数据集建立模块,用于获取疾病特征信息以及对应的症状特征信息,所述疾病特征信息包括:疾病特征词,症状特征信息包括:主要症状特征词以及伴随症状特征词,根据疾病特征信息以及该症状特征信息建立不同的特征词集合,包括:疾病特征词集合、主要症状特征词集合以及伴随症状特征词集合;
数据获取单元还包括数据库建立模块,用于根据疾病特征信息以及对应症状特征信息之间的对应关系建立疾病特征信息与对应症状特征信息的关系表,将该特征词集合与关系表组合,作为疾病知识数据库;
特征提取单元,用于获取待识别临床症状特征信息,通过TF-IDF从待识别临床症状特征信息中提取疾病特征分词以及对应的症状特征分词,根据该疾病特征分词以及对应的症状特征分词获取待识别疾病特征词以及对应的待识别症状特征词,待识别临床症状特征信息包括临床主症状与伴随症状特征信息;
匹配单元,用于将待识别疾病特征词与疾病特征信息进行匹配,获取待识别疾病特征词与疾病特征信息之间的匹配相似度,根据该匹配相似度从疾病知识数据库中查找与疾病特征信息对应的症状特征信息,得出相应类别疾病;
认知单元,用于建立Jaccard系数相似性算法,在得出的相应类别疾病的基础上,通过Jaccard系数相似性算法计算待识别症状特征词中的伴随症状特征信息与症状特征信息中的伴随症状特征信息之间的相似性,并生成对应认知报告,得出相应类别疾病。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉东湖大数据交易中心股份有限公司,未经武汉东湖大数据交易中心股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010876663.5/1.html,转载请声明来源钻瓜专利网。