[发明专利]基于症状匹配和机器学习的自动诊断系统和方法有效
申请号: | 201410280966.5 | 申请日: | 2014-06-20 |
公开(公告)号: | CN104102816B | 公开(公告)日: | 2017-07-25 |
发明(设计)人: | 唐力;周晋;黄权 | 申请(专利权)人: | 周晋 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司11139 | 代理人: | 孙皓晨,陈士骞 |
地址: | 100000 北京市东城区东*** | 国省代码: | 北京;11 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开一种基于症状匹配和机器学习的自动诊断系统和方法,其中系统包括疾病/症候数据库,用于保存已知的每种疾病/症候及其对应的症状;用户交互模块,用于接收用户输入的症状关键词集合;症状匹配模块,用于根据用户输入的所述症状关键词集合与所述疾病/症候数据库中的症状进行匹配,计算所述症状关键词集合与每种疾病/症候的匹配度;诊断模块,用于根据所述症状关键词集合与每种疾病/症候的匹配度确定对应的疾病/症候。 | ||
搜索关键词: | 基于 症状 匹配 机器 学习 自动 诊断 系统 方法 | ||
【主权项】:
一种基于症状匹配和机器学习的自动诊断系统,其特征在于,包括:疾病/症候数据库,用于保存已知的每种疾病/症候及其对应的症状;用户交互模块,用于接收用户输入的症状关键词集合;症状匹配模块,用于根据用户输入的所述症状关键词集合与所述疾病/症候数据库中的症状进行匹配,计算所述症状关键词集合与每种疾病/症候的匹配度;诊断模块,用于根据所述症状关键词集合与每种疾病/症候的匹配度确定对应的疾病/症候;词表构建模块,用于构建症状相关度词表,具体为:获取症状数据,其中所述症状数据包括从教科书、词典中获取的症状同、近义词表、从所述疾病/症候数据库中获取的每条疾病/症候的症状集合以及从用户请求记录中获取的每条有效请求的症状集合;对于所获取的症状数据,假设有两个症状x和y,则该两个症状x和y的关联度μ(x,y)为μ(x,y)=ΣP[ρ(P)·Σr∈Pg(r,x,y)Σp∈Pf(p,x)·Σq∈Pf(q,y)]]]>其中ρ(P)表示数据源P的判断权重,根据专家经验人为设定,ρ(同近义词表)>ρ(疾病/证候库)≥ρ(用户请求记录);r,p,q表示数据源P内的每个并发症状集合;其中|p|表示症状集合p中含有的症状的个数,将关联度大于关联度阈值的两个症状保存到创建的症状相关度词表;所述症状匹配模块包括:权重计算单元,用于根据以下公式计算症状x在疾病/症候d中的权重W(d,x):其中,ρ(S)表示数据源S的权重,e表示数据源S中有关疾病/症候的每一条描述单元信息;匹配度计算单元,用于计算所述疾病/症候数据库中的每条疾病/症候相对于所述症状关键词集合的匹配度,具体为:假设用户提供的所述症状关键词集合为A,遍历所述疾病/症候数据库中的每一个疾病/症候d及其对应的症状集合σ(d);用以下算式计算疾病/症候d相对于所述症状关键词集合A的匹配度M(A,d):M(A,d)=Σx∈A,y∈σ(d)μ(x,y)·W(d,y)|A|·|σ(d)|;]]>其中,∣A∣和∣σ(d)∣分别表示集合A和集合σ(d)中的元素个数;按M(A,d)由大到小的顺序对对应的疾病/症候进行排序,将排序得到的结果用R表示并呈现给用户,其中R={d|M(A,d)>0且r(d)<N},r(d)表示按M(A,d)由大到小排序后对应的疾病/症候的序号,N为人为设定的常数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于周晋,未经周晋许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410280966.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用