[发明专利]一种基于SSTM的中医证候智能诊断方法有效
申请号: | 201711096765.X | 申请日: | 2017-11-09 |
公开(公告)号: | CN107887022B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 马甲林;陈伯伦;张琳 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 223003 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 sstm 中医 智能 诊断 方法 | ||
1.一种基于SSTM的中医证候智能诊断方法,其特征在于,包括以下步骤:
(1)输入计算机程序可识别的病人电子文档诊疗记录数据集;
(2)构建症状-证候主题模型SSTM,并对模型中的参数求解;
(3)对SSTM进行训练,保存训练结果;
(4)输入预测样本;
(5)智能证候诊断—采用松弛SSTM进行增量训练;
(6)诊断结果及其症候规则输出;
其中,松弛SSTM是SSTM在初始化和抽样阶段取消对证候随机分配的显性约束条件;
所述步骤(2)包括以下步骤:
(21)构建SSTM,模型主题由来自数据集中显性变量—证候标签充当,对主题的分配只针对主症,次症不被分配主题,一个症状sdn的生成概率公式如下:
其中,d表示一条中医诊疗记录,s表示症状,sdn表示文档d的第n个症状,z表示证候,zdn表示文档d的第n个症状所属证候,y为主症和次症标记,ydn=0表示文档d的第n个症状为主症,ydn=1表示文档d的第n个症状为次症;
(22)对SSTM参数采样求解,具体公式如下:
其中,“-”表示排除当前位置症状t;表示在文档d中,排除当前位置症状t后所有y=1的症状的计数,表示在文档d中排除当前位置症状t后所有症状的计数,表示训练集中排除当前位置症状t后,所有出现t的计数,表示训练集中排除当前位置症状t后,所有症状的计数,V表示训练集中症状个数,ν为Beta(ν)分布超参数,η为Dirichlet(η)分布超参数;
其中,“-”表示排除当前位置症状t,表示在文档d中,排除当前位置症状t后所有y=0的症状的计数,表示在文档d中排除当前位置症状t后所有症状的计数,表示训练集中排除当前位置症状t后,编号为k的证候中所有出现t的计数;表示训练集中排除当前位置症状t后,编号为k的证候中所有症状的计数;表示在文档d中,排除当前位置症状t后所有被标记为证候编号为k的症状的计数,表示在文档d中排除当前位置症状t后所有被标记为y=0症状的计数,Md表示文档d中证候的个数,ν为Beta(ν)分布超参数,α和β为Dirichlet分布超参数;
为证候k的规则参数,具体到某一个症状t属于证候k的概率值采用均值参数估计法计算:
表示症状t属于编号为k的证候的概率;
θd表示文档d所含所有证候的概率参数,具体到某一个证候k属于文档d的概率,采用均值参数估计法:
表示证候k属于文档d的概率;
所述步骤(3)包括以下步骤:
(31)输入采样迭代次数Iter,超参数ν、η、α和β,训练样本集;
(32)随机初始化1:遍历训练样本集,对训练样本集中每一个文档的每一个症状s,随机地赋予一个y值,由向量y保存;
(33)随机初始化2:遍历训练样本集,对每一个文档所有被赋予y=0的症状s,从该文档的Λd的集合中随机分配一个证候编号,由向量z保存,Λd为文档d中所有证候的编号集合;
(34)重新遍历训练样本集,对每一个s,当s的主次症指示变量ys=1时按照公式(2)重新采样ys值,当ys=0按照公式(3)重新采样s的证候编号,并在向量y和z数据中更新;
(35)重复以上对样本集的采样过程Iter次,直至吉布斯采样收敛;
(36)根据公式(4)统计得到证候规则
(37)输出向量y和z,证候规则
所述步骤(5)包括以下步骤:
(51)输入采样迭代次数Iter,超参数ν、η、α和β,待预测样本,步骤(37)获得的向量y和z;
(52)随机初始化1:遍历待预测样本,对其中的每一个症状s,随机地赋予一个y值,由更新向量y保存;
(53)随机初始化2:遍历待预测样本,对其中所有被赋予y=0的症状s,从所有在向量z中出现的证候编号集合中随机分配一个证候编号;
(54)重新遍历待预测样本,对其中的每一个s,当s的主次症指示变量ys=1时按照公式(2)重新采样ys值;当ys=0按照公式(3)重新采样s的证候编号,并在向量y和z中更新;
(55)重复以上对待预测样本的采样过程Iter次,直至吉布斯采样收敛;
(56)根据公式(5)统计得到待预测病人的证候诊断结果θd;
(57)输出待预测样本证候诊断结果θd。
2.根据权利要求1所述的基于SSTM的中医证候智能诊断方法,其特征在于,步骤(1)中所述数据集的每一条数据视作一个文档d,由一个或者多个证候及相应多个症状组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711096765.X/1.html,转载请声明来源钻瓜专利网。