[发明专利]一种中药和症状关系的数据挖掘方法在审

专利信息
申请号: 202010708196.5 申请日: 2020-07-21
公开(公告)号: CN111951971A 公开(公告)日: 2020-11-17
发明(设计)人: 石东新;李朝晖;杨爽;张远;邱婉;蔡德俊;程博雅 申请(专利权)人: 中国传媒大学
主分类号: G16H50/70 分类号: G16H50/70;G16H20/90
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100024 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 中药 症状 关系 数据 挖掘 方法
【权利要求书】:

1.一种中药和症状关系的数据挖掘方法,其特征在于,该方法包括如下步骤,

步骤1、对中医诊疗老年病数据集进行相关预处理,输入数据为文本形式的医案数据,输出数据为向量形式:

步骤2、采用熵聚类算法挖掘方药配伍,输入是经过数据预处理后得到的所有中药向量,输出是方药配伍组合;具体步骤如下:

步骤3、依据中医学上用一组方药配伍共同发挥功效治疗症状的中医常识为支撑,在得到方药配伍结果的基础上,探索方药配伍与症状的对应关系,如果某组方药配伍与某个症状具有映射关系,则所有组成方药配伍的中药与此症状具有映射关系。

2.根据权利要求1所述的一种中药和症状关系的数据挖掘方法,其特征在于,步骤1的实施过程如下:

步骤1.1、将文本解析成字符串,并进行字符串匹配、字符串分割操作,从中提取出症状词、中药词;

步骤1.2、对不规范的症状词、中药词进行数据清洗;针对一义多词、多词一义、复合表述的情况,基于设计聚合、拆分规则,纠正错误用语,保证症状词、中药词的唯一性和准确性;

步骤1.3、进行数据变换,根据症状词、中药词在就诊记录中存在与否,映射到对应的二进制值1、0;存在用1表示,不存在用0表示;

步骤1.4、进行降维,统计各个症状词、中药词出现的频次,将频次不足样本量十分之一的词删除。

3.根据权利要求1所述的一种中药和症状关系的数据挖掘方法,其特征在于,步骤2的实施过程如下:

步骤2.1、输入N个中药向量,计算中药向量两两之间的关联度系数;

步骤2.2、规定与给定中药向量关联度系数大小排名位列前M位且关联度系数大于0的中药向量为该中药向量的亲密变量;为每个中药向量按照此规定寻找亲密变量;

步骤2.3、将两个互为亲密变量的中药向量组成二元组方药配伍;接着搜索下一个可能聚类的中药向量,如果该中药向量能够与二元组方药配伍中的任意一个中药互为亲密变量,则这三个中药向量聚为一类,形成三元组方药配伍;以此类推,直到饱和,即不能再往里添加任何一个中药向量才结束迭代过程;

动态地选择中药的亲密变量个数,只考虑与目标中药的关联度系数非负的中药,改进后方法过滤掉临床上实际并未同时使用的中药药对;

算法中关联度系数的公式如下:

其中H(Xi)表示中药向量Xi的自信息熵,p(i,j)表示两种中药在同一剂处方中同时出现的频率;两味中药共现频率大于0时,计算关联度系数,结果是一个大于0的数;反之,中药之间共现频率等于0时,计算关联度系数,结果是一个小于0的数。

4.根据权利要求3所述的一种中药和症状关系的数据挖掘方法,其特征在于,步骤3的实施过程如下:

步骤3.1、依据共现信息寻找可能与方药配伍存在映射关系的所有候选症状对象,只要在某个病历记录中与方药配伍同时存在的症状都暂定为与其具有映射关系;

步骤3.2、为了在暂定症状中筛选与方药配伍真正存在映射关系的症状,设计了基于关联强度规则过滤症状的方法;首先对于每一个症状向量,根据关联度系数的公式计算其与各个中药向量的关联度系数,并降序排列;这样各个中药向量有一个关于该症状向量的关联强度排名r1hs;对于每一个中药向量,计算其与各个症状向量的关联度系数,各个症状向量也有一个关于该中药向量的关联强度排名r1sh;任意一组症状向量与中药向量的关联程度可由r1hs+r1sh的大小决定;根据r1hs+r1sh重新调整基于关联度系数各症状向量与中药向量的关联强度排序rank1;然后,通过统计中药与症状的共现频次,获得基于共现频次各症状向量与中药向量的关联强度排序rank2;那么,基于关联强度规则过滤候选症状的思路为:如果方药配伍中的所有中药Hi均满足与某个候选症状的关联强度排序rank1或rank2不大于K,即候选症状满足式子(2):

{((rank1of Hi)≤K)OR((rank2of Hi)≤K),Hi∈方药配伍} (2)

则保留该症状,否则剔除,K取值为处方平均中药味数的二分之一;经过过滤步骤,最终获得符合临床认识的症状与中药的映射关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010708196.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top