[发明专利]一种基于节点相似度的Kmeans中药材功效聚类方法在审
申请号: | 202010140751.9 | 申请日: | 2020-03-03 |
公开(公告)号: | CN111370140A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 谭露露;周银座;吴晨程 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G16H50/70;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 节点 相似 kmeans 中药材 功效 方法 | ||
1.一种基于节点相似度的Kmeans中药材功效聚类方法,其特征在于包括以下步骤:
步骤1、采集相关中医药数据,数据处理后形成方剂组成库、药材功效库、药材性味归经二值表;
步骤2、根据23大类功效表,将中药材功效总结归类,构建药材功效矩阵;
步骤3、基于方剂组成库构建方剂-药材二分网络;
步骤4、计算基于度分布的药材对期望值,将药材对期望值作为中药材相似度;
步骤5、建立基于中药材相似度的Kmeans聚类模型;
步骤6、基于所述聚类模型对中药材进行聚类,得到中药材可能具有的潜在功效。
2.根据权利要求1所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤1具体实现如下:
通过文献、数据库和其他网络资源的途径,基于人工、网络爬虫的方法采集中医药相关数据,整合形成方剂组成库、药材功效库以及药材性味归经二值表;方剂组成库中包括了方剂名以及对应的药材组成信息;药材功效库包含药材所具有的各类功效;药材性味归经二值表是基于药材所具有的性味归经的数据构建的二值表。
3.根据权利要求1或2所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤2具体实现如下:
依照中药的功效大类表将功效归类成23类,分别是补气、安神、开窍、化湿、温胃止呕、涌吐药、补血、祛风除湿、平肝息风、利尿通淋、温里理气、拔毒生肌、活血化瘀、消食、杀虫解毒、止痛、发散风寒、敛肺涩肠、收敛止血清热解毒、泻下、清热泻火、化痰止咳平喘、发散风热;通过对采集到的药材功效库进行匹配,得到简化的药材功效矩阵。
4.根据权利要求3所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤3具体实现如下:
使用方剂组成库,构建方剂药材关联二分网络,其中包括22570种方剂,1249味药材。
5.根据权利要求4所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤4具体实现如下
定义药材对期望值:即药材m1和药材m2同时存在于方剂i中的期望值,记为Pi;
Pi=A·B
其中,Pi为药材m1和药材m2同时存在于方剂i中的期望值;A为方剂i被药材m1选中的概率,B为方剂i被药材m2选中的概率,Di为方剂i的度,为药材m1的度,为药材m2的度,D为所有方剂度之和;将两个药材同时存在于每个方剂中的概率值Pi累加,共n个方剂,得到这两个药材同时出现于某一方剂中的期望值W;药材m1与药材m2实际共同存在于Wreal个方剂中,可由以下公式计算得到的值作为药材的相似度值:
的取值范围为(-1,-0.5)和(1,101);再将三元组变换为矩阵形式作为中药材相似度矩阵。
6.根据权利要求5所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤5具体实现如下
5-1.对中药材相似度矩阵使用主成分分析法进行降维,降维后数据维度为1249*2;
5-2.为了匹配功效大类个数,令聚类个数k=23;
5-3.计算初始聚类中心,随机选取23个样本为初始样本;
5-4.根据最小距离原则,为样本分配最邻近聚类;即计算当前类内任意样本的类内质心距离,比较得到质心距离最小的样本,则归为当前类,并计算平均误差;
5-5.更新聚类中心;即计算每一类中所有点的平均误差,然后再次进行分配,再次计算平均误差;
5-6.比较前后两次的平均误差是否相等,若不相等则返回步骤5-5重新更新聚类中心,若相等则进入步骤5-7;
5-7.以此类推,最终得到每个类别的样本;更新并保存类别和质心距离。
7.根据权利要求6所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤6具体实现如下
将得到的聚类结果与已有的药材功效库进行对比分析,以验证方法的准确度;衡量指标使用Pearson相关系数;具体步骤为:
6-1.使用Pearson相关系数计算得到类别Ki中每一味药材与其他药材的功效相关性,并计算平均值作为此药材的平均相关性;
6-2.得到类别Ki中所有药材的平均相关性列表,并将列表均值作为衡量类别Ki的归类准确度指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010140751.9/1.html,转载请声明来源钻瓜专利网。