[发明专利]基于特征组的中医主症选择方法有效
申请号: | 201710445511.8 | 申请日: | 2017-06-14 |
公开(公告)号: | CN107292097B | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 颜建军;刘国萍;顾巍杰;郭睿;燕海霞;王忆勤;王灼龙 | 申请(专利权)人: | 华东理工大学;上海中医药大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06K9/62 |
代理公司: | 31239 上海和跃知识产权代理事务所(普通合伙) | 代理人: | 杨慧 |
地址: | 202037 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 选择 方法 中医 | ||
本发明公开了一种基于特征组的中医主症选择方法,包含以下步骤:1、对原始特征集进行筛选;2、利用特征聚类算法对筛选后的特征集进行聚类,得到相应的特征组;3、向每一个特征组引入一个隐变量,得到相应的隐类模型,计算隐变量与标签之间的相关性;4、根据隐变量与标签之间的相关性从大到小对特征组进行排序;步骤5、将排序后的特征组依次加入被选特征子集,建立含有隐变量的贝叶斯网络;6,计算贝叶斯网络的分类准确率,进而得到加入的特征组个数与分类准确率的曲线,通过判断曲线的收敛或者最高准确率得到相应的最优特征子集。本发明以特征组为选择目标,由多个特征所组成的特征组具有对原始数据更好的表示能力。
技术领域
本发明涉及模式识别和机器学习研究领域,特征涉及一种基于特征组的特征选择方法。
背景技术
特征选择(Feature Selection)的主要目的就是从原始特征中选出符合指定评估标准的最优的特征子集,使选出的最优特征子集所构建的分类模型或者回归模型达到比特征选择之前更好的性能,通过特征选择不仅提高了模型的泛化能力,使模型可以得到更好的解释从而提高计算效率,同时也很好的降低了维数灾难的发生。
在传统的特征选择算法中,特征的选择主要是针对单个的特征进行,考虑各特征与标签之间的相关性的大小,以特定的评价标准对各特征进行取舍。例如基于互信息,信息增益等特征选择算法是常用的特征选择算法。其基本思路为计算特征与分类之间的互信息的大小,在给定阈值的前提下按照互信息由大到小选择相应的特征,该算法思想简单,计算复杂度较小,且运行速度快,但该特征选择方法也存在一定的缺点:首先对于所给阈值的大小没有统一的标准,主观因素较大。其次对于所选的特征由于只考虑了特征与类别之间的相关性而忽略了特征之间的关系,可能会带来较大的的冗余,而忽略了一些重要的特征。而在现实生活中,最优特征子集所包含的特征之间往往具有一定的相关性。相对于单个特征而言,由多个特征所组成的特征组往往具有对原始数据更好的表示能力,例如在中医辨证中,证素定义为一组具有内在联系的症状与体征所组成的症状群的总称,能够准确的反应疾病的病因,病位,病性与病势等。证素是中医辨证的主要依据,也是症状的组合。也就是说通过症状的组合能够反映中医辨证中某些疾病的本质。所以在特征选择中相对于对单个特征的取舍而言通过对特征组的选择会更符合实际意义。
基于上述的思想本申请提出了基于特征组的特征选择方法,与以往的考虑单个特征的舍取不同,基于特征组的特征选择方法的考虑目标为对特征组的选择,若某一特征组可以作为特征子集,则将该特征组包含的所有特征加入所选特征子集中。
在基于特征组的特征选择算法中有两点重要的内容:(1)怎样通过对原始特征的划分得到各特征组。(2)以什么样的准则选择特征组作为特征子集,即以什么样的评价函数进行特征选择。
发明内容
针对单个特征的特征选择存在的缺陷,本发明的发明目的一在于提供了一种基于特征组的特征选择方法,根据各特征之间的关联性组成特征组,从而实现对原始数据更好的表示能力。针对在中医辨证中对应某种证型可能出现的症状可能有几十甚至上百种,会给中医辨证研究带来了困难的缺陷,本发明的发明目的在二于提供了一种基于特征组的中医主症选择方法,将证素体现在中医辨证模型中能使中医辨证模型与中医理论更加符合。
本发明的发明目的一通过以下技术方案实现:
一种基于特征组的特征选择方法,包含以下步骤:
步骤(1)、从原始特征集中去除与标签内容无关的特征和频次出现过小的特征,得到待挑选的特征集;
步骤(2)、利用特征聚类算法对待挑选的特征集中各特征进行聚类,得到相应的特征组;
步骤(3)、向每一个特征组引入一个隐变量,得到相应的隐类模型,计算隐变量与标签之间的相关性;
步骤(4)、根据隐变量与标签之间的相关性从大到小对特征组进行排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学;上海中医药大学,未经华东理工大学;上海中医药大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710445511.8/2.html,转载请声明来源钻瓜专利网。