[发明专利]分类表达式生成方法和装置有效
申请号: | 201710961839.5 | 申请日: | 2017-10-16 |
公开(公告)号: | CN107679209B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 李德彦;晋耀红;郝思洋 | 申请(专利权)人: | 鼎富智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 表达式 生成 方法 装置 | ||
1.一种分类表达式生成方法,其特征在于,所述方法包括:
获取至少两个分类,每个所述分类包括多个语料;
对所述语料的概念值和要素值进行识别,获得每个所述语料的概念和/或要素;
根据各分类包括的语料对每个所述分类进行算法挖掘生成对应于该分类的频繁模式集合,每个所述频繁模式集合中包括至少一个频繁模式,每个所述频繁模式中包括概念或要素中的至少一种;
比较所有分类下的频繁模式集合中,各个频繁模式的概念和/或要素,排除相同的频繁模式,保留至少有一个概念或要素与其它频繁模式不同的频繁模式,并生成候选频繁模式集合,所述候选频繁模式集合中包括至少一个候选频繁模式;比较的各个频繁模式中包括每个分类下预先生成的分类表达式;包括:比较通过算法挖掘的各个频繁模式是否相同,以及比较所述挖掘的各个频繁模式与所述预先生成的分类表达式中的概念和或要素的组合是否相同;
如果均不相同,则将该频繁模式作为所述候选频繁模式,并生成所述候选频繁模式集合;
将所述至少一个候选频繁模式中的概念和/或要素组合运算生成每个所述分类的分类表达式,以使所述语料能够以分类表达式的形式划分到具体的一个分类之中,辅助建立和优化分类模型。
2.根据权利要求1所述的方法,其特征在于,每个所述语料对应一个项集,所述算法包括Apriori算法,
所述根据各分类包括的语料对每个所述分类进行算法挖掘生成对应于该分类的频繁模式集合,包括:
获取所述每个分类下的多个语料所对应的多个项集;
将所述多个项集通过所述Apriori算法运算生成多个频繁模式集合,每个所述分类对应一个频繁模式集合。
3.根据权利要求2所述的方法,其特征在于,所述生成多个频繁模式集合,包括:
筛选二元或二元以上,且只包含概念和要素中的一种的频繁模式;
排除只包含概念和只包含要素组成的二元及二元以上的频繁模式,保留一元频繁模式和包含概念和要素的二元及二元以上的频繁模式,并利用保留的频繁模式生成所述多个频繁模式集合。
4.根据权利要求1-3任一项所述的方法,其特征在于,
将所述至少一个候选频繁模式中的概念和/或要素组合运算生成每个所述分类的分类表达式,包括:
设每个所述频繁模式中的一个概念或者一个要素为一元,统计所述候选频繁模式中所包含的元的个数;
判断所述候选频繁模式是否是由二元或二元以上的概念和/或要素组成;
如果是,则将所述候选频繁模式中的所有概念和/或要素进行逻辑与的运算生成所述分类表达式;
如果所述候选频繁模式中由一元概念或要素组成,则将一元的候选频繁模式与已建成的分类表达式进行逻辑非的运算生成所述分类表达式。
5.根据权利要求4所述的方法,其特征在于,
若包含二元的频繁模式,且按照逻辑与运算,则所述分类表达式表示为:c_X+e_Y 或e_X+c_Y;
若包含二元的频繁模式,且按照逻辑非运算,则所述分类表达式表示为:c_X-e_Y 或e_X-c_Y;
若包含三元的频繁模式,且按照逻辑与运算,则所述分类表达式表示为:c_X+e_Y+c_Z;
若包含三元的频繁模式,且按照逻辑与和逻辑非运算,则所述分类表达式表示为:c_X+e_Y-c_Z;
其中,上述各分类表达式中,c表示概念,e表示要素,X、Y和Z表示概念名或要素名,“+”表示逻辑与运算,“-”表示逻辑非运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富智能科技有限公司,未经鼎富智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710961839.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种烹饪酱汁的制备方法
- 下一篇:一种网布补强方法