[发明专利]一种基于直接区分序列挖掘的不确定数据分类方法在审

申请号：	201811207644.2	申请日：	2018-10-17
公开（公告）号：	CN109447138A	公开（公告）日：	2019-03-08
发明（设计）人：	赵宇海;印莹;刘陆洋;王国仁	申请（专利权）人：	东北大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06F16/2458
代理公司：	沈阳优普达知识产权代理事务所(特殊普通合伙) 21234	代理人：	李晓光
地址：	110169 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于直接区分序列挖掘的不确定数据分类方法，对不确定数据集UTD，首先初始化类标签，给出类标签集；在类标签集下，基于给定的信息增益阈值导出最小支持度阈值：采用模式增长策略进行子序列枚举，生成模式候选x，挖掘其中的区分序列，并采用削减策略，生成最终的区分序列结果集Rs；再对区分序列结果集Rs检查，利用闭序列检测算法判断Rs中的每个候选区分序列是否为概率频繁闭序列；若是概率频繁闭序列，则将满足条件的区分序列加入结果集RsTmp；最后结合基于规则的分类方法或支持向量机已有的成熟数据分类方法，完成数据分类。本发明作为不确定数据集上区分模式挖掘补充，显著提高效率，结果集更加简洁。
搜索关键词：	数据分类序列结果序列挖掘标签结果集数据集序列检测算法支持向量机最小支持度满足条件模式挖掘模式增长生成模式信息增益初始化子序列概率导出枚举削减挖掘分类补充成熟检查
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于直接区分序列挖掘的不确定数据分类方法，对给定的不确定数据集UTD，其特征在于包括以下步骤：1)初始化类标签InitializeLabel()，给出类标签集C{c1,c2,…,cn}；2)在类标签集下，基于给定的信息增益阈值导出最小支持度阈值：min_sup＝f(maxIG)，即利用最小支持度的设定算法MinSupGen求出最小支持度阈值；3)在最小支持度阈值下采用基于前缀投影的模式增长策略进行子序列枚举，生成模式候选x：x＝PrefixSpanGrowth(X)，X为前缀投影序列；4)对生成的模式候选x挖掘其中的区分序列，利用IGMine算法和ECMine算法来进行区分序列的初始挖掘工作，通过Prune削减策略进行空间削减，生成最终的区分序列结果集Rs；5)对区分序列结果集Rs检查，利用闭序列检测算法ClosureChecking判断Rs中的每个候选区分序列是否为概率频繁闭序列；6)若候选区分序列为概率频繁闭序列，则将满足条件的候选区分序列加入结果集RsTmp中；7)最后结合基于规则的分类方法或支持向量机已有的成熟数据分类方法，完成不确定数据集UTD的数据分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811207644.2/，转载请声明来源钻瓜专利网。

上一篇：一种基于分解因子的图像局部风格迁移方法
下一篇：包含完整家畜的养殖场场景点云识别方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于直接区分序列挖掘的不确定数据分类方法在审

专利文献下载