[发明专利]一种新的数据挖掘方法在审

专利信息
申请号: 201810205935.1 申请日: 2018-03-13
公开(公告)号: CN108427753A 公开(公告)日: 2018-08-21
发明(设计)人: 史宇清;朱跃龙 申请(专利权)人: 河海大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京业腾知识产权代理事务所(特殊普通合伙) 32321 代理人: 郑婷
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 特征向量 目标对象 数据挖掘 类目标 回归模型 构建 样本 粗糙 筛选 数据处理流程 分类目标 目标数据 属性数据 数据迭代 数据集中 数据筛选 特性向量 综合特征 数据集 判定 挖掘 记录 优化 统计
【说明书】:

发明公开了一种新的数据挖掘方法,所述方法包括下列步骤:步骤1:根据目标数据集中的记录统计每个目标对象的特征向量以构成粗糙数据集,每个特征向量包括其所对应的目标对象的至少一个属性数据的值;步骤2:从粗糙数据集中筛选出所有已知的第一类目标对象所对应的特征向量,对筛选出的特性向量执行数据筛选,最后获得特征向量的样本;步骤3:对数据迭代处理;步骤4:基于所述样本构建回归模型,并随之使用所构建的回归模型确定所有已知的第二类目标对象中的每个是否潜在地属于第一类目标对象。本发明通过优化数据处理流程,显著提高对数据挖掘的处理速度;能够根据目标对象的综合特征来挖掘和分类目标对象,显著地提高判定操作的效率和准确性。

技术领域

本发明涉及一种新的数据挖掘方法,属于数据挖掘技术领域。

背景技术

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predictive)模式和描述(Descriptive)模式。在应用中往往根据模式的实际作用细分为以下几种:分类,估值,预测,相关性分析,序列,时间序列,描述和可视化等。数据挖掘涉及的学科领域和技术很多,有多种分类法。根据挖掘任务分,可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;根据挖掘对象分,有关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web;根据挖掘方法分,可粗分为:机器学习方法、统计方法、神经网络方法和数据库方法。机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法中,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法中,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP方法,另外还有面向属性的归纳方法等等。

目前,随着计算机和网络应用的日益广泛以及不同领域的业务种类的日益丰富,从与特定的对象相关的海量数据记录中有效地挖掘出不同类别的对象以便针对不同类别的对象实施不同的处理方案变的越来越重要。在现有的技术方案中,通常根据与目标对象相关联的一个或多个属性数据来对目标对象进行分类,即基于每个目标对象的某个或某些特定的属性数据的值对目标对象进行分类。然而,现有的技术方案存在如下问题:由于仅仅基于单一或数个属性数据对目标对象进行分类,故分类结果的精确度较低,并且由于需要对每个目标对象的属性数据进行相同的评估操作,故数据挖掘的效率较低。因此,需要设计一种新的方案给予解决。

发明内容

本发明正是针对现有技术存在的不足,提供一种新的数据挖掘方法,以解决现有技术存在的不足,满足水利领域和图书档案管理等领域的实际使用要求。

为解决上述问题,本发明所采取的技术方案如下:

一种新的数据挖掘方法,所述数据挖掘方法包括下列步骤:

步骤1:根据目标数据集中的记录统计每个目标对象的特征向量以构成粗糙数据集,每个所述特征向量包括其所对应的目标对象的至少一个属性数据的值;

步骤2:从所述粗糙数据集中筛选出所有已知的第一类目标对象所对应的特征向量,并对筛选出的特性向量执行数据筛选(确定特征向量中各个元素的权重值,设权重值为L,元素即特征向量的组成部分对数据挖掘的重要性参数为b,则L=b2,对特征向量进行修正),最后获得特征向量的样本;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810205935.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top