[发明专利]一种数据挖掘方法及系统在审
申请号: | 202010454602.X | 申请日: | 2020-05-26 |
公开(公告)号: | CN111597232A | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 张媛媛;方静;赵军伟;付小伟;孙临珺;白宏斌 | 申请(专利权)人: | 华北科技学院 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06N3/04 |
代理公司: | 西安合创非凡知识产权代理事务所(普通合伙) 61248 | 代理人: | 马英 |
地址: | 100042 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 挖掘 方法 系统 | ||
本发明公开了一种数据挖掘方法及其系统,该方法包括如下步骤:S1、基于数据挖掘要求输出对应的关键词组;S2、生成每一个关键词组的关联词组,该关联词组由关键词组、关键词相反词组、关键字相似词组、关键字关联词组构成;S3、基于关键词组、关键词相反词组、关键字相似词组、关键字关联词组构建数据挖掘模型;S4、基于Hadoop运行数据挖掘模型实现目标数据的挖掘。本发明实现了目标数据的高精确度和高效率挖掘。
技术领域
本发明涉及数据挖掘领域,具体涉及一种数据挖掘方法及系统。
背景技术
目前,随着计算机和网络应用的日益广泛以及不同领域的业务种类的日益丰富,从与特定的对象相关的海量数据记录中有效地挖掘出不同类别的对象以便针对不同类别的对象实施不同的处理方案变的越来越重要。
在现有的技术方案中,通常根据与目标对象相关联的一个或多个属性数据来对目标对象进行分类,即基于每个目标对象的某个或某些特定的属性数据的值对目标对象进行分类。
然而,现有的技术方案存在如下问题:由于仅仅基于单一或数个属性数据对目标对象进行分类,故分类结果的精确度较低,并且由于需要对每个目标对象的属性数据进行相同的评估操作,故数据挖掘的效率较低。
发明内容
为解决上述问题,本发明提供了一种数据挖掘方法及系统,实现了目标数据的高精确度和高效率挖掘。
为实现上述目的,本发明采取的技术方案为:
一种数据挖掘方法,包括如下步骤:
S1、基于数据挖掘要求输出对应的关键词组;
S2、生成每一个关键词组的关联词组,该关联词组由关键词组、关键词相反词组、关键字相似词组、关键字关联词组构成;
S3、基于关键词组、关键词相反词组、关键字相似词组、关键字关联词组构建数据挖掘模型;
S4、基于Hadoop运行数据挖掘模型实现目标数据的挖掘。
进一步地,所述步骤S1中基于CCIPCA算法实现关键词组的获取。
进一步地,所述步骤S2中基于Inception V3深度神经网络模型实现关键词组、关键词相反词组、关键字相似词组、关键字关联词组。
进一步地,所述步骤S3分别根据关键词组、关键词相反词组、关键字相似词组、关键字关联词组构建关键词组挖掘模型、关键词相反词组挖掘模型、关键字相似词组挖掘模型和关键字关联词组挖掘模型。
进一步地,所述步骤S4基于Hadoop同时运行关键词组挖掘模型、关键词相反词组挖掘模型、关键字相似词组挖掘模型和关键字关联词组挖掘模型进行目标数据的挖掘。
本发明还提供了一种数据挖掘系统,包括:
关键词组生成模块,用于基于数据挖掘要求生成对应的关键词组;
关联词组生成模块,用于基于所述关键词组生成对应的关联词组,该关联词组由关键词组、关键词相反词组、关键字相似词组、关键字关联词组构成;
数据挖掘模型构建模块,用于基于关键词组、关键词相反词组、关键字相似词组、关键字关联词组构建数据挖掘模型;
数据挖掘模块,用于基于Hadoop运行数据挖掘模型实现目标数据的挖掘
进一步地,所述关联词组生成模块根据关键词组、关键词相反词组、关键字相似词组、关键字关联词组构建关键词组挖掘模型、关键词相反词组挖掘模型、关键字相似词组挖掘模型和关键字关联词组挖掘模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北科技学院,未经华北科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010454602.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置