[发明专利]一种数据过滤挖掘方法在审

申请号：	201811532016.1	申请日：	2018-12-14
公开（公告）号：	CN109783619A	公开（公告）日：	2019-05-21
发明（设计）人：	柴满;吴少丹;刘坤杰	申请（专利权）人：	广东创我科技发展有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/35;G06N3/04;G06N3/08;G06F17/27
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	陈慧华
地址：	519000 广东省珠海市唐家湾***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明的技术方案包括一种数据过滤挖掘方法，用于实现：开发爬虫引擎爬取互联网海量数据，利用神经网络、机器学习算法构建核心价值模型实时自动过滤挖掘海量数据的高价值信息，包括对获取的数据进行大数据处理和自然语言处理，并建立包括文本分析模型、信息价值评价模型以及深度学习算法调优模型的数据分析模型体系，对目标数据进行处理并推送给用户。本发明的有益效果为：帮助用户精准识别潜在客户，对比人工处理，其处理过程，更简单、高效、识别率更高，通过机器学习算法自动精准识别高价值信息、潜在客户，减少人工误判漏判。
搜索关键词：	机器学习算法海量数据价值信息潜在客户数据过滤挖掘数据分析模型自然语言处理爬虫价值模型价值评价目标数据人工处理神经网络文本分析学习算法自动过滤数据处理误判识别率构建引擎互联网帮助开发
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种数据过滤挖掘方法，其特征在于，包括以下步骤：S100、使用Nutch分布式爬虫技术对目标网站进行数据采集；S200、对获取的数据进行大数据处理和自然语言处理，其中大数据处理包括数据抽取、校验、装载、存储以及计算，其中自然语言处理包括对数据进行排重、过滤、文本分类和摘要；S300、建立数据分析模型体系，所述数据分析模型体系包括文本分析模型、信息价值评价模型以及深度学习算法调优模型；S400、使用数据分析模型体系对处理后的数据进行分析，并根据用户反馈信息进行优化。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东创我科技发展有限公司，未经广东创我科技发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811532016.1/，转载请声明来源钻瓜专利网。

上一篇：基于注意力机制神经网络的药物实体关系抽取方法及系统
下一篇：模型确定方法、装置及设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种数据过滤挖掘方法在审

专利文献下载