[发明专利]一种互联网信息人工智能采集方法及其系统在审

申请号：	201811446277.1	申请日：	2018-11-29
公开（公告）号：	CN109710826A	公开（公告）日：	2019-05-03
发明（设计）人：	李凤生;郏建;邱梦凌;徐超;曾光;陈鹤	申请（专利权）人：	淮河水利委员会水文局（信息中心）
主分类号：	G06F16/951	分类号：	G06F16/951
代理公司：	北京联瑞联丰知识产权代理事务所(普通合伙) 11411	代理人：	郑自群
地址：	233000 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种互联网信息人工智能采集方法，包括以下步骤：建立网页采集模型、获取网络信息、数据分析、数据处理、结果输出以及网页采集模型再学习；采集方法通过网页采集模型对互联网数据进行检索分析，然后结合人机交互显示，通过深层神经网络的特征模式学习，利用深层神经网络对解析后的数据与特征数据做比对，更新检索和分析方式，每进行一次学习，网页采集模型都会提高数据的检索精准度，经过一定时间的学习能够达到人眼与人脑的配合水平；还提供了一种基于网页采集模型的互联网信息人工智能采集系统，包括网页采集模型模块、数据分析处理模块、数据存储模块、人机交互模块。
搜索关键词：	网页采集互联网信息人工智能检索神经网络采集数据分析处理模块学习获取网络信息人机交互模块数据存储模块互联网数据采集系统模型模块人机交互数据分析特征模式特征数据数据处理精准度比对人脑人眼解析分析输出更新配合
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于互联网信息人工智能采集方法，其特征在于，包括以下步骤：建立网页采集模型，建立基于爬虫或者搜索引擎检索获取网络数据的模型；获取网络信息，利用网页采集模型对大数据平台的文章、新闻、帖子进行数据采集；数据处理，对采集的数据进行数据处理，包括图片处理，文字翻译，去噪，去重；数据分析，将处理后的数据按结构分割成数据单元，将数据单元进行自由组合形成数据单元组，再将数据单元组进行语义匹配，输出匹配度指数，提取匹配度指数最高的数据单元组；网页采集模型再学习，将数据分析后的结果存储并循环交替给深度神经网络，作为网页采集模型的学习样本，并且阶段性的进行阶段审阅迭代修改模型；结果输出，将数据分析后的结果分模块展现在人机交互界面中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于淮河水利委员会水文局（信息中心），未经淮河水利委员会水文局（信息中心）许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811446277.1/，转载请声明来源钻瓜专利网。

上一篇：一种基于机器学习的网页有害信息识别方法
下一篇：图片属性管理方法、装置、图片服务端和业务处理端

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种互联网信息人工智能采集方法及其系统在审

专利文献下载