[发明专利]一种基于WEB技术的数据检索和采集系统在审

专利信息
申请号: 202110724741.4 申请日: 2021-06-29
公开(公告)号: CN113434791A 公开(公告)日: 2021-09-24
发明(设计)人: 刘儒林;刘龙峰 申请(专利权)人: 重庆北踏云人工智能科技有限公司;重庆广播电视大学重庆工商职业学院
主分类号: G06F16/955 分类号: G06F16/955;G06F16/958;G06Q30/02
代理公司: 重庆上义众和专利代理事务所(普通合伙) 50225 代理人: 谭勇
地址: 400715 重庆市北碚区安礼*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 web 技术 数据 检索 采集 系统
【权利要求书】:

1.一种基于WEB技术的数据检索和采集系统,其特征在于,包括数据检索模块、采集模块、服务器和储存模块;所述数据检索模块包括搜索单元、广告验证单元和显示单元,所述搜索单元用于根据关键字进行搜索内容,并将检索到内容的网络链接发送到广告验证单元进行广告验证;所述广告验证单元用于对搜索单元检索到的内容进行广告验证,所述显示单元用于显示广告验证单元发送的网络链接内容;所述采集模块包括信息采集单元和自动获取单元;

搜索单元根据关键字进行内容搜索的方法包括:设置语音识别节点,用户在搜索栏中输入检索关键字,输入完关键字后,通过语音识别节点叙述对关键字的进一步描述,识别用户叙述的内容,建立检索模型,将关键字和用户叙述的内容标记为输入数据,将输入数据输入至检索模型获取输出结果并标记为检索式,根据检索式进行内容检索,设置增强学习单元,通过增强学习单元对使用检索模型的检索式进行检索的内容进行评价,并对检索模型进行再学习;获取根据检索式进行检索的记录数据,根据检索的记录数据设置评分表,当评分合格时,不进行操作,当评分不合格时,获取对应的记录数据,对检索式进行修改,将修改后的检索式和对应的输入数据整合为自学习数据,将自学习数据输入到检索模型中进行再学习。

2.根据权利要求1所述的一种基于WEB技术的数据检索和采集系统,其特征在于,广告验证单元对搜索单元检索到的内容进行广告验证的方法包括:接收搜索单元发送的网络链接,隔开广告验证单元与任意模块的连接,对接收到的网络链接进行逐一打开,并对打开网络链接进行内容分析,判断对应的网络链接是否是广告内容,当判断网络链接是广告内容时,将对应的网络链接从收搜索单元发送的网络链接中删除;当判断网络链接不是广告内容时,不进行操作;当全部分析完成后,将剩余的网络链接发送到显示单元,对广告验证单元进行病毒查杀和格式化。

3.根据权利要求1所述的一种基于WEB技术的数据检索和采集系统,其特征在于,所述信息采集单元用于当用户检索的内容无法使用时,对无法使用的内容进行采集,具体方法包括:获取无法使用的内容链接和用户需求,打开无法使用的内容链接,对链接中的内容进行分析,将链接中的内容标记为标准内容,获得内容标题、关键字和作者,将内容标题、关键字和作者标记为限定检索词,通过数据检索模块对限定检索词进行深度检索,并将检索结果与标准内容进行匹配,当匹配成功时,打开对应的链接,验证用户需求,当不符合用户需求时,检索失败,当符合用户需求时,将对应的链接发送给用户;当匹配失败时,检索失败;当检索失败时,直接扫描标准内容,提取标准内容中的文字,将提取的文字按照标准内容进行排版。

4.根据权利要求3所述的一种基于WEB技术的数据检索和采集系统,其特征在于,将标准内容中图片进行截图,将截图输入到提取的文字中,对输入完截图的文字进行再次排版,将排版后的文字标记为需求文档,将需求文档发送给用户。

5.根据权利要求1所述的一种基于WEB技术的数据检索和采集系统,其特征在于,所述自动获取单元用于根据用户需求自动采集数据,具体方法包括:获取用户需要采集数据的标签,根据需要采集数据的标签在互联网中进行检索,将检索结果与用户需求进行匹配,将匹配成功的内容进行汇总,设置日期限制,根据日期限制对汇总的内容进行筛选,将筛选后的内容标记为待选内容,用户对待选内容进行挑选,获取挑选内容的发布者,将对应发布者发布的待选内容标记为订阅内容,每天定时向用户推送订阅内容。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆北踏云人工智能科技有限公司;重庆广播电视大学重庆工商职业学院,未经重庆北踏云人工智能科技有限公司;重庆广播电视大学重庆工商职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110724741.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top