[发明专利]一种应用上架状态监控方法、智能终端及存储介质有效
申请号: | 201911292530.7 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111046316B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 王高鹏;郭训平 | 申请(专利权)人: | 北京智游网安科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/951;G06F16/955 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文 |
地址: | 100000 北京市海淀区东北旺西路8*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用 上架 状态 监控 方法 智能 终端 存储 介质 | ||
本发明公开了一种应用上架状态监控方法、智能终端及存储介质,所述方法包括:预先设置一用于存储应用信息的数据表;获取所述数据表中的详情页链接、应用名、下载链接字段和应用渠道字段,并生成一个任务发送给爬虫程序;所述爬虫程序加载所有分发渠道并爬取解析规则,在消费任务时,根据所述分发渠道进行对应的解析得到第二应用名,并将所述第二应用名与所述应用名进行对比;若所述第二应用名与所述应用名一致时,则所述详情页链接可被访问且页面状态正常,并判断下载链接是否有效;通过爬虫请求所述下载链接,如果正常请求则所述下载链接有效,否则所述下载链接已失效。本发明实现了对应用上架状态的监控。
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种应用上架状态监控方法、智能终端及存储介质。
背景技术
通过程序请求应用的详情页地址,根据服务器是否应答以及服务器返回的请求状态码进行判断,一般来说如果应用下架了(指应用无法被下载或者详情无法被访问)则服务器不予应答或者状态码是404(客户端的链接地址找不到)。缺点是只通过判断详情页链接是否合法,不解析应用名称,对某些渠道不适合,例如应用下架但该渠道状态码依旧正常但页面出现失效通知,也会出现个别应用详情页无法访问,但下载链接依旧有效的情况。
因此,现有技术还有待于改进和发展。
发明内容
针对现有技术中的上述缺陷,本发明的主要目的在于提供一种应用上架状态监控方法、智能终端及存储介质,为实现上述目的,本发明提供一种应用上架状态监控方法,包括如下步骤:
预先设置一用于存储应用信息的数据表;
获取所述数据表中的详情页链接、应用名、下载链接字段和应用渠道字段,并生成一个任务发送给爬虫程序;
所述爬虫程序加载所有分发渠道并爬取解析规则,在消费任务时,根据所述分发渠道进行对应的解析得到第二应用名,并将所述第二应用名与所述应用名进行对比;
若所述第二应用名与所述应用名一致时,则所述详情页链接可被访问且页面状态正常,并判断下载链接是否有效;
通过爬虫请求所述下载链接,如果正常请求则所述下载链接有效,否则所述下载链接已失效。
可选地,所述的应用上架状态监控方法,其中,所述应用信息包括:详情页链接、应用名、更新时间、下载链接字段、以及对应的应用渠道字段。
可选地,所述的应用上架状态监控方法,其中,所述解析规则为所述爬虫程序根据应用详情的URL抓取到详情页的html文档后,按照一定规则解析html文档获取的信息,每个分发渠道均对应有单独的解析规则。
可选地,所述的应用上架状态监控方法,其中,所述根据所述分发渠道进行对应的解析得到第二应用名,具体包括:
所述爬虫程序根据所述消费任务获取对应的渠道字段,根据所述渠道字段在所述爬虫程序中找到对应的渠道解析规则;
根据所述渠道解析规则解析应用的详情页html文档,得到所述应用的所述第二应用名。
可选地,所述的应用上架状态监控方法,其中,所述通过爬虫请求所述下载链接,如果正常请求则所述下载链接有效,否则所述下载链接已失效,之后还包括:
判断所述应用在当前分发渠道的上架状态是否正常。
可选地,所述的应用上架状态监控方法,其中,所述应用下架包括:
详情页无法访问,无法获取到html文档,则解析的所述第二应用名为空;
详情页返回404页面,则解析的所述第二应用名为空;
详情页的页面上提示所述应用已下架;
解析出所述第二应用名,所述第二应用名与所述应用名不一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智游网安科技有限公司,未经北京智游网安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911292530.7/2.html,转载请声明来源钻瓜专利网。