[发明专利]一种移动应用违规内容扫描方法、系统、设备及介质有效
申请号: | 202110884177.2 | 申请日: | 2021-08-03 |
公开(公告)号: | CN113569861B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 郝德禄;肖冠正;甘心;王伟;曾荣 | 申请(专利权)人: | 天翼爱音乐文化科技有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V10/74;G06V10/82;G06N3/04 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 应用 违规 内容 扫描 方法 系统 设备 介质 | ||
本发明公开了一种移动应用违规内容扫描方法、系统、设备及介质,方法包括:对移动应用首页页面进行截屏;通过卷积网络分割模型对首页截屏进行区域分割,确定可点击区域以及区域信息文件;根据区域信息文件对可点击区域进行遍历点击,通过像素点匹配法判断页面是否发生跳转,并结合深度优先搜索算法对应用内所有页面进行点击遍历并截屏,确定应用页面截屏;对应用页面截屏进行图像文字识别,检测应用页面截屏中是否存在敏感词语,确定移动应用违规文字扫描;对应用页面截屏进行图像内容检测,检测应用页面截屏中是否存在违规图像,确定移动应用违规图像扫描。本发明能够对应用内页面进行全覆盖扫描,可广泛应用于计算机应用技术领域。
技术领域
本发明涉及计算机应用技术领域,尤其是一种移动应用违规内容扫描方法、系统、设备及介质。
背景技术
目前,移动应用不良信息检测方法主要通过对移动应用中的静态内容进行反编译处理,并结合接口抓包技术对动态返回的文本及图像内容进行违规信息检测,然而,当移动应用使用了代码混淆、资源混淆以及接口加密后,这种方法便无法正常发挥作用。除此之外也有通过对应用页面截屏图像进行违规信息检测,这需要对应用页面进行遍历,而遍历的方法一般采用人工编写脚本控制点击应用页面坐标的方式来实现,但这些脚本只针对单一应用,且应用界面如果发生重大变化,也需要对脚本代码进行调整。此外,也有通过开发工具获取界面可点击UI组件信息,对可点击UI组件遍历点击来控制页面跳转以达到页面遍历的目的,但当移动应用为Hybrid应用或者原生应用内嵌WebView页面时,因无法获取到页面可点击UI组件信息,将导致方法失效。因此,这些方法都存在不同程度的局限性。
发明内容
有鉴于此,本发明实施例提供一种移动应用违规内容扫描方法、系统、设备及介质,以实现对任意应用页面内容进行覆盖扫描,提高对不良信息检测的准确率。
一方面,本发明提供了一种移动应用违规内容扫描方法,包括:
对移动应用首页页面进行截屏,确定首页截屏;
通过卷积网络分割模型对所述首页截屏进行区域分割,确定可点击区域以及区域信息文件;
根据所述区域信息文件对所述可点击区域进行遍历点击,通过像素点匹配法判断页面是否发生跳转,并结合深度优先搜索算法对应用内所有页面进行点击遍历并截屏,确定应用页面截屏;
对所述应用页面截屏进行图像文字识别,检测所述应用页面截屏中是否存在敏感词语,确定移动应用违规文字扫描;
对所述应用页面截屏进行图像内容检测,检测所述应用页面截屏中是否存在违规图像,确定移动应用违规图像扫描。
可选地,所述通过卷积网络分割模型对所述首页截屏进行区域分割,确定可点击区域以及区域信息文件,包括:
对所述卷积网络分割模型进行训练,确定预训练卷积网络分割模型;
将所述首页截屏输入至所述预训练卷积网络分割模型;
所述预训练卷积网络分割模型对所述首页截屏进行语义分割,分割得到文字区域、图像区域以及区域信息;其中,所述区域信息用于表征所述文字区域以及图像区域在截屏图像中的起始坐标以及区域宽高;
将所述文字区域以及所述图像区域确定为可点击区域,将所述区域信息以文件格式进行保存,确定区域信息文件。
可选地,所述根据所述区域信息文件对所述可点击区域进行遍历点击,通过像素点匹配法判断页面是否发生跳转,并结合深度优先搜索算法对应用内所有页面进行点击遍历并截屏,确定应用页面截屏,包括:
从所述区域信息文件中解析出所述可点击区域的起始坐标以及宽高信息,根据所述信息对所述可点击区域的中心点进行遍历点击,对点击后的应用页面进行截屏,确定第一应用截屏;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼爱音乐文化科技有限公司,未经天翼爱音乐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110884177.2/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法