[发明专利]一种应用检测方法、装置、设备及存储介质在审
申请号: | 202111328570.X | 申请日: | 2021-11-10 |
公开(公告)号: | CN114119365A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 卞珂珂;李玉惠;傅强;蔡琳;阿曼太;梁彧;马寒军;田野;王杰;杨满智;金红;陈晓光 | 申请(专利权)人: | 恒安嘉新(北京)科技股份公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T5/50;G06T7/11;G06N20/00;G06N3/04;G06K9/62;G06V10/774 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 马迪 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用 检测 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种应用检测方法、装置、设备及存储介质。该方法包括:获取待测应用的关键应用截图,并按照预设拼接结构对所述关键应用截图进行拼接,生成应用概览图;将所述应用概览图输入训练好的应用检测模型,并将所述应用检测模型输出的应用检测结果返回;其中,所述应用检测模型为基于块间特征聚合和浅层特征短接的Transformer模型。本发明实施例的技术方案,提高了应用检测的效率和准确性。
技术领域
本发明实施例涉及机器学习技术领域,尤其涉及一种应用检测方法、装置、设备及存储介质。
背景技术
应用检测的目的是有效检测出手机应用中是否存在特定信息,例如,检测应用中是否包含赌博内容。目前应用检测技术可以分为三类,一是基于传统计算机视觉进行的特定元素检测,二是基于深度学习的卷积神经网络(Convolutional Neural Networks,CNN)模型,进行的特定内容图片分类或特定元素检测,三是基于光学字符识别(OpticalCharacter Recognition,OCR)技术,对应用截图进行文字检测与识别,根据页面文字信息判断是否为包括特定内容的应用。
但是,现有的应用检测技术在对应用内容进行研判时,没有考虑到应用的整体性,使用的深度学习模型也比较单一,因此,应用检测的效率和准确性都有待提高。
发明内容
本发明实施例提供一种应用检测方法、装置、设备及存储介质,以实现提高应用检测的效率和准确性。
第一方面,本发明实施例提供了一种应用检测方法,包括:
获取待测应用的关键应用截图,并按照预设拼接结构对关键应用截图进行拼接,生成应用概览图;
将应用概览图输入训练好的应用检测模型,并将应用检测模型输出的应用检测结果返回;
其中,应用检测模型为基于块间特征聚合和浅层特征短接的Transformer模型。
可选的,获取待测应用的关键应用截图,并按照预设拼接结构对关键应用截图进行拼接,生成应用概览图,包括:
获取待测应用的应用截图序列,并获取应用截图序列中的各应用截图的图像灰度特征;
根据图像灰度特征,将应用截图序列聚类为应用加载图片簇和应用内容图片簇;
从应用加载图片簇的核心区域以及应用内容图片簇的核心区域中,分别选择预设数量的关键应用截图;
按照预设拼接结构对各关键应用截图进行拼接,生成应用概览图。
可选的,将应用概览图输入训练好的应用检测模型,并将应用检测模型输出的应用检测结果返回,包括:
将应用概览图输入训练好的应用检测模型,通过应用检测模型,使用四等分块的方式对应用概览图进行逐层分割,确定底层图像块;
将各底层图像块线性映射得到的词向量作为当前层输入元素,对每四个当前层输入元素映射注意力矩阵,计算当前层的各图像块的自注意力特征;
对当前层的每四个图像块的自注意力特征进行块间特征聚合处理,得到上一层各图像块的特征信息;
将上一层各图像块的特征信息作为当前层输入元素,返回执行对每四个当前层输入元素映射注意力矩阵,计算当前层的各图像块的自注意力特征的操作,直至得到完整的应用概览图的自注意力特征;
将下采样后的底层图像块的自注意力特征与应用概览图的自注意力特征进行合并,根据合并后的自注意力特征进行判决,得到应用检测结果并返回。
可选的,对每四个当前层输入元素映射注意力矩阵,计算当前层的各图像块的自注意力特征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒安嘉新(北京)科技股份公司,未经恒安嘉新(北京)科技股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111328570.X/2.html,转载请声明来源钻瓜专利网。