[发明专利]仿冒应用检测方法以及系统有效
申请号: | 201710578860.7 | 申请日: | 2017-07-14 |
公开(公告)号: | CN107273546B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 李祺;张少东;孙博文;郭燕慧 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王术兰 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 仿冒 应用 检测 方法 以及 系统 | ||
1.一种仿冒应用检测方法,其特征在于,包括:
获取应用的文本信息;
通过分词器对所述文本信息进行分词,获得词库;
将所述词库中的词与所述文本信息进行匹配,获得向量;
通过分类器对所述向量进行聚类,获得相似应用的集合;
通过自动化测试工具将原版应用与所述集合中的相似应用进行动态运行,获得应用界面的控件信息;
根据所述控件信息获得综合特征向量;
将原版应用的综合特征向量与相似应用的综合特征向量进行相似度计算,获得仿冒应用检测结果;
所述通过自动化测试工具将原版应用与所述集合中的相似应用进行动态运行,获得应用界面的控件信息,具体包括:
对自动化测试工具中的运行次数、控件遍历方式进行定制,获得测试规则;
将原版应用与所述集合中的相似应用送入自动化测试工具中,根据所述测试规则进行动态运行;
在动态运行过程中,安卓自动化测试工具通过ADB命令启动应用进入界面,获取应用的界面状态信息;
通过对所述界面状态信息进行控件提取、解析与收集,获得界面的控件列表;
根据所述控件列表获得应用界面的控件信息。
2.根据权利要求1所述的仿冒应用检测方法,其特征在于,所述通过分词器对所述文本信息进行分词,获得词库,具体包括:
通过分词器对所述文本信息进行分词,获得分词结果;
删除所述分词结果中的停用词,提取所述分词结果中的名词,获得词库。
3.根据权利要求1所述的仿冒应用检测方法,其特征在于,所述将所述词库中的词与所述文本信息进行匹配,获得向量,具体包括:
将所述词库中的词与所述文本信息中的软件描述文字进行匹配,获得向量;
所述向量的值为所述词库对应位置上的词在所述软件描述文字中出现的次数。
4.根据权利要求1所述的仿冒应用检测方法,其特征在于,所述通过分类器对所述向量进行聚类,获得相似应用的集合,具体包括:
将所有应用的所述向量送入硬聚类算法分类器中进行聚类,形成多个簇,所述簇为相似应用的集合。
5.根据权利要求1所述的仿冒应用检测方法,其特征在于,所述通过自动化测试工具将原版应用与所述集合中的相似应用进行动态运行之前,还包括:
根据开发者信息、用户评论信息、点击量、下载量中至少一种信息,确定所述相似应用的原版应用。
6.根据权利要求1所述的仿冒应用检测方法,其特征在于,所述测试规则包括:
先遍历按钮控件与提示框控件,再搜索其他控件。
7.根据权利要求1所述的仿冒应用检测方法,其特征在于,所述根据所述控件信息获得综合特征向量,具体包括:
对所述控件信息中的节点内容进行编码,获得一维序列;
将所述一维序列转化为一维向量,作为应用界面的结构特征向量;
通过符号对所述控件信息进行分词处理与匹配,获得应用界面的语义特征向量;
结合所述结构特征向量与所述语义特征向量,形成应用界面的综合特征向量。
8.根据权利要求1所述的仿冒应用检测方法,其特征在于,所述将原版应用的综合特征向量与相似应用的综合特征向量进行相似度计算,获得仿冒应用检测结果,具体包括:
将原版应用中所有应用界面的所述综合特征向量与相似应用中所有应用界面的所述综合特征向量进行向量距离计算,获得向量距离;
根据所述向量距离确定相似度;
如果所述相似度小于预设值的应用界面个数,大于预设个数,则确定为仿冒应用。
9.一种仿冒应用检测系统,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至8任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710578860.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:限制同一用户账号登录终端数量的方法
- 下一篇:一种报表安全管理方法及系统