[发明专利]一种App数据采集方法及系统有效
申请号: | 202210942548.2 | 申请日: | 2022-08-08 |
公开(公告)号: | CN115292571B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 李鹏霄;王媛媛;隋明爽;艾政阳;段荣昌;王红兵;时磊;侯炜;任博雅;吕东;王海洋 | 申请(专利权)人: | 烟台中科网络技术研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/215;G06F8/61;G06F9/445;G06F17/18;G06V10/74;G06V10/764 |
代理公司: | 烟台上禾知识产权代理事务所(普通合伙) 37234 | 代理人: | 苏红红 |
地址: | 264003 山东省烟台*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 app 数据 采集 方法 系统 | ||
1.一种App数据采集方法,其特征在于,包括以下步骤:
S1.对群控平台中所有应用软件进行遍历采集,得到群控平台应用软件信息;
S2.对群控平台应用软件中的内容进行深度优先遍历采集,并将获取的内容进行整合;具体包括以下步骤:
第一步,选定某一APP中一个未被访问过的界面作为顶点V或者访问指定的起始顶点V,并将其标记为已访问过;
第二步,搜索与顶点V邻接的所有顶点,判断这些顶点是否被访问过,如果有未被访问过的顶点,则任选一个顶点W进行访问;再选取与顶点W邻接的未被访问的任一顶点并进行访问,一次重复进行;
当一个顶点的所有的邻接顶点都被访问过时,则依次回到最近被访问的顶点;若该顶点还有其他邻接顶点未被访问,则从这些未被访问的顶点中取出一个并重复上述第二步过程,直到与起始顶点V相通的所有顶点都被访问过为止;
第三步,若在当前界面中依然有顶点未被访问,则在选取其中一个顶点作为起始顶点并访问,之后重复第二步,反之则遍历结束;
第二步中,任选一个顶点W进行访问,即对于界面的内容进行采集,步骤如下:
对登录后的APP后进行模拟点击,进入界面,并判断点击元素是否为标题;
若点击元素为标题,则对当前界面内容进行获取,将该界面内容获取后,界面下滑;
若判定点击元素不是标题,则返回,进行界面下滑操作;
判断下滑是否到底,每次滑动结束截取当前群控平台界面图像,与上一张图像进行相似度比较,判断两界面是否为不同界面,若为两个不同的界面,则利用正则表达式对界面内容采集;
若下滑未到底,则重新进行模拟点击,进行重复操作;若下滑到底则点击其他组件,完成全部点击后关闭APP;
S3. 对整合后的采集内容进行判断清洗,获得最终应用软件通用内容。
2.根据权利要求1所述的一种App数据采集方法,其特征在于,群控平台应用软件信息包括对应APP的名称、包名、签名以及其他基础信息。
3.根据权利要求1所述的一种App数据采集方法,其特征在于,截取当前群控平台界面图像,与上一张图像进行相似度比较,判断两界面是否为不同界面,步骤如下:
计算得到两图像的相似度为:
其中,和/为相邻两张图像,/、/为两图像的均值分,/、/为两图像的标准差,、/为两图像的方差,/为两图像的协方差;/
式子中,、/、/为常数;coc为相关因子,为:
设定阈值,若/,那么判定为两个不同的界面;
若,那么判定为两个相同的界面。
4.根据权利要求3所述的一种App数据采集方法,其特征在于,所述S2中将获取的内容进行整合,包括以下步骤:
将采集到的内容按照类别属性不同进行分类,对采集内容进行清洗,清洗后根据类别存储到数据库中,得到内容采集集合:
其中,K表示类别属性的个数,表示第
矩阵中任意一个元素用/表示,代表第
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台中科网络技术研究所;国家计算机网络与信息安全管理中心,未经烟台中科网络技术研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210942548.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PU基高防水透湿膜制备方法
- 下一篇:一种锅炉用智能清洗装置及其使用方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置