[发明专利]一种基于深度学习的移动应用描述与权限保真性判定方法及装置有效
申请号: | 201810950490.X | 申请日: | 2018-08-20 |
公开(公告)号: | CN109284370B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 陈亮;冯缨岚;郑子彬 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06F21/56;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 移动 应用 描述 权限 真性 判定 方法 装置 | ||
本发明公开一种基于深度学习的移动应用描述与权限保真性判定方法及装置,该装置用于实现上述方法,所述方法包括描述文本的预处理是将移动应用A的描述分句后,转化为深度神经网络进行分类时所用的词向量矩阵;每个句子s∈S对应零个或多个权限,利用训练的深度神经网络模型输出每个句子的分类类别,每个类别代表一种权限,整合移动应用A所有描述语句的类别输出,假设Y为模型输出类别对应的移动应用A的预测权限集,判定移动应用描述与权限保真性。本发明通过获得更丰富语义信息,更简单的词法分析及语法分析,获得更为准确的保真判定结果。
技术领域
本发明涉及移动应用技术领域,特别涉及一种基于深度学习的移动应用描述与权限保真性判定方法及装置。
背景技术
移动互联网作为将传统互联网技术、移动通信技术和智能终端有机结合的产物,是传统互联网的延伸和演进方向,以其高便携性的优势发展迅速。移动应用是移动互联网发展的核心。2016年,移动应用数量同比大幅增长,最新数据显示,截止2017年3月,仅Google Play应用商店中可用的应用数量已经超过280万。诚然,移动互联网融合了移动通信随时随地通信的优势和互联网的开放性和丰富业务能力的特点,但在发展过程中,也逐渐削弱传统通信网络安全性较为容易管理的特点。另外,移动应用的广泛传播也使移动终端所承载的个人信息愈加丰富,这给移动终端用户带来新的威胁和风险,使移动应用安全问题成为焦点。
移动应用由许多独立开发者开发,用户难以确定这些应用程序的可信赖性。在Android系统中,任何移动应用程序如果想要访问系统资源或者其它应用程序的资源和数据,必须在Manifest.xml文件中显式的进行声明,且用户授权后才可以访问敏感信息(例如联系人列表,短信,GPS等)。开发者往往声明尽可能多的权限来满足移动应用丰富的功能,然而同时它也给恶意应用提供了可乘之机。比如Timothy Vidas在2011年发表的文献[1]中指出,很多软件都存在过度申请权限的问题,而大部分用户即使仔细查看权限列表仍然不了解这些权限意味着什么,就直接点击同意授予权限。因此,向用户直观解释Android应用需要声明权限的意义存在一定的难度,更不用说太多恶意应用会额外声明过多的权限等等。
在Android应用商店中,应用的功能描述是开发人员向用户传达应用功能的唯一手段。Android应用的描述权限保真性是指应用的功能描述能真实地反映应用所请求的权限。不满足描述权限保真性的Android应用很可能是恶意软件。基于描述与权限保真性来进行恶意应用检测是近年来常用的检测方法之一。
现有研究权限与描述相关性的工作主要有两个分支:基于关键词的方法和基于语义的方法。基于关键词进行保真性判断的方法简单、时间复杂度低。然而,尽管Watanabe等人[2]设计的ACODE框架结合信息检索中相关权重概念提取到更有效的关键词,但是仍避免不了基于关键词方法本身的限制:易混淆和缺乏语义推理。基于语义的方法中,Pandita等人[3]提出WHYPER框架,同时抽取权限解释说明和应用描述中有关系统资源与此资源上的操作,建立描述与权限的对应关系,但其弊端在于有限的语义模式、需从权限相关API调用图推导和缺乏自动化。Zhengyang Qu等人[4]提出AutoCog框架,自动的将描述语义与权限语义相关联,描述的一些功能可以映射到相应的权限形成DP模式对。诸姣[5]使用TF-IDF和LSI等自然语言处理技术得到每种类别的Android应用与各系统权限之间的关联关系模型。上述研究有一个共同点,即均使用自然语言处理技术分析自然语言的语义,建立Android应用的功能描述语义与系统权限语义之间的关联关系模型。不可避免会遇到自然语言处理研究本身的难点,如词义的消歧,句法的模糊性等问题。另外,这类模型由于是无监督学习,会出现实际中并不存在的但相关度却很高的关联关系,并且训练模型耗时较长。特别的,现有技术全部都只考虑描述与权限的一对一关系,不能判定整体的保真性。
发明内容
本发明的主要目的是提出一种基于深度学习的移动应用描述与权限保真性判定方法,旨在克服以上问题。
为实现上述目的,本发明提出的一种基于深度学习的移动应用描述与权限保真性判定方法,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810950490.X/2.html,转载请声明来源钻瓜专利网。