[发明专利]一种基于程序上下文的移动应用敏感行为描述生成方法在审
申请号: | 202210462035.1 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114861221A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 姚远;徐锋;袁佳莉 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F40/205;G06F40/216 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 程序 上下文 移动 应用 敏感 行为 描述 生成 方法 | ||
1.一种基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,利用移动应用的程序上下文信息和应用文档,通过提示学习微调GPT3自然语言生成模型,自动生成移动应用的敏感行为描述,方法包括以下步骤:
(1)移动应用上下文提取
(1.1)移动应用程序调用图构造:根据解包后的移动应用包,构造结合移动系统特点的程序调用图;
(1.2)程序代码上下文提取:根据PScount构造敏感权限调用方法子图,得到敏感调用接口调用图序列;
(1.3)图形界面上下文提取:根据程序调用图中方法和应用图形界面的映射关系,提取布局文件中的文字和资源名;
(2)应用隐私权政策文档中敏感行为相关句子提取和补充
从移动应用的隐私权政策文档中提取和补充应用敏感行为相关句子;包括根据关键词、结合机器阅读理解问答抽取敏感行为相关句子以及根据词频-逆文档频率相似度为部分移动应用补充敏感行为相关句子两个步骤;
(3)移动应用敏感行为描述生成
使用移动应用上下文提取和应用隐私权政策文档中敏感行为相关句子提取和补充所得的移动应用敏感行为信息作为训练输入数据,基于提示学习微调GPT-3模型;将训练所得的生成模型最终输出的生成结果作为结果报告。
2.根据权利要求1所述的基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,结合安卓移动应用特点构造程序调用图,提取程序代码上下文和图形界面上下文作为应用敏感行为信息;安卓程序是由组件构成,将组件间通信、生命周期事件、界面交互、多线程的调用关系纳入应用调用图构造;使用SOOT构造应用调用图,提取应用程序中所有类和所有方法,使用宽度优先搜索进行程序方法节点的扫描与拓展;如果扫描到的程序方法中的语句是关于生命周期事件、界面交互或多线程语句,则也执行加边操作;使用IC3工具分析安卓应用组件间通信过程,在获取组件通信的双方后,在调用图中进一步加入节点和有向调用边。
3.根据权利要求1所述的基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,程序代码上下文提取中,使用PScout提供的映射表在应用调用图中找到敏感权限调用方法,并用宽度优先搜索方法构造敏感权限调用方法子图;在敏感权限调用方法子图中,采用节点中方法签名里的方法名称作为程序代码上下文,根据驼峰命名法或下划线命名法分割方法名。
4.根据权利要求1所述的基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,图形界面上下文提取中,使用SOOT遍历应用程序中的方法体提取Activity绑定的布局文件id;根据敏感权限调用方法子图确定应用程序中使用了敏感权限的Activity,提取使用敏感权限的Activity与布局文件id的映射关系;解包移动应用包获取应用中布局文件名字和布局的映射关系,匹配出使用敏感权限的Activity与布局文件名称的绑定关系,提取资源中的文本属性和资源名作为图形界面上下文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210462035.1/1.html,转载请声明来源钻瓜专利网。