[发明专利]一种基于评论数据的移动应用安全性评估方法有效
申请号: | 201910484227.0 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110334180B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 陶传奇;郭虹静;黄志球 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/35;G06F40/284;G06F40/30;G06F21/50 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 贺翔 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 评论 数据 移动 应用 安全性 评估 方法 | ||
1.一种基于评论数据的移动应用安全性评估方法,其特征在于,包括步骤如下:
1)安全性评论数据获取:收集移动应用程序的评论数据,对评论数据进行预处理和关键词提取,筛选关键词构建安全性关键词库;根据安全性关键词库,构建安全性相关评论数据集;
2)评论文本向量生成:对每一条安全性相关的评论文本,生成评论文本的语义向量及文本—主题向量,将所述评论文本的语义向量及文本—主题向量进行拼接、融合生成新的向量,新的向量作为评论文本向量;
3)评论文档向量生成:将评论文本向量作为输入,使用双向RNN模型得到当前应用程序下的评论文档向量;
4)评估结果生成:获取应用程序的安全性风险值;将每一个应用程序表示为评论文档向量,安全性风险值的二元组,将二元组作为输入,使用机器学习的回归模型构建安全性评估模型,利用安全性评估模型为待检测的应用程序生成安全性风险值;
5)评估结果说明:对步骤2)中得到的评论文本向量进行聚类,并抽取出每一簇中的关键词和关键短语;根据步骤4)中得到的安全性风险值以及抽取出的关键词和关键短语,为用户提供自然语言描述的安全性评估结果的说明。
2.根据权利要求1所述的基于评论数据的移动应用安全性评估方法,其特征在于,所述步骤1)具体包括:
11)收集移动应用程序的评论数据,利用自然语言处理技术对评论数据进行预处理和关键词提取,筛选关键词构造安全性关键词库;
12)根据安全性关键词库,利用余弦函数筛选安全性相关评论,构建安全性相关评论数据集。
3.根据权利要求1所述的基于评论数据的移动应用安全性评估方法,其特征在于,所述步骤2)具体包括:
21)利用TF-IDF算法计算评论中词语权重,采用词语权重和Word2Vec模型生成的词向量加权平均得到评论文本的语义向量;
22)利用LDA模型为评论文本生成文本—主题向量。
4.根据权利要求1所述的基于评论数据的移动应用安全性评估方法,其特征在于,所述步骤5)具体包括:
51)利用K-means++算法对步骤2)中得到的评论文本向量进行聚类,并使用TextRank算法提取出每一簇中的关键词和关键短语;
52)根据步骤4)中得到的安全性风险值以及抽取出的关键词和关键短语,以雷达图和列表的形式,为用户提供自然语言描述的安全性评估结果的说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910484227.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置