[发明专利]基于多层属性网络的App受欢迎度演化结果的预测方法在审

专利信息
申请号: 202111329169.8 申请日: 2021-11-10
公开(公告)号: CN114037284A 公开(公告)日: 2022-02-11
发明(设计)人: 陈世展;赵富超 申请(专利权)人: 天津大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06F8/71;G06F8/75
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 程毓英
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 多层 属性 网络 app 受欢迎 演化 结果 预测 方法
【权利要求书】:

1.一种基于多层属性网络的App受欢迎度演化结果的预测方法,包括如下的步骤:

阶段一数据爬取:通过开源软件版本控制系统应用程序编程接口GithubApi爬取演化历史数据,通过安卓移动软件应用市场GooglePlay的用户Token爬取用户评论;

阶段二数据预处理:对于Github中的源代码历史数据,综合考虑其在GooglePlay中的用户评论,抽取其中用户评论等数据足够的对应版本,并对爬取到的自然语言进行数据清洗;

阶段三构建App多层属性网络:根据源代码数据,生成应用程序中每个函数的控制流图,从发放调用节点提取调用信息和被调用信息,最后生成Code层的函数调用图;根据源代码数据,获取相邻两个版本的文档相似度,LDA提取每个文档的主题,获取到该版本代码的主题集合,最后与该版本的元数据构成App层网络;根据GooglePlay中的用户评论等数据,使用LDA提取出用户评论的标签,以及该评论对应的情感倾向,最后映射到WordNet网络中,生成Tag层网络;

阶段四构建用户欢迎度预测模型:根据上述的App多层属性网络,使用DeltaCon算法计算Code层网络的相似度,得到每个版本最新版本的对比结果;将每个版本的Tag层包含的情感倾向数据作为用户的欢迎度,最后通过预测方法计算出最新版本的用户欢迎度的预测结果。

2.根据权利要求1所述的App受欢迎度演化结果的预测方法,其特征在于,阶段三构建App多层属性网络的具体步骤如下:

(1)构建Code层:在生成控制流图CFG的基础上生成函数调用图,每个函数的CFG中的每一个结点,都对应程序中的每一条语句,每一个结点对象具有属性,包括是否是分支判断结点,是否是被调用结点,是否是出口结点;每一个结点会记录其所属函数是哪一个;遍历CFG中的结点可得知哪个结点存在调用与被调用关系,即找到函数调用结点,提取出调用函数和被调用函数的信息,并将被调用函数结点和调用函数结点存储于邻接链表,生成函数调用图;

(2)构建App层:对于APP层,其中的版本号、发布时间等元数据信息可以在数据获取时从网络中抓取出来,每个版本的软件特征则通过在github中增量更新的代码中提取出来;比较该版本与上一个版本的源代码,使用Levenshtein距离来判断两个版本的源代码文档是否相似,如果两个文档相似度超过0.98,认为是重复文档,并且把它们删除;对剩下的没有重复的文档进行主题提取来获得该版本的软件特征,并清洗掉文档中包含的许多与编程语言语法相关的字符和关键字;然后使用LDA从每个文档的实体标识符和代码注释提取出源代码的关键词,这些代码关键词的集合就构成了每个版本的软件特征;

(3)构建Tag层:使用python的gensim包来实现LDA模型,对每个评论都提取出主题词,而这些所有的评论提取出的主题词经过去重之后则构成标签集合;对于app的每个版本所得到的标签集合,通过wordnet中的同义词集将每个标签还原为元单词,这些元单词在wordnet中都能找到对应的映射节点;通过标签和wordnet的节点匹配,得到app的每个版本所对应的标签网络。

3.根据权利要求1所述的App受欢迎度演化结果的预测方法,阶段四构建用户欢迎度预测模型具体步骤如下:

对于app的两个版本版本,计算这两个版本的函数调用图的类似度,使用DeltaCon算法计算图形的类似度;该算法主要通过比较两个图中相同节点的连接性来计算两个图之间的相似性利用app多层属性网络中的code层,首先使用置信度传播算法来计算code层中成对节点的影响度,生成这两个相邻版本的code层影响度矩阵,然后,计算这两个矩阵的根欧距离,确定这两个图中相同节点影响分数的差,最后将其整合到这两个版本的code层的类似分数;

对于app的所有版本,都要计算其与最新版本的相似度分数,在app的多层属性网络中,其中的tag层包含了从应用市场的用户评论的提取出的关键词,这些标签也都被标注了各自的情感倾向,统计其中正向标签的占比,以此作为该app版本的受欢迎度;计算每个版本与最新版本的相似比与欢迎度的乘积,归一化后得到对于最新版本App的用户欢迎度的预测值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111329169.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top