[发明专利]基于属性的移动应用软件性能预测方法在审

专利信息
申请号: 201610104757.4 申请日: 2016-02-25
公开(公告)号: CN105787662A 公开(公告)日: 2016-07-20
发明(设计)人: 於志文;弋飞;郭斌;王柱 申请(专利权)人: 西北工业大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06K9/62;G06F17/30
代理公司: 西北工业大学专利中心 61204 代理人: 王鲜凯
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于属性的移动应用软件性能预测方法,用于解决现有移动应用软件性能预测方法实用性差的技术问题。技术方案是使用网络爬虫程序采集商用软件应用属性信息,基于采集到的软件应用属性信息提取不同的属性标签,对每个应用构建基于词频‑逆文档频率方法的内在特征向量,处理已有的用户评论信息,提取评论中负面评论的内容并排序选择出现次数较高的词语作为负面评论关键词,根据负面评论与应用属性的关系,构建负面关键词与应用属性标签的关系矩阵,利用关键词与应用特征向量的关系矩阵推导出利用关键词表示的应用外部特性,结合应用的内在特性和外部特性,使用决策树分类器,对应用的性能好坏进行分类学习并预测。实用性强。
搜索关键词: 基于 属性 移动 应用软件 性能 预测 方法
【主权项】:
一种基于属性的移动应用软件性能预测方法,其特征在于包括以下步骤:步骤一、使用网络爬虫程序采集目标应用商店内软件应用属性信息,其中包括软件分类信息和软件自身调用系统权限信息,并采集已有的用户评论信息;步骤二、基于采集到的应用属性信息,提取不同的属性标签;步骤三、针对不同的应用,根据其包含的属性标签,利用词频‑逆文档频率方法构建内在特征向量;内在特征向量由公式(1)给出,IFj=<Ttag1,j,Ttag2,j,......,Ttagn,j>   (1)其中,Ttagi,j表示第j个应用中,第i个属性标签的词频‑逆文档频率的数值大小,Ttagi,j由公式(2)给出,Ttagi,j=tfi,j×idfi   (2)其中,tfi,j是指第i属性标签出现的频率,idfi表示的是第i个属性标签的逆文档频率,idfi由公式(3)给出,<mrow><msub><mi>idf</mi><mi>i</mi></msub><mo>=</mo><msub><mi>log</mi><mn>2</mn></msub><mfrac><mrow><mo>|</mo><mi>D</mi><mo>|</mo></mrow><mrow><mo>|</mo><mo>{</mo><mi>j</mi><mo>:</mo><msub><mi>t</mi><mi>i</mi></msub><mo>&Element;</mo><msub><mi>IF</mi><mi>j</mi></msub><mo>}</mo><mo>|</mo></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>其中,|D|表示所有的应用数量,|{j:ti∈IFj}|表示包含有第i个属性标签的应用数量;步骤四、通过使用中文分词工具,将用户的评论语句划分为互相独立的词语,并收集差评中各个词语出现的频数,按照词语出现次数进行排序,提取评论中负面评论的内容并排序选择出现次数较高的词语作为负面评论关键词;公式(4)给出了每个关键词负面影响力大小的度量,<mrow><msub><mi>NF</mi><mi>i</mi></msub><mo>=</mo><mfrac><mrow><msub><mi>freq</mi><mi>i</mi></msub></mrow><mrow><munderover><mrow><mi>M</mi><mi>a</mi><mi>x</mi></mrow><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mrow><mo>(</mo><msub><mi>freq</mi><mi>k</mi></msub><mo>)</mo></mrow></mrow></mfrac><mo>&times;</mo><mi>exp</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>i</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>其中,freqi表示排序为第i个关键词出现的总频数,表示的是前m个关键词中出现频数的最大值,同时假设词语的负面影响力呈指数衰减,进而加入了指数衰减因子exp(1‑i);步骤五、根据负面评论与应用属性的关系,构建负面关键词与应用属性标签的关系矩阵,利用关键词与应用特征向量的关系矩阵推导出利用关键词表示的应用外部特征向量;所述关系矩阵由m行关键词乘以n列属性信息组成;针对每条信息和其对应的应用,如果负面评论中包含第i个关键词,并且应用属性具有第j个属性,就对关系矩阵中第<i,j>个元素加一,直到遍历完所有评论信息;在关系矩阵构建完成后,应用的外部特征向量由公式(5)给出,EFi=<NF1×p(word1),......,NFm×p(wordm)>   (5)其中,NFj表示第j个负面关键词的影响力大小,其通过公式(4)计算得到;p(wordj)表示为针对该应用第j关键词可能出现的概率,p(wordj)值的大小通过公式(6)计算得到,<mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>word</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>tag</mi><mi>k</mi></msub><mo>&times;</mo><mi>p</mi><mrow><mo>(</mo><msub><mi>word</mi><mi>j</mi></msub><mo>,</mo><msub><mi>tag</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>其中,tagk是该应用第k个属性标签的词频‑逆文档频率值大小,p(wordj,tagk)表示第j个关键词对于第k个属性标签出现的条件概率,通过构建的关系矩阵计算获取;步骤六、结合应用的内在特征向量和外部特征向量,使用决策树分类器,对应用的性能好坏进行分类学习并预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610104757.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top