[发明专利]一种针对体现用户意图的APP软件用户评论挖掘方法有效
申请号: | 201811531666.4 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109753651B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 姜瑛;胡甜媛;丁家满;李凌宇;汪海涛 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06F16/335 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种针对体现用户意图的APP软件用户评论挖掘方法,属于APP软件用户意图分析领域。本发明首先定义评价对象和评价观点的抽取规则,在抽取用户评论的评价对象和评价观点的基础上初始化评论种子,应用评论种子挖掘与之相同或相似的体现相同用户意图类别的用户评论;然后通过能愿动词、软件简介和情感分析挖掘出与评论种子匹配失败的用户评论中的体现用户意图的用户评论,并构建候选评论模式库;最后,针对每次循环挖掘过程中构建的候选评论模式库抽取具有代表性的新评论种子,用于下一次的循环挖掘,实现体现用户意图的用户评论的循环挖掘,直到体现用户意图的用户评论的挖掘效果收敛。 | ||
搜索关键词: | 一种 针对 体现 用户 意图 app 软件 评论 挖掘 方法 | ||
【主权项】:
1.一种针对体现用户意图的APP软件用户评论挖掘方法,其特征在于:所述方法的具体步骤如下:Step1、初始化数据:评论种子库中有s个评论种子seed,评论库中有c条分词后的用户评论comment,time=1,m=1;其中,time表示循环次数,m表示参与循环挖掘的第m条用户评论,seed=<seed1,…,seedi,…,seeds>,1≤i≤s;seedi=<seed_wordi1+…+seed_wordij+…+seed_wordip,seed_speechi1+…+seed_speechij+…+seed_speechip,weighti1+…+weightij+…+weightip,seed_disi,seed_intention_typei>,1≤j≤p,seed_wordij代表评论种子seedi中的第j个词,seed_speechij代表评论种子seedi中第j个词的词性,weightij代表评论种子seedi中的第j个词或其词性对应的权重,使用公式(1)计算weightij,p代表评论种子seedi中划分的词/词性的数量,seed_disi为评论种子seedi的距离,其值为评价对象和评价观点之间可扩展的最大距离和p之和,seed_intention_typei表示评论种子seedi体现的用户意图类别,用户意图被分为如下3类:软件满足的需求,软件存在的问题,软件未达到的期望;式(1)中,numObjectOpinion代表该评论种子的评价对象和评价观点的总个数,评价对象就是观点持有者表达情感的目标实体,通常由一个或多个单词组成,评价观点指的是能够表达用户自身观点的带有情感倾向的词语,是判定用户对评价对象情感的根本依据;Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:如果是,则取出一条未与评论种子匹配成功的用户评论commentm,抽取commentm的评论模式modem,接着执行Step3;否则,执行Step7;其中,评论模式modem=<mode_wordm1+…+mode_wordmn+…+mode_wordmq,mode_speechm1+…+mode_speechmn+…+mode_speechmq,mode_weightm1+…+mode_weightmn+…+mode_weightmq,mode_intention_typem>,1≤n≤q;mode_wordmn代表用户评论commentm中的第n个词,mode_speechmn代表用户评论commentm中第n个词的词性,mode_weightmn代表用户评论commentm中第n个词或其词性对应的权重,使用公式(1)计算mode_weightmn,q代表用户评论commentm中划分的词/词性的数量,mode_intention_typem代表用户评论commentm体现的用户意图类别,此时未对评论commentm进行用户意图类别判断,其值为unknown;Step3、应用评论种子判断commentm是否体现用户意图:判断用户评论commentm是否与评论种子seedg匹配:如果是,mode_intention_typem=seed_intention_typei,则执行Step6;否则,执行Step4;其中,1≤g≤s;Step4、应用能愿动词判断commentm是否体现用户意图:Step4.1、判断用户评论commentm是否包含能愿动词:如果是,则执行Step4.2;否则,执行Step5;Step4.2、mode_intention_typem=软件未达到的期望,执行Step4.3;Step4.3、modem进入候选评论模式库,执行Step6;Step5、应用软件简介和情感分析判断commentm是否体现用户意图:Step5.1、提取commentm对应的APP软件appNamem的APP软件简介中的名词和动词系列的相关词作为软件特征词,构建软件特征词集合F={f1,…,fx,…,fy}(1≤x≤y),执行Step5.2;Step5.2、判断commentm是否包含特征词fx:如果包含,则执行Step5.3;否则,执行Step5.6;Step5.3、抽取commentm的评价观点opinionm,计算opinionm的情感值sentiment_valuem,执行Step5.4;Step5.4、判断sentiment_valuem是否大于或等于0:如果是,则mode_intention_typem=软件满足的需求,commentm体现用户意图,执行Step5.5;否则,则mode_intention_typem=软件存在的问题,commentm体现用户意图,执行Step5.5;Step5.5、modem进入候选评论模式库,执行Step6;Step5.6、mode_intention_typem=null,commentm不体现用户意图,执行Step6;Step6、给出commentm判断结果:<commentm,mode_intention_typem>,m++,执行Step2;Step7、应用候选评论模式抽取新评论种子,执行Step8;Step8、判断体现用户意图的用户评论挖掘效果是否收敛:针对第time次循环,计算新评论种子seedi'中的评价对象和评价观点的词及词性组合与已有评论种子seedi中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_simi'i,统计组合文本相似度大于等于0.1的新评论种子数numNewSeedtime',当numNewSeedtime'与该次循环产生新评论种子总数numNewSeedtime相同时,体现用户意图的用户评论挖掘效果收敛,体现用户意图的用户评论挖掘结束;否则,体现用户意图的用户评论挖掘效果未收敛,进行下一次循环挖掘,time++,m=1,执行Step2;其中,i'指代新评论种子的标号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811531666.4/,转载请声明来源钻瓜专利网。