[发明专利]一种基于扩散传播模型的关联实体情感判断方法有效
申请号: | 201811283258.1 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109471928B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 吴振豪;陈钟;李青山;杨可静;兰云飞;高健博;王晓青 | 申请(专利权)人: | 北京国信云服科技有限公司;北京大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 刘晓岚 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 扩散 传播 模型 关联 实体 情感 判断 方法 | ||
1.一种基于扩散传播模型的关联实体情感判断方法,其特征在于:包括以下步骤:
步骤1、根据现有的语料信息,判断文本中实体之间的联系,建立实体之间的关系图网络;
步骤2、构建情感分析模块,并使用情感分析模块判断文本中所有实体的实际情感,得到文本中出现的实体的情感;
步骤3、采用扩散传播算法,确定文本中实体的情感扩散模式;
所述情感扩散模式包括两种,分别基于两个关系模型;第一种情感扩散模式用于负面情感的传播,如下公式所示:
其中,f(x)为文本中待评测实体的情感影响力结果,S为影响力常数,x表示被传播实体与文本中的实体的距离;所述文本中实体的情感影响力结果f(x)不能是文本中的实体,文本中实体的情感影响力结果为S;
第二种情感扩散模式用于正面情感传播,其以PageRank模型的结果为基础,按照比例进行情感扩散,如下公式所示:
其中,k表示待评测的实体,h表示所有实体集合中除待评测的实体外其余实体,E表示所有实体集合,p(k)和p(h)均表示实体的PageRank分值;同样,上述公式不能用来表示文本中的实体,文本中实体的情感影响力结果为S;
所述实体的PageRank分值采用PageRank算法进行计算,如下公式所示:
其中,p(kt)表示实体当前迭代轮次的PageRank分值,p(kj)表示链入实体kt的实体kj的PageRank分值,M(kt)表示链入kt的实体集合,L(kj)表示链出kt实体的数量,N为文本中所有实体的数量,d为阻尼系数,是一个常数;
当前后两个迭代轮次中实体的PageRank分值全部都相同的时候,停止PageRank分值计算,得到最终的PageRank分值;
步骤4、根据关联实体之间的关系,结合情感扩散模式,计算出实体集合中没有出现在文本中的其他实体的情感分值;然后根据预设的用于情感判断的阈值,来确定其他实体的情感;
步骤5、结合关联实体的关系网络和情感扩散模型,得出文本对整个行业的情感影响。
2.根据权利要求1所述的一种基于扩散传播模型的关联实体情感判断方法,其特征在于:步骤2所述情感分析模块采用训练好的SVM模型,用于分析情感极性。
3.根据权利要求1所述的一种基于扩散传播模型的关联实体情感判断方法,其特征在于:所述步骤5的具体方法为:
对行业情感影响的判断则基于行业中所有受影响实体的情况,对受影响情况进行以PageRank值为基础的加权变化,来得到最终的行业影响情况,如下公式所示:
其中,k是受本次事件影响的实体,M是受本次事件影响的实体集合,p(k)表示实体k的PageRank值,f(k)表示实体k受情感传播影响的分值,NUM表示本行业中的总实体数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国信云服科技有限公司;北京大学,未经北京国信云服科技有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811283258.1/1.html,转载请声明来源钻瓜专利网。