[发明专利]文本情感的处理方法及装置有效
申请号: | 201611265791.6 | 申请日: | 2016-12-30 |
公开(公告)号: | CN108268439B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 韩旭红 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 处理 方法 装置 | ||
1.一种文本情感的处理方法,其特征在于,包括:
获取待分析文本中的多个情感词;
获取每个所述情感词的情感强度值,其中,所述情感词的情感强度值至少基于所述情感词所对应的评价对象而确定;
基于所述待分析文本中各个情感词的情感强度值,确定所述待分析文本的情感强度值;
其中,在获取预先生成的情感词集合之前,所述方法还包括:
获取多个样本文本的情感信息,其中,情感信息用于记录各个样本文本中情感词与评价对象的对应关系,一个所述情感词至少用于评价一个所述评价对象;
根据评价对象的属性,将属性相同的评价对象对应的情感词保存入同一词语块;
确定属于同一词语块的每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值;
基于每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值,获取每个词语块中每个情感词的情感强度值;
保存各个情感词与情感强度值的对应关系,生成所述情感词集合。
2.根据权利要求1所述的处理方法,其特征在于,确定属于同一词语块的每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值包括:
确定每个词语块中,每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值。
3.根据权利要求1所述的处理方法,其特征在于,确定属于同一词语块的每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值包括:
构建情感词的第一图模型和第二图模型,其中,每个第一图模型用于记录一个词语块中每个情感词与其它情感词之间的相似值,所述第一图模型中的一个节点用于记录一个情感词的第一信息,连接两个节点的边用于记录两个情感词之间的相似值;所述第二图模型用于记录一个样本文本与每个情感词的关联值,所述第二图模型中的一个节点用于记录一个情感词的第二信息,
其中,所述第一信息包括:对应的情感词的词向量、情感词在当前时间和前一时间的情感强度值;所述第二信息包括:对应的情感词所属的词语块,情感词对于当前文本的关联值、当前文本在当前时间和上一时间的情感强度值。
4.根据权利要求1所述的处理方法,其特征在于,基于每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值,获取每个词语块中每个情感词的情感强度值包括:
初始化情感词和样本文本的情感强度值;
计算情感词和样本文本的情感强度值;
利用情感词和样本文本的情感强度值进行迭代计算,得到每个情感词的情感强度值。
5.根据权利要求4所述的处理方法,其特征在于,初始化情感词和样本文本的情感强度值包括:
获取已标注的情感词和样本文本的情感强度值;
对所述已标注的情感词和样本文本利用标注数据进行赋值;
对没有标注的情感词和样本文本赋值为预定值。
6.根据权利要求4所述的处理方法,其特征在于,计算情感词的情感强度值包括:
获取情感词vi在其所在的第一图模型中与其具有连接关系的其它情感词;
计算每个其它情感词的情感强度值、和每个所述其他情感词与所述情感词vi的相似值的权重乘积;
计算包含所述情感词vi的第二图模型的文本情感强度值、和该第二图模型对应文本与所述情感词vi与该文本的关联值的乘积;
将所述权重乘积和所述关联值的乘积之和作为所述情感词vi的情感强度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611265791.6/1.html,转载请声明来源钻瓜专利网。