[发明专利]确定文本情感的方法及装置有效
申请号: | 201611219673.1 | 申请日: | 2016-12-26 |
公开(公告)号: | CN108241682B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 刘乙霖;陈晓敏;刘嘉;赵钰;王雪纯;栾睿 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 文本 情感 方法 装置 | ||
1.一种确定文本情感的方法,其特征在于,包括:
获取文本的关键词和所述文本包含的多个句子,并标注每个句子的情感类别以及情感级别;
对所述每个句子进行分词处理,提取所述每个句子的情感词;
确定所述情感词在所述每个句子中的情感权重值;
根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度;
根据所述隶属度确定所述文本的情感类别;
其中,根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度,包括:
根据所述情感权重值确定包含所述关键词的句子的情感类别;
根据包含所述关键词的句子的情感类别,确定所述关键词的情感级别,并通过如下公式确定所述关键词在包含所述关键词的句子中的隶属度:
其中,所述W1为所述隶属度,所述V1为所述关键词的情感级别的权重值,所述∑Vi为所述关键词在所述情感级别中的权重值之和,所述α为所述关键词权重。
2.根据权利要求1所述的方法,其特征在于,所述情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,所述情感级别用于表征所述句子表达情感的强烈程度。
3.根据权利要求1所述的方法,其特征在于,确定所述情感词在所述每个句子中的情感权重值,包括:
计算所述情感词在所述每个句子中的个数;
计算包含所述情感词的句子中的词语总数;
根据所述情感词在所述每个句子中的个数以及包含所述情感词的句子中的词语总数确定所述情感词在所述每个句子中的情感权重值。
4.根据权利要求1所述的方法,其特征在于,根据所述隶属度确定所述文本的情感类别包括:
在至少一种所述情感类别中,对所述关键词在至少一个所述情感级别中的隶属度进行求和运算,并得到求和结果;
选取所述求和结果最大的情感类别为所述至少一个文本的情感。
5.一种确定文本情感的装置,其特征在于,包括:
获取模块,用于获取文本的关键词和所述文本包含的多个句子,并标注每个句子的情感类别以及情感级别;
处理模块,用于对所述每个句子进行分词处理,提取所述每个句子的情感词;
第一计算模块,用于确定所述情感词在所述每个句子中的情感权重值;
第二计算模块,用于根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度;
判断模块,用于根据所述隶属度确定所述文本的情感类别;
其中,所述第二计算模块包括:
第四计算子模块,用于根据所述情感权重值确定包含所述关键词的句子的情感类别;
第五计算子模块,用于根据包含所述关键词的句子的情感类别,确定所述关键词的情感级别,并通过如下公式确定所述关键词在包含所述关键词的句子中的隶属度:
其中,所述W1为所述隶属度,所述V1为所述关键词的情感级别的权重值,所述∑Vi为所述关键词在所述情感级别中的权重值之和,所述α为所述关键词权重。
6.根据权利要求5所述的装置,其特征在于,所述情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,所述情感级别用于表征所述句子表达情感的强烈程度。
7.根据权利要求5所述的装置,其特征在于,所述第一计算模块包括:
第一计算子模块,用于计算所述情感词在所述每个句子中的个数;
第二计算子模块,用于计算包含所述情感词的句子中的词语总数;
第三计算子模块,用于根据所述情感词在所述每个句子中的个数以及包含所述情感词的句子中的词语总数确定所述情感词在所述每个句子中的情感权重值。
8.根据权利要求5所述的装置,其特征在于,所述判断模块包括:
第六计算子模块,用于在至少一种所述情感类别中,对所述关键词在至少一个所述情感级别中的隶属度进行求和运算,并得到求和结果;
选取子模块,用于选取所述求和结果最大的情感类别为所述至少一个文本的情感。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611219673.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种许可文件批量生成方法和系统
- 下一篇:用于处理大数据的方法和装置