[发明专利]确定文本情感的方法及装置有效
申请号: | 201611219673.1 | 申请日: | 2016-12-26 |
公开(公告)号: | CN108241682B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 刘乙霖;陈晓敏;刘嘉;赵钰;王雪纯;栾睿 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 文本 情感 方法 装置 | ||
本发明公开了一种确定文本情感的方法及装置。其中,该方法包括:获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别;对每个句子进行分词处理,提取每个句子的情感词;确定情感词在每个句子中的情感权重值;根据情感权重值确定关键词在包含关键词的句子中的隶属度;根据隶属度确定文本的情感类别。本发明解决了现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。
技术领域
本发明涉及文本信息分析领域,具体而言,涉及一种确定文本情感的方法及装置。
背景技术
随着互联网上的文本信息越来越丰富,对这些文本信息进行情感分析就显得尤其重要,利用情感分析这项技术,应用得当可以更好的反馈舆情,能够为公司或者机构根据客户的情感反馈及时调整市场方向或改进产品提供支持。
现有的文章情感判断方式是基于篇章中句子情感的正中负比例进行计算的。在情感判断的机器学习中,选择一些特征参数,基本是根据句子情感占比,进而判断篇章级别的情感,若正面情感倾向的句子占比大,那该文章就被机器判断为正面情绪;若负面情感倾向的句子占比大,那该文章就被机器判断为负面情绪;若中性情感倾向的句子占比大,那该文章就被机器判断为中性情绪。基于句子情感所占比例的文章情感判断方式,文章的判断结果基本是以某种情绪的句子比例在整篇文章中的占比决定的,这些句子通常不分主次,都是按照相同的权重进行计算的。
现有的这种做法忽略了情感所指向的主体,也即忽略了关键词所在的句子所表达的情感,导致了文本情感判断不准确的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种确定文本情感的方法及装置,以至少解决现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。
根据本发明实施例的一个方面,提供了一种确定文本情感的方法,包括:获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别;对每个句子进行分词处理,提取每个句子的情感词;确定情感词在每个句子中的情感权重值;根据情感权重值确定关键词在包含关键词的句子中的隶属度;根据隶属度确定文本的情感类别。
根据本发明实施例的另一方面,还提供了一种确定文本情感的装置,包括:获取模块,用于获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别;处理模块,用于对每个句子进行分词处理,提取每个句子的情感词;第一计算模块,用于确定情感词在每个句子中的情感权重值;第二计算模块,用于根据情感权重值确定关键词在包含关键词的句子中的隶属度;判断模块,用于根据隶属度确定文本的情感类别。
在本发明实施例中,采用基于关键词加权的方式,通过获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别,对每个句子进行分词处理,提取每个句子的情感词,进而确定情感词在每个句子中的情感权重值,再根据情感权重值确定关键词在包含关键词的句子中的隶属度,进而根据隶属度确定文本的情感类别。达到了有效判断文本情感的目的,从而实现了提高文本情感判断准确率的技术效果,进而解决了现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种确定文本情感的方法流程图;
图2是根据本发明实施例的一种可选的确定文本情感的方法流程图;
图3是根据本发明实施例的一种确定文本情感的装置示意图;
图4是根据本发明实施例的一种可选的确定文本情感的装置示意图;
图5是根据本发明实施例的一种可选的确定文本情感的装置示意图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611219673.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种许可文件批量生成方法和系统
- 下一篇:用于处理大数据的方法和装置