[发明专利]文本情感的处理方法及装置有效
申请号: | 201611265791.6 | 申请日: | 2016-12-30 |
公开(公告)号: | CN108268439B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 韩旭红 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 处理 方法 装置 | ||
本发明公开了一种文本情感的处理方法及装置。其中,该方法包括:采用通过获取情感词,根据情感词所对应的评价对象而确定情感词的情感强度值,再基于待分析文本中各个情感词的情感强度值,确定待分析文本的情感强度值,进而通过各个情感词所对应的评价对象,根据各个情感词对于不同评价对象的情感强度,确定的各个情感词的情感强度值,提高了情感词在不同评价对象中情感强度值的准确性,从而解决了无法准确确定文本的情感倾向的技术问题。
技术领域
本发明涉及语义处理领域,具体而言,涉及一种文本情感的处理方法及装置。
背景技术
情感词是用来表达情感、态度和意见的词语,如“完美”、“不错”、“糟糕”等。在文本情感分析中,无论是词汇、短语、句子、段落还是篇章,基本情感单元都是情感词,情感词是表达主观情感的基本要素。情感词典中包含情感词及其情感倾向,这些信息是进行文本情感正负倾向判断的主要依据。现有技术中对文本进行情感分析的方法都是建立在情感词典的基础之上,高质量的情感词典能在一定程度上提高文本情感分类的效果。
具体地,在对一个句子或篇章进行正负情感倾向判断时,需要依赖于句子或篇章中包含的情感词的正负情感倾向,例如,当进行产品优缺点挖掘或用户推荐等情感分析任务时,都需要依赖于情感词的情感倾向或情感值进行句子级别或篇章级别的情感判断。现有的实现方式仅对情感词进行正负倾向判断,在很多情况下,仅了解情感词的正负倾向无法准确判断语句的情感。例如,一条评论中包含正向情感词和负向情感词个数相等,单纯依靠情感词的正负倾向无法进行准确判断。
目前情感词典构建的方法包括基于语料语料库的方法和基于词典的方法,大多通过种子情感词进行情感词典扩充。基于语料统计的方法主要通过分析大规模语料库中情感词、评价对象等词语出现的特征和规则,统计领域评论语料库中词语共现信息等挖掘相同情感倾向的词语。利用词汇知识库中词条之间的语义关系,通过种子评价情感词扩展相同情感倾向词语。从构建形式上来说,很多人工构建情感词典,单纯考虑单个词的正负极性,情感信息词语分布不均将导致特征和规则难以提取;基于词典的方法需要依赖种子词的个数和质量,且领域依赖性较强,对于一词多义处理易引入噪声。
在现有技术中,仅仅通过评论中包含的相关词语的情感倾向对评论进行情感分析,分析结果不准确。
针对上述无法准确确定文本的情感倾向的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种文本情感的处理方法及装置,以至少解决无法准确确定文本的情感倾向的技术问题。
根据本发明实施例的一个方面,提供了一种文本情感的处理方法,包括:获取待分析文本中的多个情感词;获取每个所述情感词的情感强度值,其中,所述情感词的情感强度值至少基于所述情感词所对应的评价对象而确定;基于所述待分析文本中各个情感词的情感强度值,确定所述待分析文本的情感强度值。
进一步地,其特征在于,获取每个所述情感词的情感强度值包括:获取预先生成的情感词集合;从所述情感词集合中读取每个所述情感词的情感强度值。
进一步地,在获取预先生成的情感词集合之前,所述方法还包括:获取多个样本文本的情感信息,其中,情感信息用于记录各个样本文本中情感词与评价对象的对应关系,一个所述情感词至少用于评价一个所述评价对象;确定属于同一词语块的每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值,其中,所述其它情感词与所述情感词属于同一词语块;基于每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值,获取每个词语块中每个情感词的情感强度值;保存各个情感词与情感强度值的对应关系,生成所述情感词集合。
进一步地,确定属于同一词语块的每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值包括:根据评价对象的属性,将属性相同的评价对象对应的情感词保存入同一词语块;确定每个词语块中,每个情感词与其它情感词之间的相似值、以及每个情感词与样本文本的关联值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611265791.6/2.html,转载请声明来源钻瓜专利网。