[发明专利]情感标识的辨识方法和情感标识的辨识系统有效
申请号: | 201610228512.2 | 申请日: | 2016-04-13 |
公开(公告)号: | CN107291686B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 刘克松;杨建武;张丹;蔡慧慧;马路 | 申请(专利权)人: | 北京大学;北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 标识 辨识 方法 系统 | ||
本发明提供了一种情感标识的辨识方法和情感标识的辨识系统,其中,情感标识的辨识方法包括:根据情感标识的使用频率确定种子词和种子词对应的文本集合;在对应的文本集合中确定候选词语;根据预设的似然比模型确定候选词语与种子词的相关性数值,以根据相关性数值确定候选词语对应的情感标识。通过本发明的技术方案,针对不同文本语境对情感标识进行识别,适用于多种互联网社交平台。
技术领域
本发明涉及语义辨识技术领域,具体而言,涉及一种情感标识的辨识方法和一种情感标识的辨识系统。
背景技术
随着互联网的飞速发展,社交网络和电子商务日益融入人们生活。网络空间上随处可见对公众人物、热点事件、网购商品和影视作品等等的评论言论。通常这些评论的文本长度较短,口语化,且带有强烈的个人情感色彩。通常文本情感倾向分析技术依赖领域情感词典,情感词库的构建是文本情感分析任务的一个重要环节。在丰富、完善的情感词表基础上,可对文本中的观点、立场以及情感倾向进行识别、分类、提炼、整合、追踪和分析研究。
相关技术中,虽然存在一些通用的情感词库,但是情感标识(如词语和表情符号等)具有很强的领域相关性。例如,一个词语的褒贬倾向并不是在所有领域都是一致的,一个情感词库也不可能涵盖所有领域。不同领域的情感标识有明显的差异。例如,在表达上网的网速时“快”是正面评价词,而在表达手机电池使用时间时“快”是负面评价词。因此,词语在领域内的褒贬倾向鲜明更为重要。一般依据规范书面语通过专家知识得到的通用情感词词典很难适用于复杂的互联网环境。
另外,通过手工构建情感词词典需要大量的人工干预和人工判断,存在较大的随意性和主观性。无法及时收录最新的网络流行语,而且缺乏不同领域之间的移植性,不能由机器自动迁移到其他领域,无法考虑词语的领域属性,不能从问题领域角度考虑词的情感倾向,具有一定的局限性。
因此,如何提高情感标识的辨识的准确性成为亟待解决的技术问题。
发明内容
本发明正是基于上述技术问题至少之一,提出了一种新的情感标识的辨识方案,通过根据情感标识的使用频率确定种子词及其文本集合,并根据似然比模型确定候选词语与种子词的相关性数值,针对不同文本语境对情感标识进行识别,适用于多种互联网社交平台。
有鉴于此,根据本发明的第一方面的实施例,提出了一种情感标识的辨识方法,包括:根据情感标识的使用频率确定种子词和种子词对应的文本集合;在对应的文本集合中确定候选词语;根据预设的似然比模型确定候选词语与种子词的相关性数值,以根据相关性数值确定候选词语对应的情感标识。
在该技术方案中,通过根据情感标识的使用频率确定种子词及其文本集合,并根据似然比模型确定候选词语与种子词的相关性数值,针对不同文本语境对情感标识进行识别,适用于多种互联网社交平台。
其中,结合种子词的文本集合的语境,考虑候选词语在上述文本集合中出现的概率,例如,候选词语在种子词的相邻位置出现的概率,更能反映候选词语与种子词的相关性。
在上述技术方案中,优选地,根据预设的似然比模型确定候选词语与种子词的相关性数值,以根据相关性数值确定候选词语对应的情感标识,具体包括以下步骤:将种子词记作s,同时将候选词语记作w,确定文本集合中的种子词的相邻文本段落;计算候选词语属于相邻文本段落的条件概率,并记作P(w|s);计算候选词语属于文本集合的概率,并记作P(w),并将候选词语出现在文本集合的次数记作k;根据第一公式计算候选词语的依赖性系数,依赖性系数记作M(w,s),其中,第一公式为确定依赖性系数大于零的候选词语,以确定为参考情感词语,并根据依赖性系数从大到小的顺序对参考情感词语进行排序。
在该技术方案中,通过计算种子词的依赖性系数,确定依赖性系数大于零即确定P(w|s)大于P(w),对候选词语进行进一步地筛选,并且根据依赖性系数从大到小的顺序对参考情感词语进行排序,更利于快速地确定情感标识的语义特性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正电子有限公司,未经北京大学;北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610228512.2/2.html,转载请声明来源钻瓜专利网。