[发明专利]情感倾向性模板的生成方法和装置以及应用方法和装置无效
申请号: | 201010209453.7 | 申请日: | 2010-06-24 |
公开(公告)号: | CN102298589A | 公开(公告)日: | 2011-12-28 |
发明(设计)人: | 胡熠;刘云峰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 贾振勇 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 倾向性 模板 生成 方法 装置 以及 应用 | ||
技术领域
本发明属于信息处理领域,尤其涉及一种情感倾向性模板的生成方法和装置、以及情感倾向性模板的应用方法和装置。
背景技术
在用户提交的查询中,核心概念常常是一个命名实体,如“三星手机”,而返回的网页内容往往蕴含着对这个命名实体进行的褒扬或批评的评论。而对命名实体进行的褒扬或者批评的评论是一种重要的数据信息,需要对网页中的上述评论进行情感倾向性分析才能得到该网页的情感倾向。
现有技术提供了一种使用了点互信息(Pointwise Mutual Information,PMI)方法来推导文本中词或短语的情感值的情感倾向分析方法,简述如下:一个词或短语的语义倾向由它和另外的一些固定词或短语,如“excellent”和“poor”,之间的点对点互信息来决定。PMI在Church和Hanks的工作中定义如下:
其中p(w1&w2)是词w1和w2共现概率。一个词或短语的情感倾向就是它与词“excellent”的PMI和它与词“poor”的PMI之间的差异。所以它最终的情感倾向就是:
SO(word)=PMI(word,”excellent″)-PMI(word,”poor″) (eq.2)
这就使得一个和词“excellent”有较大PMI的词生成了大于0的情感值,而一个和词“poor”有较大PMI的词则生成了小于0的情感值。而情感值为0的表示这个词是中立的情感倾向。这个方法简单,但是很有效。而且,这样既不用受限于特殊词性(如是否是形容词)的词,也不用受限于是词还是短语。
词或短语的情感倾向可以被用于决定一个完整句子乃至整篇文档的情感。但由于该方法只考虑被考察词和非常有限的情感词(如excellent,poor)的PMI信息,忽略了其他词的作用。如果在情感词的上下文中有表示否定的词,如“not”,“never”等,整个情感倾向就会反转,从而导致情感倾向性分析错误率高的问题;另外这些工作是针对英文文本的,从而导致适用范围受限。
现有技术提供另外一种机器学习算法的情感倾向性分析方法,如贝叶斯分类器和支持向量机等。但这种方法由于需要学习,因此领域受限,在一种领域得到的模型难以移植到其他领域。
发明内容
本发明实施例的目的在于提供一种情感倾向性模板生成方法,旨在解决现有的情感倾向性分析方法准确率低、适用范围受限的问题。
本发明实施例是这样实现的,一种情感倾向性模板的生成方法,所述方法包括下述步骤:
针对种子集合中的每个种子,查找该种子在文本集合中的所有出现,并根据种子在文本集合中的所有出现生成第一情感倾向性模板集合,所述种子是指包括实体词和情感词的词对;
采用最长公共字串方法将第一情感倾向性模板集合中具有相同情感倾向的情感倾向性模板进行两两对比,生成第二情感倾向性模板集合。
本发明实施例的另一目的在于提供一种采用所述生成方法生成的情感倾向性模板的应用方法,所述方法包括下述步骤:
将情感倾向性模板与搜索引擎返回的文本中的预设粒度的文本进行匹配;
按照情感倾向性模板的置信度为与情感倾向性模板匹配上的预设粒度的文本打分,得到预设粒度的文本的情感倾向和情感得分。
本发明实施例的另一目的在于提供一种情感倾向性模板生成装置,所述装置包括:
存储单元,用于存储种子集合和情感倾向性模板,所述种子是包括实体词和情感词的词对。
模板生成单元,用于针对种子集合中的每个种子,查找该种子在文本集合中的所有出现,并根据种子在文本集合中的所有出现生成第一情感倾向性模板集合;
模板比对生成单元,用于采用最长公共字串方法将所述模板生成单元生成的第一情感倾向性模板集合中具有相同情感倾向的情感倾向性模板进行两两对比,生成第二情感倾向性模板集合。
本发明实施例的另一目的在于提供一种情感倾向性模板的应用装置,所述装置包括:
模板匹配单元,用于将情感倾向性模板与搜索引擎返回的文本中的预设粒度的文本进行匹配;
情感得分确定单元,用于按照情感倾向性模板的置信度为与情感倾向性模板匹配上的预设粒度的文本打分,得到预设粒度的文本的情感倾向和情感得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010209453.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数据流切片的软件识别方法
- 下一篇:多功能计算器