[发明专利]情感倾向性分析的方法及装置有效
申请号: | 201510695279.4 | 申请日: | 2015-10-22 |
公开(公告)号: | CN106610990B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 朱波 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/284 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 倾向性 分析 方法 装置 | ||
1.一种情感倾向性分析的方法,其特征在于,所述方法包括:
识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料,所述标注语料至少为正向情感、负向情感,所述标注语料是以配置信息的独立于文本内容的形式与文本内容进行关联;
根据标点符号将所述主观句拆分为主观标点句;
识别所述主观句中的情感词,包括:识别所述主观标点句中的情感词;
在所述主观句中查找对所述情感词做出倾向性贡献的搭配词,包括:在所述主观标点句中,查找对所述主观标点句中的情感词做出倾向性贡献的搭配词,进一步具体实施过程为:在查找搭配词时,首先从主观标点句对应的分词序列中提取可能与情感词组合使用的所有词语,并将这些词语分别与情感词进行组合,获得多个词语组合,然后通过预定的算法从多个词语组合中选择出作为分析规则的情感词与搭配词的词语组合,其中预定的算法至少为:使用bigram算法,或,使用N-gram算法,或,采用Skip-gram算法;
将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;
通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,在对所有语句完成规则匹配后,将各个语句的情感倾向性结果进行加总,获得所述目标文本的情感倾向性结果。
2.根据权利要求1所述的方法,其特征在于,所述在所述主观句中查找对所述情感词做出倾向性贡献的搭配词,包括:
在所述主观句中,查找对所述主观标点句中的情感词做出倾向性贡献、并且位于相邻的主观标点句中的搭配词。
3.根据权利要求2所述的方法,其特征在于,所述方法进一步包括:
查找对所述主观句中的情感词做出倾向性贡献、并且位于相邻的主观句中的搭配词。
4.根据权利要求3所述的方法,其特征在于,所述将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则,包括:
将所述主观标点句中的情感词与搭配词的组合,结合所述主观标点句的标注语料,生成标点句分析规则;
将所述主观标点句中的情感词与同一主观句中相邻主观标点句中的搭配词的组合,结合相邻的两个主观标点句的标注语料,生成主观句分析规则;
将主观句中的情感词与相邻主观句中的搭配词的组合,结合相邻的两个主观句的标注语料,生成句间分析规则。
5.一种情感倾向性分析的装置,其特征在于,所述装置包括:
识别单元,用于识别学习文本中的主观句,所述学习文本中的句子对应有用于记录情感倾向性的标注语料,所述标注语料至少为正向情感、负向情感,所述标注语料是以配置信息的独立于文本内容的形式与文本内容进行关联;
拆分单元,用于在所述识别所述主观句中的情感词之前,根据标点符号将所述主观句拆分为主观标点句;
所述识别单元还用于识别所述主观句中的情感词,包括:用于识别所述主观标点句中的情感词;
查找单元,用于在所述主观句中查找对所述情感词做出倾向性贡献的搭配词;
所述查找单元包括:
第一查找模块,用于在所述主观标点句中,查找对所述主观标点句中的情感词做出倾向性贡献的搭配词,进一步具体实施过程为:在查找搭配词时,首先从主观标点句对应的分词序列中提取可能与情感词组合使用的所有词语,并将这些词语分别与情感词进行组合,获得多个词语组合,然后通过预定的算法从多个词语组合中选择出作为分析规则的情感词与搭配词的词语组合,其中预定的算法至少为:使用bigram算法,或,使用N-gram算法,或,采用Skip-gram算法;
生成单元,用于将所述情感词与所述搭配词的组合,结合所述主观句的标注语料,生成情感倾向性分析规则;
匹配单元,用于通过所述情感倾向性分析规则对目标文本中的句子进行规则匹配,在对所有语句完成规则匹配后,将各个语句的情感倾向性结果进行加总,获得所述目标文本的情感倾向性结果。
6.根据权利要求5所述的装置,其特征在于,所述查找单元包括:
第二查找模块,用于在所述主观句中,查找对所述主观标点句中的情感词做出倾向性贡献、并且位于相邻的主观标点句中的搭配词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510695279.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:搜索关键词聚类方法及装置
- 下一篇:数据处理方法和装置