[发明专利]一种应用于搜索引擎的情感映射方法与情感句型分析方法有效
申请号: | 201210308445.7 | 申请日: | 2012-08-28 |
公开(公告)号: | CN102867028A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 张钫炜;刘浩;陆月明 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 搜索引擎 情感 映射 方法 句型 分析 | ||
1.一种应用于搜索引擎的多情感倾向度映射方法与情感句型结构分析方法,其特点是量化情感,将情感倾向映射为一个情感倾向度向量,通过分析情感句句型结构,对情感倾向度向量进行运算,最终确定句子的情感倾向度向量。
2.根据权利要求1所述的多情感倾向度映射方法,其特征在于对情感词的映射规则:依据Emotion Wheel及情感标注将情感词映射到Emotion Wheel的相应位置,情感强弱的大小和倾向通过极坐标向量的形式表示。
3.根据权利要求1所述情感句句型结构分析方法,其特征在于识别四种情感句型否定句、转折句、并列递进句的结构,分析简化句型结构,得到句子语义的计算方法。其中识别方法如下所述:
a)并列、递进句判断依据,作为并列、递进句判断依据的连接词有:和、与、同、及、而、况且、何况、乃至,不但、而且、并、并且等。判断依据有两个:有无连接词出现;小句的结构是否相似。若有连接词出现则将该句子判断为并列、递进句;若没有连接词出现,但是句子中小句的结构相似,则将该句子判断为并列、递进句;
b)否定句判断依据,否定句一般含有否定副词,常见的否定副词有:不、甭、别、没有、没、不要等。只要句子分词后含有否定副词,我们就将该句子识别为否定句进行处理;
c)转折句判断依据,转折句一般含有转折连词,常见的转折连词有:却、虽然、但、但是、然而、而、偏偏、只是、不过、至于、致、不料、岂知等。只要句子分词后含有转折连词,我们就将该句子识别为否定句进行处理。
4.根据权利要求1所述情感句句型结构分析方法,其特征在于根据句子语义计算句子情感倾向度。其中计算方法如下所述:
a)并列、递进句计算方法,在计算并列、递进句的情感倾向度时,若多个词语的倾向度向量的方向相同,取模值大的词语的倾向度向量作为句子的倾向度向量。若它们的倾向度向量方向不同,又分为两种情况,第一,若是一阶混合,句子情感倾向度向量的方向取向量和的方向,句子情感倾向度向量的大小取模值最大的情感词倾向度向量的模值;第二,若是二阶或者三阶混合,只做情感倾向度向量标注,其大小取情感词情感倾向度向量模值最大的模值;
b)否定句计算方法,分为两种:第一,若句子中所有的情感词都是由否定副词修饰着,句子的情感倾向度取情感词倾向度的反向;第二,若句子中有情感词不是由否定副词修饰的,则句子的情感倾向度与被否定副词修饰的情感词无关,由其他的没有否定副词修 饰的情感词决定;
c)转折句计算方法,转折句中一般句子结构分为两个部分,只计算后句的情感倾向度作为整句的情感倾向度向量,后句的情感倾向度向量按一般句进行处理;
d)一般句的计算方法:不能判断为上述三类句子的即为一般句,其情感倾向度由其句子中词的情感倾向度向量ei欧式和的平均决定:
5.根据权利要求1所述的情感倾向度向量运算,其规则遵循基础情感与混合情感之间的关系,如表1所示
表1混合规则
0生气和快乐,希望和嫌弃,这两组无法产生一个混合情感词,因而未标出。
1在Emotion Wheel中,四对两两相对的情感无法产生混合情感 。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210308445.7/1.html,转载请声明来源钻瓜专利网。