[发明专利]一种语义情感识别方法在审
申请号: | 202011421315.5 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112417892A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 张荣显;朱振;侯鹏 | 申请(专利权)人: | 珠海横琴博易数据技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/242;G06F40/279;G06F16/33;G06F16/35 |
代理公司: | 中山市铭洋专利商标事务所(普通合伙) 44286 | 代理人: | 梁伟生 |
地址: | 519000 广东省珠海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 情感 识别 方法 | ||
1.一种语义情感识别方法,其特征在于,包括如下步骤:
步骤S1、创建情绪词典、程度副词词典和否定词词典;
步骤S2、将待分类文本按句切分成若干个子句,再将子句按语义切分成若干个词;
步骤S3、通过比对情绪词典、程度副词词典和否定词词典来找到各子句匹配的词汇,并获取词典标记好的强度分数或等级分数;
步骤S4、当前情绪词的基础强度分数记为Si,该情绪词所在位置的前面n个位置内出现否定词,正面词情感极性强度左移L个单位,Si=∑(Si-L),负面词的情感极性强度右移R个单位,Si=∑(Si+R);该情感词所在位置的前面n个位置内出现程度副词,该副词强度分数记为Wi,依据程度副词的程度大小,该处情感极性强度分数乘以对应词典标示的系数,Si=∑(Wi×Si),将整句的情感强度分数汇总得到总分WS,WS=∑Si,WS表示该子句的全部情绪词、程度副词、否定词遍历计算后得到的情感总分数;
步骤S5、汇总各个子句的分析结果,包括正面子句总句数Pos、中立子句总句数Mid、负面子句总句数Neg、总句数N=Pos+Mid+Neg、正面子句总分数PWS、负面子句总分数NWS、总分数TWS=PWS+NWS,字符总数Char。
2.根据权利要求1所述的一种语义情感识别方法,其特征在于,还包括步骤S6:
调整TWS中NWS的权重系数,所述NWS的权重系数设置为α,则TWS=PWS+α×NWS,其中α设置为1.5。
3.根据权利要求2所述的一种语义情感识别方法,其特征在于,还包括步骤S7:
利用评估函数Score=(TWS/N+σ×TWS/Char)/2计算得到全文情绪评估分数Score,将评估分数Score代入判别函数Fun=Score/(Score×Score+β)1/2计算得到最终的整体情感分类,若Fun=0.5,则最终待分析文本判为正面;若Fun=-0.5,则最终待分析文本判为负面;若-0.5Fun0.5,则最终待分析文本判为中立。
4.根据权利要求3所述的一种语义情感识别方法,其特征在于:所述系数σ的值设置为30,β的值设置为7。
5.根据权利要求1所述的一种语义情感识别方法,其特征在于:所述强度平移单位数L、R的值都设置为8。
6.根据权利要求1所述的一种语义情感识别方法,其特征在于:所述情绪词所在位置的前面位置数n的值设置为2。
7.根据权利要求1所述的一种语义情感识别方法,其特征在于,在步骤S4中:
若是长文,则对首尾指定数量的子句的情绪总分予以重视,优先加权乘以对应加权系数θ,则该子句调整后的情感总分WS=WS×θ;若该子句总分数WS0,则子句情感倾向判为正面;若该子句总分数WS0,则子句情感倾向判为负面;若该子句总分数WS=0,则子句情感倾向判为中立。
8.根据权利要求7所述的一种语义情感识别方法,其特征在于:所述长文的子句数量不少于10句。
9.根据权利要求7所述的一种语义情感识别方法,其特征在于:对首尾各2句子句优先加权。
10.根据权利要求7所述的一种语义情感识别方法,其特征在于:所述加权系数θ的值设置为1.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海横琴博易数据技术有限公司,未经珠海横琴博易数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011421315.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种致密油长水平井油管钻塞作业方法
- 下一篇:一种液晶模组包装箱