[发明专利]一种语义情感识别方法在审

申请号：	202011421315.5	申请日：	2020-12-08
公开（公告）号：	CN112417892A	公开（公告）日：	2021-02-26
发明（设计）人：	张荣显;朱振;侯鹏	申请（专利权）人：	珠海横琴博易数据技术有限公司
主分类号：	G06F40/30	分类号：	G06F40/30;G06F40/242;G06F40/279;G06F16/33;G06F16/35
代理公司：	中山市铭洋专利商标事务所(普通合伙) 44286	代理人：	梁伟生
地址：	519000 广东省珠海***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语义情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语义情感识别方法，其特征在于，包括如下步骤：

步骤S1、创建情绪词典、程度副词词典和否定词词典；

步骤S2、将待分类文本按句切分成若干个子句，再将子句按语义切分成若干个词；

步骤S3、通过比对情绪词典、程度副词词典和否定词词典来找到各子句匹配的词汇，并获取词典标记好的强度分数或等级分数；

步骤S4、当前情绪词的基础强度分数记为Si，该情绪词所在位置的前面n个位置内出现否定词，正面词情感极性强度左移L个单位，Si＝∑(Si-L)，负面词的情感极性强度右移R个单位，Si＝∑(Si+R)；该情感词所在位置的前面n个位置内出现程度副词，该副词强度分数记为Wi，依据程度副词的程度大小，该处情感极性强度分数乘以对应词典标示的系数，Si＝∑(Wi×Si)，将整句的情感强度分数汇总得到总分WS，WS＝∑Si，WS表示该子句的全部情绪词、程度副词、否定词遍历计算后得到的情感总分数；

步骤S5、汇总各个子句的分析结果，包括正面子句总句数Pos、中立子句总句数Mid、负面子句总句数Neg、总句数N＝Pos+Mid+Neg、正面子句总分数PWS、负面子句总分数NWS、总分数TWS＝PWS+NWS，字符总数Char。

2.根据权利要求1所述的一种语义情感识别方法，其特征在于，还包括步骤S6：

调整TWS中NWS的权重系数，所述NWS的权重系数设置为α，则TWS＝PWS+α×NWS，其中α设置为1.5。

3.根据权利要求2所述的一种语义情感识别方法，其特征在于，还包括步骤S7：

利用评估函数Score＝(TWS/N+σ×TWS/Char)/2计算得到全文情绪评估分数Score，将评估分数Score代入判别函数Fun＝Score/(Score×Score+β)_1/2计算得到最终的整体情感分类，若Fun＝0.5，则最终待分析文本判为正面；若Fun＝-0.5，则最终待分析文本判为负面；若-0.5Fun0.5，则最终待分析文本判为中立。

4.根据权利要求3所述的一种语义情感识别方法，其特征在于：所述系数σ的值设置为30，β的值设置为7。

5.根据权利要求1所述的一种语义情感识别方法，其特征在于：所述强度平移单位数L、R的值都设置为8。

6.根据权利要求1所述的一种语义情感识别方法，其特征在于：所述情绪词所在位置的前面位置数n的值设置为2。

7.根据权利要求1所述的一种语义情感识别方法，其特征在于，在步骤S4中：

若是长文，则对首尾指定数量的子句的情绪总分予以重视，优先加权乘以对应加权系数θ，则该子句调整后的情感总分WS＝WS×θ；若该子句总分数WS0，则子句情感倾向判为正面；若该子句总分数WS0，则子句情感倾向判为负面；若该子句总分数WS＝0，则子句情感倾向判为中立。

8.根据权利要求7所述的一种语义情感识别方法，其特征在于：所述长文的子句数量不少于10句。

9.根据权利要求7所述的一种语义情感识别方法，其特征在于：对首尾各2句子句优先加权。

10.根据权利要求7所述的一种语义情感识别方法，其特征在于：所述加权系数θ的值设置为1.5。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于珠海横琴博易数据技术有限公司，未经珠海横琴博易数据技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011421315.5/1.html，转载请声明来源钻瓜专利网。