[发明专利]基于概率推理与情感认知的文本细粒度情感生成方法有效
申请号: | 201810298349.6 | 申请日: | 2018-04-04 |
公开(公告)号: | CN108549633B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 柴玉梅;徐源音;王黎明;张卓;韩飞;韩慧;李永帅 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/247 |
代理公司: | 河南大象律师事务所 41129 | 代理人: | 王克鹏;田永红 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 概率 推理 情感 认知 文本 细粒度 生成 方法 | ||
1.基于概率推理与情感认知的文本细粒度情感生成方法,其特征在于,包括以下步骤:
步骤1:准备训练方法所需的文本数据集,选用七种情感进行文本标注;
步骤2:对文本数据集进行分析、词性标注、依存句法分析、语义依存关系处理;
步骤3:根据情感认知方法OCC方法的情感产生规则,提取构建贝叶斯网络所用的情感评估变量;
步骤4:根据网络文本的特性,添加基于表情符号和词频的情感评估变量;
步骤5:构建情感知识库;
步骤6:构建常识知识库;
步骤7:情感评估变量赋值;根据步骤2得到的数据预处理结果,对步骤3和步骤4提取的情感评估变量进行赋值;
步骤8:学习情感生成贝叶斯网络的网络结构;
步骤9,使用EM方法对情感生成贝叶斯网络进行参数学习;
步骤10:完成情感生成方法的构建工作;输入一条文本,将依次经过步骤2和步骤7处理后的结果输入网络方法,通过比较每类情感的概率值,即可得到文本的情感类别。
2.根据权利要求1所述的文本细粒度情感生成方法,其特征在于:在步骤1中,情感认知方法OCC方法对应情感有22种,分析后选用喜欢、幸福、恐惧、生气、厌恶、悲伤、惊讶共七种情感对文本进行标注;在步骤2中对文本数据集使用哈工大语言云技术平台进行处理;处理后的文本结构定义为S={w1,w2,…wN},wi表示一条文本中的第i个词语对象;词语对象wi=<cont,pos,ne,arg,rel,par,semRel,semPar>,其中cont表示词语内容;pos代表词性;ne为命名实体信息;arg=<type,beg,end>表示序号从beg至end构成的词组的语义角色类别为type;rel表示依存句法关系,par为关系指向的父节点词序号;semRel表示语义依存关系,semPar为关系指向的父节点词序号。
3.根据权利要求2所述的文本细粒度情感生成方法,其特征在于:步骤3中的情感评估变量如下:
情感评估变量
4.根据权利要求3所述的文本细粒度情感生成方法,其特征在于:所述步骤4中添加基于表情符号的情感评估变量exp、elike、ehappiness、efear、esurprise、eanger、edisgust、esadness,其中exp表示是否有表情符号,其他变量表示对应的情感类型无为1,有为2;添加基于统计词频情感评估变量welike、whappiness、wfear、wsurprise、wanger、wdisgust、wsadness表示对应的情感类型无为1,有为2。
5.根据权利要求4所述的文本细粒度情感生成方法,其特征在于:步骤5中的情感知识库是从HowNet情感极性词典、大连理工大学情感词汇本体库、清华大学极性词典、台湾大学情感词典共个中文情感词典中,归纳整理去除了低频生僻词,得到基础情感极性词典包含正向情感词15630个,负向情感词18807个。
6.根据权利要求5所述的文本细粒度情感生成方法,其特征在于:步骤6中的构建常识知识库是提取HowNet知识库中Entity类作为基础object词典;再使用完整的HowNet知识库,通过分析其概念结构,完善其他常识词典。
7.根据权利要求6所述的文本细粒度情感生成方法,其特征在于:常识知识库具体描述如下:
常识词典具体描述
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810298349.6/1.html,转载请声明来源钻瓜专利网。