[发明专利]一种面向目标的情感分类方法有效

专利信息
申请号: 201910568300.2 申请日: 2019-06-27
公开(公告)号: CN110287323B 公开(公告)日: 2020-10-23
发明(设计)人: 顾凌云;王洪阳;严涵 申请(专利权)人: 成都冰鉴信息科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/36;G06F16/33;G06F40/30
代理公司: 常州佰业腾飞专利代理事务所(普通合伙) 32231 代理人: 滕诣迪
地址: 610041 四川省中国(四川)自由贸易*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种面向目标的情感分类方法,属于大数据技术领域,包括建立客户端服务器和中心服务器,客户端服务器用于收集文本信息,并将文本信息发送给中心服务器;在中心服务器中建立预处理模块、GloVe模型模块、位置信息编码模块、注意力编码器和分类器模块,解决了提取出待分析的目标序列,针对该目标序列完成面向目标的情感分析的技术问题,适用于需要进行细粒度情感分析的场景,本发明可以实现对语句中包含多个待分析的目标,不同目标具有不同的情感色彩的文本进行感情分类,提取更加准确有效。
搜索关键词: 一种 面向 目标 情感 分类 方法
【主权项】:
1.一种面向目标的情感分类方法,其特征在于:包括如下步骤:步骤1:建立客户端服务器和中心服务器,客户端服务器用于收集文本信息,并将文本信息发送给中心服务器;在中心服务器中建立预处理模块、GloVe模型模块、位置信息编码模块、注意力编码器和分类器模块;步骤2:中心服务器获取到文本信息后,通过预处理模块对文本信息中带有主观情感色彩的文本数据进行预处理,分别表示出文本数据中的文本语句和目标序列,具体包括如下步骤:步骤A1:建立中文停用词词典,根据中文停用词词典对文本数据中含有的停用词进行删除,同时根据中文停用词词典删除文本数据中包含的不完整文本数据,得到原语句数据;步骤A2:将原语句数据中的带有感情色彩的语句作为待测目标,为待测目标建立目标序列,对目标序列进行提取,得到目标序列对应原语句数据的子序列;步骤A3:对原语句数据和目标序列进行序列化操作,完成文本数据的序列化操作;步骤3:GloVe模型模块使用GloVe词表征工具预训练一个语言模型,通过使用语言模型得到原语句数据和目标序列的字词向量的特征表示,捕捉单词之间的广泛的语义特征;步骤4:位置信息编码模块对原语句数据中的上下文字词相对于目标序列做位置信息的编码,计算原语句数据中每个字词的位置权重,具体包括如下步骤:步骤B1:规定距离目标序列越近的字词对其情感值的计算贡献越大,距离目标序列越远的字词对其情感值贡献越低;步骤B2:计算上下文中每个字词相对目标序列的位置距离,得到位置距离信息,规定若一个目标序列由多个字词组成,且某上下文属于该目标序列,则该上下文与该目标序列的位置距离为0,通过位置距离信息计算所有上下文字词相对目标序列的位置权重;步骤5:使用注意力编码器分别对原语句数据和目标序列的字向量进行编码,具体步骤如下:步骤C1:将位置距离信息与原语句数据结合更新字词向量,使经过GloVe词表征工具编码的上下文中的每个字词向量均能体现其与目标序列的位置距离信息;步骤C2:通过使用长短期网络和注意力机制完成文本语义的学习,该过程中包含以下步骤:步骤Y1:使用Bi‑LSTM从正向和反向分别学习文本字词的表示含义,将前向和后向学习得到的词向量分别结合起来,形成最后的文本字词向量;步骤Y2:使用注意力编码器分别进一步学习文本语句和目标序列中各字词间的相互关系,得到最终的文本特征向量;步骤6:分类器模块对最终的文本特征向量学习一个分类器,计算原语句数据的情感类别,具体步骤如下:步骤D1:将最终的文本特征向量经过一层全连接神经网络,分别计算该文本针对目标序列所属正向、中立、负向的三个情感得分,取概率最大的一项作为情感分类的结果,具体计算公式如下:scorej=Wp·F+bp,j∈[1,3];其中,是神经网络输入层与输出层之间神经元的参数,需要在模型的训练过程中不断变化最终达到收敛状态,scorej表示该文本属于标签j的得分,其中,j取值为1,2,3分别表示情感值:正向、中性、负向;步骤D2:通过Softmax归一化计算针对目标序列的文本情感类别,提取概率最大的情感标签作为该目标序列的文本情感值,其公式如下:
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都冰鉴信息科技有限公司,未经成都冰鉴信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910568300.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top