[发明专利]面向自然语言的方面情感分析方法及系统在审
申请号: | 202111436519.0 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114357155A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 解福;张永胜;丁琦;刘培玉;朱振方 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 自然语言 方面 情感 分析 方法 系统 | ||
1.面向自然语言的方面情感分析方法,其特征是,包括:
获取待分析的自然语言;
将待分析的自然语言,输入到训练后的方面情感提取模型中,得到提取的方面术语、意见术语和方面情感分类结果;
其中,所述方面情感提取模型,工作原理包括:对自然语言进行编码处理得到每个单词的上下文隐藏向量;基于每个单词的上下文隐藏向量,提取面向方面的特征;基于面向方面的特征,得到方面术语的起始位置和结束位置预测值;基于每个单词的上下文隐藏向量,提取面向意见的特征;基于面向意见的特征,得到意见术语的起始位置和结束位置预测值;根据两个预测值,得到情感极性。
2.如权利要求1所述的面向自然语言的方面情感分析方法,其特征是,
所述方面情感提取模型,包括:依次连接的嵌入与编码模块、语义交互与跨度提取模块和方面观点匹配与情感分类模块;
所述嵌入与编码模块,采用Glove模型和BiLSTM相互结合的方式来实现,或者,所述嵌入与编码模块,采用BERT模型来实现;
所述语义交互与跨度提取模块,包括依次连接的卷积神经网络CNN、拼接层和全连接层;其中,卷积神经网络CNN的输出层还通过注意力机制模块与拼接层连接;
所述方面观点匹配与情感分类模块,采用前馈神经网络来实现。
3.如权利要求1所述的面向自然语言的方面情感分析方法,其特征是,所述对自然语言进行编码处理得到每个单词的上下文隐藏向量;具体包括:
当采用Glove模型和BiLSTM相互结合的方式来实现,则首先使用Glove模型对句子中的每个单词进行词嵌入表示来获得词表示;然后,使用BiLSTM编码器对词表示进行编码操作,得到每个单词的上下文隐藏向量。
4.如权利要求1所述的面向自然语言的方面情感分析方法,其特征是,所述对自然语言进行编码处理得到每个单词的上下文隐藏向量;具体包括:
当采用BERT模型来实现,则首先对输入BERT模型的自然语言进行标记,将标记后的句子序列构造成设定样式后,输入到BERT模型中,得到句子的标记嵌入、段落嵌入和位置嵌入三个向量,对三个向量进行加和操作得到最终的词表示,然后将最终的词表示输入到双向Transformers编码器中,得到每个单词的上下文隐藏向量。
5.如权利要求1所述的面向自然语言的方面情感分析方法,其特征是,
所述基于每个单词的上下文隐藏向量,提取面向方面的特征;基于面向方面的特征,得到方面术语的起始位置和结束位置预测值;具体包括:
采用卷积神经网络CNN接收每个单词的上下文隐藏向量;
从每个单词的上下文隐藏向量中,提取面向方面的特征;其中,面向方面特征,是与方面术语有关的上下文隐藏向量特征;
基于面向方面的特征,采用注意力机制,定义方面术语与意见术语二者每个单词之间的语义关系;
对于在面向方面特征中的每个单词,通过面向意见特征中除了当前单词以外的所有单词进行语义关系加权求和,提取出从面向意见特征中提取出有用信息;
对从面向意见特征中提取出有用信息与面向方面的特征进行拼接,得到面向方面的最终特征,将面向方面的最终特征,输入到全连接层中,得到面向方面术语的起始位置预测得分和概率分布、面向方面术语的结束位置预测得分和概率分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111436519.0/1.html,转载请声明来源钻瓜专利网。