[发明专利]基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法在审
申请号: | 202011275960.0 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112561718A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 余正涛;王静赟;相艳;黄于欣;郭军军;线岩团 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06Q30/02;G06F16/35 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bilstm 权重 共享 案件 评价 对象 情感 倾向性 分析 方法 | ||
1.基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述方法包括:
Step1、收集用于案件微博评价对象情感倾向性分析的微博评论文本,对微博评论文本进行去重与筛选;
Step2、定制案件微博评价对象情感倾向性分析的标注体系,标记微博评论文本,将标记好的微博评论语料分为训练语料和测试语料;
Step3、获取评论语句对应的词向量和评价对象对应的词向量,训练数据经过预处理后作为具有权重共享的BiLSTM的输入;
Step4、采用权重共享的BiLSTM获取评论和评价对象的语义特征,训练案件微博评价对象情感倾向性分析模型;
Step5、将评价对象对应的隐含层输出向量进行mean pooling得到代表评价对象的向量,然后将末尾的隐含层的输出向量进行连接操作,结合注意力机制得到最终的特征表达,输入到softmax分类器,用于进行情感倾向性分析。
2.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述Step1中,使用Scrapy作为爬取工具,收集用于案件微博评价对象情感倾向性分析的微博评论文本。
3.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step2的具体步骤为:
Step2.1、定制的案件微博评价对象情感倾向性分析的标注体系采用了XML的可扩展标记语言组织文本,分别针对评价对象文本、评价对象的开始位置、评价对象的结束位置、评价对象的情感极性对收集到的微博评论文本进行标记;
Step2.2、再将实验数据分为训练语料和测试语料。
4.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step3中:将评论语句中的词与评价对象输入到embedding层中得到评论语句对应的词向量和评价对象对应的词向量其中,m代表组成评论语句词的个数,r是评价对象的个数。
5.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step4的具体步骤:
Step4.1、训练数据经过预处理后,输入到具有权重共享的BiLSTM中;
Step4.2、将案件微博评论句和评价对象的向量映射到同一个空间维度上,通过双向长短时记忆网络能够获取句子中潜在的语义信息,由一个前向的LSTM网络层和后向的LSTM网络层组成;
Step4.3、利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。
6.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法,其特征在于:所述步骤Step5的具体步骤为:
Step5.1、单独对评价对象对应的隐含层输出向量进行mean pooling,得到的结果拼接到评论句的每个词向量中,以获得每个词的最终上下文语义表示,最终输出的向量将作为下一步注意力机制层的输入;
Step5.2、结合注意力机制,通过计算对句子语义重要的信息,滤掉与句子无关的信息,突出评价对象作为关键信息在整体句子中的重要程度,增强关键特征所携带的特征信息,得到最终的特征表达;
Step5.3、将最终的特征表达输入到softmax分类器中,决策出最大概率的类别,得到评论句最终的情感极性;其中情感极性的标签是分为三个,分别是积极、中立和消极。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011275960.0/1.html,转载请声明来源钻瓜专利网。