[发明专利]基于知识图嵌入的涉案领域的半监督方面级情感分析方法有效
申请号: | 202110163044.6 | 申请日: | 2021-02-05 |
公开(公告)号: | CN112800229B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 毛存礼;赵培莲;余正涛;相艳 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/247;G06N3/04;G06N3/08 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 嵌入 涉案 领域 监督 方面 情感 分析 方法 | ||
本发明涉及基于知识图嵌入的涉案领域的半监督方面级情感分析方法,属于自然语言处理技术领域。本发明包括步骤:从涉案微博事件中爬取了包含8个案例、276个涉案热点话题的涉案领域的微博评论5W+,首先利用少量标记数据进行数据增强,通过预训练得到涉案领域的BERT词嵌入和涉案领域的知识图词嵌入,然后将两种词嵌入按照比例拼接放入下游任务中,从而对特定方面的涉案微博评论进行极性的分类。本发明是实验过程中获得的一个最优的技术方案,构建的分类模型取得了较好的效果,在典型的涉案微博评论数据集上比基线模型分别提高了3.1%。
技术领域
本发明涉及基于知识图嵌入的涉案领域的半监督方面级情感分析(Semi-ETEKGs)方法,属于自然语言处理技术领域。
背景技术
随着自媒体时代的到来、我国新媒体的蓬勃发展和网络舆情的深入,部分法院所审理的焦点案件在网络上迅速发酵,引发社会的广泛争议,司法部门通过实时有效的掌握并正确引导网络舆情有助于确保法院依法独立行使审判权,维护社会公平正义。而微博作为社会大众自由评论的社交媒体之一,其用户量庞大,发展较快,其中不少司法相关的案件会在微博中引起激烈讨论。因此,为了避免网络舆情对法院判决的影响,实时掌握用户对某一涉案热点事件的观点意见至关重要。该任务可以被视为是自然语言处理(NLP)中的子任务:涉案领域的方面级情感分析(ABSA),旨在从文本中挖掘用户的情感或者观点。
方面级情感分析是观点挖掘的一个子任务,旨在发现用户对于特定目标的极性判断。其研究方法主要包括有监督的方法和半监督的方法。由于每天成千上万的评论在社交媒体上被产出,将这些评论都进行人工标注是不可能的事情。因此,一种常见的半监督方法(SSL)能够充分利用好少量标注数据集,从而估计在分类器上训练参数。半监督方法已经被证明在很多任务和领域中都取得了不错的效果。其中Bert等为半监督方法提出了一种自监督的方法MixMatch,同时在此基础上在分布的排列和扩增的锚点上改进了模型。
发明内容
本发明提供了基于知识图嵌入的涉案领域的半监督方面级情感分析方法,以用于解决目前涉案微博评论涉案领域知识不能很好的融入到模型和涉案领域中缺乏标记的训练语料的问题,本发明取得较好的情感分类效果。
本发明的技术方案是:基于知识图嵌入的涉案领域的半监督方面级情感分析方法,包括:
从涉案微博事件中爬取涉案领域的微博评论,首先利用标记数据进行数据增强,通过预训练得到涉案领域的BERT词嵌入和涉案领域的知识图词嵌入,然后将两种词嵌入按照比例拼接放入下游任务中,从而对特定方面的涉案微博评论进行极性的分类。
作为本发明的进一步方案,所述基于知识图嵌入的涉案领域的半监督方面级情感分析方法的具体步骤如下:
Step1、收集用于涉案微博评论的方面级情感分析方法的涉案微博正文和微博评论,根据微博正文所涉及的案件,对收集的微博评论设置该案件的案件要素,同时根据案件要素对微博评论进行去重、筛选,去除与案件无关的微博评论,同时标记涉案微博评论的评价对象、所对应的评价观点词和涉案微博评论的情感极性;
Step2、利用标记的数据集进行同义词替换,随机插入和随机交换方法的数据增强,利用构建的数据集基于BERT模型和TransGate模型构建预训练涉案领域的词嵌入网络,从而获得BERT的词向量和涉案领域的TransKGs词嵌入;
Step3、对于未标记的数据集进行标签的预测,并将得到的涉案微博BERT词嵌入和TransKGs词嵌入根据超参数的设置按照权重进行加权融合,获得带有涉案领域知识的词嵌入;
Step4、将获得的具有涉案领域知识特征的词向量放入下游任务中,以此实现涉案领域微博评论的方面级情感分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110163044.6/2.html,转载请声明来源钻瓜专利网。