[发明专利]一种舆情情感细粒度三元组抽取的方法在审
申请号: | 202211168190.9 | 申请日: | 2022-09-23 |
公开(公告)号: | CN115344716A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 罗锐;刘华轶;王波;金灿 | 申请(专利权)人: | 重庆旅游云信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 成都华复知识产权代理有限公司 51298 | 代理人: | 余鹏 |
地址: | 401120 重庆*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 舆情 情感 细粒度 三元 抽取 方法 | ||
本发明提供一种舆情情感细粒度三元组抽取的方法,涉及舆情情感技术领域。该舆情情感细粒度三元组抽取的方法,具体包括以下步骤:步骤S1:对训练样本进行打标签;步骤S2:编码并取得文本的向量表示;步骤S3:向量表示优化;步骤S4:获取注意力矩阵;步骤S5:解码实体获取分数;步骤S6:获取实体和三元组;步骤S7:梯度下降训练;步骤S8:迭代第2‑7步直至模型收敛;步骤S9:通过训练好的所述模型进行预测。本发明提供一种舆情情感细粒度三元组抽取的方法,该舆情情感细粒度三元组抽取的方法适用于现实场景的舆情监控和产品迭代,抽取判断的更加精确,有助于更加方便的理解导致目标情感的原因,具有较强的实用性和指导性。
技术领域
本发明涉及舆情情感技术领域,具体为一种舆情情感细粒度三元组抽取的方法。
背景技术
舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和。舆情是舆情因变事项发生、发展和变化过程中,民众所持有的社会态度,是对“民意及其作用于执政者及其政治取向规律”的一种描述。
而舆情情感细粒度即是在舆情的基础上对情感进行更细粒度的情感分析,这往往都是为了了解目标的情感,但现有的情感了解方式操作大多都过于麻烦,数据过于庞大,难以在现实场景的舆情监控和产品迭代此类领域更加方便的理解导致目标情感的原因。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种舆情情感细粒度三元组抽取的方法,解决了难以在现实场景的舆情监控和产品迭代此类领域更加方便的理解导致目标情感原因的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种舆情情感细粒度三元组抽取的方法,具体包括以下步骤:
步骤S1:对训练样本进行打标签;
步骤S2:编码并取得文本的向量表示;
步骤S3:向量表示优化;
步骤S4:获取注意力矩阵;
步骤S5:解码实体获取分数;
步骤S6:获取实体和三元组;
步骤S7:梯度下降训练;
步骤S8:迭代第2-7步直至模型收敛;
步骤S9:通过训练好的所述模型进行预测。
优选的,所述步骤S1:对训练样本进行打标签,包括:
通过所述下标索引对表示一对有关系的目标和情感描述词;
通过所述BIO标注方式目标,描述词及对应的情感。
优选的,所述步骤S2:编码并取得文本的向量表示,包括:
通过所述预训练模型对训练文本进行编码,得到文本的向量表示。
优选的,所述步骤S4:获取注意力矩阵,包括:
得到所述文本向量分别通过实体预测模块和关系预测模块;
分别获得所述实体的转移矩阵和实体间的注意力矩阵。
优选的,所述步骤S5:解码实体获取分数,包括:
通过所述CRF算法对实体的转移矩阵进行解码得到实体;
通过所述token将注意力进行平均得到实体间的分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆旅游云信息科技有限公司,未经重庆旅游云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211168190.9/2.html,转载请声明来源钻瓜专利网。