[发明专利]识别文本中情感语句的方法、装置、电子设备及介质在审
申请号: | 202210051544.5 | 申请日: | 2022-01-17 |
公开(公告)号: | CN114547234A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 冯琰一;邹游;徐博诚;江廷雪 | 申请(专利权)人: | 特斯联科技集团有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/211;G06F40/216;G06F40/289;G06F40/247 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 李小朋 |
地址: | 101100 北京市通*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 文本 情感 语句 方法 装置 电子设备 介质 | ||
本申请公开了一种识别文本中情感语句的方法、装置、电子设备及介质。本申请中,可以获取包含至少一个待识别语句的待识别文本;将待识别文本输入至预训练完成的目标文本识别模型,得到每个待识别语句对应的情感标签;提取待识别文本中,情感标签达到预设条件的待识别语句。通过应用本申请的技术方案,可以通过预设的文字识别模型对文本中每个待识别语句分别进行情感指数的检测,并将其中情感指数满足预设条件的待识别语句确定为本次需要提取的可以代表用户真实情感的语句。进而避免了相关技术中存在的,采用基于情感词语集合的方式来对文本进行情感分析所面临的分析结果不准确的问题。现安全隐患的问题。
技术领域
本申请中涉及数据处理技术,尤其是一种识别文本中情感语句的方法、装置、电子设备及介质。
背景技术
随着互联网技术的发展,越来越多的企业发觉对文本进行情感识别是一项重要的工作,例如对用户作出的服务评价进行情感识别、对互联网文章进行情感识别与分类等,从而更好地了解用户的诉求、或者实现文本的精准定位与推荐等有益效果。
相关技术中,通常采用基于情感词语集合的方式来对文本进行情感分析。这也需要预先构建出较为完善的情感词语集合,该情感词语集合中即包含大量情感词,比如,喜欢、热爱、讨厌、厌恶等等。在进行文本情感分析时,计算机根据该情感词语集合识别文本中包含的情感词,并对识别出的情感词进行统计,从而根据统计结果确定文本所表达的情感。
然而,通过上述方法得到的文本情感分析结果较为单一,无法充分反映出用户的真实情感。
发明内容
本申请实施例提供一种识别文本中情感语句的方法、装置、电子设备及介质。用以解决相关技术中存在的,采用基于情感词语集合的方式来对文本进行情感分析所面临的分析结果不准确的问题。
其中,根据本申请实施例的一个方面,提供的一种识别文本中情感语句的方法,包括:
获取包含至少一个待识别语句的待识别文本;
将所述待识别文本输入至预训练完成的目标文本识别模型,得到每个待识别语句对应的情感标签,所述文本识别模型用于确定所述待识别语句所表征的情感状态;
提取所述待识别文本中,情感标签达到预设条件的待识别语句。
可选地,在基于本申请上述方法的另一个实施例中,在所述获取包含至少一个待识别语句的待识别文本之前,还包括:
获取初始文本识别模型,以及初始样本数据集;
利用所述初始样本数据集对所述初始文本识别模型进行训练,得到第一文本识别模型;
利用所述第一文本识别模型,得到所述目标文本识别模型。
可选地,在基于本申请上述方法的另一个实施例中,所述利用所述第一文本识别模型,得到所述目标文本识别模型,包括:
对所述初始样本数据集进行数据增强处理,得到目标样本数据集;
对所述目标样本数据集包含的每个样本语句标注对应的情感类型以及对应的情感级别,其中不同的情感级别用于反映不同的情感强烈程度;
利用所述目标样本数据集对所述第一文本识别模型进行训练,得到所述目标文本识别模型。
可选地,在基于本申请上述方法的另一个实施例中,利用以下损失函数训练得到所述目标文本识别模型:
其中,qM代表模型输出概率,x代表所述样本识别语句,n∈{0,1}。
可选地,在基于本申请上述方法的另一个实施例中,所述对所述初始样本数据集进行数据增强处理,得到目标样本数据集,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯联科技集团有限公司,未经特斯联科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210051544.5/2.html,转载请声明来源钻瓜专利网。