[发明专利]比喻句式判断模型的训练方法、装置、介质及设备有效
申请号: | 202110998207.2 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113806532B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 常永炷;毛晓曦;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F18/214;G06F18/21 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 徐世俊 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 比喻 句式 判断 模型 训练 方法 装置 介质 设备 | ||
本申请实施例提供一种比喻句式判断模型的训练方法、装置、存储介质及终端设备,该方法包括:通过预训练的比喻句式判断模型判断输入语句是否为比喻句式,得到输入语句的第一判断结果;当第一判断结果指示输入语句是比喻句式时,对输入语句基于比喻句式构建规则进行数据增强处理,得到扩充语句;通过比喻句式判断模型判断扩充语句是否为比喻句式,得到扩充语句的第二判断结果;基于第二判断结果对扩充语句设置标签,将设置标签的扩充语句作为比喻句式判断模型新增的训练样本,以迭代训练比喻句式判断模型。本申请实施例能够训练出一种比喻句式判断模型具备自动识别输入语句是否为比喻句式的功能,且模型的鲁棒性和准确性更强。
技术领域
本申请涉及电子通信技术领域,尤其涉及一种比喻句式判断模型训练技术领域,特别涉及一种比喻句式判断模型的训练方法、装置、介质及设备。
背景技术
比喻句式在文学和诗歌中有着非常广泛的应用,可以激发读者的想象力,因此,如果能够从大数据中挖掘出比喻句式将具有一定的价值,例如给学生作文打分,挖掘文学作品中的比喻句式,尤其是一些优美的比喻句式。
目前,有基于神经网络模型设计的比喻句式检测系统,但是,在真实的应用场景中,经常会遇到训练样本不足的情况,但是训练模型又需要大量设置有标签的训练样本,为了解决该问题,通常会采用一种数据增强的方式来进行训练样本的扩充,提升训练样本的数量。但是现有的比喻句式检测系统中采用的数据增强方式有一定的概率改变原始数据的标签,导致数据增强的结果不一定是带有比较词的比喻句式或者不一定是按照正确比喻句式构建规则生成的比喻句式,导致现有比喻句式检测系统无法获取足够多的正样本数据,同样会影响比喻句式检测系统的检测准确性。
发明内容
本申请实施例提供一种比喻句式判断模型的训练方法、装置、介质及设备,能够一定程度上解决数据增强改变比喻句标签的问题,从而训练出一种鲁棒性和准确性更强的比喻句式判断模型。
本申请实施例一方面提供了一种比喻句式判断模型的训练方法,包括:
通过预训练的比喻句式判断模型判断输入语句是否为比喻句式,得到与所述输入语句对应的第一判断结果;
当所述第一判断结果指示所述输入语句是比喻句式时,对所述输入语句基于比喻句式构建规则进行数据增强处理,得到扩充语句;
通过所述比喻句式判断模型判断所述扩充语句是否为比喻句式,得到与所述扩充语句对应的第二判断结果;
基于所述第二判断结果对所述扩充语句设置标签,将所述设置标签的扩充语句作为所述比喻句式判断模型新增的训练样本,以迭代训练所述比喻句式判断模型。
在本申请实施例所述的比喻句式判断模型的训练方法中,在所述通过预训练的比喻句式判断模型判断输入语句是否为比喻句式,得到与所述输入语句对应的第一判断结果之前,所述方法还包括:
获取待训练的比喻句式判断模型初始的训练样本,所述训练样本包括设置有标签的语句,所述标签用于指示所述语句是否为比喻句式;
通过所述待训练的比喻句式判断模型对所述训练样本中的语句进行特征提取,得到与所述语句对应的文本特征向量;
通过所述待训练的比喻句式判断模型,基于所述文本特征向量判断所述训练样本中的语句是否为比喻句式,得到与所述语句对应的第三判断结果;
基于所述第三判断结果及所述训练样本的标签,调整所述待训练的比喻句式判断模型的参数,得到预训练的比喻句式判断模型。
在本申请实施例所述的比喻句式判断模型的训练方法中,所述基于所述第二判断结果对所述扩充语句设置标签,将所述设置标签的扩充语句作为所述比喻句式判断模型新增的训练样本,以迭代训练所述比喻句式判断模型,包括:
基于所述第二判断结果对所述扩充语句设置标签,将所述设置标签的扩充语句作为所述比喻句式判断模型新增的训练样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110998207.2/2.html,转载请声明来源钻瓜专利网。