[发明专利]文本转换模型训练方法、文本转换方法、装置及电子设备在审
申请号: | 202210261921.8 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114706942A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 乔宏利;王洪斌;蒋宁;吴海英 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06K9/62 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 苗燕 |
地址: | 404100 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 转换 模型 训练 方法 装置 电子设备 | ||
1.一种文本转换模型训练方法,其特征在于,所述方法包括:
获取第一文本和第二文本,其中,所述第一文本和所述第二文本具有相同的语义;
在所述第一文本中包括预设词语的情况下,从所述第二文本中确定与所述预设词语存在转换关系的转换词语;
基于所述预设词语和所述转换词语,从所述第一文本中确定待转换内容,并从所述第二文本中确定已转换内容;
将所述待转换内容和所述已转换内容作为训练数据对待训练模型进行训练,获得文本转换模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述预设词语和所述转换词语,从所述第一文本中确定待转换内容,并从所述第二文本中确定已转换内容,包括:
获取所述转换词语的词语数量;
基于所述预设词语、所述转换词语以及所述词语数量,从所述第一文本中确定待转换内容,并从所述第二文本中确定已转换内容。
3.根据权利要求2所述的方法,其特征在于,所述基于所述预设词语、所述转换词语以及所述词语数量,从所述第一文本中确定待转换内容,并从所述第二文本中确定已转换内容,包括:
若所述词语数量为一个,则从所述第一文本中确定所述预设词语作为所述待转换内容,并从所述第二文本中确定所述转换词语作为已转换内容;或者
若所述词语数量为至少两个,则从所述第一文本中确定所述预设词语以及所述预设词语的上下文中的目标文本内容作为所述待转换内容,并从所述第二文本中确定至少两个转换词语以及所述至少两个转换词语之间的文本内容作为所述已转换内容。
4.根据权利要求3所述的方法,其特征在于,所述从所述第一文本中确定所述预设词语以及所述预设词语的上下文中的目标文本内容作为所述待转换内容,并从所述第二文本中确定至少两个转换词语以及所述至少两个转换词语之间的文本内容作为所述已转换内容,包括:
获取所述至少两个转换词语之间的文本内容;
在所述第一文本中的所述预设词语的上下文中的目标文本内容与所述至少两个转换词语之间的文本内容匹配的情况下,将所述目标文本内容作为所述待转换内容,并从所述第二文本中确定至少两个转换词语以及所述至少两个转换词语之间的文本内容作为所述已转换内容。
5.根据权利要求1所述的方法,其特征在于,所述将所述待转换内容和所述已转换内容作为训练数据对待训练模型进行训练,获得文本转换模型,包括:
获取所述待转换内容对应的第一字符串长度,并获取所述已转换内容对应的第二字符串长度;
在所述第二字符串长度和所述第一字符串长度满足预设长度关系的情况下,将所述待转换内容和所述已转换内容作为训练数据对待训练模型进行训练,获得文本转换模型。
6.根据权利要求5所述的方法,其特征在于,所述获取所述待转换内容对应的第一字符串长度,并获取所述已转换内容对应的第二字符串长度,包括:
获取所述待转换内容中除所述预设词语和标点符号之外的的字串符的长度,作为所述第一字符串长度,并获取所述已转换内容中除所述转换词语和标点符号之外的字符串的长度,作为所述第二字符串长度。
7.根据权利要求5所述的方法,其特征在于,所述在所述第二字符串长度和所述第一字符串长度满足预设长度关系的情况下,将所述待转换内容和所述已转换内容作为训练数据对待训练模型进行训练,获得文本转换模型,包括:
根据所述第一字符串长度和所述第二字符串长度,获得冗余比率;
在所述冗余比率大于比率阈值的情况下,将所述待转换内容和所述已转换内容作为训练数据对待训练模型进行训练,获得文本转换模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一字符串长度和所述第二字符串长度,获得冗余比率,包括:
基于R=(L2-L1)/L1对所述第一字符串长度和所述第二字符串长度进行计算,获得冗余比率,其中,R表征冗余比率,L1表征第一字符串长度,L2表征第二字符串长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210261921.8/1.html,转载请声明来源钻瓜专利网。