[发明专利]文本生成模型的训练方法、装置和电子设备有效
申请号: | 202010408192.5 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111625645B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 周浩;孙驰;郝卓琳;王竞豪;李磊;杨建东;王奉坤 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F18/24;G06F18/214 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 安凯 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 生成 模型 训练 方法 装置 电子设备 | ||
本公开实施例公开了一种文本生成模型的训练方法、装置、电子设备和计算机可读存储介质。其中所述方法包括:根据第一训练数据集和第一损失函数对原始文本生成模型进行训练生成第一中间文本生成模型;根据第二训练数据集和第一加权损失函数对所述第一中间文本生成模型进行训练生成第二中间文本生成模型,其中第一加权损失函数由第一损失函数和第二损失函数组成;根据第三训练数据集和第二加权损失函数对所述第二中间文本生成模型进行训练生成所述文本生成模型,其中所述第二加权损失函数由第一损失函数、第二损失函数和第三损失函数组成。上述方法通过多个训练数据集以及损失函数对模型进行训练,解决了现有技术中生成的文本缺乏多样性的技术问题。
技术领域
本公开涉及文本生成领域,尤其涉及一种文本生成模型的训练方法、装置、电子设备及计算机可读存储介质。
背景技术
在互联网日益发达的今天,许多用户不管是通过电商网站或者线下门店购买商品都会首先面临商品的展示信息。所述商品的展示信息最先被展示的一般商品的标题。因此,对于商品的发布者来说,其需要在展示商品链接的时候,给商品的发布信息设置一个合适的标题,这样用户才能被吸引或者用户在搜索的时候更容易搜索到对应的商品。
在现有技术中,存在给商品发布者提供合适的标题的技术方案。商品的发布者可以输入几个商品的关键词,推荐系统会推荐出对应的标题;但是现有技术中的技术方案一般是设置有标题库,之后根据商品发布者输入的关键词做模式匹配,以匹配出与关键词最相关的标题。但是,标题库的容量是有限的,因此其推荐的标题缺乏多样性。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
为了解决现有技术中推荐的标题缺乏多样性问题,本公开实施例提出如下技术方案。
第一方面,本公开实施例提供一种文本生成模型的训练方法,包括:
根据第一训练数据集和第一损失函数对原始文本生成模型进行训练生成第一中间文本生成模型;
根据第二训练数据集和第一加权损失函数对所述第一中间文本生成模型进行训练生成第二中间文本生成模型,其中第一加权损失函数由第一损失函数和第二损失函数组成;
根据第三训练数据集和第二加权损失函数对所述第二中间文本生成模型进行训练生成所述文本生成模型,其中所述第二加权损失函数由第一损失函数、第二损失函数和第三损失函数组成。
第二方面,本公开实施例提供一种文本生成方法,包括:
获取查询语句;
将所述查询语句输入文本生成模型中得到所述查询语句所对应的文本标题;
其中,所述文本生成模型是根据第一方面所述的文本生成模型的训练方法所训练得到的模型。
第三方面,本公开实施例提供一种文本生成模型的训练装置,包括:
第一模型生成模块,用于根据第一训练数据集和第一损失函数对原始文本生成模型进行预训练生成第一中间文本生成模型;
第二模型生成模块,用于根据第二训练数据集和第一加权损失函数对所述第一中间文本生成模型进行训练生成第二中间文本生成模型,其中第一加权损失函数由第一损失函数和第二损失函数组成;
第三模型生成模块,用于根据第三训练数据集和第二加权损失函数对所述第二中间文本生成模型进行训练生成所述文本生成模型,其中所述第二加权损失函数由第一损失函数、第二损失函数和第三损失函数组成。
第四方面,本公开实施例提供一种文本生成装置,包括:
查询语句获取模块,用于获取查询语句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010408192.5/2.html,转载请声明来源钻瓜专利网。