[发明专利]一种文案生成方法、装置、电子设备和存储介质在审
申请号: | 202011219419.8 | 申请日: | 2020-11-04 |
公开(公告)号: | CN112434493A | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 徐亮;王欣;赫阳 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/126;G06F16/35;G06Q30/06 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;张颖玲 |
地址: | 100176 北京市大兴区经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文案 生成 方法 装置 电子设备 存储 介质 | ||
1.一种文案生成方法,其特征在于,所述方法包括:
获取商品的第一属性数据;
基于预先训练的第一文案生成模型,确定所述商品的第一关键属性数据;所述第一关键属性数据表示第一属性数据中的部分属性数据;
根据所述第一关键属性数据,得到所述商品的第一候选文案集;所述第一候选文案集表示至少一个商品文案的集合;
按照质量判定规则对所述候选文案数据进行筛选,确定目标商品文案;所述候选文案数据包括所述第一候选文案集中的商品文案。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一关键属性数据,得到所述商品的第一候选文案集,包括:
根据所述第一关键属性数据,逐句生成针对所述第一关键属性数据的文案描述;所述每个第一关键属性数据对应至少一句文案描述;
将所述每个第一关键属性数据对应的文案描述进行拼接,生成至少一个商品文案;
基于所述至少一个商品文案,得到所述商品的第一候选文案集。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个商品文案,得到所述商品的第一候选文案集,包括:
对所述每个商品文案的重复度和/或一致性进行判断,得到判断结果;所述重复度表示所述每个商品文案中不同文案描述之间的重复程度;所述一致性表示所述每个商品文案的属性数据与所述第一属性数据之间的一致程度;
根据所述判断结果,得到所述商品的第一候选文案集。
4.根据权利要求1所述的方法,其特征在于,所述第一文案生成模型是通过以下步骤训练得到的:
获取商品的历史文案以及第二属性数据;
将所述第二属性数据与所述历史文案进行匹配,得到第二关键属性数据;
将所述历史文案、所述第二属性数据以及所述第二关键属性数据作为训练数据;
通过所述训练数据训练所述第一文案生成模型,得到训练完成的所述第一文案生成模型。
5.根据权利要求4所述的方法,其特征在于,所述第一文案生成模型包括:第一解码器和第二解码器,所述第一解码器用于对所述第二属性数据进行解码,得到所述第二关键属性数据;所述第二解码器用于生成所述第二关键属性数据对应的文案描述。
6.根据权利要求5所述的方法,其特征在于,所述通过所述训练数据训练所述第一文案生成模型,得到训练完成的所述第一文案生成模型,包括:
使用双注意力机制对所述第一解码器的网络参数进行调整,并使用覆盖机制对所述第二解码器的网络参数进行调整,得到训练完成的所述第一文案生成模型。
7.根据权利要求1所述的方法,其特征在于,所述按照质量判定规则对所述候选文案数据进行筛选,包括:
在获取商品的第一属性数据后,将所述第一属性数据输入到至少两种文案生成模型中,得到所述商品的第二候选文案集;所述至少两种文案生成模型包括所述第一文案生成模型;
按照质量判定规则对所述候选文案数据进行筛选;所述候选文案数据包括所述第二候选文案集中的商品文案。
8.根据权利要求1或7所述的方法,其特征在于,所述质量判定规则包括以下至少之一:
基于重复度对所述商品文案的质量进行筛选;所述重复度表示所述每个商品文案中不同文案描述之间的重复程度;
基于一致性对所述商品文案的质量进行筛选;所述一致性表示所述每个商品文案的属性数据与所述第一属性数据之间的一致程度;
基于困惑度对所述商品文案的质量进行筛选;所述困惑度表示所述每个商品文案中文案描述的清晰程度;
基于属性覆盖度对所述商品文案的质量进行筛选;所述属性覆盖度表示所述第一属性数据在每个商品文案中的覆盖程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011219419.8/1.html,转载请声明来源钻瓜专利网。