[发明专利]文本生成方法、装置、设备及计算机可读存储介质在审
申请号: | 202110263667.0 | 申请日: | 2021-03-10 |
公开(公告)号: | CN112926329A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 屠雅丽;张奇;李明翔;姚佳城;周琳 | 申请(专利权)人: | 招商银行股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/205;G06N3/08;G06N3/04 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 刘瑞花 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 生成 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明公开了一种文本生成方法,所述文本生成方法包括:获取待生成文本的属性值,并对所述属性值进行表征得到第一隐向量和上下文向量;基于所述第一隐向量及所述上下文向量确定文本生成计划;获取所述文本生成计划对应的潜变量,并基于所述潜变量及所述文本生成计划生成所述待生成文本。本发明还公开了一种文本生成装置、一种文本生成设备及一种计算机可读存储介质。本发明提高了文本生成的多样性、准确性及适用性。
技术领域
本发明涉及文本处理技术领域,尤其涉及一种文本生成方法、装置、设备及计算机可读存储介质。
背景技术
随着科技的迅速发展,越来越多的技术应用在文本处理领域。尤其对于文案的文本生成方法在各个领域具有广泛的应用。例如,营销文案、广告文案、邮件文案、回复文案等。目前,虽然有许多先进语言模型应用于NLG(Neuro-Linguistic Programming,神经语言程序学)领域,但是NLG领域还处于弱人工智能阶段,没有一个通用模型可以满足所有的应用场景。例如,对于风控至上的银行业,对算法效果的要求尤为严苛,而当前多数文本生成技术大多只应用于互联网电商或资讯等场景,并无法适配于银行营销场景。因此,需要提高文本生成方法的适配性,以满足银行营销等各种场景。
首先,参阅申请号为CN201910499958.2的技术方案,其获取待生成的目标文案的关键词和业务属性;从预先确定的文案片段库中搜索与所述关键词和业务属性对应的多个目标片段;对所述多个目标片段进行组合,得到多个上下句对;基于预先训练得到的上下句搭配度模型,确定所述多个上下句对中的候选句对,所述候选句对用于生成所述目标文案。由此可知,根据对目标片段进行组合得到多个上下句对的生成方法,对文本的采样方式较为单一,生成的文案表达丰富性不够,如果是历史上未曾出现过上下片段表达的候选句对,也可能无法生成目标文案。
其次,参阅申请号为CN202010038172.3的技术方案,其获取初始文本数据;根据预置BERT语言模型,计算所述初始文本数据的变分自编码器的隐藏空间参数;以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据,以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据,采用时序性倒传递算法,修正训练长短期记忆网络LSTM解码器的权重,以训练所述LSTM解码器;以待测语句和目标控制条件为所述LSTM解码器的输入数据,生成所述待测语句的目标语句。由此可知,利用预置BERT语音模型抓取初始文本数据中的句子的语法特征和语义特征,并通过控制条件的方式生成待测语句的目标语句,这种方法首先需要有待测语句,但在某些应用场景中,例如,银行的营销活动文案中不具有这种待测语句和目标控制条件,因为并无法提高文本生成方法的适配性。
最后,参阅申请号为CN201710846808.5的技术方案,其获取待生成的文案的配置信息;将配置信息导入深度文案生成模型中,其中,深度文案生成模型利用在线样本文案训练得到;获取深度文案生成模型所输出的与目标文案对应的目标词序列,其中,目标文案的点击率大于等于第一预定阈值;根据目标词序列生成目标文案。由此可知,通过对不同的信息类别导入到不同的子神经网络模型中,以实现针对不同信息类别分别提取不同的文案特征,但未考虑增加训练数据采样的丰富度问题,表达的多样性极度依赖于提取不同的信息类别。其次获取与在线样本文案匹配的点击率大于预定阈值的标签文案的标签词序列方法,阈值的定义存在随机性,生成文案的质量难以保证。
综上所述,如何提高文本生成的适用性、如何提高文本生成的多样性以及如何提高文本生成的准确性,是目前亟需解决的问题。
发明内容
本发明的主要目的在于提供一种文本生成方法、装置、设备及计算机可读存储介质,旨在提高文本生成的多样性、准确性及适用性。
为实现上述目的,本发明提供一种文本生成方法,所述文本生成方法包括以下步骤:
获取待生成文本的属性值,并对所述属性值进行表征得到第一隐向量和上下文向量;
基于所述第一隐向量及所述上下文向量确定文本生成计划;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招商银行股份有限公司,未经招商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110263667.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗痛风的丸子
- 下一篇:一种带有监测与维护铲车铲臂系统的铲斗