[发明专利]一种文本的生成方法及相关设备在审
申请号: | 201910409516.4 | 申请日: | 2019-05-15 |
公开(公告)号: | CN110134960A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 王亮 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/22;G06F17/21 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 格式要求 目标编码 句子编码 目标序列 训练数据 预设 句子 编码生成 获取目标 目标模型 语料库 输出 | ||
本发明实施例公开了一种文本的生成方法及相关设备,可以生成满足特定格式要求的文本。本发明实施例方法包括:获取目标编码,所述目标编码为待生成满足特殊格式要求的文本的首句编码;将所述目标编码输入预设模型,以输出所述目标编码对应的目标序列编码,所述预设模型为通过目标模型对训练数据进行训练得到的,所述训练数据包括语料库中满足所述特殊格式要求的每个文本以及所述每个文本中句子的句子编码,所述每个文本中句子的句子编码符合所述特殊格式要求;根据所述目标序列编码生成所述满足特殊格式要求的文本。
技术领域
本发明涉及自然语言处理领域,特别涉及一种文本的生成方法及相关设备。
背景技术
随着NLP(Natural Language Processing,自然语言处理)技术的发展,AI(Artificial Intelligence,人工智能)写诗,AI商品简介,AI自动歌词等文本生成应用已经开始出现在各大网站平台。AI文本生成能有效的节省人力成本,满足海量数据的实时生成要求,并且结果多样,能实现个性化私人订制,因而具有巨大的应用潜力。
现有的通过“在生成当前句文本的同时,也预测下一句话的关键词”的方法,生成关键词序列,以保持单句与单句之间的逻辑连贯性。
生成的单句与单句之间虽然逻辑连贯,却不满足特定格式文本的一些具体要求。如诗歌、歌词通常要求偶数句之间押韵;歌词甚至有长度要求,以符合特定的节奏韵律。
发明内容
本发明实施例提供了一种文本的生成方法及相关设备,用于生成满足单句之间逻辑连贯之外也能满足特定格式要求的文本。
本发明实施例第一方面提供了一种文本的生成方法,包括:
获取目标编码,所述目标编码为待生成满足特殊格式要求的文本的首句编码;
将所述目标编码输入预设模型,以输出所述目标编码对应的目标序列编码,所述预设模型为通过目标模型对训练数据进行训练得到的,所述训练数据包括语料库中满足所述特殊格式要求的每个文本以及所述每个文本中句子的句子编码,所述每个文本中句子的句子编码符合所述特殊格式要求;
根据所述目标序列编码生成所述满足特殊格式要求的文本。
可选地,所述目标模型为循环神经网络模型,所述将目标编码输入预设模型,以输出所述目标编码对应的目标序列编码之前,所述方法还包括:
获取所述每个文本;
根据所述特殊格式要求对所述每个文本中的句子分别进行编码,以得到所述每个文本中句子的句子编码;
基于所述每个文本中句子的句子编码对所述循环神经网络模型的模型参数进行迭代更新;
当达到预置的迭代终止条件,将达到所述预置的迭代终止条件时的所述循环神经网络模型确定为所述预设模型。
可选地,所述特殊格式要求包括韵脚要求、节奏要求和/或内容要求,所述根据所述特殊格式要求对所述每个文本中的句子分别进行编码,以得到所述每个文本中句子的句子编码包括:
基于所述每个文本中的句子的最后一个字的韵母对所述每个文本中的句子进行韵脚编码,得到所述每个文本中句子的韵脚编码,所述韵脚编码与所述韵脚要求相对应;
和/或,
基于所述每个文本中的句子的目标词语对所述每个文本中的句子进行语义编码,得到所述每个文本中句子的内容编码,所述内容编码与所述内容要求相对应;
和/或,
基于所述每个文本中的句子的句子长度对所述每个文本中的句子进行节奏编码得到所述每个文本中句子的节奏编码,所述节奏编码与所述节奏要求相对应;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910409516.4/2.html,转载请声明来源钻瓜专利网。