[发明专利]文本生成方法和装置、电子设备以及计算机可读存储介质在审
申请号: | 201911090358.7 | 申请日: | 2019-11-08 |
公开(公告)号: | CN112783334A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 赵露君;孙常龙;刘晓钟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F3/0484;G06F40/289;G06F40/216;G06F40/126 |
代理公司: | 北京市惠诚律师事务所 11353 | 代理人: | 杨雪婷 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 生成 方法 装置 电子设备 以及 计算机 可读 存储 介质 | ||
本申请公开了一种文本生成方法和装置、电子设备以及计算机可读存储介质。方法包括:生成包含时间信息的多个第一状态向量;对第一状态向量进行解码生成多个第二分词以及与第二分词中的每一个分别对应的多个第二状态向量,对第一状态向量进行解码处理生成多个第二分词的步骤包括:根据多个第二状态向量中的每一个和与其对应的第二分词计算多个第一分词和多个第二分词中的至少一个相对于第二分词所对应的时间信息的复制概率;根据复制概率选择第一分词和第二分词中的至少一个作为与时间信息对应的复制分词。因此,实现了在基于获取的分词生成文本段之外还能够在适当的时机执行文本复制来生成重复的内容部分,更加适合于在歌词生成的场景下使用。
技术领域
本发明涉及文本生成领域,尤其涉及一种文本生成方法和装置、电子设备以及计算机可读存储介质。
背景技术
例如歌词以及诗歌等生成是通过基于用户给定的多个关键字生成相关词语以填充成句子来实现歌词创作。现有技术中,由于歌词以及诗歌等本身是文本类型,因此,通常采用文本生成技术来生成歌词。但是文本生成通常只能基于给定关键字生成新的词汇,在应用于歌词以及诗歌等生成的场景时,不能够满足歌词以及诗歌等所具有的部分重复的特征。换言之,歌词以及诗歌等由于其应用于歌唱的特点而具有部分内容需要反复重复的特征。因此,需要一种改进的文本生成技术,其能够适合于生成具有部分内容重复出现的文本,以更适合于例如歌词、诗歌等等的生成的场景。
发明内容
提供本发明实施例内容是为了以精简的形式介绍将在以下详细描述中进一步描述的一些概念。本发明内容并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。
本发明实施例提供了一种文本生成方法和装置、电子设备以及计算机可读存储介质,从而能够在现有的基于关键字的文本生成方案的基础上进一步实现生成具有部分内容重复出现的文本,从而更适合于例如歌词以及诗歌等生成的场景的使用。
为达到上述目的,本发明实施例提供了一种文本生成方法,其特征在于,包括:
从用户获取多个第一分词;
对所述多个第一分词进行编码处理,以生成包含有时间信息的多个第一状态向量;
对所述多个第一状态向量进行解码处理,以生成多个第二分词,其中,所述多个第二分词中的每一个第二分词是根据所述多个第一状态向量中的至少一个以及所述多个第二分词中的至少一个生成的;
输出所述多个第二分词;
从用户接收至少一个针对所输出的所述多个第二分词中的至少一个的指令;
根据所述至少一个指令修改所述多个第二分词中的至少一个,
其中,所述第二分词中包括至少一个与所述第一分词和所述第二分词中的至少一个相同的分词。
根据本申请实施例,还提供了一种文本生成方法,包括:
获取多个第一分词,并生成多个第一词嵌入向量;
对所述多个第一词嵌入向量进行编码处理,以生成包含有时间信息的多个第一状态向量;
对所述多个第一状态向量进行解码处理,以生成多个第二分词以及与多个第二分词中的每一个分别对应的多个第二状态向量,其中,所述多个第二分词中的每一个第二分词是根据所述多个第一状态向量中的至少一个以及所述多个第二分词中的至少一个生成的,
其中,所述对所述多个第一状态向量进行解码处理以生成多个第二分词的步骤包括:
根据所述多个第二状态向量中的每一个第二状态向量和与其对应的第二分词,计算所述多个第一分词和所述多个第二分词中的至少一个相对于所述第二分词所对应的时间信息的复制概率;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911090358.7/2.html,转载请声明来源钻瓜专利网。