[发明专利]诗歌生成方法、装置、计算机设备和介质有效
申请号: | 201811284565.1 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109582952B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 李俊涛;宋彦;张海松;史树明;严睿 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;北京大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 诗歌 生成 方法 装置 计算机 设备 介质 | ||
1.一种诗歌生成方法,其特征在于,包括:
通过条件变分自编码器CVAE,对诗歌描述文本样本进行解析获得结果诗句以及解码评价,所述解码评价表征结果诗句与设置的目标诗句之间的差异性;
通过辨别器确定所述诗歌描述文本样本与所述结果诗句之间的第一相似性,以及确定所述诗歌描述文本样本与所述目标诗句之间的第二相似性,并根据所述第一相似性和所述第二相似性,确定解析评价,所述解析评价表征诗句与诗歌描述文本样本之间的差异性;
根据所述解码评价和所述解析评价对诗歌生成模型进行优化,获得已训练的诗歌生成模型;
采用所述已训练的诗歌生成模型,执行如下过程以生成相应的诗歌:
对诗歌描述文本进行解析,获得文本特征向量;
至少根据所述诗歌描述文本的文本特征向量获得第一诗句,以及获得第一诗句的诗句特征向量;
根据所述诗歌描述文本的文本特征向量以及所述第一诗句的诗句特征向量,确定上下文向量;
根据所述上下文向量获得先验分布,获得诗句隐变量向量;
根据所述诗句隐变量向量和所述上下文向量,生成第二诗句。
2.如权利要求1所述的方法,其特征在于,对诗歌描述文本样本进行解析获得结果诗句,包括:
根据所述诗歌描述文本样本获得初始诗句,并根据所述诗歌描述文本样本和所述初始诗句获得上下文向量,以及根据所述上下文向量获得诗句隐变量向量;
根据所述目标诗句和所述上下文向量获得目标隐变量向量;
根据所述诗句隐变量向量、所述目标隐变量向量以及所述上下文向量,获得结果诗句。
3.如权利要求2所述的方法,其特征在于,确定所述解码评价包括:
获取根据所述上下文向量确定的先验分布,以及根据所述目标诗句和所述上下文向量获得的后验分布;
确定所述先验分布和所述后验分布之间的信息增益KL散度;
确定在所述后验分布条件下所述先验分布的重构损失;
根据所述KL散度和所述重构损失,确定解码评价。
4.如权利要求1所述的方法,其特征在于,确定所述诗歌描述文本样本与所述第二诗句之间的第一相似性,包括:
对所述诗歌描述文本样本进行分词,获得各词向量;
根据所述诗句隐变量向量、所述目标隐变量向量以及所述上下文向量,获得所述结果诗句的各隐状态向量;
根据各词向量和所述第二诗句的各隐状态向量,获得解析矩阵;
对所述解析矩阵进行特征提取,并根据提取的特征确定第一相似性。
5.如权利要求1所述的方法,其特征在于,确定所述诗歌描述文本样本与所述目标诗句之间的第二相似性,包括:
对所述诗歌描述文本样本进行分词,获得各词向量;
根据所述目标隐变量向量,获得所述目标诗句的各隐状态向量;
根据各词向量和所述目标诗句的各隐状态向量,获得目标矩阵;
对所述目标矩阵进行特征提取,并根据提取的特征确定第二相似性。
6.如权利要求1所述的方法,其特征在于,根据所述第一相似性和所述第二相似性,确定解析评价,包括:
确定所述第一相似性的对数,获得第一对数;
确定指定值与所述第二相似性的差值的对数,获得第二对数;
根据所述第一对数和所述第二对数的加和,获得解析评价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;北京大学,未经腾讯科技(深圳)有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811284565.1/1.html,转载请声明来源钻瓜专利网。