[发明专利]诗词生成方法、装置、电子设备及存储介质在审
申请号: | 202010821155.7 | 申请日: | 2020-08-14 |
公开(公告)号: | CN112052651A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 叶诚 | 申请(专利权)人: | 深圳市欢太科技有限公司;OPPO广东移动通信有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/237 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518057 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 诗词 生成 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种诗词生成方法、装置、电子设备及存储介质。其中,方法包括:基于待生成诗句的第一字符长度和首字符,通过设定模型生成对应的诗句;其中,所述设定模型用于输出至少一个候选字符中的每个候选字符邻接在输入字符之后的概率;在通过所述设定模型生成对应的诗句时,所述方法包括:在第一字符的字符数量小于所述第一字符长度的情况下,通过所述设定模型生成位于第二字符之后的字符;所述第一字符表征所述待生成诗句中已经生成的字符;所述第二字符表征最后一个生成的第一字符;在第一字符的字符数量等于所述第一字符长度的情况下,基于已经生成的第一字符输出对应的诗句。
技术领域
本申请涉及自然语言技术领域,尤其涉及一种诗词生成方法、装置、电子设备及存储介质。
背景技术
相关技术在使用诗词生成模型生成的诗词时,需要耗费较长的时间,并且,生成的诗词的语义不连贯,导致诗词的质量不佳。
发明内容
有鉴于此,本申请实施例提供一种诗词生成方法、装置、电子设备及存储介质,以至少解决相关技术出现的诗词生成的时间过长且诗词的质量不佳的问题。
本申请实施例的技术方案是这样实现的:
本申请实施例提供了一种诗词生成方法,所述方法包括:
基于待生成诗句的第一字符长度和首字符,通过设定模型生成对应的诗句;其中,所述设定模型用于输出至少一个候选字符中的每个候选字符邻接在输入字符之后的概率;
在通过所述设定模型生成对应的诗句时,所述方法包括:
在第一字符的字符数量小于所述第一字符长度的情况下,通过所述设定模型生成位于第二字符之后的字符;所述第一字符表征所述待生成诗句中已经生成的字符;所述第二字符表征最后一个生成的第一字符;
在第一字符的字符数量等于所述第一字符长度的情况下,基于已经生成的第一字符输出对应的诗句。
上述方案中,所述通过所述设定模型生成位于第二字符之后的字符,包括:
将第二字符输入所述设定模型,得到第二字符的至少一个候选字符;
在第一字符的字符数量小于第二字符长度的情况下,对第二字符的至少一个候选字符执行第一操作;
在第一字符的字符数量大于或等于所述第二字符长度的情况下,对第二字符的至少一个候选字符执行第二操作;其中,
所述第二字符长度小于所述第一字符长度。
上述方案中,所述对第二字符的至少一个候选字符执行第一操作,包括:
基于每个候选字符对应的概率,在第二字符的至少一个候选字符中确定第三字符;其中,
所述第三字符为所述待生成诗句中邻接在第二字符之后的字符。
上述方案中,所述对第二字符的至少一个候选字符执行第二操作,包括:
确定第二字符对应的至少一组候选字符串;其中,基于第三字符长度和第二字符的至少一个候选字符中的每个候选字符,通过所述设定模型生成所述至少一组候选字符串中的一组候选字符串;所述第三字符长度为所述第一字符长度与所述第二字符长度的差值;
基于每组候选字符串对应的概率和,在所述至少一组候选字符串中确定第一候选字符串;所述概率和基于候选字符串中的每个字符对应的由所述设定模型输出的概率计算得到;其中,
所述第一候选字符串为所述待生成诗句中邻接在第二字符之后的字符串。
上述方案中,所述首字符为语气词,在通过所述设定模型生成对应的诗句时,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市欢太科技有限公司;OPPO广东移动通信有限公司,未经深圳市欢太科技有限公司;OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010821155.7/2.html,转载请声明来源钻瓜专利网。