[发明专利]诗词生成方法、装置、电子设备及存储介质在审
申请号: | 202010821155.7 | 申请日: | 2020-08-14 |
公开(公告)号: | CN112052651A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 叶诚 | 申请(专利权)人: | 深圳市欢太科技有限公司;OPPO广东移动通信有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/237 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518057 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 诗词 生成 方法 装置 电子设备 存储 介质 | ||
1.一种诗词生成方法,其特征在于,包括:
基于待生成诗句的第一字符长度和首字符,通过设定模型生成对应的诗句;其中,所述设定模型用于输出至少一个候选字符中的每个候选字符邻接在输入字符之后的概率;
在通过所述设定模型生成对应的诗句时,所述方法包括:
在第一字符的字符数量小于所述第一字符长度的情况下,通过所述设定模型生成位于第二字符之后的字符;所述第一字符表征所述待生成诗句中已经生成的字符;所述第二字符表征最后一个生成的第一字符;
在第一字符的字符数量等于所述第一字符长度的情况下,基于已经生成的第一字符输出对应的诗句。
2.根据权利要求1所述的诗词生成方法,其特征在于,所述通过所述设定模型生成位于第二字符之后的字符,包括:
将第二字符输入所述设定模型,得到第二字符的至少一个候选字符;
在第一字符的字符数量小于第二字符长度的情况下,对第二字符的至少一个候选字符执行第一操作;
在第一字符的字符数量大于或等于所述第二字符长度的情况下,对第二字符的至少一个候选字符执行第二操作;其中,
所述第二字符长度小于所述第一字符长度。
3.根据权利要求2所述的诗词生成方法,其特征在于,所述对第二字符的至少一个候选字符执行第一操作,包括:
基于每个候选字符对应的概率,在第二字符的至少一个候选字符中确定第三字符;其中,
所述第三字符为所述待生成诗句中邻接在第二字符之后的字符。
4.根据权利要求2所述的诗词生成方法,其特征在于,所述对第二字符的至少一个候选字符执行第二操作,包括:
确定第二字符对应的至少一组候选字符串;其中,基于第三字符长度和第二字符的至少一个候选字符中的每个候选字符,通过所述设定模型生成所述至少一组候选字符串中的一组候选字符串;所述第三字符长度为所述第一字符长度与所述第二字符长度的差值;
基于每组候选字符串对应的概率和,在所述至少一组候选字符串中确定第一候选字符串;所述概率和基于候选字符串中的每个字符对应的由所述设定模型输出的概率计算得到;其中,
所述第一候选字符串为所述待生成诗句中邻接在第二字符之后的字符串。
5.根据权利要求1所述的诗词生成方法,其特征在于,所述首字符为语气词,在通过所述设定模型生成对应的诗句时,所述方法还包括:
根据第一设定字典,确定第一频率;所述第一设定字典用于记录设定诗词库中每个诗句的首字在所有诗句中的出现频率;所述第一频率表征所述首字符在所述第一设定字典中对应的出现频率;
在所述第一频率大于第一设定值时,通过所述设定模型生成邻接在所述首字符之后的字符;
在所述第一频率小于或等于所述第一设定值时,通过设定算法生成邻接在所述首字符之后的字符。
6.根据权利要求5所述的诗词生成方法,其特征在于,所述通过设定算法生成邻接在所述首字符之后的字符,包括:
在所述第一频率大于第二设定值,且第二设定字典中存在第一词语的情况下,基于所述第一词语确定邻接在所述首字符之后的字符;所述第二设定字典用于记录设定诗词库中每个诗句的分词;所述第一词语为以所述首字符为前缀的词语;
在所述第一频率大于所述第二设定值,所述第二设定字典中不存在所述第一词语且第三设定字典中存在第二词语的情况下,基于所述第二词语确定邻接在所述首字符之后的字符;所述第三设定字典用于记录设定诗词库的每个诗句中相邻两个字符组成的词语;所述第二词语为包含所述首字符的词语;其中,
所述第一设定值大于所述第二设定值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市欢太科技有限公司;OPPO广东移动通信有限公司,未经深圳市欢太科技有限公司;OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010821155.7/1.html,转载请声明来源钻瓜专利网。