[发明专利]文本生成方法、文本生成装置及计算机可读存储介质在审
申请号: | 202011027336.9 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112036155A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张嘉益;崔志 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06F40/35;G06N3/08;G06N20/00 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贾会玲 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 生成 方法 装置 计算机 可读 存储 介质 | ||
本公开涉及一种文本生成方法、文本生成装置及计算机可读存储介质。方法包括:获取目标文本;确定所述目标文本中待插入修辞文本的目标位置;根据处于所述目标位置的预设范围内的文本的语义,生成所述修辞文本;将所述修辞文本插入至所述目标位置。如此,无需用户输入本体和喻体即可自动生成修辞文本,使得生成的修辞文本更加多样,提高了生成修辞文本的智能化程度。并且,在生成修辞文本时参考了处于目标位置的预设范围内的文本的语义,使得生成的修辞文本的语义与目标位置的预设范围内的文本的语义较为匹配,提高了对目标文本修饰的准确度,从而提高了修饰后的文本的信息量。
技术领域
本公开涉及计算机技术领域,尤其涉及一种文本生成方法、文本生成装置及计算机可读存储介质。
背景技术
随着科学技术的飞速发展,大量先进技术不断涌现,自然语言处理技术即为其中一个重要的技术。在自然语言处理技术的广泛应用中,自动生成文本成为一个研究的热点问题。文本生成在人工智能、神经网络的发展下有了长足的进展,如自动摘要生成、自动标题生成、AI写诗、人机对话、文本风格转换、故事生成等等。而对于人类语言写作技巧的自动化使用却少有研究或产品涉及。
在相关技术中,在学界中围绕故事生成(story generation)的任务,有着许多相关研究。其中,故事生成即是使用encoder-decoder框架模型,给定一段文本作为开头输入模型,模型就会继续生成一段合适的故事展开文本或结尾文本。其中,模型在生成故事展开文本或结尾文本时刻结合相应情感、主人公设定、指示图谱作为额外输入,增强辅助故事生成的结果。
上述用于故事生成的模型或多或少会生成一些包含有修饰性语句的句子,但是其缺点很明显:在于端到端生成,对于使用什么样的修辞写作手法,完全不可控。另外,现有的端到端方法生成比喻的技术,输入必须为一对比喻的本体和喻体,模型才能针对性生成相应的比喻文本。换言之,该技术仅限于给定本体和喻体的比喻文本的生成。并且,利用该技术生成比喻文本时并不参考上下文语义,无法保证所生成的文本忠于原文。
发明内容
为克服相关技术中存在的问题,本公开提供一种文本生成方法、文本生成装置及计算机可读存储介质。
根据本公开实施例的第一方面,提供一种文本生成方法,包括:
获取目标文本;
确定所述目标文本中待插入修辞文本的目标位置;
根据处于所述目标位置的预设范围内的文本的语义,生成所述修辞文本;
将所述修辞文本插入至所述目标位置。
可选地,所述确定所述目标文本中待插入修辞文本的目标位置,包括:
对所述目标文本进行分词处理,得到所述目标文本的分词结果,其中,所述分词结果包括各分词以及分词所在的位置;
将所述分词结果输入至修饰概率预测模型,得到所述修饰概率预测模型输出的各位置对应的修饰概率,其中,位置对应的修饰概率用于表征在所述位置处插入待生成的所述修辞文本的概率;
将最大修饰概率对应的位置确定为所述目标位置。
可选地,所述根据处于所述目标位置的预设范围内的文本的语义,生成所述修辞文本,包括:
根据处于所述目标位置的预设范围内的文本的语义,确定所述目标位置对应的语义向量;
根据所述语义向量生成所述修辞文本。
可选地,所述根据所述语义向量生成所述修辞文本,包括:
将所述语义向量输入至文本生成模型中,得到所述文本生成模型输出的所述修辞文本。
可选地,所述文本生成模型包括修辞类型生成子模型和修辞文本生成子模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011027336.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型多种阀门同时控制装置
- 下一篇:文本对话方法、装置及存储介质