[发明专利]文本生成方法、装置、终端和存储介质有效
申请号: | 201911204286.4 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110888970B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 王子璇;闫桂霞;王晓利 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/211 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 蔡艾莹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 生成 方法 装置 终端 存储 介质 | ||
本发明实施例公开了一种文本生成方法、装置、终端和存储介质;本发明实施例可以获取用户历史文本的候选句集合,候选句集合中包括多个候选句;对候选句集合中的候选句进行关联分析,得到候选句的频繁项集,频繁项集中包括多个频繁项;基于频繁项对候选句集合中的候选句进行聚类处理,得到候选句组;基于频繁项集在候选句组中确定代表句;生成目标文本,目标文本中包括代表句。本发明实施例可以利用用户历史文本确定中候选句的频繁项,并根据频繁项在聚类得到的候选句组中得确定该候选句组对应的代表句,从而生成目标文本。本方案实施例可以自动、高效地生成文本。由此,本方案实施例可以有效提升文本生成的效率。
技术领域
本发明涉及计算机领域,具体涉及一种文本生成方法、装置、终端和存储介质。
背景技术
近年来,随着计算机发展,人工问答可以由机器替代。目前出现了各种问答系统,用于给用户提供技术指导、申报反馈、搜索查询等服务,替代了传统的人工客服。比如,语音助手、人工智能客服、各种软件应用的问答中心(Frequently Asked Questions,FAQ)功能,等等。
问答系统的表达效果以及问答性能与其FAQ语料库中语料的准确度、丰富度息息相关,然而,撰写语料文本需要消耗大量的人力以及时间,因此,目前用于交互式问答的文本生成方法效率低下。
发明内容
本发明实施例提供一种文本生成方法、装置、终端和存储介质,可以提升文本生成的效率。
本发明实施例提供一种文本生成方法,包括:
获取用户历史文本的候选句集合,所述候选句集合中包括多个候选句;
对所述候选句集合中的候选句进行关联分析,得到所述候选句的频繁项集,所述频繁项集中包括多个频繁项;
基于所述频繁项对所述候选句集合中的候选句进行聚类处理,得到候选句组;
基于所述频繁项集在所述候选句组中确定代表句;
生成目标文本,所述目标文本中包括所述代表句。
本发明实施例还提供一种文本生成装置,包括:
获取单元,用于获取用户历史文本的候选句集合,所述候选句集合中包括多个候选句;
分析单元,用于对所述候选句集合中的候选句进行关联分析,得到所述候选句的频繁项集,所述频繁项集中包括多个频繁项;
聚类单元,用于基于所述频繁项对所述候选句集合中的候选句进行聚类处理,得到多个候选句组;
确定单元,用于基于所述频繁项集在所述候选句组中确定代表句;
生成单元,用于生成目标文本,所述目标文本中包括所述代表句。
本发明实施例还提供一种终端,包括存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本发明实施例所提供的任一种文本生成方法中的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种文本生成方法中的步骤。
本发明实施例可以获取用户历史文本的候选句集合,候选句集合中包括多个候选句;对候选句集合中的候选句进行关联分析,得到候选句的频繁项集,频繁项集中包括多个频繁项;基于频繁项对候选句集合中的候选句进行聚类处理,得到候选句组;基于频繁项集在候选句组中确定代表句;生成目标文本,目标文本中包括代表句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911204286.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:工作电路及其过流保护电路
- 下一篇:干扰测试方法、装置、终端及存储介质