[发明专利]文本增量方法、装置及终端设备在审
申请号: | 202010019294.8 | 申请日: | 2020-01-08 |
公开(公告)号: | CN111241815A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 王健宗;于凤英;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F16/332;G06F40/58 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 叶思 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 增量 方法 装置 终端设备 | ||
本申请适用于自然语言处理技术领域,提供了一种文本增量方法,包括:获取待增量文本;对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵;确定所述待增量文本的文本主题;将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所述待增量文本的增量文本。本申请提高了增量文本与待增量文本的相关度,从而大大提高了生成文本的准确度。
技术领域
本申请属于自然语言处理技术领域,尤其涉及一种文本增量方法、装置、终端设备及计算机可读存储介质。
背景技术
当前,在诸如问答系统、机器翻译等很多人工智能领域,都有根据原始文本数据生成其他文本数据的需求。例如人机问答系统中,当用户询问机器人时,机器人的回答需与用户的问题相关,也就是说,要求机器人生成的回答文本数据与用户询问的文本数据之间相关联。
但是传统的文本生成模型面临的挑战是,生成的文本随机性过强,因此,亟需提供一种新的文本增量方案。
发明内容
本申请实施例提供了一种文本增量方法、装置、终端设备及计算机可读存储介质,提供了一种新的文本增量方案,提高了增量文本与待增量文本的相关度。
第一方面,本申请实施例提供了一种文本增量方法,包括:
获取待增量文本;
对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵;
确定所述待增量文本的文本主题;
将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所述待增量文本的增量文本。
第二方面,本申请实施例提供了一种文本增量装置,包括:
获取模块,用于获取待增量文本;
提取模块,用于对所述待增量文本进行特征提取,获得所述待增量文本对应的特征矩阵;
确定模块,用于确定所述待增量文本的文本主题;
增量模块,用于将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所述待增量文本的增量文本。
第三方面,本申请实施例提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的文本增量方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的文本增量方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行如第一方面所述的文本增量方法。
在本申请实施例中,通过先提取待增量文本的特征矩阵,确定待增量文本的文本主题,再结合与文本主题对应的VAE生成增量文本。一方面,利用与文本主题对应的VAE生成增量文本,不同的主题设置一个不同的VAE;另一方面,由于VAE计算出的分布依赖于输入的变量,所有对这个分布的采样都会生成与输入相似或相关的输出,其本身可以帮助生成文本时实现确定性,因而通过这两方面的双重作用就避免了生成文本时的完全随机性,提高了增量文本与待增量文本的相关度,从而可以大幅提升文本生成的质量。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的文本增量方法所适用于的手机的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010019294.8/2.html,转载请声明来源钻瓜专利网。