[发明专利]一种限定采样文本序列生成方法及其系统有效
申请号: | 201911200838.4 | 申请日: | 2019-11-29 |
公开(公告)号: | CN111027292B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 杨杨;丹晓东;房超;喻鹏;徐思雅;邵苏杰;郭少勇;陶卓;董婧;王建鑫;刘祖龙 | 申请(专利权)人: | 北京邮电大学;北京智芯微电子科技有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/242;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 限定 采样 文本 序列 生成 方法 及其 系统 | ||
本发明实施例提供的限定采样文本序列生成方法及系统,该方法包括:将初始文本序列输入对抗网络模型,获取预输出文本序列的第一个词;基于词表掩模的方法,利用生成器根据第一个词,从字典数据库中选取第一个词的下一个词,构成预输出文本序列;基于词表掩模的方法,根据预输出文本序列,继续选取预输出文本序列的下一个词,获取新的预输出文本序列,直至总词数达到设定阈值,将其输入至判别器进行判别,并根据分类判别结果计算更新梯度;更新生成器的参数,并再次输入初始文本序列至更新后的生成器中;直至生成器和判别器均收敛后,输出目标文本序列。本实施例提供的方法及系统,通过改进制定文本规则精简了采样空间,改善了生成文本质量。
技术领域
本发明涉及计算机技术领域,尤其涉及一种限定采样文本序列生成方法及其系统。
背景技术
近年来,随着人工智能的不断发展,自然语言处理也受到了广泛关注。其中,文本生成作为自然语言处理领域中长期研究的课题之一,被应用于多种技术,如机器翻译、文本摘要、自动问答、智能客服等。文本生成旨在于连续的具体语境下,预测生成语法和语义正确的单词序列,是交互式人工智能系统不可或缺的组成部分。
目前,已有许多学者在在文本生成上取得了非凡的成就。在实现文本生成任务时,我们常采用前馈神经网络和循环神经网络。然而,基本的循环神经网络往往会对训练数据的分布过分依赖,而若采用人工模板提高文本生成的质量,则其通用性和扩展性都会大大降低。目前,完全基于数据科学的文本生成方法还没能取得令人满意的成果。
例如,现有技术中存在的一种应用于终端设备发布社交消息的场景中的文本生成方法及终端设备,通过对目标图像进行识别,得到该目标图像的内容信息;根据用户的用词习惯,生成与该内容信息对应的文本信息。该方法及装置主要用于解决用户为待发布的图像添加一段描述性的文本信息,导致发布消息的过程耗时较长的问题。
上述方案存在如下缺陷:该方案采用深度学习模型,能根据目标图像和用户的用词习惯生成与内容信息对应的文本信息,可以减少用户构思并编辑文本信息的时间。但该方案只提出了一种可能的文本生成解决方案,并没有给出具体的算法,其文本生成的效果尚未明确。
再例如,现有技术中还存在一种医疗文本的生成方法,通过利用词向量表示医疗文档的词汇并对医疗文档进行文本分类;获得医疗文档的最佳的输出序列标注;获得医疗文档的关键词集的索引,将索引随机打乱顺序,得到新的医疗文档及其对应的序列标注;采用基于生成式对抗网络的生成模型训练生成并输出医疗文本;获取生成的医疗文本的BLEU参数;对生成的医疗文本进行评估,最终得到目标医疗文本。
但是该方案也存在着不可克服的缺陷,表现在:该方案利用词向量对文本进行标注并获得关键词集的索引;随后随机打乱索引,得到新的对应的序列标注;最后,基于生成式对抗网络的生成模型训练生成输出新的目标文本。这一方案,通过先获得词集的索引,然后仅根据随机打乱的索引生成新的文本,并不具有很强的自我文本生成能力,模板痕迹过重,扩展性不高。
发明内容
有鉴于此,本发明实施例提供一种限定采样文本序列生成方法及其系统,用以解决现有技术中解决在生成式对抗网络中离散文本无法反向传播梯度的缺陷。
第一方面,本发明实施例提供一种限定采样文本序列生成方法,包括以下步骤:
S1:将初始文本序列输入至训练好的对抗网络模型,获取预输出文本序列的第一个词,对抗网络模型包括生成器和判别器。
S2:基于词表掩模的方法,利用生成器根据第一个词,从字典数据库中选取所述第一个词的下一个词,构成预输出文本序列。
S3:基于词表掩模的方法,根据预输出文本序列,继续选取预输出文本序列的下一个词,获取新的预输出文本序列。
S4:迭代执行步骤S2-S3,直至新的预输出文本序列的总词数达到设定阈值时,将新的预输出文本序列 输入至判别器进行判别,并根据分类判别结果计算更新梯度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;北京智芯微电子科技有限公司,未经北京邮电大学;北京智芯微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911200838.4/2.html,转载请声明来源钻瓜专利网。