[发明专利]自然语言文本生成方法和装置以及对话系统在审
申请号: | 201911036989.0 | 申请日: | 2019-10-29 |
公开(公告)号: | CN112800737A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 王娟;程建波;彭南博;黄志翔 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06N3/08;G06N3/04;G06F16/332;G06F16/338 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 许蓓 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 文本 生成 方法 装置 以及 对话 系统 | ||
本公开提出一种自然语言文本生成方法和装置以及对话系统,涉及自然语言处理领域。在本公开中,利用循环神经网络训练得到自然语言文本生成模型;将待生成的结构化数据输入自然语言文本生成模型并输出相应的文本句式,根据需要利用待生成的结构化数据中的槽值对文本句式中的槽的占位符进行替换,最终生成自然语言文本。本公开的方案能够灵活地自动学习到文本模板对应的文本句式,极大地减少了人工配置工作,节约了人力。
技术领域
本公开涉及自然语言处理领域,特别涉及一种自然语言文本生成方法和装置以及对话系统。
背景技术
随着互联网技术的发展和人工智能的发展,自然语言处理技术取得了很大的进步。
自然语言文本生成(Nature Language Generating,简称NLG)技术是自然语言处理技术中重要的一部分,指的是将结构化数据生成自然语言文本。
在一些相关技术中,人工预定义文本模板以及文本模板对应的文本句式,然后确定结构化数据对应哪个文本模板下哪种文本句式,利用对应的文本句式最终生成相应的自然语言文本。
发明内容
发明人发现,在相关技术中,文本模板对应的文本句式需要人工预先配置,费时费力,不够灵活。
在本公开中,利用结构化数据训练样本及其对应的文本模板对循环神经网络训练得到自然语言文本生成模型,将待生成的结构化数据输入自然语言文本生成模型并输出相应的文本句式,如果需要的话,利用待生成的结构化数据中的槽值对文本句式中的槽的占位符进行替换,最终生成自然语言文本,从而能够灵活地自动学习到文本模板对应的文本句式,极大地减少了人工配置工作,节约了人力。
根据本公开的一些实施例,提供了一种自然语言文本生成方法,包括:
获取待生成的结构化数据,所述结构化数据包括意图,或者,所述结构化数据包括意图、槽及其值;
将所述结构化数据输入自然语言文本生成模型并输出相应的文本模板句式,所述自然语言文本生成模型是利用结构化数据训练样本及其对应的文本模板对循环神经网络进行训练得到的;
如果所述结构化数据包括槽及其值,将所述文本模板句式中的槽的占位符替换为所述结构化数据中相应槽的值,得到相应的自然语言文本;
如果所述结构化数据不包括槽及其值,将所述文本模板句式作为相应的自然语言文本。
在一些实施例中,所述将所述结构化数据输入自然语言文本生成模型并输出相应的文本模板句式包括:将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分,每个输出部分包括预测的多个文本节点;根据各个输出部分中的文本节点的组合,确定所述结构化数据对应的多个文本模板句式。在一些实施例中,所述根据各个输出部分中的文本节点的组合,确定所述结构化数据对应的多个文本句式模板包括:从每个输出部分选取预测概率最大的预设数量的文本节点,所述预设数量为多个;将各个输出部分中选取出来的一个文本节点进行组合;从多个文本节点组合中选取所述预设数量的文本节点组合作为所述结构化数据对应的多个文本句式模板。
在一些实施例中,所述将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分包括:所述将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分,其中,每个输出部分作为预测下个输出部分的输入。
在一些实施例中,所述结构化数据和所述结构化数据训练样本是经过独热编码的。
在一些实施例中,所述自然语言文本生成模型的训练过程包括:根据所述自然语言文本生成模型的各个输出部分中的预测词与所述文本模板中相应部分的实际词之间的损失,确定总损失;基于所述总损失计算的梯度满足预设条件时,所述循环神经网络训练完成得到所述自然语言文本生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911036989.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:空调器及其控制方法
- 下一篇:自动驾驶车辆的控制方法、装置、设备及存储介质