[发明专利]自然语言生成方法、装置及存储介质在审
申请号: | 202110213834.0 | 申请日: | 2021-02-25 |
公开(公告)号: | CN114970555A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 刘杰;刘琦;王笑;张穗云;张晴 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/284;G06N3/04;G06F16/332 |
代理公司: | 北京格罗巴尔知识产权代理事务所(普通合伙) 11406 | 代理人: | 孙德崇 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 生成 方法 装置 存储 介质 | ||
本申请涉及一种自然语言生成方法、装置及存储介质,其中,所述方法应用于对话系统,所述方法包括:对系统动作文本进行编码,得到编码向量;对所述编码向量进行解码,在解码过程中判断解码文本是否满足解码结束条件,所述解码结束条件为:所述解码文本中包括所述系统动作文本模板中的所有预设的所述槽位,或者所述解码文本中包括所述系统动作文本中的所有所述槽位值;在所述解码文本满足所述解码结束条件的情况下,确定所述解码文本为用于回复所述用户查询信息的自然语言文本。本申请的实施例可通过解码结束条件对解码过程进行限制,从而能够避免语义信息丢失,提高自然语言生成的准确性及稳定性。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种自然语言生成方法、装置及存储介质。
背景技术
任务型对话系统作为垂直领域的业务助理,可以高效处理繁琐和重复的高频问答,继而完成用户的目标任务,例如订票、查询天气等。
自然语言生成(natural language generation,NLG)是任务型对话系统的重要组成部分。自然语言生成旨在将机器表述系统中的语义表达(meaning representations,MR)转化为自然语言,以便于人们理解。然而,现有的自然语言生成技术通常存在语义信息丢失(例如关键词丢失)的问题。
发明内容
有鉴于此,提出了一种自然语言生成方法、装置及存储介质。
第一方面,本申请的实施例提供了一种自然语言生成方法,应用于对话系统,所述方法包括:对系统动作文本进行编码,得到编码向量;其中,所述系统动作文本是根据用户查询信息和预设的系统动作文本模板生成的,所述系统动作文本模板包括至少一个预设的槽位,所述系统动作文本包括至少一个槽位值;对所述编码向量进行解码,在解码过程中判断解码文本是否满足解码结束条件;其中,所述解码文本为对所述编码向量进行解码得到的文本,所述解码结束条件为:所述解码文本中包括所述系统动作文本模板中的所有预设的所述槽位,或者所述解码文本中包括所述系统动作文本中的所有所述槽位值;在所述解码文本满足所述解码结束条件的情况下,确定所述解码文本为用于回复所述用户查询信息的自然语言文本。
本申请的实施例的自然语言生成方法,应用于对话系统,能够对根据用户查询信息和预设的系统动作文本模板生成的系统动作文本进行编码,得到编码向量,并对编码向量进行解码,在解码过程中,判断解码文本是否满足解码结束条件,解码结束条件为解码文本中包括系统动作文本模板中的所有预设的槽位或者解码文本中包括所述系统动作文本中的所有所述槽位值;在解码文本满足解码结束条件的情况下,确定解码文本为用于回复用户查询信息的自然语言文本,从而使得对话系统在生成自然语言时,能够根据系统动作文本中隐含的约束信息(例如包括的槽位值)或者根据系统动作文本模板中隐含的约束信息(例如包括的槽位)对编码向量的解码过程进行指导,使得系统动作文本中的关键信息在解码过程中得到充分的表达,避免语义信息丢失(例如关键词丢失),进而提高自然语言生成的准确性及稳定性。
根据第一方面,在所述自然语言生成方法的第一种可能的实现方式中,所述对系统动作文本进行编码,得到编码向量,具体包括:根据预设词典对所述系统动作文本中的各个词语进行编码,得到词向量;根据预设短语库从所述系统动作文本中确定目标短语,对所述目标短语进行编码,得到短语向量;其中,所述短语库包括多个短语,所述目标短语为同时包含于所述短语库和所述系统动作文本的短语;融合所述词向量和所述短语向量,得到所述编码向量。
在本实施例中,通过将短语向量加入编码向量,使得编码向量包括多个粒度(词粒度、短语粒度)的向量,从而能够提高编码向量对系统动作文本中关键语义信息的表达的的准确性,进而提高解码生成的自然语言文本的准确性及稳定性。
根据第一方面的第一种可能的实现方式,在所述自然语言生成方法的第二种可能的实现方式中,所述对所述目标短语进行编码,得到短语向量,具体包括:对所述目标短语中的各个词语对应的词向量进行平均或加权平均,得到短语向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110213834.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钻井平台输油管道快速定位连接装置
- 下一篇:一种氨氮在线监测仪