[发明专利]一种人机交互系统、其对话方法、介质和设备在审
申请号: | 201911275013.9 | 申请日: | 2019-12-12 |
公开(公告)号: | CN110942774A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 周思丞;苏少炜;陈孝良;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L13/04;G06N3/08;G06N3/04;G06F16/332 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 常晓 |
地址: | 100080 北京市海淀区北四*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机交互 系统 对话 方法 介质 设备 | ||
本发明公开了一种人机交互系统、其对话方法、介质和设备,接收输入的对话音频,并将接收的对话音频转换为对话文本;根据对话文本,采用文本生成模型生成符合语义的应答文本;将生成的应答文本转换为音频进行响应;其中,文本生成模型为经过生成对抗网络优化后的生成模型。采用经过生成对抗网络优化后的文本生成模型,根据输入的对话文本的语义,生成符合对话内容的应答文本,由此代替现有技术中的固定句式的回复方式,丰富人机交互的对话内容,提升用户体验。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种人机交互系统、其对话方法、介质和设备。
背景技术
随着人工智能技术的不断发生,现阶段越来越多的产品具备智能对话的功能,例如很多的智能终端上都具备语音识别系统,用户通过与终端对话就可以控制终端查询内容或执行相应的功能,为人们日常工作和生活提供了很多的便利。
而目前的人机交互系统的对话应答通常是前期设定好的固定回复句式,根据不同的对话内容,事先设定好应答句式,并对变化的内容留出槽位。当接收到用户的对话时,解析用户的意图,再通过调用第三方接口获取到用户需要的内容,通过将获取结果填充到槽位中,以固定的句式回复用户。
这种对话方式,只能应对事先设计好的对话,而对于超出设定范围的对话机器往往不能了解用户意图,因此不能做出回应或采用设定的通用方式进行回应,并且这样对话的回复方式固化生硬,影响用户的使用体验。
发明内容
本发明提供一种人机交互系统、其对话方法、介质和设备,结合生成对抗网络,用以根据对话语文生成应答,提升用户体验。
第一方面,本发明提供一种人机交互系统的对话方法,包括:
接收输入的对话音频,并将接收的所述对话音频转换为对话文本;
根据所述对话文本,采用文本生成模型生成符合语义的应答文本;其中,所述文本生成模型为经过生成对抗网络优化后的生成模型;
将生成的所述应答文本转换为音频进行响应。
在一种可实现的实施方式中,在本发明提供的上述方法中,所述根据所述对话文本,采用文本生成模型生成符合语义的应答文本,包括:
将所述对话文本进行编码,形成编码向量;
根据形成的所述编码向量以及所述文本生成模型优化后的概率分布,生成符合所述对话文本语义的映射向量;
将所述映射向量进行解码,生成所述应答文本。
在一种可实现的实施方式中,在本发明提供的上述方法中,所述生成对抗网络包括:文本生成模型和判别模型;
所述生成对抗网络通过以下方式对所述文本生成模型进行优化:
根据所述对话文本,采用文本生成模型生成符合语义的应答文本;
将生成的所述应答文本和真实文本输入所述判别模型进行样本判别;
根据所述判别模型的判别结果对所述文本生成模型或所述判别模型进行迭代优化。
在一种可实现的实施方式中,在本发明提供的上述方法中,当判别模型判别出一个正确样本和一个错误样本时,判别结果等于设定阈值;当判别模型判别出一个以上的正确样本时,判别结果大于所述设定阈值;
所述根据所述判别模型的判别结果对所述文本生成模型或所述判别模型进行迭代优化,包括:
在判别结果为所述设定阈值时,对所述文本生成模型进行优化;
在判别结果大于所述设定阈值时,对所述判别模型进行优化。
在一种可实现的实施方式中,在本发明提供的上述方法中,所述文本生成模型采用长短时神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911275013.9/2.html,转载请声明来源钻瓜专利网。