[发明专利]语音外呼方法、系统、设备及存储介质有效
申请号: | 202011330778.0 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112532794B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 江小林;罗超;胡泓 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | H04M3/51 | 分类号: | H04M3/51;G10L15/26;G10L13/08 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 夏彬 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 方法 系统 设备 存储 介质 | ||
1.一种语音外呼方法,其特征在于,包括:
呼叫交换模块根据接到的订单的信息,向客户进行语音外呼并发出首句对话;
所述呼叫交换模块在发出所述首句对话成功后,接收所述客户的语音回复,调用语音中控引擎;
所述语音中控引擎调用语音处理引擎,根据所述语音回复生成机器回复;
所述呼叫交换模块将所述机器回复传输至所述客户;
其中,所述语音处理引擎包括自动语音识别引擎、口语理解引擎、对话管理引擎、自然语言生成引擎、语音合成引擎;
所述语音中控引擎调用所述语音处理引擎,根据所述语音回复生成所述机器回复的步骤包括:
所述自动语音识别引擎将所述语音回复转换成文本信息;
所述口语理解引擎将所述文本信息转换为机器可以理解的语义解析;
所述对话管理引擎根据所述语义解析判断对话状态,并确定用以答复所述语义解析的所述机器回复;
所述自然语言生成引擎将所述机器回复转换为自然语言文本;
所述语音合成引擎将所述自然语言文本合成语音;
监控服务模块对所述订单的语音外呼状态进行监控并作出处理;
所述监控服务模块对所述订单的语音外呼状态进行监控并作出处理的步骤包括:
记录所述呼叫交换模块发出所述首句对话和所述机器回复的第一结果;
记录所述对话管理引擎生成的所述首句对话和所述机器回复的第二结果;
监控所述第一结果和所述第二结果的关联,若两者一致则将相应的所述订单标记为外呼成功,将所述第一结果和所述第二结果删除;若两者不一致的时长超过第一时间阈值,由所述监控服务模块发出报警。
2.根据权利要求1所述的语音外呼方法,其特征在于,所述发出首句对话的步骤包括:
所述呼叫交换模块向所述对话管理引擎发出请求,获取由所述对话管理引擎生成的所述首句对话,经语音合成后将所述首句对话发送至所述客户。
3.根据权利要求1所述的语音外呼方法,其特征在于,所述调用语音中控引擎包括将所述客户的所述语音回复转化成计算机能处理的音频,通过Mrcp Server将所述音频切割并由服务接口传输至所述语音中控引擎。
4.根据权利要求3所述的语音外呼方法,其特征在于,若所述Mrcp Server检测到所述音频中静音的时长超过第二时间阈值,即判断所述客户处于静默状态,并调用所述对话管理引擎按照预先设计的对话策略主动向所述客户发出提示语。
5.根据权利要求3所述的语音外呼方法,其特征在于,所述语音合成引擎由所述语音中控引擎调用,返回所述音频到所述Mrcp Server接口以及所述呼叫交换模块。
6.根据权利要求1所述的语音外呼方法,其特征在于,所述对话管理引擎由所述语音中控引擎直接调用,和/或由所述呼叫交换模块的话术中控调用以获取不同场景下的话术。
7.根据权利要求1所述的语音外呼方法,其特征在于,所述语音合成引擎将所述自然语言文本合成语音的步骤包括:
所述语音合成引擎将录制好的目标音频语料以及所述自然语言文本输入声音特征提取模型和声学模型,输出与所述自然语言文本对齐的梅尔谱特征;
将所述声学模型输出的所述梅尔谱特征输入声码器,合成对应的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011330778.0/1.html,转载请声明来源钻瓜专利网。