[发明专利]语音交互的系统、方法、设备及介质在审
申请号: | 202111535752.4 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114512125A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 王潇;吴震;苏显泽;刘兵;别秋豪;瞿琴;徐仁新 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/18;G10L15/28;G10L15/26;G10L15/16;G10L13/047 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 系统 方法 设备 介质 | ||
1.一种语音交互的系统,包括:
语音架构层,用于接收请求语句,对所述请求语句进行语音识别,得到语音识别结果并发送给语音中控层;对所述语音中控层返回的对话回复结果进行语音合成,得到回复语句;
所述语音中控层,用于对所述语音识别结果进行语义解析,得到语义解析结果并发送给业务中控层;将所述业务中控层返回的所述对话回复结果转发给所述语音架构层;
所述业务中控层,用于将所述语义解析结果分发给业务处理层;将所述业务处理层返回的所述对话回复结果转发给所述语音中控层;
所述业务处理层,用于调用所述语义解析结果对应领域的对话服务资源,得到所述对话回复结果并返回所述业务中控层。
2.根据权利要求1所述的系统,其中,所述语音架构层包括:语音架构单元、语音识别单元和语音合成单元;
所述语音架构单元,用于接收所述所述请求语句,调用所述语音识别单元对所述请求语句进行语音识别,得到所述语音识别结果并发送给所述语音中控层中的语音中控单元;调用所述语音合成单元对所述语音中控单元返回的对话回复结果进行语音合成,得到所述回复音频并发送所述给客户端。
3.根据权利要求2所述的系统,其中,所述语音中控层包括:语音中控单元和语义解析单元;
所述语音中控单元,用于调用所述语义解析单元对所述语音架构层中的语音架构单元发送的所述语音识别结果进行语义解析,得到所述语义解析结果并发送给所述业务中控层中的业务中控单元;将所述业务中控单元返回的所述对话回复结果转发给所述语音架构单元。
4.根据权利要求3所述的系统,其中,所述语音中控层还包括交互优化单元;
所述语音中控单元,还用于调用所述交互优化单元,对置信度不大于第一预设阈值的所述语音识别结果进行拒识;和/或,对置信度大于第一预设阈值且不大于第二预设阈值的所述语音识别结果生成澄清反问文本并发送给所述语音架构单元,或者缓存所述置信度大于第一预设阈值且不大于第二预设阈值的所述语音识别结果和所述澄清反问文本,所述第一预设阈值小于所述第二预设阈值;
所述语音架构单元,还用于对所述澄清反问文本进行语音合成,得到澄清反问语句。
5.根据权利要求4所述的系统,其中,所述交互优化单元包括辅助识别模块和语义澄清模块中的至少一个;
所述语音中控单元,用于调用所述辅助识别模块,确认对所述语音识别结果进行接收或者拒识;和/或,调用所述语义澄清模块,对置信度大于所述第一预设阈值且不大于所述第二预设阈值的所述语音识别结果生成澄清反问文本;
所述辅助识别模块,用于识别所述语音识别结果的置信度是否大于第一预设阈值和第二预设阈值;若所述语音识别结果的置信度不大于第一预设阈值,确认拒识所述语音识别结果;若所述语音识别结果的置信度大于第一预设阈值,确认接收所述语音识别结果,以便所述语音中控单元调用所述语义解析单元对所述语音识别结果进行语义解析;
所述语义澄清模块,用于若所述语音识别结果的置信度大于所述第一预设阈值且不大于所述第二预设阈值,基于预设澄清反问逻辑,针对所述语音识别结果生成澄清反问文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111535752.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微流控芯片
- 下一篇:利用含磷的细粒级选铁尾矿制备的有机肥及其制备方法