[发明专利]一种语音识别服务代理服务器及代理方法有效
申请号: | 201810758656.8 | 申请日: | 2018-07-11 |
公开(公告)号: | CN108833590B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 戴俊;常月;黄国瑞;张伟冬;先永春 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L29/06;G10L15/26 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 服务 代理服务器 代理 方法 | ||
本发明公开了一种语音识别服务代理服务器及代理方法,所述服务器包括MRCP代理模块,用于接收媒体设备发送的语音流处理请求;将所述语音流处理请求发送给业务代理模块进行处理;从所述业务代理模块接收处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用;业务代理模块,用于从所述MRCP代理模块接收所述语音流处理请求;与语音业务服务器交互,实现对所述语音流的处理,将处理结果返回给MRCP代理模块。在媒体设备与ASR服务之间解耦,利于服务扩展;通过业务代理服务对ASR服务请求进行鉴权,流控,安全,反作弊等,可很好应用于公有云;通过业务代理服务下挂接其他业务模块,对ASR服务进行扩展,如搜索,翻译,识别意图等。
【技术领域】
本发明涉及计算机应用技术,特别涉及一种语音识别服务代理服务器及代理方法。
【背景技术】
随着ASR(Automatic Speech Recognition,自动语音识别)技术日趋成熟和相互结合,基于ASR的增值业务不断涌现和迅猛发展。
现有技术中,媒体设备可以通过MRCP(Media Resource Control Protocol,媒体资源控制协议)直接连接ASR服务,这样的应用方式有两个劣势:
1,对于私有云有很好的支持,对于公有云支持不好,因为公有云需要有鉴权,流控,安全,反作弊等机制。原生的方法要支持公有云,要么放弃这些机制,要么让这些机制与ASR服务耦合;
2,对于ASR服务,只能返回识别的文本,不能有很好的扩展,若要扩展,需要让ASR耦合其他业务模块。
另外,媒体设备也可以通过HTTP对接共有云平台再对接ASR服务,这样的应用方式劣势如下:
因为媒体设备通常不具备HTTP对接ASR的能力,需要进行改造。因此对接不方便,有改造成本。并且,对于ASR服务,只能返回识别的文本,不能有很好的扩展。
【发明内容】
本申请的多个方面提供了语音识别服务代理服务器、方法、设备及存储介质,能够解耦媒体设备与业务系统,提供公有云鉴权,流控,计费,安全等服务,并为ASR服务扩展知识。
本申请的一方面,提供一种语音识别服务代理服务器,所述服务器包括:
MRCP代理模块,用于接收媒体设备发送的语音流处理请求;将所述语音流处理请求发送给业务代理模块进行处理;从所述业务代理模块接收处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用;
业务代理模块,用于从所述MRCP代理模块接收所述语音流处理请求;与语音业务服务器交互,实现对语音流的处理,将处理结果返回给MRCP代理模块。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语音业务服务器为ASR服务器和/或扩展业务服务器。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述业务代理模块包括:
ASR处理子模块,用于向所述ASR服务器发送ASR请求,接收所述ASR服务器返回的语音识别结果;和/或,
扩展业务处理子模块,用于向所述扩展业务服务器发送扩展业务请求,接收所述扩展业务服务器返回的扩展业务处理结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述业务代理模块还用于与控制服务器交互,实现对所述媒体设备的控制。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述控制服务器为鉴权/流控/计费/安全服务器;
所述业务代理模块还包括:
鉴权子模块,用于与所述鉴权服务器交互,实现对所述媒体设备的鉴权;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810758656.8/2.html,转载请声明来源钻瓜专利网。