[发明专利]一种自动语音识别业务的实现方法、系统和媒体服务器有效
申请号: | 201310032134.7 | 申请日: | 2013-01-28 |
公开(公告)号: | CN103151041A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 张伟;程佳佳;崔飞 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;H04L29/06;G10L19/00 |
代理公司: | 北京派特恩知识产权代理事务所(普通合伙) 11270 | 代理人: | 王黎延;张振伟 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 语音 识别 业务 实现 方法 系统 媒体 服务器 | ||
1.一种自动语音识别ASR业务的实现方法,其特征在于,该方法包括:
媒体服务器收到APP服务器的访问请求后,确定自身支持的音频编解码类型集;
媒体服务器收到APP服务器发送的ASR业务请求后,根据ASR业务类型向ASR服务器申请ASR业务资源;
媒体服务器根据所述音频编解码类型集与ASR服务器进行协商,通过协商所得的音频编解码类型对媒体业务数据包进行转码,并将转码后的媒体业务数据包发送给ASR服务器。
2.根据权利要求1所述的ASR业务的实现方法,其特征在于,所述媒体服务器与ASR服务器进行协商,通过协商所得的音频编解码类型对媒体业务数据包进行转码,并将转码后的媒体业务数据包发送给ASR服务器,为:
媒体服务器中的媒体控制模块MSCU向ASR服务器发送会话初始协议SIP信令进行协商,并指定媒体服务器与ASR服务器匹配的音频编解码类型;
媒体服务器中的语音中心交互模块MRU接收终端所发的媒体业务数据包,并将所述媒体业务数据包按所述协商的音频编解码类型进行转码,并将转码后的媒体业务数据包发送到媒体服务器中的媒体存储传输音频模块MSTU;
MSCU控制MSTU将转码后的媒体业务数据包发送至ASR服务器。
3.根据权利要求1所述的ASR业务的实现方法,其特征在于,所述媒体服务器根据所述音频编解码类型集与ASR服务器进行协商得到音频编解码类型,为:
媒体服务器向ASR服务器发送SIP信令,ASR服务器收到SIP信令后,判断自身支持的音频编解码类型是否存在于媒体服务器支持的音频编解码能力集中,如果存在匹配的音频编解码类型,则通知媒体服务器,双方指定所述匹配的音频编解码类型作为后续对媒体业务数据包进行转码的音频编解码类型;如果不存在匹配的音频编解码类型,则结束当前ASR业务流程。
4.根据权利要求1、2或3所述的ASR业务的实现方法,其特征在于,所述媒体服务器收到APP服务器的访问请求之后,该方法还包括:
终端向APP服务器发送媒体业务数据包请求;APP服务器根据所述媒体业务数据包请求向媒体服务器发送访问请求的信令,之后媒体服务器指定自身与终端进行交互的地址。
5.根据权利要求2所述的ASR业务的实现方法,其特征在于,所述媒体服务器对媒体业务数据包进行转码,并将转码后的媒体业务数据包发送给ASR服务器,为:
媒体服务器中的MSCU通知MSTU打开NAT通道;
媒体服务器中的MSCU向MRU下发转码命令;
媒体服务器中的MSCU同ASR服务器建立链接,并通知ASR服务器等待音频输入,并进行音频识别;
媒体服务器中的MRU将终端所发的媒体业务数据包中的数据进行转码,并将转码后的媒体业务数据包通过MRU内口发送到MSTU的接收端口;
媒体服务器中的MSTU对转码后的媒体业务数据包进行NAT,并发送到ASR服务器。
6.一种ASR业务的实现系统,其特征在于,该系统包括:媒体服务器、APP服务器和ASR服务器;其中,
所述媒体服务器,用于收到APP服务器的访问请求后,确定自身支持的音频编解码类型集;收到APP服务器发送的ASR业务请求后,根据ASR业务类型向ASR服务器申请ASR业务资源;根据所述音频编解码类型集与ASR服务器进行协商,通过协商所得的音频编解码类型对媒体业务数据包进行转码,并将转码后的媒体业务数据包发送给ASR服务器;
所述APP服务器,用于向媒体服务器发送访问请求和ASR业务请求;
所述ASR服务器,用于与媒体服务器进行协商,并接收媒体服务器所发的转码后的媒体业务数据包。
7.根据权利要求6所述的ASR业务的实现系统,其特征在于,该系统还包括终端,用于媒体服务器收到APP服务器的访问请求之后,向APP服务器发送媒体业务数据包请求;相应的,
所述APP服务器,还用于根据所述媒体业务数据包请求向媒体服务器发送访问请求的信令;
所述媒体服务器,还用于收到所述访问请求的信令后,指定自身与终端进行交互的地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310032134.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带钥匙扣的手提包
- 下一篇:一种基于向量机SVM的说话者年龄段识别方法