[发明专利]一种在彩铃系统中实现语音识别的系统及方法有效
申请号: | 200910089749.7 | 申请日: | 2009-07-22 |
公开(公告)号: | CN101621712A | 公开(公告)日: | 2010-01-06 |
发明(设计)人: | 潘飚;关春 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04Q3/00 | 分类号: | H04Q3/00;H04M3/42 |
代理公司: | 北京派特恩知识产权代理事务所(普通合伙) | 代理人: | 张颖玲;王黎延 |
地址: | 518057广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 系统 实现 语音 识别 方法 | ||
技术领域
本发明涉及语音识别和彩铃技术,特别是涉及一种在彩铃系统中实现语音 识别的系统及方法。
背景技术
随着语音技术的不断发展,语音识别技术在计算机领域获得了广泛的应用, 所涉及到范围也越来越广泛,例如,语音录入、各种声控终端等等。虽然语音 识别技术本身已日渐成熟,但在通讯领域的应用还远未普及,目前的应用大多 限于在应用程序接口(API)接口的开发。
另一方面,在彩铃业务的日益发展过程中,语音技术如交互式语音应答 (IVR)流程也逐渐被应用于彩铃系统中。但是,由于彩铃业务本身的特点, 其个性化的需求特别多,存在大量用户可以自己定制的功能,而现有的IVR流 程只能接收用户一些简单的按键信息,对于彩铃业务用户定制功能中,一些需 要用户输入文本信息的应用,如按歌曲名称搜索等,还无法利用IVR流程实现。
这里,所述彩铃业务是一种智能多媒体业务,在由端局、业务控制点(SCP)、 业务交换点(SSP)、语音平台组成的移动智能平台上实现,通常,用户终端通 过拨打特定的业务接入码,接入移动智能平台的SSP,触发彩铃业务的业务逻 辑,完成彩铃业务的实现。
现有技术中,对于彩铃业务中需要用户输入文本信息的应用,大多只能通 过web方式来实现。虽然,web方式的使用在交互信息上具有很大的优势,但 其使用还是受到使用环境、使用人群的限制,比如:需要提供支持web运行的 环境,需要用户掌握如何使用web方式等等。而对于IVR流程,则没有这些使 用环境的要求,只要通过通信终端触发IVR业务逻辑即可;并且,IVR业务具 有使用方便、操作简单的优势,那么,如何在彩铃系统中利用IVR流程实现更 多的用户定制功能,目前亟待解决的是IVR流程中的信息交互问题。
发明内容
有鉴于此,本发明的主要目的在于提供一种在彩铃系统中实现语音识别的 系统及方法,能解决IVR流程中的信息交互问题,完成彩铃IVR流程中语音的 识别。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种在彩铃系统中实现语音识别的系统,包括:业务控制点、 交互式语音应答IVR业务逻辑、媒体服务器和语音识别引擎;其中,
所述业务控制点,用于解析执行业务指令,并由IVR业务逻辑控制完成与 媒体服务器之间的信息交互;
所述IVR业务逻辑,用于控制对用户的放音、收号、用户录入信息的处理, 并根据用户的选择和业务逻辑设定完成业务功能;
所述媒体服务器,用于根据业务控制点的指示操作,并根据指示与语音识 别引擎进行信息交互,将语音识别结果通知IVR业务逻辑;
所述语音识别引擎,用于在业务控制点的控制下,对用户录入的语音进行 识别,并上报语音识别结果。
其中,该系统还包括交换机,用于接收用户拨打的接入码,并向业务控制 点发起邀请;所述业务控制点,还进一步由IVR业务逻辑控制完成与交换机之 间的信息交互。
上述方案中,所述业务控制点与媒体服务器通过扩展的Parlay的SENDUI 接口交互信息。所述媒体服务器与语音识别引擎进行信息交互包括:通知语音 识别引擎开始语音识别、接收语音识别引擎返回的语音识别结果。
本发明还提供了一种在彩铃系统中实现语音识别的方法,先触发IVR业务 逻辑;该方法还包括:
媒体服务器根据来自IVR业务逻辑通过业务控制点发送的指示准备放音, 并通知用户准备录入语音;
媒体服务器连接语音识别引擎,语音识别引擎识别用户录入的语音,并将 语音识别结果发送给媒体服务器;媒体服务器通过业务控制点通知IVR业务逻 辑语音识别结果;其中,业务控制点与媒体服务器通过扩展的Parlay的SENDUI 接口交互信息。
其中,所述触发IVR业务逻辑为:用户拨打彩铃IVR流程的接入码触发IVR 业务逻辑。
上述方案中,所述媒体服务器根据来自IVR业务逻辑通过业务控制点发送 的指示准备放音具体包括:IVR业务逻辑向业务控制点发送生成UI消息,指示 业务控制点呼叫媒体服务器;业务控制点向媒体服务器发送邀请INVITE请求, 呼叫媒体服务器;
媒体服务器收到邀请请求后,分配语音资源准备放音,完成后向业务控制 点返回200OK消息;业务控制点收到200OK后向媒体服务器返回ACK消息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910089749.7/2.html,转载请声明来源钻瓜专利网。