[发明专利]一种离线质检用语音识别方法及系统在审
申请号: | 201911118846.4 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110931016A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 陈辉;饶海红;温儒玲;乔数;蒋玲;张洪图;赖琼玉;陈佳芳;陈利霞 | 申请(专利权)人: | 深圳供电局有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L15/30;G10L15/06;G10L15/18 |
代理公司: | 深圳汇智容达专利商标事务所(普通合伙) 44238 | 代理人: | 熊贤卿 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 离线 质检 用语 识别 方法 系统 | ||
本发明提供了一种离线质检用语音识别方法,包括步骤:对客服系统的通话录音进行语音转码;将转码后的文本或者命令转码为相应的语音文件;将转换后的文本或者命令通过预先设置好的程序进行上下文语义分析;将分析后的语义在知识库进行查询,并根据对比结果返回答案;将返回的语义提取声纹,并和已登记的声纹进行比较。本发明还提供了相应的系统。实施本发明,对8k语音连续语音识别率可以达到80%,定制模型识别率可以达到85%以上,可较大幅度的提高识别率。
技术领域
本发明涉及语音识别技术领域,具体为一种离线质检用语音识别方法及系统。
背景技术
语音识别技术相当复杂,包括了声学、语言学、数字信号处理、统计模式、概率论和信息论、发声机理和听觉机理、人工智能等多学科技术的一项综合性技术,研究所投入的人力、物力等非常大,所需时间相对也比较长。
语音识别属于多维模式识别和智能计算机接口的范畴,语音识别研究的根本目的是研究出一种具有听觉功能的机器,能直接接受人的语音命令,理解人的意图并作出相应的反应。事实上,让机器听懂人的语言,一直是人类长期追求的理想,有着广泛的应用需求。在目前的客服系统中,需要广泛的应用到语音识别功能来对客户的需求进行识别和监测,方便团队及时做出政策调整,实现两种语言间的直接通信,即通过“语音识别-机器翻译-文本合成”将一种语言直接转换成另一种语言;语音世界可以使用户通过语音直接检索数据库,也就是类似互联网搜索引擎的语音搜索,获取所需的信息,或者语音电话拨号。
但是,现有的离线质检语音识别系统,在使用的过程中,识别的错误率较高并且识别过程较复杂。
发明内容
本发明所要解决的技术问题在于,提供一种离线质检用语音识别方法及系统,具备错误率较低和流程较简单等优点,解决了以往离线质检系统错误率较高和流程较复杂的问题。
为解决上述技术问题,本发明的一方面,提供一种离线质检用语音识别方法,其包括以下步骤:
步骤一、语音转码:对客服系统的通话录音进行语音转码;
步骤二、语音文本分析:将转码后的文本或者命令转码为相应的语音文件;
步骤三、语义理解:将转换后的文本或者命令通过预先设置好的程序进行上下文语义分析;
步骤四、语义核对:将分析后的语义在知识库进行查询,并根据对比结果返回答案;
步骤五、声纹检测:将返回的语义提取声纹,并和已登记的声纹进行比较,对用户进行身份校验和鉴别。
优选地,在所述步骤一中,所述的转码过程采用ASR语音识别技术,转码完毕后上传至云平台。
优选地,在所述步骤二中,所述的语音文本分析过程中采用TTS语音合成技术,在合成的同时,进行语音数据的传输和云端的识别,将收集到的语料进行模型的优化训练。
优选地,在所述步骤三中,具体包括:由识别机器首先对客户的需求信息进行对比合成,并由知识库返回答案后,进行智能问答。
优选地,在所述步骤五中,所述的声纹检测过程由系统对录音的音色进行识别,使用i-vector算法进行比对。
相应地,本发明的另一方面,还提供一种离线质检用语音识别系统,其包括:
语音转码单元,用于对客服系统的通话录音进行语音转码;
语音文本分析单元,用于将转码后的语音文件转码为相应的文本或者命令;
语义理解单元,用于将转换后的文本或者命令通过预先设置好的程序进行上下文语义分析;
语义核对单元,用于将分析后的语义在知识库进行查询,并根据对比结果返回答案;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911118846.4/2.html,转载请声明来源钻瓜专利网。