[发明专利]一种语音取号方法、系统及存储介质在审
申请号: | 201910965760.9 | 申请日: | 2019-10-12 |
公开(公告)号: | CN111554269A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 陈宗盛;张景涛;邓小飞;孙信中;矫人全 | 申请(专利权)人: | 南京奥拓软件技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/18;G10L15/25;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210012 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 方法 系统 存储 介质 | ||
1.一种语音取号方法,其特征在于,包括:
获取语义识别模型和取号语料库的特征表示集,所述取号语料库的特征表示集为根据语义识别模型,处理得到的取号语料的特征表示的集合;
获取位于目标区域内的用户语音信号;
对所述用户语音信号进行语音识别,得到用户语音识别文本;
根据所述用户语音识别文本和语义识别模型,得到用户语义特征表示;
在所述取号语料库的特征表示集中,匹配所述用户语义特征表示,得到对应的取号语料;
根据对应的取号语料,执行对应的取号操作。
2.根据权利要求1所述的语音取号方法,其特征在于,所述获取位于目标区域内的用户语音信号步骤之后,还包括:
对所述用户语音识别文本进行预处理,所述预处理至少包括分词操作。
3.根据权利要求1所述的语音取号方法,其特征在于,所述获取位于目标区域内的用户语音信号的步骤,具体包括:
获取目标区域的语音信号和现场图像;
对所述现场图像进行人脸识别;
若判断所述现场图像中存在人脸,则将获取的语音信号确定为位于目标区域内的用户语音信号。
4.根据权利要求3所述的语音取号方法,其特征在于,所述若判断所述现场图像中存在人脸,则将获取的语音信号确定为位于目标区域内的用户语音信号的步骤,具体包括:
判断目标区域内是否有人脸;
若判断为是,则判断获取的语音信号是否为符合要求的人声;
若判断为符合要求的人声,则则将获取的语音信号确定为位于目标区域内的用户语音信号;反之,则判断无位于目标区域内的用户语音信号。
5.根据权利要求1至4任一项所述的语音取号方法,其特征在于,在所述获取语义识别模型和取号语料库的特征表示集步骤之前,所述语音取号方法还包括:
获取取号语料库,执行训练,获取语义识别模型;
利用所述语义识别模型,对所述取号语料库进行处理,得到所述取号语料库的特征表示集。
6.根据权利要求5所述的语音取号方法,其特征在于,所述语音取号方法还包括:构建所述取号语料库的特征表示集的索引。
7.一种语音取号系统,其特征在于,包括语音取号装置,所述语音取号装置包括:
模型获取单元,用于获取语义识别模型和取号语料库的特征表示集,所述取号语料库的特征表示集为根据语义识别模型,处理得到的取号语料的特征表示的集合;
语音获取单元,用于获取位于目标区域内的用户语音信号;
语音识别单元,用于对所述用户语音信号进行语音识别,得到用户语音识别文本;
语义识别单元,用于根据所述用户语音识别文本和语义识别模型,得到用户语义特征表示;
匹配单元,用于在所述取号语料库的特征表示集中,匹配所述用户语义特征表示,得到对应的取号语料;
取号操作单元,用于根据对应的取号语料,执行对应的取号操作。
8.根据权利要求7所述的语音取号系统,其特征在于,所述语音取号装置还包括:
预处理单元,用于对用户语音识别文本进行预处理,所述预处理至少包括分词操作。
9.根据权利要求7所述的语音取号系统,其特征在于,还包括训练装置,所述训练装置包括:
训练模块,用于获取取号语料库,执行训练,获取语义识别模型;
取号语料特征模块,用于利用语义识别模型,对取号语料库进行处理,得到取号语料库的特征表示集。
10.一种机器可读存储介质,其上存储有计算机程序,其特征在于,其中所述计算机程序在由处理器执行时实现权利要求1-6任一项所述的语音取号方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京奥拓软件技术有限公司,未经南京奥拓软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910965760.9/1.html,转载请声明来源钻瓜专利网。