[发明专利]语音识别方法及装置在审
申请号: | 202010615561.8 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111785275A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 焦金珂;李健;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L17/00;G10L15/06;G10L15/02;G10L15/20;G10L15/18 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 黄海英 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
获取待识别的语音数据;
从所述语音数据中提取声纹特征,得到目标声纹特征;
确定所述目标声纹特征对应的目标对象,并确定用于识别所述目标对象的语音数据的语音识别模型;
基于所述语音识别模型将所述待识别的语音数据识别为文字。
2.根据权利要求1所述的方法,其特征在于,确定所述目标声纹特征对应的目标对象包括:
将所述目标声纹特征与数据库中的多组预设声纹特征进行匹配,其中,每组预设声纹特征分别关联有预设身份信息,所述预设身份信息为所述预设声纹特征对应的语音信息的发出对象的身份信息;
获取与所述目标声纹特征的匹配度最高的一组预设声纹特征,得到第一预设声纹特征;
获取所述第一预设声纹特征关联的预设身份信息;
基于所述第一预设声纹特征关联的预设身份信息确定所述目标对象。
3.根据权利要求1所述的方法,其特征在于,所述语音识别模型包括声学模型和语言模型,其中,所述声学模型用于判断预设语音数据属于预设声学字符的概率,所述语言模型用于判断预设声学字符序列属于预设文字序列的概率,基于所述语音识别模型将所述待识别的语音数据识别为文字包括:
将所述待识别的语音数据输入所述声学模型,得到目标声学字符串;
将所述目标声学字符串输入所述语言模型,得到目标文字序列;
根据所述目标文字序列确定所述语音数据对应的文字结果。
4.根据权利要求1所述的方法,其特征在于,在确定所述目标声纹特征对应的目标对象之前,所述方法还包括:
采集所述目标对象对应的基础语料数据;
基于所述基础语料数据提取所述目标对象的声纹特征;
获取所述目标对象的身份信息;
建立所述目标对象的身份信息和所述目标对象的声纹特征之间的关联关系。
5.根据权利要求3所述的方法,其特征在于,在确定用于识别所述目标对象的语音数据的语音识别模型之前,所述方法还包括:
采集所述目标对象对应的基础语料数据;
从所述基础语料中获取基础语音信息,并标注所述基础语音信息对应的声学字符信息;
将所述基础语音信息以及所述基础语音信息对应的声学字符信息作为训练集数据,训练得到所述声学模型。
6.根据权利要求3所述的方法,其特征在于,在确定用于识别所述目标对象的语音数据的语音识别模型之前,所述方法还包括:
采集所述目标对象对应的基础语料数据;
从所述基础语料中获取基础文本信息,并标注所述基础文本信息对应的声学字符信息;
将所述基础文本信息以及所述基础文本信息对应的声学字符信息作为训练集数据,训练得到所述语言模型。
7.根据权利要求2所述的方法,其特征在于,在将所述目标声纹特征与数据库中的多组预设声纹特征进行匹配之后,所述方法还包括:
在所述数据库中不存在与所述目标声纹特征匹配的预设声纹特征的情况下,将预设语音识别模型确定为所述语音识别模型。
8.根据权利要求1所述的方法,其特征在于,获取待识别的语音数据包括:
获取目标场景下当前发言对象的语音数据,得到所述待识别的语音数据,其中,所述目标场景为多人语音交流场景。
9.根据权利要求1所述的方法,其特征在于,获取待识别的语音数据包括:
获取目标场景下的录音数据,其中,所述目标场景为多人语音交流场景;
采用预设规则切分所述录音数据,得到多个录音片段;
获取所述多个录音片段中的目标录音片段,并将所述目标录音片段作为所述待识别的语音数据。
10.一种语音识别装置,其特征在于,包括:
第一获取单元,用于获取待识别的语音数据;
第一提取单元,用于从所述语音数据中提取声纹特征,得到目标声纹特征;
第一确定单元,用于确定所述目标声纹特征对应的目标对象,并确定用于识别所述目标对象的语音数据的语音识别模型;
识别单元,用于基于所述语音识别模型将所述待识别的语音数据识别为文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010615561.8/1.html,转载请声明来源钻瓜专利网。