[发明专利]一种语音识别方法及系统在审
申请号: | 201811224720.0 | 申请日: | 2018-10-19 |
公开(公告)号: | CN109147762A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G09B5/04 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信息 语音识别 声韵母 词库 发音 地域信息 映射表 混用 校正 音词 地域 发音特点 文本信息 用户服务 声母 韵母 准确率 词语 | ||
1.一种语音识别方法,其特征在于,包括:
根据不同地域的发音特点,建立发音词库;所述发音词库包括吞音词及拖音词;
根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表;
获取待识别语音信息;
根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息;
根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正;
识别校正后的待识别语音信息,得到对应的文本信息。
2.根据权利要求1所述的一种语音识别方法,其特征在于,所述的获取待识别语音信息之前还包括:
搜集不同地域的用户语音信息;
根据所述不同地域的用户语音信息,建立不同地域各自对应的地域语音特征库,并建立所述地域语音特征库与对应的地域之间的地域映射表;
所述的根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息具体包括:
提取出所述待识别语音信息中的语音特征;
根据提取出的语音特征,查找到对应的地域语音特征库;
根据查找到的地域语音特征库,在所述地域映射表中查找到对应的地域信息。
3.根据权利要求2所述的一种语音识别方法,其特征在于,所述语音特征包括语调、语速或声调中的一种或多种。
4.根据权利要求1所述的一种语音识别方法,其特征在于,所述的根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表具体包括:
根据地域信息,按地域对声母混用及韵母混用进行分类;
建立混用声母与对应声母之间的映射关系,以及混用韵母与对应韵母之间的映射关系;
根据所述声母混用的映射关系和所述韵母混用的映射关系,建立不同地域的声母混用及韵母混用的声韵母映射表。
5.根据权利要求1所述的一种语音识别方法,其特征在于,所述的获取待识别语音信息之后还包括:
根据所述待识别语音信息,更新混用声母与对应声母之间的映射关系,以及混用韵母与对应韵母之间的映射关系;
根据更新后的声母映射关系以及韵母映射关系,更新所述声韵母映射表。
6.根据权利要求1-5任一项所述的一种语音识别方法,其特征在于,所述的根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正具体包括:
根据所述地域信息,查找到所述地域信息对应的声韵母映射表;
根据所述地域信息对应的声韵母映射表,对所述待识别语音信息中的相关声母及韵母进行校正;
根据所述发音词库,对进行声母及韵母校正后的所述待识别语音信息中的相关词语进行校正;
所述的识别校正后的待识别语音信息,得到对应的文本信息具体包括:
对进行词语校正后的待识别语音信息进行语音识别,得到对应的文本信息。
7.一种语音识别系统,其特征在于,包括:
词库建立模块,根据不同地域的发音特点,建立发音词库;所述发音词库包括吞音词及拖音词;
声韵母映射表建立模块,用于根据地域信息,建立不同地域的声母混用及韵母混用的声韵母映射表;
语音获取模块,用于获取待识别语音信息;
地域识别模块,用于根据所述待识别语音信息,识别出所述待识别语音信息对应的地域信息;
语音校正模块,用于根据所述地域信息、所述声韵母映射表和所述发音词库,对所述待识别语音信息进行校正;
语音识别模块,用于识别校正后的待识别语音信息,得到对应的文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811224720.0/1.html,转载请声明来源钻瓜专利网。