[发明专利]一种语音识别的方法和装置有效

申请号：	201710065885.7	申请日：	2017-02-06
公开（公告）号：	CN108399914B	公开（公告）日：	2021-06-22
发明（设计）人：	徐礼逵	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/18;G10L15/26;G10L25/51
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	赵娟
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种语音识别的方法和装置，所述方法包括：当接收到语音数据，识别所述语音数据得到候选识别文本集合；判断所述候选识别文本集合中是否存在易混淆词对；若所述候选识别文本集合中存在易混淆词对，则采用预置的语言模型和贝叶斯模型得到所述候选识别文本集合的候选识别文本的评分；采用所述评分从所述候选识别文本中筛选出目标识别文本。本发明实施例中引入贝叶斯评分，提高了语音数据中易混淆词的识别准确度，提高了用户体验。

技术领域

本发明涉及语音技术领域，特别是涉及一种语音识别的方法和一种语音识别的装置。

背景技术

目前，移动互联网的快速发展带动了移动智能设备如手机、平板电脑的广泛普及，而作为移动设备上人机交互最方便自然的方式之一，语音识别正逐渐被广大用户所接受。

尽管随着语音识别技术的发展，语音识别性能取得了较大进步，但是语音识别受到如发音相同等的易混淆词的影响，很难从用户的发音准确识别出而导致识别错误。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音识别的方法和相应的一种语音识别的装置。

为了解决上述问题，本发明实施例公开了一种语音识别的方法，包括：

当接收到语音数据，识别所述语音数据得到候选识别文本集合；

判断所述候选识别文本集合中是否存在易混淆词对；

若所述候选识别文本集合中存在易混淆词对，则采用预置的语言模型和贝叶斯模型得到所述候选识别文本集合的候选识别文本的评分；

采用所述评分从所述候选识别文本中筛选出目标识别文本。

可选地，还包括：

若所述候选识别文本集合中不存在易混淆词对，则采用预置的语言模型得到所述候选识别文本集合的候选识别文本的评分。

可选地，所述判断所述候选识别文本集合中是否存在易混淆词对的步骤包括：

判断所述候选识别文本集合中在预置易混淆词库中是否存在匹配项；

当所述候选识别文本集合中在预置易混淆词库中存在匹配项时，判断为所述候选识别文本集合中存在易混淆词对。

可选地，所述贝叶斯模型通过如下方式进行训练：

从语料库中抽取包含易混淆词的训练语料；

抽取所述训练语料的训练词形；

采用所述训练词形训练贝叶斯模型。

可选地，所述采用预置的语言模型和贝叶斯模型得到所述候选识别文本集合的候选识别文本的评分的步骤包括：

从所述候选识别文本中提取出词形；

将所述词形输入到预置的贝叶斯模型，得到所述候选识别文本集合的候选识别文本的贝叶斯评分；

将所述词形输入到预置的语言模型，得到所述候选识别文本集合的候选识别文本的语言评分；

采用所述贝叶斯评分和语言评分得到所述候选识别文本的评分。

可选地，所述采用所述评分从所述候选识别文本中筛选出目标识别文本的步骤包括：

将所述评分按照由大到小的顺序进行排序；

将所述排序在最前的评分所对应的候选识别文本作为目标识别文本。

可选地，所述语言模型通过如下方式进行训练：

从语料库中获取注音训练语料；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司，未经北京搜狗科技发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710065885.7/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音识别的方法和装置有效

专利文献下载