[发明专利]一种语音识别的方法以及计算机在审

申请号：	201710121180.2	申请日：	2017-03-02
公开（公告）号：	CN108538286A	公开（公告）日：	2018-09-14
发明（设计）人：	康战辉	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/26;G06F17/27
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王仲凯
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本相关信息语音识别语音信号识别上下文信息关键信息获取目标目标语言语音信号准确率计算机
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种语音识别的方法，用于在根据下次接收的语音信号获取的识别文本中，对于该主题词或者该主题词相关的主题词的识别就会显示的是准确的识别，提高了语音识别的准确率。本发明实施例方法包括：获取初步识别文本中的主题词，所述主题词为所述初步识别文本中关键信息的词，所述初步识别文本为根据语音信号识别得到的文本；根据所述主题词获取目标相关信息，所述目标相关信息为与所述主题词对应的上下文信息；根据所述目标相关信息建立目标语言库。

技术领域

本发明涉及计算机领域，尤其涉及一种语音识别的方法以及计算机。

背景技术

一个通用的语音识别系统至少包括声学模型和语言模型两大部分。其中声学模型主要是将输入的语音信号转化为topN候选的语言序列；而语言模型则是判别候选语言序列是否符合一个正常语句的概率。至此，一个通用的语言模型往往是通过海量(几亿，乃至几十亿，上百亿)自然文本统计不同长度片段(Ngram)的出现概率而构建。

现有技术的缺点是，通用的语言模型往往存在数据识别有偏的问题。比如在语音转写场景下，具体来说比如某个专业的学术演讲场景下，用户需要通过语音识别系统自动做会议记录。此时如果在会议演讲中提到一些小众、专业的词汇(比如某种蛋白质的名字)，通用的语音识别系统，由于其中的语言模型可能没有涉及到这方面的语料，进而往往不能正确识别。

发明内容

本发明实施例提供了一种语音识别的方法以及计算机，用于在根据下次接收的语音信号获取的识别文本中，对于该主题词或者该主题词相关的主题词的识别就会显示的是准确的识别，提高了语音识别的准确率。

本发明实施例第一方面提供一种语音识别的方法，可以包括：

获取初步识别文本中的主题词，该主题词为该初步识别文本中关键信息的词，该初步识别文本为根据语音信号识别得到的文本；

根据该主题词获取目标相关信息，该目标相关信息为与该主题词对应的上下文信息；

根据该目标相关信息建立目标语言库。

本发明实施例第二方面提供一种计算机，可以包括：

第一获取模块，用于获取初步识别文本中的主题词，该主题词为该初步识别文本中关键信息的词，该初步识别文本为根据语音信号识别得到的文本；

第二获取模块，用于根据该主题词获取目标相关信息，该目标相关信息为与该主题词对应的上下文信息；

建立模块，用于根据该目标相关信息建立目标语言库。

从以上技术方案可以看出，本发明实施例具有以下优点：

在本发明实施例中，获取初步识别文本中的主题词，该主题词为该初步识别文本中关键信息的词，该初步识别文本为根据语音信号识别得到的文本；根据该主题词获取目标相关信息，该目标相关信息为与该主题词对应的上下文信息；根据该目标相关信息建立目标语言库。用户在使用计算机的过程中，计算机可以接收语音信号，根据语音信号获取对应的初步识别文本，再根据初步识别文本获取主题词，然后根据该主题词获取目标相关信息，可以根据相关信息建立目标语言库，目标语言库用于在根据下次接收的语音信号获取的识别文本中，对于该主题词或者该主题词相关的主题词的识别就会显示的是准确的识别，提高了语音识别的准确率。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，还可以根据这些附图获得其它的附图。

图1为本发明实施例中通用的语音识别系统的一个示意图；

图2为本发明实施例中所应用的语音识别系统的框架示意图；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710121180.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于多任务神经网络的多样例关键词检测方法
下一篇：一种改良声控系统装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音识别的方法以及计算机在审

专利文献下载