[发明专利]一种语音识别的方法以及计算机在审
申请号: | 201710121180.2 | 申请日: | 2017-03-02 |
公开(公告)号: | CN108538286A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G06F17/27 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 相关信息 语音识别 语音信号识别 上下文信息 关键信息 获取目标 目标语言 语音信号 准确率 计算机 | ||
本发明实施例公开了一种语音识别的方法,用于在根据下次接收的语音信号获取的识别文本中,对于该主题词或者该主题词相关的主题词的识别就会显示的是准确的识别,提高了语音识别的准确率。本发明实施例方法包括:获取初步识别文本中的主题词,所述主题词为所述初步识别文本中关键信息的词,所述初步识别文本为根据语音信号识别得到的文本;根据所述主题词获取目标相关信息,所述目标相关信息为与所述主题词对应的上下文信息;根据所述目标相关信息建立目标语言库。
技术领域
本发明涉及计算机领域,尤其涉及一种语音识别的方法以及计算机。
背景技术
一个通用的语音识别系统至少包括声学模型和语言模型两大部分。其中声学模型主要是将输入的语音信号转化为topN候选的语言序列;而语言模型则是判别候选语言序列是否符合一个正常语句的概率。至此,一个通用的语言模型往往是通过海量(几亿,乃至几十亿,上百亿)自然文本统计不同长度片段(Ngram)的出现概率而构建。
现有技术的缺点是,通用的语言模型往往存在数据识别有偏的问题。比如在语音转写场景下,具体来说比如某个专业的学术演讲场景下,用户需要通过语音识别系统自动做会议记录。此时如果在会议演讲中提到一些小众、专业的词汇(比如某种蛋白质的名字),通用的语音识别系统,由于其中的语言模型可能没有涉及到这方面的语料,进而往往不能正确识别。
发明内容
本发明实施例提供了一种语音识别的方法以及计算机,用于在根据下次接收的语音信号获取的识别文本中,对于该主题词或者该主题词相关的主题词的识别就会显示的是准确的识别,提高了语音识别的准确率。
本发明实施例第一方面提供一种语音识别的方法,可以包括:
获取初步识别文本中的主题词,该主题词为该初步识别文本中关键信息的词,该初步识别文本为根据语音信号识别得到的文本;
根据该主题词获取目标相关信息,该目标相关信息为与该主题词对应的上下文信息;
根据该目标相关信息建立目标语言库。
本发明实施例第二方面提供一种计算机,可以包括:
第一获取模块,用于获取初步识别文本中的主题词,该主题词为该初步识别文本中关键信息的词,该初步识别文本为根据语音信号识别得到的文本;
第二获取模块,用于根据该主题词获取目标相关信息,该目标相关信息为与该主题词对应的上下文信息;
建立模块,用于根据该目标相关信息建立目标语言库。
从以上技术方案可以看出,本发明实施例具有以下优点:
在本发明实施例中,获取初步识别文本中的主题词,该主题词为该初步识别文本中关键信息的词,该初步识别文本为根据语音信号识别得到的文本;根据该主题词获取目标相关信息,该目标相关信息为与该主题词对应的上下文信息;根据该目标相关信息建立目标语言库。用户在使用计算机的过程中,计算机可以接收语音信号,根据语音信号获取对应的初步识别文本,再根据初步识别文本获取主题词,然后根据该主题词获取目标相关信息,可以根据相关信息建立目标语言库,目标语言库用于在根据下次接收的语音信号获取的识别文本中,对于该主题词或者该主题词相关的主题词的识别就会显示的是准确的识别,提高了语音识别的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,还可以根据这些附图获得其它的附图。
图1为本发明实施例中通用的语音识别系统的一个示意图;
图2为本发明实施例中所应用的语音识别系统的框架示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710121180.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多任务神经网络的多样例关键词检测方法
- 下一篇:一种改良声控系统装置