[发明专利]语音识别方法及相关产品有效

专利信息
申请号: 201911389673.X 申请日: 2019-12-28
公开(公告)号: CN111161739B 公开(公告)日: 2023-01-17
发明(设计)人: 万根顺;高建清;王智国 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G10L15/26 分类号: G10L15/26;G10L15/18;G10L15/06
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强
地址: 230088 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 方法 相关 产品
【权利要求书】:

1.一种语音识别方法,其特征在于,包括:

获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本;

采用定制语言模型执行所述预设场景的语音识别;

所述文本内容为用户在终端上产生的与预设场景相关的内容;

依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本,采用定制语言模型执行所述预设场景的语音识别具体包括:

对所述共享文本进行分词分类处理得到关键词,依据所述关键词对热词列表进行更新得到新的热词列表;

通过定制语言模型和所述新的热词列表执行语音识别。

2.根据权利要求1所述的方法,其特征在于,所述依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本具体包括:

采集并识别预设场景的语音得到语音识别结果,所述语音识别结果包括句子文本和句子时间信息;

根据所述文本时间信息和所述句子时间信息进行匹配,如与所述句子时间信息匹配,将所述文本时间信息对应的所述文本内容确定为所述共享文本。

3.根据权利要求2所述的方法,其特征在于,所述对所述共享文本进行分词分类处理得到关键词,依据所述关键词对热词列表进行更新得到新的热词列表具体包括:

对所述共享文本进行分词、分类处理,以获取短语集合或句子集合;

根据短语的词频和词频阈值确定所述关键词,所述词频为所述短语在所述短语集合或所述句子集合中出现的次数。

4.根据权利要求3所述的方法,其特征在于,在根据短语的词频和词频阈值确定所述关键词之前还包括:

根据所述热词列表对所述短语集合进行过滤。

5.根据权利要求2至4任一项所述的方法,其特征在于,所述对所述共享文本进行分词分类处理得到关键词,依据所述关键词对热词列表进行更新得到新的热词列表还包括:

确定所述关键词之间或所述关键词与所述热词列表之间存在的同音词语;

确定存在所述同音词语的所述句子文本,并对所述句子文本中的同音词语进行替换,得到词语替换后的句子文本;

根据所述词语替换后的句子文本的语音模型得分,将语言模型得分最高的同音词语确定为所述新的热词列表中的词语。

6.根据权利要求2至4任一项所述的方法,其特征在于,所述方法依据所述共享文本得到所述预设场景的定制语言模型,采用定制语言模型执行所述预设场景的语音识别之前还包括:

对所述语音识别结果进行分段处理得到段落的分割时间点,在所述分割时间点之后,依据所述共享文本得到所述预设场景的定制语言模型,采用定制语言模型执行所述预设场景的语音识别。

7.根据权利要求6所述的方法,其特征在于,在所述分割时间点之后,依据所述共享文本得到所述预设场景的定制语言模型包括:

确定所述文本内容和所述语音识别结果之间的文本相似度;

依据所述文本相似度和相似度阈值,过滤文本相似度低于所述相似度阈值的所述文本内容。

8.一种语音识别装置,其特征在于,包括:

获取单元,用于获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本;

识别单元,用于采用定制语言模型执行所述预设场景的语音识别;

所述文本内容为用户在终端上产生的与预设场景相关的内容;

所述共享文本为终端产生的语音识别结果;

依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本,采用定制语言模型执行所述预设场景的语音识别具体包括:

对所述共享文本进行分词分类处理得到关键词,依据所述关键词对热词列表进行更新得到新的热词列表;

通过定制语言模型和所述新的热词列表执行语音识别。

9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-7任一项所述的语音识别方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911389673.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top