[发明专利]一种语音识别方法、智能终端及存储介质在审
申请号: | 201911403451.9 | 申请日: | 2019-12-27 |
公开(公告)号: | CN113053359A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 潘弘海 | 申请(专利权)人: | 深圳TCL数字技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/183;G10L15/22 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文 |
地址: | 518000 广东省深圳市前海深港合作区前湾一路鲤鱼门街一号前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 智能 终端 存储 介质 | ||
本发明公开了一种语音识别方法、智能终端及存储介质,本发明提供的语音识别方法,在将获取到的语音转换为文本时,将文本中的理论上应为专有字符串的第一字符串提取出来,并在所述第一字符串不是专有字符串时,获取所述第一字符串对应的专有字符串,提高了语音识别中对专有字符串的识别准确率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别方法、智能终端及存储介质。
背景技术
相较于拼音、字形等文本输入方式,语音输入方式具有速度快、操作便捷等优点,被应用到越来越多的场景中。但是,受到汉语多字同音、方言、发音不标准以及噪音等因素的影响,语音识别结果错误的情况时有发生,给用户使用带来不便,影响了语音识别产品的推广。
因此,现有技术还有待改进和发展。
发明内容
发明人发现,在现有技术中,语音识别的错误点往往出现在专有名词上,而专有名词是用户整句话的重点,例如,对于智能电视来说,用户使用语音识别进行搜索观看时,会说出包含电视剧名、人名、歌曲名等的句子,如“我想看琅琊榜”等,而智能电视必须要识别出电视剧名、人名、歌曲名等专有字符串,才能执行正确的搜索,达成用户的目的。然而,由于汉语中多字同音、方言以及周围噪音的影响,在现有技术中,对电视剧名、人名、歌曲名等专有字符串的识别会存在误差,如将“我想看琅琊榜”识别为“我想看狼牙棒”。专有名字符串的识别错误显然会导致语音识别的准确率大大降低,甚至与用户的原有意向想去甚远。
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音识别方法、智能终端及存储介质,旨在解决现有技术中语音识别对专有名词识别准确率低的问题。
本发明的技术方案如下:
本发明的第一方面,提供了一种语音识别方法,所述语音识别方法包括:
获取语音信息对应的文本,提取出所述文本中的第一字符串,并将所述第一字符串与目标数据库中的预设字符串进行匹配;
当所述目标数据库中不存在与所述第一字符串相同的预设字符串时,获取所述目标数据库中与所述第一字符串对应的目标预设字符串;
将所述文本中的所述第一字符串替换为所述目标预设字符串,将替换后的所述文本作为所述语音信息的识别结果。
所述的语音识别方法,其中,所述将所述第一字符串与目标数据库中的预设字符串进行匹配包括:
获取所述语音信息对应的专业类别;
根据所述专业类别在预先设置的至少一个数据库中选取所述专业类别对应的数据库,并将所述数据库作为所述目标数据库;
将所述第一字符串与所述目标数据库中的预设字符串进行匹配。
所述的语音识别方法,其中,所述提取出所述文本中的第一字符串具体包括:
将所述文本输入至所述专业类别对应的第一模型中,获取所述第一模型输出的所述第一字符串;
其中,所述第一模型是根据第一数据集训练而成的,所述第一数据集包括多组第一样本,每组第一样本中包括所述专业类别中的样本文本以及样本文本对应的样本第一字符串。
所述的语音识别方法,其中,所述获取所述目标数据库中与所述第一字符串对应的目标预设字符串包括:
获取所述第一字符串对应的第一音节序列;
将所述第一音节序列输入至预先训练的第二模型,获取所述第二模型输出的第二音节序列;
其中,所述第二模型是根据第二数据集训练而成的,所述第二数据集包括多组第二样本,每组第二样本中包含样本音节序列以及样本音节序列对应的样本第二音节序列,其中,所述样本第二音节序列是所述目标数据库中的一预设字符串对应的音节序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL数字技术有限公司,未经深圳TCL数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911403451.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种频带的状态判断方法以及相关设备
- 下一篇:一种截屏方法及相关设备