[发明专利]一种提升语音识别准确率的方法在审
申请号: | 201910477254.5 | 申请日: | 2019-06-03 |
公开(公告)号: | CN110211609A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 蒋智斌 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/54;G10L25/24;G10L15/02;G10L15/06;G10L15/07 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 郭会 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户语音 语音识别 准确率 用户数据库 数据库 标准语音数据库 用户语音数据 标准数据库 语音数据库 交互使用 模型匹配 实时记录 输入语音 用户判断 语音数据 高频率 检索 | ||
本发明公开了一种提升语音识别准确率的方法,包括实时记录用户输入的语音数据、比较用户语音数据库、比较标准语音数据库、得到最终的识别结果、用户判断识别结果是否正确、输入语音和正确结果到用户数据库、刷新用户数据库、按照正确的识别结果进行操作。本发明的方法通过在标准数据库之外,额外建立当前用户的专属语音数据库,将识别错误的用户语音数据添加到用户语音数据库中,并将用户语音数据库优先进行模型匹配和检索,达到提升高频率用户的语音识别准确率的效果,提升用户的交互使用体验。
技术领域
本发明涉及语音识别技术领域,特别涉及一种提升语音识别准确率的方法。
背景技术
人机交互是通过输入,输出设备,以有效的方式实现人与机器对话的技术。已广泛应用在消费电子,通信,家电,医疗,汽车等各个行业。主要有基于传统硬件设备的交互技术,基于触控的交互技术,基于语音识别的交互技术等。近年来,随着人工智能的发展以及计算机处理能力的增强,使得语音识别技术日趋成熟并被广泛应用于智能终端上。电视行业也是人机交互比较频繁行业,之前的用户大部分都是通过遥控键来选择和点播电视节目,通过集成人工智能模块,以语音的方式来和电视机进行人机交互,可以用比较简单便捷的方式来操作电视机和获取各项信息,跳过了之前繁琐的设置功能选项和操作。因此,语音识别的效果就直接关系到了用户对产品的体验与评价,改善用户交互体验成为了消费电子,家电产品的核心需求之一。
目前市面上支持语音交互的电视机越来越多,基本上都是以普通话作为语音输入。但是每个人的普通话发音都或多或少存在不标准的情况,再加上一些的同音字的影响,导致语音识别的准确率随着不同的人存在比较明显的差别。而大部分的电视机都没有提供语音识别的纠错功能,导致对于错误识别的语音,一旦识别错误,后续无法进行修正,严重影响用户体验。考虑到电视机、家用空调、音箱等的使用用户是以家庭成员为主,使用的人数基本限定在个位数。所以可以通过建立针对当前使用用户的语音数据库,将那些无法通过标准语音库识别的语音数据存入数据库中,来解决某些特定语音输入无法识别和识别准确率低的问题。
发明内容
本发明的目的是克服上述背景技术中不足,提供一种提升语音识别准确率的方法,通过在标准数据库之外,额外建立当前用户的专属语音数据库,将识别错误的用户语音数据(特征值)添加到用户语音数据库中,并将用户语音数据库优先进行模型匹配和检索,达到提升高频率用户的语音识别准确率的效果,提升用户的交互使用体验。
为了达到上述的技术效果,本发明采取以下技术方案:
一种提升语音识别准确率的方法,包括以下步骤:
A.实时采集用户录入的语音数据并获取采集到的语音数据的语音特征值;
B.将获取到的语音特征值先在用户语音数据库内进行检索比对并输出识别结果及该结果的可靠度分数值,计算识别结果的可靠度分数值为现有语音识别技术中较为成熟的计算方法,此处不再赘述;
C.再将获取到的语音特征值在标准语音数据库内进行检索比对并输出识别结果及该结果的可靠度分数值;
D.将由用户语音数据库得到的识别结果与由标准语音数据库得到的识别结果的可靠度分数值进行比较,在分数相同时,将由用户语音数据库得到的识别结果作为最终识别结果,否则,以分数高的识别结果作为最终识别结果;
E.向用户返回最终识别结果,并在用户对最终识别结果无修改时执行对应的指令。
进一步地,还包括以下步骤:
F.若用户对最终识别结果有修改时,则由用户重新输入语音及该语音对应的正确的文本信息;
G.将用户录入的语音的语音特征值及该语音特征值对应的正确的文本信息保存至用户语音数据库并对用户语音数据库进行刷新;
H.执行用户输入的正确的文本信息对应的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910477254.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音检索方法及系统
- 下一篇:评估音频信号损失的方法、装置及存储介质