[发明专利]一种提高语音识别准确率的方法与系统在审
申请号: | 202310472717.5 | 申请日: | 2023-04-27 |
公开(公告)号: | CN116386616A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 刘斌 | 申请(专利权)人: | 齐鲁师范学院 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G10L15/04 |
代理公司: | 嘉兴亮典知识产权代理有限公司 33521 | 代理人: | 吕梅 |
地址: | 250200*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 语音 识别 准确率 方法 系统 | ||
本发明公开了一种提高语音识别准确率的方法与系统,该方法包括:获取用户的录音信息,生成语音文本信息,判断所述语音文本信息与标准语音文本信息的匹配度,以得到第一匹配结果和第二匹配结果,基于所述第一匹配结果对所述录音信息进行处理并生成调整文本信息,基于第二匹配结果对所述语音文本信息和所述标准语音文本信息进行分割并生成第一分割文本信息和第二分割文本信息,筛选第一分割文本信息与第二分割文本信息中的差异值,对所述差异值进行调整,本发明公开的方法与系统相结合,对语音识别系统进行了完善,提高了语音识别系统的准确率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种提高语音识别准确率的方法与系统。
背景技术
随着信息技术的发展,越来越多的电子设备中运用了语音识别技术,如导航上的语音搜索应用、语音转换发送短信、微信语音转换文字等,为人们提供了诸多的便利,减少了人们手动文字输入的工作量,节省了时间。
现有技术中,通过采集语音振源数据转换为语音信息进行语音识别,减少语音识别系统因环境嘈杂、发音不清晰等导致的语音获取数据不完整的问题,但无法排除多个用户发生同时同步电子设备输入语音信息,而造成语音识别混乱的情况,也无法大概率的避免语音识别系统的在识别语音信息的转换过程中造成语音识别的不精确性,以致反馈出的语音识别结果与用户所输入的语音数据不匹配,需要用户再次输入语音信息,浪费了再次获取用户语音信息的时间,以及再次经过语音识别系统输出的识别结果出错率依然较高,因此,对语音识别系统的语音识别校正过程还有待完善。
发明内容
为了解决上述语音音色识别不清晰和降低字词大概率错误的问题,本申请提供一种提高语音识别的方法与系统。
第一方面,提供一种提高语音识别的方法,所述方法包括:
获取用户的录音信息并生成语音文本信息;
判断所述语音文本信息与标准语音文本信息的匹配度,以得到第一匹配结果和第二匹配结果;
基于所述第一匹配结果对所述录音信息进行处理并生成调整文本信息;
基于第二匹配结果对所述语音文本信息和所述标准语音文本信息进行分割并生成第一分割文本信息和第二分割文本信息;
筛选第一分割文本信息与第二分割文本信息中的差异值,对所述差异值进行调整。
通过采用上述技术方案,通过获取用户的录音信息,以生成语音文本信息,语音文本信息与标准语音文本信息进行匹配,并判断其匹配度,以得到第一匹配结果和第二匹配结果,对第一匹配结果和第二匹配结果进行分别处理,根据第一匹配结果以对用户的录音信息进行调整,从而生成调整文本信息,根据第二匹配结果以对语音文本信息进行分割,且对标准语音文本信息进行分割,进而得到第一分割文本信息和第二分割文本信息,将第一分割文本信息与第二分割文本信息进行比对,得到一个差异值,根据差异值进行调整。
优选的,所述用户获取语音文本信息,并将语音文本信息与标准语音文本信息进行匹配,其中所述标准语音文本信息由用户所设定;
判断语音文本信息与标准语音文本信息的匹配值;
设定第一匹配区间值和第二匹配区间值,若所述匹配值落入所述第一匹配区间值内,则输出第一匹配结果,若所述匹配值落入第二匹配区间置内,则输出第二匹配结果。
通过采用上述技术方案,将语音文本信息与由用户所设定的标准语音文本信息进行匹配,得到一个匹配度,通过设定区间值,分为第一匹配区间值和第二匹配区间值,将匹配度与区间值进行比对,当匹配度落入第一匹配区间值时,输出第一匹配结果,若落入第二匹配区间值,则输出第二匹配结果。
优选的,所述第一匹配区间值设定为高匹配度区间值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁师范学院,未经齐鲁师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310472717.5/2.html,转载请声明来源钻瓜专利网。