[发明专利]一种语音信息识别校正方法和系统有效
申请号: | 202110026093.5 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112820274B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 李斌;高晓冬;谢利蓉;王宣懿 | 申请(专利权)人: | 上海仙剑文化传媒股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/25;G10L15/14;G10L15/187;G10L17/00 |
代理公司: | 北京智桥联合知识产权代理事务所(普通合伙) 11560 | 代理人: | 金光恩 |
地址: | 200237 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 信息 识别 校正 方法 系统 | ||
本发明涉及一种语音信息识别校正方法,包括:获取用户发出的语音信号,对语音信号进行识别以获得与语音信号对应的第一识别字符串;对第一识别字符串中的每一个字符执行上下文连贯性判断,以在存在上下文不连贯的字符时,将第一识别字符串判断为待校正字符串,否则,对第一识别字符串执行字符串完整度判断,以在第一识别字符串的完整度低于预设完整度阈值时,将第一识别字符串判断为待校正字符串;基于现场视觉数据对待校正字符串中每一个字符执行现场校正。本发明还涉及一种语音信息识别校正系统。通过本发明,能够在语音识别模式识别数据有误时采用针对性视觉识别模式进行辅助性识别,从而提升了识别数据的可靠性。
技术领域
本发明涉及语音识别领域,尤其涉及一种语音信息识别校正方法和系统。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2010年至2020年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。
声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对信号进行预加重以提升高频,对信号加窗以避免短时语音段边缘的影响。
当前,语音识别的准确性不仅决定了语音识别技术本身是否可靠,同时决定了采用语音识别技术的各种应用解决方案的可用性。然而,基于声学特征的语音识别技术已经比较成熟,继续深入化研究一方面会增加数据运算负担,另一方面提升了精度也无法上升到一个更高的数量级。因此,如果在采用基于声学特征的语音识别模式的同时引入其他不同识别原理的识别模式,将能够在不过分增加系统运算量的同时有效提升语音识别精度。然而,使用哪一种其他识别机制、引入其他识别机制的场景辨识以及如何将两种不同识别机制有机结合使用,都是当前需要解决的难题。
发明内容
为了解决上述问题,本发明提供了一种语音信息识别校正方法和系统,采用基于现场视觉数据的视觉特征的语音识别模式作为辅助识别模式,在采用针对性评估方式评估到基于声学特征的语音识别模式识别效果不佳时,将两种语音识别模式有机结合使用,从而在保证语音识别准确性的同时避免陷入过于繁琐的运算过程。
为此,本发明至少需要具备以下几处关键的发明点:
(1)基于字符上下文连贯性以及字符串完整性对语音识别到的字符串进行准确性判断,为后续是否执行字符串校正提供关键参考数据;
(2)基于待校正字符串中每一个字符出现的时间顺序和现场录像数据中每一个图像帧的时间戳执行字符与图像帧的匹配操作,以确定每一个字符作为待校正字符所对应的在所述现场录像数据中的图像帧;
(3)对待校正字符对应的图像帧执行人脸特征识别以获得人脸成像区域对应的人员国籍和人员嘴型,基于识别到的人员国籍和人员嘴型映射出相应的视觉识别字符,并采用视觉识别字符完成对待校正字符的现场校正,从而采用双重识别机制保障语音识别数据的可靠性。
根据本发明的第一方面,提供了一种语音信息识别校正方法,所述方法包括:
获取用户发出的语音信号,对所述语音信号执行基于声学特征的识别以获得与所述语音信号对应的第一识别字符串;
对所述第一识别字符串中的每一个字符执行上下文连贯性判断,以在所述第一识别字符串中存在上下文不连贯的字符时,将所述第一识别字符串判断为待校正字符串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海仙剑文化传媒股份有限公司,未经上海仙剑文化传媒股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110026093.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置