[发明专利]一种文字校验方法及装置有效
申请号: | 201711386355.9 | 申请日: | 2017-12-20 |
公开(公告)号: | CN109949828B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 王群 | 申请(专利权)人: | 苏州君林智能科技有限公司 |
主分类号: | G10L25/54 | 分类号: | G10L25/54;G06F40/279 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 215163 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 校验 方法 装置 | ||
本发明实施例提供了一种文字校验方法及装置,该方法包括当检测到播放指令时,获取文本中待校验的文字,所述待校验的文字包括至少一个文字;确定所述待校验的文字对应的目标语音信号片段,所述待校验的文字所在的文字段为所述目标语音信号片段经过语音识别后生成的文字段,所述文本包括至少一个文字段,每个文字段对应一个语音信号片段;播放所述目标语音信号片段。本发明实施例在确定待校验的文字后,可以根据待校验的文字对应的时间戳准确地确定相应的语音信号片段并进行播放,所以本实施例提供的方法使用比较方便,能够提高校验效率。
技术领域
本发明实施例涉及语音文字转换技术领域,尤其涉及一种文字校验方法及装置。
背景技术
目前,随着智能语音文字转换技术的发展,将语音转换为文字的效率得到了大大提高。智能语音文字转换技术可以应用于会议记录、培训记录或采访记录中。在对语音信号进行文字转换时,首先提取语音信号的特征参数,再将该特征参数与语音数据库中文字对应的特征参数进行匹配,从而得到匹配度最高的文字并输出。对于在安静环境下的标准普通话语音的文字转换,准确率较高。但是,在现实场景下,发言者无可避免地会带有一定的地方口音,并且无法保证在安静的环境下进行录音,所以无法保证语音文字转换的准确率。
在无法保证语音文字转换准确率的情况下,需要人工对转换后的文字进行校验。当校验人员发现错误文字时,需要依据原录音内容进行改正。对于较长的录音,虽然可以根据错误文字的位置,判断用于校正错误文字的那段语音内容的大概位置,但是这种方式通常要多次尝试播放,多次试听,才能准确播放出校验需要的那段语音内容,所以比较浪费时间,导致校验效率比较低下。
发明内容
本发明实施例提供了一种将文字校验方法及终端,以提供一种能够提高文字校验效率的方法。
本发明实施例提供了一种文字校验方法,包括:
当检测到播放指令时,获取文本中待校验的文字,所述待校验的文字包括至少一个文字;
确定所述待校验的文字对应的目标语音信号片段,所述待校验的文字所在的文字段为所述目标语音信号片段经过语音识别后生成的文字段,所述文本包括至少一个文字段,每个文字段对应一个语音信号片段;
播放所述目标语音信号片段。
进一步地,确定所述待校验的文字对应的目标语音信号片段,包括:
确定所述待校验的文字所在的文字段的第一时间戳;
确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段,所述第二时间戳为语音信号片段标记的时间戳。
进一步地,确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段,包括:
对全部语音信号片段进行分组;
确定各组语音信号片段中第一个语音信号片段的第三时间戳,所述第三时间戳与所述第一个语音信号片段的第二时间戳相同;
确定与所述第一时间戳差值最小的目标时间戳,所述目标时间戳为所述第三时间戳中的一个;
如果所述第一时间戳大于所述目标时间戳,则从所述目标时间戳对应的语音信号片段开始向后依次搜索各个语音信号片段的第二时间戳,确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段,否则从所述目标时间戳对应的语音信号片段开始向前依次搜索各个语音信号片段的第二时间戳,确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段。
进一步地,当检测到播放指令时,获取文本中待校验的文字之前,包括:
获取语音信号;
在所述语音信号中的语句停顿信号处进行断句,生成语音信号片段;
将所述语音信号片段转换为文字段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州君林智能科技有限公司,未经苏州君林智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711386355.9/2.html,转载请声明来源钻瓜专利网。