[发明专利]一种文字校验方法及装置有效
申请号: | 201711386355.9 | 申请日: | 2017-12-20 |
公开(公告)号: | CN109949828B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 王群 | 申请(专利权)人: | 苏州君林智能科技有限公司 |
主分类号: | G10L25/54 | 分类号: | G10L25/54;G06F40/279 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 215163 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 校验 方法 装置 | ||
1.一种文字校验方法,其特征在于,所述方法包括:
获取语音信号;
在所述语音信号中的语句停顿信号处进行断句,生成语音信号片段;
按照语音信号片段的时间先后顺序对全部语音信号片段进行分组;
确定各组语音信号片段中第一个语音信号片段的第三时间戳,所述第三时间戳与各组语音信号片段中第一个语音信号片段的第二时间戳相同;
当检测到播放指令时,获取文本中待校验的文字,所述待校验的文字包括至少一个文字;
确定所述待校验的文字所在的文字段的第一时间戳,所述待校验的文字所在的文字段为目标语音信号片段经过语音识别后生成的文字段,所述文本包括至少一个文字段,每个文字段对应一个语音信号片段;
确定与所述第一时间戳差值最小的目标时间戳,所述目标时间戳为所述第三时间戳中的一个;
如果所述第一时间戳大于所述目标时间戳,则从所述目标时间戳对应的语音信号片段开始向后依次搜索各个语音信号片段的第二时间戳,确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段,否则从所述目标时间戳对应的语音信号片段开始向前依次搜索各个语音信号片段的第二时间戳,确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段;
播放所述目标语音信号片段。
2.根据权利要求1所述的方法,其特征在于,当检测到播放指令时,获取文本中待校验的文字之前,包括:
将所述语音信号片段转换为文字段;
对所述文字段标记第一时间戳,以及对所述语音信号片段标记第二时间戳。
3.根据权利要求2所述的方法,其特征在于,对所述文字段标记第一时间戳,以及对所述语音信号片段标记第二时间戳,包括:
利用所述语音信号片段的起始时间和/或结束时间对所述文字段标记第一时间戳,以及对所述语音信号片段标记第二时间戳,所述第一时间戳与所述第二时间戳相同。
4.根据权利要求2所述的方法,其特征在于,获取语音信号之后,以及对所述文字段标记第一时间戳,对所述语音信号片段标记第二时间戳之前,还包括:
将所述语音信号转换为文字;
根据所述文字的语意,对所述文字进行断句,生成文字段;
根据所述文字段对所述语音信号进行断句,生成语音信号片段。
5.一种文字校验装置,其特征在于,包括:
确定单元,用于对全部语音信号片段进行分组;确定各组语音信号片段中第一个语音信号片段的第三时间戳,所述第三时间戳与所述第一个语音信号片段的第二时间戳相同;
第一获取单元,用于当检测到播放指令时,获取文本中待校验的文字,所述待校验的文字包括至少一个文字;
确定单元,确定所述待校验的文字所在的文字段的第一时间戳,所述待校验的文字所在的文字段为目标语音信号片段经过语音识别后生成的文字段,所述文本包括至少一个文字段,每个文字段对应一个语音信号片段;确定与所述第一时间戳差值最小的目标时间戳,所述目标时间戳为所述第三时间戳中的一个;如果所述第一时间戳大于所述目标时间戳,则从所述目标时间戳对应的语音信号片段开始向后依次搜索各个语音信号片段的第二时间戳,确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段,否则从所述目标时间戳对应的语音信号片段开始向前依次搜索各个语音信号片段的第二时间戳,确定与所述第一时间戳相同的第二时间戳对应的目标语音信号片段;
播放单元,用于播放所述目标语音信号片段。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
转换单元,用于将所述语音信号片段转换为文字段;
标记单元,用于对所述文字段标记第一时间戳,以及对所述语音信号片段标记第二时间戳。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州君林智能科技有限公司,未经苏州君林智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711386355.9/1.html,转载请声明来源钻瓜专利网。