[发明专利]一种基于语义的语音质检方法和装置在审
申请号: | 202010925791.4 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112037819A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 王建辉;吕超;杜新凯 | 申请(专利权)人: | 阳光保险集团股份有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/54;G10L15/26;G10L15/18 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李飞 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 语音 质检 方法 装置 | ||
1.一种基于语义的语音质检方法,其特征在于,包括:
分别获取规则语句和待质检文本,其中,所述待质检文本是通过对待质检语音进行语音识别后获得的;
对所述待质检文本进行分割,获得多个文本片段;
利用滑窗算法,将所述多个文本片段组合成多个候选语句;
从所述多个候选语句中筛选出至少一个目标候选语句;
根据所述规则语句和所述至少一个目标候选语句,获得语音质检结果。
2.根据权利要求1所述的语音质检方法,其特征在于,所述文本片段包括字、词、短语和句子中的一个或其任意组合。
3.根据权利要求1或2所述的语音质检方法,其特征在于,所述待质检文本为携带时间信息的文本,所述对所述待质检文本进行分割,获得多个文本片段,包括:
根据预设符号和所述时间信息,对所述待质检文本进行分割,获得所述多个文本片段。
4.根据权利要求3所述的语音质检方法,其特征在于,所述根据预设符号和所述时间信息,对所述待质检文本进行分割,获得所述多个文本片段,包括:
根据所述预设符号,对所述待质检文本进行分割,获得至少一个待比对片段;
根据所述时间信息,确定所述至少一个待比对片段中每个待比对片段对应的时间;
在当前待比对片段对应的时间大于等于第一预设时间的情况下,按照所述第一预设时间,对所述当前待比对片段进行分割,获得至少两个文本片段。
5.根据权利要求1所述的语音质检方法,其特征在于,所述利用滑窗算法,将所述多个文本片段组合成多个候选语句,包括:
获取当前滑窗内的所有文本片段的总长度;
在所述总长度大于等于预设区间的最小值且小于所述预设区间的最大值的情况下,将所述所有文本片段组合成一个所述候选语句,并按照预设步长,将所述当前滑窗沿着所述当前滑窗的扩张方向进行扩张,其中,所述预设区间是根据所述规则语句确定的。
6.根据权利要求5所述的语音质检方法,其特征在于,所述语音质检方法还包括:
在所述总长度小于所述预设区间的最小值的情况下,按照所述预设步长,将所述当前滑窗沿着所述当前滑窗的扩张方向进行扩张。
7.根据权利要求5所述的语音质检方法,其特征在于,所述语音质检方法还包括:
在所述总长度大于所述预设区间的最大值的情况下,按照所述预设步长,将所述当前滑窗沿着所述当前滑窗的收缩方向进行收缩。
8.根据权利要求5所述的语音质检方法,其特征在于,所述预设区间的最小值为第一预设参数和字符个数的乘积值,所述预设区间的最大值为第二预设参数和所述字符个数的乘积值,所述字符个数为所述规则语句所包含字符的个数。
9.根据权利要求1所述的语音质检方法,其特征在于,所述从所述多个候选语句中筛选出至少一个目标候选语句,包括:
在当前候选语句中的任意两个相邻文本片段之间的时间间隔小于等于第二预设时间的情况下,确定所述当前候选语句为所述目标候选语句;或者,
在当前候选语句对应的语速大于等于预设语速的情况下,确定所述当前候选语句为所述目标候选语句。
10.一种基于语义的语音质检装置,其特征在于,包括:
获取模块,用于分别获取规则语句和待质检文本,其中,所述待质检文本是通过对待质检语音进行语音识别后获得的;
分割模块,用于对所述待质检文本进行分割,获得多个文本片段;
组合模块,用于利用滑窗算法,将所述多个文本片段组合成多个候选语句;
筛选模块,用于从所述多个候选语句中筛选出至少一个目标候选语句;
获取模块,还用于根据所述规则语句和所述至少一个目标候选语句,获得语音质检结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光保险集团股份有限公司,未经阳光保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010925791.4/1.html,转载请声明来源钻瓜专利网。