[发明专利]基于语义解析的文本确认方法、装置及终端设备在审
申请号: | 201811502282.X | 申请日: | 2018-12-10 |
公开(公告)号: | CN109817205A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 彭捷 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L25/93;G10L13/08;G06F17/27 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音标注 文本 差异文本 关联关系 目标语音 语义解析 终端设备 标注 计算机可读存储介质 语音 数据处理技术 确认结果 属性判断 文本输出 文本语音 重复率 分节 两段 字数 | ||
1.一种基于语义解析的文本确认方法,其特征在于,包括:
获取与目标语音对应的至少两个语音标注文本,并根据字数最多的所述语音标注文本对所述目标语音进行分节得到至少两段文本语音,其中,不同的所述语音标注文本由不同的标注方生成;
将不同所述语音标注文本之间存在差异的部分文本确定为差异文本,将所述差异文本对应的所述文本语音确定为差异语音,并判断所述差异语音是否带有清音属性;
若所述差异语音带有所述清音属性,则判断所述差异文本与所述清音属性是否存在关联关系;
将与所述清音属性存在关联关系的所述差异文本所对应的所述语音标注文本添加至标注集,并确定所述标注集中重复率最高的所述差异文本,将重复率最高的所述差异文本所对应的所述语音标注文本输出为确认结果,其中,所述重复率是指所述差异文本在所述标注集中的出现次数与所述标注集中所述语音标注文本的数量之间的比例。
2.如权利要求1所述的文本确认方法,其特征在于,所述判断所述差异语音是否带有清音属性,包括:
将所述差异语音按照预设的尺度时长平均拆分为至少两段子语音,并将每一段所述子语音与预设的消减系数进行乘积运算后,获取每一段所述子语音的属性衡量值,其中,所述属性衡量值用于指示所述子语音的能量高低;
将落入预设的目标衡量值区间的所述属性衡量值所对应的至少两段连续的所述子语音归入子语音集,获取得到的每个所述子语音集的子语音数量;
若存在超过预设数量的所述子语音数量,则确定所述差异语音带有所述清音属性。
3.如权利要求2所述的文本确认方法,其特征在于,判断所述差异文本与所述清音属性是否存在关联关系,包括:
将所述差异文本与预设的目标字库中的所有目标字进行比对,其中,所述目标字是带有所述清音属性对应的音标的字;
若所述差异文本中含有所述目标字,则确定所述差异文本与所述清音属性存在关联关系。
4.如权利要求3所述的文本确认方法,其特征在于,所述若所述差异文本中含有所述目标字,则确定所述差异文本与所述清音属性存在关联关系,包括:
计算所述差异文本中所述清音属性对应的音标相对于所述差异文本中所有音标的音标占比区间,并根据所述音标占比区间以及所述差异语音的时长计算第一发音区间,其中,所述第一发音区间是预期的所述清音属性对应的音标在所述差异语音中所占的发音时段;
确定超过所述预设数量的所述子语音数量所对应的所述子语音集,并确定所述子语音集中的所有所述子语音在所述差异语音中所占的第二发音区间;
若所述第一发音区间与所述第二发音区间之间的重合度超过预设的重合度阈值,则确定所述差异文本与所述清音属性存在关联关系。
5.如权利要求1所述的文本确认方法,其特征在于,若所述标注集内的所述语音标注文本中存在至少两个所述差异文本,则所述确定所述标注集中重复率最高的所述差异文本,将重复率最高的所述差异文本所对应的所述语音标注文本输出为确认结果,包括:
获取与所述标注集中每个所述差异文本对应的预设基础值,并基于所述预设基础值对所述语音标注文本中每个所述差异文本对应的所述重复率进行加权求和,得到文本评分值;
将数值最高的所述文本评分值对应的所述语音标注文本输出为所述确认结果。
6.如权利要求5所述的文本确认方法,其特征在于,所述获取所述语音标注文本中与每个所述差异文本对应的预设基础值,包括:
获取所述语音标注文本对应的所述标注方的错误标注记录,所述错误标注记录中包括有所述标注方已识别出错的文本;
若所述错误标注记录含有所述语音标注文本中的所述差异文本,则将所述差异文本对应的所述预设基础值设置为第一预设值;
若所述错误标注记录未含有所述语音标注文本中的所述差异文本,则将所述差异文本对应的所述预设基础值设置为第二预设值,其中,所述第二预设值大于所述第一预设值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811502282.X/1.html,转载请声明来源钻瓜专利网。