[发明专利]基于语义解析的文本确认方法、装置及终端设备在审
申请号: | 201811502282.X | 申请日: | 2018-12-10 |
公开(公告)号: | CN109817205A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 彭捷 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L25/93;G10L13/08;G06F17/27 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用于数据处理技术领域,提供了基于语义解析的文本确认方法、装置、终端设备以及计算机可读存储介质,包括:获取与目标语音对应的至少两个语音标注文本,并根据字数最多的语音标注文本对目标语音进行分节得到至少两段文本语音;将不同语音标注文本之间存在差异的部分文本确定为差异文本,并判断差异文本对应的差异语音是否带有清音属性;若差异语音带有清音属性,则判断差异文本与清音属性是否存在关联关系;将与清音属性存在关联关系的差异文本所对应的语音标注文本添加至标注集,将标注集中重复率最高的差异文本所对应的语音标注文本输出为确认结果。本发明基于清音属性判断语音标注文本是否正确,提升了语音标注的准确性。 | ||
搜索关键词: | 语音标注 文本 差异文本 关联关系 目标语音 语义解析 终端设备 标注 计算机可读存储介质 语音 数据处理技术 确认结果 属性判断 文本输出 文本语音 重复率 分节 两段 字数 | ||
【主权项】:
1.一种基于语义解析的文本确认方法,其特征在于,包括:获取与目标语音对应的至少两个语音标注文本,并根据字数最多的所述语音标注文本对所述目标语音进行分节得到至少两段文本语音,其中,不同的所述语音标注文本由不同的标注方生成;将不同所述语音标注文本之间存在差异的部分文本确定为差异文本,将所述差异文本对应的所述文本语音确定为差异语音,并判断所述差异语音是否带有清音属性;若所述差异语音带有所述清音属性,则判断所述差异文本与所述清音属性是否存在关联关系;将与所述清音属性存在关联关系的所述差异文本所对应的所述语音标注文本添加至标注集,并确定所述标注集中重复率最高的所述差异文本,将重复率最高的所述差异文本所对应的所述语音标注文本输出为确认结果,其中,所述重复率是指所述差异文本在所述标注集中的出现次数与所述标注集中所述语音标注文本的数量之间的比例。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811502282.X/,转载请声明来源钻瓜专利网。