[发明专利]一种在线标注方法及系统在审
申请号: | 202010548311.7 | 申请日: | 2020-06-16 |
公开(公告)号: | CN111785272A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 朱宇 | 申请(专利权)人: | 杭州云嘉云计算有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/51 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
地址: | 311100 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 标注 方法 系统 | ||
1.一种在线标注方法,其特征是,包括以下步骤:
S1,利用ASR引擎识别待标注音频得到原始音频日志和短音频;
S2,对原始音频日志和短音频进行解析,获取识别结果和音频相关信息;
S3,对识别结果进行在线标注,得到标注结果;
S4,根据识别结果和标注结果进行对比计算识别率;
S5,利用音频相关信息对ASR引擎识别效果进行统计。
2.根据权利要求1所述的一种在线标注方法,其特征是,所述音频相关信息包括截幅比、音量、前信噪比、后信噪比、音频时长、识别延时、语句长度和传输延时。
3.根据权利要求2所述的一种在线标注方法,其特征是,步骤S5具体包括:
S501,设定截幅比、音量、前信噪比和后信噪比的阈值范围;
S502,将音频相关信息与阈值范围进行比对,若超过阈值范围则标记为异常音频,并定位异常音频;
S503,计算异常音频占比,并以web客户端通过图表展示。
4.根据权利要求2所述的一种在线标注方法,其特征是,步骤S5具体包括:
S511,对音频时长、识别延时、语句长度和传输延时进行计算得到相关参数;
S512,设定相关参数的阈值范围,若相关参数超过阈值范围,对相关参数进行标记;
S513,用web客户端将相关参数以及带标记的相关参数用图表展示。
5.根据权利要求4所述的一种在线标注方法,其特征是,所述相关参数包括实时率、总实时率、排队时延、识别延时。
6.根据权利要求1所述的一种在线标注方法,其特征是,步骤S4具体包括:获取识别结果关于缺漏错误、增添错误和替换错误的信息,计算识别率,所述识别率包括缺漏识别率、增添识别率、替换识别率和总错误识别率。
7.一种在线标注系统,采用权利要求1所述的一种在线标注方法,其特征是,包括:
解析子系统,对原始音频日志和短音频进行解析,获取识别结果和音频相关信息;
在线标注子系统,对识别结果进行在线标注,得到标注结果;
统计子系统,根据识别结果和标注结果进行对比计算识别率,利用音频相关信息对ASR引擎识别效果进行统计;
垂直分数据库,分开存储解析和标注不同的阶段产生的数据。
8.根据权利要求7所述的一种在线标注系统,其特征是,还包括标注音频管控子系统,根据不同的业务场景建立不同的项目和任务对需要标注的音频进行管控。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云嘉云计算有限公司,未经杭州云嘉云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010548311.7/1.html,转载请声明来源钻瓜专利网。