[发明专利]语音标注系统、方法、终端及存储介质在审

专利信息
申请号: 202210197982.2 申请日: 2022-03-02
公开(公告)号: CN114582328A 公开(公告)日: 2022-06-03
发明(设计)人: 杨磊;陈震;段志峰;张庆;刘国平 申请(专利权)人: 上海钧正网络科技有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/02;G10L15/22;G10L25/27;G10L25/45
代理公司: 上海文舜致远专利代理事务所(普通合伙) 31445 代理人: 许红英
地址: 201199 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 标注 系统 方法 终端 存储 介质
【说明书】:

发明提供语音标注系统、方法、终端及存储介质,优化平台标注流程,解耦数据采集、数据标注及方案设计这三个阶段,让各个阶段变成可独立运转的系统模块,不再相互等待,模块之间通过语音数据作为联系的载体,从而实现研发人员可随时从语音库中获取最新、分类最全面、最贴近业务场景的标注语音数据;可依托庞大的用户基数,在脱敏、数据安全治理和用户许可下,定时自动获取用户线上语音数据作为数据采集源,由此可获得更为庞大、复杂度更高、更贴合业务场景的标注数据,能够训练出效果更好的模型;引入人工标注+自研AI算法辅助标注并存的模式,能够切实有效地提高标注效率和质量,降低标注成本。

技术领域

本发明涉及计算机应用技术领域,尤其涉及语音标注系统、方法、终端及存储介质。

背景技术

人工智能是机器产生的智能,在计算机领域是指根据对环境的感知,做出合理的行动并获得最大收益的计算机程序。要想实现人工智能,就需要把人类理解和判断事物的能力教给计算机,让其拥有类似人类的识别能力。数据标注可视为模仿人类学习过程中的经验学习,相当于人类从书本中获取已知知识的认知行为。数据标注为人工智能企业提供了大量带标签的数据,供机器训练和学习,从而保证算法模型的有效性。

目前常用的模型训练上线流程如图1所示:先沟通需求,再获取样本,对样本进行标注,基于标注过的样本进行模型训练,再调整样本,训练模型至准确率达标,交付应用且交互研发,最后将模型上线使用。

其中的样本标注即数据标注,是对未处理的初级数据进行加工处理,并转换为机器可识别信息的过程;原始数据一般通过数据采集获得,随后的数据标注相当于对数据进行加工,然后输送到人工智能算法和模型里进行调用。数据标注产业主要是根据用户或企业的需求,对数据进行不同方式的标注,从而为人工智能算法提供大量的训练数据以供机器学习使用。如今在技术的推动下,数据标注平台已经替代传统人工成为数据标注的主力。数据标注是帮助机器学习认知数据特征的重要过程。数据标注平台针对数据标注过程,实现包括数据提取、标注任务分配、标注人员管理等一系列功能,不断为模型训练提供优质、可靠的标注数据。

目前很多语音识别产品升级,需要进行大量的模型训练来提高语音识别的性能,例如哈啰ASR语音识别系统。而模型训练要求前期对各类语音进行大量标注并输入到训练系统中,由训练系统对标注数据进行加工处理并经过一系列算法调优后,输出业务可用的ASR语音识别系统。作为模型训练的先导环节,语音标注具有至关重要的意义。

当前业界较为成熟的解决方案如图2所示,具体包括如下各个阶段:

阶段一:方案设计阶段。在该阶段中,根据产品需求选择对应的数据,并将数据组合成各种场景。例如,哈啰电动车VVSmart的ASR语音识别需求,语音数据类型需要包含:是否含唤醒词,男女声区分,普通话方言区分,远近距离区分,是否含噪声等等。研发人员需要根据业务场景灵活组合各类数据类型。

阶段二:标注实施阶段。在该阶段中,对挑选出来的语音,通过任务分配的方式,安排人工进行语音数据的清洗、评估、提取、标注等操作,而后再通过人工多级审核的方式进行数据质检,确保标注结果正确性。

阶段三:数据验收阶段。将标注完成后的语音数据,提交给模型训练人员,验收后供模型训练使用。

然而,上述的解决方案仍存在如下各种问题:

首先是数据体量问题:对于机器学习和深度学习等算法来说,数据样本量越大,分类越丰富,复杂度越高,越贴合产品业务场景,对算法模型的训练效果就越好。但单纯通过人工搜集的语音样本,极难满足模型训练样本的要求。

其次是流程设计问题:上述语音标注流程中,用户选取数据场景后,需要等待语音标注完成才能进行模型训练。等待时长=待标注语音数量*单条语音标注耗时。这势必会拖慢算法模型训练节奏,影响产品上线周期。同时,未经标注的语音,研发人员根据需求场景进行选取时,往往会出现无从下手的局面。需要花费很多的时间在语音试听,筛选的工作上。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海钧正网络科技有限公司,未经上海钧正网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210197982.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top