[发明专利]一种语料获取方法及装置在审
申请号: | 202110019112.1 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112863490A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 马金龙;熊佳;汪暾;罗箫;焦南凯;徐志坚;谢睿;陈光尧 | 申请(专利权)人: | 广州欢城文化传媒有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L15/26;G10L25/51 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨小红 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种语料获取方法及装置,方法包括:获取语音样本;过滤语音样本中的截断语音以及无效语音,获取合格的语音样本;对合格的语音样本进行多次语音识别,得到多个对应的语音文本;将多个语音文本进行比对,得到相似度得分;若相似度得分大于预设的相似度阈值,则将大于相似度阈值的语音样本作为待标注语音样本,并将文字内容最长的语音文本作为待标注语音文本;将待标注语音文本进行人工标注,得到标注样本。解决了现有技术获取训练用的语音样本时间周期长,花费成本高的技术问题。 | ||
搜索关键词: | 一种 语料 获取 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢城文化传媒有限公司,未经广州欢城文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110019112.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种识别装置、识别方法及电子设备
- 下一篇:一种智慧物流用自动搬运机器人