[发明专利]语音数据情感标注方法、装置、计算机设备及存储介质在审
申请号: | 201910279565.0 | 申请日: | 2019-04-09 |
公开(公告)号: | CN110047469A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 王义文;张文龙;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/26;G10L25/63 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音数据情感标注方法、装置、计算机设备及存储介质,应用于语音数据处理领域,用于解决当前语音数据情感标注的准确率低下的问题。本发明提供的方法包括:获取待情感标注的目标语音;对目标语音进行语音识别,得到目标文本;提取目标文本中的各个关键词,并记录每个关键词对应的语音片段;根据每个关键词对应的语音片段确定出每个关键词对应的特征向量;在得到各个关键词对应的特征向量之后,对各个关键词对应的特征向量进行聚类,直到满足预设的条件,聚类后得到各个向量集;从每个向量集中随机抽取第一数量个特征向量;获取标注人员在各个指定情感维度对每个向量集对应的语音语句在整体上所作的打分分值,作为情感标注值。 | ||
搜索关键词: | 标注 特征向量 语音数据 计算机设备 存储介质 目标文本 目标语音 语音片段 向量集 聚类 语音数据处理 随机抽取 语音识别 语音语句 准确率 维度 向量 预设 记录 应用 | ||
【主权项】:
1.一种语音数据情感标注方法,其特征在于,包括:获取待情感标注的目标语音;对所述目标语音进行语音识别,得到目标文本;提取所述目标文本中的各个关键词,并记录每个关键词对应的语音片段;根据每个关键词对应的语音片段确定出所述每个关键词对应的特征向量;在得到所述各个关键词对应的特征向量之后,对所述各个关键词对应的特征向量进行聚类,直到满足预设的条件,聚类后得到各个向量集,每个向量集包括一个以上的特征向量;针对所述各个向量集中的每个向量集,从所述每个向量集中随机抽取第一数量个特征向量;获取标注人员在各个指定情感维度对所述每个向量集对应的语音语句在整体上所作的打分分值,作为所述每个向量集的情感标注值,所述每个向量集对应的语音语句是指从所述每个向量集中抽取出的各个特征向量对应的各个关键词分别所处的完整语句的语音片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910279565.0/,转载请声明来源钻瓜专利网。
- 上一篇:语音识别方法、装置及存储介质
- 下一篇:一种语音端点检测方法