[发明专利]一种音频片段的聚类方法、装置、电子设备和介质在审
申请号: | 202210828411.4 | 申请日: | 2022-07-13 |
公开(公告)号: | CN115050372A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 王斌;王乾坤;穆维林;杨晶生 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G10L17/18;G10L25/24;G10L25/30;G10L25/51;G10L25/84 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李博洋 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种音频片段的聚类方法、装置、电子设备和介质,该聚类方法包括:获取第一音频片段对应的第一聚类结果,获取当前采样周期采集的第二音频片段,根据所述第一聚类结果解析所述第二音频片段得到第二聚类结果;其中第二音频片段与上一采样周期采集的第一音频片段均截取自相同的实时音频流,第二聚类结果中包括在第二音频片段内至少一个说话人的身份标识信息和与身份标识信息对应的时间戳信息。本方法实现了流式的说话人音频流的切分和聚类,并在线实时更新说话人信息,从而能实时地反映说话人说话的情况,提高了说话人识别的精准度和用户体验。 | ||
搜索关键词: | 一种 音频 片段 方法 装置 电子设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210828411.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于电脑端的图形用户界面系统
- 下一篇:一种视角可调液晶显示屏