[发明专利]视频中音频聚类的处理方法和装置有效
申请号: | 201911289077.4 | 申请日: | 2019-12-16 |
公开(公告)号: | CN110717067B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 闫启伟;黄宇凯;郝玉峰;曹琼;李科 | 申请(专利权)人: | 北京海天瑞声科技股份有限公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06K9/62;G06K9/00;G10L17/22;G10L17/02;G10L25/24 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李英艳;李志新 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种视频中音频聚类的处理方法和装置,其中,该方法包括:获取视频片段集,视频片段集包括多个视频片段;获取每个视频片段的音频;提取所述音频的音频特征;获取每个视频片段的人脸图像;提取人脸图像的人脸特征;基于视频片段的音频特征和人脸特征,确定音频之间的综合相似度;基于综合相似度,对音频进行聚类。通过本公开的处理方法,提高了音频聚类的准确率。 | ||
搜索关键词: | 视频 音频 处理 方法 装置 | ||
【主权项】:
1.一种视频中音频聚类的处理方法,其特征在于,所述方法包括:/n获取视频片段集,所述视频片段集包括多个视频片段;/n获取每个所述视频片段的音频;/n提取所述音频的音频特征;/n获取每个所述视频片段的人脸图像;/n提取所述人脸图像的人脸特征;/n基于所述视频片段的所述音频特征和所述人脸特征,确定所述音频之间的综合相似度;/n基于所述综合相似度,对所述音频进行聚类。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海天瑞声科技股份有限公司,未经北京海天瑞声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911289077.4/,转载请声明来源钻瓜专利网。