[发明专利]一种音频匹配方法及装置在审
申请号: | 201910089084.3 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109817242A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 马哲;高超 | 申请(专利权)人: | 北京雷石天地电子技术有限公司 |
主分类号: | G10L25/54 | 分类号: | G10L25/54;G10L25/57;G06K9/00;G06K9/62;G10H1/00 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 王新月 |
地址: | 100101 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 匹配 音频指纹 视频特征信息 视音频数据 信息数据库 匹配关系 音频作品 视音频信息 建立关联 信息建立 视音频 头像 存储 视频 查找 | ||
本发明涉及视音频处理技术领域,特别是涉及一种音频匹配方法及装置,其中方法权项包括:获取当前视音频数据中的音频指纹信息;当无法查找到与所述音频指纹信息相匹配的第一音频创作者信息时,获取所述当前视音频数据中的视频特征信息;在所述音频作品信息数据库中,查找与所述视频特征信息相匹配的第二音频创作者信息;将所述第二音频创作者信息与所述音频指纹信息建立匹配关系,并将该匹配关系存储至所述音频作品信息数据库中。本发明通过将原视频进行头像识别,进而与歌星建立关联性,解决了现有技术中无法根据视音频信息找到相应歌星信息的问题。
技术领域
本发明涉及视音频处理技术领域,特别是涉及一种音频匹配方法及装置。
背景技术
在传统的KTV中,每个歌曲都是预先存储到本地(包括分布式存储)的,所以每个歌曲都会有相应的完整的作品信息。
但随着互联网的深入发展,越来越多的KTV或点唱设备支持用户自选,或随机挑选热门视音频进行播放,有时播放的视音频并没有配套的完整的作品信息,这时用户便无从得到这些信息了;或者用户只得到部分视音频片段,更无法获知其作品信息。
发明内容
为解决现有技术中的问题,本发明提供一种音频匹配方法及装置,根据视音频中的视频信息与作品信息进行匹配,进而将音频指纹与作品信息进行关联存储,以解决无法获知音频对应的作品信息的问题。
为达到上述目的,一方面,本发明实施例提供一种音频匹配方法,包括:
获取当前视音频数据中的音频指纹信息;
在音频作品信息数据库中,查找与所述音频指纹信息相匹配的第一音频创作者信息;
当无法查找到与所述音频指纹信息相匹配的第一音频创作者信息时,获取所述当前视音频数据中的视频特征信息;
在所述音频作品信息数据库中,查找与所述视频特征信息相匹配的第二音频创作者信息;
将所述第二音频创作者信息与所述音频指纹信息建立匹配关系,并将该匹配关系存储至所述音频作品信息数据库中;
将与所述音频指纹信息相匹配的音频作品信息发送至播放终端并展示给用户。
可选的,所述获取所述当前视音频数据中的视频特征信息,包括:
将所述当前视音频数据中的视频文件根据预设时间间隔进行抽帧,得到多个抽样帧;
分别对所述抽样帧进行人脸识别并进行数据统计,得到出现频率最高的人的面部数据;
根据所述出现频率最高的人的面部数据,生成视频特征信息;所述视频特征信息包括与所述出现频率最高的人的面部数据对应的第一头像指纹。
可选的,所述在所述音频作品信息数据库中,查找与所述视频特征信息相匹配的第二音频创作者信息包括:
所述在所述音频作品信息数据库中,查找与所述第一头像指纹相匹配的第二头像指纹;所述第二音频创作者信息中包括所述第二头像指纹。
可选的,所述将所述第二音频创作者信息与所述音频指纹信息建立匹配关系包括:
将所述音频指纹信息与所述第二头像指纹对应的人名建立匹配关系;所述第二音频创作者信息包括所述人名。
可选的,将与所述音频指纹信息相匹配的音频作品信息发送至播放终端并展示给用户包括:
当查找到与所述音频指纹信息相匹配的第一音频创作者信息时,将所述第一音频创作者信息发送至播放终端并展示给用户;
当无法查找到与所述音频指纹信息相匹配的第一音频创作者信息时,将所述第二音频创作者信息发送至播放终端并展示给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雷石天地电子技术有限公司,未经北京雷石天地电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910089084.3/2.html,转载请声明来源钻瓜专利网。