[发明专利]音乐与图像间语义相似度的估计方法和估计系统有效

专利信息
申请号: 201310148164.4 申请日: 2013-04-25
公开(公告)号: CN103793447B 公开(公告)日: 2019-05-14
发明(设计)人: 汤晓鸥;吴希宣;乔宇 申请(专利权)人: 汤晓鸥
主分类号: G06F16/432 分类号: G06F16/432;G06F16/48;G06T7/00;G10L25/48
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 吴平
地址: 中国香港香港中*** 国省代码: 中国香港;81
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音乐 图像 语义 相识 估计 方法 系统
【权利要求书】:

1.一种音乐与图像间语义相似度的估计方法,包括以下步骤:

构建一个具有匹配关系音乐与图像对的数据库;

从所述数据库中获取具有匹配关系的音乐和图像对,并从获取到的所述音乐和图像中分别抽取特征表示;

根据所述获取到的所述音乐和图像的特征表示和匹配关系,利用机器学习的方法,建立音乐与图像间语义相似度的估计模型;

获取目标图像和目标音乐,利用所述估计模型对目标图像和目标音乐进行语义相似度估计;

所述获取目标图像和目标音乐,利用所述估计模型对目标图像和目标音乐进行语义相似度估计,包括:

选取一部分具有匹配关系的音乐和图像对作为参考音乐和图像对;

分别计算目标音乐的音乐特征和所述目标图像的图像特征;

利用所述音乐特征和所述图像特征计算参考距离特征,所述参考距离特征包括第一参考距离特征和第二参考距离特征,所述第一参考距离特征为利用所述音乐特征计算所得的所述目标音乐与各所述参考音乐和图像对中的音乐之间的距离,所述第二参考距离特征为利用所述图像特征计算所得的所述目标图像与各所述参考音乐和图像对中的图像之间的距离;

通过所述估计模型对所述参考距离特征进行相关分析或典型相关分析,得到所述目标音乐与所述目标图像间的相似度估计结果。

2.根据权利要求1所述的音乐与图像间语义相似度的估计方法,其特征在于,所述构建一个具有匹配关系音乐与图像对的数据库包括步骤:

预先标定音乐图像对相似度的比较信息,包括步骤:

获取音视频文件,并从所述音视频文件中提取相对应的音乐和不同场景的图像;

匹配每一帧图像对应的音乐段;

对图像和音乐段的相似度进行标定,得到音乐图像对相似度的比较信息。

3.根据权利要求1至2中任一项所述的音乐与图像间语义相似度的估计方法,其特征在于,所述根据所述特征表示和匹配关系,利用机器学习的方法,建立音乐与图像间语义相似度的估计模型的步骤包括:

根据音乐的语义特征对音乐进行聚类得到音乐类;

根据音乐类对相应的图像进行划分和聚类得到图像类;

从每个类中选取参考音乐和相应的图像构成参考对;

计算训练数据与每个类中参考对之间的语义距离;

根据所述语义距离及预先标定的音乐图像对相似度的比较信息构建典型相关分析模型;

所述根据音乐的语义特征对音乐进行聚类的步骤包括:

从音乐库获取音乐文件及语义标签属性,计算所述语义标签属性的概率,所述语义标签属性的概率作为音乐的语义特征,根据所述语义标签属性的概率采用归一化分割法对音乐进行聚类。

4.根据权利要求1至2中任一项所述的音乐与图像间语义相似度的估计方法,其特征在于,所述利用所述估计模型对目标图像和目标音乐进行语义相似度估计包括:

由各类相似度估计函数加权获得所述目标音乐与所述目标图像间的相似度估计函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤晓鸥,未经汤晓鸥许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310148164.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top