[发明专利]一种基于声音和视觉的多模态视频场景分割方法在审
申请号: | 201811182971.7 | 申请日: | 2018-10-11 |
公开(公告)号: | CN109344780A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 张奕;谢锦滨 | 申请(专利权)人: | 上海极链网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G10L25/57;G10L25/30 |
代理公司: | 上海海贝律师事务所 31301 | 代理人: | 范海燕 |
地址: | 202164 上海市崇明区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于声音和视觉的多模态视频场景分割方法,方法包括以下步骤:步骤S1:对输入视频进行镜头分割,得到各镜头片段;步骤S2:在分割得到的各镜头片段上进行视觉和声音特征提取,得到镜头对应的视觉和声音特征向量;步骤S3:根据视觉和声音特征,将相邻的属于相同语义的镜头合并入同一场景,得到新的场景时间边界。 | ||
搜索关键词: | 视觉 镜头 多模态视频 场景分割 声音特征 声音特征向量 镜头分割 时间边界 输入视频 同一场景 语义 场景 合并 分割 | ||
【主权项】:
1.一种基于声音和视觉的多模态视频场景分割方法,其特征在于:。包括以下步骤:步骤S1:对输入视频进行镜头分割,得到各镜头片段步骤S2:在分割得到的各镜头片段上进行视觉和声音特征提取,得到镜头对应的视觉和声音特征向量;步骤S3:根据视觉和声音特征,将相邻的属于相同语义的镜头合并入同一场景,得到新的场景时间边界。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海极链网络科技有限公司,未经上海极链网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811182971.7/,转载请声明来源钻瓜专利网。