[发明专利]获取MV视频资源中字幕信息的方法及系统有效
申请号: | 201510351335.2 | 申请日: | 2015-06-23 |
公开(公告)号: | CN107027067B | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 邓宏平;刘青;吴爱红;张银田;魏征;吴子扬;常欢;魏思;胡郁;刘庆峰 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
主分类号: | H04N21/431 | 分类号: | H04N21/431;H04N21/435 |
代理公司: | 11252 北京维澳专利代理有限公司 | 代理人: | 刘路尧;逢京喜 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 mv 视频 资源 字幕 信息 方法 系统 | ||
本发明公开了一种获取MV视频资源中字幕信息的方法及系统,该方法包括:获取MV视频资源;根据所述MV视频资源中的视频帧图像确定所述MV视频资源中的字幕空间位置;根据所述字幕的空间位置确定的上下边界之间的图像确定所述字幕的时间位置;依次计算每个时间位置内的字幕条的时间线。本发明可以实现对唱评资源中字幕信息的自动采集,并提高唱评资源的准确性。
技术领域
本发明涉及信息采集技术领域,具体涉及一种获取MV视频资源中字幕信息的方法及系统。
背景技术
随着科技的不断发展,以及人们生活水平的不断提高,人们的休闲娱乐生活越来越丰富,比如参加各种歌唱比赛以及去KTV唱歌已日益普遍,因而唱歌的打分和评测需求就相应而生。目前主流的唱歌打分系统,是通过对音高、节奏和歌词三方面的信息进行评测。因此,储备数量足够多、质量足够好的评测资源,成为该系统体验好坏的直接决定性因素。
考虑到成本与版权的问题,目前唱评资源的制作主要通过以下两种方式:
1.人工标注方式:由有一定音乐基础的人,对歌曲的歌词进行校对、补充,并通过听取音频文件,标注歌曲歌唱的音高、音长,从而实现唱评资源的标注工作。
2.乐器弹奏方式:由音乐造诣较高的人,对利用乐器歌曲进行弹奏,然后利用特制的软件进行录制,从而得到歌曲的音高、音长信息,再结合现有歌词的信息,完成唱评资源的标注。
现有的基于人工标注的方法,不仅效率低,成本高,而且标注过程中也会受到标注人员疲惫疏忽而造成的错误标注的困扰。而基于乐器弹奏的方法,同样需要人工参与,弹奏人员的技术熟练程度也会影响标注结果;对于大规模的标注任务,弹奏人员受到的压力同样不小;此外,如果弹奏的节奏与MV视频中的节奏不能完全吻合,就会影响最终的唱歌打分。因而采用传统的唱评资源采集方法,难以实现大规模的唱评资源采集。
发明内容
本发明实施例提供一种获取MV视频资源中字幕信息的方法及系统,以实现对唱评资源中字幕信息的自动采集,并提高唱评资源的准确性。
为此,本发明实施例提供如下技术方案:
一种获取MV视频资源中字幕信息的方法,包括:
获取MV视频资源;
根据所述MV视频资源中的视频帧图像确定所述MV视频资源中的字幕空间位置;
根据所述字幕的空间位置确定的上下边界之间的图像确定所述字幕的时间位置;
依次计算每个时间位置内的字幕条的时间线。
优选地,所述根据所述MV视频资源中的视频帧图像确定所述MV视频资源中的字幕空间位置包括:
对所述MV视频资源进行灰度处理,得到各视频帧图像的灰度图;
利用所述灰度图计算所述视频帧图像的梯度特征;
根据所述视频帧图像的梯度特征得到只含字幕区域像素的视频帧图像;
对所述只含字幕区域像素的视频帧图像做投影处理,并利用投影曲线计算得到字幕条的上下边界。
优选地,所述根据所述视频帧图像的梯度特征得到只含字幕区域像素的视频帧图像包括:
根据所述视频帧图像的梯度特征考察多个连续的视频帧图像内的候选梯度点,所述候选梯度点是指梯度幅值大于设定的幅度阈值的梯度点;
如果当前视频帧图像中的每个候选梯度点的设定邻域内,对应在前一视频帧图像中也存在一个候选梯度点,则确定所述候选梯度点为稳定梯度点;
获取只含稳定梯度点的视频帧图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510351335.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:反相器电路
- 下一篇:电路装置、振荡器、电子设备以及移动体