[发明专利]基于口型特征的字幕调整方法以及装置在审
申请号: | 202110267541.0 | 申请日: | 2021-03-11 |
公开(公告)号: | CN113033357A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 卢启伟;刘善果;刘胜强 | 申请(专利权)人: | 深圳市鹰硕技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06T7/62;H04N21/488 |
代理公司: | 深圳余梅专利代理事务所(特殊普通合伙) 44519 | 代理人: | 陈余才 |
地址: | 518000 广东省深圳市宝安区新安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开是关于一种基于口型特征的字幕调整方法、装置、电子设备以及存储介质。其中,该方法包括:基于图像识别述视频中发言人的唇部定位;选取唇部的预设唇部区域,生成基于时间变化的预设唇部区域唇部所占面积的时序曲线;基于预设拟合算法生成拟合曲线;基于所述字幕信息及所述字幕信息对应的标准口型信息生成基于字幕展示时间变化的预设唇部区域唇部所占面积的标准曲线,将所述标准曲线和拟合曲线对比,并根据对比结果调整所述字幕信息的展示时间。本公开通过基于唇部特征区域唇部占比面积统计的方式,开创性的实现了音频字幕与图像画面的时间匹配,极大的提高了用户体验。 | ||
搜索关键词: | 基于 口型 特征 字幕 调整 方法 以及 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市鹰硕技术有限公司,未经深圳市鹰硕技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110267541.0/,转载请声明来源钻瓜专利网。