[发明专利]字幕生成方法及装置、电子设备有效
申请号: | 201910996249.5 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110798636B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 梁志杰 | 申请(专利权)人: | 腾讯数码(天津)有限公司 |
主分类号: | H04N5/278 | 分类号: | H04N5/278;H04N5/265;H04N5/445;H04N21/44;H04N21/439;H04N21/431;H04N21/488;G10L15/26;G06F40/289;G06F16/31 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 300000 天津市滨海新区经济技术开*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 生成 方法 装置 电子设备 | ||
1.一种字幕生成方法,其特征在于,包括:
对字幕文本进行关键词提取并确定各所述关键词的权重信息;
根据所述字幕文本对应的音频数据确定各所述关键词的声学特征参数;
根据各所述关键词的权重信息以及声学特征参数,确定所述关键词的突出显示效果;
根据所述字幕文本以及所述字幕文本中所述关键词的突出显示效果生成目标字幕;
对目标图像进行识别,以确定指定对象在所述目标图像中的位置;
将所述目标图像中,所述指定对象之外的位置作为候选区域;
将所述目标图像划分为多个子区域,并将位于所述候选区域的子区域作为候选子区域;
分别计算各所述候选子区域的像素灰度值离散程度数据;
根据各所述候选子区域的像素灰度值离散程度数据,选取一个或多个所述候选子区域作为目标区域,并将所述目标字幕添加至所述目标图像的所述目标区域。
2.根据权利要求1所述的字幕生成方法,其特征在于,所述方法还包括:
对所述音频数据进行语音识别以获取所述字幕文本。
3.根据权利要求1所述的字幕生成方法,其特征在于,对字幕文本进行关键词提取并确定各所述关键词的权重信息,包括:
对所述字幕文本进行分词处理,得到多个分词;
计算各所述分词在所述字幕文本中的词频并获取各所述分词的逆文本频率指数;
结合各所述分词的词频及逆文本频率指数计算各所述分词的权重信息;
根据各所述分词的权重信息,从所述分词中确定所述关键词以及所述关键词对应的权重信息。
4.根据权利要求1所述的字幕生成方法,其特征在于,根据所述字幕文本对应的音频数据确定各所述关键词的声学特征参数,包括:
获取所述音频数据中各所述关键词对应的音频片段的响度信息;
对于每一所述关键词,根据该所述关键词对应的音频片段的响度信息确定该所述关键词的声学特征参数。
5.根据权利要求1所述的字幕生成方法,其特征在于,根据各所述关键词的权重信息以及声学特征参数,确定所述关键词的突出显示效果,包括:
根据各所述关键词的权重信息以及声学特征参数,分别计算各所述关键词的综合权重值;
根据各所述关键词的综合权重值,确定所述关键词的突出显示效果。
6.根据权利要求5所述的字幕生成方法,其特征在于,根据各所述关键词的综合权重值,确定所述关键词的突出显示效果,包括:
将综合权重值最高一个或多个的所述关键词进行突出显示;或者
将综合权重值超过权重阈值的所述关键词进行突出显示。
7.根据权利要求5所述的字幕生成方法,其特征在于,所述关键词的突出显示效果的强度与所述关键词的综合权重值正相关。
8.根据权利要求1所述的字幕生成方法,其特征在于,选取一个或多个所述候选子区域作为所述目标区域,包括:
选取像素灰度值离散程度最小的一个或多个所述候选子区域作为目标区域;或者,
选取像素灰度值离散程度最小的一个所述候选子区域及其相邻的一个或多个候选子区域作为目标区域。
9.根据权利要求8所述的字幕生成方法,其特征在于,将所述目标字幕添加至目标图像,包括:
根据所述目标区域的像素灰度均值,确定所述字幕文本的显示颜色;
根据所述目标区域的形状以及所述字幕文本的字符数量,确定所述字幕文本的排版布局。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯数码(天津)有限公司,未经腾讯数码(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910996249.5/1.html,转载请声明来源钻瓜专利网。