[发明专利]一种新闻字幕摘要生成方法和系统在审
申请号: | 202111395292.X | 申请日: | 2021-11-23 |
公开(公告)号: | CN114064968A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 刘潇婧 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06F16/738 | 分类号: | G06F16/738;G06F16/75;G06F40/30 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 高明翠 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 字幕 摘要 生成 方法 系统 | ||
1.一种新闻字幕摘要生成方法,其特征在于,所述方法包括如下步骤:
获取新闻视频数据,对所述新闻视频数据进行预处理,将视频切分为固定时长的视频片段,将所述视频片段中的文字块进行摘要标注;
建立每个文字块在视频片段序列中的空间和时间连接关系的时空图,生成视频字幕的文字块边缘特征向量;
获取每个视频片段文字块的语义特征向量,并将所述语义特征向量和其他文字块的语义特征向量以及两文字块间的边缘特征向量进行拼接,将拼接后的向量输入到全连接层;
将所述全连接层输出的向量输入自注意力层加权求和后生成每个文字块的时空特征向量;
将所述时空特征向量输入到二分类模型中进行训练,根据二分类模型的输出结果对每一文字块进行摘要主题句的判断。
2.根据权利要求1所述的一种新闻字幕摘要生成方法,其特征在于,对所述新闻数据进行预处理的方法包括:对所述视频数据进行解帧,获取多张图片形式的视频帧,采用文字识别技术识别每一视频帧中的文字并获取每一文字对应的时间戳和文字位置数据,切割生成每个视频帧文字块。
3.根据权利要求1所述的一种新闻字幕摘要生成方法,其特征在于,对所述新闻数据进行预处理的方法还包括:将所述视频数据以固定时长进行切割,生成具有固定时长的视频片段,并将所述视频片段中具有相同文本信息和位置的文字块合并成单个文字块。
4.根据权利要求1所述的一种新闻字幕摘要生成方法,其特征在于,所述文字块边缘特征向量的生成方法包括:
以每个视频片段的文字块为节点获取每个文字块i的文字信息ci、文字块高度hi、文字块宽度wi和文字块时间长度li,其中ci=(ci1,ci2,...,cij,...,cim),cij为文字信息中的单字符信息,m为文字块的文字长度;
构建所述文字块的时空图G=(T,E),其中所述T=(t1,t2,...,ti,...,tn),ti=(ci,hi,wi,li),其中T表示文字块特征集合,ti为文字块集合中任意一个文字块特征,n为视频片段中的文字块数量;
将所述文字块所占的图片帧数作为所述文字块的时间长度li;
定义eij为文字块ti和tj之间的边缘特征向量,其中其中hij为文字块ti和tj之间的垂直距离,wij为文字块ti和tj之间的水平距离,lij为文字块ti和tj之间的时间距离。
5.根据权利要求4所述的一种新闻字幕摘要生成方法,其特征在于,所述文字块的时空特征提取方法包括:
将每个文字块中的文字ci输入到预训练好的BERT模型中提取语义特征,并将所述BERT模型输出特征向量的平均特征向量si作为每个文字块节点的语义特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111395292.X/1.html,转载请声明来源钻瓜专利网。