[发明专利]视频文件描述文本生成方法、装置及存储介质在审

申请号：	202310258197.8	申请日：	2023-03-10
公开（公告）号：	CN116229328A	公开（公告）日：	2023-06-06
发明（设计）人：	常志;陈永录;孙彦南;董甜	申请（专利权）人：	中国工商银行股份有限公司
主分类号：	G06V20/40	分类号：	G06V20/40;G06V10/80;G06V20/52;G06F40/289;G06F40/216
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	孟凡林;刘芳
地址：	100140 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频文件描述文本生成方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种视频文件描述文本生成方法，其特征在于，所述方法包括：

获取待分析的视频文件；

提取所述待分析的视频文件中的全局静态特征、全局动态特征和局部特征；其中，所述全局静态特征用于表征所述待分析的视频文件的背景特征；所述全局动态特征用于表征所述待分析的视频文件中每个对象的移动特征；所述局部特征用于表征所述待分析的视频文件的预设区域的特征；

根据所述全局静态特征、所述全局动态特征和所述局部特征，确定所述待分析的视频文件中目标对象的动作行为特征；

根据所述全局静态特征、所述全局动态特征、所述局部特征和所述目标对象的动作行为特征，生成描述文本；其中，所述描述文本用于表征所述视频文件的内容。

2.根据权利要求1所述的方法，其特征在于，所述根据所述全局静态特征、所述全局动态特征和所述局部特征，确定所述待分析的视频文件中目标对象的动作行为特征，包括：

根据所述全局静态特征、所述全局动态特征和所述局部特征，确定所述待分析的视频文件中第一概率值、第二概率值以及第三概率值；其中，所述第一概率值表征待分析的视频文件中对象的概率分布情况；所述第二概率值表征待分析的视频文件中每个对象的动作的概率分布情况；所述第三概率值表征待分析的视频文件中的每个对象的行为的概率分布情况；

根据所述第一概率值、所述第二概率值和所述第三概率值，确定所述待分析的视频文件中目标对象的动作行为特征；其中，所述目标对象为所述多个对象中的一个；其中，所述第一概率值、所述第二概率值和所述第三概率值的对象为同一个。

3.根据权利要求2所述的方法，其特征在于，所述根据所述全局静态特征、所述全局动态特征和所述局部特征，确定所述待分析的视频文件第一概率值、第二概率值以及第三概率值，包括：

根据所述全局静态特征和所述局部特征，构建场景特征；

根据所述局部特征，确定出所述每个对象；

根据所述场景特征、所述每个对象和所述全局动态特征，确定所述待分析的视频文件中第一概率值、第二概率值以及第三概率值。

4.根据权利要求1所述的方法，其特征在于，所述根据所述全局静态特征、所述全局动态特征、所述局部特征和所述目标对象的动作行为特征，生成描述文本，包括：

根据所述全局静态特征、所述全局动态特征和所述局部特征，确定特征平均值；

根据所述特征平均值和所述目标对象的动作行为特征，生成描述文本。

5.根据权利要求4所述的方法，其特征在于，所述根据所述特征平均值和所述目标对象的动作行为特征，生成描述文本，包括：

将所述特征平均值和所述目标对象的动作行为特征进行融合，得到融合特征；

将所述融合特征输入至编码器中，生成词语概率分布；

根据所述词语概率分布，生成描述文本。