[发明专利]基于关键帧识别和音频文本化的短视频推荐方法及系统在审
申请号: | 201911080231.7 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110688526A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 韩强;李滨;李广庆;杨金增;万义鹏;周纹纹 | 申请(专利权)人: | 山东舜网传媒股份有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/783;G06N3/04;G06N3/08 |
代理公司: | 37221 济南圣达知识产权代理有限公司 | 代理人: | 黄海丽 |
地址: | 250000 山东省济南*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 视频片段 音频文本 词频 字幕文本信息 图像分类 音频信息 关键帧 排序 标签 关键帧提取 均匀分割 时间顺序 视频推荐 视频文本 图像识别 文本信息 协同过滤 用户提供 预存储 算法 整合 输出 分析 | ||
1.基于关键帧识别和音频文本化的短视频推荐方法,其特征是,包括:
获取待推荐的短视频;将短视频按照时间顺序均匀分割为若干个视频片段;
对每个视频片段进行关键帧提取,对每个关键帧进行图像识别,提取出图像分类标签和字幕文本信息;
对每个视频片段提取出对应的音频信息,从音频信息中提取对应的音频文本信息;
将得到的图像分类标签、字幕文本信息和音频文本信息进行整合,得到待推荐短视频的文本信息;
从待推荐短视频文本信息中分析每个词的词频,按照词频从大到小对每个词进行排序,将排序靠前的M个词作为待推荐短视频的关键词输出;M为正整数;
根据待推荐短视频的关键词与用户预存储的关键词,利用协同过滤算法为用户提供推荐结果。
2.如权利要求1所述的方法,其特征是,对每个视频片段进行关键帧提取,采用像素帧平均法或直方图帧平均法。
3.如权利要求1所述的方法,其特征是,对每个关键帧进行图像识别,提取出图像分类标签;具体步骤包括:将每个关键帧输入到预训练的第一卷积神经网络中,输出图像分类标签;
对每个关键帧进行图像识别,提取出字幕文本信息;具体步骤包括:将每个关键帧输入到预训练的第二卷积神经网络中,输出字幕文本信息。
4.如权利要求1所述的方法,其特征是,在对每个视频片段提取出对应的音频信息步骤之后,在从音频信息中提取对应的音频文本信息步骤之前,还包括:对音频信息进行去噪处理。
5.如权利要求1所述的方法,其特征是,所述将得到的图像分类标签、字幕文本信息和音频文本信息进行整合,得到待推荐短视频的文本信息之后,所述从待推荐短视频文本信息中分析每个词的词频,按照词频从大到小对每个词进行排序,将排序靠前的M个词作为待推荐短视频的关键词输出之前,还包括:对待推荐短视频的文本信息进行去噪处理;
所述对待推荐短视频的文本信息进行去噪处理,具体步骤包括:
S401:对待推荐短视频的文本信息,基于TF-TDF的词性分析算法进行词性初筛,去除第一无效词,保留第一有效词;
S402:对待推荐短视频的文本信息,基于统计学算法进行词性统计,去除第二无效词,保留第二有效词;
S403:对第一有效词和第二有效词进行取交集处理,得到去噪处理后的待推荐短视频的文本信息。
6.如权利要求1所述的方法,其特征是,所述根据待推荐短视频的关键词与用户预存储的关键词,利用协同过滤算法为用户提供推荐结果中,根据待推荐短视频的关键词与用户预存储的关键词,利用协同过滤算法为用户提供推荐结果;具体步骤包括:
根据待推荐短视频的关键词与用户预存储的关键词,计算待推荐短视频的关键词与用户预存储的关键词的相似度;如果相似度超过设定阈值,则判定当前待推荐短视频即为用户感兴趣的短视频;否则,判定当前待推荐短视频不是用户感兴趣的短视频,不予推荐。
7.如权利要求1所述的方法,其特征是,所述根据待推荐短视频的关键词与用户预存储的关键词,利用协同过滤算法为用户提供推荐结果之后,还包括:
对推荐的短视频与已推荐的视频列表进行比较,如果待推荐的短视频已经存在于已推荐的视频列表中,则将待推荐的短视频删除,返回获取待推荐的短视频步骤;进行下一个待推荐短视频的推荐处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东舜网传媒股份有限公司,未经山东舜网传媒股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911080231.7/1.html,转载请声明来源钻瓜专利网。