[发明专利]一种基于关键词的视频搜索方法、系统、装置及存储介质在审
申请号: | 201910837873.0 | 申请日: | 2019-09-05 |
公开(公告)号: | CN110750679A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 陈斌 | 申请(专利权)人: | 天脉聚源(杭州)传媒科技有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/783 |
代理公司: | 44205 广州嘉权专利商标事务所有限公司 | 代理人: | 何文聪 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 搜索指令 搜索 结合能 存储介质 检索结果 人工生成 视频技术 视频搜索 搜索效率 文字识别 语音识别 自动生成 全面性 检索 语音 观看 应用 | ||
本发明公开了一种基于关键词的视频搜索方法、系统、装置及存储介质,方法包括:对视频进行文字识别,生成得到第一关键词;对视频进行语音识别,生成得到第二关键词;根据第一关键词和第二关键词,得到各视频对应的关键词集;根据接收到的搜索指令,利用搜索指令中的第三关键词在关键词集中进行搜索,得到检索结果列表。本发明通过识别视频中视频的文字和语音,从而能自动生成用于搜索的关键词集,有效避免了人工生成的片面性,而且通过两种方式的结合能有效提高关键词的全面性,大大提高检索时的准确性,能给用户带来更好的观看体验和搜索效率。本发明可广泛应用于视频技术领域中。
技术领域
本发明涉及视频处理技术领域,尤其涉及一种基于关键词的视频搜索方法、系统、装置及存储介质。
背景技术
目前,市面上很多的在线视频都可以提供搜索功能,通过为在线视频提供相应的关键词方便搜索。
关键词在生成时,所采用的方法为一般都是由视频服务提供商的工作人员通过人工方式生成的。通过人工生成的视频看点可能无法与海量用户的真实体验相契合,有时可能关键词不够全面,导致用户不能顺利搜索到所需的视频,从而给用户带来不好的观看体验,影响视频的收益。
发明内容
为了解决上述技术问题,本发明的目的是提供一种基于关键词的视频搜索方法、系统、装置及存储介质。
本发明所采取的技术方案是:
一种基于关键词的视频搜索方法,包括以下步骤:
对视频进行文字识别,生成得到第一关键词;
对视频进行语音识别,生成得到第二关键词;
根据第一关键词和第二关键词,得到各视频对应的关键词集;
根据接收到的搜索指令,利用搜索指令中的第三关键词在关键词集中进行搜索,得到检索结果列表,所述检索结果列表包括搜索得到视频和所述视频对应的关键词集。
作为所述的一种基于关键词的视频搜索方法的进一步改进,还包括以下步骤:
根据检索结果列表,对检索结果列表中的视频与其余视频进行相关度计算,得到检索结果列表中的视频与其余视频之间的相关度;
根据相关度,将相关度最高的n个视频进行排列生成推荐视频列表,其中,n为正整数,n为预设值。
作为所述的一种基于关键词的视频搜索方法的进一步改进,所述的对视频进行文字识别,生成得到第一关键词,这一步骤具体包括:
对视频进行解封装,得到视频码流;
对视频码流进行解码,得到视频帧;
对视频帧进行编码,得到视频截图;
对视频截图中的文字进行识别处理,得到视频文字;
对视频文字进行分词处理,得到第一关键词。
作为所述的一种基于关键词的视频搜索方法的进一步改进,所述的对视频进行语音识别,生成得到第二关键词,这一步骤具体包括:
对视频进行语音提取,得到语音数据;
对语音数据进行识别处理,生成得到第二关键词。
作为所述的一种基于关键词的视频搜索方法的进一步改进,所述的对语音数据进行识别处理,生成得到第二关键词,这一步骤具体包括:
根据语音数据,利用预设的语音识别模型进行匹配识别处理,得到识别结果;
对识别结果进行分词处理,得到第二关键词。
本发明所采用的另一个技术方案是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天脉聚源(杭州)传媒科技有限公司,未经天脉聚源(杭州)传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910837873.0/2.html,转载请声明来源钻瓜专利网。