[发明专利]素材存储方法、装置及电子设备有效
申请号: | 202011574131.2 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112667831B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 王传鹏;符芳捷;李腾飞;周惠存;陈春梅 | 申请(专利权)人: | 上海硬通网络科技有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/55;G06F16/71;G06F16/75;G06F40/289;G06F40/216;G06V30/19;G06V10/74 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈志明 |
地址: | 201800 上海市嘉定*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 素材 存储 方法 装置 电子设备 | ||
本申请公开了一种素材存储方法、装置及电子设备,所述方法包括:获取素材库中的各素材;根据新增期对各素材进行分类,形成处于新增期的各第一类素材,以及处于非新增期的各第二类素材,其中,新增期为素材首次存储至素材库的预设时段内;对各第一类素材通过第一OCR模型进行文字识别,对各第二类素材通过第二OCR模型进行文字识别,获取文本信息集,其中,第一OCR模型的模型小于第二OCR模型,文本信息集包括与各第一类素材一一对应的各第一类文本信息,和与各第二类素材一一对应的各第二类文本信息;将文本信息集中的各文本信息与多个预设词条进行相似度匹配,根据匹配结果从各第一类素材和各第二类素材中筛选出可用素材,将各可用素材存储到素材库中。
技术领域
本申请涉及计算机技术领域,特别涉及一种素材存储方法、装置及电子设备。
背景技术
在互联网媒体平台上进行广告投放时,为避免广告内容出现敏感信息,通常需要定期对素材库中的广告素材进行过滤筛选后再进行存储。为避免素材存储出现遗漏,现有技术中,在利用轻量的ocr模型进行初步过滤后,通过yolo3+crnn进行二次过滤后存储,以实现敏感素材的过滤。由于二次过滤的输入信息,是初步过滤的输出结果,时间上呈因果关系,因此未被过滤的素材的过滤耗时均为两次过滤耗时的总和,在进行多素材过滤存储时,无法根据素材的实时性要求和历史筛选情况进行调整,计算机资源调度效率差,对多素材进行过滤时效率低。
发明内容
本申请的目的在于至少解决现有技术中存在的技术问题之一,提供一种素材存储方法、装置以及电子设备,提高对多素材的过滤效率。
本申请实施例提供一种素材存储方法,包括:
获取素材库中的各素材;
根据新增期对各素材进行分类,形成处于新增期的各第一类素材,以及处于非新增期的各第二类素材,其中,所述新增期为所述素材首次存储至所述素材库的预设时段内;
对各所述第一类素材通过第一OCR模型进行文字识别,对各所述第二类素材通过第二OCR模型进行文字识别,获取文本信息集,其中,所述第一OCR模型的模型小于所述第二OCR模型,所述文本信息集包括与各所述第一类素材一一对应的各第一类文本信息,以及与各所述第二类素材一一对应的各第二类文本信息;
将所述文本信息集中的各文本信息与预设文本信息集中的多个预设词条进行相似度匹配,根据相似度匹配结果从各所述第一类素材和各所述第二类素材中筛选出各可用素材,将各所述可用素材存储到所述素材库中。
进一步的,所述获取素材库中的各素材,包括:
异步调用所述素材库中的各素材。
进一步的,所述对各所述第一类素材通过第一OCR模型进行文字识别,以及对各所述第二类素材通过第二OCR模型进行文字识别,包括:
对各所述第一类素材通过第一OCR模型进行文字识别,以及并行地对各所述第二类素材通过第二OCR模型进行文字识别。
进一步的,所述素材的素材类型包括图片素材和视频素材;
对各所述第一类素材通过第一OCR模型进行文字识别,包括:
对各所述第一类素材中的所述视频素材进行切帧,同时对由各第一类素材中的图片素材以及帧图像形成的图片素材集通过第一OCR模型进行文字识别。
进一步的,所述将所述文本信息集中的各文本信息与预设文本信息集中的多个预设词条进行相似度匹配,包括:
根据语料库对各所述第一类文本信息以及各所述第二类文本信息进行分词处理,获取多个对象分词;
将所述多个对象分词与所述语料库的多个预设词条进行相似度匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海硬通网络科技有限公司,未经上海硬通网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011574131.2/2.html,转载请声明来源钻瓜专利网。