[发明专利]一种基于互联网大数据的网络违法视频广告识别方法及系统在审
申请号: | 201711212506.9 | 申请日: | 2017-11-28 |
公开(公告)号: | CN108628923A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 谭晓磊 | 申请(专利权)人: | 南京莱斯信息技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 张弛 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频广告 视频广告识别 大数据 智能搜索引擎 互联网 判定 抓取 互联网信息 准确度 广告特征 静态文字 违法行为 引擎 解析 数据库 存储 网络 多媒体 学习 | ||
1.一种基于互联网大数据的网络违法视频广告识别方法,其特征在于,包括以下步骤:
(1)、首先通过搜索引擎,从互联网中抓取视频广告,截取时同时记录视频广告当时特征向量空间,包括网页类型、页面地址、相关链接;
(2)、对抓取的视频广告进行结构化处理,生成计算机可以解读的编码信息;
(3)、通过识别引擎,加载违法行为模型及行为识别模型,对视频广告的内容进行行为理解和语义分析,同时基于互联网大数据,对违法行为特征进行深度挖掘,充实违法视频广告特征知识库;
(4)、通过相关的判定模型对识别的结果进行判定,对判定后的视频广告提取广告特征参数,存储在违法广告特征数据库中;
(5)、根据判定模型,对视频广告的识别结果进行输出,并将输出的结果参数也存储至违法广告特征数据库中;
(6)、从违法广告特征数据库中提取相应的特征数据,作为后续机器深度学习的依据。
2.根据权利要求1所述的识别方法,其特征在于:步骤(3)中的识别引擎的功能为,基于卷积神经网络,对视频广告中出现的音频、图像信息进行扫描,抽取特征,对视频广告的内容进行行为理解和语义分析,通过多层交叠的卷积和最大池化操作,最终将广告音视频内容分别表示为一个固定长度的向量,并将这些向量连接起来得到整个图像或者语音的语义。
3.根据权利要求1所述的识别方法,其特征在于:步骤(5)中的广告特征参数包括广告商品信息、广告音频信息、广告人物信息、广告内容信息,以及广告内容中是否包含违禁品、色情信息、封建迷信、假冒伪劣、减肥丰胸、夸大虚假的违规类型信息。
4.根据权利要求1所述的识别方法,其特征在于:步骤(3)中进一步采取机器深度学习方式对于视频广告的内容进行行为理解和语义分析,机器深度学习通过多层的非线性变换得到新的特征表示,并进一步的进行卷积和池化操作,对违法特征深度挖掘、比对,充实违法视频广告特征知识库。
5.一种基于互联网大数据的网络违法视频广告识别系统,其特征在于,包括:
搜索引擎,用以从互联网中抓取视频广告,截取时同时记录视频广告当时特征向量空间;
处理模块,用以对抓取的视频广告进行结构化处理,生成计算机可以解读的编码信息;
识别引擎,用以加载违法行为模型及行为识别模型,对视频广告的内容进行行为理解和语义分析;同时基于互联网大数据,对违法行为特征进行深度挖掘,形成违法视频广告特征知识;
违法视频广告特征知识库,用以存储违法视频广告特征知识;
违法广告特征数据库,用以存储违法视频广告特征;
判定模块,用以通过相关的判定模型对识别的结果进行判定,对判定后的视频广告提取广告特征参数,存储在违法广告特征数据库中。
6.根据权利要求5所述的识别系统,其特征在于:识别引擎的功能包括人物识别、动作识别、广告行为理解型、违法行为分析、情感语义分析。
7.根据权利要求5所述的识别系统,其特征在于:所述特征向量空间包括网页类型、页面地址、相关链接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京莱斯信息技术股份有限公司,未经南京莱斯信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711212506.9/1.html,转载请声明来源钻瓜专利网。