[发明专利]基于用户IP和片尾内容的识别有害视频的方法及系统在审
申请号: | 201711499468.X | 申请日: | 2017-12-30 |
公开(公告)号: | CN110020251A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 蔡昭权;胡松;胡辉;蔡映雪;陈伽;黄翰;梁椅辉;罗伟;黄思博 | 申请(专利权)人: | 惠州学院 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/783;G06K9/00;H04L29/06;H04L29/12 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 覃婧婵 |
地址: | 516007 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 权重因子 视频 片尾 视频内容 网页 视频拷贝检测 图像处理手段 视频数据库 模式提供 页面内容 页面元素 输出 大数据 用户IP 预设 数据库 指向 查询 监测 | ||
一种识别有害视频的方法及其系统,所述方法包括:当判断出网页的页面元素包括视频的URL路径时,识别所述网页的页面内容中记载的用户的IP地址或IP地址段,依据视频的URL路径获取所述URL中包含的域名或所述URL指向的IP地址,并且基于所述IP地址和域名的相关查询输出第一权重因子、第二权重因子;并且,获取片尾的视频内容,并在预设的有害视频数据库中对所述片尾的视频内容进行视频拷贝检测,根据监测的结果输出第三权重因子;综合第一权重因子和第二权重因子以及第三权重因子,对所述视频是否属于有害视频进行识别。本公开能够结合大数据所打造的数据库,用尽量少的图像处理手段,利用多种模式提供一种识别有害视频的方案。
技术领域
本公开属于信息安全领域,例如涉及一种识别有害视频的方法及其系统。
背景技术
在信息社会,到处充斥信息流,包括但不限于文本、视频、音频、图片等。其中,视频文件往往包括听觉信息和视觉信息,表达能力更加全面。然而,随着移动互联网的普及,网络上充斥大量有害视频内容,例如涉及毒品、色情、暴力等非法内容的视频,或者诱导加入邪教、自杀群体、犯罪群体等的有害视频,由于视觉直观性、冲击性等特点,其危害性更加甚于有害文本、有害图片和有害音频等,因此对这些有害视频进行识别,进而进行过滤、删除、消除危害,是十分必要的。
对于网络有害视频的识别,现在的技术主要有可以分为两大类,一种是传统方法,其中又包括两类:(1)基于单模态特征的识别方法。这类方法主要是提取视频的视觉特征,根据这些特征来构造分类器。例如在暴力视频识别上,常见的特征有视频运动矢量、颜色、纹理以及形状等。(2)基于多模态特征融合的识别方法,这类方法主要是提取视频的多个模态的特征,将其融合以构造分类器。例如在暴力视频识别上,除了视频特征外,很多方法还提取音频特征,包括短时能量,突发声音等。有些方法还考虑了网络视频周围的文本,从这些文本中继续提取一些特征用于融合识别。另一种是深度学习的方法:(1)CNN利用卷积神经网络对资料库中的敏感有害图像进行识别处理,得到有害敏感视频的内部特征,利用学习到的有害视频框架判断得到的视频帧中是否有有害信息。(2)RNN循环神经网络,直接将资料库中的视频序列输入循环神经网络中识别有害视频信息,学习到有害视频的框架,利用学习到的有害视频框架判断识别新的视频是否为有害视频。(3)CNN+RNN,利用CNN学习视频中图像帧中的空间域信息,利用RNN识别视频序列中的时间域信息,最后将两者结合进行识别判断,利用学习到的框架对视频进行识别。
现有的图像处理手段主要有下面两种方法:传统方法和深度学习方法。其中传统方法中经典的方法词包模型,该模型由四个部分组成:(1)底层的特征提取阶段(2)特征编码(3)特征汇聚(4)使用合适的分类器进行分类。深度学习模型是另一种图像处理的模型,主要有自编码器,受限波尔兹曼机,深度信念网络,卷积神经网络,循环神经网络等。随着计算机硬件的不断进步,数据库的完善,使用传统的方法运算过程相比于深度学习来说较为简单,深度学习方法能够学习到更有意义的数据,并根据任务不断进行参数调整,所以对于图像处理方面,深度学习模型有更强大的特征表达能力。
现有的识别方法在在识别效率上都有所不足,在大数据和人工智能发展的情形下,如何高效的识别有害视频,就成为一个需要考虑的问题。
发明内容
本公开提供了一种识别有害视频的方法,包括:
步骤a),当判断出网页的页面元素包括视频的URL路径时,识别所述网页的页面内容中记载的用户的IP地址或IP地址段,在第一数据库中查询是否存在所述IP地址或同一网段IP地址,并根据用户IP地址的查询结果输出与IP相关的第一权重因子;
步骤b),依据视频的URL路径获取所述URL中包含的域名或所述URL指向的IP地址,基于所述URL中包含的域名,在第二数据库中进行whois查询,和/或基于所述URL指向的IP地址,在第二数据库中查询是否存在所述URL中包含的IP地址或同一网段IP地址,并根据whois查询结果和/或IP地址的查询结果,输出与视频的URL路径相关的第二权重因子;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠州学院,未经惠州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711499468.X/2.html,转载请声明来源钻瓜专利网。