[发明专利]敏感数据识别方法、装置及设备在审
申请号: | 202011296573.5 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112381159A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 张弥 | 申请(专利权)人: | 北京金山云网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;高莺然 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感数据 识别 方法 装置 设备 | ||
本发明实施例提供了敏感数据识别方法、装置及设备,应用于数据识别技术领域。该方法包括:获取多媒体数据;对所述多媒体数据的多种指定元素分别进行元素识别,得到每一种指定元素的目标识别结果;其中,对每一种指定元素所进行的元素识别为:所得出识别结果能够用于判断所述多媒体数据是否敏感数据的识别方式;对所述多种指定元素的目标识别结果进行指定方式的融合分析,得到融合分析结果;基于所述融合分析结果,识别所述多媒体数据是否为敏感数据。通过本方案,可以有效识别多媒体数据是否属于敏感数据。
技术领域
本发明涉及数据识别技术领域,特别是涉及敏感数据识别方法、装置及设备。
背景技术
当今,多媒体数据作为传递信息内容的常用载体,已经普遍存在人们的工作和生活中,且越来越海量。
多媒体数据通常存在多种元素,而通过将多种元素组合在一起可以表征任一种元素所无法表征的含义。例如:针对一张既存在图像内容又存在文字内容的图片而言,该图片中图像内容和文字内容属于不同元素,通过将图像内容和文字内容组合在一起可以表征某一含义;或者,针对一张属于全身照的图片,该图片中的人脸部分和服饰部分属于不同元素,通过将人脸部分和服饰部分组合在一起可以表征某一含义。
那么,如何有效识别多媒体数据是否属于敏感数据,是一个亟待解决的问题。
发明内容
本发明实施例的目的在于提供敏感数据识别方法、装置及设备,以实现有效识别多媒体数据是否属于敏感数据的目的。具体技术方案如下:
第一方面,本发明实施例提供了一种敏感数据识别方法,所述方法包括:
获取多媒体数据;
对所述多媒体数据的多种指定元素分别进行元素识别,得到每一种指定元素的目标识别结果;其中,对每一种指定元素所进行的元素识别为:所得出识别结果能够用于判断所述多媒体数据是否敏感数据的识别方式;
对所述多种指定元素的目标识别结果进行指定方式的融合分析,得到融合分析结果;
基于所述融合分析结果,识别所述多媒体数据是否为敏感数据。
可选地,所述对所述多种指定元素的目标识别结果进行指定方式的融合分析,得到融合分析结果,包括:
检测关于所述多种指定元素的目标识别结果的组合内容,是否能够表征预设的多个寓意内容中的至少一个,得到检测结果,作为融合分析结果;其中,每一寓意内容所表征的含义均属于敏感性内容;
所述基于所述融合分析结果,识别所述多媒体数据是否为敏感数据,包括:
若所述融合分析结果表明关于所述多种指定元素的目标识别结果的组合内容,能够表征预设的多个寓意内容中的至少一个,则确定所述多媒体数据为敏感数据;否则,确定所述多媒体数据不为敏感数据。
可选地,所述检测关于所述多种指定元素的目标识别结果的组合内容,是否能够表征预设的多个寓意内容中的至少一个,得到检测结果,包括:
通过存储有预设知识图谱的图数据库,检测关于所述多种指定元素的目标识别结果的组合内容,是否能够表征预设的多个寓意内容中的至少一个,得到检测结果;
其中,所述预设知识图谱中至少记录有多个第一类节点、多个第二类节点,以及各个第一类节点与各个第二类节点的关联关系;所述多个第一类节点至少包括表示所述多种指定元素的潜在识别结果的多个节点,所述多个节点中的每一节点表示一个潜在识别结果,每一第二类节点表示一个寓意内容,所述关联关系用于表征各个第一类节点所表示内容与各个第二类节点所表示内容的相关性。
可选地,各个潜在识别结果均属于实体内容,且对应有本体内容;
所述多个第一类节点还包括:表示所述潜在识别结果对应的本体内容的节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011296573.5/2.html,转载请声明来源钻瓜专利网。