[发明专利]一种密标检测方法、装置及电子设备在审
申请号: | 202111196100.2 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113918973A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 苗功勋;刘志远;孙强;熊英超;李志刚;侯洪涛 | 申请(专利权)人: | 南京中孚信息技术有限公司;中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/64 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 王思楠 |
地址: | 210000 江苏省南京市浦口区江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 方法 装置 电子设备 | ||
本申请涉及信息安全技术领域,具体公开了一种密标检测方法、装置及电子设备。该密标检测方法包括:基于预设的密标关键词,从待检测文本中提取至少一个上下文;将所述至少一个上下文依次输入预先训练得到的密标检测模型中,得到各上下文对应的密标检测结果,所述密标检测结果包括密标或非密标;若各上下文中的至少一个目标上下文对应的密标检测结果为密标,则根据所述至少一个目标上下文确定所述待检测文本的密级。该方法在文档解析内容异常或者上下文句子较短的情况下,仍然能够准确识别出上下文是否包含密标,进而能够准确检测出文档的密级,能够极大提升密级检测的准确性。
技术领域
本申请申请涉及信息安全技术领域,具体而言,涉及一种密标检测方法、装置及电子设备。
背景技术
密标是电子文件上关于秘密程度的标记,能防止电子文件泄密,对不同秘密程度的电子文件进行分类。并对不同类别的电子文件通过技术手段加上标记,并使电子文件得到相应程度的安全保护。为了监测重要的标密文档是否出现在公共空间中,以防止失密,则需要对海量的文档进行密标检测。
现有技术中,在规范的密标模板检测的基础上将密标检测视为真词错误检测问题,使用N元语法模型对含密标关键词的上下文句子进行训练,若密标词与上下文无关,即可判断为密标。
但是,使用现有技术的方法,在文档解析内容异常的情况下或者上下文句子较短的情况下,不能进行有效的密标识别。
发明内容
本申请的一个目的在于提供一种密标检测方法,以解决密标不能被有效检测;文档解析内容异常时,计算识别能力差,且需要监督学习才能良好检测密标的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请提供一种密标检测方法,包括:
基于预设的密标关键词,从待检测文本中提取至少一个上下文;
将所述至少一个上下文依次输入预先训练得到的密标检测模型中,得到各上下文对应的密标检测结果,所述密标检测结果包括密标或非密标;
若各上下文中的至少一个目标上下文对应的密标检测结果为密标,则根据所述至少一个目标上下文确定所述待检测文本的密级。
可选地,所述根据所述至少一个目标上下文确定所述待检测文本的密级,包括:
分别获取各所述目标上下文中的密标关键词;
根据各所述目标上下文中的密标关键词,确定各所述目标上下文对应的密标等级;
根据各所述目标上下文对应的密标等级,确定待检测文本的密级。
可选地,根据各所述目标上下文对应的密标等级,确定待检测文本的密级,包括:
将各所述目标上下文对应的密标等级中的最高密标等级,作为所述待检测文本的密级。
可选地,所述将所述至少一个上下文依次输入预先训练得到的密标检测模型中,得到各上下文对应的密标检测结果之前,还包括:
基于预设的任务训练得到初始模型参数;
基于所述初始模型参数,构建初始检测模型;
使用预先标记的训练样本,训练所述初始检测模型,得到所述密标检测模型。
可选地,所述预设的任务基于多个未标记的训练样本得到。
可选地,所述使用预先标记的训练样本,训练所述初始检测模型,得到所述密标检测模型,包括:
对所述训练样本进行编码,得到编码向量序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中孚信息技术有限公司;中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司,未经南京中孚信息技术有限公司;中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111196100.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防水的彩印包装纸箱
- 下一篇:一种基于人工智能的配网调度语音交互方法