[发明专利]一种密标检测方法、装置及电子设备在审
申请号: | 202111196100.2 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113918973A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 苗功勋;刘志远;孙强;熊英超;李志刚;侯洪涛 | 申请(专利权)人: | 南京中孚信息技术有限公司;中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/64 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 王思楠 |
地址: | 210000 江苏省南京市浦口区江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 方法 装置 电子设备 | ||
1.一种密标检测方法,其特征在于,包括:
基于预设的密标关键词,从待检测文本中提取至少一个上下文;
将所述至少一个上下文依次输入预先训练得到的密标检测模型中,得到各上下文对应的密标检测结果,所述密标检测结果包括密标或非密标;
若各上下文中的至少一个目标上下文对应的密标检测结果为密标,则根据所述至少一个目标上下文确定所述待检测文本的密级。
2.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个目标上下文确定所述待检测文本的密级,包括:
分别获取各所述目标上下文中的密标关键词;
根据各所述目标上下文中的密标关键词,确定各所述目标上下文对应的密标等级;
根据各所述目标上下文对应的密标等级,确定待检测文本的密级。
3.根据权利要求2所述的方法,其特征在于,根据各所述目标上下文对应的密标等级,确定待检测文本的密级,包括:
将各所述目标上下文对应的密标等级中的最高密标等级,作为所述待检测文本的密级。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述至少一个上下文依次输入预先训练得到的密标检测模型中,得到各上下文对应的密标检测结果之前,还包括:
基于预设的任务训练得到初始模型参数;
基于所述初始模型参数,构建初始检测模型;
使用预先标记的训练样本,训练所述初始检测模型,得到所述密标检测模型。
5.根据权利要求4所述的方法,其特征在于,所述预设的任务基于多个未标记的训练样本得到。
6.根据权利要求4所述的方法,其特征在于,所述使用预先标记的训练样本,训练所述初始检测模型,得到所述密标检测模型,包括:
对所述训练样本进行编码,得到编码向量序列;
将所述编码向量序列输入所述初始检测模型的输入层,并经由所述初始检测模型的多个网络层处理之后进行编码得到预测标签编码;
基于预设的损失函数以及所述预测标签编码,对所述初始检测模型的模型参数进行修正,得到所述密标检测模型。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设的密标关键词,从待检测文本中提取至少一个上下文,包括:
对所述待检测文本进行预处理,所述预处理包括:去除所述待检测文本中的预设字符;
根据密标关键词特征、左右上下文词特征以及时序位置特征,获取所述待检测文本中的所述至少一个上下文,各所述上下文的长度在预设长度范围内,且包含所述密标关键词,且所述密标关键词位于所述上下文中的中心位置。
8.一种密标检测装置,其特征在于,包括:
提取模块,用于基于预设的密标关键词,从待检测文本中提取至少一个上下文;
处理模块,用于将所述至少一个上下文依次输入预先训练得到的密标检测模型中,得到各上下文对应的密标检测结果,所述密标检测结果包括密标或非密标;
确定模块,用于在各上下文中的至少一个目标上下文对应的密标检测结果为密标,则根据所述至少一个目标上下文确定所述待检测文本的密级。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至7任一所述的密标检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的密标检测方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中孚信息技术有限公司;中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司,未经南京中孚信息技术有限公司;中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111196100.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防水的彩印包装纸箱
- 下一篇:一种基于人工智能的配网调度语音交互方法