[发明专利]一种基于智能语义感知的预警信息合法性检测方法及检测系统有效
申请号: | 201811438885.8 | 申请日: | 2018-11-28 |
公开(公告)号: | CN109543764B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 苗开超;杨彬;年福东;张淑静;汪翔;李腾;吴丹娃;张亚力;程天奇;刘宜轩 | 申请(专利权)人: | 安徽省公共气象服务中心;安徽大学 |
主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06F40/30;G06F40/284;G06F18/214 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 张景云 |
地址: | 230001*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于智能语义感知的预警信息合法性检测方法及检测系统,包括:S1:基于深度学习的垂直领域预警文本多标准分词算法;S2:基于人机耦合形式的白名单构建与实时更新方法;S3:在线非法字符匹配算法:利用多标准分词算法对待发布预警信息进行多标准分词获得候选字符集合,结合倒排索引与树状数据结构,设计大规模文本数据层级搜索与比对算法,通过与白名单的语义对比实现预警信息文本中的非法字符的快速定位与判断。优点为:以正向合法字(词)智能感知算法取代传统的反向非法字(词)搜索算法,可以达到非法字(词)100%检测效果。基于人机耦合形式的白名单构建与实时更新,可随着预警发布系统的不断使用逐步减少对人工的依赖。 | ||
搜索关键词: | 一种 基于 智能 语义 感知 预警 信息 合法性 检测 方法 系统 | ||
【主权项】:
1.一种基于智能语义感知的预警信息合法性检测方法,其特征在于:包括:步骤S1:基于深度学习的垂直领域预警文本多标准分词算法:利用公开数据集与垂直领域数据集,设计基于序列深度学习的多标准分词算法;步骤S2:基于人机耦合形式的白名单构建与实时更新方法:以已有合法预警信息库为数据基础,利用多标准分词算法构建合法字符白名单,同时审核员根据实际检测结果对白名单进行实时更新,对于白名单中的每一个字词采用词向量嵌入技术进行语义向量化表示;步骤S3:在线非法字符匹配算法:利用多标准分词算法对待发布预警信息进行多标准分词获得候选字符集合,结合倒排索引与树状数据结构,设计大规模文本数据层级搜索与比对算法,通过与白名单的语义对比实现预警信息文本中的非法字符的快速定位与判断。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽省公共气象服务中心;安徽大学,未经安徽省公共气象服务中心;安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811438885.8/,转载请声明来源钻瓜专利网。