[发明专利]基于统计规律的资讯内容异常检测方法在审
申请号: | 201610920198.4 | 申请日: | 2016-10-21 |
公开(公告)号: | CN106649261A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 张勇 | 申请(专利权)人: | 天津海量信息技术股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300000 天津市滨海新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于统计规律的资讯内容异常检测方法,包括如下步骤步骤一、准备语料;步骤二、将语料进行nlp分词;步骤三、分词结果构成多维向量;步骤四、多维向量积攒成多维向量库;步骤五、形成多维向量库扩展;步骤六、需要检测时准备目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、分词结果构成多维向量;步骤九、在多维向量库内检测目标资讯是否正确;步骤十、计算出词项的概率大于阈值;步骤十一、检测通过;步骤十二、计算出词项的概率小于阈值;步骤十三、检测不通过;步骤十四、预警处理。本发明中提出了一种基于统计规律的资讯内容异常检测方法,相比采用黑白名单,简单的过滤敏感词,本发明更能高效准确的检测资讯内容的错误。 | ||
搜索关键词: | 基于 统计 规律 资讯 内容 异常 检测 方法 | ||
【主权项】:
一种基于统计规律的资讯内容异常检测方法,其特征在于:包括如下步骤:步骤一、准备语料;步骤二、将语料进行nlp分词;步骤三、分词结果构成多维向量;步骤四、多维向量积攒成多维向量库;步骤五、形成多维向量库扩展;步骤六、需要检测时准备目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、分词结果构成多维向量;步骤九、在多维向量库内检测目标资讯是否正确;步骤十、计算出词项的概率大于阈值;步骤十一、检测通过;步骤十二、计算出词项的概率小于阈值;步骤十三、检测不通过;步骤十四、预警处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津海量信息技术股份有限公司,未经天津海量信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610920198.4/,转载请声明来源钻瓜专利网。
- 上一篇:汽车座椅(前排)
- 下一篇:一种社交媒体中企业硬件设施敏感信息防护方法