[发明专利]使用加权字典和正规化来进行文字攻击性检测和处理的系统和方法有效
申请号: | 201180017473.7 | 申请日: | 2011-01-28 |
公开(公告)号: | CN103098050B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 约瑟夫·L·斯皮尔斯 | 申请(专利权)人: | 因迪普拉亚公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/20 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 苗源,郑霞 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 加权 字典 正规化 进行 文字 攻击性 检测 处理 系统 方法 | ||
1.一种用于文字攻击性检测和处理的方法,其包括:
使用一个或多个处理器来接收多个攻击性文字,其中在所述多个攻击性文字中的每个相应攻击性文字与标识该相应文字的攻击性的严重性评分相关联;
接收文字串,其中候选文字选自所述文字串;
对于在所述多个攻击性文字中的每个相应攻击性文字,计算候选文字与所述相应攻击性文字之间的距离;
计算所述候选文字的多个攻击性评分,所述多个攻击性评分中的每个攻击性评分基于(i)在所述候选文字与所述多个攻击性文字中的攻击性文字之间的所计算的距离和(ii)所述攻击性文字的严重性评分;以及
基于所述候选文字的多个攻击性评分中的最高评分是否超过了攻击性阈值来判断所述候选文字是否为攻击文字;
其中,候选文字的攻击性评分根据下式之一来计算:
攻击性评分=A*((B-C)/B);
攻击性评分=A*((B-(1/C)/B);
攻击性评分=Max(((A-C)/A),0);以及
攻击性评分=(((B-C)/B)>T);
其中,
A为在所述多个攻击性文字中的攻击性文字的严重性评分;
B为所述攻击性文字的长度;以及
C为在所述候选文字与所述攻击性文字之间的计算的距离;
T为攻击性阈值。
2.根据权利要求1所述的方法,其特征在于,所述多个攻击性文字中的每个文字和所述文字串中的每个文字包括简写。
3.根据权利要求1所述的方法,其特征在于,所述距离被计算为:Levenshtein距离、Hamming距离、Damerau-Levenshtein距离、Dice系数、相似性指数、或Jaro-Winkler距离。
4.根据权利要求1所述的方法,其特征在于,所述攻击性阈值由服务管理员设置;
其中所述文字串从用户输入到服务;以及
其中如果在所述文字串中的候选文字由于具有超过所述服务管理员所设置的攻击性阈值的攻击性评分而被识别为攻击文字,则拒绝自所述用户到所述服务的输入。
5.根据权利要求4所述的方法,其特征在于,所述服务为内容评论入口,且其中所述攻击性阈值基于下列之一来设置:其中存在被评论的内容的内容分组;所述攻击性阈值相关联的特定内容;以及内容的第三方内容分级。
6.根据权利要求5所述的方法,其特征在于,所述内容分组包括
主题的特定分类,
类型,
地理原产地,其中所述地理包括国家、州、城市、公国或者它们的区域或子区域的集合,
专业或政府认证或分级的组、或行业节日或事件精选。
7.根据权利要求4所述的方法,其特征在于,所述服务选自下列的组:
留言板、内容评论入口、聊天室、电子布告栏系统、社交网站和多人游戏。
8.根据权利要求1所述的方法,其特征在于:
所述攻击性阈值由服务用户来设置;
所述文字串为从所述服务到所述用户的有意输出;以及
包含因攻击性评分超过所述用户设置的所述攻击性阈值而被识别为攻击文字的文字串在显示给所述用户之前被修改。
9.根据权利要求8所述的方法,其特征在于,根据下列之一来修改所述文字串:
删除所述文字串使得所述文字串并不显示给所述用户;
从所述文字串删除所述攻击性文字使得所述攻击性文字不显示给所述用户;
删改所述文字串使得所述文字串并不显示给所述用户;或者,
从所述文字串删改所述攻击性文字使得所述攻击性文字不显示给所述用户。
10.根据权利要求8所述的方法,其特征在于,所述多个攻击性文字和攻击性阈值是基于对所述用户所确定的文化规范来设置。
11.根据权利要求8所述的方法,其特征在于,所述多个攻击性文字和攻击性阈值基于政府机构限定的定义来设置,所述政府机构对于用户或者与所述用户相关联的非政府机构具有管辖权。
12.根据权利要求8所述的方法,其特征在于,对于用户设置最大攻击性阈值,且其中所述用户不能设置高于所述最大攻击性阈值的攻击性阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因迪普拉亚公司,未经因迪普拉亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180017473.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铁-活性炭烟草薄片的制备方法
- 下一篇:数字白板系统