[发明专利]使用加权字典和正规化来进行文字攻击性检测和处理的系统和方法有效
申请号: | 201180017473.7 | 申请日: | 2011-01-28 |
公开(公告)号: | CN103098050B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 约瑟夫·L·斯皮尔斯 | 申请(专利权)人: | 因迪普拉亚公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/20 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 苗源,郑霞 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了用于识别将认为是对于用户或系统所有者而言淫秽或另外具有攻击性的语言的计算机实施的系统和方法。接收到多个攻击性文字,其中每个攻击性文字与标识该文字的攻击性的严重性评分相关联。接收文字串。计算在候选文字与多个攻击性文字中的每个攻击性文字之间的距离,且计算候选文字的多个攻击性评分,每个攻击性评分是基于在候选文字与该攻击性文字之间的距离和攻击性文字的严重性评分。关于候选文字是否为攻击文字做出判断,其中在多个攻击性评分中的最高攻击性评分超过攻击性阈值时认为候选文字为攻击性文字。 | ||
搜索关键词: | 使用 加权 字典 正规化 进行 文字 攻击性 检测 处理 系统 方法 | ||
【主权项】:
一种用于文字攻击性检测和处理的方法,其包括:使用一个或多个处理器来接收多个攻击性文字,其中在所述多个攻击性文字中的每个相应攻击性文字与标识该相应文字的攻击性的严重性评分相关联;接收文字串,其中候选文字选自所述文字串;对于在所述多个攻击性文字中的每个相应攻击性文字,计算候选文字与所述相应攻击性文字之间的距离;计算所述候选文字的多个攻击性评分,所述多个攻击性评分中的每个攻击性评分基于(i)在所述候选文字与所述多个攻击性文字中的攻击性文字之间的所计算的距离和(ii)所述攻击性文字的严重性评分;以及基于所述候选文字的多个攻击性评分中的最高评分是否超过了攻击性阈值来判断所述候选文字是否为攻击文字;其中,候选文字的攻击性评分根据下式之一来计算:攻击性评分=A*((B‑C)/B);攻击性评分=A*((B‑(1/C)/B);攻击性评分=Max(((A‑C)/A),0);以及攻击性评分=(((B‑C)/B)>T);其中,A为在所述多个攻击性文字中的攻击性文字的严重性评分;B为所述攻击性文字的长度;以及C为在所述候选文字与所述攻击性文字之间的计算的距离;T为攻击性阈值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因迪普拉亚公司,未经因迪普拉亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201180017473.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种铁-活性炭烟草薄片的制备方法
- 下一篇:数字白板系统