[发明专利]文本过滤系统及方法有效
申请号: | 201110440801.6 | 申请日: | 2011-12-23 |
公开(公告)号: | CN102521402A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 闫俊英 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 上海思微知识产权代理事务所(普通合伙) 31237 | 代理人: | 郑玮 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种文本过滤系统及方法,该系统至少包括:本体库建立模组,用于根据用户的过滤需求建立本体库;自适应学习模组,通过对一组过滤样本进行训练学习以对该本体库建立模组建立的本体库动态调整,使其逐渐接近于用户的过滤需求;以及文本过滤模组,通过对待过滤文本进行预处理、抽取特征词集及相似度匹配处理后,获得该待过滤文本与本体的相关度,并根据该相关度对该待过滤文本进行过滤,通过本发明,不仅能够准确表达用户的过滤模型,并能够在过滤时进行自主学习,调整采用本体表达的用户过滤模型,并能够动态调整过滤阈值,以达到更好的过滤效果。 | ||
搜索关键词: | 文本 过滤 系统 方法 | ||
【主权项】:
一种文本过滤系统,至少包括:本体库建立模组,用于根据用户的过滤需求建立本体库;自适应学习模组,通过对一组过滤样本进行训练学习以对该本体库建立模组建立的本体库动态调整,使其逐渐接近于用户的过滤需求;以及文本过滤模组,通过对待过滤文本进行预处理、抽取特征词集及相似度匹配处理后,获得该待过滤文本与本体的相关度,并根据该相关度对该待过滤文本进行过滤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110440801.6/,转载请声明来源钻瓜专利网。
- 上一篇:用于水处理的防堵型喷淋出药装置
- 下一篇:一种制备复合消毒剂的发生设备