[发明专利]一种基于兴趣认知的垃圾邮件识别方法及其系统无效
申请号: | 200610124174.4 | 申请日: | 2006-12-12 |
公开(公告)号: | CN1976323A | 公开(公告)日: | 2007-06-06 |
发明(设计)人: | 皮佑国 | 申请(专利权)人: | 华南理工大学 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L29/06;G06Q10/00 |
代理公司: | 广州市华学知识产权代理有限公司 | 代理人: | 杨晓松 |
地址: | 51064*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于兴趣认知的垃圾邮件识别方法,包括下述步骤:1.个人兴趣认知知识库的建立和维护;2.概率计算和邮件属性评价;3.结果输出;一种实现上述方法的垃圾邮件识别系统,包括分词部件、垃圾邮件概率计算部件、知识库部件、分类评价部件、属性评价输出部件等。本发明精确度好,智能化程度高,可达到较好的垃圾邮件过滤效果。 | ||
搜索关键词: | 一种 基于 兴趣 认知 垃圾邮件 识别 方法 及其 系统 | ||
【主权项】:
1、一种基于兴趣认知的垃圾邮件识别方法,其特征在于包括下述步骤:1.个人兴趣认知知识库的建立和维护1.1通过最大限度地收集客户往来的邮件,认知客户的生活和工作兴趣;将客户邮件的邮件主题、邮件内容分解为单词;1.2以由1.1得到的单词为索引建立、更新和扩充知识库,对没有的单词进行添加并按1.3登记属性概率;对知识库中已经有的单词只是考虑新的事件重新计算并刷新其属性概率,实现知识库的积累和更新;1.3知识库中的属性概率按照如下规律确定并刷新:对发送出去的邮件中所有的单词,均记为出现在正常邮件中的样本;对接收邮件中的单词,在训练期内,按照客户确定的属性记录样本数,在训练期完成以后,按照系统决策的属性记入样本数;1.4对知识库单词出现的总样本数设定有阈值,仅当各个分词的总样本数高于这个阈值时,才容许结束训练期;2.概率计算和邮件属性评价2.1按照1.1中得出的单词总数和1.2及1.3中得出的属性概率分别计算各单词在待评价邮件中出现的条件概率;2.2利用2.1的结果利用贝叶斯分类公式计算邮件的属性概率;2.3根据给定的阈值进行属性评价;2.4在训练期内,将评价决策结果与客户的决策结果进行比较并修改决策阈值,仅当决策结果与客户决策结果达到接近时,才能结束训练期;3.结果输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610124174.4/,转载请声明来源钻瓜专利网。