[发明专利]一种结合用户属性的邮件分类方法及系统有效
申请号: | 201610592259.9 | 申请日: | 2016-07-25 |
公开(公告)号: | CN106230690B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 周可;王桦;沈慧羊 | 申请(专利权)人: | 华中科技大学 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;G06F16/35;G06Q10/10 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种结合用户属性的邮件分类方法及系统,属于数据挖掘技术领域,首先利用分类器初始化新邮件垃圾邮件概率,然后在搭建好的用户属性网中匹配到新邮件的用户爱好属性、邮件主题属性、用户亲近度属性和用户行为属性,之后依次利用用户爱好属性、邮件主题属性、用户亲近度和用户行为属性对垃圾邮件概率的影响,更新邮件的垃圾邮件概率。本发明还提供了实现上述方法的系统。本发明通过结合用户属性对邮件进行分类判定,提高了现有邮件分类技术的精准性。 | ||
搜索关键词: | 一种 结合 用户 属性 邮件 分类 方法 系统 | ||
【主权项】:
1.一种结合用户属性的邮件分类方法,其特征在于,包括以下步骤:(1)初始化垃圾邮件概率:从待分类邮件中提取关键词,使用预先训练的邮件分类器对关键词分类,得到每个关键词的垃圾邮件概率值P(Spam|w),其中Spam表示垃圾邮件,w表示关键词;(2)根据用户爱好更新垃圾邮件概率:提取一个关键词,将其与预先构建的用户属性网中的收件人爱好进行匹配,如果匹配成功,则降低该关键词垃圾邮件概率值即P(Spam|w)=P(Spam|w)*ξ,ξ为兴趣爱好因子,否则,保持关键词垃圾邮件概率值P(Spam|w)不变;将关键词的垃圾邮件概率P(Spam|w)输入给预先训练的分类器,邮件分类器输出垃圾邮件概率P(Spam|E)其中Spam表示垃圾邮件,E表示邮件;重复本步骤,直到所有关键词和用户爱好完成对比;(3)根据邮件主题更新垃圾邮件概率:由邮件主题判断邮件是否是回复邮件,如果是则根据P(Spam|E)=P(Spam|E)*θ计算降低本邮件的垃圾邮件的概率,其中θ是回复因子,如果不是回复邮件则P(Spam|E)不变;(4)根据收发件人亲密度更新垃圾邮件概率:在用户属性网中统计收发件人历史通信次数;如果历史通信次数大于0则收发件人间的亲近度表示为
其中u表示用户u,
表示用户![]()
表示用户u和用户
之间的亲近度,ti,i=1,2,...,m表示通信次数,Tj,j=1,2,...,n表示通信次数范围,ck,k=1,2,...,n表示在不同通信次数范围内
的取值;如果历史通信次数为零,亲近度则随收发件人之间的间隔人数增加而减小,即
其中i是用户υ和用户u之间的间隔用户人数,
表示用户
用户
是用户υ和用户u的间隔用户,且用户
和用户u有通信历史,α为亲近度值下降系数;如果历史通信次数为零,但是收发件人之间有多条路径可以连接,亲近度则随收发件人之间连接路径的数量提 高而提高,即
其中p代表用户u可以到达用户v的路径数目;根据收发件人的亲近度更新垃圾邮件概率![]()
其中
是设置的亲近度阈值,e是自然常数,判断P(Spam|E)是否大于垃圾邮件阈值T,如果大于T,则将本邮件放入垃圾箱中,如果小于等于T,则放入收件箱中;(5)根据用户行为更新垃圾邮件概率:判断用户行为,如果用户将放入垃圾箱中的邮件恢复,则根据公式
降低该邮件中所有关键词的垃圾邮件概率值;如果用户将放入收件箱中的邮件删除,则根据公式![]()
增大该邮件中所有关键词的垃圾邮件概率值,其中wR代表恢复邮件中的关键词,wD代表删除邮件中的关键词,ρR表示恢复系数,ρD表示删除系数,e是自然常数;所述用户属性网的构建方法为:(11)信息提取:提取邮件的收发件人、邮件主题信息、用户行为和用户爱好信息;(12)构建用户节点:判断用户属性网中是否含有发件人用户或收件人用户,如果有则将属性网中用户节点资料和邮件中用户资料对比更新;如果不含发件人或发件人用户,则在用户属性网中创建用户节点;判断收发件人用户之间是否有通信历史,如没有则创建这两个用户间的连接关系,连接关系中通信次数初始化为1,如有则两个用户节点间的连接关系中通信次数累加一次;(13)构建邮件节点:根据邮件信息创建邮件节点属性和邮件收发关系属性,之后判断用户是否删除或恢复邮件,如果有则创建用户节点和邮件节点的删除或者恢复关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610592259.9/,转载请声明来源钻瓜专利网。