[发明专利]一种基于会话网络的邮件重要性评价方法有效
申请号: | 201811441956.X | 申请日: | 2018-11-29 |
公开(公告)号: | CN109543050B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 胡春明;蒋坤;何潇安 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/38 | 分类号: | G06F16/38;G06Q50/00 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 会话 网络 邮件 重要性 评价 方法 | ||
本发明提出一种基于会话网络的邮件重要性评价方法。首先对邮件的部分特征进行提取,并对邮件的会话网络进行还原。在邮件的会话网络的基础上,为了充分体现邮件之间的上下文关系,使用邮件之间的引用关系(包括回复和转发)作为会话网络中的边。最后结合邮件特征和邮件的会话网络结构提出了一种新的邮件重要性评价算法。
技术领域
本发明涉及一种智能评价方法,尤其涉及一种基于会话网络的邮件重要性评价方法。
背景技术
在社交服务走向多样化的如今,邮件由于其良好的隐私性和普及性仍然保持着庞大的用户群体,据统计,目前全球范围每天约有2050亿封邮件被收发。但是过多的邮件也导致了邮件过载问题,用户无法从自己的邮箱中有效地过滤出重要邮件,纽约时报曾称邮件过载问题是一项价值6500亿美金的经济阻力。
解决邮件过载问题的有效方法之一就是对邮件的重要性进行评价,一方面可以进行重要性邮件的推荐,另一方面可以为垃圾邮件分类提供参考依据。目前针对邮件的重要性评价方法主要分为两类,一类是基于收发件人之间的信任分数,一类是基于特征提取的邮件重要性判别式模型。
其中基于信任分数的方法首先需要构建用户之间的社交信任网络。该网络是一个有向图,其中每个节点是个人用户,边表示信赖关系,如节点X到节点Y的边表示用户X信赖用户Y。如图1所示为一个信任网络,其中实线表示信任,虚线表示没有信任。将需要计算信任关系的节点称为sink,考虑信任路径,本发明可以得出对于节点1而言sink是不可信任的,而对于节点2而言sink是可信任的。此外,如果考虑到传递的层数,这个信任度是可以量化的。
在对社交信任网络建模后,在该网络中使用结构和信任度信息计算节点间的信任关系,并认为来自信任的发件人的邮件是重要的。Golbeck提出的TrustMail系统是使用信任网络对邮件重要性评价的开创性工作。
另一类对邮件的重要性评价方法则是关注于邮件的特征,通过提取邮件的特征对邮件的重要度进行评价。这也是目前主要的邮件重要性研究方向,这类方法的步骤如图2所示。这类方法不同点主要是特征工程中选取的特征不同。以Gmail为例,该系统进行邮件重要性分类预测主要提取了四类特征,分别是社交特征(Social feature),内容特征(Content feature),线程特征(Thread feature)和标记特征(Label feature)。
现有技术基于社交信任网络的方法忽略了邮件的元数据信息,而基于判别式模型的方法没有考虑邮件的网络结构信息。此外,现有的针对邮件重要性评价方法忽略了邮件之间的上下文关系,无法体现邮件之间的引用关系(包括答复,转发),而在进行邮件重要度评价中是需要考虑该因素的,其原因是邮件相对于普通文本的关键区别之一就是邮件间会存在逻辑上下文关系,而这部分隐式信息在现有的邮件重要性评价方法中没有被考虑到。
发明内容
针对这个问题,本发明提出一种基于会话网络的邮件重要性评价方法。首先对邮件的部分特征进行提取,并对邮件的会话网络进行还原。在邮件的会话网络的基础上,为了充分体现邮件之间的上下文关系,使用邮件之间的引用关系(包括回复和转发)作为会话网络中的边。最后结合邮件特征和邮件的会话网络结构提出了一种新的邮件重要性评价算法。为实现上述的发明目的,本发明包括以下步骤:
步骤1,邮件数据集预处理。在这个步骤中主要进行邮件的去重以及时区的统一。其中邮件的去重是为了避免在邮件网络中出现重复节点。进行时区的统一是因为在下面进行邮件引用关系生成会使用时序关系,时区不统一会出现错误。
步骤2,邮件会话网络构建。邮件会话网络构建主要包括两部分,分别是特征提取,边生成。
步骤3,使用邮件重要性评价算法对于邮件的重要性进行评价。在邮件的会话网络上结合邮件特征基于PageRank算法改进的一种邮件重要性评价算法对邮件的重要性进行评价。
本方法相对于现有技术有如下的特点和优势:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811441956.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种针对写作特点自动推送素材的方法及系统
- 下一篇:一种广告投放方法及装置