[发明专利]一种邮件指纹提取方法及系统在审
申请号: | 202210581925.4 | 申请日: | 2022-05-26 |
公开(公告)号: | CN114745348A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 刘庆林;王金威;刘正伟;魏海宇;谢辉;安恩庆;李小琼;康柏荣;王鲲 | 申请(专利权)人: | 北京中睿天下信息技术有限公司 |
主分类号: | H04L51/42 | 分类号: | H04L51/42;H04L51/08;G06F21/60;G06F21/64 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 丁彦峰 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 邮件 指纹 提取 方法 系统 | ||
本申请公开了一种邮件指纹提取方法及系统。本方法首先从接收到的目标邮件中提取邮件头部分、邮件正文部分以及附件信息部分;然后对邮件头部分进行特征提取得到邮件头部特征码;对邮件正文部分进行特征提取得到邮件正文特征码;对附件信息部分进行特征提取得到邮件附件特征码;最后基于邮件头部特征码、邮件正文特征码以及邮件附件特征码对目标邮件进行指纹提取。本发明通过对三部分指纹字符的提取,实现了摘要指纹计算方法,减少了传统指纹提取方案中需要进行邮件全文数据计算导致计算速度满、资源消耗大的问题,同时后期在进行指纹匹配时也可以按照提取的方式进行匹配,极大的提升了邮件匹配效率。
技术领域
本发明涉及邮件安全领域,特别涉及一种邮件指纹提取方法及系统。
背景技术
在邮件安全的领域里,发送批量的垃圾邮件是攻击者经常会使用的一种攻击手段,攻击者通过工具可以很方便的构造出大量重复的垃圾邮件进行投递,从而使邮件服务器负载加剧甚至导致服务中断,为业务的正常运行带来巨大风险。
识别大批量相同邮件的一个重要手段就是通过将邮件信封、邮件内容、邮件附件等信息结合进行指纹摘要提取,作为判断批量邮件的特征使用,这种方案从理论上来说是没有问题的,但是当邮件内容巨大、附件巨大或相同邮件的数量特别巨大时,邮件指纹计算的提取的速度将受到严重影响,严重影响到了邮件业务的处理速度。
目前也存在一种截取数据的方式进行指纹计算的方法,这种方法对大邮件只提取前面一部分数据进行指纹计算,超出大小的部分不处理,这样就可以减少进行指纹计算的数据量提升计算和匹配效率。
目前比较常见的邮件指纹提取方式仍然是通过全文提取的方式处理,将邮件的信封、正文、附件等全量信息组合后进行摘要计算,将结果作为邮件指纹存储的方式,这种方式会提取邮件的全部信息,当遇到邮件内容较大、邮件正文中存在大量不可见字符、附件内容较大的情况时,需要获取摘要的整合结果就会很长,计算效率会出现明显的下降,影响指纹的计算效率和后续的匹配效率。
对于部分截取方式的指纹计算,虽然从计算上减少了邮件内容的提取,但是这种只采取截断连续部分的方式会产生大量的误报指纹,严重影响业务的准确性,同时对附件信息的处理也存在天然的缺陷。
发明内容
基于此,本申请实施例提供了一种邮件指纹提取方法及系统,能够通过特征、采样、统计等方式减少巨大邮件中标识邮件指纹数据,只需要少量数据就可以实现整个邮件的精准标识,提高指纹计算的效率和后续需要进行指纹匹配业务的效率,提升邮件业务处理能力。
第一方面,提供了一种邮件指纹提取方法,该方法包括:
从接收到的目标邮件中提取邮件头部分、邮件正文部分以及附件信息部分;
对所述邮件头部分进行邮件头特征提取得到邮件头部特征码;
对所述邮件正文部分进行正文特征提取得到邮件正文特征码;
对所述附件信息部分进行附件特征提取得到邮件附件特征码;
基于邮件头部特征码、邮件正文特征码以及邮件附件特征码对所述目标邮件进行指纹提取。
可选地,所述根据各个指标项的指标项得分进行企业诚信状况评估得出待测企业的诚信分,包括:
依据应用场景的真实业务特征,在所述各个指标项的指标项得分中选取信用主体的指标,计算各个指标项的权重值;并利用得到的各个指标项的权重值和指标项得分计算出待测企业的诚信分。
可选地,所述邮件头部分至少包括:
邮件的发件人、收件人、时间、主题、Message-ID、投递路由;还包括RFC规定的头域信息以及邮件中继服务器或邮件网关类设备添加的自定义头域信息。
可选地,对所述邮件头部分进行邮件头特征提取得到邮件头部特征码,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中睿天下信息技术有限公司,未经北京中睿天下信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210581925.4/2.html,转载请声明来源钻瓜专利网。