[发明专利]一种面向数字人文的电子邮件历史事件轴生成方法及装置有效

专利信息
申请号: 201911422430.1 申请日: 2019-12-30
公开(公告)号: CN111177421B 公开(公告)日: 2023-07-04
发明(设计)人: 林延中;杨芸;朱南皓;潘文辉;彭文浩;许佳柱 申请(专利权)人: 论客科技(广州)有限公司
主分类号: G06F16/432 分类号: G06F16/432;G06F16/44;H04L51/42;H04L51/216
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 郭浩辉;麦小婵
地址: 510006 广东省广州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 数字 人文 电子邮件 历史事件 生成 方法 装置
【说明书】:

发明提供了一种面向数字人文的电子邮件历史事件轴生成方法、装置、终端设备及可读存储介质,方法包括:建立深度哈希模型,并利用训练数据集对深度哈希模型进行训练;利用训练好的深度哈希模型对预先归档的电子邮件进行哈希编码,并将得到的邮件哈希码与对应的邮件进行关联存储到邮件史料数据库中;利用训练好的深度哈希模型根据获取到的检索语句生成检索哈希值并进行检索以提取出目标电子邮件;根据各个目标电子邮件的归档时间,按时间先后顺序生成电子邮件历史事件轴。本发明能够将深度学习应用于电子邮件检索,并对检索到的电子邮件生成电子邮件历史事件轴,从而能够有效辅助数字人文研究及相关电子史料的保存与利用、助力人文学术研究。

技术领域

本发明涉及邮件检索领域,尤其是涉及一种面向数字人文的电子邮件历史事件轴生成方法、装置、终端设备及可读存储介质。

背景技术

在数字人文领域,传统人文历史研究也受到了诸如人工智能、深度学习的影响,产生了以技术辅助人文研究的新趋势。传统历史的研究依赖于纸质史料,随着互联网的普及,未来历史学家对当代历史的研究将会由传统纸质史料转为电子史料,电子邮件作为传统信件在信息社会里的新形式,能帮助各个群体更好地开展各方面的当代历史研究,为现实行为提供合法依据。

由于不同数据的异构性,以及传统手工设计特征在特征表示上能力不足,传统的跨模态检索方法不能有效地通过多模态数据的关联关系来降低其异构性,从而无法取得更好的效果。

同时,就提取电子邮件信息作为面向数字人文的历史事件轴而言,“语义鸿沟”问题是当今的难点问题,将深度学习应用于电子邮件检索,为解决异质数据之间的“媒体鸿沟”提供了大量特征学习与表示方面先进的研究成果。但是,传统检索技术不能有效捕捉在数字人文视域下,电子邮件包含的历史信息的空间性和时间性,无法学习强大的特征表示和跨模态嵌入,因而无法生成用于数字人文研究的高质量、紧凑的哈希编码,导致不能取得较好的检索效果。

发明内容

本发明实施例所要解决的技术问题在于,提供一种面向数字人文的电子邮件历史事件轴生成方法、装置、终端设备及可读存储介质,能够将深度学习应用于电子邮件检索,并对检索到的电子邮件生成电子邮件历史事件轴,进而有效辅助数字人文研究及相关电子史料的保存与利用。

为了解决上述技术问题,本发明实施例提供了一种面向数字人文的电子邮件历史事件轴生成方法,包括:

建立深度哈希模型,并利用预设的训练数据集对所述深度哈希模型进行训练;其中,所述训练数据集中的每一训练数据样本均包括多个标签;

利用训练好的深度哈希模型对预先归档的所有电子邮件进行哈希编码,并将得到的邮件哈希码与对应的邮件进行关联存储到邮件史料数据库中;

利用训练好的深度哈希模型根据获取到的检索语句生成检索哈希值,并根据所述检索哈希值对所述邮件史料数据库进行检索以提取出目标电子邮件;

根据各个所述目标电子邮件的归档时间,按时间先后顺序生成电子邮件历史事件轴。

进一步地,在所述建立深度哈希模型之前,还包括:

实时对目标邮件系统中的所有电子邮件进行归档,根据邮件收件时间或邮件发件时间对各个电子邮件进行时间标注并存储。

进一步地,在所述对各个电子邮件进行时间标注后,还包括:

根据预设的加密算法对归档的所有电子邮件进行加密并存储。

进一步地,所述建立深度哈希模型,还包括:

将预设的损失函数添加到所述深度哈希模型,以通过所述损失函数对所述深度哈希模型在训练过程中的输出结果进行约束。

进一步地,所述利用预设的训练数据集对所述深度哈希模型进行训练,具体为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于论客科技(广州)有限公司,未经论客科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911422430.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top