[发明专利]基于深度学习的邮件标签方法、系统、设备及存储介质在审
申请号: | 202011344783.7 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112257814A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 王思博;罗超;胡泓;李巍;邹宇 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 钟宗 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 邮件 标签 方法 系统 设备 存储 介质 | ||
1.一种基于深度学习的邮件标签方法,其特征在于,包括以下步骤:
S110、建立邮件数据队列,采集所述邮件数据队列中第一类预设字段的数据消息,所述第一类预设字段至少包括发件人邮箱、邮件主题;
S120、判断所述邮件是否为匿名联系用户的预设业务,若是,则执行步骤S130,若否,则结束;
S130、解析邮件文本内容,抓取第二类预设字段的内容,所述第二类预设字段至少包括邮件正文;
S140、对所述第二类预设字段的内容进行预处理;
S150、基于所述第二类预设字段的内容的语种,分别输入到基于不同语言的经过训练的标签分类模型,获得所述邮件文本内容对应的至少一个标签;
S160、根据所述邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息;以及
S170、将所述邮件处理流程信息发送到预设的处理邮箱。
2.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S110中,所述第一类预设字段包括订单号、邮件ID、邮件下载地址、发件人邮箱、邮件主题。
3.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S120中,根据发件人邮箱、邮件主题判断是否是酒店匿名联系客人的业务。
4.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S130中,通过HTTP请求的方式,解析出邮件的文本内容,所述第二类预设字段包括收发件人信息、邮件主题、邮件正文、历史邮件对话信息。
5.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S140中,包括以下步骤:
S141、根据收发件人信息,定位当前邮件的文本内容,过滤掉历史邮件对话信息;
S142、根据所述邮件主题以及搜索所述邮件正文内容中预设邮件开头语的位置,定位邮件正文内容;
S143、当所述邮件语言是繁体中文,转换成简体中文;
S144、当所述邮件语言是中文,进行中文分词。
6.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S150中,所述标签分类模型为经过预训练的ALBERT模型,所述ALBERT模型输出的分类标签包括满房、切客、确认后涨价、索要手机号、支付。
7.根据权利要求1所述的基于深度学习的邮件标签方法,其特征在于,所述步骤S160中,所述预设标签映射表中包括每个所述标签与至少一邮件处理流程信息的映射关系;
所述步骤S170中,包括处理信息自所述标签对应的邮件抓取的至少包括邮件ID、订单号、邮件发生时间、标签。
8.一种基于深度学习的邮件标签系统,用于实现权利要求1所述的基于深度学习的邮件标签方法,其特征在于,包括:
数据队列模块,建立邮件数据队列,采集所述邮件数据队列中第一类预设字段的数据消息,所述第一类预设字段至少包括发件人邮箱、邮件主题;
匿名判断模块,判断所述邮件是否为匿名联系用户的预设业务,若是,则执行步骤S130,若否,则结束;
解析邮件模块,解析邮件文本内容,抓取第二类预设字段的内容,所述第二类预设字段至少包括邮件正文;
预处理模块,对所述第二类预设字段的内容进行预处理;
分类模型模块,基于所述第二类预设字段的内容的语种,分别输入到基于不同语言的经过训练的标签分类模型,获得所述邮件文本内容对应的至少一个标签;
映射关系模块,根据所述邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息;以及
邮件处理模块,将所述邮件处理流程信息发送到预设的处理邮箱。
9.一种基于深度学习的邮件标签设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任意一项所述基于深度学习的邮件标签方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7任意一项所述基于深度学习的邮件标签方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011344783.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可调式的定位夹紧装置
- 下一篇:视频边界检测方法、系统、设备及存储介质