[发明专利]基于深度学习的邮件标签方法、系统、设备及存储介质在审
申请号: | 202011344783.7 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112257814A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 王思博;罗超;胡泓;李巍;邹宇 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 钟宗 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 邮件 标签 方法 系统 设备 存储 介质 | ||
本发明提供了基于深度学习的邮件标签方法、系统、设备及存储介质,该方法包括:建立邮件数据队列,采集第一类预设字段的数据消息;当邮件是否为匿名联系用户的预设业务,解析邮件文本内容,抓取第二类预设字段的内容,第二类预设字段至少包括邮件正文;对第二类预设字段的内容进行预处理;基于内容的语种,分别输入到基于不同语言的标签分类模型,获得邮件文本内容对应的标签;根据邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息,发送到预设的处理邮箱。本发明面对复杂的语义表达,能够有更高的准确率和召回率,便于及时干预酒店违规行为,达到及时保障客人权益和隐私。
技术领域
本发明涉及邮件标签分类领域,具体地说,涉及基于深度学习的邮件标签方法、系统、设备及存储介质。
背景技术
目前酒店通过平台邮件联系客人的过程中,由于缺乏有效的违规监控,出现了大量满房取消、切客、索要客人手机号等酒店违规行为,不仅导致客人无法得到入住权益、隐私安全等保障,而且无故增加了公司的订单损失。现有的方法是通过关键词提取和T+1审核的方式,即业务方根据命中关键词抓取的结果,当天审核前一天的疑似违规邮件,进一步处罚酒店。关键词的方式相对而言比较简单,但遇到深层次语义表达的情况,效果就很差了。而且T+1审核也无法及时制止酒店的违规行为。
因此,本发明提供了一种基于深度学习的邮件标签方法、系统、设备及存储介质。
发明内容
针对现有技术中的问题,本发明的目的在于提供基于深度学习的邮件标签方法、系统、设备及存储介质,克服了现有技术的困难,面对复杂的语义表达,能够有更高的准确率和召回率,便于及时干预酒店违规行为,达到及时保障客人权益和隐私。
本发明的实施例提供一种基于深度学习的邮件标签方法,包括以下步骤:
S110、建立邮件数据队列,采集所述邮件数据队列中第一类预设字段的数据消息,所述第一类预设字段至少包括发件人邮箱、邮件主题;
S120、判断所述邮件是否为匿名联系用户的预设业务,若是,则执行步骤S130,若否,则结束;
S130、解析邮件文本内容,抓取第二类预设字段的内容,所述第二类预设字段至少包括邮件正文;
S140、对所述第二类预设字段的内容进行预处理;
S150、基于所述第二类预设字段的内容的语种,分别输入到基于不同语言的经过训练的标签分类模型,获得所述邮件文本内容对应的至少一个标签;
S160、根据所述邮件文本内容的标签与预设标签映射表的映射关系,获得邮件处理流程信息;以及
S170、将所述邮件处理流程信息发送到预设的处理邮箱。
优选地,所述步骤S110中,所述第一类预设字段包括订单号、邮件ID、邮件下载地址、发件人邮箱、邮件主题。
优选地,所述步骤S120中,根据发件人邮箱、邮件主题判断是否是酒店匿名联系客人的业务。
优选地,所述步骤S130中,通过HTTP请求的方式,解析出邮件的文本内容,所述第二类预设字段包括收发件人信息、邮件主题、邮件正文、历史邮件对话信息。
优选地,所述步骤S140中,包括以下步骤:
S141、根据收发件人信息,定位当前邮件的文本内容,过滤掉历史邮件对话信息;
S142、根据所述邮件主题以及搜索所述邮件正文内容中预设邮件开头语的位置,定位邮件正文内容;
S143、当所述邮件语言是繁体中文,转换成简体中文;
S144、当所述邮件语言是中文,进行中文分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011344783.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可调式的定位夹紧装置
- 下一篇:视频边界检测方法、系统、设备及存储介质