[发明专利]使用领域自适应的通信中的任务检测在审
申请号: | 201980071214.9 | 申请日: | 2019-09-05 |
公开(公告)号: | CN112997202A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | R·A·西姆;R·W·怀特;H·阿扎邦亚德 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 领域 自适应 通信 中的 任务 检测 | ||
本文大体上讨论了用于任务分类的设备、系统和方法。一种方法可以包括:修改来自源语料库的源样本的源句子的表示,以更接近地类似于来自目标语料库的目标样本的目标句子的表示,使用机器学习模型来与目标样本一起操作以生成任务标记,该机器学习模型使用源句子的经修改的表示而被训练,任务标记指示目标样本是否包括任务,以及基于目标样本是否包括任务来使个人信息管理器(PIM)生成提醒。
背景技术
在过去的几十年里,电子邮件的使用在总量(信息过载)和电子邮件被使用的目的数量(功能过载)方面都有所增长。许多电子邮件程序都用作通信工具以及任务储存库、个人档案和日历工具。尽管各种研究(research)都关注如何通过直接集成任务支持或者在电子邮件客户端内记入日历(calendaring)来支持该功能过载,但是很少有研究关注存在于其他数据源中的信息如何可以被用于缓解信息过载。附加地,很少有研究关注在搜索或重新查找个人信息管理器(PIM)(例如电子邮件)储存库上的项目时存在的搜索问题。
先前的研究包括关于自动电子邮件管理和任务进程监测的工作。关于承诺(commitment)检测和领域自适应(domain adaptation)的先前研究包括表明电子邮件中的承诺和请求的注释是具有挑战性的,即使对人类也是如此。承诺是个人承诺执行动作的允诺(promise),并且请求是接收人执行所请求的动作的恳求(solicitation)。至少一个研究课题甚至制定了用于收集判断并且构建承诺/请求分类的数据集的指导方针。该研究的一个见解是当陈述在上下文(完整的电子邮件)中被给出时,注释任务更容易且更准确。其他先前研究表明对通信中的承诺的细粒度分类,并且研究哪些短语与承诺相关联。
然而,自动承诺分类器已经在其他工作中得到发展。例如,一些研究建议训练分类器将电子邮件中的句子分类为以下行动之一:递送、承诺、请求、改正、提议和会议。在该研究中,句子由n元词语上的词频逆文档频率(TF-IDF)加权向量表示。
其他研究已经使用了更复杂的特征来检测电子邮件中的承诺,诸如命名实体、词性(POS)标签、相关性和指代消解。该研究将请求和承诺两者视为承诺。
还有其他研究使用不同种类的特征来检测电子邮件中的任务。该研究将承诺视为从电子邮件中提取的任务中的一个任务,并且将请求和承诺两者视为承诺。该研究使用特征集,诸如消息长度、情态动词的存在和疑问词语,并且在手动标记的电子邮件集合上训练分类器。该研究的结论是,仅电子邮件的一些区域与承诺检测相关,并且其他区域通常引入了噪声。
所有这些研究都使用单个数据集来训练模型并且执行分析。这些研究中使用的数据集也很小(例如用于训练模型的示例不足一万个)。尽管一个研究对承诺模型的可迁移性执行了有限的分析,但是该研究使用了来自同一领域的数据集。
出于隐私原因,使用专有数据训练承诺检测模型(和其他基于电子邮件的模型)可能是不切实际的。相反,这些模型是基于公共语料库训练的。基于该公共数据训练的问题是所得模型相对于私有/专有目标受众是有偏差的,从而在目标上产生了次优性能。实施例提供了一种减少或移除与使用这种公共语料库训练的模型的偏差的方法。实施例可以提供在专有目标上执行良好的模型,而不需要或仅需要目标语料库的最小检查。
发明内容
该发明内容章节被提供来以简化形式引入实施例的各个方面,并且在详细描述中进一步解释以下实施例。该发明内容章节不旨在标识所要求保护的主题的必要或所需特征,并且在该发明内容章节中列出的元件的组合和顺序不旨在向所要求保护的主题的元件提供限制。
一种系统可以包括存储器。该系统还可以包括处理电路系统,被耦合至存储器以实现用于对来自目标语料库的目标样本进行任务分类的操作。任务分类可以包括:修改来自源语料库的源样本的源句子的表示,以更接近地类似于来自目标语料库的目标样本的目标句子。任务分类还可以包括:使用机器学习模型来与目标样本一起操作以生成任务标记,该机器学习模型使用源句子的经修改的表示而被训练,该任务标记指示目标样本是否包括任务。处理电路系统还可以基于目标样本是否包括任务来使个人信息管理器(PIM)生成提醒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980071214.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理