[发明专利]相关项目的计算机实现的标识在审

专利信息
申请号: 201580050487.7 申请日: 2015-09-16
公开(公告)号: CN106796600A 公开(公告)日: 2017-05-31
发明(设计)人: 邱郁翔;郁欣;A·K·萨彻蒂 申请(专利权)人: 微软技术许可有限责任公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市金杜律师事务所11256 代理人: 王茂华
地址: 美国华*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 相关 项目 计算机 实现 标识
【说明书】:

背景技术

应用有时将输入的语言项目扩展成相关语言项目的集合。例如,搜索引擎可以将用户的输入查询扩展成被认为与用户的输入查询同义的术语的集合。搜索引擎然后可以基于查询和相关术语而不仅仅是原始查询来执行搜索。为了执行上述任务,搜索引擎可以应用在机器学习过程中产生的模型。机器学习过程进而对由有标签的训练示例的集合组成的训练数据语料库进行操作。该行业已经使用不同的技术来产生用于在训练过程中使用的标签,一些是手动的,一些是自动的。

发明内容

本文中描述了一种用于生成至少一个模型组件的计算机实现的训练系统。在一个实现中,训练系统通过利用已经评估的文档来间接地生成特定种子项目(例如,特定查询)和特定单个候选项目(例如,查询的潜在同义词)之间的每个配对的标签。也就是说,训练系统基于以下各项生成标签:评估测量,该评估测量测量文档的集合中的文档已经被评定为与特定种子项目相关的程度;以及检索信息,该检索信息反映在文档的集合中发现特定候选项目的程度。

总体上,训练系统基于标签信息和特征信息生成模型组件。标签信息共同地对应于在上面概括的处理中生成的标签。特征信息对应于为种子项目和候选项目的不同配对而生成的特征值的集合。

本文中还描述了用于应用在上述过程中生成的模型组件的模型应用系统。模型应用系统(例如,其实现搜索服务)通过以下方式来操作:接收输入项目(例如,输入查询)并且应用模型组件以生成被模型组件确定为与输入项目相关的零个、一个或多个相关项目的集合;该集合可以包括或排除原始输入项目作为其一部分。模型应用系统然后基于相关项目的集合而生成输出结果,并且将该输出结果传递给终端用户。

在另一实现中,训练系统生成第一模型组件和第二模型组件。在应用阶段,第一模型组件标识与输入项目相关的相关项目的初始集合。第二模型组件从相关项目的初始集合中选择相关项目的子集。

上述方法可以在各种类型的系统、设备、组件、方法、计算机可读存储介质、数据结构、图形用户界面演示、制品等中体现。

提供本发明内容以便以简化形式介绍概念的选择;这些概念在下面的具体实施方式中进一步描述。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。

附图说明

图1示出了其中训练系统产生由模型应用系统(例如,搜索服务)使用的一个或多个模型组件的环境的概述。

图2示出了图1的训练系统的一个实现。

图3示出了项目扩展组件的一个实现,其是图1的模型应用系统的组件。

图4示出了表示图1的整体环境的实现的一个计算系统。

图5示出了第一模型生成组件的一个实现,其是图2的训练系统的(可选)组件。

图6是由图5的第一模型生成组件执行的操作的示例。

图7示出了候选生成组件的一个实现,其是图5的第一模型生成组件的一个组件。

图8示出了标签生成组件的一个实现,其是图5的第一模型生成组件的另一组件。

图9是由图8的标签生成组件执行的操作的示例。

图10示出了特征生成组件的一个实现,其是图5的第一模型生成组件的另一组件。

图11示出了第二模型生成组件的一个实现,其是图2的训练系统的另一(可选)组件。

图12是由图11的第二模型生成组件执行的操作的示例。

图13示出了过程,图1的训练系统可以通过该过程来生成模型组件(诸如第一模型组件(使用图5的模型生成组件)或第二模型组件(使用图11的第二模型生成组件))。

图14示出了过程,图1的训练系统可以通过该过程来生成标签用于在产生模型组件时使用。

图15示出了过程,图1的训练系统可以通过该过程来生成第二模型组件。

图16示出了表示图1的模型应用系统的一种操作方式的过程。

图17示出了可以被用于实现前述附图中所示的特征的任何方面的说明性计算功能。

在整个公开和附图中使用相同的附图标记来指代相同的组件和特征。系列100数字是指最初在图1中找到的特征,系列200数字是指最初在图2中找到的特征,系列300数字是指最初在图3中找到的特征,等等。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201580050487.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top