[发明专利]相关项目的计算机实现的标识在审
申请号: | 201580050487.7 | 申请日: | 2015-09-16 |
公开(公告)号: | CN106796600A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 邱郁翔;郁欣;A·K·萨彻蒂 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相关 项目 计算机 实现 标识 | ||
背景技术
应用有时将输入的语言项目扩展成相关语言项目的集合。例如,搜索引擎可以将用户的输入查询扩展成被认为与用户的输入查询同义的术语的集合。搜索引擎然后可以基于查询和相关术语而不仅仅是原始查询来执行搜索。为了执行上述任务,搜索引擎可以应用在机器学习过程中产生的模型。机器学习过程进而对由有标签的训练示例的集合组成的训练数据语料库进行操作。该行业已经使用不同的技术来产生用于在训练过程中使用的标签,一些是手动的,一些是自动的。
发明内容
本文中描述了一种用于生成至少一个模型组件的计算机实现的训练系统。在一个实现中,训练系统通过利用已经评估的文档来间接地生成特定种子项目(例如,特定查询)和特定单个候选项目(例如,查询的潜在同义词)之间的每个配对的标签。也就是说,训练系统基于以下各项生成标签:评估测量,该评估测量测量文档的集合中的文档已经被评定为与特定种子项目相关的程度;以及检索信息,该检索信息反映在文档的集合中发现特定候选项目的程度。
总体上,训练系统基于标签信息和特征信息生成模型组件。标签信息共同地对应于在上面概括的处理中生成的标签。特征信息对应于为种子项目和候选项目的不同配对而生成的特征值的集合。
本文中还描述了用于应用在上述过程中生成的模型组件的模型应用系统。模型应用系统(例如,其实现搜索服务)通过以下方式来操作:接收输入项目(例如,输入查询)并且应用模型组件以生成被模型组件确定为与输入项目相关的零个、一个或多个相关项目的集合;该集合可以包括或排除原始输入项目作为其一部分。模型应用系统然后基于相关项目的集合而生成输出结果,并且将该输出结果传递给终端用户。
在另一实现中,训练系统生成第一模型组件和第二模型组件。在应用阶段,第一模型组件标识与输入项目相关的相关项目的初始集合。第二模型组件从相关项目的初始集合中选择相关项目的子集。
上述方法可以在各种类型的系统、设备、组件、方法、计算机可读存储介质、数据结构、图形用户界面演示、制品等中体现。
提供本发明内容以便以简化形式介绍概念的选择;这些概念在下面的具体实施方式中进一步描述。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
附图说明
图1示出了其中训练系统产生由模型应用系统(例如,搜索服务)使用的一个或多个模型组件的环境的概述。
图2示出了图1的训练系统的一个实现。
图3示出了项目扩展组件的一个实现,其是图1的模型应用系统的组件。
图4示出了表示图1的整体环境的实现的一个计算系统。
图5示出了第一模型生成组件的一个实现,其是图2的训练系统的(可选)组件。
图6是由图5的第一模型生成组件执行的操作的示例。
图7示出了候选生成组件的一个实现,其是图5的第一模型生成组件的一个组件。
图8示出了标签生成组件的一个实现,其是图5的第一模型生成组件的另一组件。
图9是由图8的标签生成组件执行的操作的示例。
图10示出了特征生成组件的一个实现,其是图5的第一模型生成组件的另一组件。
图11示出了第二模型生成组件的一个实现,其是图2的训练系统的另一(可选)组件。
图12是由图11的第二模型生成组件执行的操作的示例。
图13示出了过程,图1的训练系统可以通过该过程来生成模型组件(诸如第一模型组件(使用图5的模型生成组件)或第二模型组件(使用图11的第二模型生成组件))。
图14示出了过程,图1的训练系统可以通过该过程来生成标签用于在产生模型组件时使用。
图15示出了过程,图1的训练系统可以通过该过程来生成第二模型组件。
图16示出了表示图1的模型应用系统的一种操作方式的过程。
图17示出了可以被用于实现前述附图中所示的特征的任何方面的说明性计算功能。
在整个公开和附图中使用相同的附图标记来指代相同的组件和特征。系列100数字是指最初在图1中找到的特征,系列200数字是指最初在图2中找到的特征,系列300数字是指最初在图3中找到的特征,等等。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580050487.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于附近位置解释用户查询
- 下一篇:用于内容创作的生产力工具