[发明专利]使实体的独特事实显现有效
申请号: | 201710661288.0 | 申请日: | 2017-08-04 |
公开(公告)号: | CN107688616B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 阿卡什·纳纳瓦蒂;阿尼克特·雷;托尔斯滕·罗尔芬格 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06F16/35;G06F16/33 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 独特 事实 显现 | ||
本申请涉及使实体的独特事实显现。系统和方法识别并且提供与实体有关的有趣事实。示例方法包括:选择与至少一个独特事实触发相关联的文档,所述文档来自文档存储库。所述方法还包括:从所述文档生成实体‑句子对;以及,针对由所述实体‑句子对表示的实体中的第一实体,使用出现在句子中的突显项来将所述第一实体的所述实体‑句子对聚类。所述方法还包括:确定所述集群中的每一个集群的代表句子;以及,响应于识别所述第一实体的查询,提供至少一个代表句子。另一示例方法包括:确定查询与知识库中的实体有关;确定所述实体具有相关联的独特事实列表;以及响应于所述查询,提供在所述列表中的所述独特事实中的至少一个。
相关申请
本申请是2016年8月5日提交的标题为“Surfacing Unique Facts for Entities”的美国临时申请No.62,371,461号的非临时申请并且要求其优先权,其公开内容通过引用合并于此。
背景技术
传统上,搜索引擎搜索出现在文档中的查询项(query term),诸如,可通过互联网进行访问的网页。搜索引擎可以用于搜索其它数据源,诸如,知识库。知识库存储与实体有关的信息(例如,属性或者事实)。为知识库中的实体存储的事实往往是结构化的或者模式化的,或者换句话说,针对某种类型的实体的所有实例是共同的。例如,知识库可以包括:动物实体的学名、寿命、质量、保护现状等,并且可以具有城市实体的人口、地理位置、和市长。响应于提及在知识库中的实体的查询,可以将来自知识库的信息包括在文档中。
发明内容
实施方式提供了一种响应于对特定实体的查询自动识别并且提供独特事实(unique facts)的改进型搜索引擎。例如,实施方式可以从文档存储库中识别并且提取表示实体的独特事实的句子、确定最佳事实、并且响应于被定向到实体的查询提供这些事实中的一个或者多个。该查询可以具体地请求实体的独特事实或者有趣的事实或者可以是被定向到实体的查询。系统可以自动选择高质量、支持良好的事实,而不是表达差劣的事实或者缺少支持的事实。系统可以使用格式差劣的句子和需要场境以支持事实的句子,但是可以不响应于查询提供这样的句子。在一些实施方式中,系统可以将句子聚类,从而使得支持特定事实的句子聚类在一起并且可以从集群中选择一个句子作为集群的代表句子。响应于查询而提供的句子可以是代表句子,并且系统可以对代表句子进行分析以确保不显示重复的事实。可以按照随机顺序来显示句子,或者在一些实施方式中,可以对句子和集群进行评分,从而使得在得分较低的句子之前提供得分较高的代表句子。这些句子可被提供有指向它们从中被提取出的源文档的链接。
根据某些方面,一种系统包括:数据存储,该数据存储存储独特事实触发;以及查询处理系统。该查询处理系统可以包括:至少一个处理器;以及存储器,该存储器存储指令,该指令在由至少一个处理器执行时使查询处理系统执行操作。该操作包括:从文档存储库中选择与至少一个独特事实触发相关联的文档;以及为第一实体生成实体-句子对。实体可以是在存储实体和相应事实的知识库中的实体。生成实体-句子对包括:从所选择的文档中提取句子;以及针对所述句子中的至少一些句子中的每一句,在该句子中识别对第一实体的指代(reference);以及存储该句子和从中提取出该句子的文档的标识符,作为第一实体的实体-句子对。该操作还包括:通过对实体-句子对根据突显项(salient term)来聚类,来为第一实体生成至少一个主要独特事实集群;以及确定该至少一个主要独特事实集群中的每一个的代表句子。该操作还包括:响应于识别第一实体的查询,提供至少一个代表句子。
根据某些方面,一种方法包括:选择与至少一个独特事实触发相关联的文档。该文档来自文档存储库。该方法还包括:从选择的文档生成实体-句子对。在实体-句子对中的实体来自知识库并且当实体-句子对中的句子包括对该实体的提及时,将实体-句子对中的该实体与该句子相关联。该方法还包括:针对由实体-句子对表示的实体中的第一实体,使用出现在句子中的突显项来将第一实体的实体-句子对聚类,该聚类产生主要集群,其中,至少一个主要集群具有支持集群;以及确定主要集群中的每一个主要集群的代表句子。该方法还包括:响应于识别第一实体的查询,提供至少一个代表句子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710661288.0/2.html,转载请声明来源钻瓜专利网。