[发明专利]自动化阅读理解有效
申请号: | 201810662220.9 | 申请日: | 2015-05-11 |
公开(公告)号: | CN109101533B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 塔尼亚·贝德拉克斯·韦斯;安娜·帕特森;查迈纳·辛西娅·罗斯·德西尔瓦;阿德沃伊·门格尔;迈德·萨比尔·优素福·桑尼;卢克·弗里德曼;丹尼尔·安德森;路易斯·肖 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动化 阅读 理解 | ||
本申请涉及自动化阅读理解。本发明公开了用于基于呈现的各种信号来确定文本片段中的实体之间的相似性和/或不同性以及用于基于各种信号来确定在文本片段中所找到的一个或多个主语能够执行一个或多个相关联的动作的一个或多个可能性的方法和装置。
分案说明
本申请属于申请日为2015年5月11日的中国发明专利申请No.201580025196.2的分案申请。
背景技术
搜索引擎提供关于文档的信息,所述文档诸如web页面、图像、文本文档、电子邮件和/或多媒体内容。搜索引擎可以响应于用户的搜索查询而识别文档,所述搜索查询包括一个或多个搜索项。搜索引擎可以基于文档与查询的相关性以及文档的重要性来排名文档,并且可以提供搜索结果,其包括所识别文档的多个方面和/或指向所识别文档的链接。在一些情形下,搜索引擎可以附加地或替选地提供响应于搜索查询而与任何特定文档无关的信息(例如,“local time in Tokyo(东京的本地时间)”)。搜索引擎可以直接从文档中提取各种类型的信息,例如,以使文档通过搜索所提取的信息就“可找到”。直接从文档中提取的信息可以包括指名的实体(例如,人物、地点、事物等)、指名的实体的属性、时间数据(日期、时间、时间间隔等)、由主语执行的动作等等。
发明内容
本说明书大体上针对一些技术特征,用于确定在文本片段中所描述的实体之间的相似性和/或不同性,并且/或者用来确定与文本片段中的主语相关联的动作是否有可能可由所述主语执行。可以分析文本片段,诸如故事的摘录、文章、电子邮件、文本消息、书籍(或者其章节或更小部分)、散文等,例如,使用诸如正则表达式、规则、机器学习、共指消解等各种技术来识别所述文本片段中所引用的一个或多个实体(例如,人物、地点、事物等)和/或一个或多个主语(例如,人物、动物、角色、生命体等)。
在一些实施方式中,可以识别与所识别的一个或多个实体相关联的一个或多个实体属性,例如,使用类似的技术。基于所识别的实体属性以及其他信号(例如,所述文本片段中所包含的比较/对比信号、所述实体属性的同义词/反义词),可以作出关于实体之间的相似性和/或不同性的一个或多个确定。关于实体属性的确定可以被使用于各种目的,诸如,提供关于文本片段的更多鲁棒信息(例如,以加强搜索引擎的搜索)、回答关于文档的问题(例如,以辅助自动化阅读理解应试,或者以协助提供信息性查询结果)等等。
附加地或替选地,也可以识别与所识别的一个或多个主语相关联的一个或多个动作。至少部分地基于在文档的语料库中所找到的参考主语以及相关联的参考动作,可以确定所述动作可由所述主语执行的可能性。例如,假设所述主语是动物并且所述相关联的动作是通常由人类执行的一个动作(例如,唱歌、跳舞)。可以分析非虚构新闻故事的语料库中所包含的参考主语和动作,以确定所述动物主语将能够执行所述动作的可能性。如果所述动作被视为不太可能由所述动物主语执行,则可以提供所述动物主语已被“拟人化”的指示。主语将能够执行相关联的动作的可能性的指示可以被使用于各种目的,诸如,提供关于文本片段的更多鲁棒信息(例如,以加强搜索引擎的搜索)、回答关于文档的问题(例如,以辅助自动化阅读理解应试,或者以协助提供信息性查询结果)等等。
确定实体之间的相似性和/或不同性可以提供各种技术优势。例如,确定实体之间的相似性和/或不同性可以使搜索引擎的搜索更加高效,例如,通过基于实体的相似性或不同性来促进对文档的改进的索引,这进而可以减少实现搜索引擎的计算系统所需的计算时间和资源。提供更加准确的结果也可以使得用户信任度提高并且搜索引擎执行较少的搜索,这可以减少来自用户(例如,较少提交的搜索)以及来自搜索引擎(例如,返回较少的搜索结果)的网络流量。确定实体之间的相似性或不同性也可以促进通用知识库的增长,如本文所述,所述通用知识库可以是针对用户的通用信息的来源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810662220.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:检测作弊方法、装置及设备
- 下一篇:一种基于文本规则的自动文档分发方法和装置