[发明专利]意图知识图谱生成方法、意图识别方法及装置有效
申请号: | 201910511702.9 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110263180B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 李然;卢佳俊;王灿;朱嘉琪;任可欣 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/901 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;刘悦晗 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 知识 图谱 生成 方法 识别 装置 | ||
本公开提供一种意图知识图谱生成方法、意图识别方法及装置,根据用户历史检索信息,识别与检索词对应的实体和意图,建立检索词和实体之间的第一映射关系,以及检索词和意图之间的第二映射关系,将实体与预设的概念体系中底层的概念关联,并根据资源数据的内容信息和识别出的意图,建立所述资源数据与所述第二映射关系的链接,从而生成意图知识图谱。在进行意图识别时,对于用户输入的实体类检索词,先确定对应的实体,再确定该实体下所有的检索词,从中选择与用户输入的检索词最接近的检索词,并确定相应的第二映射关系,由此获取相关的资源数据。本公开还提供一种服务器和计算机可读介质。
技术领域
本公开涉及知识图谱技术领域,具体涉及一种意图知识图谱生成方法及装置、意图识别方法及装置、服务器和计算机可读介质。
背景技术
在传统的搜索场景中,搜索引擎会根据用户输入的检索词(query),为用户返回相关的检索结果。传统的搜索场景是基于倒排索引和字符串匹配的逻辑为用户返回相关网页或信息,例如:用户检索query=“茶杯犬多少钱一只”,即可根据上述方法,匹配“茶杯犬”及“多少钱”相关的页面给用户。
但对于实体类检索(即用户的检索词只有一个实体词,而没有前后缀的辅助信息),检索词可能不会包含用户的检索意图,例如用户检索“茶杯犬”,这种场景下搜索引擎无法通过检索词字面意图获得用户意图,即不知道用户具体想了解茶杯犬哪方面的信息,也就无法准确返回与用户潜在意图相关的结果。因此如何准确识别用户实体类检索词的潜在检索意图,并将其最关注的信息展现出来,是搜索产品在上述场景下满足用户需求的关键。
对用户搜索意图的识别,现有技术方案分如下两大类:
第一类:直接从检索词中解析出用户意图,主要包括如下两种方案:
(1)利用规则模板,从在线或历史检索中解析用户意图,例如query=北京的天气,可利用类似[city][weather]的模板来匹配query,从而解析出其中的用户意图。这种方案一方面只适用于特定场景的、描述比较规范的query;另一方面,一旦检索词的表达方式出现变化,就需要重新定义模板来适配。例如:对检索词为“北京的天气”可以解析,而检索词为“天气北京”就需要新定义模板,这样,模板的维护的管理复杂。
(2)利用机器学习模型或深度学习模型从检索词中训练模型识别用户意图。该方案本质上仍然强依赖于检索词的表达,即检索词越完整、越是包含用户意图,模型学习到的结果才能越好。该方案一般用于对话场景,因为对话场景下用户的表达普遍比较完整,而在搜索场景下用户的检索词普遍简单、所以该方案不适用。
第二类:先构建意图词典,然后通过检索词与意图词典的匹配度或相似度来识别意图。这类方案的关键在于词典本身的效果,而意图词典的构建一般有以下几种方案:
(1)根据历史检索词集合,通过模型训练来得到不同类别组成的意图词典;(2)同样根据历史检索词集合,进行聚类得到基于类别的意图词典;(3)根据检索结果页中网页的点击来分类或训练得到意图分类模型。
利用意图词典识别意图,获取到的意图是基于类别的,而不是基于实体粒度的;而且获取到的意图是扁平化的,即没有形成有语义的意图体系,也无法得知获取到的意图究竟是什么意思。
第三类:用知识图谱的方法来整合意图,建立意图知识图谱。
现有的意图知识图谱,同样是基于类别粒度的,比如:李白和杜甫都是人物,目前只针对“人物”这一粒度来整合意图图谱,而不会细化到李白或杜甫这一实体粒度来整理其意图,更不会细化到针对李白的各种检索表达的层面(比如检索词为李太白、诗仙等),但实际上有相当多的用户意图是与实体及不同的检索表达而有所区别的。
发明内容
本公开针对现有技术中存在的上述不足,提供一种意图知识图谱生成方法及装置、意图识别方法及装置、服务器和计算机可读介质。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910511702.9/2.html,转载请声明来源钻瓜专利网。