[发明专利]查询处理方法及装置有效
申请号: | 201910715482.1 | 申请日: | 2019-08-05 |
公开(公告)号: | CN110442696B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 周环宇;冯欣伟;余淼;戴松泰;宋勋超 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/953;G06F40/247 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 钭飒飒;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 处理 方法 装置 | ||
本发明提供一种查询处理方法及装置,包括:接收用户输入的查询信息;根据查询信息的类别和查询信息的关键词,从候选库中获取查询信息的相似查询信息,候选库保存有历史查询信息、历史查询信息的类别和历史查询信息的关键词之间的映射关系;若查询信息和相似查询信息之间的相似度大于相似度阈值,则将相似查询信息作为查询信息的泛化结果;根据相似查询信息,获取查询信息对应的查询结果;输出查询结果。通过上述方式,可以对查询信息进行更加全面的泛化,从而使得查询结果更加全面。
技术领域
本发明涉及网络技术领域,尤其涉及一种查询处理方法及装置。
背景技术
查询(Query)的泛化,也称为说查询扩招,是搜索问答领域一个特别重要的问题。在搜索领域,当搜索某个特定查询时,可能会出现特定查询具有不止一种表述形式,如何尽可能多的挖掘这些表述形式就是查询泛化所需要完成的工作。尽可能多的挖掘查询的不同表述方式能最大程度的回答用户的各种表达形式的问题。
现有技术中,对于查询的泛化主要通过关键词的替换来进行,比如“多久”和“多长时间”是同义词,“何时”和“什么时候”是同义词。对于查询关键词的同义替换工程可以通过人工筛选字典,也可以通过训练模型来实现机器筛选字典。
然而,尽管使用关键词替换能够解决一部分查询的泛化,但是由于关键词替换可以解决的问题的是有限,造成现有查询的泛化还不够全面,由此造成了该查询对应的查询结果也不够全面。
发明内容
本发明提供一种查询处理方法及装置,以解决现有技术中查询的泛化还不够全面造成查询对应的查询结果不够全面的问题。
本发明的第一个方面提供一种查询处理方法,包括:
接收用户输入的查询信息;
根据所述查询信息的类别和所述查询信息的关键词,从候选库中获取所述查询信息的相似查询信息,所述候选库保存有历史查询信息、所述历史查询信息的类别和所述历史查询信息的关键词之间的映射关系;
若所述查询信息和所述相似查询信息之间的相似度大于相似度阈值,则将所述相似查询信息作为所述查询信息的泛化结果;
根据所述相似查询信息,获取所述查询信息对应的查询结果;
输出所述查询结果。
可选的,在所述接收用户输入的查询信息之前,还包括:
获取所述历史查询信息;
将所述历史查询信息保存在所述候选库中,并建立所述历史查询信息、所述历史查询信息的类别和所述历史查询信息的关键词之间的映射关系。
可选的,在所述获取所述历史查询信息之后,还包括:
通过预设的使用别名列表扩容所述历史查询信息的关键词。
可选的,在所述建立所述历史查询信息、所述历史查询信息的类别和所述历史查询信息的关键词之间的映射关系之后,还包括:
将所述历史查询信息转化为同义历史查询信息,所述历史查询信息由第一语言描述,所述同义历史查询信息由第二语言描述;
将所述同义历史查询信息保存在所述候选库中,并将所述同义历史查询信息添加到所述历史查询信息、所述历史查询信息的类别和所述历史查询信息的关键词之间的映射关系中。
可选的,在所述将所述相似查询信息作为所述查询信息的泛化结果之前,还包括:
将所述查询信息转化为同义查询信息,所述查询信息由第一语言描述,所述同义查询信息由第二语言描述。
可选的,所述相似查询信息包括:第一相似查询信息和第二相似查询信息,所述第一相似查询信息由第一语言描述,所述第二相似查询信息由第二语言描述;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910715482.1/2.html,转载请声明来源钻瓜专利网。