[发明专利]信息检索方法和装置在审
申请号: | 201710217499.5 | 申请日: | 2017-04-05 |
公开(公告)号: | CN107122421A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 杨硕;邹磊 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 江崇玉 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 检索 方法 装置 | ||
技术领域
本申请涉及互联网领域,特别涉及一种信息检索方法和装置。
背景技术
随着互联网的高速发展,用户当前越来越多的倾向于通过在互联网上提问来获取问题的答案。搜索引擎在获取到用户的提问后,会基于提问中出现的一或多个关键词进行检索,并返回与所述一或多个关键词匹配的结果。
然而,对于机器来说,理解人类的一个问题是一件很困难的事情,通过上述这种方式获取到的结果很可能并不是用户提问想要获取的结果,从而造成检索准确率偏低。
发明内容
本申请实施例提供了一种信息检索方法和装置,以提高检索出的用户待解决问题的结果的准确性。所述技术方案如下:
一方面,提供了一种信息检索方法,所述方法包括:
接收输入的待解决问题;
确定所述待解决问题所属的技术领域;
根据预先建立的在所述技术领域的知识库,确定所述技术领域中与所述待解决问题相匹配的目标文档,其中,所述知识库中包括问题对象、知识对象、文档对象、所述问题对象和所述知识对象之间的对应关系以及所述知识对象和所述文档对象之间的对应关系,所述知识对象选自所述问题对象的一部分;
返回所述目标文档。
另一方面,提供了一种信息检索装置,所述信息检索装置包括:
界面模块,用于接收输入的待解决问题;
处理模块,用于确定所述待解决问题所属的技术领域;
所述处理模块,还用于根据预先建立的在所述技术领域的知识库,确定所述技术领域中与所述待解决问题相匹配的目标文档,其中,所述知识库中包括问题对象、知识对象、文档对象、所述问题对象和所述知识对象之间的对应关系以及所述知识对象和所述文档对象之间的对应关系,所述知识对象选自所述问题对象的一部分;
所述界面模块,还用于返回所述目标文档。
本申请实施例提供的技术方案带来的有益效果包括:
在基于用户的待解决问题(即用户提问)进行检索时,不仅考虑到问题中的一或多个关键词,同时考虑到问题的技术领域,通过考虑待解决问题的技术领域以及利用预先构建的特定知识库,可以大幅提高检索出的用户待解决问题的结果的准确性。
附图说明
图1是本申请实施例提供的特定技术领域中的四层知识图的示意图;
图2是本申请实施例提供的一种示例性的问题节点、知识节点和文件节点的关系图;
图3是本申请实施例提供的示例信息检索方法的流程图;
图4是本申请实施例提供的一种示例信息检索方法的示意图;
图5是本申请实施例提供的示出节点间随机游走概率的节点之间的关系图;
图6是本申请实施例提供的一种示例信息检索装置的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。文中所讲的“电子设备”可以包括智能手机、平板电脑、智能电视、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。文中所讲的“信息检索装置”可以是一或多个服务器等。
相关的信息检索方法仅仅考虑到在一个问题当中出现的关键词,往往很难理解用户的意图。为了理解一个问题,人类通常使用他们在技术领域的基本知识。比如对于问题“当用户尝试在发件箱中发送一些特殊表格时,程序就停滞在等待状态”。首先,我们会关注到“特殊表格”和“发件箱”,这些都是产品outlook的一些部件,我们就能推断出这是outlook产生的一些问题。
从以上分析可以得出,技术领域的背景知识在问题理解当中发挥着重要作用。本申请中通过构建特定技术领域的知识库来方便机器理解用户问题。
本申请中的信息检索方法是基于预先构建的知识库。所述知识库中包括问题对象、知识对象、文档对象、所述问题对象和所述知识对象之间的对应关系以及所述知识对象和所述文档对象之间的对应关系。其中,问题对象可以是用户输入的一个个待解决问题,知识对象可选自所述待解决问题的一部分,文档对象可以是一个个解决待解决问题的文档。
为便于理解本申请中提到的知识库,下面的描述中是以知识图的形式展现知识库中的各个部分及其关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710217499.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置