[发明专利]信息检索方法、装置、计算机设备和存储介质有效
申请号: | 201810065115.7 | 申请日: | 2018-01-23 |
公开(公告)号: | CN108446295B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 康平陆;杨新宇;陈钦明 | 申请(专利权)人: | 深圳市阿西莫夫科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/953;G06F16/9532;G06F16/33;G06F16/332;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 518051 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 检索 方法 装置 计算机 设备 存储 介质 | ||
1.一种信息检索方法,所述方法包括:
接收用户的信息检索请求,所述信息检索请求携带了目标问题;
获取预设的多个检索路径以及每个所述检索路径对应的调用顺序;
根据所述调用顺序获取第一顺序的检索路径,利用获取到的检索路径对所述目标问题进行检索,得到临时信息库;所述临时信息库包括多个信息对,所述信息对包括检索结果,以及所述检索结果对应的关联问题;
识别所述目标问题的问题类别;
识别多个关联问题的问题类别;
根据所述关联问题的问题类别和所述目标问题的问题类别,对所述信息对进行过滤;
计算过滤得到的多个信息对中每个检索结果与所述目标问题的相似度;
检测是否存在与所述目标问题的相似度达到阈值的信息对;
当不存在与所述目标问题的相似度达到阈值的信息对时,根据所述调用顺序获取下一顺序的检索路径,返回所述利用获取到的检索路径对所述目标问题进行检索的步骤;
当存在与所述目标问题的相似度达到阈值的信息对时,抽取所述相似度达到阈值的检索结果作为目标结果,展示所述目标结果。
2.根据权利要求1所述的方法,其特征在于,识别所述目标问题的问题类别的步骤,包括:
对所述目标问题进行预处理,得到所述目标问题对应的目标关键词;
获取预设的多个问题类别以及每个问题类别对应的多个词袋,所述词袋包括多个预设关键词;
将所述目标关键词与多个词袋中的预设关键词进行匹配;
当所述目标问题包含了一个词袋时,根据相匹配的词袋对应的问题类别对所述目标问题进行分类;
当所述目标问题包含了多个词袋时,根据相匹配的多个词袋包含预设关键词的数量和/或权重确定相匹配的多个词袋的优先级,根据相匹配的多个词袋包含预设关键词的数量和/或权重确定相匹配的多个词袋的优先级。
3.根据权利要求2所述的方法,其特征在于,对所述目标问题进行预处理的步骤,包括:
对所述目标问题进行拆分处理,得到对应的多个目标分词;所述目标分词包括停用词或标点符号;
对多个目标分词进行过滤,删除所述停用词和所述标点符号;
对过滤后的多个目标分词进行同义词替换;
对过滤后的多个目标分词进行命名实体替换。
4.根据权利要求2所述的方法,其特征在于,在获取预设的多个问题类别以及每个问题类别对应的多个词袋的步骤之前,还包括:
获取问题语料;所述问题语料包括多个问题类别以及每个问题类别对应的多个预设问题;
对多个预设问题进行预处理,得到每个预设问题对应的一个或多个中间关键词;
计算每个中间关键词的TF-IDF值,根据所述TF-IDF值对多个中间关键词进行筛选,将筛选得到的多个中间关键词作为预设关键词;
利用每个预设问题对应的一个或多个预设关键词,生成相应预设问题的词袋,将所述词袋与相应的问题类别进行关联。
5.根据权利要求4所述的方法,其特征在于,根据TF-IDF值对多个中间关键词进行筛选,将筛选得到的多个中间关键词作为预设关键词的步骤,包括:
根据所述TF-IDF值对多个中间关键词进行排序;
按照排序对多个中间关键词进行遍历,若当前顺序的中间关键词的TF-IDF值超过预设倍数的下一顺序中间关键词的TF-IDF值,将所述当前顺序的中间关键词与所述下一顺序中间关键词之间的位置作为截取位置;
根据所述截取位置截取排序靠前的多个中间关键词,将截取到的多个中间关键词作为预设关键词。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个目标结果的满意度反馈;
对所述满意度反馈进行大数据分析;
根据大数据分析结果对所述阈值和/或多个检索路径的调用顺序进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市阿西莫夫科技有限公司,未经深圳市阿西莫夫科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810065115.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向脏数据的清洗规则挖掘系统
- 下一篇:一种信息处理方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置