[发明专利]一种电子文档筛选查询方法及系统在审
申请号: | 202310920071.2 | 申请日: | 2023-07-26 |
公开(公告)号: | CN116662521A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 单良;王亚平;路阳;江伟欢;刘伟家;郑楠 | 申请(专利权)人: | 广东省建设工程质量安全检测总站有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/216;G06F40/284;G06F40/30;G06F16/33 |
代理公司: | 广州渣津专利代理事务所(特殊普通合伙) 44516 | 代理人: | 申宏辉 |
地址: | 510000 广东省广州市天河区先*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 文档 筛选 查询 方法 系统 | ||
一种电子文档筛选查询方法及系统,属于信息检索领域,方法包括:连接业务管理系统,确定检索域;基于检索域获取目标文档集,跨域关联构建检索数据库;基于查询需求确定主关键词与从关键词集合,配置关键词矩阵;遍历多个检索数据子库对关键词矩阵进行匹配,生成相似度矩阵;设定相似度阈值并对相似度矩阵进行判定,确定单项关键词匹配结果;基于单项关键词匹配结果,对相似度矩阵逐矩阵列求和生成相似度匹配结果;基于相似度匹配结果进行文档映射,确定文档查询结果。本申请解决了现有技术中电子文档筛选查询准确度和效率低的技术问题,实现了电子文档的高精度、动态、多元化查询,达到了提高电子文档筛选准确度和效率的技术效果。
技术领域
本发明涉及信息检索领域,具体涉及一种电子文档筛选查询方法及系统。
背景技术
当前,随着信息技术的发展,各个组织和企业积累了大量的电子文档数据。这些数据通常分布在不同的业务系统中,存在跨域和异构的特征。目前,实现大规模文档检索的方法主要有:构建集中式索引,采用爬虫技术索引;利用元数据等手段提取文档特征并基于特征索引实现搜索。但是,这些方法在跨域异构数据场景下效果不佳,效率和查询准确度低下。
发明内容
本申请通过提供了一种电子文档筛选查询方法及系统,旨在解决现有技术中电子文档筛选查询准确度和效率低的技术问题。
鉴于上述问题,本申请提供了一种电子文档筛选查询方法及系统。
本申请公开的第一个方面,提供了一种电子文档筛选查询方法,该方法包括:连接业务管理系统,确定检索域;基于检索域获取目标文档集,跨域关联构建检索数据库,检索数据库由多个检索数据子库构成,各检索数据子库存在数据类型差异,检索数据库实时更新;基于查询需求,确定主关键词集合与从关键词集合,配置关键词矩阵,从关键词集合由主关键词集合多元化处理获取;结合相似度匹配算法,遍历多个检索数据子库对关键词矩阵进行匹配,生成相似度矩阵,其中,关键词出现频次为附加生成信息;设定相似度阈值,基于相似度阈值对相似度矩阵进行判定,确定单项关键词匹配结果,其中,匹配成功标识为1,匹配失败标识为0;基于单项关键词匹配结果,对相似度矩阵逐矩阵列求和生成相似度匹配结果,相似度匹配结果表征匹配的关键词集合与检索数据库中单项文档的综合相似度;基于相似度匹配结果进行文档映射,确定文档查询结果。
本申请公开的另一个方面,提供了一种电子文档筛选查询系统,该系统包括:确定检索域模块,用于连接业务管理系统,确定检索域;检索数据库构建模块,基于检索域获取目标文档集,跨域关联构建检索数据库,检索数据库由多个检索数据子库构成,各检索数据子库存在数据类型差异,检索数据库实时更新;关键词矩阵模块,基于查询需求,确定主关键词集合与从关键词集合,配置关键词矩阵,从关键词集合由主关键词集合多元化处理获取;相似度矩阵模块,用于结合相似度匹配算法,遍历多个检索数据子库对关键词矩阵进行匹配,生成相似度矩阵,其中,关键词出现频次为附加生成信息;关键词匹配结果模块,用于设定相似度阈值,基于相似度阈值对相似度矩阵进行判定,确定单项关键词匹配结果,其中,匹配成功标识为1,匹配失败标识为0;相似度匹配结果模块,基于单项关键词匹配结果,对相似度矩阵逐矩阵列求和生成相似度匹配结果,相似度匹配结果表征匹配的关键词集合与检索数据库中单项文档的综合相似度;文档查询结果模块,基于相似度匹配结果进行文档映射,确定文档查询结果。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省建设工程质量安全检测总站有限公司,未经广东省建设工程质量安全检测总站有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310920071.2/2.html,转载请声明来源钻瓜专利网。